Časopis Slovo a slovesnost
en cz

Sovětské sympozium o strojové lingvistice

Marie Těšitelová

[Kronika]

(pdf)

Symposium soviétique consacré à la recherche linguistique par ordinateur

Ve dnech 24.—26. listopadu 1980 konalo se v estonském hlavním městě Tallinu za domácí účasti sympozium o strojové lingvistice. Máme k dispozici pouze sborník résumé přihlášených referátů v anglickém znění (Symposium: Computational linguistics and related topics. Summaries. Ed. U. Viks. Tallinn, Academy of Sciences of the Estonian S. S. R. Division of social sciences 1980, 124 s.), ale přesto můžeme posoudit, jak se v Sovětském svazu chápe strojová lingvistika a její rozsah (k tomu srov. zde zprávu E. Hajičové, s. 344n.) a co se rozumí „příbuznými problémy“. Sborník sám obsahuje celkem 35 résumé a seznam účastníků sympozia (přihlášeno jich bylo 50 z různých sovětských vysokých škol a vědeckých ústavů sovětských Akademií).

Vymezením strojové lingvistiky se zabývá résumé známého sovětského matematického lingvisty V. M. Andrjušenka (s. 11—14). Chápe ji jako vědeckou disciplínu, která studuje vztahy mezi strukturami lingvistickými a strojovými. Struktury strojové pak vymezuje dvěma formami obrážejícími realitu, jedna z nich je založena na přirozeném jazyce, druhá na logických abstrakcích. Spojení obou těchto forem představuje podle autora specifikum strojové lingvistiky.

Největší pozornost je v převážné části résumé věnována vztahu strojové lingvistiky k textu a to zejména na pozadí jejího vztahu k matematické lingvistice, resp. jejím složkám, lingvistice kvantitativní (ve větším počtu příspěvků) a algebraické (v relativně menším počtu příspěvků).

Tak vztah strojové lingvistiky k lingvistice kvantitativní, resp. kvantitativní typologii textu zkoumá především P. M. Aleksejev (s. 5—7), a to vzhledem k tomu, že (1.) východisko i závěry kvantitativního studia jsou pořizovány s pomocí počítače (tedy i strojové lingvistiky), (2.) výsledků kvantitativního studia se využívá při automatické analýze textu, tj. předmětu strojové lingvistiky, (3.) teorie kvantitativní typologie textu je založena na týchž základech jako strojová lingvistika. Pozorování jsou opřena o výsledky kvantitativní analýzy, kterou v Sovětském svazu provádí skupina vedená R. G. Piotrovským (1969). — Dalším přínosem k vymezování vztahu strojové lingvistiky k lingvistice kvantitativní je příspěvek M. V. Arapova a Ju. K. Krylova (s. 14—16), který sleduje opakování prvku v textu a jeho funkci.

Při hledání vztahu lingvistiky strojové k lingvistice kvantitativní je podle očekávání velká pozornost věnována slovníku textu: Rozsah slovníku se zřetelem k délce textu zkoumá např. J. Tuldava (s. 110—114) a dále při tom prohlubuje stanovení tzv. bohatství slovníku (Těšitelová, 1974). — Zkušenosti z automatického sestavování frekvenčních seznamů slov a konkordancí obsahuje příspěvek L. V. Azarové a kol. (s. 17—18). — Vědecké a technické slovníky a encyklopedie studuje se zřetelem k bance dat A. S. Gerd (s. 29—30), sestavení uvedených slovníků s pomocí počítače popisují H. G. Grigorjev a M. A. Marusenko (s. 39—41). — Problematikou automatického sestavování tzv. základního slovníku se zabývá N. V. Gurová (s. 52—53), lexikálního systému vůbec pak M. G. Mamedová s F. F. Skorochoďkem (s. 72—73).

Studium vztahu strojové lingvistiky a textu opírá se dále o distribuci písmen sledovanou se zřetelem k délce textu a k jeho struktuře (začátek textu) v příspěvku V. J. Grigorjeva (s. 43—47), výsledky morfologické analýzy estonských textů analyzuje Ü. Kaasika spolu s J. Tuldavou (s. 54). Význam analýzy syntaktických struktur v daném kontextu ukazuje Ju. S. Martemjanov (s. 74), syntaktických rysů G. Ju. Martynenko (s. 75—77).

Ve sborníku nacházíme i résumé týkající se vztahu strojové lingvistiky ke studiu sémantiky: Tak v rámci dialogu byl sestaven program na doplňování „prázdných“ míst v informaci vztahujících se k predikátu (v příspěvku I. P. Beletské, s. 19—21), dále byla provedena morfologická a syntaktická analýza za účelem sémantické analýzy věty, N. F. Suchanská a N. N. Chemerisová (s. 104—105).

Pokud jde o résumé příspěvků, které sledují vztah strojové lingvistiky a lingvistiky algebraické, zaslouží zvláštní zmínky např. algebraické modely v oblasti lexika [347]Ju. K. Lekomceva (s. 55—58), od téhož autora pak pravidla o tzv. lingvistické polaritě, tj. polaritě opozit typu teplý - studený, den - noc, otázka - odpověď apod. (s. 50—61), modelování v oblasti sémantiky od M. I. Lekomcevové a Ju. K. Lekomceva (s. 62—71), algebraický popis gramatických kategorií B. V. Suchotina (s. 100—101), automatický systém ke generování slovníku v příspěvku Ju. Vikse (s. 119—121) apod.

V několika málo příspěvcích se obráží vztah strojové lingvistiky k hudbě: Uvádějí se např. statistické charakteristiky textu a jeho hudebního ztvárnění (M. G. Borodová a G. Š. Nadareišvili, s. 22—26), V. Detlovs (s. 27—28) studuje optimální délku segmentu v hudebním textu (s využitím zákona Zipfova - Mandelbrotova), M. Valk-Falk sleduje frekvenci motivů v melodické struktuře (s. 115—118).

V ojedinělých résumé analyzují se např. gramatické chyby podmíněné afázií (E. L. Ginzburg a kol., s. 31—34), geografické rozložení jazykových jevů (S. Murumets, s. 78—80) apod.

Náš přehled základní tematiky příspěvků ze strojové lingvistiky a „příbuzných problémů“ ukazuje, že sovětská lingvistika chápe strojovou lingvistiku poměrně široce a že významné postavení tu má vztah k lingvistice kvantitativní, ovšem při dominantním vztahu k textu. Stranou je tu ponechán — alespoň v posuzovaném sborníku — strojový překlad, který má ve strojové lingvistice obvykle postavení celkem centrální (srov. zde s. 344).

 

LITERATURA

 

HAJIČOVÁ, E.: Mezinárodní konference strojové lingvistiky v Tokiu. SaS, 42, 1981, s. 344—345.

Statistika teksta I. Red. R. G. Piotrovskij. Minsk 1969.

TĚŠITELOVÁ, M.: Otázky lexikální statistiky. Praha 1974.

Slovo a slovesnost, ročník 42 (1981), číslo 4, s. 346-347

Předchozí Eva Hajičová: Mezinárodní konference strojové lingvistiky v Tokiu

Následující Slavomír Utěšený: Druhá konference o slangu a argotu v Plzni