Časopis Slovo a slovesnost
en cz

Seminář matematické lingvistiky v Bukurešti

Marie Ludvíková

[Chronicles]

(pdf)

Семинарь по математической лингвистике в Бухаресте / Séminaire sur la linguistique mathématique à Bucarest

Z podnětu akad. Moisila byl ve dnech 21.—26. října 1963 uspořádán v Bukurešti seminář matematické lingvistiky. Cílem semináře původně bylo prodiskutovat několik zásadních referátů, přednesených předními odborníky z různých zemí. Ukázalo se však, že většina účastníků pracuje natolik samostatně, že může přednést své vlastní výsledky, takže se vlastně konalo malé mezinárodní symposium. Vedle značného počtu rumunských pracovníků byli přítomni: členové skupiny strojového překladu z Budapešti, akad. Kalmár z university v Szegedu, pracovníci z berlínské Arbeitsstelle für mathematische Linguistik und automatische Übersetzung a z Arbeitsstelle für strukturelle Grammatik, z Prahy pracovníci oddělení matematické lingvistiky ÚJČ a P. Sgall z centra numerické matematiky, ze Sofie matematik B. Penkov, celkem asi 50 účastníků. Omluvili se pracovníci sovětští a polští.

Bylo předneseno na 40 referátů rozdělených do několika tematických skupin. V části věnované strojovému překladu vyložily metodu a výsledky své práce skupiny německá, maďarská a dvě skupiny rumunské. V pojetí jejich práce jsou významné metodologické rozdíly. Německá skupina, jejíž člen J. Kunze referoval o pokusném překladu z angličtiny do němčiny, pracuje čistě empiricky, bez složité morfologické analýzy. Celou morfologickou informaci ukládá do slovníku, což podstatně zvyšuje jeho objem a znesnadňuje hledání v něm; z hlediska okamžitého praktického výsledku je to postup výhodný. — Protipólem berlínské skupiny je rumunské pracoviště strojového překladu v Temešváru, jehož člen S. Abraham zdůrazňoval nutnost teoretického základu, neboť jen tak se překlad dostane na vyšší rovinu, kde už nepůjde o překlad z jazyka do jazyka, ale z algoritmu do algoritmu. Programátorkou skupiny je E. Domonkosová, která hovořila o své chystané publikaci obsahující algoritmy jednotlivých úloh strojového překladu z angličtiny do rumunštiny (shrnuté do 32 tzv. organigramů). Další rumunská skupina strojového překladu na universitě v Kluži řeší problémy syntaktické analýzy pro překlad z ruštiny do rumunštiny. — Maďarští pracovníci Varga, Hell a Sipöczi ve svých příspěvcích rovněž zdůrazňovali nutnost a užitečnost analytického přístupu k strojovému překladu, zvláště u jazyků se silnou flexí, jako je např. ruština. Příspěvek Vargův popisoval nový, ekonomičtější způsob programování morfologické analýzy ruštiny, provedené podle Oettingera.

Kvantitativní lingvistika nebyla na semináři příliš silně zastoupena. Chyběli tu zvláště pracovníci sovětští, maďarští a polští. Hlavní referáty zde přednesli L. Doležel a B. Penkov. Doleželův model stylistického výběru zobrazuje proces jazykového kódování na stylistické rovině jako automatickou regulaci, přičemž zařízení funguje jako automat s náhodnými reakcemi. Užitečným se jeví zvláště zavedení pojmů jazyková konstanta a stylistická proměnná, které se mohou stát východiskem k exaktní analýze jednotlivých sty[240]lů. — Bulharský matematik Penkov podal přehled o dosavadním statistickém výzkumu bulharštiny. Na materiálu 11.000 grafémů byly zjišťovány četnosti jednotlivých písmen a dvojic písmen, z nich pak stanovena entropie H1 a H2 a pomocí Kolmogorovova pokusu též H. Mimo to byly prováděny pokusy, nakolik je možno popsat jazyk jednoduchým markovským procesem, a skutečně se podařilo generovat některá reálná slova. V jazyce jsou ovšem daleko složitější závislosti, které tento primitivní model nemůže vystihnout. — Další příspěvky přinášely výsledky z různých oblastí statistického výzkumu jazyka. Zabývaly se např. vztahem jazykovědy a teorie informace (Nicolau), statistickým zjišťováním autorství (Stan-Stanová), četnostmi symetrických a asymetrických souhláskových skupin v slovníku a textech v rumunštině (Rocericová), korelační analýzou grafematické soustavy češtiny (Průcha), hodnocením produktivnosti slovních kmenů na základě statistiky slov ze starých a nových slovníků (Papp, přečteno za jeho nepřítomnosti).

Nejsilněji obsazenou sekcí byla algebraická lingvistika. Tato příznivá okolnost se projevila i na kvalitě přednesených referátů, ukazujících nové cesty výzkumu. Akad. Kalmár ve své úvodní přednášce předložil úplný algebraický model přirozeného jazyka. Pomocí symbolů a relací přejatých z teorie automatů definoval prvky jazyka a jejich aplikace na všech jazykových rovinách včetně sémantiky. — Srovnáváním různých typů konečných automatů a odpovídajících gramatik se zabýval S. Marcus (Bukurešť). Podle jeho mínění bylo by nesprávné odmítnout modely konečných automatů jako neadekvátní bez předchozího důkladného prozkoumání. Uvedl 15 typů konečných automatů, z nichž evidentní lingvistickou hodnotu má pouze Chomského gramatika třetího typu, a dokazoval proti Chomskému, že gramatikou s konečným počtem stavů lze modelovat i věty koordinované. Referát vyvolal diskusi o smyslu budovat gramatiku s konečným počtem stavů, když nestačí pro účely generativního popisu přirozených jazyků. Podle Marcuse však existují modely nadřazené a podřazené a přirozený jazyk patrně nebude možno zobrazit jedním modelem, ale soustavou modelů, v níž i konečné automaty budou mít své místo.

Řada příspěvků byla věnována problémům generativní, zvláště transformační gramatiky. Jeví se tu snaha o generativní popis sémantické roviny jazyka, o zjemnění transformačních postupů při jejich aplikacích na různé jazyky a o hlubší matematizaci. P. Sgall ve svém referátě ukázal na možnost zavedení zobrazovacích relací R mezi různými rovinami jazyka, které by umožnilo organické včlenění sémantiky do generativního systému. Novými úpravami v aparátu transformační gramatiky, zejm. v souvislosti se vztahem aktivní a pasivní věty se zabýval W. Bierwisch (Berlin); na materiálu německém upozornil na důsledky nové koncepce Chomského skupiny, podle níž by se rozdíl mezi aktivní a pasívní větou projevil už v souboru jaderných vět. — Abrahamův příspěvek pojednával o formulaci transformační gramatiky jako určitého druhu Markovova normálního algoritmu, což by otevřelo cestu jejímu dalšímu matematickému zpracování.

Na semináři se též představila drobnějšími pracemi skupina mladých pracovníků, převážně z centra pro fonetiku a dialektologii Rumunské akademie věd. Práce vznikly většinou pod vedením akad. Rosettiho a jejich společným znakem je metoda distribuční analýzy. Šlo např. o příspěvky o distribuční klasifikaci předložek, zájmen, větných členů a o lineárních a nelineárních řetězcích v latinské větě. Zvláštní pozornost si zaslouží referát, který přednesl E. Vasiliu; předložil v něm návrh formalizace pádového systému na základě matice distinktivních rysů funkčního charakteru.

Ze semináře lze učinit některé obecnější závěry: rozptyluje se určitá skepse, která se v poslední době projevovala, pokud jde o budoucnost strojového překladu. Východiskem patrně bude opuštění utilitaristického pojetí a postavení strojového překladu na přísnou teoretickou bázi. Jednu cestu naznačil ve své přednášce S. Abraham: vycházet z transformační gramatiky při analýze a z teorie Markovových algoritmů při její aplikaci v strojovém překladu. Se strojovým překladem souvisí i rozvoj algebraické lingvistiky. Zde se vedle dalšího propracování moderních gramatik obrací pozornost k rovině sémantiky a usiluje se o její zařazení do generativního systému. Zvláštní situace nastala v Rumunsku, kde algebraická lingvistika [241]až na malé výjimky zcela ovládla pole jazykovědného bádání. Je to způsobeno přílišným soustředěním na problémy gramatiky, v nichž je algebraická lingvistika „mocnější“ než lingvistika kvantitativní. Dále tu působí tradice jazykového bádání, které se v Rumunsku zásluhou akad. Rosettiho ubíralo strukturním směrem již od r. 1934, a pak vliv akad. Moisila a S. Marcuse, kteří se algebraickou lingvistikou přímo zabývají a vychovávají řadu mladých lidí, matematiků i lingvistů, k systematické práci v tomto odvětví. Pokud jde o kvantitativní lingvistiku, zdá se, že tzv. prestatistické období již bylo překonáno a spolupráce obou věd se dostává na vyšší rovinu. Svědčí o tom materiálově dobře fundované statistické průzkumy jednotlivých jazykových jevů, odhady statistických a informačněteoretických charakteristik jazyků i pokusy o zobrazení sdělovacího procesu pravděpodobnostními modely. Tu je třeba zdůraznit, že pochybnosti o užitečnosti statistické lingvistiky, vyslovené některými účastníky, byly zásadně odmítnuty poukazem na dvojí protiklad jazykových jevů: deterministický — náhodný (Doležel, Kalmár). Rovněž akad. Moisil zdůraznil, že složité a různorodé problémy lingvistiky vyžadují aplikaci všech metod, jež jsou v moderní matematice k dispozici; teprve důkladné výzkumy mohou ukázat, které metody jsou pro tu neb onu oblast adekvátnější a užitečnější.

Projednaly se otázky spolupráce, koordinace výzkumu, publikací, bibliografie, organizace studia matematické lingvistiky apod. Na návrh S. Marcuse bude sestavována bibliografie algebraické lingvistiky pro potřeby příslušných pracovišť všech socialistických zemí. Českoslovenští účastníci slíbili sestavit bibliografii kvantitativní lingvistiky, zatím za r. 1962 (bibliografie strojového překladu se zpracovává v SSSR). Byla ustavena mezinárodní komise pro koordinaci práce v matematické lingvistice v socialistických zemích. Za československou stranu do ní byli navrženi dr. Čulík, doc. Doležel a doc. Sgall. Výsledky práce jednotlivých skupin budou předkládány a hodnoceny na pravidelných ročních mezinárodních konferencích, již se speciálním zaměřením; v ČSSR je plánována na rok 1964 konference o algebraické lingvistice a na rok 1966 konference o statistické lingvistice.

Slovo a slovesnost, volume 25 (1964), number 3, pp. 239-241

Previous Zdeněk Tyl, Milena Tylová: Česká jazykověda v roce 1963 (Část první: Lingvistika obecná, srovnávací a slovanská)

Next Blanka Borovičková, Vlastislav Maláč: Zasedání komise o analýze a syntéze mluvené řeči ve Varšavě