Časopis Slovo a slovesnost
en cz

4. mezinárodní konference o strojové lingvistice v Debrecíně 1971

Marie Těšitelová, Eva Hajičová

[Kronika]

(pdf)

4-ая международная конференция о машинной лингвистике в Дебрецене / Quatrième conférence internationale consacrée à la linguistique automatique avait lieu à Debrecen en 1971

Ve dnech 4.—7. září 1971 se konala v maďarském Debrecíně v pořadí 4. mezinárodní konference věnovaná problematice strojové lingvistiky.[1] Na konferencích o strojové lingvistice, které se konají v dvouletých intervalech, roste počet účastníků (tentokrát se jí účastnilo asi 140 odborníků z 20 zemí), nejpočetněji byly opět zastoupeny Spojené státy americké (podle seznamu účastníků vydaného předem 37 zájemci) a Sovětský svaz (podle tohoto seznamu 15 účastníky). Z Československa se konference zúčastnili J. Horecký, P. Sgall, E. Benešová, Sv. Machová, P. Piťha a autorky této zprávy. S rostoucím počtem zájemců o tyto konference vzrostl i počet přihlášených referátů a diferencovala se i jejich tematika, což se projevilo i na chápání rozsahu tzv. strojové lingvistiky. Pořadatelé se snažili tomu zabránit jednak tím, že omezili počet referátů (asi na 40), které měly být předneseny, jednak tím, že se pokusili seřadit tyto referáty v podstatě do dvou skupin, a to do sekce A (obecné otázky strojové lingvistiky, problematika syntaktické a sémantické analýzy a syntézy) a do sekce B (tzv. aplikace strojové lingvistiky, kam byla zařazena problematika fonologická, morfologická a lexikologická na straně jedné a strojový překlad a jiné aplikace, jako je využití počítačů při jazykovém vyučování apod., na straně druhé). Podle našeho názoru v sekci B šlo v některých případech jen o specializovanější problematiku, popř. o dílčí otázky strojové lingvistiky. Za problematickou věc pak pokládáme rozlišování „aplikované“ strojové lingvistiky. To však souvisí s chápáním tzv. strojové lingvistiky vůbec; této problematice byla věnována tzv. diskuse u kulatého stolu (srov. o tom dále).

Po oficiálním zahájení konference byly na plenárním zasedání předneseny tři referáty. Především to byl referát dvou pracovníků VINITI z Moskvy V. B: Borščeva a M. V. Chomjakova, kteří podali novou metodu definování jazyků; text chápou jako konečný model a jazyk jako axiomatickou třídu modelů. — V druhém referátě se A. K. Joshi (USA) pokusil na základě pojmu jednoduchý strom a jistého typu generování stromu odpovědět na otázku, jaká hloubka hierarchické struktury je nutná pro popis věty. —Teoretickými otázkami analýzy a rozhodovacích procedur pro transformační gramatiky se zabýval v třetím referátě S. Peters (USA). Navrhl jistý typ analýzy pro takovou třídu transformačních gramatik, kdy podmínky pro zapuštění věty jsou dány větou bezprostředně nadřazenou. Na příkladech ukázal, že jde o empiricky zajímavou třídu transformačních gramatik.

Mezi referáty týkající se teoretických otázek strojové lingvistiky byl především zařazen referát Y. Wilkse (USA), zabývající se pojmem modelu. — H. Karlgren (Švédsko) podrobil analýze tzv. syntaktické parazity, řetězce slov ve větě, které se nemohou vyskytovat v gramaticky správné větě. Kritéria pro identifikaci syntaktických parazitů se opírají o formalismus kategoriální gramatiky.

V sekci syntaktické analýzy jazyků přirozených i umělých se L. H. Reeker (USA) zabýval obecně otázkami algoritmů analýzy [78]a jejich vyhodnocováním. — O. S. Kulaginová (SSSR) uvedla principy syntaktické analýzy při automatickém překladu (na příkladu překladu z francouzštiny do ruštiny), dále pravidla transformační a principy syntaktické syntézy. — F. B. Thompson (USA) předvedl ukázky syntaktické analýzy založené na Fillmoreově koncepci „pádové“ gramatiky. V diskusi k tomuto referátu se poukázalo na užitečnost zjišťování frekvence syntaktických struktur. — A. Münnich (Maďarsko) uvažoval o vlastnostech jazyka určeného pro komunikaci mezi člověkem a strojem. Měl by to být jazyk snadný k učení, jasný a nedvojznačný, přístupný stroji k zpracování, např. k překladu apod., a měl by obsahovat programovací jazyk jako vlastní podmnožinu. Mnohé z těchto vlastností má podle referenta esperanto, a proto bylo v budapešťském Výpočetním středisku užíváno a studováno jako jazyk pro komunikaci mezi člověkem a strojem. Otázka esperanta vzbudila živou diskusi, která vyzněla celkem velmi kriticky k možnostem jeho využití k danému účelu.

Z referátů, které byly zaměřeny k syntaktické rovině, se referát R. Smithe (USA) zabýval pravděpodobnostním modelem syntaktických struktur. — E. V. Padučeva (SSSR) mluvila o projektivitě v koordinovaných konstrukcích, kterou je třeba respektovat v automatické syntaktické analýze. V diskusi se ukázalo, že překlady ruských příkladů do angličtiny mohou věc znejasnit; to je ovšem obecný problém, na nějž se narazilo i v jiných případech, když se referovalo jen anglicky o speciálních jevech jazyků od angličtiny typologicky odlišných. — P. Piťha demonstroval složitou problematiku vyjadřování posesivity v systému funkčního generativního modelu.

Značný zájem byl o sekci týkající se sémantické analýzy a syntézy při automatickém zpracování textů. P. Satyanarayana (USA) zdůrazňoval potřebu spolu s analýzou syntaktickou provádět i analýzu sémantickou, avšak zaměřil se pouze na otázku zachycení sémantické informace u slovníkových hesel. — R. Schank (USA) informoval, jak od r. 1969 pokročila na jeho pracovišti (Výpočetním středisku Stanfordské university) sémantická analýza, která se neváže na gramatická pravidla, ale opírá se o pojmový interlingvální mechanismus, který byl k tomuto účelu na základě kombinací pojmů zvlášť vypracován. — Kolektivní referát pracovníků University ve Wisconsinu, který přednesl S. Klein, se týkal stochasticky modifikovaného sémantického modelu. Počítá s generativní kontrolou řady kvantitativních aspektů týkajících se stylu, syntaktických struktur a relativní frekvence lexikálních jednotek.

Do skupiny přednášek týkajících se roviny sémantické byl zařazen referát E. Hajičové k otázkám chápání pojmu presupozice. Ukazuje se v něm, že nelze vystačit jen s distinkcí presupozice a význam, ale že je třeba ještě odlišit tzv. potenciální význam (který se negací mění z tvrzeného na pouze možný). — P. Sgall se v následujícím referátě zabýval otázkami aktuálního členění větného, zvl. pak Chomského pojmem ohnisko; na příkladech ukázal, že dané empirické jevy a jejich sémantiku lze výhodněji zachytit na základě uspořádání prvků sémantické reprezentace (popř. i hloubkové struktury), které lze interpretovat jako hierarchii stupňů výpovědní dynamičnosti. — J. Martemjanov (SSSR) podal návrh na zachycení tématu a rématu v generativní gramatice a zdůraznil zejména dva principy, rekurzívnost v aplikování pravidel a vysvětlovací úlohu hloubkových formulí. Jako poslední byl do této skupiny zařazen referát A. Ljudskanova (Bulharsko) a G. Klimonové (NDR) o identifikaci zájmen při automatické analýze textu.

V sekci B, označené jako aplikace strojové lingvistiky (srov. výše), byl přednesen především referát H. Spitzbarta (NDR), který naznačil, jak se využívá počítačů při zkoumání indonéštiny. — S. Klein (USA) popisoval program, který byl vypracován na jeho pracovišti pro morfologickou a syntaktickou analýzu přirozených jazyků. — G. Hell (Maďarsko) ve svém referátě naznačil problematiku rozdělování slov při automatickém zpracování textu. K tomuto referátu byla připojena exkurze do Výpočetního střediska debrecínské university, vybaveného počítačem Odra. — M. Těšitelová podtrhla ve svém referátě jednak náročnost na množství dat při automatické morfologické analýze flektivních jazyků, jednak potřebu jejich automatického zpracovávání, aby byl umožněn komplexní výzkum morfologických kategorií v jejich kombinacích a vzájemné „souhře“. — R. N. Smith (USA) poukázal na to, že automatická analýza a syntéza vět přirozených jazyků vyžadují více po[79]znatků o lexikální jednotce, než ji poskytují dosud existující slovníky. Je třeba uvádět celé lexikální konstrukce. — H. P. Edmundson a M. N. Epstein (USA) informovali o tom, jak pokročil od r. 1969 jejich výzkum synonym a antonym na universitě v Marylandu: na základě 9 axiómů, podle nichž se pokusili rozlišit synonyma a antonyma, byl vypracován program k sestavení příslušného slovníku.

Několik referátů bylo věnováno otázkám strojového překladu. O projektu strojového překladu z angličtiny do francouzštiny realizovaného na universitě v Montrealu (ve spolupráci se střediskem CETA v Grenoblu) referoval A. Colmerauere (Kanada). — S. Perschke (Itálie) informoval o programovacím jazyce SLC/II, který považuje za nejvhodnější pro lingvistické práce. — Z hlediska automatické analýzy maďarštiny referoval I. Botos (Maďarsko) o některých slovesných konstrukcích s předmětem přímým v maďarštině.

Využití počítačů přímo při jazykovém vyučování se týkaly referáty S. C. Yanga (USA) a J. M. Waaba (Belgie). — H. Feliciangeli a G. T. Herman (USA) informovali o některých nejnovějších výsledcích biologického výzkumu v oblasti vývojové biologie, k nimž se dospělo na základě aplikace metod vyvinutých pro automatickou analýzu přirozených i umělých jazyků. — Využití počítačů při studiu folklóru (katalogizace lidových písní apod.) byl věnován referát V. Voigta (Maďarsko).

Zvlášť zajímavá byla diskuse u kulatého stolu o pojetí strojové lingvistiky; diskusi řídili B. Vauquois (předseda mezinárodního výboru) a G. Szépe a byli k ní přizváni D. G. Hays (USA), V. J. Rozencvejg (SSSR), L. Kalmár (Maďarsko), H. Schnelle (NSR), H. Spang-Hansen (Dánsko), H. Karlgren (Švédsko), P. Sgall (ČSSR), P. A. Verburg (Holandsko), M. Kay (USA), F. Papp (Maďarsko), A. Ljudskanov (Bulharsko). Diskuse se mohli zúčastnit i všichni ostatní účastníci konference. Diskutující se zaměřili především na otázky vyplývající z postavení strojové lingvistiky jako interdisciplinárního oboru: B. Vauquois hned v úvodním slově mluvil o „mathematico-computational linguistics“ jako o oboru majícím rovnocenný vztah k lingvistice, matematice a nauce o počítačích (“computer sciences”); užíval pak termínu matematická lingvistika pro pomezní obor mezi matematikou a lingvistikou a termínu mechanolingvistika pro pomezní obor mezi lingvistikou a naukou o počítačích. Většina ostatních účastníků, kteří se k této otázce vyslovovali (mimo lingvisty i matematikové, z nich zejm. akademik L. Kalmár), vidí strojovou lingvistiku sice jako obor interdisciplinární, ale založený na lingvistice, s níž má společný objekt zkoumání, přirozený jazyk. Jako jedna ze závažných podmínek úspěšného rozvoje tohoto interdisciplinárního oboru byla v diskusi označena kvalita komunikace mezi pracovníky různých věd; aby si lingvisté a matematici navzájem rozuměli tak dobře, jako si jednotlivci z obou oblastí rozumějí mezi sebou, tomu dosud stojí v cestě řada překážek z obou stran.

Nejen otevřený závěr diskuse, ale i náplň konference sama ukazovala značnou variabilitu v chápání pojmu strojové lingvistiky v praxi. Jistě nelze strojovou lingvistiku ztotožňovat s novým pojetím lingvistiky vůbec (i když některé projevy nejmladších pracovníků, zejm. ovšem matematiků a odborníků v práci se samočinnými počítači, by tomu mohly nasvědčovat), ani nelze tento pojem zaměňovat s pojmem matematické lingvistiky. Podle našeho názoru však strojová lingvistika má jako speciální lingvistická disciplína své oprávnění, a jak i výsledky předložené na debrecínské konferenci ukazují, přináší poznatky důležité pro zkoumání jazyka vůbec. — Referáty z konference budou otištěny ve zvláštním sborníku.


[1] První konference týkající se této problematiky byla r. 1965 v New Yorku, druhá r. 1967 v Grenoblu, třetí r. 1969 ve Stockholmu; srov. SaS 27, 1966, 94—96; 29, 1968, 107—109; 31, 1970, 83—86.

Slovo a slovesnost, ročník 33 (1972), číslo 1, s. 77-79

Předchozí Josef Vachek: Výroční zasedání Societas Linguistica Europaea v Leidenu

Následující Josef Vachek: Třetí díl Martinetova sborníku