Časopis Slovo a slovesnost
en cz

Mezinárodní kongres o strojové lingvistice v Stockholmu 1969

Eva Hajičová, Petr Piťha

[Rozhledy]

(pdf)

Международный конгресс машинной лингвистики в Стокгольме 1969 г. / Congrès international sur la linguistique automatique à Stockholm en 1969

Mezi lingvistické kongresy pravidelně pořádané přibyla další řada. Jsou to kongresy o matematické lingvistice a strojovém zpracování jazykových údajů, pořádané od roku 1965 pravidelně v dvouročních intervalech (1965 v USA, 1967 ve Francii,[1] 1969 ve Švédsku; na r. 1971 byla požádána o organizaci Jugoslávie), které měly v jistém smyslu své předchůdce v mezinárodních konferencích v zemích východní Evropy (1962 v Maďarsku, 1963 v Rumunsku, 1964 v Československu).[2] Tato mezinárodní setkání, velmi potřebná v oboru, který nedávno vznikl a prodělal dosti podstatné změny, velmi dobře odrážejí celkový vývoj daného odvětví jazykovědy. Také letošní kongres[3] byl zajímavý především tím, že jak svým programem, tak rozsáhlými diskusemi otevřel některé otázky o postavení strojové lingvistiky.[4] Vedle toho podal kongres přehledný obraz o současném bádání na většině základních světových pracovišť; nikoli ovšem na všech, protože nebyla zastoupena pracoviště sovětská (krátce před zahájením kongresu pozvaní sovětští lingvisté odřekli svou účast). Celkové složení delegátů ukazovalo, že strojová lingvistika je úzce spojena s úrovní technického vybavení pracovišť (25 % delegátů z USA, 13 % z NSR), což však nemusí přímo souviset s úrovní oboru v té zemi.

Pořadatelé konference spolu s programovou komisí kladli největší důraz na diskusi — proto byly všechny přijaté referáty otištěny předem a rozeslány ještě před zahájením kongresu všem účastníkům.[5] Při vlastních zasedáních pak autor měl k dispozici deset minut na shrnutí výsledků své práce, ostatní doba byla věnována diskusi. Ukázalo se však, že nelze předpokládat předběžnou znalost textu referátu a že se tedy diskuse častěji vázala jen ke stručnému úvodnímu sdělení autora, což jednak diskusi oslabovalo, jednak zavádělo k věcem původnímu referátu velmi vzdáleným.

Jednání konference bylo rozděleno do šesti sekcí; algebraické a teoretické lingvistiky, sémantiky, transformační gramatiky, strojové analýzy, automatického zpracování informací a sekce zahrnující otázky nezařaditelné do žádné z předchozích (diachronie, komparativní lingvistika, dialektologie).[6] Je přirozené, že nebylo [84]v silách programového výboru zajistit, aby mezi jednotlivými sekcemi neexistovaly přesahy, a někdy bylo zřejmé, že zařazení referátu do té které sekce bylo dáno spíše časovými než tematickými zřeteli.

Sekce algebraické a teoretické lingvistiky byla věnována referátům týkajícím se některých vlastností formálních gramatik (o kontextových gramatikách mluvili P. S. Peters a D. Varga, o některých aspektech gramatik se zásobníkovými převodníky J. Mey,[7] o gramatikách se smíšenými typy pravidel A. Joshi). Spíše do sémantické sekce měl snad být zařazen referát o závislostní koncepci sémantické analýzy přirozeného jazyka (R. C. Schank).

V sémantické sekci vedle pokusu o souhrnný pohled na možnosti formalizace sémantiky přirozeného jazyka (R. M. Schwarcz) bylo zajímavé rozpracování jedné možnosti, jak chápat význam věty (ve smyslu Fillmoreových „předpokladů“, I. Bellertová), a návrh na zpracování kategorie času v přirozeném jazyce ve vztahu k reálnému času (D. Wunderlich). Téměř celé jedno zasedání bylo věnováno zprávám, které přednesli pracovníci francouzského pracoviště C.E.T.A. v Grenoblu (B. Vauquois, J. Rouault, B. Veillon a N. Nedobejkine); referovali o některých aplikacích logiky v popisu sémantiky přirozených jazyků. K těmto pracím se svým zaměřením blížil i referát A. Dugase o projektu SP v Montrealu.

V sekci o transformační gramatice byla přednesena řada referátů, v nichž byly zásady transformačního popisu jazyka aplikovány na jazykový materiál, počínaje fonologií (St. Braun, V. A. Fromkina, D. L. Rice, F. Karttunen) a konče nadvětnou syntaxí (L. Karttunen). Za jisté novum lze považovat větší zájem o grafemiku, který je dán praktickými zřeteli (O. Fujimura, S. C. Yang). Zajímavé byly rovněž referáty o některých lingvistických a programačních aspektech jednoho pokusu o programování transformační gramatiky francouzštiny na počítači (J. Friedmanová, A. Querido). — Bylo jistě překvapivé (ale příznačné pro současné pojetí náplně strojové lingvistiky především ze strany amerických lingvistů), že nejnovější vývoj americké transformacionalistické školy, reprezentovaný např. pracemi Fillmorea, Lakoffa, Rosse, McCawleyho, se na konferenci zřetelněji neprojevil.[8]

V sekci věnované strojové analýze bylo zahrnuto velké množství referátů dosti různorodých. Hlavní náplň tvořily technicky zaměřené referáty o jednotlivých problémech automatické analýzy (nespojité složky — H. Eggers a kol., homonymie sloves — I. Bátori, apod.); některé z nich byly teoretičtěji orientovány a blížily se svou náplní k referátům sémantické sekce (analýza slovotvorby — K. D. Büntig, předložkových spojení — A. G. Woyna, aj.). Celkový obraz této sekce byl zvýrazněn skupinou referátů, které pojednávaly o syntakticko-sémantické analýze slov (S. Zoltán, H. Josselson), slovních spojení (Ching-Yi Doughertyová) a o syntakticko-sémantické výstavbě nadvětných celků (A. Hoppe). Nejpodstatnější z nich obsahoval návrhy na užití počítačů při aplikaci nejnovějších myšlenek TG na široký jazykový materiál (E. v. Glaserfeld). Tato sekce tedy znovu potvrdila, že hlavní problémy automatické analýzy se přesouvají do oblasti sémantiky větné a lexikální, což dále působí prohloubení zájmu o vícerovinné popisy jazyka.

Obecněji byl zaměřen zajímavý referát Ch. Montgomeryové, věnovaný problematice vztahu mezi lingvistikou a automatickým zpracováním jazykových údajů. Vycházela z porovnání přístupu k jazyku na jedné straně u lingvistů, kteří jsou podle autorky [85]zaměřeni především na teorii, a na straně druhé u odborníků na strojové zpracování dat, kteří jsou orientováni na praxi. Tento dvojí přístup k jazyku považuje za základní problém strojové lingvistiky, zdůrazněný ještě odlišným základním školením matematiků a lingvistů. Lingvisté nedovedou ocenit přínos počítače, protože postrádají potřebné znalosti.[9] Nedovedou proto zadat úkol, často užívají počítačů tam, kde to není efektivní. Naproti tomu prakticky orientovaní odborníci dělají podle ní především tu chybu, že podceňují (nebo přehlížejí) skutečnost, že v podstatě v každé aplikaci (překlad, indexování atd.) je čistě lingvistický problém analýzy obsahu.

Další sekci tvořily referáty o užití počítačů v oblasti dialektologie, komparativní jazykovědy a diachronního popisu jazyka. Větší skupinou byly referáty věnované fonologickým změnám. Vyšší roviny jazyka, zvláště rovina syntaktická, jsou zatím všeobecně méně zpracovány z diachronního hlediska, a proto se užití nových technických prostředků i nových metod orientuje spíš na oblasti s problematikou již přesněji formulovanou. Důležitým přínosem počítačů (a dalších technických novinek) užívaných moderní fonetikou a fonologií je možnost detailního a široce založeného sledování současné variability jazyka a přesunů od jednoho (výchozího) pólu variační škály k druhému (výslednému).

Poslední sekcí byla velmi rozsáhlá sekce automatického zpracování informací. Vedle přehledných zpráv o jednotlivých pracovištích nebo jednotlivých přístupech k problémům automatického zpracování informací, indexování a automatické identifikace (J. A. Moyne, G. Salton, C. Borkowski, A. W. Pratt a kol. aj.) se tu nejvíce pozornosti pochopitelně věnovalo problematice celků větších, než je věta (automatické generování textu — G. Woolley, sémantická analýza paragrafů — Y. Wilks, „obsahová“ analýza prováděná počítačem — J. Laffal). Zde se nejvíce projevila těsná souvislost mezi stavem výzkumu v této oblasti a technickými možnostmi pracovišť — téměř všechny přednesené referáty se týkaly práce na amerických pracovištích.

Na závěr tohoto přehledu je třeba říci, že se na konferenci projevovala určitá převaha technicky zaměřených referátů nad referáty orientovanými čistě lingvisticky, zvláště pak teoreticky. Ústup od problematiky strojového překladu byl zde více než vyvážen zprávami o využití počítačů k mnoha dalším úkolům v lingvistice. Konference tak odrážela změnu, která nejvýrazněji proběhla v USA po známé zprávě ALPAC z roku 1966.[10] Přesun zájmu z oblasti SP proběhl v podstatě dvojím směrem: teoretičtěji zaměření pracovníci spojení s výzkumem TG i s jinými směry teoretického lingvistického popisu se orientovali ještě více na oblast vlastního lingvistického výzkumu a praktičtěji zaměření pracovníci hledali širší využití počítačů než jen SP. Tento vývoj a posílení oblasti strojové lingvistiky vede zároveň k oživení diskusí o současném postavení tohoto směru v rámci lingvistiky, o vzájemném vztahu matematiky a lingvistiky, o poměru k ostatním příbuzným vědám.

Na stockholmské konferenci se debaty soustředily především kolem tematické charakteristiky kongresu, kterou již v pozvánce navrhl H. Karlgren. Vychází zde z termínu computational linguistics; zastoupeny musí být obě složky (to znamená počítače a lingvistika), nezáleží na tom, která z nich vystupuje jako metoda a která jako objekt. Bylo svým způsobem paradoxní, že přes snahu pořadatelů zdůraznit lingvistický aspekt, většina referátů byla zaměřena technicky.

Druhým podnětem k diskusi byla rozmnožená diskusní úvaha M. Minowa nad souborem kongresových referátů. Jeho v podstatě anketní dotaz, s jakými problémy [86]zvláště technického charakteru se dnes setkává využití počítačů v lingvistice, měl širokou odezvu. Jednotlivé odpovědi byly rovněž souborně rozmnoženy a jsou velmi konkrétní (kterých počítačů se užívá, kterých programovacích jazyků, možnosti výměny, ekonomické charakteristiky, efektivnost atd.). Diskusní odpoledne, vyhrazené pouze tomuto tématu, však přineslo především pohledy ze strany programování a nakonec se příliš soustředilo jen na otázky spíše „pedagogického“ charakteru.

Domníváme se, že nejasnosti kolem vymezení strojové lingvistiky jsou přiměřené jejímu vývoji. Jde o to, že bohatě členěná teoretická lingvistika má své aplikace (školské, překladatelské), které vyžadují svůj základní výzkum blížící se spíše k teoretickým vědám, a na druhé straně vlastní praktickou aplikaci. Základní výzkum se komplikuje, přibližuje teoretickou úrovní jiným teoretickým disciplínám, ovlivňuje je a postupně se konstituuje. Vztahy těchto větví — teoretická věda, aplikovaná věda, základní výzkum — jsou v průběhu času velmi komplexní, protože mezi nimi dochází k cyklickému a oboustrannému ovlivňování.


[1] Srov. v SaS zprávy P. Sgalla, 27, 1966, 94—96, J. Panevové a P. Piťhy, 29, 1968, 107—109.

[3] International Conference on Computational Linguistics, Stockholm, 1.—4. září 1969, pořádaná výzkumnou skupinou pro kvantitativní lingvistiku (KVAL) při stockholmské universitě, koordinátor H. Karlgren, z pověření Mezinárodního výboru pro strojovou lingvistiku (International Committee on Computational Linguistics), jehož předsedou byl v posledních čtyřech letech D. G. Hays ze státní university v Buffalo, New York, a nově zvoleným předsedou na další období je B. Vauquois z Grenoblu.

[4] Pro mezinárodní termín computational linguistics, který je historicky svázán s termínem matematická lingvistika, se v češtině ujal překlad strojová lingvistika. Na stockholmské konferenci se termínu strojová lingvistika užívalo i v jeho širším významu, srov. např. zařazení sekce o algebraické lingvistice.

[5] V tomto směru se lze jen obdivovat pohotovosti pořadatelů, neboť uzávěrka, byť předem stanovená na květen 1969, prakticky neexistovala a výrobní lhůta pro rozmnožení zaslaných referátů byla necelé dva dny!

[6] Na kongresu nebyla opět zastoupena kvantitativní lingvistika; přesto v některých referátech, zvláště těch, které byly orientovány značně prakticky, bylo samozřejmě kvantitativní hledisko uplatňováno, ale samostatná kvantitativní studie přednesena nebyla.

[7] Tento referát byl pro nás zvlášť zajímavý, neboť se jeho autor pokoušel aplikovat své závěry na funkční generativní model, s nímž pracujeme v laboratoři algebraické lingvistiky UK v Praze. Se závěry autora však nemůžeme souhlasit (také v diskusi se ukázala jejich spornost), srov. o tom připravovanou stať A. Goralčíkové a L. Nebeského v PBML 12, 1970.

[8] Pouze nepříliš jasný referát I. Binnicka (který je McCawleyho žákem) o možné aplikaci rozšířeného generativního sémantického modelu jazyka navazoval na tento vývoj přímo.

[9] Nežádá znalost v praktickém programování, ale znalost principů počítačů a využití jich. V diskusi se však kladl i tak krajní požadavek, že „strojový lingvista“ musí být vyškolen nejen v lingvistice, ale musí být i výborným programátorem.

[10] Srov. P. Novák, Jazyk a stroje, SaS 28, 1967, 327—328.

Slovo a slovesnost, ročník 31 (1970), číslo 1, s. 83-86

Předchozí Marie Těšitelová, František Daneš: Druhý mezinárodní kongres aplikované lingvistiky v anglické Cambridgi

Následující Karel Horálek: Nad českým překladem Staigerovy poetiky