Časopis Slovo a slovesnost
en cz

Druhá mezinárodní konference o automatickém zpracování jazyků

Jarmila Panevová, Petr Piťha

[Chronicles]

(pdf)

Вторая международная конференция по автоматической обработке языков / Deuxième conférence internationale du traitement automatique des langues

V Grenoblu byla ve dnech 23.—25. 8. 1967 uspořádána druhá mezinárodní konference o automatickém zpracování jazyků a strojovém překladu;[1] připravilo ji Sdružení pro strojový překlad a aplikovanou lingvistiku (Association pour la Traduction Automatique et la Linguistique Appliquée). Konference se zúčastnili delegáti z 25 zemí. V početné delegaci USA byla zastoupena většina důležitých amerických pracovišť (s výjimkou MIT); byla zde patrna určitá převaha USA ve strojové lingvistice.

Program konference byl značně rozmanitý. Bylo předneseno asi třicet referátů, vydaných v plném znění.[2]

Podstatná část konference byla věnována referátům o obecných přístupech k automatickému zpracování jazyků. Šlo jednak o předvedení celkových projektů automatizovaných systémů, jednak o teoretické aspekty takových systémů nebo o teoretické podklady k jejich budování.

Jeden z typů syntaktické analýzy ruštiny, vypracovaný v Bunker-Ramo Corporation (Kalifornie), popsal P. Garvin. Analýza je založena na skutečnosti, že ne ze všech slov věty lze získat stejnou informaci o syntaktické stavbě věty. Je tedy vhodné vycházet od těch slov, která jí obsahují více. Celkově se analýza provádí postupným několikerým procházením věty, při každém z nich se analyzují jisté typy konstrukcí odpovídající jednotlivým výchozím slovům.[3]

Práce na přípravě strojového překladu (dále jen SP) prováděné v C.E.T.A. v Grenoblu popsal B. Vauquois a G. Veillon.[4] Autoři podali definice transformační gramatiky, které užívají a která se liší od gramatiky Chomského; v druhé části se zabývali otázkami programování popisované gramatiky pro počítač IBM 7044. Hlavní zájem byl soustředěn na popis užívaného metajazyka. V závěru byl podán rozbor dvou aspektů aplikace předvedeného modelu SP, a to sémantického hodnocení syntaktické struktury vět vstupního jazyka (ruštiny) a generování patřičné syntaktické struktury výstupního jazyka (franc.) na základě informací o sémantické struktuře jazyka vstupního.

Práce cambridgeské skupiny na SP byla představena v referátu M. Mastermanové. Vyjádřila v něm svůj kritický názor na zprávu o SP Jazyk a stroje,[5] kterou autorka referátu pokládá za nezdůvodněnou a zbytečně pesimistickou. Dále popsala systém účinné spolupráce člověka a stroje při SP z francouzštiny do angličtiny, na němž se pracuje v Cambridgi. Je založen na soustavě postupně kladených otázek a odpovědí, kdy „předredaktor“ podle zadaných otázek vybírá sémantickou oblast, o niž jde, a „vede“ tak stroj k výběru vhodného ekvivalentu ve výstupním jazyce. Z praktického hlediska je tento postup zdůvodněn snahou vyhnout se dodatečné redakci, kdy člověk bez znalosti [108]originálu těžko rozhoduje mezi navrhovanými možnostmi. Z hlediska teoretického představuje navržený systém velmi zajímavé zpracování sémantických otázek, definuje se pojem sémantického čtverce, sémantické hloubkové struktury ap.

Práce National Physical Laboratory v Teddingtonu byla popsána ve společném referátu J. McDaniela—W. L. Price—A. J. M. Szansera a D. M. Yatese; podali zprávu o zajímavém experimentu, kterým zkoumali užitečnost strojově přeložených vědeckotechnických ruských textů pro čtenáře; kritických připomínek se využívá ke zdokonalení algoritmů. Dále byla tato skupina reprezentována referátem D. M. Yatese o gramatickém modelu ruštiny vybudovaném tak, že je základnou pro syntézu angličtiny.

Mezi teoreticky zaměřenými referáty obecného charakteru zaujal nejvíce příspěvek E. Pendegrafta z Texaské university v Austinu. Vycházel ze skepse nad současnými možnostmi zkoumání sémantiky jazyka a ukázal, že v této oblasti dnes lingvisté ani nemohou používat zcela vědeckých (teoreticky a metodicky čistých) postupů, dále že sémantika se jako vědní disciplína musí opřít o jiné vědy, jmenovitě o logiku. Protože sémantiku chápe jako nauku o jazykovém vyjadřování lidského poznání a usuzování, domnívá se, že k jejímu popisu lze dojít způsobem obdobným rozvíjení základních principů, jaké pozorujeme na schopnosti řeči u dětí (language acquisition). Ta je podle autora založena na daném, avšak nerozvinutém poznání skutečnosti i jazyka a také jejich vztahu. Toto poznání se postupně rozvíjí cyklicky opakovanými operacemi dedukce, indukce a abstrakce, z nichž prvá seskupuje shodné a jednorodé prvky do tříd, druhá vytváří ověřitelné hypotézy a třetí provádí změny v logické syntaxi vznikajícího systému. Naznačil, že při podobném zkoumání je možno užít logik různého typu, které se budou lišit především svou filosoficko-psychologickou interpretací. V závěru autor stručně naznačil způsob, jak si představuje postup popisu sémantiky organicky zapojený do celkového popisu jazyka.

I. I. Revzin vycházel z Bar-Hillelovy[6] hypotézy o možnosti existence různých syntaktických popisů a dokazoval, že nejenom mohou existovat dvě stejně dokonalé gramatiky téhož jazyka, ale že mluvčí také patrně takových různých gramatik užívá.

Dalšímu z aktuálních problémů algebraické teorie jazyků, totiž otázce vztahu závislostních a frázových gramatik, byl věnován referát J. Robinsonové;[7] autorka v něm popsala dvě metody, z nichž jednou se převádějí bezkontextové frázové gramatiky (FG) na jim odpovídající (tj. stejně silné) závislostní gramatiky (ZG), druhou pak se převádějí ZG na jim odpovídající FG. Pro ZG používá notace známé z prací H. Gaifmana a D. Hayse.[8] V referátu se zavádí pojem strukturní citlivosti (structure sensitivity), která je pro ZG obdobou kontextovosti u FG. Závěrem pojednala autorka o omezeních kladených na gramatiky, aby byly zbaveny této vlastnosti.

Některé referáty byly věnovány dílčím lingvistickým otázkám empirického charakteru. Podle nich bude třeba empirické znalosti o přirozených jazycích mnohde prohloubit, aby bylo možno vypracovat gramatický popis odpovídající požadavkům, které jsou dnes na něj gramatickou teorií kladeny. Potvrzovaly rovněž, že tyto požadavky spolu s užívanými postupy vedou k jasnějšímu, přesnějšímu a také úplnějšímu formulování poznatků (ne vždy nutně nových, často dokonce všeobecně známých). Příkladem může sloužit referát A. Hoppeho (Bonn) o překládání německých konstrukcí s významem posesívnosti. Lingvisticky méně zajímavý byl referát K. Borkowského (USA) o strojovém rozpoznávání vlastních jmen [109]v procesu překladu novinových zpráv. Otázkou sémantického rozboru adverbií a předložkových pádů ve sponových větách se zabýval G. K. Schweisthal.

Zvláštní sekce byla věnována otázkám lexikologie a lexikografie. Nejzajímavější zde byl příspěvek H. P. Edmundsona z Kalifornské university v Los Angeles; pokusil se navrhnout způsob modelování vztahu synonymie a antonymie ve slovní zásobě. Tyto vztahy chápe jako ternární relaci, kterou je možno definovat množinou axiómů. Dále naznačil možnost topologické charakterizace slovní zásoby. Referát vyvolal řadu připomínek lingvistů poukazujících na to, že metoda je demonstrována pouze na velmi primitivních jevech a že složitější (jemnější) vztahy nebude možno takto postihnout. Referující ovšem dokázal většinu předložených příkladů pomocí své metody popsat. Přestože diskuse nevyzněla jednoznačně, je třeba Edmundsonův pokus o axiomatizaci popisu vztahů v slovníku považovat za vážný příspěvek do metodologie nauky o slovní zásobě. Dále v této sekci přednášeli J. A. Bachrach a L. Hirschbergová z Beneluxu o zlepšení automatického slovníku DICAUTOM, které záleží v rozšířeném zpracování nejrůznějších kontextů, v nichž se dané slovo (termín) může vyskytovat.

Referát autorů J. Olneye — C. Revarda a P. Ziffa (Santa Monica, California) o vyvinutí strojových prostředků k získání formálního sémantického popisu angličtiny popisoval způsob automatického a poloautomatického zpracování dvou výkladových slovníků angličtiny jako získání základu pro její sémantický popis, zejména pro popis její slovní zásoby (jde o automatické získávání sémantické klasifikace, uspořádání sémantických složek, získávání sémantických polí, základních slovních forem zbavených afixů). Do programu je zahrnut rovněž rozklad slov na morfémy a tzv. produktivní lexikální procedury, tj. v podstatě tvoření slov. Tyto procedury se pak uvádějí ve vztah k pracím na generativní gramatice, tj. přihlíží se při tvoření slov a při obsazování generovaných struktur terminálními symboly také k syntaktickým vlastnostem slov. Navrhovaný projekt je zajímavým a slibným příspěvkem k systematickému studiu otázek lexikální sémantiky.

Poněkud menší pozornost byla na této konferenci věnována čistě matematickým aspektům lingvistického zkoumání. J. P. Benzécri upozornil na závažnost statistických údajů v otázkách, kde jiná než početní kritéria nejsou nebo jsou ne dost jasná, např. při jemném třídění lexikální zásoby podle společného výskytu slov (tříd slov). Nové výsledky francouzských badatelů z oblasti zkoumání ekvivalentnosti různých typů kontextových frázových gramatik byly shrnuty v referátu J. P. Benzécriho—J. Frianta— R. Guedje a J. Roubauda.

Na konferenci byly prezentovány nejnovější praktické výsledky použití počítačů v lingvistice (např. příspěvek K. Harpera, D. Hiżové a A. Joshiho). Potvrdila se znovu nutnost orientace na sémantickou analýzu přirozených jazyků. Ukázalo se také, že je třeba dále se věnovat pečlivému a detailnímu studiu gramatiky a jejího vztahu k sémantice a že ani teoretické otázky možností formalizace jazykového popisu nejsou zcela uspokojivě vyřešeny. Pro otázku budoucnosti (možností a ekonomičnosti) strojového překladu, která v poslední době byla znovu mezi odborníky živě diskutována, znamenala konference jisté upevnění toho směru v matematické, aplikované a strojové lingvistice, který pečlivou teoretickou a empirickou přípravou a využíváním počítačů směřuje k možnému uplatnění počítačů při strojovém překladu.


[1] Prvá byla v r. 1965 v New Yorku, srov. P. Sgall, Newyorská konference o strojové lingvistice, SaS 27, 1986, 94—96.

[2] 2éme Conférence internat. sur le traitement automatique des langues. Grenoble 23—25 août 1967.

[3] Srov. P. L. Garvin, Syntactic Retrieval ve sb. Proceedings of the National Symposium on Machine Translation, Prentice Hall, Inc., 1961, 286—292.

[4] Laboratoř SP university v Grenoblu (Centre d’Études pour la Traduction Automatique) vybavená počítači IBM byla během kongresu oficiálně inaugurována, založena však byla už dříve; za několik let dosáhla již významných výsledků.

[5] Srov. o tom ref. P. Nováka Jazyk a stroje, SaS 28, 1967, 327—329.

[6] Y. Bar-Hillel, Four Lectures on Algebraic Linguistics and Machine Translation, 1963, Hebrew University, Jerusalem.

[7] Srov. např. H. Gaifman, Dependency system and phrase structure systems, The Rand Corporation, Santa Monica, California, May 1961; u nás k této otázce P. Novák, Závislostní koncepce v syntaxi (pokus o formální rozbor), habil. práce.

[8] D. Hays, Dependency theory: a formalism and some observations, The Rand Corporation, Santa Monica, July 1964.

Slovo a slovesnost, volume 29 (1968), number 1, pp. 107-109

Previous Emanuel Michálek, Igor Němec: Zpráva o prvém lexikografickém symposiu slovanských historických slovníků

Next Milena Tylová: Spolupráce ČSAV se Státní knihovnou ČSSR v oblasti jazykovědné bibliografie