Časopis Slovo a slovesnost
en cz

Francouzský matematik o perspektivách strojového překladu

Svatava Machová

[Kronika]

(pdf)

Французский математик о перспективах машинного перевода / Un mathématicien français sur les perspectives de la traduction automatique

Ve více než dvacetileté historii strojového překladu (SP) se střídala období optimismu a pesimismu. Optimismu i pesimismu propadali jak někteří pracovníci tohoto oboru, tak i jeho potenciální uživatelé.[1] Po r. 1966 se počet skupin, které se věnovaly SP, značně zmenšil a k podstatnému oživení dochází přibližně až v první polovině sedmdesátých let. Stává se tak především proto, že roste potřeba rychlého překladu odborných technických textů a prudce stoupá cena lidské práce.[2]

Tvůrcové nových systémů SP se pochopitelně musejí zamýšlet nad příčinami dřívějších neúspěchů. Jedna z možných — nedostatečný rozsah paměti počítače — už v současné době ztrácí na účinnosti. Ostatní se dají shrnout do dvou okruhů spolu souvisejících: (1) nízký stupeň porozumění textu; (2) strnulá a neohebná organizace modelu.

K překladu je třeba značného stupně porozumění textu a toho dřívější systémy nebyly schopny. Mnohé skupiny spatřují v této skutečnosti hlavní příčinu neúspěchu SP, a usilují proto o vybudování systémů, které budou do jisté míry textu rozumět. Cesty k tomu jsou rozmanité, jak o tom svědčí četné studie z oblasti tzv. umělé inteligence.[3]

Druhému okruhu příčin je převážně věnována studie Bernarda Vauquoise La traduction automatique à Grenoble.[4] V první části knihy (s. 14—140) B. Vauquois zajímavě a přehledně podává historii SP od r. 1961 až do r. 1972, jak se obráží v pracích odborníků amerických, sovětských, kanadských a francouzských.

Druhá část knihy je věnována budoucnosti, perspektivám SP. Autor se domnívá, že rozhodný krok kupředu může být udělán poté, kdy modely SP přestanou být strnulými a neohebnými a stanou se pružnými: Téměř každý návrh SP počítal s tím, že po důkladné morfologické analýze všech elementů vstupního textu bude provedena úplná syntaktická analýza a na ni bude přímo navazovat buď syntaktická syntéza textu cílového jazyka, anebo se bude před ní ještě provádět analýza sémantická; ta každou větu převede na formuli nějakého umělého jazyka, která zachová smysl věty, nikoli však morfologické a syntaktické rysy vstupního jazyka (tzv. převodní jazyk). Poslední etapou pak bývala syntéza syntaktická a morfologická.

Model SP byl strnulý v tom smyslu, že se v každé etapě uplatňovala jistá procedura na všechny elementy překládané věty, zatímco by v mnoha případech bylo vhodné diferencovat a např. překládat některé elementy do cílového jazyka bezprostředně po morfologické analýze, aniž by se prováděla jejich analýza [352]syntaktická, jiné po analýze syntaktické a jiné teprve po analýze sémantické.

Neohebný byl model v tom smyslu, že po provedení nějaké procedury nebylo možno se k ní znovu vrátit: Při syntaktické syntéze nebylo možno se vrátit např. k syntaktické analýze a obohatit ji — což některé zvláštní případy vyžadují.

Model SP by tedy měl být organizován tak, aby se s jednoduchými případy nezacházelo stejně jako se složitými. B. Vauquois podává ve své práci návrh systému, který by tyto vlastnosti měl, byl by „přizpůsobivý“ a jeho složky by se při své činnosti vzájemně ovlivňovaly. Vychází při tom z progresívních aspektů modelů T. Winograda, W. Woodse a A. Colmerauera.[5] Základní organizace Vauquoisova modelu přináší mnoho nového, uvnitř každé etapy SP se však přirozeně uplatňuje velká většina dosavadních postupů.

Vauquoisův model se skládá z těchto základních složek: (1) přenašeč, (2) monitor, (3) algogramatika, (4a) morfologický analyzátor, (4b) transformátor, (4c) převodník, (4d) generátor, (5) pracovní oblast. Objasnění funkce jednotlivých složek vyžaduje, abych v jejich popisu nepostupovala v tom pořadí, v jakém byly právě uvedeny (toto pořadí vyplývá ze vzájemného propojení příslušných částí modelu).

Přenašeč je zařízení, které zakódovává vstupy a dekóduje výstupy. Přenáší tedy pouze zprávy od uživatele k monitoru a naopak. V pracovní oblasti se na vymezených úsecích v paměti počítače uchovává vstupní text a všechny jeho modifikace vznikající v procesu překládání. (Pracovní oblast je bezprostředně spojena s algogramatikou a s každou sekcí 4. složky modelu.)

Na základě údajů obsažených v algogramatice řídí celý proces překladu monitor, tj. v podstatě řada příkazů, které je třeba za určitých podmínek plnit. Při splnění těchto podmínek uvádí monitor v činnost některou sekci 4. složky modelu: buď morfologický analyzátor (který provádí morfologickou analýzu vstupního textu a mění vstupní řetěz na odpovídající stromovou strukturu), nebo transformátor (zařízení, které mění jedny stromové struktury na druhé a zhruba odpovídá syntaktické analýze a syntéze), popř. uvádí v činnost převodník (což je svého druhu převodní jazyk) nebo generátor (provádí morfologickou syntézu a mění stromové struktury na výstupní řetěz), a to v libovolném pořadí a v libovolný moment překladu. (Algogramatika i každá sekce 4. složky je vedle pracovní oblasti spojena bezprostředně pouze s monitorem.)

Jak často, v jakém pořadí a kdy je uváděna ta či ona procedura v chod, je dáno údaji obsaženými v algogramatice. Ta je základem celého procesu, sama o sobě neobsahuje žádný algoritmus, i když určuje výběr algoritmu na každém kroku. Algogramatika popisuje vztahy mezi ekvivalentními texty dvou jazyků, je to všestranný konfrontační popis. Tento popis má formu sítí s přechody a přerušeními. Při překladu se pak v sítích algogramatiky hledá cesta, která by byla slučitelná se vstupním řetězem, a k tomu, aby se našla, uvádí monitor v chod různé základní složky modelu.

Model B. Vauquoise vnáší do procesu SP četné nové a slibné postupy. Pracoviště v Grenoblu, kde budou pokusy na základě tohoto modelu prováděny, má velké zkušenosti (pokud jde o překlad odborného textu z ruštiny do francouzštiny, patří toto pracoviště k nejpokročilejším v Evropě). Proto můžeme právem očekávat od něho kvalitní výsledky.


[1] Srov. B. Havránek, Budoucnost strojového překladu? SaS 24, 1963, 140; J. Panevová - E. Hajičová, Algebraická lingvistika a informatika II, Strojový překlad, Čs. informatika 14, 1972, 17—24.

[2] D. Berbille, Traduction automatique et traducteur traditionnel, předneseno na 4. mezinár. kongresu aplikované lingvistiky, Stuttgart 1975.

[3] Srov. např. Trudy 6. meždunarodnoj objedinennoj konferencii po iskusstvennom intelektu, tom 6., Obščenije s EVM na jestestvennom jazyke, Moskva 1975, 220 s.; P. Sgall, Lingvistika a umělý intelekt, SaS 35, 1974, 205—208.

[4] Documents de la Linguistique Quantitative 24, Paris 1975, 180 s.

[5] T. Winograd, Understanding natural language, New York 1972; W. A. Woods, An experimental parsing system for transition network grammars, Cambridge 1972; A. Colmerauer, Systèmes-Q, Rapport TAUM 71, Univ. de Montréal 1971.

Slovo a slovesnost, ročník 37 (1976), číslo 4, s. 351-352

Předchozí Růžena Bergerová: Sovětská práce o skladbě konstrukcí s „cizí řečí“

Následující Dieter Viehweger: Úvahy ke gramatice textu: propoziční pojetí textu proti pojetí orientovanému k jednání