en cz

K otázkám strojového překladu v Moskvě

Igor A. Meľčuk (Moskva)

[Rozhledy]

К вопросам машинного перевода в Москве / Traduction automatisée à Moscou

[*]Tento článek se týká především obsahu, cílů a perspektiv jedné ze sovětských skupin, které se zabývají otázkami strojového překladu. Jde o kolektiv, který se utvořil kolem A. A. Ljapunova a matematiků jeho skupiny (Steklovův institut matematiky AV SSSR) v Moskvě.

Práce tohoto kolektivu začala v r. 1955, kdy matematičky O. S. Kulaginová, T. Ventceľová a autor tohoto článku přikročili k vytvoření algoritmu pro strojový překlad matematických textů z francouzštiny do ruštiny. Matematický text se zdá pro první pokus nejvhodnější vzhledem k ustálené terminologii, málo rozmanité slovní zásobě a jednoduché, v mnohém standardizované syntaxi.

S pomocí studentů filologické fakulty moskevské university byla provedena excerpce pro slovník přímo z francouzských matematických textů. Byl prozkoumán text asi o 30.000 slov. Mezi těmito 30.000 slov bylo nalezeno přes tisíc slov různých. K těmto slovům byla bez statistického šetření přidána nejdůležitější slova pomocná a řada důležitých termínů, které se [286]neobjevily ve zkoumaných textech. Tak byl vytvořen slovník přibližně z dvou tisíc jednotek. V letech 1955—1956 byl vypracován vlastní algoritmus překladu, jehož částečný popis byl uveřejněn v čas. „Voprosy jazykoznanija“.[1] Úplný popis tohoto algoritmu vyjde v 2. č. sborníku „Problemy kibernetiki“.[2]

V r. 1957 dokončily O. S. Kulaginová a G. V. Čekovová programování francouzsko-ruského algoritmu a bylo započato se zkušebními překlady na stroji „Strela“. Je už přeloženo několik desítek vět, při čemž se nepřipouštělo předběžné redigování překládaného textu, ani dodatečná úprava získaného překladu.

Příklady vět přeložených strojem:

Indiquons une autre méthode pour établir l’existence des intégrales des équations différentielles ordinaires. — Ukažem drugoj metod, čtoby ustanoviť suščestvovanije integralov obyčnych differenciaľnych uravnenij.

Si le point (a, b) est sur une ligne E, la valeur cherchée de l’intégrale sera nulle. — Jesli točka (a, b) jesť na linii E, najdennoje značenije integrala budet ravnym nulju.

Nous pouvons par suite énoncer pour l’équation (a) le théorème suivant. — My možem sledovateľno sformulirovať dlja uravnenija (a) sledujuščuju teoremu.

Le théorème qui vient d’être établi subsiste dans ces nouvelles conditions. — Teorema kotoraja toľko čto byla ustanovlena suščestvujet v etich novych uslovijach.

V mnohých přeložených větách jsou chyby, způsobené vadami programu nebo technickými závadami a někdy nedostatky algoritmu. Tak např.:

Pour effectuer l’intégration, nous chercherons d’abord l’intégrale générale, qui sera une certaine fonction de y, dans laquelle figurera x. — Čtoby osuščestviť integrirovanije my najdennem snačala obščij integral kotoraja budet nekotoroj funkcijej y v kotoroj figurirovajet x.

Or si le nombre K augmente indéfiniment, on obtient (formule) c’est-à-dire que tous les coefficients deviennent égaux à l’unité. — Itak, jesli čislo K vozrastet neograničenno my polučim (formule), to-jesť, čto tous koefficienty stanovjatsja ravnymi jedince (kde tous nebylo přeloženo pro čistě technickou závadu).

V průběhu pokusů se zpřesňovaly a zdokonalovaly překladatelské programy; zpřesňoval se též vlastní algoritmus. Nedávno (v létě r. 1959) provedly O. S. Kulaginová a G. V. Čekovová strojový překlad souvislých úryvků textu se zcela uspokojivými výsledky.

Hlavní rysy francouzsko-ruského algoritmu jsou tyto:

1. Proces překladu se skládá ze dvou částí, analýzy a syntézy: Analýza záleží v tom, že se pro každé slovo francouzského textu zjišťuje, jaký tvar má mít příslušné slovo ruské. — Syntézou nazývám sestavení uvedených tvarů slov ruských. Překládá se tedy po slovech.

2. Analýza se provádí především na základě morfologie. Morfologické rozdíly se v psané francouzštině vyjadřují dostatečně důsledně a to umožňuje snadno analyzovat koncovky a pomocná slova (předložky, pomocná slovesa aj.). V řadě případů je ovšem nutno využívat více méně širokého kontextu; avšak tyto případy syntaktické analýzy jsou jedinečné, netvoří systém a mají vzhledem k morfologii jen úlohu pomocnou.

3. Protože pořádek slov ve francouzštině a v ruštině je dosti shodný, ukázalo se, že při analýze není nutno ve francouzském textu přihlížet k vzájemné poloze slov ani k jejich vztahům. Pořádek slov je při překladu zachováván s výjimkou jednotlivých případů jednoduchých přesunů (jako např. přesun postponovaných adjektiv: équation différentielle — differenciaľnoje uravnenije).

Francouzsko-ruský algoritmus je sestaven speciálně pro binární překlad, to znamená, že je určen pro danou dvojici jazyků a pro překlad pouze jedním směrem, tj. pouze z francouzštiny do ruštiny. Není použitelný, při nejmenším je velmi nepraktický pro překlad do jakéhokoli jiného jazyka, neboť analýza francouzského textu je provedena z hlediska překladu do ruštiny.

[287]Po francouzsko-ruském algoritmu sestavila T. N. Mološná z Institutu matematiky anglicko-ruský algoritmus, rovněž pro překlad textu matematického. Ačkoli tento algoritmus je též binární (byl totiž určen pro překlad z angličtiny do ruštiny), je vybudován zcela jinak než algoritmus francouzsko-ruský. Vzhledem k chudobě morfologie a k rozšířenosti konverze (slovo může patřit do různých slovních druhů: work „práce“, „pracovat“, „pracovní“) je v angličtině nejdůležitější analýza syntaktická, jež si vyžaduje prozkoumání širokého kontextu. T. N. Mološná vypracovala zvláštní systém metod pro takovou analýzu, založený na zjištění typických elementárních slovních spojení (obvykle spojení dvou slov) v angličtině a v ruštině. Zásady pro sestavení anglicko-ruského algoritmu popsala v časopise „Voprosy jazykoznanija“;[3] jeho hlavní teze zde připomínáme.

1. Anglické věty se rozkládají na elementární slovní spojení (tvoří je dvě až čtyři slova), jež nejsou skupinami slov samých, nýbrž strukturami složenými z druhů slov rozmístěných v určitém pořadí a majících určitou gramatickou formu. Např. adjektivum + substantivum shodují se v rodě, čísle a pádě (hluboký sníh) aj. (v uved. čl. s. 92).

2. Těmto nejjednodušším anglickým slovním spojením jsou přiřazena analogická slovní spojení ruská (ve většině případů je přiřazení jednoznačné; v případě mnohoznačnosti platí dodatečná pravidla). Překládá se takto: „Anglická věta je podrobena analýze (zjištění nejjednodušších volných slovních spojení) a pak se z ruských spojení, odpovídajících příslušným anglickým, sestavuje ruská věta“ (s. 92).

3. Při analýze anglického textu se užívá tzv. komprimace, tj. zjednodušování slovních spojení tím, že celé spojení je nahrazeno svým hlavním komponentem; tak např. spojení „adjektivum + substantivum“ je syntakticky ekvivalentní substantivu a za určitých podmínek jím může být nahrazeno. Komprimace se užívá, jak uvádí autorka, k tomu, „aby se postupně zjistily vztahy mezi všemi slovy ve větě, nejen mezi těmi, která jsou v bezprostředním sousedství, ale i těmi, která nejsou vedle sebe a jsou mezi sebou reálně spojena“ (v uved čl. s. 94).

Anglicko-ruský algoritmus, založený na srovnávání elementárních struktur (konfigurací) dvou jazyků, je krokem vpřed vzhledem k algoritmu francouzsko-ruskému, kde se srovnávání omezuje jen na jednotlivá slova.

V současné době se provádí programování anglicko-ruského algoritmu a v blízké budoucnosti bude možno zahájit zkušební překlady strojem.

Po anglicko-ruském algoritmu vypracoval autor tohoto článku v letech 1956—1957 maďarsko-ruský algoritmus, určený především k překladu speciálního lingvistického textu.[4] Maďarština byla zpracována proto, aby se objasnily zvláštnosti, které přinese do struktury algoritmu svérázná stavba tohoto jazyka, tak odlišná od stavby angličtiny a francouzštiny. Ukázalo se, že ačkoli je morfologie maďarštiny velmi bohatá a gramatické významy se vyjadřují především tvary slov, vytvořit maďarsko-ruský algoritmus jen na morfologickém základě, analogicky jako francouzsko-ruský, není možno.

Jde o to, že se pořádek slov v maďarštině tak podstatně liší od pořádku slov v ruštině, že správně přeložená věta při zachování výchozího pořádku slov může být zcela nesrozumitelná nebo jen těžko srozumitelná. Proto je třeba v přeloženém textu provádět četné a dosti složité inverze slov a k tomu je nutno znát vzájemné vztahy a závislosti slov. Tím se těžiště přesunuje na analýzu syntaktickou a tu je vhodnější provádět poněkud jinak, než jak se postupovalo v algoritmu anglicko-ruském. Při syntaktické analýze maďarského textu je obvykle nutno [288]určovat vzájemné závislosti mezi slovy od sebe vzdálenými. Tato operace vyžaduje speciálního aparátu, který se nevypracovával pro angličtinu nebo francouzštinu.

Zkušenost z práce na uvedených třech algoritmech umožnila dospět k některým závěrům, na nichž je založena veškerá další práce:

a) odmítnutí čistě binárních algoritmů, těsně vázaných na danou dvojici jazyků, a přechod k pokusům o vytvoření takových obecných algoritmů, které by umožnily překládat z daného jazyka do jakéhokoli jazyka jiného a naopak;

b) překládání především na základě syntaktického rozboru, při čemž nejpodstatnějším činitelem je srovnávání elementárních, nejprostších slovních spojení jednoho jazyka s analogickými slovními spojeními jazyka druhého;

c) nutnost vytvořit takový systém analogií mezi jazyky, který by zahrnul: lexikální analogie; morfologické analogie — mezi takovými „mimosyntaktickými“ kategoriemi jako číslo u podst. jmen, čas a způsob u slovesa atd.; syntaktické analogie — mezi elementárními slovními spojeními různých jazyků.

Tento systém analogií, vytvářející jistý kalkul, je možno považovat za převodní jazyk (rus. jazyk-posrednik) pro strojový překlad.[5]

V nynější době je největší úsilí soustředěno na vypracovávání tohoto převodního jazyka.

Překlad pomocí převodního jazyka je chápán takto: Pro každý z překládaných jazyků je vypracován speciální algoritmus, který tvoří dvě skupiny pravidel: pravidla analýzy a pravidla syntézy.

Pravidla analýzy dovolují přecházet od textu ve vstupním jazyce (rus. perevodimyj jazyk) k dohodnutému číselnému kódu, při čemž každému slovu v dané formě a syntaktické funkci je jednoznačně přiřazena určitá číselná řada, nazývaná informací o slově. Informace je soubor cifer, kterými se označují všemožné charakteristiky slova.

Posloupnost informací je rozkládána na typicky dvojčlenná spojení — konfigurace. Jeden z členů konfigurace je hlavní, druhý závislý. Každé konfiguraci je přiřazeno číslo syntaktického vztahu existujícího mezi slovy tvořícími tuto konfiguraci; tím končí analýza.

Podle pravidel syntézy se provádí operace, která je opačná k popsané analýze: se znalostí čísla syntaktických vztahů, které je třeba vyjádřit, je možno vyhledat odpovídající konfigurace a dále přejít od posloupnosti konfigurací k reálnému textu ve výstupním jazyce (rus. perevodjaščij jazyk), (neboť každé číselné řadě, každé informaci, je jednoznačně přiřazeno slovo v určité formě).

Tak se analýza a syntéza provádějí zcela nezávisle na překladu a zůstávají neměnné pro daný jazyk při překladu z daného jazyka do libovolného a naopak. Proto se algoritmy analýzy a syntézy vypracovávají pro každý jazyk zvlášť.

Kromě toho je dán převodní jazyk, totiž speciální tabulky a soubory pravidel, s jejichž pomocí se přechází od číselného kódu jazyka vstupního k číselnému kódu jazyka výstupního, a to tak, že k určitému počtu uložených informací jednoho jazyka se připojuje některé spojení odpovídajících informací jazyka druhého. — Vztahy zdaleka nebývají vždy jednoznačné; v takových případech se užívá pravidel výběru založených na analýze kontextu.

V současné době se na převodním jazyku pracuje v těchto ústavech: v Institutě jazykovědy AV SSSR, v Steklovově Institutě matematiky (lingvistka T. N. Mološná, matematička O. S. Kulaginová a G. V. Čekovová) a v Laboratoři elektromodelování AV SSSR (lingvistky Je. V. Padučevová, M. Langlebenová, A. L. Šumilinová, I. N. Šelimovová a Z. Volocká). Zatím se pracuje na modelu převodního jazyka. Sestavují se pro něj tyto algoritmy: ruský, anglický, francouzský, maďarský (a to především pravidla analýzy). Všechny algoritmy jsou zalo[289]ženy na krátkém textu asi 150 slov; gramatické jevy tu nejsou plně zachyceny, přestože nejpodstatnější z nich, nejcharakterističtější pro každý jazyk, berou se v úvahu v algoritmech modelu. Úkolem práce v dané etapě není vyčerpávající popis zkoumaných jazyků, nýbrž vytvoření zásadního, zároveň však konkrétně přesného schématu tohoto popisu. Bude-li tento úkol vyřešen uspokojivě, tj. bude-li toto schéma zdařilé, pak další rozšíření algoritmů nebude příliš obtížné a nevyžádá si nějakých podstatných změn v schématu samém.

Při práci bylo zapotřebí provést řadu čistě lingvistických výzkumů, nutných pro řešení otázek, které se obvykle v gramatikách neuvádějí. Tak A. L. Šumilinová sestavila formální pravidla pro tzv. „rekonstrukci zájmena“ (tj. pro určení, které podst. jméno je zastoupeno daným zájmenem); I. N. Šelimová zkoumala otázku, v jakém vztahu jsou předložkové vazby (předložka + podstatné jméno) s tím nebo oním slovem atd.

Vytvoření dostatečně rozvinutého a univerzálního systému analogií mezi jazyky přinese užitek nejen praxi strojového překladu, nýbrž i lingvistické teorii. Je možné, že se na základě převodního jazyka, tohoto abstraktního kalkulu, podaří po příslušném logickém zpracování vytvořit „metajazyk“ lingvistiky a vypracovat metody formálního popisu, jež jazykověda tolik postrádá.

Plány další práce jsou tedy přibližně takovéto:

1. Při práci na převodním jazyku využívat dalších jazyků, zejména němčiny, jazyků skandinávských, slovanských (kromě ruštiny), vietnamštiny, arabštiny, indonéštiny aj., aby bylo možno ve společném systému analogií zaregistrovat co možná nejvíce různých jazykových zvláštností a tím dosáhnout obecnějšího systému.

2. Rozšiřovat a doplňovat již existující algoritmy: a) podstatně zvětšit slovníky kmenů, až na několik tisíc jednotek; b) sestavit vyčerpávající seznamy elementárních slovních spojení možných v daném jazyce; c) úplněji a důkladněji zpracovat frazeologii; d) zaregistrovat a popsat co nejvíce individuálních zvláštností jednotlivých jazyků (specifické konstrukce, užívání slov atd.).

3. Ve spolupráci se specialisty v logice a logické sémantice zpřesnit metody a schémata formálního popisu. Je možné, že se později na základě převodního jazyka, ke kterému se dospělo empirickou cestou jako k zobecněnému systému analogií mezi řadou konkrétních jazyků, podaří vytvořit logicky zpracovaný, přísně formalizovaný jazyk strojového překladu, druh logického kalkulu.

4. Široce rozvinout statistický výzkum řeči, aby matematikové a lingvisté mohli řešit otázky o ekonomičnosti a vhodnosti toho nebo onoho způsobu popisu na základě frekvenční charakteristiky zkoumaného jevu.

5. Popsat způsob a metody používané při sestavování algoritmů strojového překladu, aby bylo možno v budoucnu, až bude rozřešen problém samého procesu sestavování algoritmů, svěřit tuto práci strojům (s využitím předem připravených slovníků, paralelních textů v několika jazycích aj.).

6. Co se týče teoretické stránky, je základním úkolem, aby se v lingvistice maximálně využilo spolupráce lingvistů a matematiků, logiků a inženýrů: je třeba důsledně užívat v jazykovědě metod exaktních věd, dosahovat nutné přísnosti formálních popisů při různých lingvistických výzkumech atd.

Na závěr je třeba dodat ještě toto: Protože dosud neexistují speciální elektronkové stroje pro překlad, veškeré pokusy se dosud prováděly na univerzálních počítacích strojích. Překlad pomocí univerzálních strojů je zcela možný, avšak ne dost účelný a úsporný. Proto je důležité shrnout dosavadní zkušenosti a rozebrat nynější postup z hlediska projektování a budování elektronkového stroje, určeného speciálně pro překlad. Postavení takového stroje významně podnítí další práce na strojovém překladu.[6]

[*] Článek byl napsán v květnu 1958. — Z ruštiny jej přeložil N. P. Savickij.

[1] O. S. Kulagina a I. A. Meľčuk, Mašinnyj perevod s francuzskogo jazyka na russkij, VJaz 1956, č. 5, s. 111—121.

[2] O. S. Kulagina, Algoritm perevoda s francuzskogo jazyka na russkij.

[3] T. N. Mološnaja, Nekotoryje voprosy sintaksisa v svjazi s mašinnym perevodom s anglijskogo jazyka na russkij, Vjaz 1957, č. 4, s. 92n.

[4] Viz Bjulleten’ ob’jedinenija po mašinnomu perevodu pri MGPIIJa, 1957, č. 4. — Viz také nyní autorovu stať O mašinnom perevode s vengerskogo jazyka na russkij, Problemy kibernetiki 1, 1958, s. 222—264.

[5] Je to jeden z četných možných přístupů k problému převodního jazyka (srov. např. čl. N. D. Andrejeva, Mašinnyj perevod i problema jazyka-posrednika, VJaz 1957, č. 5, s. 117n. a zde s. 280.

[6] O postupu těchto prací viz zde přísp. B. Palka, s. 277—285.

Slovo a slovesnost, ročník 20 (1959), číslo 4, s. 285-289

Předchozí Bohumil Palek: Strojový překlad v SSSR (Zkušenosti z konference o matematické lingvistice v Leningradě v r. 1959)

Následující Igor Němec: Československý příspěvek k prohloubení historickosrovnávacího studia slovanských jazyků

Menu
O archivu
Archiv
Nová domovská stránka
Hledání v archivu: