Časopis Slovo a slovesnost
en cz

Symposium o strojovém překladu v rámci Rady vzájemné hospodářské pomoci (RVHP)

Svatava Machová-Komrsková, Jarmila Panevová

[Discussion]

(pdf)

Симпозиум о машинном переводе в рамках Совета экономической взаимопомощи / Symposion consacré à la traduction automatique dans le cadre du Conseil de l’aide économique mutuelle (RVHP)

Příprava strojového překladu (SP) jako jedna z oblastí, kde je nezbytně třeba spojení mnoha sil, byla od r. 1966 zahrnuta jako úkol s mezinárodní spoluprací koordinovaný v rámci RVHP. Podílí se na něm řada skupin z členských zemí RVHP; koordinujícím pracovištěm je Všesvazový ústav vědecké a technické informace (VINITI) v Moskvě, z ČSSR se na úkolu podílí laboratoř algebraické lingvistiky na FF KU. Na dny 10.—13. X. 1967 bylo svoláno do Budapešti první mezinárodní symposium členských zemí RVHP s názvem „Vypracování automatických systémů překladu přirozených jazyků a jejich použití“. — Symposia se zúčastnilo asi 30 odborníků ze 6 zemí (z Bulharska, ČSSR, Maďarska, NDR, Polska, SSSR). Mělo výrazně pracovní charakter; bylo tu předneseno 28 referátů týkajících se předem stanovených tematických okruhů. Plné znění referátů bylo rozmnoženo a při jednání byla hlavní pozornost věnována diskusi.

Prvním tematickým okruhem byly obecné otázky SP a jeho vztah k teorii gramatiky. Pod názvem „strategie při SP“ byly rozebírány otázky možnosti a reálnosti SP. Příznačný byl už název úvodního referátu Ju. A. Šrejdera (SSSR), SP — iluze a skutečnost. Při probírání historie SP a etap jeho vývoje poukázal autor na to, že se prvých pokusů se SP značně zneužívalo reklamně a tím se nadělalo více škody než užitku. V tomto smyslu je patrně SP iluzí. V dnešní situaci stojí podle autora odborníci před těmito úkoly: (1) překonat rozpor mezi studiem formálních modelů a konkrétním popisem jazyků, (2) popsat indeterministické mechanismy jazyka, (3) popsat sémantiku jazyka; dnes se sice již mluví o systémech založených na hloubkové struktuře, ale tyto popisy nejsou dosud ani v stadiu experimentů. Avšak v tomto smyslu — s přihlédnutím k těmto problémům a nevyhnutelnosti jejich řešení v lingvistice vůbec — je SP patrně skutečností. — V ref. Gy. Szépeho (MLR) o vztahu teorie gramatiky a SP se kladly některé zásadní otázky; např. vezmeme-li v úvahu, že Chomského lingvistická teorie má dva stupně: gramatika jazyka L je teorií jazyka L, tj. teorie gramatiky v užším smyslu, a teorie gramatiky ve smyslu metateorie, tj. teorie gramatiky v širším smyslu, a dále, že známá Bar-Hillelova kritika SP[1] byla vedena z pozic teorie gramatiky v užším smyslu, lze se ptát, do jaké míry platí tato kritika z hlediska onoho vyššího stupně teorie gramatiky. Bar-Hillelova kritika se týkala nemožnosti plně automatizovaného vysoce kvalitního SP. Existují však i jiné formy SP (např. částečně automatický, méně kvalitní ap.). [434]Podle autora referátu bylo by třeba vypracovat teoreticky zdůvodněné metody, jak měřit kvalitu SP. — A. Ljudskanov (BLR) ve svém referátu zavedl pojem informace nutné pro překlad, kterou je třeba na základě empirického studia dané dvojice jazyků stanovit. Syntaktické, morfologické a lexikální operace, jimiž se tato informace získává, zadávají se předem. Autor podtrhoval zejména nutnost co nejdříve při analýze odstranit různé složitosti, což znamená, že se přenášejí problémy hloubkové struktury na povrchovější roviny (např. syntaktický problém stavby souvětí se řeší na grafické úrovni podle interpunkčních znamének). Zdá se však, že to není nic jiného než nutnost stanovit funkce na základě formy. — Poněkud odlišný názor byl vysloven v referátu, který přednesl D. Varga (MLR). Analýza přirozených jazyků a její algoritmizace je otázka do té míry složitá, že je třeba k ní přistupovat zpočátku s velmi obecnými pravidly a vycházet z toho, co je obecně možné, a teprve postupně zjišťovat to, co je nějakými podmínkami vyloučeno. Podle D. Vargy nelze směšovat obecná pravidla a zákonitosti jejich použití. Např. při syntaktické analýze jsou dána pravidla, ale podmínky jejich užití už v sobě zahrnují faktory jiné než syntaktické (různá sémantická a kontextová omezení). Úkolem lingvisty je takové podmínky pro jednotlivé roviny jazyka najít a zahrnout je do procesu analýzy jako volné proměnné, nikoli jako pevné součásti systému. Pravidla takového charakteru jsou pak často velmi složitá, avšak na rozdíl od jednoduchých pravidel nevedou k nežádoucímu zkomplikování základního systému.

Druhý tematický okruh se týkal otázek analýzy při strojovém překladu. O referátech, které přednesli členové oddělení matematické lingvistiky VINITI z Moskvy (Ju. A. Šrejder, V. B. Borščov, M. V. Arapov), mluvíme souborně; byly vypracovány na základě shodného přístupu k popisu jazyka při přípravě SP.

Úkolem skupiny je připravovat cestu k uskutečnění automatického zpracování ruských textů. Vyřešení úkolu spojuje skupina s vyřešením SP uvnitř jednoho jazyka (ruštiny).. Jejich cílem je dosáhnout toho, aby jeden ruský text byl parafrázován všemi možnými ruskými texty, které mají se vstupním textem do jistého předem zadaného stupně stejný obsah a liší se od něho svou morfologickou, syntaktickou nebo sémantickou strukturou. Při řešení úkolu vycházejí ze tří základních principů: (1) V každé etapě se snaží stanovit mechanismy společné pro různé složky jazyka, pro několik přirozených jazyků i pro jazyky přirozené a umělé; současně se snaží stanovit parametry, které v různých složkách a jazycích mají různý význam (princip univerzálnosti). (2) Každá soustava, kterou vybudují, bude přístupná značným doplněním a změnám a musí být budována tak, aby nějaká nutná změna podružného charakteru nevyžadovala dlouhý řetěz změn v rozmanitých částech soustavy (princip doplňování). Tento princip je nutný vzhledem k neúplnosti našich znalostí o jazyce. (3) Procedura se sestavuje nezávisle na jakémkoli způsobu realizace (princip nezávislosti).

Gramatika, na jejímž základě formulují analýzu a syntézu ruských textů, je podle jejich slov jistým sjednocením gramatiky bezprostředně složkové a závislostní. Nedostatky obou těchto modelů mají podle autorů jeden společný zdroj: přirozený jazyk totiž nelze popsat na základě nějakého jednoho absolutizovaného principu a je ho třeba popisovat na základě několika dostatečně autonomních mechanismů založených na různých principech. Model, který budují, je bližší přirozeným jazykům (nebo alespoň ruštině), ale poněvadž je to v podstatě agregát, v němž je sjednoceno několik různých mechanismů, bude jeho matematický popis složitý, poněvadž bude třeba formálně zachytit i vztahy mezi těmito dílčími mechanismy. V rámci jednoho modelu nelze podle jejich názoru rovněž sjednotit problémy makrosyntaktické a mikrosyntaktické. (V makrosyntaxi se řeší problémy výskytu jazykových jednotek souvisících s gramatickými vlastnostmi jazykových jednotek a v mikrosyntaxi problémy výskytu souvisící v podstatě se sémantickými vlastnostmi.) Za hlavní úkol makrosyntaxe pokládají vybudování gramatiky, která je schopna vypočítat všechny správné S-texty a pouze [435]je (přičemž pod S-texty rozumějí popis syntaktické struktury nějakých textů). S-texty jsou budovány na základě tzv. grafové gramatiky, do jisté míry shodné s bezprostředně složkovou gramatikou, kde pravidla jsou zadána pomocí grafů. Jedno pravidlo ztotožňují s jedním operátorem dispozice. Dispozici definují jako jisté zobecnění pojmů kalkul a algoritmus. Dispozice se od algoritmu liší tím, že po kterémkoli operátoru je možný přechod k více než jednomu operátoru a v rámci dispozice není nijak zadáno pořadí, v němž mají být jednotlivé cesty zkoušeny. Aparátu složité grafové gramatiky využívá skupina pro popis syntaktického modelu ruštiny a na symposiu bylo předloženo jeho využití k popisu soustavy interpunkčních znamének v ruštině.

K tomuto tématu patřila i řada jiných referátů. J. Kunze (NDR) mluvil o využívání projektivity jako vlastnosti syntaktických struktur při SP; navrhoval jisté zobecnění projektivity, kterému by vyhovovalo více struktur v němčině a angličtině. — A. G. Vasiljevskij (SSSR) podal charakteristiku systému používaného skupinou Centrálního výzkumného ústavu patentní informace v Moskvě při překladu patentových dokumentů z angličtiny do ruštiny. — Z referátu A. Gutové (PLR) se dá soudit, že skupina pracující v Centrálním ústavu vědeckotechnických a ekonomických informací ve Varšavě začíná provádět morfologickou analýzu polštiny a sestavuje slovník polských slov pomocí děrných štítků. — K. Korvasová (ČSSR) chystá zobecněný algoritmus pro překlad odborných textů z angličtiny do češtiny. Ve svém referátu probrala problematiku spojenou s přípravou textů k syntaktické analýze a soustředila pozornost na řešení lexikálně gramatické homonymie. (Jak se ukázalo v diskusi, šlo však o homonymii gramatickou.) V závěru demonstrovala výsledek práce na překladu jedné anglické věty do češtiny, aniž byl naznačen postup uplatněný při syntéze. — Tematicky sem patřil i referát S. Ja. Fitialova (SSSR), popisující systém užívaný leningradskou skupinou. Jde o systém založený na modelu gramatiky valentností. Analýza a syntéza jsou pojímány nezávisle, v procesu překladu jsou zahrnuty etapy jako interpretace vstupního textu (tj. zbavení zvláštností vstupního jazyka) a interpretace výstupní (tj. úprava vhodná pro výstupní jazyk).

Třetí tematický okruh byl věnován otázkám sémantickým. Zde zaujal zejména referát akad. L. Kalmára (MLR). Autor se v něm zabýval pojmy význam, synonymie a překlad, které jsou spolu logicky spjaty. Dvě jazykové formace (slova, konstrukce, věty) jsou synonymní tehdy, mají-li stejný význam. Chápe-li se synonymie jako relace ekvivalence, pak je možno na základě metod teorie množin definovat pojem významu nějaké jazykové formace jako to, co je společné jí a formacím s ní synonymním. Překlad je pak zobrazení formací jednoho jazyka na množinu formací druhého jazyka, kde význam formací zůstává invariantní. Takto jednoduché mohou být tyto vztahy, pokud nepřihlížíme k homonymii, ale protože přirozený jazyk je komplikován množstvím hononymie, definuje autor relaci slabé synonymie (tj. částečné),[2] která je reflexívní, symetrická, ale intranzitivní. Bere-li se v úvahu homonymie, vznikají tady složitější vztahy mezi probíranými pojmy, které jsou zajímavými matematickými problémy. Některé z nich se v referátu probíraly a směřovaly k doplnění pojmu a stupňů synonymie. Uspokojivé řešení otázek významu musí být založeno nejen na pojmu synonymie uvnitř jazyka, ale také na pojmu mezijazykového překladu. Analogicky jako silnou a slabou synonymii definuje pojem silného a slabého překladu; je to opět relace mezi jazykovými formacemi, ale tentokrát náležejícími různým jazykům. Tento přístup k otázkám tak málo formalizovaným, jako je tomu u probíraných pojmů, je nepochybně plodný.

K problematice nutnosti sémantických studií při přípravě SP patřil dále ref. E. Agricoly (NDR) věnovaný otázce syntaktické a sémantické homonymie a způsobům jejího řešení. Případy homonymie autor třídil podle typů a navrhl výstavbu [436]„optimálního lingvistického thesauru“ jako předpokladu pro řešení homonymie. — Nutnost zabudování sémantických údajů do systému automatické analýzy ukázal G. Sipöczy (MLR) na příkladu překladu předložkových konstrukcí v ruštině; šlo zejména o konstrukce s homonymií mezi neshodným přívlastkem a doplněním slovesa.

Čtvrtá tematická oblast — syntéza — byla v podstatě vyplněna referáty z ČSSR. J. Panevová poukazovala na možnost uplatnit výsledky práce týkající se generativního popisu češtiny při syntéze češtiny a na shody a odchylky těchto dvou procedur. V závěru navrhovala určitý způsob využití samočinného počítače při zpracování materiálu vhodného pro obě procedury. Na tento referát navazující ref. S. Komrskové pojednával o tom, jak lze při syntéze snížit počet vybraných forem sloužících k vyjádření jednoho a téhož gramatického významu.

Problematice slovníku byly věnovány dva referáty. E. Hajičová se zabývala využitím frekvenčního slovníku pro hledání kontextových kritérií při výběru nejvhodnějšího překladu. F. Papp (MLR) popisoval způsob, jímž byl pomocí děrných štítků zpracován maďarský výkladový slovník. Na štítcích byly zachyceny nejen informace gramatické (slovní druh, způsob tvoření slova ap.), ale i lexikálně sémantické (podle slovníkových definic). Získaný materiál byl postupně zpracován v soustavy podle různých hledisek. Autor doporučoval, aby podobným způsobem byly zpracovány výkladové slovníky jednotlivých jazyků členských zemí RVHP, aby se tak získala jednotná koncepce pro sestavování slovníku pro SP.

Jak již uvedeno, pracovní ráz symposia kladl důraz na diskusi. Velká pozornost byla věnována vyjádření vztahu ke zprávě komise Automatic Language Processing Advisory Committee (ALPAC) Jazyk a stroje.[3] Celkově se konstatovalo, že zpráva vyplynula z amerických poměrů a vztahuje se k nim; není psána na dosti odborném základě a její propočty o potřebě překladatelů, o nákladech ap. nelze pro naše země přijmout. Poukazovalo se též na to, že zpráva ani prakticky neovlivnila směr výzkumu těch pracovišť, jejichž zaměření nebylo jen úzce prakticistické. V USA měla nanejvýš vliv na jistý přesun sil mezi jednotlivými pracovišti. V diskusi bylo též poukázáno na to, že existuje ještě další zpráva, vydaná jinými představiteli předních pracovišť SP, jejíž vyznění je mnohem optimističtější.[4]

Jinou otázkou, k níž se účastníci symposia v diskusi často vraceli, byla otázka výhod a nevýhod závislostní a bezprostředně složkové koncepce v syntaxi.[5] Zastánci bezprostředně složkové koncepce pokládají za nevýhodu nutný binarismus závislostní koncepce a nutnost stanovení směru závislosti. Tyto námitky nelze však podle našeho názoru zcela přijmout. Jiná sporná otázka se týkala vztahu mezi komplikovaností systému a jednoduchostí pravidel a otázky přenášení a vypouštění informací v průběhu analýzy.

Vcelku mělo symposium dobrou úroveň; řešily se tu otázky lingvistické (týkající se jak přístupů k SP, tak vztahu mezi jazykovým popisem a SP), a to z hlediska teoretického i praktického. Ukázalo se jasně, že přístup úzce utilitární a postrádající teoretické založení dnes neobstojí. Kromě toho zde byla vznesena řada organizačních návrhů týkajících se konkrétních forem spolupráce mezi zúčastněnými skupinami.


[1] Srov. BHk, Budoucnost SP, SaS 24, 1963, 160.

[2] Srov. např. pojem semisynonymie v čl. P. Sgalla — L. Nebeského Vztah formy a funkce v jazyce (pokus o axiomatizaci), SaS 23, 1962, 174—189.

[3] Srov. o tom u nás P. Novák, Jazyk a stroje, SaS 28, 1967, 327—329.

[4] Srov. J. P. Titus, The Nebulous Future of Machine Translation, Communications of the Association for Computing Machinery 10, 1967, č. 3, s. 189—191.

[5] Srov. např. P. Novák, Některé otázky syntaktické analýzy (z hlediska SP), SaS 23, 1962, 9—20.

Slovo a slovesnost, volume 29 (1968), number 4, pp. 433-436

Previous Jan Průcha: Leonťjevův úvod do psycholingvistiky

Next Ivan Lutterer: Sturtevantův „Úvod do jazykovědy“ v desátém vydání