Časopis Slovo a slovesnost
en cz

Nové svazky sborníku Mašinnyj perevod i prikladnaja lingvistika

Jarmila Panevová

[Rozhledy]

(pdf)

Новые тетради сборника Машинный перевод и прикладная лингвистика / Nouveaux volumes du recueil Mašinnyj perevod

11. a 12. svazek sb. Mašinnyj perevod i prikladnaja lingvistika (MPPL)[1] redigovaného V. Ju. Rozencvejgem shrnuje výsledky práce za léta 1965—67 skupiny laboratoře strojového překladu na 1. moskevském institutu cizích jazyků, jednotlivců a kolektivů, které mají k této skupině blízko. Jsou to práce, které jsou v mnohém průkopnické a jsou významnými příspěvky k popisu sémantiky přirozených jazyků novými, přesnějšími metodami. Jejich společným rysem je také to, že nepouštějí ze zřetele praktické aplikace výsledků popisu; některé jsou zaměřeny k otázkám analýzy a syntézy při strojovém překladu bezprostředně, jiné volněji, nebo směřují k analýze textů pro jiné účely automatického zpracovávání jazykových údajů. V naprosté většině jsou však zároveň cenným příspěvkem k řešení teoretických nebo empirických lingvistických otázek.

Řada statí se váže k modelu typu „smysl—text“ navrženému A. K. Žolkovským a I. A. Meľčukem a rozpracovávají se v nich na materiálu ruštiny a angličtiny dílčí otázky v rámci tohoto modelu. Celkový rámec tohoto modelu, jeho výhody praktické a přínos pro teoretickou lingvistiku vykládají A. K. Žolkovskij a I. A. Meľčuk v úvodní stati.[2] Autoři pokládají za prvořadý úkol současné lingvistiky výstavbu takového fungujícího modelu jazyka, který by umožnil přejít od všech významů ke všem textům daného jazyka. Sami se snaží na těchto zásadách budovat svůj model, který zároveň slouží jako syntéza ruského textu (při automatickém překladu); formální rámec tohoto modelu však zatím chybí. Ze čtyř komponentů (sémantického, syntaktického, morfologického a fonologického) se zde věnuje pozornost prvému z nich; sémantický komponent přetváří abstraktní sémantický zápis (který se zde blíže neosvětluje) v tzv. základní (Basic) lexikálně syntaktické struktury (LSS); každá základní LSS je reprezentantem všech LSS, které jsou navzájem synonymní. Zvláštní pozornost se zde věnuje pravidlům parafrázování, která jsou analogem transformací a převádějí základní LSS na ostatní synonymní LSS. Za výhodu se pokládá, že tyto transformace se provádějí na hloubkových strukturách, teprve v další části sémantického komponentu se LSS převádějí na povrchové syntaktické struktury. Značný význam v tomto modelu má slovník; způsob jeho zpracování a zachycení lexikálních významů je také uváděn jako hlavní lingvistický přínos tohoto modelu,[3] zavádí se zde podobně jako v syntaxi pojem hloubkovosti, tj. hloubkového lexika, tzn. že významové jednotky se dělí na samostatná slova a slova, která jsou „lexikálním korelátem“ jiných slov, vystupují jako hodnoty lexikálních funkcí (např. lexikální funkcí je konverze, hodnota této funkce pro slovo vyigrat’ je proigrat’, tedy Conv (vyigrat’) = proigrat’, hodnotou lexikální funkce Liqu (likvidace situace) u slova spat’ je razbudit’, u slova bol’ snimat’ ap.). V sémantickém zápisu věty potom vystupují pouze samostatná slova, ostatní jsou zachycena jako jejich lexikální [70]funkce. U každého slova v slovníku jsou vyplněny údaje o hodnotách jeho lexikálních funkcí (u každého slova nevystupují ovšem všechny), a to synonymních ekvivalentů i tzv. parametrů. Podle zásady, že to, co je povrchově různé, ale významově stejné, má být v hloubkovém zápisu shodně zachyceno, shrnují se pak do oblasti sémantických parametrů jevy z hlediska teoretického popisu jazyka velmi různé; jsou zde prostředky charakteristické pro slovotvorbu (tvoření pojmenování), dále pro významy předložek (morfologické významosloví), parametry zahrnují též oblast frazeologie. Např. vztah mezi boľ a spojením snimať boľ je zachycen stejně jako vztah mezi spat’ a razbudit’ (jde o vyjádření parametru Liqu slova bol’ a slova spat’) nebo uvnitř parametru Fin mohou být prostředky náležející do frazeologie Fin (veter) = stich, s níž se zde zachází jako se systémovým tvořením pojmenování, stejně jako prostředky, které jsou na pomezí lexika (tvoření pojmenování) a gramatiky Fin (pisat’) = dopisat’. Tato integrace sémantiky gramatické a lexikální má z hlediska popisu sémantiky věty své opodstatnění, ale ve svých důsledcích znamená, že např. způsob vyjádření „vydávání typického zvuku“ pro různé konatele (svin’ja - chrjukajet, sneg - skripit) má v tomto popisu stejný statut jako vyjádření Perf (dovršení děje) — učit’sja - naučit’sja, nebo jako produktivní tvoření pojmenování S1 (jméno subjektu) -cenit’ - cenitel’ nebo že spojení jako zavodit’ časy, činiť karandaš se popisují, jako by šlo o jediné (složené) pojmenování (v Mathesiově smyslu) určité situace. Není také zcela zřejmé, na čem závisí výběr vyjádření pro sémantické parametry (mnohdy se zdá, že je více možností, které nejsou synonymní). Při popisu významu slov v tomoto systému také není patrně jednoduché rozhodnout, kdy zvolit popis skládáním parametrů (jako Bon a AntiBon) a kdy pouhé rozčlenění jednoho parametru pomocí indexů (srov. dále článek I. I. Ubina — např. Magn s kladným hodnocením a Magn se záporným hodnocením).

Konkrétní ukázky slovníkových hesel nacházíme v článku K. O. Erastova, který uvádí slovníkový zápis se všemi údaji potřebnými pro sémantickou syntézu zpracovávaného typu pro 30 rus. slov. Detailním rozpracováním jedné z lexikálních funkcí, a sice sémantického parametru Magn (význam velké míry) se zabývá I. I. Ubin. Ukazuje, že tento zatím jediný parametr je třeba rozdělit na řadu dílčích, protože ve významu velké míry existuje řada významových odstínů (např. velká míra se zřetelem k subjektu, k trvání ap., takto se charakterizuje v rámci parametru Magn např. rozdíl mezi ljubit’ bol’še žizni a ljubit’ večno, popř. do groba),[4] dále odstínů stylistických a emocionálních (kladné nebo záporné hodnocení ap.). V článku se uvádějí způsoby vyjádření Magn (i jeho podvýznamů) u 290 ruských slov. Na anglickém materiálu (textu o 30 000 slovech) zkoumala vyjadřování některých sémantických parametrů Z. M. Šaljapinová. Na základě analyzovaného materiálu ukázala potřebu zavést některé nové lexikální funkce. Experimentální prověřování jedné části sémantické syntézy podle Žolkovského a Meľčuka (a to algoritmus pro pravidla parafrázování zkoušený na počítači Ural-4) popisuje N. G. Arsenťjevová.

Na pojmech modelu „smysl—text“ staví své zkoumání otázek aktiva a pasíva v rus. textu E. I. Korolev; jeden z jeho článků je věnován pravidlům pro výběr aktivní nebo pasívní konstrukce při syntéze rus. textu, druhý pak je věnován pravidlům pro řešení homonymie u zvratného tvaru slovesa při analýze textu (podávají se pravidla, opírající se jednak o kontext, jednak o údaje ze sémantického slovníku, rozhodující, kdy sloveso se zvratnou částicí je reflexívní pasívum a kdy jde o aktivní tvar zvratného slovesa).

Otázkám syntézy při strojovém překladu je věnován též příspěvek Je. D. Feľd[71]mana; jde v něm o syntézu nominální fráze na základě sémantického zápisu a vyznačení syntaktické závislosti s pomocí údajů v slovníku, kde mají slova velmi podrobně vyplněny své „sémantické valence“.

Stati autorů G. V. Dorofejeva a Ju. S. Martem’janova jsou věnovány formalizaci některých významů slov přirozeného jazyka (článek o formalizaci elementárních významů) prostředky matematické logiky. Další dvě stati těchto autorů jsou věnovány analýze textu, tj. obsahových vztahů mezi různými větami téhož textu. Stanovují se pravidla taková, která — zatím na ukázkovém textu jedné zvířecí bajky — umožňují logické odvození výroků na základě jejich vyplývání z jiných výroků, tj. vyvozují se tu jistou procedurou výroky, které explicitně v textu nejsou obsaženy. K této problematice se váže též článek N. N. Leonťjevové o významové neúplnosti textu. Ukazuje se, že úplný sémantický zápis (nutný např. pro účely automatického zpracování informací) musí odhalit některé významové neúplnosti, které každý text přirozeného jazyka obsahuje. K jejich doplnění bude třeba mj. i pravidel odvozování (o jakých se mluví ve výše uvedené stati Dorofejeva a Martem’janova); autorka velmi instruktivně ukazuje a také definuje typy této neúplnosti, které se formálně jeví jako některý z typů nesprávného sémantického zápisu; každý z těchto typů nesprávnosti (nesouvislost textu, významová redukce textu ap.) se definuje v termínech sémantického zápisu, který autorka zvolila.

V čl. V. Ju. Rozencvejga se provádí sémantická analýza francouzských sloves aller a venir a ukazuje se, že ze sémantické charakteristiky významu sloves vyplývají jisté závěry o obsahu (popisované situaci), např. o pravděpodobnosti, kde se nachází mluvčí ve vztahu ke směru pohybu a jeho počátečnímu a cílovému bodu při užití toho kterého slovesa. Dále se tu rozebírá význam některých francouzských částic, které tvoří dvojice, např. non-si, aussi-non plus.

Sémantickým rozborem negace v ruštině se zabývá Je. V. Padučevová. Zápor zachycuje v hloubkové struktuře věty zvláštním operátorem negace. Zkoumá, ke kterému slovu věty je třeba tento operátor připojit a jak se jednotlivé typy negace realizují v povrchové struktuře. Popisuje, k jakým formálním změnám ve struktuře věty vede povrchová realizace negace.

Otázkám slovosledu a aktuálního členění jsou věnovány dva články V. A. Matvejenkové. V jednom z nich vytváří autorka pravidla automatického stanovení „logických důrazů“ při analýze ruské věty, tj. buduje takovou „gramatiku důrazů“, která umožňuje stanovit v izolované větě rozložení základu a jádra výpovědi a stupně (síly) důrazu, který na nich je. K tomu účelu rozdělila autorka slovesa a příslovečná určení do řady kategorií, neboť vychází z názoru, že slova sama podle své sémantiky mají jisté předpoklady patřit k základu nebo k jádru výpovědi. Tento předpoklad může snad do jisté míry platit pro větu kontextově nezačleněnou. Její pravidla pak mohou — zdá se — odhalit odchylky od základního slovosledu,[5] které však z hlediska kontextového začlenění mohou být právě nepříznakové. Druhý článek této autorky se zabývá umístěním příslovečného určení místa při syntéze ruské věty.

A. R. Aruťjunov se zabývá popisem lexikální sémantiky něm. sloves, vychází z jejich syntaxe a snaží se dojít k sémantické klasifikaci.[6] V. V. Sannikov se pro účely automatické analýzy ruštiny zabývá analýzou interpunkčního znaku (tečky) a podává řešení homonymie tohoto znaku (hranice věty a tečka za zkratkou), para[72]lelně s tím navrhuje provádět morfologickou analýzu zkratek. — Y. Gentilhomme (Francie) podává přehled prací lexikografického centra v Besançonu.

Sborníky též obsahují bibliografii prací ze strojového překladu a aplikované lingvistiky (do konce r. 1968).

Už z pouhého výčtu problémů je zřejmé, že oba sborníky jsou cenným příspěvkem k aktuálním problémům současné lingvistiky. Přínosem je zejména soustředění na otázky sémantické, příznačná je i pozornost věnovaná rozboru celých textů a jejich obsahové analýze, rovněž otázky aktuálního členění a negace, které jsou zde zastoupeny, patří k nejdiskutovanějším v poslední době (v lingvistice evropské i americké) a konfrontace výsledků tu může být víc než užitečná. Zaslouží si proto pozornosti i těch, kteří se formálním popisem jazyka přímo nezabývají.


[1] MPPL, vyp. 11, Moskva 1969, 238 s., MPPL, vyp. 12, Moskva 1969, 206 s.

[2] Srov. též jiné tematicky blízké stati těchto autorů, např. O semantičeskom sinteze, Problemy kibernetiky 19, Moskva 1967, 177—238, titíž, O sisteme semantičeskogo sinteza I, Naučno-techničeskaja informacija (NTI), 1966, N° 11, 48—55, II, NTI, serija 2, 1967, N° 2, 17—27, Ju. D. Apresjan - A. K. Žolkovskij - I. A. Meľčuk, O sisteme semantičeskogo sinteza III, NTI, serija 2, 1968, N° 11, 8—21; titíž, Semantics and Lexicography: Towards a New Type of Unilingual Dictionary, Studies in Syntax and Semantics (ed. by F. Kiefer), Dordrecht-Holland 1969, 1—33.

[3] S uváděnými přednostmi je třeba souhlasit, jistě tu lexikologie může získat mnoho podnětů, neboť jde o vybudování systému v lexiku. V rámci celkového popisu jazyka tu však vidíme jisté problémy, srov. též naši recenzi v Prague Bulletin of Mathematical Linguistics 16 (v tisku).

[4] Připomínáme na tomto příkladu, že boľše žizni a do groba nevystupují jako samostatné jednotky sémantického zápisu, ale jsou zachyceny shodně jako parametr Magn (pouze s různým indexem).

[5] K této problematice srov. u nás např. E. Benešová, Některé otázky aktuálního členění a slovosledu v češtině, AUC, SlavPrag XIII (v tisku).

[6] Srov. též práce Ju. D. Apresjana, např. Eksperimental’noje issledovanije semantiki russkogo glagola, Moskva 1967.

Slovo a slovesnost, ročník 32 (1971), číslo 1, s. 69-72

Předchozí Marie Těšitelová: O frekvenčním slovníku slovenštiny

Následující Jitka Štindlová: Lexikální indexy a jejich strojové zpracování