Časopis Slovo a slovesnost
en cz

Strojový překlad v SSSR (Zkušenosti z konference o matematické lingvistice v Leningradě v r. 1959)

Bohumil Palek

[Discussion]

(pdf)

Машинный перевод в СССР / Traduction automatisée dans l’URSS

Aplikovaná lingvistika je dnes již velmi důležitou jazykovědnou disciplínou a její význam rok od roku roste. Jedno z vedoucích míst v ní zaujímá strojový překlad. Nejen proto, že má velký národohospodářský význam, ale i proto, že má velký vliv na samo lingvistické zkoumání. Vyžaduje od lingvistů důkladnou klasifikaci všech jazykových jevů a umožňuje dojít k závěrům, ke kterým by lingvistika jinak nedošla. Jeho důležitost byla podtržena také tím, že na 8. mezinárodním lingvistickém sjezdu v Oslo r. 1957 a na 4. mezinárodním slavistickém sjezdu v Moskvě[1] mu bylo věnováno několik referátů. Kromě toho začalo vycházet několik speciálních časopisů [Mechanical Translation (MT), Bjulleten’ ob’jedinenija po mašinnomu perevodu, připravuje se vydávání časopisu International Journal of Machine Translation and Mathematical Linguistics] a vyšlo mnoho sborníků.[2] Velký význam pro rozvoj strojového překladu mají konference, které jsou téměř každoročně pořádány v USA a poslední dobou také v SSSR.

Oba poslední sjezdy KSSS kladly velký důraz na rozvoj automatizace a nové techniky jakožto podstatného a důležitého činitele národního hospodářství. To pochopitelně nemohlo zůstat bez vlivu na průběh práce na strojovém překladu. Sovětští odborníci získali plnou podporu a uznání ve své práci.

Práce na strojovém překladu v SSSR byla zahájena počátkem r. 1955 v Institutu přesné mechaniky a výpočtové techniky (ITM i VT) a v Steklovově matematickém institutu AV SSSR. Překlad z angličtiny do ruštiny byl připraven během r. 1955 a koncem téhož roku byly provedeny prvé překlady na stroji značky BESM. Teprve později se zapojil do práce také Jazykovědný institut a I. moskevský pedagogický institut pro cizí jazyky (I MGPIIJ). Dnes v Sovětském svazu pracuje několik středisek. Jedním z největších je středisko ITM i VT, kde pracuje spolu s techniky větší skupina lingvistů na strojovém překladu z angličtiny, čínštiny, japonštiny a němčiny do ruštiny.

Tato skupina je zaměřena především na praktickou potřebu strojového překladu a na důkladný rozbor jazyků. Další skupina je soustředěna kolem Steklovova matematického institutu AV SSSR. Pracuje se na teoretických otázkách, zkoumají se nové možnosti popisu jazyka a výrazem těchto teoretických zkoumání je praktická činnost. Pod vedením A. A. Ljapunova byly rozpracovány algoritmy[3] francouzštiny, angličtiny a maďarštiny (viz zde podrobněji [278]v článku Meľčukově, s. 286n.). S touto skupinou spolupracuje skupina Jazykovědného institutu, vedená A. A. Reformatským. S nimi jsou ve spojení ještě pracovníci Laboratoře elektromodelování Všesvazového institutu vědecké a technické informace při radě ministrů SSSR. Při rozpracovávání algoritmů se směřuje k tomu, aby programování[4] bylo standardizováno a automatizováno. Kromě toho se navrhuje, aby bylo automatizováno i sestavení algoritmů tak, že by počítač dostal dostatečně dlouhý text a obecný program, podle něhož by si algoritmus daného jazyka sestavil sám. V leningradské laboratoři strojového překladu, vedené N. D. Andrejevem, překládá se díky vyspělé leningradské orientalistice především z orientálních jazyků — z arabštiny, turečtiny, indonéštiny, hindštiny, japonštiny, barmštiny, ale také z jazyků evropských — z němčiny, španělštiny atd. Intenzívně se pracuje na problematice spojené s převodním jazykem, modely jazyka, informačními jazyky. Vedle těchto velkých středisek, která již dnes vydávají sborníky a jsou v rozpracovávání strojového překladu velmi daleko, vznikly později skupiny, jejichž práce je teprve v začátcích a rozvíjí se pod vedením výše uvedených zkušenějších skupin. Tak začala práce na universitě v Gorkém, v Jerevanu a v Tbilisi. I v jiných střediscích je o strojový překlad zájem, např. v Kyjevě o slovanské jazyky, speciálně o češtinu.

Rozvoj aplikované lingvistiky je patrný také na tom, jakou měrou byla zastoupena na konferencích kybernetických i týkajících se speciálně strojového překladu. Prvé zmínky o strojovém překladu byly proneseny na zasedání AV SSSR, věnovaném automatizaci výroby, které se konalo od 15. do 20. října 1956. Referát, který zde přednesl D. J. Panov,[5] se týkal obecných otázek strojového překladu. Intenzívní rozvoj po roce 1956 způsobil, že na kybernetické konferenci zaujímala aplikovaná lingvistika jedno z vedoucích míst.[6] Zasedání, které se konalo od 28. do 31. května 1957 v Moskvě, zúčastnilo se přes 500 odborníků. Pořádala ho Laboratoř elektromodelování AV SSSR. Matematická lingvistika byla na pořadu plenárního zasedání (referátem V. V. Ivanova o vytvoření jazyka vhodného pro stroj, o jazycích věd a o nutnosti jejich normalizace a referátem V. N. Uspenského o logických a matematických otázkách spojených se strojovým překladem). Sekce teoretická byla převážně věnována matematické lingvistice (z 22 přednesených referátů bylo 21 lingvistických). Vystřídala se nejrůznější témata matematické lingvistiky; od obecných otázek strojového překladu (A. A. Ljapunov) přes informační jazyky (V. K. Finn), metody zkoumání jazyka a vytvoření gramatického schématu (O. S. Kulaginová) až ke konkrétním otázkám „metajazyka“ chemie (G. M. Vleduc, V. K. Finn), geometrie (N. M. Erolajevová, J. A. Šichanovič) a sestavení algoritmů pro jednotlivé jazyky (T. N. Mološná, L. A. Bezzabornová atd.).

Od tohoto zasedání bylo patrno, že s matematickou lingvistikou je třeba vážně počítat. Velký vliv na její rozvoj v tomto období měly kybernetické semináře, které se konají ha moskevské universitě od r. 1955. Podobné semináře začaly na leningradské universitě o rok později. Významné postavení v matematické lingvistice má statistika. Od 1. do 4. října 1957 se konalo v Leningradě zasedání věnované statistice jazyka.[7] Byli zde zástupci nejrůznějších institucí akademických a vojenských. Na programu byly dvě otázky: 1. použití statistických metod při rozboru jazyka mluveného i psaného a rozpracování otázek spojených s přenosem informace, 2. vztah strukturálních a statistických metod v jazykovědě. Velký vliv na koordinaci práce matematické lingvistiky v SSSR mělo vytvoření Výboru aplikované lingvistiky AV [279]SSSR v lednu 1958.[8] Vedle vynikajících lingvistů, L. R. Zindera, A. A. Reformatského, V. J. Rozencvejga, V. V. Ivanova, N. D. Andrejeva a dalších, jsou členy výboru také vojenští odborníci V. I. Medvedev aj., matematikové a technici R. L. Dobrušin, J. S. Bykov, L. A. Varšavskij, psychologové a neurologové A. R. Lurija, I. I. Žinkin aj. Předsedou je leningradský fonetik L. R. Zinder. Činnost výboru je rozdělena do sedmi sekcí aplikované lingvistiky: lingvistická statistika, uplatnění matematických metod v jazykovědě, rozpracování algoritmů strojového překladu, experimentální fonetika, fyziologické a psychologické metody v aplikované lingvistice, transkripce a transliterace, umělé jazyky a kódy. Otázkám srozumitelnosti řeči bylo věnováno symposium, které se konalo od 26. do 30. května 1958 v Moskvě[9] (zúčastnili se ho také čeští odborníci J. Vachek a J. Slavík; jejich vystoupení se setkalo s živým ohlasem u sovětských odborníků).

Rozvoj matematické lingvistiky je nejpatrnější na strojovém překladu. O jeho rozvoji je možno si udělat představu z konferencí, které byly pořádány v Moskvě r. 1958 a v Leningradě r. 1959.

Prvou konferenci o strojovém překladu pořádal r. 1958 I MGPIIJ; zúčastnilo se jí 340 odborníků z nejrůznějších vědeckých pracovišť a bylo předneseno 70 referátů.[10] Ve dnech 15. a 16. května 1958 se konalo plenární zasedání, kde byly předneseny nejdůležitější referáty. Od 17. do 20. května konference pokračovala ve dvou sekcích, v sekci teoretické a v sekci algoritmů strojového překladu. Na plenárním zasedání byly prodiskutovány obecné otázky matematické lingvistiky. Bylo zdůrazněno, že matematická lingvistika má význam pro dosavadní lingvistiku zejména z toho důvodu, že vyžaduje upřesnění lingvistických pojmů. Na druhé straně však lingvisté musí umět aplikovat matematické metody na jazyk. Plenární zasedání rovněž vyslechlo referáty významných představitelů jednotlivých středisek pracujících na strojovém překladu. V teoretické sekci byly předneseny referáty různého charakteru. Probíraly se zde otázky fonologické, sémantické, otázky poměru strukturalismu ke strojovému překladu atd. V rezoluci konference byl zdůrazněn význam strojového překladu pro národní hospodářství a technický pokrok, který je jedním z nejdůležitějších bodů vytyčených na XX. sjezdu KSSS. Dále bylo upozorněno, že matematická lingvistika má velký význam při řešení otázek přenosu sdělení, sestavování gramatik atd.

Konference rozhodla, aby v r. 1960 byla uspořádána Všesvazová konference o matematické lingvistice. Toto rozhodnutí bylo uskutečněno o rok dříve. Od 15. do 21. dubna 1959 konala se tato konference v Leningradě a byla neobyčejně úspěšná. Zúčastnila se jí také čtyřčlenná skupina pracovníků na strojovém překladu z Československa (P. Sgall a P. Novák vystoupili na konferenci s referátem o pražské typologii jazyků a o jejím vztahu k modelům jazyka). Kromě Československa se konference zúčastnila Čína, Rumunsko a Polsko. Celkem bylo přítomno 486 pracovníků z různých oblastí Sovětského svazu. Vedle vynikajících vědců, jako akad. S. L. Soboleva, akad. B. A. Larina, člena kor. A. A. Markova, člena kor. L. D. Kantoroviče, profesorů Zindera, Reformatského, Rozencvejga, Olderoge atd., byli přítomni převážně pracovníci mladší. Konference se bohužel nemohl zúčastnit vynikající sovětský odborník v oblasti počítačů a kybernetických zařízení prof. A. A. Ljapunov.

Konference byla živá a přinesla mnoho nových námětů. Soustředila se hlavně na tato témata: matematické modely jazyka, aplikace statistických metod při zkoumání jazyka, převodní a informační jazyky, sestavení programů a technických zařízení, které by byly schopny zpracovat řeč. Referáty, které byly na konferenci předneseny, přesáhly svým obsahem vytčená témata. Charakteristickým rysem celé konference byla snaha dosáhnout toho, aby se lingvistika plně podílela na sestavování automaticky čtecích zařízení, na automatickém referování o vědecko[280]technické literatuře, na vytváření informačních jazyků, na řízení strojů promluvou a zejména také na praktickém využití strojového překladu. To vyžaduje, aby lingvistika pracovala exaktním způsobem. Konference hodnotila také dosavadní výsledky strukturálního zkoumání jazyka a v rezoluci žádá, aby strukturální pohled na jazyk byl spojen s užíváním matematických metod. Podtrhla význam výchovy kádrů pro strojový překlad a rozhodla doporučit ministerstvu vysokých škol, aby na všech vysokých školách, kde je přednášena lingvistika, přednášela se také matematika s lingvistickým zaměřením. Dále požádala, aby byla zřízena pracoviště strojového překladu v Gorkém, Tbilisi a Jerevanu, aby byla zavedena matematická lingvistika a strojový překlad jakožto specializace pro aspiranty. Konference jasně ukázala, že matematická lingvistika je v Sovětském svazu vyspělá; strojovému překladu a příbuzným otázkám se tu s velkým zaujetím věnuje mnoho mladých pracovníků, jejichž úsilí jistě povede k významným výsledkům.

První práce o strojovém překladu publikované v SSSR byly rázu obecného a informativního. Byly nutným předpokladem pro další systematickou práci na straně jedné a pro propagaci strojového překladu na straně druhé. Velký význam měly články publikované v čas. „Voprosy jazykoznanija“ a v prvních číslech BMB.[11] Vedle populárních studií a článků zabývajících se obecnou problematikou strojového překladu je nyní publikováno množství článků, které se specializují na určité úseky strojového překladu.

Při rozpracovávání teorie strojového překladu se ukázalo, že binární překlad z jednoho jazyka do druhého (např. z češtiny do angličtiny) je možno uskutečnit vždy pomocí algoritmů zvláštních (to znamená, že jiný by byl algoritmus např. pro překlad z angličtiny do češtiny). Uvážíme-li, jak mnoho je jazyků, z nichž by se mělo překládat, ukazuje se neekonomičnost takových binárních překladů. To vede k snaze vytvořit převodní jazyk (rus. jazyk-posrednik), který by umožňoval překládat z libovolného jazyka do jazyka jiného.

V Sovětském svazu tyto otázky rozpracovávají N. D. Andrejev a I. A. Meľčuk. Andrejev publikoval o tom článek,[12] kde se zabývá sémantickou problematikou převodního jazyka a zejména otázkou polysémie, která má při překladu z většího počtu jazyků důležitou úlohu. N. D. Andrejev vychází z toho, že různé jazyky světa mají různou sémantiku; na základě této různosti navrhuje vytvořit sémantické skupiny, které by podléhaly jistým pravidlům. Tato pra[281]vidla by umožňovala změnu sémantiky jednoho jazyka v sémantiku jazyka druhého. Tyto sémantické skupiny by byly sestaveny pro velké množství jazyků. Kromě sémantických skupin by slovník obsahoval také údaje o frekvenci. Ve frekvenčním systému by byla oddělena slova, která mají speciální užití, slova, která se vyskytují v odborných textech, další skupinu by tvořila slova, kterých se užívá obecně. Stroj by při překladu obdržel informaci o tom, jakého druhu text překládá, a podle toho by volil nejprve slova odborná a potom teprve obecně užívaná. Tímto postupným překladem by se vyřešila, podle N. D. Andrejeva, do značné míry polysémie slov. Dále Andrejev navrhuje, aby bylo využito sémantiky standardních a frekventovaných sufixů slov. Srovnáním různých sufixů v různých jazycích bude možno určit příslušné sémantické kategorie, do nichž jednotlivé sufixy patří. O převodním jazyce referoval N. D. Andrejev také na konferenci v Leningradě.[13] Vyslovil zde jasně své názory na převodní jazyk jako na jazyk konkrétní, který má svou morfologii, slovní zásobu a syntax. Symbolicky zapsaný převodní jazyk, podle Andrejeva, bude se moci uplatnit i v úloze jazyka informačního.

Od koncepce Andrejevovy se liší pojetí I. A. Meľčuka, který se otázkou převodního jazyka zabýval na loňské moskevské konferenci o strojovém překladě a také na letošní konferenci v Leningradě.[14] Meľčukův přístup k věci je charakteristický pro skupinu, která je soustředěna kolem Jazykovědného institutu AV SSSR. Meľčuk se domnívá, že převodní jazyk je systém vzájemných vztahů mezi jednotlivými jazyky. Tyto vztahy se uplatňují ve třech plánech: lexikálním, morfologickém a syntaktickém. V převodním jazyce podle Meľčuka najde uplatnění pouze slovní zásoba (obohacená o jednotky slovotvorné) a syntax. Znamená to, že převodní jazyk bude vyjadřovat rozdíly, které jsou mezi jednotlivými jazyky. Morfologické kategorie, pokud jich bude třeba (čas, číslo), budou slovy převodního jazyka (srov. zde čl. I. A. Meľčuka, s. 288).

Když se začalo uvažovat o převodním jazyce, vznikla otázka, zda by nebylo možno užít jako převodního jazyka některého jazyka přirozeného nebo umělého. Touto otázkou se zabýval na I. konferenci o strojovém překladu E. A. Bokarev.[15] Staví otázku střízlivě na rozdíl od některých horlivých stoupenců umělých jazyků. Domnívá se, že by bylo možno zkoumat převodní jazyk paralelně s jazyky umělými a zkušenosti, získané při studiu obou systémů, přenášet z jednoho jazyka do druhého. Skupina, která je soustředěna kolem ITM i VT, chce pracovat s ruštinou, protože je jazykem, do kterého se nejvíce překládá. — Dnes je ještě obtížné říci, který z uvedených přístupů je nejsprávnější, ale každý z nich přináší nové poznatky o převodním jazyce.

Intenzívně se také pracuje na problematice „jazyků“ různých vědních odvětví, mezi nimi i lingvistiky, která je těsně spojena s otázkami převodního jazyka. Vzhledem k tomu, že strojový překlad se bude převážně uplatňovat při překladu odborných textů, bylo by vhodné, aby jazyky jednotlivých vědních odvětví byly standardizovány, aby se upouštělo od možné dvojí interpretace atd. To zároveň znamená přínos pro každou vědní disciplínu, protože bude nutno jednoznačně a jasně formulovat názory na její problematiku.[16] S převodním jazykem je také spojena otázka informačního jazyka, tj. jazyka, který umožňuje uchování informace v počítači. V. P. Berkov se na konferenci v Leningradě zabýval rozdílem mezi informačním a převodním jazykem;[17] rozdíl spatřuje v tom, že převodní jazyk musí být co nejvýhodněji přizpůsoben překladu z mnoha jazyků a musí být přitom minimálně obsažný. Pro informační [282]jazyk je charakteristické, že obsahuje minimální množství informace (ve srovnání s jazyky přirozenými, v jejichž mluvnické stavbě je vždy velké procento tzv. nadbytečnosti — redundance). V této souvislosti se pracuje i na dalších problémech spojených s dokonalým využitím samočinných počítačů, zejm. na automatickém referování,[18] (jde o to, že by stroj byl schopen sám referovat o obsahu té které vědecké stati, že by dovedl vytvořit krátký obsah, který by zájemci postačil), na příjmu psaného a mluveného textu[19] aj.

Velké množství otázek je spojeno s problematikou slovníku, zejména jeho systému v strojovém překladu. Touto problematikou se zevrubně a v celé šíři zabývají především I. L. Bratčikov, S. J. Fitialov a G. S. Cejtin.[20] Ve svém článku zkoumají různé způsoby sestavování slovníku a hledají pro to nejvhodnější metodu. Do slovníku pro strojový překlad se musí uložit kmeny všech slov. Mnohá slova však mají několik variant kmenů, ty pak musí být uloženy několikrát (měkkostní korelace v paradigmatu, vsuvné vokály atd.). Kromě toho musí být uloženy v slovníku i koncovky. Hlavní potíže nastávají při srovnávání významových odstínů jednotlivých slov; u některých je třeba uvést celé fráze nebo idiomy apod. Při prostém uložení by takový slovník zabral příliš mnoho místa v paměti stroje. Proto se hledají metody, které by zpracovaly slovník ekonomicky. Ukázalo se, že je výhodná tzv. komprimace, tj. že na jedné jednotce slovníku stroje je v určitém kódu obsažena informace o více jednotkách. Každou komprimovanou jednotku provází index výskytu, který přispívá k jednoduššímu hledání v slovníku. Přístup k této problematice je demonstrován na programu určeném pro leningradský elektronkový počítač „Strela“. Problematikou struktury slovníku se také na moskevské konferenci v r. 1958 zabýval G. M. Strelkovskij.[21] Kromě obdobných problémů, jakými se zabývají autoři výše uvedeného článku, uvažuje o možnostech doplnění slovníku o nově zjištěná slova. Velmi závažnou otázkou týkající se slovníku strojového překladu je otázka homonymie, která je aktuální zejména v angličtině, a to především vzhledem ke konverzi slovních druhů.[22] Řešení je možné jenom cestou formalizace příslušných vztahů. Některé případy konverze jsou zatím formální cestou neřešitelné, zvláště následuje-li jich po sobě několik. Ještě složitější je homonymie mezi slovy téhož druhu. Tu bude zapotřebí zkoumat různé vlivy kontextu na užití příslušného ekvivalentu. Velmi zajímavý článek o slovníku pro strojový překlad publikovala S. S. Belokrinická, která ukazuje, jak by měl vypadat německý algoritmus (její přístup je omezen možnostmi počítače BESM).[23] Slovník rozděluje na slova mnohoznačná a jednoznačná. Při určení významu mnohoznačného slova postupuje takto: 1. provádí sémantickou a strukturní analýzu okolního textu, 2. určuje význam na základě formálního příznaku.

Nejdůležitější je ve strojovém překladu syntax. Syntaktické zkoumání není důležité jen z hlediska pořádku slov, ale má vliv i na řešení homonymie slovních druhů, na slovník, morfologii atd. Syntaktické vztahy jsou nejsložitější a tím také těžko popsatelné. V jednom ze svých prvních článků se T. N. Mološná zabývá syntaktickými otázkami v angličtině. Otázku syntaktického rozboru spojuje s problematikou slovních druhů a po příkladu Ch. Friese [283]se snaží nalézt formálně determinované slovní druhy.[24] Na základě tohoto rozdělení hledá syntaktické vztahy mezi jednotlivými útvary. Její metoda je velmi obdobná známému Bar-Hillelovu popisu a analýze jazyka.[25] Pomocí těchto vztahů je možno podle autorky určit jednotlivé typy jazyka. Podstatným přínosem ke zkoumání anglické syntaxe je článek B. M. Lejkinové.[26] Lejkinová přistupuje k analýze anglické věty již z hlediska nezávislého rozboru angličtiny (tj. počítá s překladem prostřednictvím převodního jazyka, nikoli s binárním překladem z jednoho jazyka do druhého).[27] Autorka se omezila na jednoduchou anglickou větu. Hlavní cíl svého zkoumání spatřuje v stanovení pracovní hypotézy, pomocí níž by bylo možno nalézt jednotlivé větné členy. Možností formálního zpracování větné interpunkce se zabývá T. M. Nikolajevová.[28] Tento problém je velmi důležitý zejména pro koordinované větné členy a věty. Podobná otázka byla také předmětem referátu D. Džanaridze, I. A. Meľčuka a T. N. Mološné na konferenci v Leningradě r. 1959.[29] Šlo o souřadicí spojky, o jejich vyjádření v převodním jazyce a o to, jak bude postupovat překlad od jazyka vstupního k jazyku převodnímu. Obecné otázky syntaxe ve spojitosti se strojovým překladem byly řešeny již na konferenci v Moskvě r. 1958. L. I. Ilija se zabýval vzájemným vztahem dvou hlavních názorů na syntaktické bádání: „bezprostředních složek“ [immediate constituents] (Pike, Bloomfield) a větných členů (Bazell, Kuryłowicz, Diderichsen) a domnívá se, že obě metody se mohou navzájem doplňovat.[30]

Rozpracování algoritmů jednotlivých jazyků je centrem veškeré práce. Zpočátku se s tím zřetelem pracovalo především na problematice angličtiny. Např. otázkou homonymie se zabývala T. N. Mološná v článku, o kterém jsme se již dříve zmínili (pozn. č. 22); táž autorka také pracovala na otázkách anglické syntaxe. I. K. Beľská, která pracuje v téže skupině jako T. N. Mološná, věnovala jeden ze svých článků otázkám anglického slovníku.[31] Je třeba říci, že anglickému algoritmu se věnuje v SSSR již dlouhou dobu velká pozornost a dnes je důkladně zpracován. Přispělo k tomu také to, že byl spolu s ruským algoritmem zpracován jako první (srov. pokus v New Yorku r. 1954). Brzy se začalo také pracovat na algoritmu francouzštiny. K rozboru francouzštiny podstatně přispěl I. A. Meľčuk (viz zde [284]v článku Meľčuka samého, s. 286), který své vývody formuluje obecně.[32] Statistické zkoumání vztahu rodu substantiv a koncovek a srovnání těchto výsledků s poměry v jiných jazycích nám ukazuje, jak jsou si jazyky blízké nebo vzdálené typologicky. Intenzívně se pracuje na rozpracovávání algoritmu němčiny. Vedle Belokrinické (srov. výše v pozn. č. 23) se V. V. Paršin zabývá jedním z typických jevů němčiny, kompozity a jejich překladem do ruštiny.[33] Postupuje tak, že slova rozdělí na jednotlivé komponenty a podle ruského ekvivalentu hledá různé možnosti překladu. Otázka kompozit by měla být také řešena z hlediska nezávislé analýzy němčiny, nikoli jen binárním zkoumáním.

Pro práci na strojovém překladu v SSSR je na rozdíl od situace v USA charakteristické to, že se zde pracuje na velkém množství algoritmů z nejrůznějších jazyků. Tak I. A. Meľčuk v podstatě rozpracoval maďarský algoritmus (viz zde na s. 287);[34] pracuje se rovněž na algoritmu čínštiny a japonštiny.[35] V Leningradě, kde za vedení N. D. Andrejeva pracuje Laboratoř pro strojový překlad, sestavují se algoritmy jak jazyků evropských (také norštiny,[36] jinak srov. výše), tak jazyků orientálních — hindštiny, vietnamštiny, barmštiny a arabštiny.[37] Na podzim r. 1959 se přistoupí i k rozpracovávání nezávislého algoritmu českých elektrotechnických textů.

Strojový překlad má velký vliv i na samu lingvistickou teorii, zejména na metodu jazykovědy. V poslední době se objevilo několik prací, které se snaží aplikovat na lingvistické zkoumání teorii množin (srov. J. H. Greenberg).[38] V Sovětském svazu se touto aplikací zabývá O. S. Kulaginová a dosáhla na tomto poli již výrazných úspěchů.[39] Její koncepce, velmi originální, byla v podstatě přijata na konferenci v Leningradě všemi středisky SSSR. Intenzívně [285]se rovněž pracuje v lingvistické statistice, kde se užívá nejmodernějších metod matematické statistiky.[40] Aplikuje se teorie pravděpodobnosti, teorie informace a komunikace.[41]

Práce na aplikované lingvistice v SSSR vychází ze širokého základu teoretického; uvažuje se o vztazích k tradiční lingvistice a z hlediska těchto nových aspektů jsou hodnoceny dosavadní výsledky lingvistiky.[42] Pozoruhodné je, že se mnozí autoři snaží aplikovat matematické metody také ve srovnávacím jazykozpytu.[43] Velkou pomocí sovětským jazykovědcům bylo to, že nalezli pochopení u logiků, matematiků a inženýrů.[44] Jazykovědci mohou pracovat na těchto nových problémech jen ve spojení s nimi. Užitek, který z této společné práce je, má pak význam nejen pro lingvistiku, ale také pro matematiku, logiku atd., nemluvě o budoucí velké důležitosti praktického uplatnění strojového překladu i jiných příbuzných disciplín aplikované lingvistiky.


[1] B. Havránek a K. Horálek, Osmý mezinárodní kongres lingvistů v Oslo, SaS 19, 1958, 47n.; Petr Sgall, Otázky strojového překladu (Z IV. mezinárodního sjezdu slavistů v Moskvě), SaS 20, 1959, s. 208—210.

[2] „Bjulleten’ ob’jedinenija po mašinnomu perevodu“ 1—7 (BMP 1—7); „Mašinnyj perevod“ (Sbornik statej po mašinnomu perevodu), Institut točnoj mechaniki i vyčisliteľnoj techniki AN SSSR, Moskva 1958 (MP); Materialy po mašinnomu perevodu I, Izd. Leningradskogo universiteta, Leningrad 1958 (MMP I); Voprosy statistiki reči (Materialy soveščanija), Izd. Leningradskogo universiteta, Leningrad 1958 (VSR); Problemy kibernetiki I, Izd. Akademii nauk SSSR, Moskva 1958 (PK I); Tezisy konferencii po mašinnomu perevodu (15—21 maja 1958 g.), I MGPIIJ, Moskva 1958 (Tez. I); Tezisy soveščanija po matematičeskoj lingvistike (15—21 aprelja 1959 g.), Leningradskij universitet, Komitet po prikladnoj lingvistike, Leningrad 1959 (Tez. II).

[3] Algoritmus strojového překladu je systém formálních pravidel, která odpovídají pravidlům gramatiky a slovníku; jsou formulována tak, aby jich bylo možno automaticky užívat.

[4] Program strojového překladu je algoritmus uvedený do takové podoby, v které může být uložen do stroje.

[5] D. J. Panov, A. A. Ljapunov, I. S. Muchin, Avtomatizacija perevoda s odnogo jazyka na drugoj, sb. Sessija Akademii nauk SSSR po naučnym problemam proizvodstva 15—20 oktjabrja 1956 g. Plenarnyje zasedanija, Moskva 1956.

[6] I. A. Meľčuk, Soveščanije po voprosam razrabotki i postrojenija informacionnych mašin, VJaz 1957, č. 5, 161n.; Naučno-techničeskoje soveščanije po kibernetike, PK I, 266n.

[7] V. A. Uspenskij, Soveščanije po statistike reči, VJaz 1958, č. 1, 170n.

[8] V. V. Ivanov, Komitet po prikladnoj lingvistike, VJaz 1958, č. 3, 136n.

[9] L. R. Zinder, Simpozium po voprosam razborčivosti reči, Vjaz 1958, č. 5, 151n.

[10] T. M. Nikolajeva, Konferencija po mašinnomu perevodu, VJaz 1958, č. 5, 149n.

[11] V. P. Berkov, B. A. Jeršov, O popytkach mašinnogo perevoda, VJaz 1955, č. 6, 145n.; I. S. Muchin, Opyty avtomatičeskogo perevoda na elektronnoj vyčisliteľnoj mašine BESM, Moskva 1956; O nekotorych aktuaľnych zadačach sovremennogo jazykoznanija, VJaz 1956 č. 4, 3n.; P. S. Kuznecov, A. A. Ljapunov, A. A. Reformatskij, Osnovnyje problemy mašinnogo perevoda, VJaz 1956, č. 5, 107n.; L. I. Žirkov, Granicy primenimosti mašinnogo perevoda, VJaz 1956, č. 5, 121n.; T. N. Mološnaja, V. A. Purto, I. I. Revzin, V. J. Rozencvejg, Nekotoryje lingvističeskije voprosy mašinnogo perevoda, VJaz 1957, č. 1, 107n.; L. S. Barchudarov, G. V. Kolšanskij, K voprosu o vozmožnostjach mašinnogo perevoda, VJaZ 1958, č. 1, 129n.; I. K. Beľskaja, Nekotoryje obščije voprosy mašinnogo perevoda, MP, 3n.; M. I. Steblin-Kamenskij, Značenije mašinnogo perevoda dlja jazykoznanija, MMP 1, 3n.; A. A. Reformatskij, K voprosu o mašinnom perevode ustnoj reči, BMP 6, 31n.; I. I. Revzin, O nekotorych aspektach sovremennych teoretičeskich issledovanij v oblasti mašinnogo perevoda, BMP 7, 13n.; V. J. Rozencvejg, Raboty po mašinnomu perevodu s inostrannych jazykov na russkij i s russkogo na inostrannyje v Sovetskom sojuze, IV Mežd. s’jezd slavistov, Moskva 1958; I. A. Meľčuk, Raboty po mašinnomu perevodu v SSSR, Vestnik Akademii nauk SSSR, 1959, 2, 43n.; T. L. Gavrilova, O. S. Kulagina, T. N. Mološnaja, G. V. Čekova, Perevod s odnogo jazyka na drugoj pri pomošči mašiny, Materialy konferencii po teorii informacii, Moskva 1958; nejzákladnější informace o strojovém překladu obsahuje brožura D. J. Panov, Avtomatičeskij perevod, Moskva 1956, vyšla také v druhém vydání r. 1958 podstatně rozšířena; pro seznámení s elektronkovými počítači je velmi informativní brožura S. A. Lebedev, Elektronnyje vyčisliteľnyje mašiny, Moskva 1956.

[12] N. D. Andrejev, Mašinnyj perevod i problema jazyka-posrednika, VJaz, 1957, č. 5, 117n.

[13] N. D. Andrejev, S. J. Fitialov, Jazyk-posrednik mašinnogo perevoda i principy jego postrojenija, Tez II, 53n.

[14] I. A. Meľčuk, Modeľ jazyka-posrednika dlja mašinnogo perevoda, Tez I, 20n.; týž autor, K voprosu o grammatičeskom v jazyke-posrednike, Tez II, 60n.

[15] E. A. Bokarev, Jazyk-posrednik i iskustvennyje meždunarodnyje jazyki, Tez I, 4n.

[16] V. V. Ivanov, Lingvističeskije voprosy sozdanija mašinnogo perevoda dlja informacionnoj mašiny, MMP 1, 10n.; N. D. Andrejev, Meta-jazyk mašinnogo perevoda i jego primenenije, MMP 1, 40n.

[17] V. P. Вerkov, Grammatičeskaja informacija i informacionnyj jazyk, Tez II, 68n.

[18] V. A. Agrajev, V. V. Borodin, Problema avtomatičeskogo reforirovanija i puti jejo rešenija, Tez II, 88n.

[19] N. D. Andrejev, Principy postrojenija elektročitajuščich ustrojstv, MMP 1, 223n.

[20] I. L. Bratčikov, S. J. Fitialov, G. S. Cejtin, O strukture slovarja i kodirovke informacii dlja mašinnogo perevoda, MMP 1, 61n.

[21] G. M. Strelkovskij, Nekotoryje obščije principy sostavlenija slovarej dlja mašinnogo perevoda, Tez I, 56n.; podobně I. K. Beľskaja, O principach postrojenija slovarja dlja mašinnogo perevoda, Vjaz 1959, č. 3, 89n.; užší problém zkoumá A. V. Superanskaja, Process transkribirovanija sobstvennych imen i vozmožnosť jego avtomatizacii, BMP 6, 44n.

[22] T. N. Mološnaja, Voprosy različenija omonimov pri mašinnom perevode s anglijskogo jazyka na russkij, PK 1, 215n.

[23] S. S. Belokrinickaja, Princip sostavlenija nemecko-russkogo slovarja mnogoznačnych slov dlja mašinnogo perevoda, MP, 89n.

[24] T. N. Mološnaja, Nekotoryje voprosy sintaksisa v svjazi s mašinnym perevodom s anglijskogo jazyka na russkij, VJaz 1957, č. 4, 92n.; srov. podobné články I. I. Revzin, Nekotoryje voprosy formalizacii sintaksisa, BMP 1, 5n., a T. M. Nikolajeva, Analiz russkogo predloženija, ITM i VT, Moskva 1958; Ch. Fries, The Structure of English, New York 1952.

[25] Yehoshua Bar-Hillel, A Quasi-Arithmetical Notation for Syntactic Description, Language 29, 1953, 47n.

[26] B. M. Lejkina, Pervyj etap nezavisimogo analiza struktury prostogo predloženija v anglijskom jazyke, MMP 1, 216n.

[27] L. N. Zasorina, N. B. Karačan, S. N. Medvedeva, G. S. Cejtin, Projekt programm dlja morfologičeskogo analiza russkogo jazyka v mašinnom perevode, MMP 1, 136n.

[28] T. M. Nikolajeva, Analiz znakov prepinanija pri mašinnom perevode s russkogo jazyka, MP, 33n.

[29] D. Džanaridze, I. A. Meľčuk, T. N. Mološnaja, Obrabotka sočiniteľnych sojuzov pri perechode ot vchodnogo jazyka k jazyku posredniku, Tez. II, 63n.

[30] L. I. Ilija, Metody členenija sintaksičeskogo celogo, Tez I, 43n.

[31] I. K. Beľskaja, Osnovnyje charakteristiki slovarja i grammatičeskich schem mašinnogo perevoda s anglijskogo jazyka na russkij, MP, 47n.; podobně také T. N. Mološnaja, Soobščenije o sostavlenii grammatičeskich pravil dlja mašinnogo perevoda s anglijskogo jazyka, BMP 2, 1n.

[32] O. S. Kulagina, I. A. Meľčuk, Mašinnyj perevod s francuzskogo jazyka na russkij, VJaz 1956, č. 5, 111n.; podobně O. S. Kulagina, Mašinnyj perevod s francuzskogo jazyka, Izvestija VUZov, Matematika, 1958, 5 (6), 46n.; I. A. Meľčuk, Statistika i zavisimosť roda francuzskich suščestviteľnych ot ich okončanij, VSR, 112n.; podobný článek s týmž názvem publikoval dříve I. A. Meľčuk v BMP 7, 13n.

[33] V. V. Paršin, Perevod složnych suščestviteľnych s nemeckogo jazyka na russkij pri mašinnom perevode, MP, 81n.

[34] I. A. Meľčuk, Nekotoryje voprosy mašinnogo perevoda s vengerskogo jazyka na russkij, BMP 4, 1n.; týž, Nekotoryje vyvody obščego charaktera v svjazi s mašinnym perevodom s vengerskogo jazyka, BMP 6, 44n.; týž, O mašinnom perevode s vengerskogo jazyka na russkij, PK 1, 222n.

[35] I. V. Sofronov, Obščije principy mašinnogo perevoda s kitajskogo jazyka, VJaz 1958, č. 2, 116n.; V. A. Voronin, Grammatičeskij analiz pri mašinnom perevode s kitajskogo na russkij jazyk, MP, 101n.; M. B. Jefimov, Nekotoryje voprosy mašinnogo perevoda s japonskogo jazyka na russkij, MP, 114n.; A. A. Babincev, J. P. Semeniščev, O mašinnom perevode s japonskogo jazyka na russkij, MMP 1, 209n.

[36] V. P. Berkov, M. P. Čerkasova, Rabota nad norvežsko-russkim algoritmom mašinnogo perevoda, MMP 1, 98n.

[37] T. E. Katenina, O rabote nad chindustani (chindi)-russkim algoritmom mašinnogo perevoda, MMP 1, 191n.; N. D. Andrejev, D. S. Batova, V. S. Panfilov, V. M. Petrova, Elementy nezavisimogo analiza vo v’jetnamsko-russkom algoritme mašinnogo perevoda, MMP 1, 199n.; J. K. Lekomcev, Strojenije v’jetnamskoj glagoľnoj sintagmy, VSR, 131n.; N. D. Andrejev, E. A. Zapadova, O. A. Timofejeva, Nekotoryje voprosy postrojenija birmano-russkogo algoritma mašinnogo perevoda, MMP 1, 126n.; O. B. Frolova, V. I. Strelkova, Načaľnyj etap raboty nad arabsko-russkim algoritmom mašinnogo perevoda, MMP 1, 112n.

[38] J. H. Greenberg, Essays in Linguistics, New York 1957.

[39] O. S. Kulagina, Ob odnom sposobe opredelenija grammatičeskich ponjatij na baze teorii množestv, PK 1, 203n.; Ob odnom sposobe opredelenija lingvističeskich ponjatij, BMP 3, 1n.; koncepce O. S. Kulaginové byla původně vyložena v její kandidátské práci; srov. Nekotoryje teoretičeskije voprosy mašinnogo perevoda, Otdelenije prikladnoj matematiki Matematičeskogo instituta im. Steklova, Moskva 1958; V. A. Uspenskij, K opredeleniju časti reči v teoretiko-množenstvennoj sisteme jazyka, BMP 5.

[40] E. V. Padučeva, Statističeskoje issledovanije struktury sloga, VSR, 100n.; Z. M. Volockaja, I. A. Meľčuk, T. N. Mološnaja, I. N. Šelimova, O russkom slovare častotnosti, VSR, 93n.; R. G. Piotrovskij, Nekotoryje voprosy statističeskogo obsledovanija leksičeskich grup, VSR, 85n.; V. A. Artemov, Primenenije statističeskich metodov v eksperimentaľno-fonetičeskom i psichologičeskom izučenii reči, VSR, 73n.; I. I. Revzin, O sootnošenii strukturnych i statističeskich metodov v sovremennoj lingvistike, VSR, 45n.; A. L. Šumilina, Z. M. Volockaja, Nekotoryje statističeskije dannyje o suščestviteľnych russkogo jazyka (na materiale matematičeskich tekstov), BMP 7, 41n.

[41] L. R. Zinder, O likvističeskoj verojatnosti, VJaz 1958, č. 2, 121n.; stať s týmž titulem publikoval autor v VSR, 58n.; V. V. Ivanov, Verojatnostnoje opredelenije lingvističeskogo vremeni, VSR, 62n.; A. Suprun, Po povodu izbytočnosti jazykovoj informacii. Tezisy dokladov i soobščenij na 7-oj naučnoj konferencii professorsko-prepodavateľskogo sostava, Frunze 1959, 7n.

[42] V. V. Ivanov, Jazykoznanije i matematika, BMP 5, 5n.; R. L. Dobrušin, Elementarnaja grammatičeskaja kategorija, BMP 5, 19n.; P. S. Kuznecov, Ob osnovnych položenijach fonologii, BMP 5, 27n.; V. V. Ivanov, Kod i soobščenije, BMP 5; V. V. Ivanov, n-mernoje prostranstvo jazyka, BMP 5; V. V. Ivanov, Ponjatije nejtralizacii v morfologii i leksike, BMP 5; S. K. Šaumjan, Ponjatije fonemy v svete simvoličeskoj logiki, BMP 5, 58n.; týž, Logičeskij analiz ponjatija fonemy, sb. Logičeskije issledovanija, 158n., Moskva 1959.

[43] V. V. Ivanov, O nekotorych ponjatijach sravniteľno-istoričeskogo jazykoznanija, BMP 5, G. A. Klimov, O glottochronologičeskom metode datirovki raspada prajazyka, VJaz 1959, č. 2, 119n.

[44] L. R. Zinder, Ob odnom opyte sodružestva fonetikov s inženerami svjazi, VJaz 1957, č. 5, 111n.

Slovo a slovesnost, volume 20 (1959), number 4, pp. 277-285

Previous Vincent Blanár: Základné dielo z českého historického miestopisu

Next Igor A. Meľčuk (Moskva): K otázkám strojového překladu v Moskvě