Časopis Slovo a slovesnost
en cz

Dobrá propagace nových metod v jazykovědě v SSSR

Pavel Novák, Bohumil Palek, Marie Těšitelová

[Rozhledy]

(pdf)

Хорошая пропаганда новых методов в языкознании в СССР / Une bonne propagation de nouvelles méthodes dans la linguistique en URSS

Takto můžeme uvítat sborník O točnych metodach issledovanija jazyka (O tak nazyvajemoj „matematičeskoj lingvistike“), který vyšel r. 1961 v Moskvě (162 s.). Sborník obsahuje vedle krátké předmluvy 6 kapitol: I. Může se stát jazykověda exaktní vědou? II. Některé otázky sémantiky v současné jazykovědě (autorka obou O. S. Achmanova). — III. O některých typech jazykového významu. IV. Strojový překlad a lingvistika (autor obou I. A. Meľčuk). — V. Užití statistických metod při zkoumání jazyka (R. M. Frumkina). — VI. Možnosti zkoumání jazyka metodami teorie informace (J. V. Padučeva). Za těmito kapitolami následuje bibliografie (kolem 180 titulů) a věcný rejstřík. Kapitoly III. až VI. vznikly větší nebo menší úpravou, doplněním nebo zkrácením statí již uveřejněných, avšak většinou v publikacích velmi málo přístupných.[1]

O. S. Achmanovovou ani průkopníka strojového překladu v Sovětském svazu I. A. Meľčuka představovat nemusíme.[2] R. M. Frumkinová působí v sektoru strukturní a aplikované lingvistiky Ústavu jazykovědy AN SSSR, J. V. Padučevová v Ústavu vědecké informace AN SSSR.

Jádru knihy (kap. IV—VI) jsou předeslány tři kapitoly, mající probrat „ty obecně jazykovědné otázky, bez jejichž vyjasnění by výklad o konkrétních cestách přesného zkoumání a přesného popisu jazykových jevů byl odtržený od předchozí jazykovědy“ (3). Všechny tři jsou věnovány významu v jazyce.

Podle otázky v názvu 1. kap. (5—19) mohli bychom soudit, že chce na ni O. S. Achmanovová odpovědět asi takto: Jazykověda se stane přesnou vědou, podaří-li se jí zmocnit se přesnými metodami i významu. Avšak ve skutečnosti A. jen správně konstatuje, že požadavky, které klade na jazykovědu možnost využití samočinných počítačů k strojovému překladu a zpracování informací strojem, jsou mocným impulsem pro zpřesňování jazykovědných metod; souhlasí s nutností zprvu vědomě omezit výzkum na komunikativní složku jazyka; poukazuje na to, že nedostatek vzájemně jednoznačného vztahu mezi významem a formou je zdrojem různých nesnází při studiu významu: dále klade vedle sebe názory některých lingvistů na vztah významu a zvukové formy a k některým z nich se staví odmítavě (glosematika, deskriptivismus), kdežto druhým dává spíše za pravdu (Martinet, Siertsema).

K jednotlivým místům lze mít připomínky: Tak se jako příklad na nedostatek vzájemně jednoznačného vztahu mezi označovaným a označujícím uvádí ruské jem, vyjadřující (1) ed-, (2) ind., (3) 1. os., (4) sg. a (5) préz. (7). To je však spíše příklad na „kumulaci funkcí“. Za předpokladu, že by sloveso jesť nemělo v ruštině synonyma, byl by vztah mezi formální jednotkou jem a uvedenou kombinací jednotek významových vzájemně jednoznačný. Tvrzení „… v podstatě [132]Hjelmslevova ‚jednotka výrazu‘ a ‚jednotka obsahu‘ mají svůj úplný protějšek v ‚fonému‘ a ‚morfému‘ diskriptivní lingvistiky“ (12), bylo by třeba doložit. — Vedle dvou přístupů k vztahu zvukové formy a významu, o nichž A. mluví a které nazývá „homoplánovým“ (v diskriptivismu je význam vně hranic zkoumání, správněji řečeno stačí jen zjištění, že výpověď má význam a že dvě výpovědi mají nebo nemají stejný význam) a „heteroplánovým“ (u Hjelmsleva — plán obsahu a plán výrazu), stojí za zmínku přístup, v němž se forma a význam (funkce) považují za korelativní pojmy a týž jev může být z jednoho hlediska formou a z druhého významem.[3] — A. Martinet svou teorii dvojího členění v jazyce — první je členění sdělení na dvojstranné jednotky označovaného — označujícího, druhé je členění označujícího na posloupnost „diakritických“ jednotek, fonémů — modifikoval později tím, že do ní zapojil — jako třetí bod — členění fonémů na simultánní distinktivní rysy.[4] Převodní a informační jazyky nejsou jedinými typy strojových jazyků.[5]

V II. kap. (20—32) O. S. Achmanovová, opírajíc se zejména o Jakobsonovu stať „On linguistics aspects of translation“,[6] jednak osvětluje vztah významu z hlediska překladu, jednak probírá sémantické otázky konstrukce umělých mezinárodních jazyků. Zcela zavádějící je pozn. 2 na s. 27, v níž se vedle sebe zcela nerozlišeně kladou sémantické práce Carnapovy a „obecná sémantika“ Korzybského.[7]

Předpokladem celkové přesnosti metodologické je i přesnost terminologická. V III. kap. (33—39) podává I. A. Meľčuk korektivní definici výrazů gramatický, syntaktický a morfologický.[8] Zavádí tím jistou klasifikaci jazykového materiálu z tří hledisek, z nichž první dvě jsou významová, třetí formální. (1) Označovaným jsou vztahy mezi prvky jazyka nebo vztahy mimojazykové (význam syntaktický — význam lexikální); (2) význam se vyjadřuje závazně nebo fakultativně (význam gramatický — význam negramatický); (3) v hranicích slova nebo mimo ně (postupy morfologické — postupy nemorfologické). K této kapitole není v bibliografické příloze uvedena literatura. Ovšem vzhledem k tomu, že nejde „jen“ o upřesnění významu některých termínů, nýbrž i o to, že se jisté rysy jazykové reality považují za zvlášť důležité, by tu podrobnější konfrontace se staršími pracemi, zvláště typologickými, neškodila a pouhé dva odkazy (v textu) ji nahradit nemohou.

V kap. IV. (40—66) podává týž autor informativní přehled základních postupů užívaných v strojovém překladu (dále SP). Jeho cílem není zřejmě ukázat, jaký je systém SP, z jakých fází se skládá a jak jsou tyto fáze realizovány v algoritmu analýzy a syntézy a tyto algoritmy v samočinném počítači, nýbrž jde mu o zjištění různých postupů užívaných v jednotlivých fázích SP. Tato kapitola předpokládá tedy čtenáře se základními znalostmi SP, a proto naše další hodnocení bude vycházet z hlediska tohoto čtenáře.

Ve výkladu jednotlivých postupů ve SP se autor soustřeďuje na několik základních okruhů otázek. Nejprve se zamýšlí nad poměrem mezi lingvistikou a SP. Velmi správně zdůrazňuje jejich těsný vztah. Při popisu jazyka vždy konstruujeme určitý systém — model —, který nám [133]s větší nebo menší přesností zachycuje stav jazyka. Při SP je pak takový model prověřován přísně formalizovaným aparátem — algoritmy. SP zde tedy vystupuje jako aplikovaná disciplína, kde se prověřují teoretické výzkumy jazykovědy. Doslovná interpretace tohoto autorova názoru by mohla vést k domněnce, že jakéhokoli modelu sestaveného pro jazyk je možno využít při SP. SP však je z tohoto hlediska disciplínou užší, což je dáno jeho speciálním úkolem. Kromě toho je tu problém nejen využitelnosti, ale i efektivnosti modelů.

Dále autor vyděluje (spolu s Yngvem) dva základní přístupy ke SP, a to přístup „95%ní“ a „100%ní“. Při 95%ním překladu se nepředpokládá přesné přeložení textu do všech podrobností (jak stylistických, tak slovníkových); naopak počítá se s tím, že si odborník mnoho domyslí. Tento postup, který vychází jednak z komerčních, jednak z technických požadavků, je poměrně vzdálen bezprostřednímu lingvistickému bádání, protože pro takový překlad není důležitá struktura jazyka a pravidla při něm užívaná neodpovídají často obvyklým pravidlům gramatickým. Lingvistice je naopak mnohem bližší, jak správně autor konstatuje, postup 100%ní, který předpokládá adekvátní překlad. Proto také v podstatě všechny lingvisticky cenné poznatky se objevují v tomto postupu.

V souvislosti s tím autor věnuje velmi mnoho místa syntaktickému zkoumání, zvláště syntaktické analýze jednoduché věty (v této oblasti bylo ve SP snad nejvíce vykonáno). Autor probírá některé typy syntaktické analýzy, jimž byl nedávno věnován i článek P. Nováka,[9] a hodnotí je z hlediska úspornosti algoritmu. Upozorněme tu na důležitou problematiku, na niž v Novákově článku nedošlo. Konkrétním slovním tvarům musejí být buď přímo v slovníku, anebo pomocí slovníku a morfologické analýzy přiřazeny jisté syntaktické (a vůbec gramatické) charakteristiky nutné pro další postup překladu, které vytvářejí jistou klasifikaci slovních tvarů; Meľčuk (opíraje se o některé již užívané postupy) rozlišuje i teoreticky běžnou klasifikaci od klasifikace, které říká „klouzavá“ (skoľzjaščaja) a které sám užívá. Jde při ní o to, že „jednotné stálé rozdělení slov (slovních tvarů) do tříd se vůbec neprovádí. Místo jednoho příznaku se slovu připisuje celá řada příznaků, která charakterizuje slovo ze všech relevantních stran. Třídění slov je tu možno dostat využitím jakékoli kombinace příznaků“ (48). Věříme s autorem, že lze pomocí „klouzavé“ klasifikace úspěšně vyřešit i otázku klasifikace slovních druhů.

Pro analýzu souvětných celků uvádějí se dva postupy. Rozčlenění na jednoduché věty se buď provádí před analýzou těchto vět, nebo je rozčlenění na jednoduché věty výsledkem celkové analýzy souvětí.

Jedním z velmi důležitých a zároveň velmi aktuálních problémů SP je problematika významu. Hlavním úkolem, který je tu třeba pomocí formalizace významu řešit, je polysémie a homonymie. Obě se vyskytují ve všech fázích SP; při jejich řešení se v podstatě postupuje těmito způsoby: (1) vymezením oboru (např. překlad textů matematických, elektrotechnických apod.); (2) pomocí nejobecnějších nebo nejpravděpodobnějších významových variant slov; (3) analýzou sousedních slov (předcházejících a následujících); (4) s pomocí tzv. sémantických faktorů. Využití postupů 1 a 2 nepřináší takové výsledky jako postupy 3 a 4, které předpokládají mnohem podrobnější rozbor sémantický. Proto také hlavní těžiště výzkumu spočívá ve vyjasnění základních principů postupu 3 a 4. Třetí spočívá v tom, že se význam daného slova zjišťuje na základě „sémantických příznaků“ okolních slov. Tento postup je těsně spjat s postupem 4 přiřazením „sémantických příznaků“ každému slovu. Čtvrtý postup nebyl původně vypracován pro potřeby SP ani lingvistiky, nýbrž vznikl z potřeb automatického zpracování vědeckých a technických informací. Základním pojmem tohoto postupu je pojem sémantického faktoru (rus. semantičeskij množiteľ, angl. semantic factor). Sémantickým faktorem se přibližně rozumí základní pojem dále již nerozložitelný (např. částice, pohyb atd.). Kombinacemi sémantických faktorů jsou [134]určeny pojmy složitější. — Autor ne vždy zcela jasně odlišuje směry ve výzkumu, které se zabývají SP a které automatickým zpracováním vědeckých a technických informací.

Poslední téma, které autor zkoumá, je převodní jazyk. Podrobněji rozebírá pouze postup cambridžské skupiny (Cambridge Language Research Unit). Je škoda, že autor nevyložil zde své vlastní názory. — Přehled jednotlivých pracovišť strojového překladu v kapitole uváděný není úplný.

V V. kap. (67—97) podává R. M. Frumkinová ve výběru, jak se vzhledem k rozsahu celé problematiky v úvodu zdůrazňuje, některé základní pojmy nutné při užívání statistických metod v jazykovědě a svůj výklad doplňuje konkrétními ukázkami převážně z oblasti lexika a metriky. Zejména oblast lexika a zákonitosti v ní postižitelné statisticky jsou středem badatelského zájmu autorčina, jak ukazuje nejen citovaná kapitola a k ní připojená literatura (o ní viz dále), nýbrž i ostatní její publikační činnost.[10]

Pokud jde o statistické pojmy v jazykovědě, pokládáme především za užitečné, že autorka zavádí pojem pravidel statistických vedle pravidel plně determinovaných, která se zpravidla uvádějí v gramatikách. Statistická pravidla postihují ty jevy, které se při určeném komplexu podmínek mohou, ale nemusí vyskytnout.[11] Ačkoli se tzv. pravidla plně determinovaná snaží postihnout jevy v plné šíři, nedaří se to vždy. Pravidla determinovaná a statistická se navzájem doplňují, jak ostatně vyplývá z dialektiky vztahu stránky kvalitativní a kvantitativní. To je podle našeho názoru důležitý zřetel při užívání statistických pravidel v jazykovědě.

Mají-li statistická pravidla dobře plnit svou funkci, musí být založena na takovém výběru materiálu, který náležitě reprezentuje daný soubor. Autorka stati tu zvlášť zdůrazňuje jednak rozsah materiálu,[12] jednak relativní odchylku, kterou lze stanovit formulí, v níž je kromě konstanty uvedena frekvence jevu i rozsah materiálu. Autorka tu správně připomíná, že se lingvisté často dopouštějí chyby tím, že pracují se souborem, jehož rozsah není přesně stanoven ani předběžným pokusem.

Pokud jde o výběr materiálu, postrádáme v stati zmínky o dvou činitelích, které v této souvislosti nelze pominout. Je to především stanovení rozsahu materiálu podle povahy jazykového jevu, který máme zkoumat. Je jistě rozdíl, studujeme-li frekvenci hlásek, anebo slov, syntaktických jevů ap. Stranou je ponechán i zřetel k obsahu jazykového materiálu, ačkoli má do značné míry vliv na výsledky statistického šetření. Výrazně se to projevuje zejm. při užívání statistických metod k studiu slovníku; touto problematikou se autorka zvlášť zabývá v 2. části své kap.

Své výklady o zákonitostech v slovní zásobě opírá o frekvenční slovníky, jejichž význam charakterizuje jen povšechně,[13] uvádějíc jako příklad celkem nejstarší slovník Kädingův z r. 1897. Nehledíc k tomu, že zjišťování frekvence slov ve formě různých seznamů má již starší tradici,[14] není podle našeho názoru slovník Kädingův svým speciálním zaměřením těsnopiseckým a svým stářím nejvhodnějším reprezentantem. To je však vyváženo tím, že se v seznamu literatury (154—155) uvádějí všechny důležitější frekvenční slovníky vyšlé do r. 1953.

[135]Zvláštní pozornost věnuje autorka zákonitostem v slovní zásobě, které se projevují mezi délkou textu N a rozsahem jeho slovníku L. Autorka zavádí pojem tzv. „statistické struktury“ textu, pro niž jsou rozhodující skupiny slov, která se v jistém počtu opakují, přičemž z hlediska frekvence tu nerozhoduje ani délka textu, ani rozsah slovníku.

Význam tohoto tvrzení jsme se pokusili ověřit na českém materiálu. K tomu účelu jsme vybrali 3 knihy, o něž se také opírá český frekvenční slovník,[15] a to:

K. Čapek, Život a dílo skladatele Foltýna (21.950 slov, z toho 4.192 slov různých), I. Olbracht, Bratr Žak (29.803 slova, z toho 5.558 slov různých), M. Pujmanová, Předtucha (24.357 slov, z toho 4.858 slov různých). Ve všech třech dílech, která se liší jak v N, tak i v L, nacházíme např. skupinu slov s frekvencí 1 v tomto poměru:

K. Čapek:

2.439 různých slov, tj. 58.38 % z celkového počtu,

I. Olbracht:

3.212 různých slov, tj. 57,79 % z celkového počtu,

M. Pujmanová:

2.982 různých slov, tj. 61,38 % z celkového počtu.

Vrstva slov s frekvencí 1 je u K. Čapka i u I. Olbrachta stejně velká při rozdílnosti N a L. Slovník M. Pujmanové ukazuje větší rozmanitost v L.[16]

Autorka ve shodě s Yulem správně zdůrazňuje, že srovnáním statistických struktur můžeme vnést přesné metody do hodnocení bohatství slovníku, jeho rozmanitosti apod. Naznačuje to i naše ukázka. Také v distribuci různých druhů slov existují jisté obecné zákonitosti,[17] a to i při nižší frekvenci. Také toto autorčina tvrzení můžeme doložit na českém materiálu.

Např. v cit. 3 dílech, která jsme uvedli výše, jsou substantiva a slovesa s frekvencí 1 doložena takto:

K. Čapek:

832 substantiv, tj. 34,11 %, 722 sloves, tj. 29,60 %

I. Olbracht:

1064 substantiv, tj. 33,14 %, 1141 sloves, tj. 35,52 %

M. Pujmanová:

1012 substantiv, tj. 33,94 %, 1054 sloves, tj. 35,35 %

Nápadně nižší frekvence sloves u K. Čapka ukazuje na zvláštní postavení slovesa v jeho díle. Potvrzuje se tím i Yulova teze, že na základě rozboru jednotlivých druhů slov lze identifikovat styl jednotlivých autorů; srov. op. cit. v pozn. 15.[18]

Na základě studia literatury zabývá se autorka i vztahy mezi délkou textu N a rozsahem slovníku L, ukazujíc, že L je jistou funkcí N. Dále věnuje pozornost i tzv. zákonu Zipfovu, který stanoví vztah mezi frekvencí slova (P) a číslem uvádějícím jeho pořadí ve frekvenčním seznamu (r). Tento problém, jemuž bylo v literatuře věnováno již hojně pozornosti, probrala autorka též ve speciálním článku.[19] Na základě úprav tzv. zákona Zipfova (P = k . r), zvláště Mandelbrotem,[20] se potvrzuje známý fakt, že zákon nepostihuje zejm. slova s malou pravděpodobností výskytu, která tvoří značnou část slov různých, tedy slovníku L. (Srov. i ukázku českého materiálu.) Platí jen pro slova s vyšší frekvencí, která představují značnou část textu N (až 80 %),[21] a proto jej autorka pokládá za cenný pro studium lexikální struktury. Pro úplnost literatury bylo by však třeba doplnit i úpravu zákona Zipfova, kterou na základě materiálu českého frekvenčního slovníku (op. cit., v pozn. 15) provedl v posledních letech M. Vey.[22]

[136]Kromě využití statistických metod k studiu slovní zásoby zabývá se autorka i distribucí slov podle počtu slabik v různých jazycích, přičemž se opírá zejména o práci německého matematika W. Fuckse. (Srov. sb. Teorije peredači soobščenij, Moskva 1957, 221—247.) Na základě znalosti průměrného počtu slabik v slově, který je typický pro jednotlivé jazyky, stanovil W. Fucks formuli, podle níž lze vypočítat počet slov jednoslabičných, dvojslabičných v textu apod. Autorka ověřila s úspěchem Fucksovu formuli na ruštině.

V závěru kapitoly se na základě materiálu a bádání B. V. Tomaševského ukazuje význam využití statistických metod v metrice. Tomaševskij např. dokázal, že u Puškina mezi počtem stop v jambu (x) a průměrným počtem bezpřízvučných slabik v jednom verši (y) existuje vztah y = 0,28 (x — 1). Tato formule aplikována na pětistopový jambický verš s césurou dokazuje i nezávislost obou poloveršů.[23]

Stať F. M. Frumkinové je dobrým přínosem jak pro poznání některých základních pojmů při využití statistických metod k studiu jazyka (např. tzv. statistické pravidlo, statistická struktura slovníku), tak pro nejnutnější seznámení s příslušnou základní literaturou, zejména staršího období (Zipf, Yule, přehled frekvenčních slovníků). Cenné jsou i některé konkrétní příklady, na nichž se využití statistických metod k studiu jazyka názorně ukazuje. Je třeba litovat, že tu není zastoupena i ukázka užití statistických metod k poznání gramatické struktury jazyka (ukázka týkající se frekvence pádů nestačí).

Dobrým úvodem do problematiky teorie informace a jejího významu pro studium jazyka je kap. VI. E. V. Padučevové (98—149). Na základě studia literatury, zvláště díla Shannonova, Millerova aj. (viz s. 156—157)[24] a se zřetelem na čtenáře, který hledá v knize celkem první poučení o dané problematice, vykládá autorka systematicky základní pojmy z teorie informace a shrnuje názory vynikajících odborníků na využití metod teorie informace v lingvistice.

Na výkladu pojmů z teorie informace je třeba kladně ocenit zejm. to, že autorka stojí na půdě lingvistiky, a proto jistě vhodně zdůrazňuje ty jevy, které jsou pro lingvisty důležité, popř. upozorňuje na některé omyly, kterých se lingvisté při chápání některých pojmů a problémů dopouštějí. Na prvém místě se upozornění týká zejména obsahu sdělení; zdůrazňuje se tu, že pro techniky není důležitá obsahová stránka sdělení, nýbrž jeho statistická struktura, opírající se zejm. o pravděpodobnost, popř. o podmíněnou pravděpodobnost jednotlivých symbolů. Co se týče pojmu množství informace a entropie, připouští autorka jejich terminologickou synonymitu, ačkoli z hlediska věcného by se podle ní mělo mluvit o entropii záporné.

Aby náležitě vynikl problém jazyka jako kódu, zabývá se autorka stati nejprve obecně pojmem kódu a kódování. Chceme-li jazyk studovat metodami teorie informace, připomíná autorka, je třeba k němu přistupovat jako ke kódu a formulovat pravidla kódu v podobě statistických pravidel (srov. kapitolu R. M. Frumkinové). Vzhledem k tomu, že jazyk tvoří souvislý sled diskrétních jednotek, lze vypracovat model jazyka jako kódu s pravděpodobnostmi všech jeho symbolů, tj. písmen a fonémů. Jen u těchto jevů lze opatřit statistické údaje, které jsou nutné pro teorii informace. Naproti tomu např. spojení slov, jejichž frekvence do velké míry závisí na tématě, jak správně autorka zdůrazňuje, nelze plně postihnout ani složitými Markovovými řetězci.

S jistou opatrností musí lingvista přistupovat podle autorky i k pojmu redundance (nadbytečnosti), která se v technickém významu liší od významu běžně chápaného v lingvistice. Nadbytečnost v technickém slova smyslu může lingvistice přinést mnohé cenné poznatky srov[137]náváním procenta nadbytečnosti v různých jazycích. To předpokládá zjistit vztah nadbytečnosti k počtu fonémů a k průměrné délce slova. Autorka správně zdůrazňuje, že nadbytečnost může být kvantitativní mírou strukturnosti jazyka a sloužit jako základ k typologickému srovnávání různých jazyků i k studiu vývoje jazyka.

Také množství informace má významnou úlohu z hlediska lingvistického, a to pro překládání z jednoho jazyka do druhého i pro fonologický systém (např. stanovit „slabost“ jisté pozice). Pro tzv. optimálnost jazykového kódu má zvláštní význam opět průměrná délka slova tím, že přibližuje průměrnou informaci na písmeno maximu. Správně se tu připomíná, že nepřímý poměr mezi délkou slova a jeho frekvencí platí jen pro tzv. slova pomocná, tj. spojky, předložky apod.,[25] kdežto u slov plnovýznamových toto zjištění neplatí. — Domníváme se, že je to dáno právě obsahovou stránkou sdělení, jejíž jasnost a srozumitelnost se nedá v podstatě omezovat formálními činiteli.

Lze souhlasit se závěrem kapitoly, v němž autorka jistě právem zdůrazňuje, že dosavadními metodami teorie informace možno studovat jen formální stránku jazyka, tedy systém jeho fonémů a písmen. Ostatní jevy nelze v lineární posloupnosti dobře postihnout. — Zmínku o teorii sémantické informace bylo by možno doplnit zprávou o tzv. významové segmentaci.[26]

Tři informativní přehledy nejsou z jedné roviny. Kapitola IV. pojednává o jistém úkolu — SP, kdežto kapitoly V. a VI. o jistých metodách, které se uplatňují i při přípravě SP, ovšem vedle metod jiných. Jde především o celou problematiku tzv. „nekvantitativní“ lingvistiky, která je ve sborníku vědomě nechána stranou (srov. předmluvu). Na to je třeba výslovně upozornit, neboť se někdy exaktní, matematické metody mylně ztotožňují s metodami kvantitativního výzkumu. Jistá nevyváženost, která tím pochopitelně vznikla, nebyla vyrovnána ani v předmluvě, ani v slibně nazvané kapitole první. — V bibliografické příloze se nepostupuje vždy zcela soustavně. Při podobných příležitostech by bylo zřejmě lépe vedle běžného odkazového aparátu podat výběrovou bibliografii pro jednotlivá odvětví.[27]

Přes uvedené výhrady můžeme sborník vřele doporučit jako dobrou pomůcku pro lingvisty při orientaci v nových metodách v jazykovědě nejen užitečnou, ale i podnětnou.


[1] Ke kap. III. K voprosu o „grammatičeskom“ v jazyke-posrednike, Mašinnyj perevod i prikladnaja lingvistika 4, 1960, 25—45; k IV. Nekotoryje voprosy mašinnogo perevoda za rubežom, Dokl. na konf. po obrabotke informacii, mašinnomu perevodu i avtomatičeskomu čteniju teksta, vyp. 6, Moskva 1961; k V. Primenenije statističeskich metodov v jazykoznanii, VJaz 9, 1960, č. 4, 129—133; k VI. Vozmožnosti izučenija jazyka metodami teorii informacii, cit. Dokl. na konf. po obrabotke informacii …, vyp. 5.

[2] Viz jeho stati K otázkám strojového překladu v Moskvě, SaS 20, 1959, 285—289 a Strojové překládání v SSSR, Pokroky matematiky, fyziky a astronomie 5, 1960, 212—215.

[3] Viz B. Havránek, Strukturální lingvistika, OSNND VI, 456. — Srov. i ref. P. Nováka a P. Sgalla na liblické konferenci o marxistické jazykovědě v prosinci 1960.

[4] Phonetics and Linguistic Evolution, ve sb. Manual of Phonetics (ed. L. Kaiser), Amsterodam 1957, 268—269.

[5] Viz A. D. Andrejev, Mašinnyje jazyki kak element universaľnogo koda nauki, Dokl. na konf. po obrabotke informacii, mašinnomu perevodu i avtomatičeskomu čteniju teksta, vyp. 9, Moskva 1961. — Srov. i K. Čulík, On languages generated by some types of algorithms, ref. na konf. o metodách automat. programování, Varšava 5.—15. září 1961, vyd. PAN.

[6] V sb. On translation, ed. R. A. Brown, Cambridge 1959.

[7] Srov. zejména A. Schaff, Wstęp do semantyki, Varšava 1960, i rec. P. Materny, Filosofický časopis 9, 1961, č. 2, 282n. a ostatně i Boľšaja sovetskaja enciklopedija, sv. 51, heslo semantika.

[8] Podobného zaměření je Meľčukova stať O terminach „ustojčivost“ i „idiomatičnost“, VJaz 9, 1960, č. 4, 73—80.

[10] Srov. např. stati: Nekotoryje voprosy metodiki sostavlenija častotnych slovarej, Mašinnyj perevod i prikladnaja lingvistika 1959, č. 2 (9), 23—37. — Nekotoryje dannyje o raspredelenii form mnogoosnovnych glagolov v svjazi s problemoj sostavlenija slovarja osnov dlja mašinnogo perevoda, Problemy kibernetiki, vyp. 4, Moskva 1960, 197—205.

[11] Srov. I. A. Meľčuk, Statistika i zavisimosť roda francuzskich suščestviteľnych ot ich okončanija, Vopr. statistiki reči, Leningrad 1958, 112—130.

[12] Srov. též Alvar Ellegård, Estimating Vocabulary Size, Word 16, 1960, 219—244.

[13] K tomu srov. M. Těšitelová, K statistickému výzkumu slovní zásoby, SaS 22, 1961, 171—181.

[14] Srov. D. Harkin, The History of Word Counts, Babel, Revue internationale de la traduction 3, 1957, 113—124.

[15] J. Jelínek - J. V. Bečka - M. Těšitelová, Frekvence slov, slovních druhů a tvarů v českém jazyce, Praha 1961.

[16] Srov. M. Těšitelová, Otázky frekvence slov, zvláště v češtině, 1951, nepublikovaná disertační práce, 93n.

[17] Srov. cit. český frekvenční slovník, s. 30n.

[18] Srov. též M. Vey, Espèces de mots et fréquence de vocabulaire en tchèque, Bulletin de la Société de linguistique de Paris, tom 55 (1956), 89—112.

[19] K voprosu o tak nazyvajemom „zakone Zipfa“, VJaz, 1961, č. 2, 117—122.

[20] Structure formelle des textes et communication, Word 10, 1954, 10—27.

[21] Např. jen prvních 10 nejčastějších slov v citovaných 3 knihách tvoří u K. Čapka 24 % všech slov (textu N), u I. Olbrachta 22 %, u M. Pujmanové 22 %.

[22] A propos de la statistique du vocabulaire tchèque. Examen des principales relations numériques, Slavia 27, 1959, 396—406.

[23] O využití statistických metod v metrice viz nejnověji W. Fucks, Mathematische Analyse von Sprachelementen, Sprachstil und Sprachen, Köln u. Opladen 1955.

[24] Srov. též P. Sgall, Nové otázky matematických metod v jazykovědě, SaS 20, 1959, 44—55; J. Krámský, Teorie sdělné promluvy, tamtéž, 55—66. — Srov. i ref. L. Doležela na liblické konferenci o marxistické jazykovědě v prosinci 1960.

[25] Srov. český frekvenční slovník cit. v pozn. 15. — Viz též G. K. Zipf, Human Behavior and the Principle of Least Effort, Cambridge 1944, 66n. — B. Trnka, Kvantitativní lingvistika, ČMF 34, 1951, 16.

[26] Srov. G. Herdan, Type-Token Mathematics, ’s-Gravenhage 1960, 210—225.

[27] Uvádíme zde základní práce knižní, jen výjimečně časopisecké, které nejsou nebo již nemohly být v knize citovány: G. Herdan, Language as Choice and Chance, Groningen 1956; ev. II. díl Type-Token Mathematics, ’S-Gravenhage 1960: P. Guiraud, Problèmes et méthodes de la statistique linguistique, Paris 1960; A. G. Oettinger, Automatic language translation, Cambridge 1960. — Z bibliografií tu postrádáme: B. Trnka, A Tentative Bibliography, Utrecht/Brusseles, 1950; P. Guiraud, Bibliographie critique de la statistique linguistique, Utrecht/Anvers 1954; E. and K. Delavenay, Bibliography of Mechanical Translation — Bibliographie de la traduction automatique, ’S-Gravenhage 1961; N. G. Ryčkova, Lingvistika i matematika, Nauka i žizn’ 28, 1961, č. 9, 76—77, kde spolupracovnice akad. A. N. Kolmogorova referuje o jeho nové metodě zjišťování entropie textu.

Slovo a slovesnost, ročník 23 (1962), číslo 2, s. 131-137

Předchozí Karel Horálek: Staronová teorie jazykových funkcí v americkém sborníku

Následující Miloš Dokulil: Nová sovětská práce o tvoření slov v češtině