Časopis Slovo a slovesnost
en cz

Nové otázky matematických metod v jazykovědě

Petr Sgall

[Rozhledy]

(pdf)

Новые вопросы математических методов в языкознании / Nouveaux problèmes des méthodes mathématiques en linguistique

[*]Chceme zde podat přehled o novějších pracích z různých úseků tzv. matematické lingvistiky, s jejímiž metodami jsme u nás dosud poměrně málo seznámeni; půjde nám zejména o vztah matematické teorie informace k jazykovědě. Úkolem článku je, aby pomohl zvýšit zájem našich odborníků o tyto nové metody, ovšem zájem spojený s kritickým pohledem na dosavadní poněkud nerovnoměrné výsledky.

Matematické metody jsou dnes značně rozšířeny v jazykovědě západních zemí, zejména USA, a také v SSSR jsou některé jejich aspekty zpracovávány ve značném rozsahu.[1] I v naší jazykovědě je alespoň uplatňování statistických postupů v některých oborech (ve fonologii, v lexikologii) už dost běžné. Soustředíme zde tedy svou pozornost především na ty úseky, o kterých se u nás dosud psalo jen málo.

Podle metody můžeme matematická zpracování jazykových jevů předběžně rozdělit na tři okruhy: jsou to jednak práce založené statisticky, dále různá použití logických kalkulů (v souvislosti s teorií množin) a konečně uplatnění metod teorie informace.

Úlohou statistické metody v jazykovědě se u nás zabývá zejména prof. B. Trnka, který je autorem první mezinárodní bibliografie kvantitativní lingvistiky a několika speciálních prací týkajících se hlavně problematiky fonologické.[2] Jeho zpráva o kvantitativní lingvistice (ČMF 34, 1951, s. 66—74) seznámila naše odborníky s nejdůležitějšími výsledky, jichž bylo do té doby dosaženo přesným rozborem kvantitativní stránky jazykové skutečnosti; B. Trnka zde také — při kritice prací Zipfových — ukázal na nesprávnost příliš rychlého zobecňování závěrů, ke kterým se došlo statistickým výpočtem.[3]

Uplatnění statistiky v otázkách fonologie je u nás dobře známo z prací V. Mathesia, B. Trnky, [45]J. Vachka a jiných.[4] Také v jazykovědě západních zemí, zejména tam, kde se při fonologickém rozboru zdůrazňuje kritérium distribuce, je statistické zpracovávání hláskoslovných otázek časté.

Statistická metoda — podobně jako tomu často bylo s novými metodami i dříve v dějinách jazykovědy — proniká rychle právě v hláskosloví, kde jsou systémové vztahy jazykových prvků poměrně nejprůhlednější.[5] V pracích, které tu máme na mysli, je kladen důraz na jazykovědnou stránku problematiky (která i při relativní průhlednosti je ovšem dost složitá). Rozlišuje se důsledně výskyt fonémů v systému a v textu, číselný výskyt fonémů a množství různých posic, v kterých se daný foném objevuje, a základní pojmy, s kterými se operuje (foném, varianta, relevantní vlastnost atd.) jsou vcelku jasně vymezeny. Podobně je tomu také při uplatňování statistické metody v otázkách slovní zásoby, zejména při práci na frekvenčních slovnících.[6]

V některých jiných oblastech však není situace tak dobrá. Často se statistickému zpracovávání jazykových jevů věnují matematikové s malou přípravou jazykovědnou. Tito autoři užívají ovšem propracovanějších statistických postupů, do nichž dovedou zahrnout velké množství jazykových fakt, ale jazykovědným otázkám někdy nevěnují dost pozornosti. To se projevuje i v některých základních pracích, jako je např. Yulův výpočet konstanty charakteristické pro styl daného autora a podmíněné tím, jak rovnoměrně autor užívá celé své slovní zásoby.[7] G. U. Yule totiž dochází k tomuto výpočtu na základě materiálu vybraného bez jednoznačného teoretického opodstatnění: zkoumá v daných textech prostě výskyt všech podstatných jmen. Konstatuje jistě oprávněně, že podobné zkoumání sloves a adjektiv by vedlo k výsledkům v podstatě stejným, kdežto pomocná slova se pro tento účel nehodí, protože jejich výskyt je stabilní, bez ohledu na autora. Ale dělení podle slovních druhů tu přece není jediné možné; uvnitř slovních druhů mohou být z tohoto hlediska značné rozdíly: ne všechna pomocná slova mají stabilní výskyt bez ohledu na autora, a naopak některá často užívaná substantiva jsou pro autorův styl méně charakteristická.

Jiným, daleko vyhraněnějším příkladem může být stať W. Fuckse podávající „matematickou teorii tvoření slov“.[8] Nejde jen o to, že autorovo chápání slova jako složeného ze slabik není z lingvistického hlediska nejpřesnější; takové hledisko jistě má v určitém ohledu svou oprávněnost. Autor však zakládá své výpočty na tvrzení, že „každé slovo má aspoň jednu slabiku“ (s. 221, 228, 242, 244 aj.); přitom je jedním ze zkoumaných devíti jazyků ruština a autor nic neříká o tom, jak ve své statistice naložil se slovy, jako jsou předložky k, v; nemluví ani o možnosti neslabičných slov v jiných jazycích. Počítal ruské neslabičné předložky jako slabičné, nebo je vůbec nepovažoval za slova? Čtenář nemá možnost kontrolovat autorův postup v této věci a výsledek, ke kterému Fucks došel, tak ztrácí na hodnotě. To platí i o jiných pracích matema[46]tiků, kteří se zabývají otázkami výskytu slov o různém počtu slabik, např. o knize Herdanově, o které pojednáváme dále, nebo o starší stati sovětského matematika S. G. Čebanova.[9]

I mimo jazykovědu je známo, jaké nebezpečí přináší užívání statistických metod zejména při zkoumání společenských jevů, kde je vždy důležitá i kvalita, nejen kvantita studovaných jevů a kde pro složitost problematiky pravidla matematické statistiky často (při nestejnorodosti počítaných fakt) nevystihují skutečnost s potřebnou přesností. V diskusích sovětských statistiků před několika lety bylo z toho vyvozeno, že statistický rozbor je třeba vždy spojovat s rozborem podstaty studovaných jevů.[10]

Plnou lingvistickou hodnotu mohou mít jen ty výpočty, u kterých je zaručeno, že za základ byla vzata fakta lingvisticky správně určená a roztříděná. Dovedeme-li tomuto nebezpečí čelit, pak není třeba matematické metody v jazykovědě odmítat; nelze přece tvrdit, že při zkoumání jazyka se obejdeme bez počítání, že tu nejsou stejnorodá fakta, vhodná pro statistické zpracování. Je známo, že zjištění kvantitativních vztahů má svůj význam pro zkoumání hierarchie jazykového systému (ačkoli tu není jediným, rozhodujícím měřítkem) a má tedy heuristickou hodnotu, že je také důležité pro vyučování cizím jazykům atd.[11]

Metody kvantitativní lingvistiky se různým způsobem uplatňují i při zkoumání otázek historické jazykovědy, ať už jde o zjišťování chronologie textů, stupně příbuznosti jazyků, nebo o jiné problémy. Ani zde ovšem matematická přesnost výpočtu nezaručuje oprávněnost takových závěrů, ke kterým se došlo na základě nepřesných nebo nejistých předpokladů.

Tak např. při zjišťování relativní chronologie starých památek se už odedávna sahalo — z matematického hlediska ovšem často jen laicky — i k počítání různých (hláskoslovných, tvaroslovných, lexikálních, metrických, popř. i jiných) archaických rysů a novot. Při zkoumání stáří jednotlivých částí Rgvédu použil této metody s úspěchem zejména anglický indolog E. V. Arnold;[12] u nás se snažil v dané otázce postoupit dál P. Poucha.[13] Velký počet archaismů svědčí jistě dost bezpečně o poměrně velkém stáří daného zpěvu, velký počet archaických zpěvů v té či oné knize Rgvédu může být měřítkem pro její celkové chronologické zařazení. Ale nelze se domnívat, že bychom touto cestou bezpečně zjistili nejstarší či nejmladší zpěv Rgvédu ap. Předpoklady o tom, co považovat za archaismus, jsou často nejasné, a archaismů se ostatně užívá ještě dlouho po zavedení novotvarů, takže přesné měřítko tu nemáme. Tím, že takové výsledky nepovažujeme za přesné, nepopíráme ovšem jejich význam pro jazykovědu; vždyť jiné metody řešení těchto otázek mají obvykle přesnosti daleko méně.

Při zjišťování stupně příbuznosti jazyků užíval statistických metod už ve dvacátých letech polský antropolog a etnograf J. Czekanowski,[14] kterého pak následovali někteří badatelé [47]američtí.[15] Dnes je v USA rozšířena metoda tzv. lexikální statistiky (glottochronologie), propracovaná v posledních několika letech hlavně M. Swadeshem a R. B. Leesem. Pracuje se tu se seznamem vybraných základních slov, která v daném jazyce označují nejběžnější předměty a vztahy (jako ruka, dát, velký), a mění se tedy jen velmi pomalu, jsou jen v minimální míře zasahována působením kulturního vývoje a vlivem sousedních jazyků.[16] Srovnáním těchto základních slov ve dvou jazycích (nebo i ve dvou různých vývojových obdobích téhož jazyka, ve dvou nářečích ap.) se zjišťuje procento slov (z daného seznamu), jejichž podobnost umožňuje předpokládat týž původ daného slova v obou jazycích. Podle toho, kolik slov se v příbuzných jazycích už neshoduje, usuzuje se pak na relativní časový odstup od doby, kdy se jazyky rozdělily.

Této metody se užívá především při třídění amerických jazyků, jejichž památky nesahají daleko do minulosti. Pro studium jazyků už dříve dobře prozkoumaných historickosrovnávací metodou nepřináší glottochronologie nějaké zpřesnění. Spíš naopak, obdobných výpočtů založených zejména na vývoji indoevropských jazyků užívají američtí lingvisté pro zpřesnění svého statistického postupu.[17] Tento postup neumožňuje spolehlivou absolutní chronologii, a ani jinak nejsou jeho výsledky plně uspokojivé.[18] Pro klasifikaci těch jazyků, které nejsou zpracovány historickosrovnávací metodou, je však glottochronologie jistě přínosem, i když posuzuje vývoj jazyků jen podle jedné složky (vybraných základních slov) a ani uvnitř této složky nemůže důsledně přihlížet k rozmanitosti činitelů jazykového vývoje.

Na možnost matematického zpracování typologie jazyků ukazuje J. H. Greenberg,[19] a to na základě typologie Sapirovy.[20] Jde mu hlavně o lingvistický rozbor otázky, její matematické zpracování spíš jen naznačuje. Pro každý jazyk braný v úvahu vypočítává Greenberg deset indexů (jako např. poměr počtu morfémů k počtu slov v textu). Takový postup je jistě vhodnější než starší chápání typologie jako klasifikace celých jazyků, kde se nebrala v úvahu existence prvků různých typů v témž jazyce. Ale shrnutí různých fakt do jednoho indexu má své nevýhody ve srovnání s lingvistickým rozborem typologického složení jazyka, při kterém se rozbírají otázky vzájemné souvislosti rysů, tedy zejména ve srovnání s postupem známým u nás z prací Skaličkových.[21]

Proti přeceňování statistických metod namítají někdy jazykovědci oprávněně, že výskyt určitého jevu v textu nebo v systému jazyka sám o sobě není rozhodující, nýbrž že je jen jedním z projevů hierarchie uvnitř jazykového systému (ve spojení s jinými činiteli). Z tohoto hlediska je pak třeba výše hodnotit ty práce, které statistické zkoumání spojují s uplatněním logického kalkulu a podobných postupů, úzce spojených s metodami teorie množin. I tyto metody se uplatňují zatím snad nejrozsáhleji v oblasti hláskosloví. O popis fonologie japonštiny s použitím metod a výsledků teorie relací se snaží američtí badatelé F. Harrary a H. H. Pa[48]per;[22] stručněji nadhazuje některé podobné otázky (o pravděpodobnosti výskytu fonémů v dané pozici) sovětských fonetik L. R. Zinder.[23] Frekvenci různých souhláskových skupin zkoumá poněkud jinou metodou S. Saporta a dospívá k závěru, že nejčastější jsou spojení takových souhlásek, mezi nimiž není rozdíl ani maximální ani minimální (tedy skupiny jako sk, pt).[24]

Systém gramatických kategorií zkoumá na základě teorie množin O. S. Kulagina.[25] Také při zpracovávání obecných otázek jazykového znaku používají různých podobných metod někteří jazykovědci američtí i západoevropští.[26]

Některé jiné příbuzné otázky jsou řešeny hlavně v souvislosti s prací na strojovém překladu. Vlastní problematiku strojového překladu zde probírat nechceme; nelze však mlčky přejít důležitost těchto otázek pro jazykovědu, která zde nachází nové široké pole uplatnění v praxi. Nejzávažnější pro teoretickou lingvistiku není samo praktické použití strojového překladu, nýbrž požadavky, které toto nové odvětví na teorii klade, a podněty, které odtud vyplývají. Omezenost praktických možností strojového překladu, na kterou už u nás bylo upozorněno,[27] je nesporná. Na automatické překládání umělecké literatury sotva kdo z odborníků vážně pomýšlí. Nepůjde tu o nahrazování tvůrčí umělecké práce strojem, spíš naopak bude možno užívat strojů pro mechanické úkony, kterými člověk nemusí být zatěžován. Ale rozhodující je dnes právě to, že předpoklady pro strojový překlad musí být připraveny prací lingvistů. Jazykověda tím bude postupně přivedena k zpřesnění svých měřítek, k podrobnému a pronikavému zpracování úseků zatím ne zcela zvládnutých (utřídění syntaktických vazeb, slovních významů aj.), které by umožnilo formulovat jednoznačná pravidla všude tam, kde to jazyková skutečnost připouští. Dnes se tu teprve začínají rýsovat nové úkoly a oblasti zájmu, jejichž význam jistě poroste; tak např. zpracování problematiky tzv. převodního jazyka, tj. umělého systému vztahů, který má sloužit jako mezistupeň při překladech z kteréhokoli a do kteréhokoli jazyka, bude jistě mít velkou důležitost pro další rozvoj tzy. analytického srovnávání (porovnávání) jazyků, pro srovnávání jejich syntaktického i lexikálního bohatství, pro obecnou teorii mluvnice. Sám fakt, že začínáme mít k dispozici stroje, do kterých je možno „uložit“ jazykový systém, otvírá, jak se domníváme, nové perspektivy i v otázce možnosti pokusů v jazykovědě. A teorie strojového překladu je mj. také přínosem pro teorii překladu vůbec.[28]

Pro strojový překlad je třeba předem vypracovat síť instrukcí gramatického rozboru, které by umožnily podle psané podoby jednotlivých slov a podle jejich postavení v kontextu jednoznačně rozebrat různě stavěné věty jazyka, z něhož se překládá, a sestavit jim odpovídající věty v druhém jazyce. Při překladu z jazyka s chudou morfologií, kde je úloha slova ve větě často vyznačena [49]jen jeho postavením vůči jiným slovům, je to věc značně obtížná. Teoretické zpracování syntaxe z tohoto hlediska je zatím jen v počátcích, ať už máme na mysli tzv. operational syntax, kterou vypracovává Y. Bar-Hillel,[29] nebo jiné práce, opírající se o matematickou teorii Markovových řetězů.[30] O obecné matematické vymezení syntaktického systému, kde by byly zahrnuty všechny možnosti kombinace morfémů, se snaží F. W. Harwood.[31]

Kromě uvedených prací z oblasti hláskosloví, slovní zásoby a skladby je třeba upozornit i na jednotlivé stati, v nichž jsou matematické metody uplatňovány při rozboru jiných složek jazyka. Pro morfologii má např. význam článek Z. S. Harrise,[32] v němž autor počítá fonémy, které se mohou vyskytovat v pozici za daným fonémem (za danou řadou fonémů) v textu. Vrcholy takto získané křivky ukazují dosti přesné hranice výpovědi, slova a morfému. Jako příklad matematického zpracování sémantických otázek můžeme uvést práci R. Wellse,[33] který s pomocí faktorové analýzy vztahů mezi významy slov ukazuje možnost určité klasifikace slovních významů.

Metody, o kterých jsme dosud mluvili, umožňují jednak pracovat souhrnně s velkým množstvím jazykových jevů, zachycených statisticky, a jednak usnadňují větší zobecňování vědeckých postupů jednoduchým logickým zachycením, povzbuzujícím k vyšší abstrakci. Tyto metody ovšem předpokládají důsledné lingvistické zpracování jevů, na jejichž studium mají být uplatněny, a samy přímo nemění nijak podstatně základní jazykovědné pojmy.

Ještě hlubší zásah do jazykovědy očekávají někteří vědci od nového odvětví matematiky — teorie informace.

Problematiku teorie informace a její základní pojmy probírá v tomto čísle Slova a slovesnosti stať J. Krámského. Můžeme se tedy v tomto ohledu omezit jen na konstatování, že termín „informace“ zde nelze chápat v jeho obvyklém smyslu; někteří odborníci rozlišují několik různých pojmů informace; tak S. Goldman[34] mluví o „sémantické informaci“ (tj. informaci v obvyklém smyslu slova) a „jazykové informaci“ (kterou jedině lze měřit metodami teorie informace; ta totiž nepočítá se smyslem výpovědi, který není ergodický,[35] nýbrž jen s vlastnostmi kódu, v kterém je daná zpráva sestavena, a s délkou zprávy). P. Neidhardt[36] rozeznává 1. „informaci sémantickou“ (absolutní množství nově získaných vědomostí), 2. „strukturní“ (relativní množství nových vědomostí určitého příjemce zprávy), 3. „idealizovanou“ (množství nových vědomostí podle určitého pravidla výběru, např. při uměleckém stanovisku) a 4. „selektivní“, při které nejde o pravdivost zprávy, o její význam pro příjemce ani o estetickou hodnotu, nýbrž jen o sestavení znaků určitého kódu. Z těchto čtyř pojmů pracuje vlastní teorie informace, jak uvádí P. Neidhardt, jen s posledním. Selektivní informace je veličina, která udává stupeň volnosti výběru pro sestavení dané zprávy, nejde tu tedy přímo o měření obsahu zprávy. A. A. Charkevič připomíná,[37] že termín „informace“ tu označuje spíše informaci, kterou by zpráva mohla obsahovat, než tu, kterou skutečně obsahuje.

Autoři základních prací z teorie informace se většinou jen dost stručně zmiňují o možnosti uplatnit její výsledky i na zkoumání přirozených jazyků. Často přitom zůstávají jen u rozboru vzta[50]hů mezi písmeny toho kterého jazyka.[38] Z jazykovědců se podrobněji zabývá významem teorie informace H. A. Gleason ve svém úvodu do deskriptivní lingvistiky,[39] kde rozbírá zejména otázky tzv. nadbytečnosti (redundancy). Nadbytečnost je rozdíl mezi teoretickou kapacitou daného kódu (vypočtenou za předpokladu, že se všechny jednotky kódu mohou ve zprávách kombinovat bez jakéhokoli omezení, tj. že je využito všech možností seskupení znaků či jejich složek) a mezi průměrným množstvím informace obsažené ve zprávách skutečných. Ve většině kódů jsou různá omezení, různé nepřípustné kombinace jednotlivých složek (např. v Morseově abecedě nemůže následovat několik mezer za sebou; v přirozených jazycích jsou různá taková omezení poměrně velmi četná). Gleason ukazuje (s. 275n.) na některé hlavní prameny nadbytečnosti v mluvené angličtině, jako jsou: různost frekvence fonémů, omezení skupin fonémů, neexistence víc než poloviny morfémů, které by (z hlediska fonologického složení) existovat mohly, různost frekvence morfémů, omezení řad morfémů, sémantická omezení (větší nebo menší pravděpodobnost obsahu výpovědi).[40] Nadbytečnost jazyka sice snižuje jeho teoretickou efektivnost jakožto „kódu“, ale je nutně spojena s jeho strukturou a má velký význam pro srozumitelnost řeči za ztížených podmínek při přenosu, při hluku ap.

Jako nové odvětví jazykovědy vznikla v USA tzv. psycholingvistika, která spojuje lingvistiku s teorií informace a s psychologickou teorií učení.[41] Její příslušníci zpracovávají z nového hlediska otázky jednotek, jazykového systému i jazykových změn, osvojování mateřského i cizího jazyka aj. Zatím je těžké odhadovat, jaký význam pro jazykovědu bude mít tato nová metoda; nesporné však je, že spolupráce jazykovědců s psychology, matematiky a inženýry spojovací techniky má velký význam pro další rozvoj jazykovědy. Vždyť otázky, o které tu jde, je třeba osvětlovat co nejšíře z různých stránek; jejich omezování na problematiku tzv. čisté lingvistiky je dnes už překonáno.[42]

O soubornou aplikaci matematických metod — statistiky i teorie informace — na jazykovědné otázky se jako první pokusil anglický vědec G. Herdan v knize Language as Choice and Chance (Groningen, 1956). Autor zde určitým způsobem shrnuje i výsledky dosavadních dílčích prací; neklade si úkoly malé: chce matematickým zpracováním „učinit z lingvistiky vědu“ a ukázat, že tu jsou základnější vztahy statistické (dané náhodou, chance) než příčinné (dané podle něho „výběrem“, choice). Zastavme se tedy u problémů jeho práce.

Při zkoumání stylu jednotlivce v I. oddílu knihy jsou brány za základ číselné vztahy výskytu slov v řeči toho kterého autora; hledá se tu charakteristická veličina, která by byla nezávislá na délce zkoumaného textu (k tomu totiž nestačí základní statistický propočet, založený na tom, kolik slov se v daném textu kolikrát vyskytuje). Autor tu zdokonaluje starší metodu Yulovu, o které jsme se už zmínili, a zpřesňuje jeho formuli. Nemůžeme tu ovšem hodnotit jeho výsledek po stránce matematické. Všimněme si však, že to, co zde Herdan bere za základ výpočtu jakožto věc závislou na výběru ze strany mluvčího (totiž počty slov s různou frekvencí), chápe se v II. oddílu knihy jako věc náhody. Tam se totiž zkoumá norma jazyka a příslušnost [51]mluvčích k téže jazykové normě se matematicky chápe tak, že jejich různosti nepřesahují meze náhodných odchylek. To právě ukazuje, že náhoda a „výběr“ nejsou protichůdnými, navzájem se vylučujícími atributy různých jevů, nýbrž jen různými aspekty: každá věc má své příčiny, z jednoho hlediska se projevuje jako nutná, z jiného jako náhodná. Touto stránkou věci se však autor nezabývá a v daném případě nechává konec konců nerozhodnuto, zda jeho veličina vm je charakteristická pro jednotlivce (jak bychom měli předpokládat podle I. oddílu), nebo pro daný jazyk (jak se říká na s. 100 a 110).

V II. oddílu autor dovozuje, že prvek náhody je v jazyce rozhodující, že právě na něm je založena např. stálost výskytu fonémů (viz s. 66n. — nejde mu ovšem o básnické texty), dále stálost výskytu mluvnických tvarů a spojení, a hlavně stálost vztahu mezi délkou slova a jeho výskytem (to jsou podle Herdana, podobně jako podle jiných statistiků jazyka, veličiny nepřímo úměrné, což ovšem zdaleka neplatí přesně). Jazykový systém (langue) není podle něho jen souborem jazykových prvků, nýbrž obsahuje i pravděpodobnost výskytu (s. 79). Domníváme se, že tato teze není úplně nová, vždyť jazykovědci nikdy nepředpokládali, že různé gramatické a lexikální prvky jsou na jedné rovině, a frekvence je i zde spojena — i když ne přímočaře — s hierarchií uvnitř jazykového systému. Matematická formulace tohoto faktu je rozhodně velmi důležitá a v dalším zpracování může přinést nové výsledky. Pravděpodobnost výskytu je tu však poněkud neorganicky kladena jako třetí základní vztah vedle Saussurových vztahů syntagmatického a asociačního. Pravděpodobnost výskytu jazykových jednotek přece není pouze záležitostí „langue“, nýbrž především vztahu mezi „langue“ a „parole“ (chápeme-li je jako jazykový systém a jako jeho „užívání“ při tvoření a přijímání promluv). Herdanovo pojetí tak ve svých důsledcích, jak se domnívám, znovu pomáhá ukázat, že „parole“ není jev pouze individuální (proti kolektivnímu jazykovému systému), jak vykládal F. de Saussure.[43]

Při výkladech o teorii informace a jejím uplatnění na jazykovědné problémy ve III. oddílu zdůrazňuje G. Herdan na několika místech, že členění jazykového systému na binární vztahy je nejen výhodné pro různé pracovní postupy, nýbrž že je pro jazykový systém základní; rozhodující argumenty tu však podány nejsou. Dále hledá autor v řeči vlastnosti, které by dovolily považovat ji za ergodický proces, zpracovatelný metodami teorie informace; to souvisí s otázkami náhody jako stabilizujícího činitele v jazyce, probranými v oddílu II. K tomu je třeba říci, že tyto vlastnosti jazyk jistě má, pokud jde o ty jeho stránky, na které není zaměřena pozornost mluvčího a posluchače (tedy např. — mimo umělecké projevy a některé zvláštní případy — výskyt fonémů a jejich kombinací, výskyt slov různé délky); pokud však jde o významovou stránku řeči, často se upozorňuje na to, že zde nelze metod teorie informace přímočaře používat.[44] Smyslová stránka výpovědi totiž není ergodická, stejně jako není ergodická ani vyjadřovaná skutečnost, neboť zde jsou jednotlivá fakta na sobě navzájem závislá; naproti tomu třeba výskyt fonémů v běžné řeči je sice také omezen fonémy sousedními nebo blízkými, ale nikoli už fonémy vzdálenějšími, takže zvukovou stránku řeči lze zpracovávat bezprostředně, dá se tu počítat s náhodným výskytem a jeho zákonitostmi. Pracuje se tedy matematicky s údaji o jazyce, ale ne s údaji o skutečnosti, se smyslem výpovědi (s informací „jazykovou“, ne „sémantickou“ v Goldmanově terminologii). To je právě jedna ze základních obtíží, která působí mnoho nedorozumění při uplatnění teorie informace v jazykovědě. — G. Herdan se těmito problémy vcelku nezabývá, neurčuje dost jasně meze použitelnosti teorie informace. Slibuje, že dokáže možnost zpracování slovních významů, což však v plné míře nečiní.[45]

Čtvrtý oddíl knihy obsahuje několik různých úvah o otázkách duality v jazyce (probírají [52]se tu vztahy systému a výskytu, označujícího a označovaného, gramatiky a slovní zásoby, mluveného a psaného jazyka ap.).

Na několika místech knihy upozorňuje G. Herdan — podobně jako to dělávají jiní matematikové — na přesnost matematických výpočtů, která má nyní nahradit intuitivní odhadování dříve u lingvistů obvyklé. Toto stanovisko je zčásti oprávněno; ale je zde nebezpečí, že při matematickém postupu ztratíme ze zřetele jemné rozdíly, které si lingvisté dobře uvědomují, ale které není snadné vyjádřit matematicky (tak např. už pro slovníkovou statistiku je velmi obtížné určit správná měřítka pro zachycování pomocných slov ap.). Matematické výsledky, i když jsou přesně vypočítány, ztrácejí svou hodnověrnost, vycházejí-li z nepřesných údajů a zastírají-li pak důležité rozdíly mezi počítanými jevy. A některé Herdanovy závěry jsou právě z těchto a podobných příčin značně nespolehlivé. Tak např. několikrát výslovně připomíná nepřesnost svých výchozích dat, ale výsledek výpočtu přesto považuje za plně směrodatný; nebo při argumentaci upozorňuje na to, že se zabývá jen jedním aspektem dané otázky, ale při shrnutí už proklamuje obecnou platnost svých výsledků. Tak zejména při porovnávání jazykových systémů co do efektivnosti (efficiency) uznává na s. 190, že se jeho vývody týkají jen vztahu délky a frekvence slov (jde tu o jasnost gradace výskytu různoslabičných slov), ale o pouhých pět řádků níže formuluje závěr zcela obecný, podle něhož prý různé jazyky představují různé stupně efektivnosti kódování; angličtina, kde výskyt slov jednoslabičných, dvojslabičných atd. je odstupňován v jasné klesající řadě, má podle něho větší efektivnost než němčina, a za tou teprve přichází ruština s nevelkým rozdílem mezi výskytem slov jednoslabičných a dvojslabičných.

Ostatně není zcela jasné, zda tu Herdan při srovnávání angličtiny, ruštiny a němčiny bere v úvahu všechna slova, i pomocná, což by poskytovalo zkreslený obraz, neboť anglická pomocná slova odpovídají svou funkcí velmi často ruským koncovkám, a nelze pak vyvozovat větší efektivnost angličtiny z toho, že má (v souvislém textu) daleko více slov jednoslabičných, kdežto v ruštině je výskyt obou skupin zhruba stejný. To ukazuje, jak důležité je před matematickým zpracováním provést důsledný rozbor lingvistický, v tomto případě zejména typologický. Autor se v tom ohledu přidržuje Jespersenových teorií o tendenci k analytičnosti (kterou ostatně formuluje naprosto nepřesně jako tendenci „k izolaci slabik v nezávislá slova“, s. 187) a neuvědomuje si, že při působení takové tendence po dobu mnoha tisíc let by — při vývoji jinak ovládaném náhodností — všechny jazyky už byly plně analytické, kdyby protichůdné faktory nebyly stejně silné, a tedy stejně nutné, jako tato analyzující tendence.[46]

G. Herdan tu nechává stranou jiná možná měřítka, která by bylo třeba hledat a zpracovat. Uvádíme jen namátkou některé takové možnosti: Je např. známkou výkonnosti kódu, že pro sdělení v něm formulované stačí řada o menším počtu znaků (resp. jejich složek) než v kódech jiných; je tedy možno srovnávat délku smyslově shodné výpovědi v různých jazycích; toto měřítko sice G. Herdan uvádí (s. 181), ale domnívá se, že angličtina i v té věci předčí jiné jazyky, protože má mnoho krátkých slov. Takovéto úvahy však přehlížejí tu skutečnost, že angličtina často užívá pomocných slov tam, kde některé jiné jazyky vystačí s tvarem slova základního.[47] Obecně je třeba předpokládat, že flexivní jazyky, které často hromadí několik významů v jednom morfému a mají málo pomocných slov, jsou stručnější než jazyky jiné. Dále by bylo třeba vzít v úvahu úspornost a nadbytečnost syntaktických kombinací v různých jazycích, rozdíl značkových a popisných pojmenování (v tomto bodě uznává přece i O. Jespersen nevýhody angličtiny),[48] a konečně problém homonymie: u výkonného kódu se jistě předpokládá, že týž znak [53]má (v témž kontextu) jen jeden význam. Homonymie je na překážku efektivnosti, a s tím je třeba se vyrovnat, považujeme-li tendenci k analytičnosti a jednoslabičnosti za rozhodující pro zdokonalování jazyků; vždyť při zkracování slov na jednu slabiku nutně vzrůstá počet homonym.

Jazykověda skutečně potřebuje matematické zpracování takových i jiných otázek. Ale tím, že se z jednoho výpočtu — i když velmi rozsáhlého — budou dělat ukvapené obecné závěry, může být úloha matematiky jen zdiskreditována. Máme-li dosáhnout přesnosti uvnitř vlastního oboru, pak je třeba respektovati potřebu přesnosti v oborech jiných a nelze se spokojovat s pouhými dohady a nepřesnostmi, kdykoli se dostaneme za hranice svého úseku. G. Herdan vytýká marxismu (jeho pojetí marxistické dialektiky, podané stručně na s. 291n. a soustředěné na Hegelovy triády, je ostatně velmi naivní), že nedodržuje zásadu imanentního zkoumání jednotlivých oborů a přenáší prý dualitu z jazyka neoprávněně i na fyzický svět. Sám ovšem požadavku imanentního zkoumání také vyhovět nemůže, nedrží se ani „čisté matematiky“ ani lingvistiky a pouští se tu a tam i do historie. Tak např. příčinu „úpadku němčiny“ ve vývoji „od Goetha po Hitlera“ vidí v tom, že tu byla porušena „dualita langue a parole“ (s. 292n.); historickou příčinu těchto změn hledá „v chybách intelektu a charakteru národa“. Tak končí „přesná metoda“ matematika, když opustí svůj obor. Ale jiné obory přece potřebují od matematiky právě zpřesnění svých výsledků, nikoli přesnou matematickou podporu takových mlhavých a vědou ostatně dávno vyvrácených dohadů.

G. Herdan se snaží ukázat, jak už bylo řečeno, důležitost nahodilosti a statistických zákonů v jazyce proti staršímu pojetí tradiční lingvistiky, která zdůrazňovala více „výběr“ s jeho příčinami a na tomto základě vyhledávala kauzální zákonitosti. Kladným aspektem tohoto pojetí je, jak se domníváme, jeho zaměření proti výkladům subjektivistickým, které přeceňují vliv jednotlivce na vývoj jazyka. Vezmeme-li však v úvahu známou marxistickou tezi, podle které se právě v řadě náhod projevuje nutnost a zákonitost,[49] vidíme právě v náhodných procesech možnost vyhledávání zákonitostí kauzálních. Zákonitosti statistické jsou tu pak jistě potřebnou pomocí, ale nemáme proč zůstávat jen u nich. Vždyť ostatně G. Herdan sám — ačkoli to neodpovídá jeho pojetí, ani možnostem jeho metody — na mnoha místech mimoděk (přímo či mezi řádky) klade otázku po příčinách těch nebo oněch statistických vztahů zjištěných výpočtem (srov. např. s. 107n. o vztazích v jazykové normě, s. 185 o „příčině“ toho, že délky slov u Turgeněva jsou rozděleny podobně jako v němčině — prý snad proto, že Turgeněv byl víc než jiní ruští spisovatelé ovlivněn západními literaturami(!); i při zjišťování vlivu nacismu na vývoj němčiny hledá Herdan, jak už bylo uvedeno, za zjištěnými statistickými vztahy konec konců historické příčiny.

Pro jazykový vývoj je důležitý „kolektivní výběr“, který je z hlediska jednotlivců a jejich vůle náhodný, právě proto, že je výslednicí mnoha jednotlivých výběrů individuálních (ani tento individuální výběr obvykle není plně vědomý). Proto také vývoj jazyka nepostupuje k předem vytčenému cíli, není zaměřen teleologicky.[50] Z tohoto hlediska je tedy možno Herdanovo zdůraznění náhodných prvků v jazyce vítat, — ale ne jako pepření kauzální zákonitosti.

Z našeho pohledu na Herdanovu knihu je tedy možno učinit závěr, že matematické metody jsou pro jazykovědu potřebným nástrojem, kterého však ještě neumíme dost dobře užívat. Je snad zbytečné zdůrazňovat, že právě na jazykovědce čeká úkol zvládnout tento nástroj a přistoupit k co nejtěsnější spolupráci s matematiky. Nelze čekat, že by matematikové sami, bez takové spolupráce, mohli bez mnoha zbytečných omylů zvládnout složité otázky základních vztahů mezi jazykovými jevy. G. Herdan přináší pro matematické zpracování jazyka mnoho dobrých podnětů, a nebylo by správné prostě jeho knihu odmítat proto, že autor v tomto prvním souborném zpracování daných otázek nedovedl takové podněty uplatnit důsledně.

[54]Domníváme se, že jedna z příčin nejasností v dosavadním uplatňování teorie informace (a teorie komunikace) na jazyk je také v tom, že jazyk se tu často považuje prostě za jeden z kódů, klade se na stejnou úroveň např. s Morseovou abecedou, s dálnopisným systémem, s algebraickými znaky ap.[51] Přehlíží se přitom, že jazyk (máme tu na mysli tzv. přirozený jazyk, ne různé jazyky umělé, logické, symbolické aj.) je přímo spojen s myšlením i s jinými stránkami duševní činnosti. Můžeme se v případě potřeby vyjadřovat (a snad i myslet) v různých kódech, ale jazyk (mateřský) je právě ten dorozumívací prostředek, v kterém nejen jsme zvyklí mluvit a myslet, ale v kterém se naše myšlení vytvářelo. Do různých kódů se zprávy příležitostně převádějí podle potřeb dané situace (jednotlivé kódy mají v určitých směrech výhody ve srovnání s jazykem — zprávy v nich mohou být lépe předávány na dálku nebo uchovávány natrvalo, mohou být utajeny atd.; pod pojem kódu se ovšem mohou zahrnovat i sdělovací prostředky, které se netýkají jen dorozumívání člověka s člověkem). Jazyk je však pro naše myšlení něčím základnějším. Proto také překlad z jednoho jazyka do druhého není totéž, co dešifrování kódu.[52]

Kromě toho se při tomto pojetí často nepřihlíží k rozdílu, který bychom mohli nazvat rozdílem mezi kódy primárními a sekundárními. Sekundární kódy (telegrafický, dálnopisný, hláskové písmo aj.) jsou podstatně závislé na jazyce, jejich různé znaky nebo skupiny znaků označují jednotlivé jazykové prvky (fonémy, slova).[53] Primární kódy neodpovídají jazyku tak přímo (jde tu např. o obrázkové písmo, systém světel na křižovatkách nebo jiných podobných značek, „jazyk květin“ ap.), ačkoli bývají také často jazyku podřazeny, (jejich prvky vystupují jako symboly slovních významů).

Ve spojové technice jde — alespoň zpravidla — o kódy, které jsme tu označili jako sekundární. Při různých výpočtech, ať už jsou důležité pro dešifrování nebo pro měření efektivnosti kódů (příp. s pomocí pojmů entropie a nadbytečnosti), jde o vztah takových systémů znaků k těm základnějším systémům, na kterých jsou založeny. Efektivnost telegrafického kódu se dá měřit podle jeho vztahu k jazyku, v kterém se telegrafuje (přesněji: k psané podobě toho jazyka).[54]

Má-li mít užití pojmů teorie informace význam pro jazykovědu vcelku, nejen pro její jednotlivé složky, je třeba přihlížet tu ke vztahu mezi zvukovou a významovou stránkou jazyka. Entropie a efektivnost jazykového systému by se pak neměřily jen vlastnostmi jeho fonémů a písmen, nýbrž by tu přicházely v úvahu některé jiné otázky, jako srovnání různých možných způsobů zvukového (nebo i písemného) vyjádření téhož systému gramatických kategorií (nebo gramatických významů, sémat, funkčních morfologických jednotek); nebo z druhé strany srovnání různých systémů gramatických kategorií ve vztahu k vyjadřované skutečnosti a k myšlení; vždyť každá gramatická kategorie sama o sobě je složitou skutečností, za různých okolností plní mnoho různých funkcí, jednotlivé jazyky se v tom neshodují, a než se vyjádříme o jejich sdělovací hodnotě, měli bychom i tyto vztahy vzít v úvahu.

Při zkoumání efektivnosti různých jazyků jakožto sdělovacích prostředků je v každém případě [55]předem pravděpodobné, že nebude možno sestavit jazyky do jedné řady — od nedokonalých k nejvyspělejším —, neboť ve svém mnohatisíciletém vývoji prošly působením nejrůznějších činitelů, změnily se velmi podstatně a jsou dlouhým užíváním uzpůsobeny k plnění svých úkolů. Spíš je třeba očekávat, že se různá měřítka efektivnosti jazyků (viz o některých z nich zde na s. 52) navzájem kříží, že každý jazyk má své přednosti i nevýhody.

Závěrem můžeme říci, že matematické metody přinášejí do jazykovědné práce nejen zpřesnění, nýbrž i mnoho nových podnětů. Přispívají ke spojení naší vědy s mnoha jinými obory a tím ji obohacují o nová hlediska. Ale bez těsného spojení s dosavadními metodami jazykovědy vedlo by matematické zpracování jazyka často k nežádoucímu zkreslování. Tím naléhavěji je proto zapotřebí, aby jazykovědci sami ve spolupráci s matematiky zvládli nové metody a dali jejich uplatnění správný směr.


[*] Redakce úmyslně zařadila do tohoto čísla dvě stati z oboru matematických metod v lingvistice, širší a zčásti teoretický příspěvek P. Sgalla a speciálnější a více popisný příspěvek J. Krámského o tzv. teorii informace, vysvětlující některé základní pojmy.

[1] Harvardská universita pořádá už po několik let stálé kursy matematické lingvistiky (srov. J. Whatmough, Reports for the Eighth Intern. Congress of Linguists I, Oslo 1957, s. 211). Na movskevské universitě bude tento studijní obor zaveden od letošního roku; již od r. 1956 tu existuje seminář, jehož účastníci uplatňují v jazykovědě matematické metody na základě prací A. N. Kolmogorova a A. A. Ljapunova (viz V. J. Rozencvejg, Raboty po maš. perevodu …, Moskva 1958, s. 9 — referát pro IV. mezinár. sjezd slavistů).

[2] B. Trnka, A Tentative Bibliography, Utrecht 1950; Pokus o vědeckou teorii a praktickou reformu těsnopisu (Sbírka pojednání a rozprav filos. fakulty 20), Praha 1937; A Phonological Analysis of Present Day Standard English, Práce z vědeckých ústavů 37, Praha 1935; K výstavbě fonologické statistiky, SaS 11, 1948, s. 59—64. — Druhou, obsáhlejší bibliografii kvantitativní lingvistiky sestavil P. Guiraud (Bibliographie critique de la statistique linguistique, Utrecht 1954).

[3] V Slově a slovesnosti se o Zipfových metodách kriticky vyslovil už N. S. Trubeckoj (2, 1936, s. 252n.), později B. Trnka ve výše uvedené stati; můžeme zde tedy Zipfovy práce, které ovšem mají velkou hodnotu jako průkopnický čin, nechat stranou. Zipfovy výsledky zpřesňuje nejnověji A. Kotsoudas v stati, kde vypočítává, jak velkého slovníku je zapotřebí pro text určité délky (Language 33, 1957, č. 4, s. 545—552).

[4] Viz např. V. Mathesius, Čeština a obecný jazykozpyt, Praha 1947 (s. 48n. o využití jednotlivých fonémů; s. 62n. o kvantitativních vztazích souhlásek a samohlásek ap.; s. 87n. o vztahu mezi vzácností a expresivitou fonémů); J. Vachek se zabývá i významem frekvence fonémů pro historickou fonologii (nejnověji v Zeitschrift f. Angl. u. Amerikanistik 1, 1957, s. 5—28); důležité příspěvky k uplatnění matematických metod v jiné oblasti jsou obsaženy v jeho skriptech Jazykovědná problematika zkoušek srozumitelnosti řeči, Praha 1956. Na práci B. Trnky navazuje J. Krámský, On the Quantitative Phonemic Analysis of English Mono- and Dissylables, Philologica 8, 1956, s. 45—59 aj.

[5] Už v polovině minulého století ukazoval E. Förstermann v několika statích, na které mě laskavě upozornil prof. Trnka, že statistické údaje o výskytu hlásek pomáhají poznat vzájemný vztah příbuzných jazyků (viz zejm. Kuhns Zeitschrift, sv. 1, 1852, s. 163n. a sv. 2, s. 35n.).

[6] O problematice frekvenčních slovníků se u nás v poslední době několikrát psalo, viz zejm. M. Vey, Apropos de la statistique du vocabulaire tchèque, Slavia 27, 1958, s. 396—409; V. Fried, Sémantická frekvence anglických slov a některé možnosti jejího využití, ČMF 37, 1955, s. 129—142 a O numerickém určování slovní zásoby. Cizí jazyky ve škole 1, 1957, č. 4, s. 145n.

[7] G. U. Yule, The Statistical Study of Literary Vocabulary, Cambridge 1944.

[8] Ruský překlad této stati je obsažen ve sborníku Teorija peredači soobščenij, Moskva 1957, s. 221—247 (jde o překlad sborníku shrnujícího referáty na mezinárodní konferenci o teorii informace v Londýně v září 1955).

[9] Doklady AN SSSR 55, 1947, č. 2, s. 103—106.

[10] Ve shodě s tím je i nynější stanovisko sovětských jazykovědců, zdůrazňující nutnost rozboru jazykové struktury a přesného určení jednotek, které mají být statisticky zpracovávány (viz zprávu V. A. Uspenského z konference o statistice řeči, Voprosy jazykozn. 1958, č. 1, s. 170—173, zejm. 172, z referátu I. I. Revzina).

[11] K tomu srov. jednak výše uvedené stati Trnkovy, jednak příspěvek V. Frieda v ČMF 33, 1950, s. 157—162.

[12] E. V. Arnold, Vedic Metre in its Historical Development, Cambridge 1905; německý badatel W. Wüst se ve své pozdější práci o této otázce (Stilgeschichte und Chronologie des Rgveda, Abh. f. die Kunde des Morgenlandes 17, č. 4, Lipsko 1928) soustředil převážně na lexikální měřítka, která však jsou méně spolehlivá.

[13] P. Poucha, Schichtung des Rgveda, Archiv orientální 13, 1942, s. 103—141 a 225 až 269; AO 15, 1944, s. 65—86.

[14] Statistiku hláskoslovných a tvaroslovných jevů důležitých z hlediska srovnávacího jazykozpytu podává J. Czekanowski mj. ve své knize Wstęp do historii Słowian (poprvé vyšla ve Lvově r. 1927, nyní viz 2. vyd., Poznaň 1957, zejm. s. 5n. o obecných otázkách, s. 158—166 o třídění indoevropských jazykových skupin, s. 179—201 a přiložené tabulky o vzájemném vztahu slovanských jazyků); viz též J. Czekanowski, Na marginesie recenzji p. K. Moszyńskiego o książce: Wstęp do historii Słowian, Lvov 1928, s. 6—16.

[15] Viz zejm. A. L. Kroeber - C. D. Chrétien, Quantitative Classification of Indo-European Languages, Language 13, 1937, s. 83—103.

[16] M. Swadesh, Int. Journ. of Amer. Ling. 16, 1950, č. 4, s. 157—167 sestavil takový seznam o 225 slovech (pro angličtinu); v IJAL 21, 1955, č. 2, s. 121—137 vylučuje z tohoto seznamu sám ještě některá slova, která nejsou dost stabilní nebo dost jasně sémanticky odlišná od jiných, takže v seznamu zbývá jen 100 slov.

[17] Tak R. B. Lees v Language 29, 1953, s. 113—127 upravuje zásady lexikálně statistického zkoumání na základě kontrolního propočtu vývoje jazyků zpracovaných už dříve historickosrovnávací metodou.

[18] Kritiku lexikální statistiky podává H. Hoijer, Language 32, 1956, č. 1, s. 49—60; proti přeceňování matematických metod při řešení otázek jazykové příbuznosti se vyslovuje i J. H. Greenberg, Essays in Linguistics, New York 1957, s. 40n. a 54.

[19] Method and Perspective in Anthropology, Papers in Honor of Wilson D. Wallis, Minneapolis 1954, s. 192—220.

[20] Language, New York 1921.

[21] Nejnověji viz V. Skalička, O současném stavu typologie, SaS 19, 1958, s. 224—232.

[22] Language 33, 1957, č. 2, s. 143—169.

[23] Voprosy jazykoznanija 1958, č. 2, s. 121n.

[24] Language 31, 1955, 25—30; S. Saporta zakládá svou práci na metodách tzv. psycholingvistiky (o té srov. dále). Že se fonémy odlišené jen minimálním kontrastem nevyskytují v bezprostředním sousedství uvnitř téhož morfému, konstatoval u nás už dříve B. Trnka, TCLP VI, 1936, s, 57n.

[25] Viz sborník „Problemy kibernetiki“ I (red. A. A. Ljapunov), Moskva 1958, s. 203—214; souhrnnou zprávu o sovětských pracích na tomto úseku podal V. J. Rozencvejg v referátu pro IV. mezinár. sjezd slavistů (cit. Raboty po maš. perevodu …, Moskva 1958, s. 9n.).

[26] J. H. Greenberg, op. cit. v pozn. 18, s. 4n.; H. J. Uldall, Outline of Glossematics I, Kodaň 1957; srov. už E. Koschmieder, Forschungen und Fortschritte 30, 1956, s. 210n.

[27] K. Horálek, Bude možno strojově překládat z ruštiny do češtiny? Čs. rusistika 2, 1958, č. 2—3, s. 85—88.

[28] V. J. Rozencvejg a I. I. Revzin ukazují, že rozvoj teorie strojového překladu teprve umožní důsledně odlišit lingvistické otázky od literárněvědných v obecné teorii překladu (Tezisy konferencii po mašinnomu perevodu, Moskva 1958, s. 26n.); M. I. Steblin-Kamenskij dovozuje (v témž sborníku, s. 23), že práce na strojovém překladu je pro jazykovědu důležitá jako kritika tradičních gramatických pojmů, podmíněná praxí a tudíž objektivnější a účinnější než kritika čistě teoretická; srov. i jeho stať ve sb. „Materialy po maš. perevodu“ I, Leningrad 1958, s. 3n.

[29] Z jeho prací u nás dostupných viz zejm. Language 29, 1953, č. 1, s. 47—58.

[30] Viz např. V. H. Yngve v ruských překladech dvou sborníků: Mašinnyj perevod, Moskva 1957, s. 271n. a Teorija peredači soobščenij, Moskva 1957, s. 255n. Pro jazykovědce je zajímavá i ta skutečnost, že A. A. Markov vypracoval svůj statistický rozbor řetězu mj. na jazykovém materiálu (vypočítával pravděpodobnosti výskytu písmen v textu Puškinova Oněgina, viz Izvestija Imper. Akad. Nauk, 6. série, 7. sv., Petrohrad 1913, s. 153—162).

[31] Language 31, 1955, s. 409—413.

[32] Language 31, 1955, s. 190—222.

[33] Cahiers F. de Saussure 15, 1957, 117n.

[34] Viz ruský překlad jeho práce, Teorija informacii, Moskva 1957, s. 42n.

[35] Za ergodický může být považován takový proces, jehož jednotlivé prvky neovlivňují pravděpodobnost výskytu jiných prvků v sousedství, nebo jehož prvky se takto vzájemně ovlivňují jen na vzdálenost danou konečným počtem prvků. — Obecné otázky formálního zpracování sémantické informace probírají Y. Bar-Hillel a R. Carnap ve sborníku Communication Theory (vyd. W. Jackson 1953), s. 503—512. (Je to sborník projevů z mezinárodní konference o teorii komunikace konané v Londýně r. 1952.)

[36] Informationstheorie, Berlín 1957, s. 49.

[37] Očerki obščej teorii svjazi, Moskva 1955, s. 34.

[38] Kromě výše uvedených prací srov. i L: Brillouin, Science and Information Theory, 1956, s. 23n. — Hlubší vztah k jazykovědě má tvůrce kybernetiky a jeden ze zakladatelů teorie informace, N. Wiener; srov. zejm. jeho knihu The Human Use of Human Beings (v rus. překladu Kibernetika i obščestvo, Moskva 1958, s. 93n.).

[39] An Introduction to Descriptive Linguistics, New York 1955, s. 266n.

[40] Pojem nadbytečnosti v jazyce je zčásti blízký pojmu neutralizace, zejména v pojetí B. Trnky (srov. nejnověji Voprosy jazykoznanija 1957, č. 3, s. 48 o neutralizaci morfologické). Z jiného hlediska nadhodil u nás podobnou problematiku V. Skalička (ČMF 26, 1940, s. 24 až 29), který užil termínu „zpomalení, retardace“ o spojeních jako bojovali boj („reduplikace“) nebo „pták noh“ („subsumace“); Skaličkovi tu jde o vztahy sémat, prvků významové stránky jazyka, nikoli o nadbytečné prvky vyjadřovacích prostředků.

[41] Viz zejm. sborník „Psycholinguistics“, Supplement to Intern. Journ. of Amer. Ling. 20, č. 4, Baltimore 1954.

[42] Viz O. S. Achmanova, O psicholingvistike, Moskva 1957, s. 4.

[43] Viz jeho Cours de linguistique générale, 2. vyd., Paříž 1922, s. 30.

[44] K tomu srov. výše uvedené stanovisko Goldmanovo a Neidhardtovo a dále Krámského v tomto čísle SaS, s. 61n.

[45] Srov. kritiku Herdanových výkladů, kterou podává R. W. Brown v čas. Language 33, 1957, zejm. s. 178n. Na jiné chyby v Herdanově knize upozornili J. Krámský, Philologica Pragensia 1, 1958, s. 89 a M. Halle, Kratylos 3, 1958, s. 20n.

[46] Srov. Skaličkův výklad o podobném přeceňování tendence k analogii, Sovětská jazykověda 5, 1955, č. 2, s. 85n.

[47] P. N. Savickij konstatuje v dosud nepublikované stati Resursy sžatosti russkogo jazyka, že ruština z takových příčin předčí angličtinu stručností.

[48] Viz jeho Growth and Structure of the English Language, 9. vyd., Oxford 1946, s. 120 až 139.

[49] Viz K. Marx - B. Engels, Vybrané spisy II, Praha 1950, s. 336 (v závěru Engelsova Původu rodiny).

[50] K tomu srov. Engelsův výklad o vývoji společnosti ve IV. kapitole jeho spisu L. Feuerbach (K. Marx - B. Engels, Vybrané spisy II, s. 407n.).

[51] To neznamená, že by si odborníci v otázkách teorie informace rozdíl mezi jazykem a kódem vůbec neuvědomovali; např. S. Goldman ve výše uvedené práci mezi oběma pojmy rozlišuje (s. 335, 339, 365 aj.).

[52] Srov. D. J. Panov, Avtomatičeskij perevod, 2. vyd., Moskva 1958, s. 50. O základním postavení jazyka ve vztahu k různým systémům znaků srov. i J. H. Greenberg, op. cit. v pozn. 18, s. 64.

[53] Např. spojení ∙ — v Morseově abecedě označuje písmeno a, které zase je v abecedě češtiny označením českého fonému a. Ale foném a už není jednotkou žádného takového kódu, nemůžeme říci, že by (sám nebo ve spojeních s jinými fonémy) odpovídal obdobným způsobem prvku nějakého kódu základnějšího.

[54] Tak např. A. A. Charkevič, Očerki obščej teorii svjazi, s. 64n. uvádí, že Morseovu abecedu musíme co do efektivnosti posuzovat podle toho, pro který jazyk se jí užívá; její nejkratší značka je pro písmeno e, které je skutečně nejčastějším písmenem v angličtině. V ruštině je však častěiší o, jež je označeno (neekonomicky) značkou delší; pro ruštinu by tedy Morseova abeceda mohla být zdokonalena.

Slovo a slovesnost, ročník 20 (1959), číslo 1, s. 44-55

Předchozí Bohuslav Havránek, Alois Jedlička, Igor Němec, František Daneš, Karel Hausenblas: Z IV. mezinárodního sjezdu slavistů v Moskvě

Následující Jiří Krámský: Teorie sdělné promluvy