Časopis Slovo a slovesnost
en cz

Sovětská kniha o matematických metodách v lingvistice

Jan Králík

[Chronicles]

(pdf)

Советская книга о математических методах в лингвистике / Un ouvrage soviétique sur les méthodes mathématiques dans la linguistique

Dnes již početná literatura kvantitativní lingvistiky je soustředěna především v časopisech.[1] Monografické práce jsou zatím vzácné a publikace zpracované z hlediska matematického ještě vzácnější. Z autorů knižních prací tohoto oboru se matematickou metodikou souborně [351]zabývali vlastně jen G. Herdan a Ch. Muller.[2] V sovětské literatuře se věnují matematické problematice kvantitativní lingvistiky některé sborníky a speciální brožury.[3] Také zde však až dosud chybělo soustavné zpracování speciální metodiky, jíž se kvantitativní lingvistika výrazně odděluje od řady oborů, které sice také užívají metod matematické statistiky a algebraického modelování, nikoli však v osamostatňující modifikaci.

Bílé místo v literatuře kvantitativní lingvistiky, jejíž matematická metodika již konstituuje samostatný obor, zaplňuje do značné míry kniha autorů R. G. Piotrovského, K. B. Bektajeva a A. A. Piotrovské Matematičeskaja lingvistika (Moskva 1977, 384 s.). Představuje úspěšné sjednocení různých pohledů na matematické modelování jazyka z hlediska jeho kvantitativních vlastností a poskytuje základ pro velmi potřebnou jednotu přístupu k lingvistickým datům z hlediska statistického a pravděpodobnostního. Pro lingvisty tato kniha znamená především vítanou příručku základních a typických speciálních metod kvantitativní lingvistiky.

Autoři koncipují tento první přehled matematických metod užívaných v kvantitativní lingvistice jako učebnici pro pedagogické instituty. Nepředpokládají žádné hlubší matematické znalosti. V úvodní kapitole první části knihy se proto zastavují u rozdílů mezi znakem jazykovým a matematickým (matematický znak zahrnuje pouze designát, nikoli již denotát) a pak přecházejí od množinových pojmů a jejich vymezení k reálným číslům. Záměrně se omezují pouze na ty jazykové jevy, které „je možno vyjádřit číslem“ (my bychom raději řekli „které jsou měřitelné“), a pomíjejí jevy ryze kvalitativní povahy. Příklady takto chápaných jazykových jevů zasahují i do méně tradičních kvantitativně linvistických oblastí: vedle frekvence a délky slov a slabik a jejich pořadí ve frekvenčních seznamech je tu i informační hodnota, stupeň analytičnosti jazyka atp.

Přirozeným základem všech dalších postupně budovaných modelů je termín funkce (matematický pojem), vykládaný jak ve formě diskrétní (obecný vztah mezi prvky dvou množin, přiřazení), tak spojité, a to tentokrát jak pro případy vyčíslitelné, tak nevyčíslitelné (kvalitativní). Přitom se nevylučuje běžná statistická praxe zadání funkce tabulkou nebo grafem a výklad o spojitých funkcích rekapituluje základní poučky o polynomech, mocninách a funkcích trigonometrických.

Kapitola druhá, věnovaná glottochronologii a informačnímu schématu, vychází z pojmu nekonečně malé veličiny, jejímž prostřednictvím definuje limitu funkce. Krátká glottochronologická část se pak drží jednak klasického pojetí Swadeshova, jednak modernějších myšlenek Arapovových a Chercové, i když jde jen o ilustrativní příklady. Velmi názorný je výklad limitního modelu pro růst bohatství slovníku, výklad glottochronologické úvahy naproti tomu poněkud trpí zkrácením.

Zásadní charakter má kapitola třetí, nadepsaná „Dynamika lingvistických procesů a její popis pomocí pojmů diferenciálního počtu“. Dosah výkladu o diferencích, derivování a zjišťování průběhu funkcí je totiž velmi široký, ačkoli jej v knize provázejí pouze dva lingvistické příklady (vzrůst počtu arabismů v perských textech 10.—12. stol. a užití zájmena hic v pozdních textech latinských).

Závěr první části knihy (čtvrtá kapitola) podává definice a přehled nekonečných řad a jejich součtů (včetně kritérií pro konvergenci), vykládá myšlenky McLaurinovy řady pro rozvoj funkce a zkratku teorie neurčitých a určitých integrálů.

Druhá část knihy, která zaujímá více než dvě třetiny rozsahu publikace, je věnována základům kombinatoriky, pravděpodobnostně informačním odhadům normy jazyka a tzv. statistickému konstruování textu. Vychází z definice jazykového jevu jako výsledku lingvistického pokusu, přičemž pokusem se tu rozumí uskutečnění určitého pozorování za určitého komplexu podmínek. Za náhodný jev se pak považuje každý jev, který může jak nastat, tak nenastat. Za elementární náhodný jev se označuje výsledek takového lingvistického pokusu, který se může realizovat právě a pouze jedním způsobem.

[352]V úvodní kapitole druhé části knihy (kapitola pátá) zavádějí autoři pojem pravděpodobnosti jako „míry možnosti nastání daného jevu za realizace daného komplexu podmínek“ (s. 115) a uvádějí k tomu tri definice: (a) pravděpodobnost subjektivní, uvažovanou v psycholingvistice, (b) pravděpodobnost klasickou, určovanou na základě kombinatorických schémat, a (c) pravděpodobnost statistickou, odhadovanou pomocí relativní frekvence. Teprve pak následuje axiomatika teorie pravděpodobnosti (Kolmogorov) a příklady výpočtu podmíněných pravděpodobností a entropií. Výklad vrcholí Bayesovou větou a praktickou ukázkou jejího smyslu.

Kapitola šestá, zabývající se pravděpodobnostním modelováním vzniku textu a jeho jednotek, je nejrozsáhlejším uceleným výkladem. Obsahuje (již důsledně s lingvistickými příklady) Bernoulliho a Poissonovo schéma, pojem statistického rozložení a jeho charakteristik, věty o střední hodnotě a rozptylu, momenty, limitní věty a nerovnosti z oblasti zákona velkých čísel. Ačkoli je přehledný výklad této kapitoly oproštěn od přílišného teoretizování, je to kapitola pro nematematického čtenáře bezesporu velmi náročná.

Sedmou kapitolu tvoří praktický přehled různých metod statistického zpracování textu (různé typy výběrů, variační řady, grafická znázornění, výpočet a význam průměrů, momentů, rozptylů). Osmá kapitola se zabývá — podle názvu — statistickým modelováním textu a pravděpodobnostními charakteristikami jazyka. Obsahuje bodové a intervalové odhady a příklady praktických výpočtů. Na příkladě se ukazuje i aplikace Kolmogorovovy funkce a určení nutného rozsahu výběru.

Závěrečný oddíl věnovali autoři testování hypotéz a přehledu některých nejužívanějších testů (Wilcoxonova, Studentova, Pearsonova, Kolmogorovova-Smirnovova) pro testování shod a rozdílů výběrových rozdělení. Ačkoli kapitolu neprovází ani zmínka o teorii odhadu, je její výklad pro kvantitativní lingvistiku velmi cenný.

Souhrnným přínosem recenzované knihy je důsledný zřetel autorů k lingvistické specifice a snaha vycházet z pevné báze přesně vymezených a definovaných pojmů. Autoři např. předkládají definici jazykového jevu, pokoušejí se o objasnění problematiky spojitých modelů atd. To jsou témata, o nichž lze samozřejmě také diskutovat. Lze např. poznamenat, že v knize poněkud zúžené pojetí jazykového jevu omezuje možnou obecnost výkladu: ztrácí se tím příležitost uvažovat o vzájemném vztahu jazykového prvku a jazykového jevu, a značně tak zjednodušit a zároveň zobecnit nejednu formulaci. Výklad proto např. nemůže obsáhnout pohled na základní dichotomii jazykového systému a jeho realizace.

Často diskutovaným problémem jsou i spojité modely a jejich užití nejen tam, kde popisují spojité děje a jevy (podle autorů knihy např. v oblasti fonetiky). Kniha přitom obsahuje aplikace řady spojitých modelů na hromadné diskrétní jevy (jako spojité procesy se např. modelují ústup ruských redukovaných vokálů, rozvoj terminologie atd.), neobsahuje však explicitní výklad myšlenky limitních přechodů a jejich významu, známého např. ze studií biologických a demografických (kapitolu o limitních větách takový výklad provázet nemusí). Chybí tu zdůraznění, že spojitost (i fyzikální pojem kontinuum) je matematická abstrakce, nikoli vlastnost vnějšího světa.

Předmětem jiné diskuse by mohlo být užití trigonometrických a hyperbolických funkcí v kvantitativní oblasti lingvistických výzkumů právě proto, že jejich povaha je abstraktně spojitá, nikoli původně statistická, tedy diskrétní. To samozřejmě nevylučuje možnost úspěšně aplikovat regresní modely s těmito funkcemi, vylučuje to však příležitost smysluplného výkladu sledovaných dějů. U funkcí statistické nebo pravděpodobnostní povahy takové nebezpečí nehrozí, naopak.

Taková diskuse však má pro rámec knihy a její přínos pouze fakultativní charakter, týká se jen některých odstavců. Vybudovat soustavnou metodologii tak speciálního oboru, jakým je kvantitativní lingvistika, nelze ze dne na den a bez konfrontací různých pohledů. Bylo však třeba k tomu učinit první krok. A ten se R. G. Piotrovskému, K. B. Bektajevovi a A. A. Piotrovské v mnoha ohledech zdařil.


[1] Viz bibliografii Kvantitativní lingvistika 1961—1971, red. M. Těšitelová, vyd. Státní knihovna ČSR, Praha 1962—1972; k tomu srov. M. Těšitelová, Kvantitativní lingvistika, skripta Lingvistické příručky, vyd. FFUK, Praha 1977; rec v SaS 40, 1979, 74—75.

[2] G. Herdan, Type-Token Mathematics, Hague 1960; týž, Quantitative Linguistics, London 1964; Ch. Muller, Initiation à la statistique linguistique, Paris 1968, srov. SaS 31, 1970, s. 261.

[3] Viz např. brožury a sborníky v redakci R. G. Piotrovského a jejich recenze v SaS 32, 1971, 378—380 a SaS 34, 1973, 187—189; speciálními metodami glottochronologickými se např. zabývá práce M. V. Arapova a M. M. Chercové Izmenenije slovarja vo vremeni, Moskva 1974; o ní ref. v SaS 37, 1976, 51—56.

Slovo a slovesnost, volume 40 (1979), number 4, pp. 350-352

Previous Slavomír Utěšený: Studie k mezijazykové dialektologii Evropy

Next Arnošt Lamprecht: Zamyšlení nad genezí slovenštiny