Časopis Slovo a slovesnost
en cz

Anglická práce o statistice pro lingvisty

Marie Těšitelová

[Kronika]

(pdf)

Английская работа о статистике для лингвистов / An English volume on the statistics for linguists

Šířit, ev. prohloubit znalost statistických metod a podmínek jejich užití při studiu jazykových jevů vzal si za úkol anglický lingvista Christopher Butler v knize Statistics in linguistics (vyd. B. Blackwell, Oxford 1985, 214 s.). Za klíčový problém při tom právem pokládá potřebu ukázat především metody výběru materiálu na pozadí poučení o základním souboru. Do druhé řady pak klade metody testování hypotéz a aplikace testů. Kniha je určena studentům a lingvistům, ev. jiným odborníkům začínajícím pracovat s jazykovým materiálem při využití statistických metod; u svých čtenářů nepředpokládá znalost statistických metod, jen znalosti matematiky ze základní školy.

Autor rozdělil svou práci do 12 kapitol; vzhledem k jejímu určení pedagogickému je ke každé kapitole připojen soubor cvičení. Ve dvou dodatcích se uvádějí jednak statistické tabulky, jednak klíč, výsledky ke cvičením.

Po výkladu základních statistických pojmů, jakými jsou různé druhy výběru, připomínají se zejména výběr náhodný, systematický, stratifikační a vícenásobný (srov. u nás např. M. Königová, K otázce statistického výběru v lingvistice. SaS, 26, 1965, s. 161—168); věnuje se pozornost distribuci frekvence (srov. M. Těšitelová, Kvantitativní lingvistika. Praha 1987, učební text UK), grafickému znázornění (histogramem a polygonem) apod.

Pro testování hypotéz volí autor testy jak parametrické, tak neparametrické. Z parametrických testů to jsou z-test (pro velké výběry) a t-test (pro malé výběry), z neparametrických testů se vedle testu Mannova-Whitneyova a testu Wilcoxonova uvádí tzv. test dobré shody χ2-test.

Dále se probírají korelace, resp. koeficienty korelační. Poslední kapitola ukazuje, jak je možno počítačů využít k automatickému testování, např. k aplikaci t-testu, testu χ2, k výpočtu průměru, směrodatné odchylky apod.

Vybrané statistické jevy aplikuje autor na jazykový materiál, který mu k danému účelu sebrali studenti; jde o angličtinu a francouzštinu. Jsou to např. tyto jazykové jevy: délka věty, délka slov, přízvukování slabik, délka samohlásek, rozložení časů v angličtině, stylistické jevy, problémy překladu z jednoho jazyka do druhého apod., ale i rozložení chyb v jazykových projevech žáků apod. Zde se však ukazuje jeden ze základních problémů knihy. Je třeba jistě ocenit, že se vybrané statistické pojmy aplikují na jazykové jevy. Platí to i pro připojená cvičení a klíč k nim. Ovšem příklady aplikací na jazykové jevy celkem namátkou vybrané většinou nemohou ukázat problematiku aplikací vybraných postupů v plné šíři; k tomu by se autor dostal, kdyby se alespoň některým jazykovým jevem zabýval do větší hloubky a ovšem se zřetelem k tomu, že jde o jazykový materiál a že inter[80]pretace zjištěných dat má sloužit k rozšíření našeho poznání o zkoumaných jazykových jevech. Teprve v takových případech lze posoudit vhodnost, ale i užitečnost vybraných metod pro jazykový výzkum. Pro lingvistiku jsou zjištěná statistická data jen prostředkem, nikoli cílem k hlubšímu poznání jazyka (srov. M. Těšitelová, např. o. c., 1987, s. 9). To se přirozeně musí obrážet i na volbě jistých metod; jde o otázku, která stále zůstává do určité míry otevřenou a autor k ní z tohoto aspektu přispěl jen velmi málo.

S uvedenou námitkou souvisí i další výhrada, kterou lze vznést k recenzované práci, tj. uvádění literatury. Autor cituje jen své tři práce, v podstatě články, a několik prací, které vyšly v poslední době ve Velké Británii a týkají se dílčích problémů kvantitativní lingvistiky, psychologie a pedagogiky. Je škoda, že autor zřejmě nezná, že už např. před dvaceti lety francouzský matematik Charles Muller vydal svůj úvod do studia jazyka statistickými metodami (Initiation à la statistique linguistique, Paris 1968; srov. rec. P. Nováka v SaS, 31, 1970, s. 258—262, zvl. s. 261). Ch. Muller uvádí rovněž výběr základních statistických pojmů — lze ovšem dodat, že většinou shodných —, ale jejich výběr zdůvodňuje na bohatém jazykovém materiálu, zejména z oblasti lexikální a stylistické, jak je ve francouzské kvantitativní lingvistice celkem tradiční (srov. např. P. Guiraud, Problèmes et méthodes de la statistique linguistique, Paris 1960). Oba uvedení francouzští autoři, jak matematik Muller, tak i lingvista Guiraud, ukázali i význam zvolených metod pro studium jazykových jevů, na jejich přednosti i na jejich meze. K tomu se Ch. Butler ve své knize bohužel nedostal.

U Ch. Butlera postrádáme však i znalost starší literatury z kvantitativní lingvistiky, která vznikla na půdě Británie samé. Jde např. o práce matematika G. Herdana, který věnoval velkou pozornost právě výběru statistických metod vhodných pro studium jazykových jevů; srov. zejména jeho práci zaměřenou na metody výběru — Language as choice and chance (Groningen 1956) a soubornou práci — Quantitative linguistics (London 1964).

I přes uvedené nedostatky je Butlerova příručka užitečná tím, že propaguje využití statistických metod v lingvistice. Je třeba litovat, že se autor nepokusil navázat na to, co tu bylo již vykonáno, zejména v kvantitativní lingvistice, a to v měřítku nejen světovém, ale i zvláště domácím. Ztrácí čas tím, že v podstatě opět začíná tam, kde měl nač navázat, kde ho předešli jiní, kde mohl sám už udělat nějaký krok dále, zejména v období, kdy lze i při výběru vhodných statistických metod využít s prospěchem počítače, jak konečně autor sám v závěrečné kapitole dobře naznačil.

Slovo a slovesnost, ročník 49 (1988), číslo 1, s. 79-80

Předchozí Petr Zima: Sovětská práce o jazyce v politice a ideologii zemí Asie a Afriky

Následující Marie Těšitelová: Ke kvantifikaci v oblasti sémantiky (substantiva) I