Časopis Slovo a slovesnost
en cz

O popularizaci výsledků české kvantitativní lingvistiky

Věra Vlková

[Rozhledy]

(pdf)

О популяризации результатов в чешской квантитативной лингвистике / On the popularization of results of the Czech quantitative linguistics

Bohatá knižní i časopisecká produkce pracovníků bývalého úseku matematické lingvistiky Ústavu pro jazyk český ČSAV nás zejména v posledních letech neustále přesvědčuje o tom, že kvantitativní lingvistika má u nás již bohatou tradici. Vedle stěžejních děl teoretických, zabývajících se uplatněním kvantitativních metod v oblasti lexikální (Těšitelová, 1974) i v oblasti gramatické — morfologické a syntaktické (Těšitelová, 1980), k nimž je nutno přiřadit i souhrnné poučení o pojetí a stavu vývoje kvantitativní lingvistiky, o její problematice metodické, o otázkách statistiky lexikální, gramatické, sémantické i statistiky fonologické, grafematické, stylistické a typologické i o možnostech využití výsledků zkoumání v praxi, které bylo zpracováno zejména pro účely didaktické (Těšitelová, 1977, 1987), máme nyní k dispozici i rozsáhlé a všestranné statistické zpracování materiálu současného českého jazyka. Jde především o jazyk tzv. věcného stylu, jehož jádro tvoří funkční styl odborný a dalšími složkami jsou styl publicistický a styl administrativní. Postupně se s ním seznamujeme v celé řadě podob. K tradičním patří zvláště frekvenční slovníky: frekvenční slovník současné publicistiky (Těšitelová a kol., 1980a), administrativy (Těšitelová a kol., 1980b) a odborné češtiny (Těšitelová a kol., 1982a); jejich syntézu představuje Frekvenční slovník češtiny věcného stylu (Těšitelová a kol., 1983a). Na ně pak navazují souhrnné kvantitativní a kvalitativní analýzy jednotlivých složek věcného stylu, zaměřené na stránku lexikální, morfo[143]logickou i syntaktickou, doplněné řadou tabulek a grafů (Těšitelová a kol., 1982b, 1982c, 1983b, 1983c, 1983d, 1984, 1985a).

Všechna uvedená díla jsou založena na zpracování korpusu věcného stylu v rozsahu 540 000 slov, který zahrnuje celkem 180 textů po 3000 slovech. Z toho největší část — 56 %, tj. 100 textů o rozsahu 300 000 slov, patří do funkčního stylu odborného, 33 %, tj. 60 textů o rozsahu 180 000 slov, připadá na styl publicistický a 11 %, tj. 20 textů o rozsahu 60 000 slov, na styl administrativní. Pozornost přitom byla věnována nejen projevům psaným (75 %), ale i projevům mluveným (25 %). Podle potřeby a možnosti byla tato data srovnávána s daty o jazykových jevech stylu uměleckého ve frekvenčním slovníku češtiny (Jelínek - Bečka - Těšitelová, 1961).

Z téže materiálové základny vychází i kolektivní monografie Kvantitativní charakteristiky současné češtiny (Těšitelová a kol., 1985b), která je syntézou badatelského úsilí autorského kolektivu. Je prvním souborem kvantitativních charakteristik všech rovin současného jazyka (fonologické, grafematické, lexikální, morfologické a syntaktické), a to v kontextu nejen domácím, ale i světovém; představuje shrnutí výsledků zkoumání v oblasti kvantitativní lingvistiky za posledních dvacet let. Významnou a ojedinělou prací je i Retrográdní slovník současné češtiny (Těšitelová - Petr - Králík, 1986).

Všechny tyto práce, stejně jako dílčí studie publikované časopisecky, jsou na vysoké odborné úrovni a nejen jejich stránka obsahová, ale i metodika výkladu využívajícího rozsáhlý aparát kvantitativní lingvistiky spolu se stránkou jazykovou a terminologickou je předurčují především uživatelům odborným — jazykovědcům, pedagogům i odborníkům dalších oborů. Proto je třeba uvítat, že autorský kolektiv vedený M. Těšitelovou (H. Confortiová, J. Králík, M. Ludvíková, I. Nebeská a L. Uhlířová) zpracoval výsledky svých dlouholetých výzkumů i formou popularizační, v publikaci přímo určené širší veřejnosti. Čtvrtý svazek Malé jazykové knižnice nakladatelství Academia přináší titul O češtině v číslech (Praha 1987, 205 s., 9 obr.), který představuje výběr statistických údajů o češtině, v řadě případů i ve srovnání s jazyky jinými, především slovanskými, zpracovaný ve formě jazykových koutků. Vznikají tak relativně autonomní celky (jednotlivé kapitolky, popř. celé oddíly), v nichž se autoři ve výběru zaměřují zejména na problémy obecnějšího rázu i na některé otázky aktuální. Jednotlivé kapitolky jsou přitom zpracovány pokud možno s minimálními nároky na znalost aparátu kvantitativní lingvistiky a méně běžné pojmy jsou průběžně vysvětlovány. Tato koncepce dává možnost přiblížit metody i výsledky kvantitativního zkoumání našeho jazyka širokému okruhu čtenářů. Zanedbatelné přitom není ani to, že čtenář tak není nucen k průběžnému a postupnému studiu, ale má možnost vybrat si jednotlivé kapitolky, resp. jednotlivé jevy nebo tematické okruhy podle momentální potřeby či zájmu.

Způsob výběru a zpracování materiálu i jeho přiblížení širokým čtenářským vrstvám patří k výrazným kladům této publikace; nepochybně se v něm odráží rozsáhlá pedagogická zkušenost a dlouholetá praxe v oboru u vedoucí autorského kolektivu M. Těšitelové. Je třeba vysoce ocenit i to, že se zdánlivé jednotlivosti zde probírají v širších kontextových souvislostech, takže se čtenáři dostává poměrně rozsáhlého a uceleného poučení o řadě obecnějších otázek, které se zdaleka netýkají pouze aspektů kvantitativních. Máme na mysli např. poučení o slovnících spisovné češtiny — o jejich obsahu i rozsahu, o slovnících frekvenčních a jejich typech, a to nejen domácích, ale i ve srovnání se slovníky zahraničními, které přináší řadu podnětů a nabízí další možnosti pro uplatnění kvantitativních metod v dalších oblastech (zpracování autorských slovníků aj.), dále pak i poučení o vzájemných vztazích mezi slovním druhem, významem a frekvencí apod. Na řadě konkrétních příkladů se zde přesvědčivě ukazuje, jak právě výsledky kvantitativního výzkumu jazyka a jejich interpretace přispívají k poznání jazykových jevů a jejich osvětlení [144]a k usouvztažení řady jejich stránek, které nabývají na důležitosti právě díky uplatnění statistických metod. Např. princip ekonomičnosti vyjadřování, princip nejmenšího úsilí ve světle kvantitativních výzkumů nebo vztah frekvence jazykových jevů a jejich centrálnosti (bezpříznakovosti) na straně jedné a perifernosti (příznakovosti) na straně druhé, který signalizuje, že pro výzkum jak jednotlivých dílčích otázek (např. sporné autorství), tak i dynamiky celého jazykového systému nabývají na důležitosti především jevy s frekvencí nižší a nejnižší.

Po stručném úvodu, seznamujícím čtenáře se zaměřením a posláním kvantitativního zkoumání jazykových jevů a s oblastmi jeho využití, následují jednotlivé kapitolky uspořádané do sedmi tematických oddílů. Oddíl první, nazvaný „Čísla o slově“, se zaměřuje na charakteristiku současné slovní zásoby. Ukazuje, která slova jsou v češtině nějčastější vůbec, která jsou nejčastější slovesa i jména podstatná a přídavná a proč. Autoři věnují pozornost i vztahu slovníku projevů psaných a mluvených, rozdílům ve slovníku mužů a žen, všímají si i frekvence rodných jmen v češtině, rozdílů v repertoáru a frekvenci jmen mužských a ženských a posunů daných oblibou určitých jmen v určitých časových obdobích.

Tematické novum představuje oddíl druhý, nazvaný „Čísla o významu slova“, který se na řadě ukázek snaží přiblížit problematiku kvantifikace v oblasti sémantiky. Na konkrétních příkladech se tak ukazuje důležitost odlišení jednotlivých významů slov podle jejich frekvence v textu a zároveň i rozdíly mezi běžnou charakteristikou významu slova uváděnou ve výkladových slovnících, která vychází od významu geneticky základního a od něho postupuje k významům sekundárním, a sémantickou charakteristikou frekvenční (srov. např. sloveso jít, které se v textech věcného stylu uplatňuje ve svém základním významu, tj. ‚pohybovat se krokem‘, pouze v 10 %, zatímco plných 75 % připadá na význam ‚týkat se‘ a zbývajících 15 % se uplatňuje ve významu ‚směřovat‘ a ‚dařit se‘). Pozornost je věnována i spojovatelnosti slov v kontextu, jejich syntagmatice a paradigmatice. Poukazuje se zde nejen na řadu konkrétních spojení, popř. jejich typů, které jsou dnes relativně ustálené, ale i na obecnější souvislosti mezi významovým rozsahem slova, jeho frekvencí a jeho spojovatelností. Výklady tohoto oddílu jsou založeny na Sémantickém frekvenčním slovníku češtiny (zatím nepublikovaném). Výsledky těchto výzkumů lze široce využívat jak v oblasti stylistické, tak při zpracování moderních výkladových slovníků.

Oddíly třetí a čtvrtý — „Čísla o hláskách“ a „Čísla o písmenech“ — se zaměřují nejen na statistické zkoumání roviny fonematické a grafematické, s důrazem na kombinatoriku některých jevů a na pozici fonému (grafému) ve slově, ale především na možnosti uplatnění výsledků těchto výzkumů v praxi.

Kvantitativním výzkumům roviny syntaktické je věnován oddíl pátý, „Čísla o větě jednoduché“, zaměřující se především na problematiku délky věty, slovosledu, využití a funkce jednotlivých slov a slovních druhů ve větě, a oddíl šestý, „Čísla o souvětí“; ten se zabývá stavbou souvětí a jejich typy, druhy vět vedlejších a využitím spojovacích výrazů. Právě v rámci výkladů syntaktických si může čtenář nejlépe uvědomit i prakticky doložit složitost a náročnost statistických výzkumů jazykových jevů a jejich interpretace. Zde se ukazuje, že se při nich nelze opírat o jednotlivé, izolované kvantitativní charakteristiky, ale že je třeba vycházet vždy z celého souboru kvantitativních údajů a jejich vztahů a teprve na tomto základě daný jev charakterizovat. Ukazuje se rovněž, jak výzkum v oblasti kvantitativní lingvistiky směřuje k obsáhnutí složitějších, komplexních jazykových jevů.

Oddíl sedmý, „Čísla o ostatních jazykových jevech“, je převážně věnován otázkám stylistické statistiky a jejího praktického využití při charakteristice funkčního stylu, stylu autora, popř. při určování sporného autorství. Zde jsou také uvedeny nejzajímavější momenty a výsledky kvantitativních výzkumů Rukopisu královédvorského a zelenohorského, zpracovávaných v minulých letech v Ústavu pro jazyk [145]český ČSAV (srov. Těšitelová - Nebeská - Králík, 1976). V rámci tohoto oddílu se ukazují i možnosti využití kvantitativních metod při výzkumu jazykové typologie a možnosti i meze využití glottochronologické metody výzkumu vývoje jazyků.

Závěrečná část ve stručnosti shrnuje využití výpočetní techniky pro potřeby jazykovědy i jeho vývojové proměny a naznačuje další perspektivy rozvoje i aplikace kvantitativní lingvistiky.

Přestože jde pouze o výběr z rozsáhlého spektra výsledků kvantitativních výzkumů současné češtiny, jehož cílem nebyl úplný popis jazykového systému, dávají jednotlivé kapitoly publikace O češtině v číslech ve svém souhrnu ucelený a přehledný obraz téměř o všech jazykových rovinách, a to nejen pokud jde o stránku kvantitativní. Kvantitativní zkoumání odráží a charakterizuje jevy kvalitativní i jejich vzájemné souvislosti a odhaluje obecnější zákonitosti jejich fungování v jazykových projevech.

Výběr problémů je čtenářsky atraktivní a způsob zpracování ve formě jazykových koutků i přehledná grafická úprava přispívají k tomu, že text je poměrně snadno přístupný pro široký okruh čtenářů — lingvistů i nelingvistů. Pro lingvisticky orientované čtenáře bude přínosem především řada nových pohledů na zkoumání jazykových jevů a jejich souvislostí i řada nových podnětů pro další, prohloubenější interpretaci a usouvztažnění jazykových jevů. Zcela nepochybné jsou i široké možnosti aplikace v oblasti didaktické. Exaktnější přístup ke zkoumané problematice, než na jaký jsme tradičně zvyklí, ji přibližuje i čtenářům technicky orientovaným, jimž knížka O češtině v číslech rovněž nabízí široké aplikační možnosti.

 

LITERATURA

 

JELÍNEK, J. - BEČKA, J. V. - TĚŠITELOVÁ, M.: Frekvence slov, slovních druhů a tvarů v českém jazyce. Praha 1961.

TĚŠITELOVÁ, M.: Otázky lexikální statistiky. Praha 1974.

TĚŠITELOVÁ, M.: Kvantitativní lingvistika. Lingvistické příručky UK. Praha 1977, 2. vyd. 1987.

TĚŠITELOVÁ, M.: Využití statistických metod v gramatice. Praha 1980.

TĚŠITELOVÁ, M.: O využití výsledků kvantitativní lingvistiky. NŘ, 70, 1987, s. 225—236.

TĚŠITELOVÁ, M.: Ke kvantifikaci v oblasti sémantiky (substantiva) I. SaS, 49, 1988, s. 81—100.

TĚŠITELOVÁ, M. a kol.: Frekvenční slovník současné publicistiky. Praha 1980a. Interní tisk ÚJČ ČSAV.

TĚŠITELOVÁ, M. a kol.: Frekvenční slovník současné administrativy. Praha 1980b. Interní tisk ÚJČ ČSAV.

TĚŠITELOVÁ, M. a kol.: Frekvenční slovník současné odborné češtiny. Praha 1982a. Interní tisk ÚJČ ČSAV.

TĚŠITELOVÁ, M. a kol.: Kvantitativní charakteristiky současné české publicistiky. Linguistica II. Praha 1982b. Interní tisk ÚJČ ČSAV.

TĚŠITELOVÁ, M. a kol.: Kvantitativní charakteristiky současné české publicistiky. Tabulky a grafy. Linguistica III. Praha 1982c. Interní tisk ÚJČ ČSAV.

TĚŠITELOVÁ, M. a kol.: Frekvenční slovník češtiny věcného stylu. Praha 1983a. Interní tisk ÚJČ ČSAV.

TĚŠITELOVÁ, M. a kol.: Psaná a mluvená odborná čeština z kvantitativního hlediska (v rámci věcného stylu). Linguistica IV. Praha 1983b. Interní tisk ÚJČ ČSAV.

TĚŠITELOVÁ, M. a kol.: Kvantitativní charakteristiky gramatických jevů v současné administrativě. Tabulky. Praha 1983c. Interní tisk ÚJČ ČSAV.

TĚŠITELOVÁ, M. a kol.: Kvantitativní charakteristiky současné odborné češtiny (v rámci věcného stylu). Tabulky a přehledy. Linguistica VII. Praha 1983d. Interní tisk ÚJČ ČSAV.

TĚŠITELOVÁ, M. a kol.: Kvantitativní charakteristiky gramatických jevů v češtině věcného [146]stylu. Tabulky a přehledy. Praha 1984. Interní tisk ÚJČ ČSAV; rec. V. Vlková, NŘ, 69, 1986, s. 143—145.

TĚŠITELOVÁ, M. a kol.: Současná česká administrativa z hlediska kvantitativního. Linguistica XV. Praha 1985a. Interní tisk ÚJČ ČSAV.

TĚŠITELOVÁ, M. a kol.: Kvantitativní charakteristiky současné češtiny. Praha 1985b; rec. J. Krámský, SaS, 47, 1986, s. 241—247; V. Vlková, ČJL, 36, 1985/86, s. 229—232.

TĚŠITELOVÁ, M. - NEBESKÁ, I. - KRÁLÍK, J.: On the quantitative characteristics of the Czech texts of disputed authorship — RKZ. PSML, 5, 1976, s. 119—147.

TĚŠITELOVÁ, M. - PETR, J. - KRÁLÍK, J.: Retrográdní slovník současné češtiny. Praha 1986; rec. O. Šoltys, SaS, 49, 1988, s. 52—56.

Slovo a slovesnost, ročník 50 (1989), číslo 2, s. 142-146

Předchozí Miloš Dokulil: Na okraj české práce o slovotvorné analýze a syntéze

Následující Petr Mareš: Německý úvod do lingvistické analýzy textu