Časopis Slovo a slovesnost
en cz

Nad frekvenčním slovníkem současné čínštiny

Oldřich Švarný, Marie Těšitelová

[Rozhledy]

(pdf)

Над частотным словарем современного китайского языка / Reviewing the frequency dictionary of present-day Chinese

Do řady frekvenčních slovníků, které jsou u nás známy (srov. Těšitelová, 1977, 1987), přibyl frekvenční slovník současné čínštiny — Xiandai Hanyu Pinlü Cidian (Frequency dictionary of present-day Chinese), vyd. Wang Huang a kol. Beijing yuyuan xueyuan chubanshe (Nakladatelství Pekingského jazykového institutu), Peking 1986, 1491 s. (dále PLC). Po stránce metodologické se tento frekvenční slovník nijak výrazněji neodlišuje od současných frekvenčních slovníků evropských jazyků, navazuje zejména na frekvenční slovníky Al. Juillanda (1964 aj.) a jeho následovníků. Pozoruhodný je však zvláště tím, jak se vzhledem k typologickému charakteru čínštiny jakožto jazyka izolačního typu se znakovým písmem vyrovnal s některými základními problémy, jakými jsou při sestavování frekvenčních slovníků: (1.) jednotka souboru, (2.) výběr a rozsah materiálu (korpusu), (3.) zhodnocení výsledků charakteristikami statistickými apod. Pro to i pro malou dostupnost tohoto slovníku u nás věnujeme mu zvláštní pozornost a zabýváme se podrobněji některými otázkami spjatými s jeho vznikem i jeho konečnou podobou.

1. Jednotkou souboru v PLC je v podstatě lexém (lexikální jednotka), chápaná však jinak než v lingvistice evropské, resp. v kvantitativní lingvistice (Těšitelová, 1987, s. 12n.). Stanovit jednotku souboru pro PLC v čínštině znamenalo řešit především tyto vztahy: báze — slabika — glyf — slovo — slovní spojení.

Bází (yusu) se tu rozumí nejmenší sémantická jednotka v čínštině; je typicky jednoslabičná. Dvojslabičná báze je v čínštině jev netypický. Glyf, tj. jednotka čínského „znakového“ písma, rovná se slabice (s výhradou glyfů pro tzv. erizaci, viz níže). Vztah glyfu k bázi je již méně jednoznačný; jeden glyf často označuje dvě (ale i více) jednotky jak homofonní, tak i nehomofonní. Pokud jde o vztah báze a slova, není v čínštině snadné rozlišit, kdy jde o bázi ve funkci slova a kdy ve funkci morfému, resp. kdy spojení dvou bází je spojením dvou slov (konstrukcí [238]syntaktickou) nebo spojením dvou morfémů v dvojslabičném slově (konstrukcí morfologickou). Pro čínštinu je příznačné, že kritéria pro to, kdy báze je ještě slovem a kdy již slovem není, jsou povahy syntaktické (ve stanovení těchto kritérií neexistuje zatím úplný konsensus). Slova dvojslabičná i víceslabičná vznikají z největší části ustrnutím původních struktur syntaktických. V jazyce knižním, který směřuje k víceslabičnosti, zejména u jmen, nacházíme však na druhé straně i mnoho jednoslabičných slov bázových, která jsou v hovorové čínštině již pouze dvojslabičná.

Všechny lexikální jednotky PLC, tj. jednoslabičné lexémy bázové, lexémy dvojslabičné i víceslabičné, popř. sousloví, jsou v seznamech jednak transkribovány v pinyinu (tj. ve formě latinky upravené pro potřeby čínštiny), jednak zachycovány i glyfy, čímž se usnadňuje rozlišení uváděných homofonních jednotek. Tzv. erizací, tj. připojením r na konci slabiky, se v pinyinu označuje suprasegmentální morfém. Z hlediska morfologického se erizované slabiky považují za ekvivalentní (dvojslabičnému) spojení dvou bází s druhou bází atónovou.

Jak známo, v čínštině se rozlišují čtyři distinktivní tóny, které se naznačují zvláštními znaménky nad hlavní samohláskou slabiky. Atónovost, tj. ztráta distinktivního tónu výrazným zkrácením slabičného vokálu, popř. i jeho redukcí timbrovou, označuje se tečkou před slabikou a vynecháním tónového znaménka, srov. např. /zhuō.zi/ ‚stůl‘; oslabování tónu, popř. fakultativnost tónu zejména druhé báze dvojslabičných lexémů je označována v PLC jen velmi omezeně.

V současné čínštině neexistují souhláskové skupiny ani souhlásky na konci slabiky, a tak celkový počet slabik činí asi 410 (bez zřetele k slabikám s redukovaným vokálem, vyskytujícím se pouze v některých atónových slabikách, dále ke slabikám v některých onomatopoích a citoslovcích). Protože se ne všechny slabiky vyskytují ve všech čtyřech tónech, je počet slabik i tónově rozlišených asi 1340. Z toho plyne, že v současné čínštině je mnoho (jednoslabičných) bází homofonních (počet všech bází se odhaduje na 5000). Homofonní báze se rozlišují pomocí glyfů, ale i číselnými indexy, gramatickou funkční charakteristikou (srov. dále), slovním spojením (identifikují se v rámci dvoj- i víceslabičného slova, v němž se vyskytují) apod. Pokud jde o rozlišování homofonních bází glyfy, potíž je v tom, že jeden glyf často zachycuje dvě (nebo i více) jednotky nehomofonní, ale i homofonní, např. glyf pro /hái/ ‚ještě‘ a /huán/ ‚vrátit‘, glyf pro /lī/ ‚míle‘ a /lī/ ‚uvnitř‘ apod. Tento problém se v rámci první části PLC řeší u jednotek homoglyfních nehomofonních tím, že se uvádí fonetický přepis, srov. výše, v druhé části slovníku (seznamy glyfů) však tento přepis chybí a tím tato část značně ztrácí na své informativní hodnotě. Např. mezi 50 glyfy s největší frekvencí (srov. seznam č. 7) má 14 z nich dvojí i trojí „čtení“.

Případů, kdy jeden glyf označuje dvě báze homofonní, sémanticky různé, které mají stejnou slovní funkční charakteristiku, je poměrně málo, srov. glyf pro /gua/ ‚holit‘ /tvář, hlavu/ i pro /gua/ ‚dout, foukat‘ apod. Slovník je považuje za jednu jednotku; vzhledem k nízké frekvenci těchto lexémů je tento nedostatek celkem zanedbatelný. Významným přínosem PLC při řešení jednotky souboru je fakt, že alespoň u homofonních homoglyfních jednoslabičných a dvojslabičných jednotek s dvěma nebo více slovními funkčními charakteristikami uvádí tyto charakteristiky, čímž se tyto jednotky rozlišují jako lexémy různé. V jiných případech se tyto charakteristiky uvádějí jen příležitostně. V novém vydání slovníku, popř. při jeho přepracování by však bylo žádoucí, aby tyto charakteristiky byly doplněny u všech lexikálních jednotek. Získala by se tím cenná kvantitativní data o různých vlastnostech jednotlivých jazykových jednotek v čínštině.

Pokud jde o „slovní funkční charakteristiky“, ev. „gramatické funkční charakteristiky“ (yufa gongneng tezheng) — pojem termín „slovní druh“ je pro čínštinu méně vhodný —, rozlišuje jich PLC celkem patnáct:

[239]jméno (substantivum, jméno místa, jméno času, záložka aj.); sloveso (tranzitivní, intranzitivní aj.); zástupné slovo (zájmeno, deiktické slovo); adjektivum (predikativní, atributivní); prepoziční sloveso (méně přesně: předložka, v podstatě sloveso pomocné); číslovka (základní číslovky 1—9; jsou to v čínštině slova synsémantická a nutně se pojí s měrovými slovy, dále označení řádů); měrové slovo (měrové jméno, numerativ aj.; jsou to všechno slova synsémantická, která se nutně pojí s číslovkami nebo slovy deiktickými); příslovce (synsémantická slova vázaná na postavení před slovesy nebo před jinými adverbii; nepatří sem např. adverbia místa a času v našem — „evropském“ — pojetí); partikule (synsémantická atónová enklitická slova s formálními významy a velkou četností); modální a fázová slovesa; spojky (mají v čínštině podřadnou úlohu; hovorová čínština se např. prakticky obejde bez spojek souřadicích); slova onomatopoická; první morfém víceslabičné jednotky; poslední morfém víceslabičné jednotky (v posledních dvou případech nejde vlastně o slovní charakteristiku, ale o označení některých produktivních morfémů v poměrně volných morfologických konstrukcích); komplement (v podstatě modifikátor-větný člen jistého typu vázaný na postavení za slovesem).

Autoři PLC se spokojují jen s 15 základními charakteristikami (uvedenými výše před závorkami) a nerozlišují dílčí charakteristiky, které by zejména nečínský uživatel slovníku často nutně potřeboval (srov. např. některé naše doplňky v závorkách u jednotlivých gramatických charakteristik).

U některých jednoslabičných bázových slov nemohli autoři PLC jednoznačně rozlišit, o kterou ze dvou gramatických funkčních charakteristik jde, a proto uvádějí obě vedle sebe, jako by v daném případě šlo o charakteristiku jednu. Bývá to nejčastěji (uspořádáno podle klesající frekvence) u těchto dvojic gramatických charakteristik: jméno — poslední morfém, jméno — měrové slovo, sloveso — adjektivum, sloveso — modální sloveso. Jak zřejmo, jde tu většinou o blízké gramatické charakteristiky. Pokud se homofonní homoglyfní slova (ať již bázová — méně často — víceslabičná) v PLC rozlišují podle různých gramatických funkčních charakteristik jako slova různá, je vhodné u bázových slov v čínštině mluvit v této souvislosti o polyfunkčnosti slov nebo prostě o slovech různých, nikoli o konverzi; u dvojslabičných slov je někdy možno jednu funkční charakteristiku označit za primární, druhou za sekundární, odvozenou, např. u dvojice sloveso — jméno.

Z toho, co bylo uvedeno o stanovení jednotky souboru — „slova“ v PLC, plyne, že vzhledem k typologickému charakteru čínštiny jde o jednotku sui generis, kterou podle našeho úzu — jen značně volně — můžeme označovat jako lexém, ev. lexikální jednotku.

 

2. Na základě výběru náhodného, ale i řízeného — celkem ve shodě s metodou výběru materiálu u frekvenčních slovníků z posledního období (srov. Těšitelová, 1987, s. 74n.) — byl pro PLC shromážděn materiál ze čtyř funkčních stylů: (I.) publicistického, (II.) populárněvědného, (III.) hovorového a (IV.) uměleckého. Pokud jde o techniku práce, kombinuje se tu tradiční způsob práce — ruční — s moderní výpočetní technikou, s využitím počítačů, a to až po metody laserového snímání sazby, použitého v Číně poprvé.

 

Celkový rozsah materiálu (korpus), na němž je PLC založen, představuje

 

 

1,314 404

jednotek, lexémů, z toho

 

31 159

různých lexémů,

které obsahují

 

 

 

1,807 398

slabik (glyfů), z toho

 

65 210

glyfů v různých lexémech.

 

[240]Na jednotlivé styly připadá:

 

I.

styl publicistický

289 572

lexémů,

tj.

22,04 %,

II.

styl populárněvědný

197 581

lexémů,

tj.

15,03 %,

III.

styl hovorový

159 389

lexémů,

tj.

12,12 %,

IV.

styl umělecký

667 862

lexémů,

tj.

50,81 %,

 

 

1,314 404

lexémů,

tj.

100,00 %.

 

Rozložení počtu slabik (glyfů) v nich je v relativních četnostech zhruba shodné, srov.:

 

 

 

 

 

 

 

I.

styl publicistický

440 799

slabik,

tj.

24,39 %,

II.

styl populárněvědný

284 308

slabik,

tj.

15,73 %,

III.

styl hovorový

201 892

slabik,

tj.

11,17 %,

IV.

styl umělecký

880 399

slabik,

tj.

48,71 %.

 

 

1,807 398

slabik,

tj.

100,00 % 

 

Materiál byl získán ze 179 textů: 34 z publicistiky, 21 z populárněvědné literatury, 18 z hovorové čínštiny, 106 z umělecké literatury. Průměrná délka jednoho textu je asi 7300 lexémů.

Rozlišení lexikální stránky stylu uměleckého (asi v 50 %) a v zásadě stylu věcného, zejména ve dvou významných reprezentantech, v publicistice a vlastně v odborném stylu (o problému tzv. populárněvědného stylu srov. Těšitelová, 1977), stejně jako i zřetel k projevům mluveným odpovídá současným trendům v sestavování frekvenčních slovníků pro evropské jazyky (srov. i všestranný kvantitativní výzkum v českém jazyce, Těšitelová, 1987, s. 75n.). Zvláštní zmínky zaslouží statistická analýza hovorového jazyka, která má vždycky zvláštní podmínky, v čínštině nadto i speciální. Souvisí to s tím, že se čínština zapisuje glyfy, které mají tendenci hovorový jazyk v písemném projevu nejrůznějšími způsoby modifikovat; proto autoři PLC zvolili většinou materiál z dramat (srov. též Jelínek - Bečka - Těšitelová, 1961) a doplňovali jej magnetofonovými zápisy běžného hovorového jazyka. Důležitým rysem slovníku hovorového stylu v čínštině je výraznější tendence k jednoslabičnosti lexémů. Dobře to dokládá průměrná délka lexémů v slabikách u jednotlivých funkčních stylů, srov.:

 

Styl

Průměrná délka v slabikách

 

lexému

různého lexému

I.

publicistický

1,52

1,97

II.

populárněvědný

1,44

1,93

III.

hovorový

1,27

1,83

IV.

umělecký

1,32

2,04

 

Za pozornost stojí, že se největší průměrná délka lexému vyskytuje v publicistice (1,52), u různých lexémů v slovníku uměleckého stylu (2,04). Může to být ovšem do jisté míry podmíněno i tím, že na umělecký styl připadá zhruba polovina veškerého materiálu, korpusu (srov. výše).

 

3. Frekvenční slovník současné čínštiny se skládá ze 6 seznamů lexémů (č. 1—6), 2 seznamů glyfů (č. 7—8) a 5 příloh, které si mimo jiné všímají poměrného zastoupení lexémů jednoslabičných, dvojslabičných až pětislabičných.

[241]V seznamu č. 1 (s. 1—489) je uvedeno 16 593 lexémů, u nichž se koeficient užití U rovná 2 a více.[1] Seznam je uspořádán abecedně podle slabik se zřetelem ke glyfům; vždy jsou vyčerpány všechny lexémy zapisované v první slabice jedním a týmž glyfem, takže jde zároveň o jakési „hnízdování“ i podle glyfů. U každé jednotky seznamu je uvedena četnost absolutní, relativní a koeficient užití. U absolutních četností se dokládá i počet textů v jednotlivých funkčních stylech, v nichž se daný lexém vyskytuje (srov. analogickou praxi v uvádění počtu textů u českého frekvenčního slovníku, FSČ), takže tu nacházíme i stylistické zařazení lexému.

Seznam č. 2 (s. 491—820) se skládá ze dvou částí: (1.) ze seznamu lexémů uspořádaných podle koeficientu užití (U), a to od hodnoty nejvyšší až po hodnotu 6, resp. do frekvence 8, (2.) ze seznamu lexémů uspořádaných podle klesající absolutní frekvence, a to až do frekvence 10, resp. do koeficientu užití 5 (inkluzive).

První část seznamu obsahuje 8548 lexémů, resp. slov „nejužívanějších“; tyto lexémy pokrývají 95,53 % příslušného materiálu a odpovídá jim 635 ranků.[2]

Druhá část seznamu obsahuje 8441 lexémů — slov „nejfrekventovanějších“; pokrývají 95,47 % příslušného materiálu (tedy shodně s částí prvou) a patří sem 748 ranků, což znamená, že je tu více lexémů s různou frekvencí, než je tomu pochopitelně u koeficientu užití (srov. výše).

V seznamu č. 3 (s. 821—960) nacházíme lexémy s koeficienty užití 5—1. Je jich celkem 22 446, z toho 14 566 lexémů s koeficientem užití U = 1 (s. 870—960). Nevýhodou je, že těchto 14 566 lexémů, které tvoří 46,85 % lexémů různých (kumulativní četnost 1,43 %), není nikde v PLC zaznamenáno abecedně, takže jen velmi těžko zjišťujeme, zda se v materiálu vyskytují či nikoli.

Seznam č. 4 (s. 961—1280) uvádí ve čtyřech částech vždy 4000 nejfrekventovanějších lexémů v jednotlivých funkčních stylech:

První část — 4000 nejfrekventovanějších lexémů v publicistice (z počtu 12 107 různých lexémů z 34 textů) — představuje kumulativní relativní četnost 94,76 % a 377 ranků. Mezi prvních 100 nejvíce frekventovaných lexémů se hlásí lexémy s významem jako ‚země‘, ‚stát‘, ‚lid‘, ‚společnost‘, ‚revoluce‘, ‚strana‘ apod.

Druhá část — 4000 nejfrekventovanějších lexémů v populárněvědném stylu (z 12 364 různých lexémů z 21 textů) — prezentuje kumulativní relativní četnost 92,27 % a 276 ranků. Mezi prvními nejvíce frekventovanými lexémy nacházíme např. lexémy s významem ‚věda‘, ‚zkoumat‘, ‚výzkum‘, ‚technika‘ apod.

Třetí část — 4000 nejfrekventovanějších lexémů v hovorové čínštině (z 8263 různých lexémů z 18 textů) — s kumulativní relativní četností 96,65 % a 271 rankem obsahuje slovník, jehož nejčastější jednotky (např. prvních 200 nejfrekventovanějších lexémů) se jen nevýznamně liší od slovníku nejčastějších slov bez stylového rozlišení. Souvisí to zřejmě s tím, že jádro materiálu v textech hovorového stylu tvoří dramata (srov. výše), která mají i v čínštině nejblíže k slovníku stylu uměleckého (pro češtinu srov. FSČ).

Čtvrtá část — 4000 nejfrekventovanějších lexémů v uměleckém stylu (z 23 622 různých lexémů ze 106 textů) — má tu kumulativní relativní četnost 90,63 % (tedy relativně nejnižší, srov. části 1—3), počet ranků 515, tedy relativně nejvyšší. I bez zřetele k tomu, že materiál ze stylu uměleckého tvoří málo přes 50 % celého korpusu, [242]jde tu zřejmě o obecný charakteristický rys tohoto stylu; na rozdíl od stylu věcného (srov. část první a druhou) slovo se v něm opakuje relativně méně často a to se samozřejmě projevuje v menší kumulativní relativní četnosti a ve větším počtu ranků.

V seznamu č. 5 (s. 1281—1288) je uvedeno 360 lexémů, které se vyskytují v největším počtu textů (179—100), v seznamu č. 6 (s. 1289—1298) 300 nejužívanějších lexémů; u každého z nich se uvádí četnost napočítaná a četnost očekávaná, teoretická. Významnost rozdílů mezi nimi se hodnotí směrodatnou odchylkou.

Seznamy č. 7 (s. 1299—1387) a č. 8 (s. 1389—1477) přinášejí 4574 různých glyfů obsažených v PLC. Protože slovník neobsahuje abecední seznam všech „čtení“ (včetně „různočtení“) glyfů doložených v PLC ani jiný klíč k seznamům glyfů, je tu vyhledávání konkrétních glyfů velmi nesnadné (srov. i výše). V seznamu č. 7, uspořádaném podle klesající četnosti glyfů, je u každého glyfu uvedena četnost absolutní, relativní a kumulativní, dále počet jednoslabičných lexémů zapisovaných daným glyfem i počet víceslabičných lexémů, v nichž se daný glyf vyskytuje (tyto poslední údaje jsou podrobněji obsaženy v seznamu č. 8).

Z celkového počtu 4574 různých glyfů doložených v PLC má 116 nejfrekventovanějších kumulativní relativní četnost 50 %, dalších 1242 glyfů 45 %, 1059 následujících 4 %; zbývajících 2157 glyfů (tedy téměř polovina všech různých glyfů) představuje 1 %. — Připomeňme, že průměrná dostačující gramotnost v Číně je znalost 1500 až 2500 glyfů.

V seznamu č. 8 se zkoumá schopnost glyfů tvořit lexémy, a proto uspořádání je tu dáno součtem jednoslabičných lexémů, zachycovaných daným glyfem, a počtem víceslabičných lexémů, v nichž se glyf vyskytuje jako komponent. Tento součet lexémů se chápe jako index „schopnosti tvořit lexémy“ (gou ci nengli). Vedle tohoto indexu je u každého glyfu uvedena jeho absolutní četnost, počet a četnost lexémů jednoslabičných zachycovaných daným glyfem a počet a četnost víceslabičných lexémů s daným glyfem, a to vzhledem k pozici glyfu v lexému, iniciálové, mediální a finální.

Seznam č. 8 je autory označen — a to plným právem — jako průkopnický čin. Aby ho však bylo možno plně využít pro jazykovou teorii i praxi, zejména pedagogickou, bylo by třeba glyfy tohoto seznamu přepsat i foneticky (v možných různočteních, čímž by se rozlišily ev. homoglyfní nehomofonní báze), doplnit retrográdní a „mediográdní“ uspořádání lexémů (uspořádání podle iniciálového glyfu v rámci abecedního řazení podle slabik nacházíme již v seznamu č. 1, v němž by ovšem bylo třeba doplnit chybějících 14 566 lexémů s koeficientem užití U = 1) apod.

Ke slovníku je připojeno 5 příloh: seznam lexémů s 757 ranky a 4 tabulky (s. 1479—1491). Ty ukazují, jaký význam má v čínštině rozlišování lexémů jednoslabičných (kdy báze funguje jako slovo) a dvojslabičných (dvě báze jako morfémy vytvářejí morfologickou strukturu), které jsou relativně nejvíce frekventované, a lexémů troj- až pětislabičných, ev. víceslabičných, které mají mnohem nižší frekvenci. Ukazuje se tu typologicky výrazný rys čínštiny, v níž je jednoslabičná báze dobře ohraničena a morfologická variabilita se prakticky omezuje jen na oslabování až neutralizaci jejího tónu. V tom je velký rozdíl např. od flektivní češtiny, v níž jsou morfémy ve slově, jako dobře konstituovaném gramatickém celku, integrovány, až fúzovány.

Data shromážděná v PLC umožňují ovšem statistická zkoumání i mnoha jiných aspektů čínštiny, než je ukázáno v jeho seznamech i přiložených tabulkách. Je např. dobře známo, že čínština je tónový jazyk, ale méně je již známo, že v dnešním jazyce existuje řada enklitických, silně zkrácených atónových slabik vyslovovaných bez distinktivního tónu; tón se zde vlastně realizuje na skupině dvou slabik (popř. i tří až čtyř slabik, jestliže se k tónové slabice enkliticky připojují dvě nebo tři slabiky [243]atónové). Největší podíl četnosti atónových slabik připadá na enklitická pomocná slova jednoslabičná, doložená ve 100 nejvíce frekventovaných lexémů.

Práce na frekvenčním slovníku současné čínštiny probíhaly v l. 1979—1984 a spočívaly hlavně na pracovnících Ústavu výuky Pekingského jazykového institutu (Beijing yuyan xueyuan). Významně se však na nich podíleli i pracovníci Jazykového ústavu (Yuyan yanjiusuo) Čínské akademie společenských věd (Zhongguo shehui kexuyuan), Akademie telekomunikací i jiných institucí.

 

Závěr. Jako většina dosavadních frekvenčních slovníků má i PLC především poslání didaktické, dodat exaktnosti výuce čínštiny, a to zvláště jako jazyku cizímu. Autoři jsou si však vědomi i širšího poslání frekvenčního slovníku, připomínají zejména teorii informace, telekomunikaci apod. Jak jsme mohli jen stručně naznačit, frekvenční slovník současné čínštiny znamená v statistických datech, která uvádí, ale i v datech, která je možno z nich dále odvodit, jak to ostatně plyne z povahy frekvenčních slovníků obecně, významný objektivní základ ke kvantitativnímu popisu současné čínštiny, resp. důležitý přínos ke studiu současné čínštiny vůbec, a to nejen psané, ale i mluvené, k studiu jazykových charakteristik jednotlivých funkčních stylů apod. Slovník však znamená i významný vklad do typologického studia jazyků; tím, že se metodologicky v podstatě shoduje s frekvenčními slovníky evropských jazyků, vytvořil předpoklady ke kvantitativnímu studiu typologicky odlišných jazyků, srov. např. porovnání s jazyky flektivními apod.

 

LITERATURA

 

BINYONG, YIN: Hanyu yusu d dingliang yanjiu (K otázce stanovení počtu bází v čínštině). Zhongguo yuwen (Čínský jazyk), 1984, č. 5, s. 338—347.

JELÍNEK, J. - BEČKA, J. V. - TĚŠITELOVÁ, M.: Frekvence slov, slovních druhů a tvarů v českém jazyce. Praha 1961. Dále FSČ.

JUILLAND, Al. - BRODIN, D. - DAVIDOVITCH, C.: Frequency dictionary of French words. The Hague 1970.

JUILLAND, Al. - CHANG-RODRIGUEZ, E.: Frequency dictionary of Spanish words. The Hague 1964.

TĚŠITELOVÁ, M.: Über die Wissenschaftssprache aus quantitativer Sicht. In: Linguistica generalia, 2, 1977, s. 21—36.

TĚŠITELOVÁ, M.: Kvantitativní lingvistika. Praha 1987. 1. vyd. 1977. Skripta UK.

XIANDAI HANYU CIDIAN (SLOVNÍK SOUČASNÉ ČÍNŠTINY). Peking 1979.


[1] Koeficient užití (U), přejatý z frekvenčních slovníků Al. Juillanda (1964 aj.), je dán součinem frekvence slova (F) a jeho disperze (D), tj. doložením slova v jednotlivých textech korpusu, ev. jejich částech, lomeno 100.

[2] Rank je číslo přiřazené jednotkám (slovům) uspořádaným podle frekvence (zpravidla klesající) tak, že jednomu údaji o frekvenci odpovídá pouze jeden rank, i když těchto jednotek může být i více; liší se od pořadí, když každé jednotce — při uspořádání zpravidla podle klesající frekvence — přiřazujeme různé číslo, i když několik jednotek má touž frekvenci, srov. Těšitelová, 1987.

Slovo a slovesnost, ročník 51 (1990), číslo 3, s. 237-243

Předchozí František Štícha: Sovětská monografie o typologii reflexív

Následující Jaroslava Pačesová: Sté výročí založení Mezinárodní fonetické asociace a otázky fonetické transkripce