Časopis Slovo a slovesnost
en cz

K frekvenci pádů v současné spisovné češtině

Marie Těšitelová

[Články]

(pdf)

О частотах падежей в современном литературном чешском языке / Fréquence des cas en tchèque littéraire contemporain

Pád u substantiv patří vedle čísla a rodu ke gramatickým kategoriím, jejichž frekvenci zjišťujeme — ať úmyslně, nebo bezděčně — při jakékoli statistické analýze slov v jazycích flektivního typu. Slovem totiž zpravidla rozumíme tvary slov (rus. slovoforma), které se ve většině slovanských jazyků u jména i u slovesa vyznačují relativně velkým počtem, a to již od staršího období vývoje těchto jazyků.[1] U jmen, zvl. substantiv, jejichž tvar vyjadřuje zpravidla koncovkou pád a číslo, mají nadto pády i tzv. samostatné významy, takže i u izolovaných tvarů, s nimiž obvykle pracujeme při statistické analýze textů, můžeme do značné míry určit jejich význam,[2] a proto má i smysl zjišťovat frekvenci pádů vůbec na základě frekvence jednotlivých tvarů. Vzhledem k tomu, že substantiva a jejich tvary zaujímají zvláštní postavení jak mezi jmény, tak i ve frekvenci slov vůbec, budeme v tomto příspěvku věnovat pozornost frekvenci pádů u substantiv v současné spisovné češtině.

Frekvence pádů u substantiv se zřetelem k různým stylovým vrstvám byla v češtině již studována.[3] Bylo prokázáno, že se např. od frekvence pádů, kterou možno brát jako jistou „normu“ pro češtinu vůbec (i když opatrně vzhledem k nestejně dlouhým stylovým skupinám, do nichž jsou texty FSČ rozřazeny), liší se frekvence pádů v beletrii (ve FSČ označena jako A) od frekvence pádů ve vědecké odborné literatuře (G). Ukazuje to i následující tabulka, v níž jsou pády charakterizovány pořadovým číslem (od 1—7), které

 

 

Pořadí pádů uspořádaných podle klesající frekvence

N

G

D

A

V

L

I

N

G

D

A

V

L

I

sg.

pl.

FSČ

1

2

6

3

7

4

5

2

1

6

3

7

4

5

Skupina A

1

3

6

2

7

5

4

1

2

6

3

7

5

4

Skupina G

2

1

6

3

4

5

2

1

6

3

4

5

Tab. č. 1

 

[270]jim bylo přiřazeno při uspořádání podle klesající frekvence, a to odděleně pro singulár a pro plurál.[4]

Z tohoto jednoduchého přehledu vyplývá, že v češtině, ale i v beletrii (A) má relativně největší frekvenci Nsg, tedy pád, který zpravidla vyjadřuje subjekt, popř. členy vázané k němu shodou. Na rozdíl od „normy“ v češtině má v beletrii nižší frekvenci Gsg, jehož frekvence je zejména podmíněna častým výskytem genitivu vlastnosti a partitivnosti, než Asg, který lze ztotožnit zpravidla s objektem. Obrácený poměr ve frekvenci pádů v beletrii zjišťujeme u Lsg a Isg, tedy u pádů nejméně syntaktických (srov. o. c. v pozn. 1, zvl. s. 107), které vyjadřují různé okolnosti zejm. ve vztahu k slovesu, resp. predikátu (lokál), ev. tvoří součást predikátu (u instrumentálu). Naproti tomu pro frekvenci pádů ve vědeckých odborných textech je příznačná vysoká frekvence Gsg i Gpl, k jejímuž růstu mimo výše uvedené faktory napomáhá i genitiv záporový, popř. objektový. Jak v beletrii, tak v odborné literatuře mají stabilně nejnižší frekvenci Dsg a Dpl, pády vyjadřující nepřímé zasažení předmětu, a vokativy, Vsg a Vpl, pády, o jejichž oprávněnosti v pádovém systému se někdy pochybuje, popř. jež bývají kladeny na periférii pádového systému.

Nabízí se dále otázka, zda a jak se ve frekvenci jednotlivých pádů projevuje nebo může projevit individuální styl autora nebo textu v rámci jednotlivých stylů, v našem případě tedy stylu uměleckého a stylu odborného. K ověření této otázky jsem zvolila především vždy 6 textů z FSČ, a to jednak ze skupiny A, jednak ze skupiny G, a to tak, aby minimálně dva texty byly relativně stejně dlouhé, aby tu bylo možno srovnávat při zachování některých vnějších podmínek. Zvoleny byly tyto texty:

Skupina A: K. Horký, Pískání v lese — 28 084 slov (z toho 6 578 substantiv), J. Mařánek, Barbar Vok — 30 145 slov (9 324 substantiv), V. Vančura, Konec starých časů — 30 281 slov (8 308 substantiv), J. Marek, Vesnice pod zemí — 31 195 slov (6 614 subst.), K. Nový, Rytíři a lapkové — 33 774 slov (10 218 subst.), J. Hora, Hladový rok — 35 273 slov (9 997 subst.). Kromě toho byly k této skupině přiřazeny 2 texty, z nichž byl pořízen náhodný výběr (viz dále): J. Otčenášek, Kulhavý Orfeus — 4 355 slov (1 087 subst.), I. Kříž, Úsek častých nehod — 4 535 slov (1 016 subst).

Skupina G: J. Janko, Základy statistické indukce — 17 249 slov (5 520 subst.), K. Přerovský, Terapie uhličitá — 18 448 slov (6 167 subst.), R. Souček, Psychoanalýza — 20 603 slov (6 018 subst.), V. Úlehla, Zamyšlení nad životem — 20 340 slov (5 735 subst.), Zd. Nejedlý, Dějiny národa českého — 31 250 slov (8 178 subst.), K. Honzík, Tvorba životního slohu — 33 700 slov (10 334 subst.). Dále sem byly přiřazeny 2 texty, z nichž byl pořízen náhodný výběr slov, a to: K. Kosík, Dialektika konkrétního — 4 441 slov (1 534 subst.), E. Severin—V. Kasika, Průmyslová televize — 4 845 slov (1 754 subst.).

Sledujeme-li frekvenci pádů u jednotlivých autorů v uvedených textech, zjišťujeme, že tu existují odchylky od výše zmíněných norem platících jednak pro češtinu vůbec, jednak pro různé styly (srov. skup. A a G), jak ukazuje následující přehled, uvádějící pořadí pádů uspořádaných podle klesající fre[271]kvence odděleně v singuláru i v plurálu v jednotlivých textech beletristických a dále i odborných:

 

A

Autor

Pořadí pádů podle klesající frekvence

N

G

D

A

V

L

I

N

G

D

A

V

L

I

 

sg.

pl.

K. Horký

1

3

6

2

7

4

5

2

1

6

3

7

4

5

J. Mařánek

1

2

6

3

7

5

4

2

1

6

3

7

5

4

V. Vančura

1

3

6

2

7

4

5

3

2

6

1

7

4

5

J. Marek

1

3

6

2

7

4

5

1

3

6

2

7

5

4

K. Nový

1

2

6

3

7

5

4

2

1

6

3

7

5

4

J. Hora

1

2

6

3

7

5

4

1

3

6

2

7

5

4

J. Otčenášek

1

2

7

3

6

5

4

1

3

6

2

7

5

4

I. Kříž

1

3

6

2

7

4

5

3

1

6

2

5

4

Tab. č. 2

 

Stabilní postavení tu mají z pochopitelných důvodů relativně nejfrekventovanější pády Nsg a Npl a pády nejméně frekventované: Dsg, Dpl, Vsg a Vpl. Zvláštní pozornosti si zaslouží individuální odchylky v užívání pádů, a to vždy jen v rámci dvou pádových dvojic, a to Gsg-Asg, Lsg-Isg i Lpl-Ipl. V plurálu dochází ke kolísání i v rámci tří pádů, Npl-Gpl-Apl, což lze vysvětlit zejm. tím, že tvary plurálové jsou podstatně méně frekventované než tvary singulárové (poměr 3 : 1).

Avšak i kolísání ve frekvenci jednotlivých pádů v singuláru a v plurálu, hodnoceno z hlediska statistického (testováním významnosti rozdílu mezi dvěma rozptyly pomocí testu F a rozdílu mezi dvěma průměry pomocí testu t), ukazuje se jako statisticky nevýznamné, resp. jak výběrové rozptyly, tak i rozdíly mezi výběrovými průměry se od sebe liší.

[272]Např. pro Gsg nabývající v jednotlivých textech hodnot 20,58 %, 22,32 %, 16,52 %, 15,36 %, 20,88 %, 19,20 %, je

 

a t dané vzorcem

 

Pro Asg (nabývající hodnot 21,81 %, 18,07 %, 24,84 %, 21,81 %, 20,33 %, 20,50 %) dostáváme hodnoty

 

t = 0,2796 < t0,05;4 = 2,776

Pro Lsg a Isg jsou výběrové průměry v podstatě totožné:

Lsg (x̄1 = 10,27, x̄2 = 10,52); Isg (x̄1 = 10,21, x̄2 = 10,13).

Domnívám se, že odchylky v užívání jednotlivých pádů, zejm. vyjadřujících objekt, vlastnosti, různé okolnosti děje apod., i když statisticky nevýznamné, jsou podmíněny nejen významem těchto pádů, ale i individuálním stylem autora, tematikou textu apod. Např. v textech s historickými náměty (Mařánek, Nový), kde jde o častější určování slovesného děje vzhledem k času a k místu, nacházíme relativně vyšší frekvenci Lsg i Lpl, než má např. více úvahový a jazykově experimentující text Vančurův. Podle normy platící v beletrii by měly být u Vančury Lsg a Lpl frekventovanější než Isg a Ipl. Kromě toho je u Vančury nápadná i relativně nízká frekvence Npl, při čemž Apl má naopak frekvenci relativně vysokou; patrně vlivem úvahových a popisných částí textu, které kladou větší důraz na objekt než na subjekt.

Pokud jde o odborné texty, nacházíme tu — jak lze očekávat — relativně větší ustálenost v užívání pádů, což je dáno zejm. opakováním odborných termínů, ustálených vazeb a obratů odborného stylu, ale přesto se zde projevují individuální odchylky u jednotlivých autorů a textů, jak ukazuje tabulka č. 3 na s. 273.

Porušení stability ve frekvenci Gsg (u Součka a Úlehly) ve prospěch Nsg, i když statisticky nevýznamné (výběrové průměry jsou tu téměř shodné:

Gsg (x̄1 = 28,68, x̄2 = 28,67), Nsg (x̄1 = 26,45, x̄2 = 26,58),

je patrně dáno blízkostí stylu uvedených textů stylu beletrie, uměleckému, resp. populárnějším zpracováním odborné tematiky.

Dokládá to dobře text K. Chocholy Spalovací motory (zařazený ve FSČ do skupiny E, tj. mezi texty populárně odborné), kde mají Nsg a Npl jednoznačně největší frekvenci, jako je tomu v textech skupiny A. Frekvence ostatních pádů se nevy-

 

[273]G

Autor

Pořadí pádů podle klesající frekvence

N

G

D

A

V

L

I

N

G

D

A

V

L

I

 

sg.

pl.

J. Janko

2

1

6

3

4

5

3

1

6

2

4

5

K. Přerovský

2

1

6

3

4

5

2

1

6

3

4

5

R. Souček

1

2

6

3

5

4

2

1

6

3

5

4

V. Úlehla

1

2

6

3

4

5

2

1

6

3

4

5

Zd. Nejedlý

2

1

6

4

3

5

2

1

6

3

4

5

K. Honzík

2

1

6

3

5

4

2

1

6

3

4

5

K. Kosík

2

1

6

3

5

4

2

1

6

3

5

4

E. Severin

V. Kasika

2

1

6

4

3

5

2

1

6

3

5

4

Tab. č. 3

myká normě pro skupinu G, která je ve FSČ shodná s normou ve skupině E. Je zajímavé, že ustáleností ve frekvenci Nsg a Npl se vyznačuje i frekvence pádů zjišťovaná náhodným výběrem (viz dále) na jednotlivých stránkách textu. Lze to vysvětlit tím, že v daném případě autor popisuje činnost motorů tak, že tu stroj i jeho jednotlivé součástky vystupují jako nositelé rozmanitých činností a stavů.

K posouzení stability ve frekvenci jednotlivých pádů u substantiv je užitečné přihlédnout i k výsledkům frekvence pádů při tzv. náhodném výběru, pořízeném u 3 textů beletristických a 3 textů odborných podle formule[5]

 

Pokud jde o beletrii, byl zvolen jednak text pojatý do FSČ (aby bylo možno srovnávat výsledky výběru mechanického a výběru náhodného), a to Vl. Vančura, [274]Konec starých časů, a dále texty nové: J. Otčenášek, Kulhavý Orfeus, I. Kříž, Úsek častých nehod; z odborné literatury byl v prvém případě vybrán text K. Chocholy Spalovací motory a dále: K. Kosík, Dialektika konkrétního, E. Severin—V. Kasika, Průmyslová televize.

Tabulky sestavené pro frekvenci pádů na jednotlivých náhodně vybraných stránkách textů ukazují některé tendence týkající se ustálenosti frekvence jednotlivých pádů, kterou jsme konstatovali výše.

V beletrii to platí především o frekvenci Nsg a Npl (projevuje se v 50 % i výše). Ve frekvenci všech ostatních pádů je značné kolísání, zejména v plurálu, což je zřejmě podmíněno relativně nízkou frekvencí těchto pádů. Nejen u pádů plurálových, ale i singulárových střídají se navzájem nejen frekvence Gsg a Asg, ale i Lsg a Isg. Je to ovšem podmíněno i relativně malým počtem dokladů pro pády méně frekventované a zřejmě i specifikou významu jednotlivých pádů ve vztahu k měnící se skutečnosti apod.

V odborných textech, necháme-li stranou již zmíněný text Chocholův, projevuje se vysoká ustálenost frekvence Nsg (jako druhého nejčastějšího pádu, u Kosíka v 11 případech z 15, v Průmyslové televizi dokonce v 10 případech z 11). Pokud jde o Npl a Gpl, je tu mezi frekvencí obou pádů kolísání v poměru 1 : 1; jinak je zde jako v textech beletristických relativně značné kolísání v rámci několika pádů, zejména Asg, Lsg a Isg, podmíněné zřejmě malým počtem dokladů.

Závěr: Frekvence pádů v češtině se vyznačuje značnou ustáleností, která je do velké míry stylisticky podmíněná. Pro beletrii je typická největší frekvence Nsg a Npl. Jinak se kolísání ve frekvenci projevuje vždy v rámci dvojice pádů, a to Gsg a Asg, Lsg a Isg, ev. Lpl a Ipl. — Pro texty odborné lze jako normu označit nejvyšší frekvenci Gsg a Gpl, ev. kolísání v rámci Nsg a Gsg, Lsg a Isg, Lpl a Ipl. I když rozdíly mezi frekvencí jednotlivých pádů nejsou statisticky významné, lze odchylky u jednotlivých autorů, popř. v jednotlivých textech vysvětlit významem jednotlivých pádů v češtině i individuálním stylem autora, tematikou, způsobem zpracování textů apod.

Pro metodologii práce při zjišťování frekvence pádů pak plyne, že u nejfrekventovanějších jevů lze celkem vystačit s výběrem náhodným.

 

R É S U M É

Zur Frequenz der Kasus in der gegenwärtigen tschechischen Schriftsprache

Auf Grund der statistischen Analyse der 8 Texte der Belletristik und derselben Zahl der Fachtexte wird die Frequenz der Kasus im Tschechischen folgendermaßen charakterisiert:

Die Frequenz der Kasus in der tschechischen Schriftsprache scheint verhältnismäßig konstant, aber stilistisch bedingt zu sein. In der Belletristik kommen die Nsg und Npl am häufigsten vor, was man als eine typische Eigenschaft der betreffenden Spracherscheinung bezeichnen kann. In den anderen Kasus finden wir, meistens in den einzelnen Paaren der Kasus, d. h. in den Dsg und Asg, Lsg und Isg, [275]bzw. Lpl und Ipl, eine bestimmte Schwankung in der Frequenz. Was die Fachliteratur betrifft, kann man für eine Norm die höchste Frequenz, der Gsg und Gpl und ein bestimmtes Schwanken im Rahmen der Kasuspaare, und zwar der Nsg und Npl, Lsg und Isg, Lpl und Ipl, halten. Obwohl die Unterschiede in der Frequenz der einzelnen Kasus statistisch keine Bedeutung haben, kann man die Abweichungen bei den einzelnen Autoren, bzw. in den einzelnen Texten durch die Semantik der betreffenden Kasus im Tschechischen, aber auch durch das Thema, die Methoden der Textbearbeitung u. ä. erklären. Was die Methodologie der statistischen Analyse betrifft, hat unsere Untersuchung gezeigt, daß ein statistisch repräsentatives Korpus zur Feststellung der häufigsten Kasus im Tschechischen durch die zufällige Auswahl erreicht werden kann.


[1] Srov. Vl. Skalička, Vývoj jazyka, Praha 1960, zvl. s. 93—110.

[2] Srov. Vl. Skalička, Poznámky k teorii pádů, SaS 12, 1950, 134—152; též D. Konečná, Poznámky k významům „izolovaných“ pádů v současné spisovné češtině, SaS 21, 1960, 24—33.

[3] J. Jelínek—J. V. Bečka—M. Těšitelová, Frekvence slov, slovních druhů a tvarů v českém jazyce (dále jen FSČ), Praha 1961, zvl. s. 93—95; srov. též M. Těšitelová, Frekvence slov a tvarů ve spise „Život a dílo skladatele Foltýna“ od Karla Čapka, NŘ 32, 1948, 126—130.

[4] V tomto příspěvku — ve shodě s pracemi cit. v pozn. 3 — nerozlišují se víceméně z technických důvodů pády prosté od lokálu, pádu vysloveně předložkového. Je samozřejmé, že při podrobnější analýze bude třeba tento zásadní rozdíl respektovat. Nutnost toho ukazuje i naše analýza v tomto článku, srov. dále speciální postavení lokálu.

[5] Srov. M. Königová, K otázce statistického výběru v lingvistice, SaS 26, 1965, s. 164, 165.

Slovo a slovesnost, ročník 30 (1969), číslo 3, s. 269-275

Předchozí Bohumil Palek: Type-token a lingvistika

Následující Jan Průcha: K syntaktickým rozdílům mezi psanými a mluvenými texty