Časopis Slovo a slovesnost
en cz

Frekvence slov a tvarů substantiv a sloves v běžně mluveném jazyce

Bohumír Dejmek

[Articles]

(pdf)

Frequency of noun and verb words and forms in everyday spoken language

0. Kvantitativnímu průzkumu mluveného jazyka se v současnosti věnuje značná pozornost. Zjišťováním jeho výrazných znaků se zabývají odborná pracoviště, např. Ústav Českého národního korpusu při FF UK (k výzkumu mluvené češtiny viz Šonková, 2000), i specifické obory, jako je aplikovaná pedagogika, zvlášť zaměřená na výuku mateřského jazyka i jazyků cizích. Zvláštního významu pak nabývá výzkum běžně mluveného jazyka (BMJ): je totiž nejběžnějším prostředkem komunikace mezi lidmi.

Základy tohoto článku byly položeny před mnoha lety v souvislosti s výzkumem BMJ (městské mluvy) Přelouče (viz Dejmek, 1976) s úmyslem volně navázat na Frekvenci slov, slovních druhů a tvarů v českém jazyce (Jelínek – Bečka – Těšitelová, 1961; dále FSČ).

FSČ vychází z jazyka mnoha stylů a žánrů, z jazyka stylu uměleckého, odborného, publicistického a hovorového. Jsou tu excerpovány texty charakteristické pro výše uvedené styly. Styl hovorový, který nás nejvíce zajímá, je reprezentován dvěma skupinami:

(1) Mluvenými projevy uveřejněnými tiskem (skupina H), jejichž „mluvenost“ je však silně omezena tím, že jde o psané texty.

(2) Dramaty (skupina D), která měla vyvažovat nedostatek „mluvenosti“. Dramata vykreslením různých sociálních prostředí a charakterů v dialozích do jisté míry reprezentují mluvený jazyk, ale jde v nich především o umělecké ztvárnění se všemi charakteristickými rysy uměleckého stylu.

Autoři FSČ přiznávají, že se záznamy mluvených projevů byly problémy, a proto chtěli tento nedostatek do jisté míry kompenzovat žánry relativně blízkými. My však takové mluvené projevy, realizované BMJ, tedy ve sféře běžně dorozumívací, máme k dispozici, a proto si dovolujeme tuto chybějící část FSČ doplnit. Chceme-li poznat zákonitosti v slovní zásobě jazyka i v jeho gramatické stavbě, je třeba poznat kvantitativní poměry v jazyce (FSČ, s. 93)[1] komplexně.

Běžně mluveným jazykem rozumíme soubor mluvených prostředků (spisovných i nespisovných) fungujících ve vymezené komunikační sféře, v projevech vyznačujících se „komplexní mluveností“.[2] Je poznamenán výběrem slovní zásoby a specifickými stylistickými prostředky (využití slov parazitních, kontaktových), častým opakováním slov, různými nepravidelnostmi větné stavby, častými přerušováními, nedokončením projevu apod.

Tento článek si klade za cíl zpracovat náš materiál ve velkém zestručnění[3] a upozornit na případné shody a rozdíly ve frekvenci slov a tvarů mezi BMJ a ostatními styly [16]a žánry. Naše pojednání ovšem představuje torzo původní koncepce. Celý materiál potřebný k našemu účelu nebyl v letech, kdy probíhal jazykový výzkum v Přelouči, tj. na konci 60. let, pro jiné úkoly explorátora zpracován. Zůstala však podstatná část, kterou autor kdysi začal ručně zpracovávat a která dnes dovoluje zachytit frekvenci slov a tvarů v podobě a množství, které jsou využitelné pro srovnání s některými výsledky FSČ. Pořadí slov, zejména s malým zastoupením, a frekvenci slovních druhů z části, která zůstala v rukou autorových, už nebylo možné sumarizovat.

 

1. Zásady pro výběr a tabulaci frekvence slov a vybraných tvarů

1.1. Výběr pramenů

FSČ vychází z materiálu získaného ze 75 pramenů, podle stylových vrstev rozdělených do 8 skupin; námi sledované D-dramata vychází z 10 pramenů, H-mluvené projevy uveřejněné v tisku pak ze 4 zdrojů (FSČ, s. 10 a 22).

Náš materiál byl získán od 7 respondentů (R)[4] – pramenů. Jejich stručná charakteristika:

R1 – muž, 40 let, narozen v Lipolticích (6 km jižně od Přelouče), v zemědělsko-dělnickém prostředí. Pokrývač, nejvyšší vzdělání – měšťanská škola. Bydlí v Přelouči.

R2 – žena, 35 let, narozena ve Vrdech-Bučicích v živnostenské rodině. Gymnázium v Kutné Hoře, Plzeň, Praha vysoká škola; od roku 1957 žije v Přelouči – lékařka.

R3 – žena, 36 let, narozena v Litomyšli, tam vyrůstala a chodila do školy. V roce 1952 se provdala do Přelouče, má středoškolské vzdělání a pracuje jako úřednice.

R4 – muž, 40 let, narozen v Přelouči v rodině státního zaměstnance. Obecnou a měšťanskou školu vychodil v Přelouči. Má středoškolské vzdělání a pracuje jako náměstek technického ředitele v Průmstavu.

R5 – muž, 35 let, narozen v Přelouči v řemeslnickém prostředí. V Přelouči vychodil obecnou a měšťanskou školu. Vzdělání nižší odborné – učňovská škola. Dělnický údržbář.

R6 – žena, 32 let, narozena v Přelouči v dělnické rodině; obecnou i měšťanskou školu vychodila v Přelouči, střední zdravotní školu v Pardubicích. Zdravotní sestra v Přelouči.

R7 – muž, 39 let, narozen ve Svinčanech (8 km jihovýchodně od Přelouče) v řemeslnicko-zemědělské rodině. Do obecné školy chodil ve Svinčanech, do měšťanské školy v Cholticích. Pracoval jako kvalifikovaný dělník v Přelouči, pak školník tamtéž.

Besedy s každým R probíhaly v různých situacích, na různá témata (jsou patrna ze záznamů částí souvislých projevů, viz Dejmek, 1976, s. 201–211) a explorátor měl ke každému R sice blízký, ale přece jen různý vztah, od nejbližšího příbuzného po kamarády a sousedy až po původně málo známé osoby (blíže viz Dejmek, 1976, s. 23–25).

 

1.2. Metoda tabulace

Naše zpracování frekvence slov a tvarů substantiv a sloves dodržuje ve značné míře metody tabulace, jak je uvádí FSČ na s. 22–24, aby výsledky mohly být co nejvíce srovnatelné.

V následující části vytýkáme některé zásady, které jsou obsaženy ve FSČ, ale i ty, které se více či méně od FSČ liší a které by mohly do jisté míry frekvenci slov ovlivnit.

(1) Za samostatná slova jsme považovali:

[17](a) předložky,

(b) jednotlivé členy sousloví (střední škola, Kutná Hora apod.),

(c) spojky aby, kdyby; u těchto spojek ve spojení s podmiňovacím způsobem jsme postupovali jinak než FSČ, např. v abychom šli jsme vyčleňovali zvlášť spojku aby a zvlášť tvar kondicionálu bychom šli (ve frekvenci slovo řazeno samozřejmě pod jít),

(d) sloveso být/bejt ve významu existence a sponovém; jinak je zahrnuto ve frekvenci složených slovesných tvarů,

(e) zájmena se, si, pokud měla funkci předmětu (bylo možno nahradit je podobami sebe, sobě), např. zvolil si; odlišení od typů 2b bylo velmi nesnadné, někdy i nemožné.

(2) Za samostatná hesla jsme pokládali:

(a) slovesné tvary složené: přišel jsem, budu hlídat, řek(l) bych,

(b) spojení reflexiv se, si se slovesem, šlo-li o reflexiva tantum (smát se), dále o slovesa, která mají s reflexivem jinou vazbu (dobývat něco x dobývat se do něčeho), nebo o slovesa, kde se, si vyjadřují reciprocitu (líbali se); v takových případech se, si nezapočítáváme, ale zaznamenáváme, např. dělat (se); typy šlo se jsou zachyceny u pasiva zvratného.

(3) Problémy třídění slov

Řazení k slovním druhům bylo někdy velmi obtížné; vedle jasných případů existovaly situace, kdy slovnědruhová příslušnost slova byla sporná nebo nejasná, např. u slov jako jo, no, nu, že, jak, co, tak, v BMJ zvlášť četných. Taková polyfunkční slova zařazujeme pod jedno heslo (stejně tak činí i FSČ).

(4) Řazení hesel a jejich podoba

(a) hesla řadíme podle základního tvaru slova; u jmen podle nominativu, u sloves podle infinitivu (přišli jsme řadíme pod přijít),

(b) nespisovné nebo různé deformované podoby spisovných slov se uvádějí ve slovníku pod spisovným tvarem, za lomítkem na nespisovnou podobu upozorňujeme, ale zvlášť ji nevyčíslujeme, např. obecněčeské von (vyskytující se v této podobě téměř ve 100 %) řadíme pod on/von,

(c) výrazy, které neměly spisovný protějšek nebo které se výrazněji odlišovaly hláskovou nebo slovotvornou podobou, jsme řadili podle jejich zvukové podoby, např. bajvočko, ajznboňák apod.,

(d) individualismy a slova polysémantická jsou zařazována buď jako samostatná hesla, např. šumovat (ve špajzu šumuje), nebo se přiřazují ke slovu se základním významem, např. von ho sejmul (=srazil) pod sejmout, dal si krajskýho (=velkého panáka) pod krajský.

Přestože se hesla pod 4 (b)-(d) v našem výrazně zestručnělém článku, resp. v kratičké slovníkové části, téměř nevyskytují (s výjimkou být/bejt, on/von, když/dyš), chtěli jsme svými poznámkami spíše jen naznačit, že problematika záznamu slov se může v BMJ od postupů ve FSČ někdy lišit.

 

1.3. Pořadí slov podle frekvence

Pořadí slov začíná slovem s nejvyšší frekvencí a končilo by slovy s frekvencí 1. Zde uvádíme 20 nejfrekventovanějších slov, ostatní jsou v domácím záznamu autora tohoto článku. Na rozdíl od FSČ není třeba u našeho přehledu zkráceného pořadí uvádět [18]u hesla všechna čísla,[5] která pořadí hesel určují. Hesla jsou excerpována z jedné skupiny, z BMJ, a prvních 20 hesel v našem pořadí použilo všech 7 respondentů. Na dalších místech by ovšem hodnota frekvence, a tedy i pořadí, mohla být dána nejen absolutní frekvencí, nýbrž i počtem respondentů, u nichž je slovo doloženo. To jsme ovšem nemohli důsledně, zejména u slov s menší četností, sledovat.

 

2. Frekvence slov v BMJ

Tab. č. 1

R

počet slov

 

  %

pořadí slov

R1

9313

 

  16,7

2

R2

8507

 

  15,3

3

R3

6885

 

  12,4

5

R4

6833

 

  12,3

6

R5

10393

 

  18,7

1

R6

6238

 

  11,2

7

R7

7430

 

  13,4

4

celkem

55599

 

100,0

 

 

2.1. Frekvence prvních 20 slov v BMJ ve srovnání s týmiž slovy ve FSČ, a to ve skupinách D, H a celkem (C)[6]

Tab. č. 2

Pořadí a slovo

BMJ

D

 

H

 

C

 

1.

ten

5240/7[7]

6991/10

1.

3656/4

2.

44964/8[8]

2.

2.

být/bejt

2541/7

5758/10

2.

2733/4

3.

43148/8

3.

3.

a

1925/7

4301/10

3.

4781/4

1.

67122/8

1.

4.

on/von

1519/7

2758/10

5.

1057/4

10.

32496/8

5.

5.

1157/7

3781/10

4.

378/4

32.

11060/8

12.

6.

no

1124/7

249/10

69.

3/1

?.

480/7

368.

7.

mít

1079/7

1863/10

8.

780   

12.

11426   

11.

8.

tak

1028/7

1301/10

14.

483   

26.

7930/8

20.

9.

na

872/7

2302/10

6.

1363/4

6.

27753/8

6.

10.

tam

872/7

355/10

54.

136/4

66.

2594/8

69.

11.

že

707/7

1900/10

7.

1393/4

5.

18092/8

7.

12.

v(e)

613/7

1688/10

10.

1960/4

4.

33679/8

4.

13.

jo

519/7

32/5  

?.

0   

115/4

1713.

14.

ale

469/7

1372/10

13.

488/4

25.

9406/8

16.

15.

když/dyš

445/7

657/10

30.

302/4

39.

5819/8

31.

16.

jít

406/7

599/10

35.

244/4

43.

3336/8

50.

17.

do

403/7

798/10

20.

516/4

24.

10831/8

14.

18.

se

395/7

561/10

37.

657/4

16.

7174/8

23.

19.

s(e)

392/7

1119/10

15.

587/4

20.

14951/8

8.

20.

jak

347/7

615/10

32.

454/4

30.

6123/8

29.

[19]Mezi prvními dvaceti slovy jsou zastoupena především zájmena (ten, on/von, ), částice (no, jo, tak, že), spojky (a, že, ale, když/dyš), předložky (na, v(e), do, s(e)), dále slovesa, nejčastěji sponové být/bejt, mít a z plnovýznamových sloveso jít.

Pořadí ve všech třech sloupcích z FSČ odpovídá situaci v BMJ jen u prvních tří hesel, ale na prvních pěti místech jsou si skupiny BMJ a D velmi blízké. Pořadí sledujeme i u C, kde hesla uvedená v BMJ jsou na předních místech, tj. do 50. místa (výjimku tvoří jen no a zvláště jo – viz dále).

Časté užívání zájmena ten víceméně potvrzuje názory některých lingvistů, že ten v mluvených nespisovných projevech nabývá – stojí-li před substantivem – podobnou funkci, jakou mají v některých jazycích členy (ten řidič tu ženskou vyhodil ze dveří). Zájmeno ten v BMJ silně převyšuje ostatní hesla; do celkového počtu zařazujeme i podoby tenhle, tenle, tenhleten, tenleten, tenhlencten, tendlencten, dokonce i případy, kde zájmeno ten zastupuje sloveso, např. potentočkovat.[9]

Také počet a by se změnil, kdybychom postupovali přesně podle FSČ. Spojení abychom přišli rozkládal FSČ na a+bychom přišli. V našem případě jsme vyčleňovali spojku aby+podmiňovací způsob. K počtu spojky a bychom tedy – abychom mohli lépe srovnávat – měli připočíst všechna a ze spojky aby, tj. 152. Pozici a by to však v BMJ neovlivnilo.

S prvními 20 hesly v BMJ nejvíce koresponduje skupina D, a to 15 hesly, i když na různých místech, zatímco ve skupině H jen 10 hesly. Zvláštní postavení v D, H i C – ve srovnání s BMJ – mají hesla no a jo. V BMJ figuruje no na 6. pozici a jo na 13., v D je no 69. v pořadí a jo počtem 32/5 stojí v dalekém odstupu od předních míst; v H no svým zastoupením 3/1 patří na zcela koncové pozice, jo se nevyskytuje vůbec.[10]

Z plnovýznamových slov nám stav našeho materiálu dovoluje sledovat jen substantiva a verba. Substantiva se mezi prvními dvaceti slovy nevyskytují. Dále je můžeme sledovat jen u jednotlivých respondentů. Jako 38. se umístilo substantivum Bojda (hypokoristikon explorátora) u R3. Toto jméno je první substantivum i u R4 (49.). Další substantiva se objevují v pořadí až kolem 50. místa a na dalších místech: muž (R6 – 47.), pán (R2 – 49.), Jirka (R6 – 49.), škola (R4 – 51., R7 – 55.), kluk (R1 – 63.), metr (R5 – 64.) atd. Kdybychom mohli pracovat se součty substantiv u všech R, jejich pořadí by se silně propadla.

Slovesa vstupují do pořadí mnohem dříve a ve větším počtu. Mít a jít jsou dokonce v první dvacítce hesel v BMJ. Mezi prvními dvaceti hesly u jednotlivých R jsou ještě výrazněji zastoupena slovesa dát (si), říkat, dělat (si), chtít, myslet (si) aj.

 

3. Frekvence substantiv a sloves

Z důvodů výše uvedených se ze slovních druhů orientujeme pouze na frekvenci substantiv a sloves. Srovnáváme jejich zastoupení v BMJ a ve FSČ, a to skupiny D, H a C.

[20]Tab. č. 3

 

BMJ

%

D

%

H

%

C

%

substantiva

9034

43,5

28318

46,6

24222

60,1

 

60,5

verba

11717

56,5

32451

53,4

16071

39,9

 

39,5

V BMJ je nejnižší poměrné zastoupení substantiv ve srovnání s ostatními skupinami (i s C), naopak nejvyšší zastoupení sloves. Slovesa převažují i v D. Skupina H je s větším počtem substantiv v souladu s C.

 

3.1. Frekvence pádů u substantiv

Tab. č. 4 

 

BMJ

%  

D   

%  

H   

%  

C   

%  

singulár

 

 

 

 

 

 

 

 

1. pád

2161

23,9

6757

23,9

4185

17,3

 

22,5

2. pád

866

9,6

3048

10,8

4706

19,4

 

16,9

3. pád

207

2,3

907

3,2

898

3,7

 

3,4

4. pád

1978

21,9

5961

21,1

3726

15,4

 

15,0

5. pád

317

3,5

3438

12,1

46

0,2

 

1,8

6. pád

689

7,6

1876

6,6

2242

9,2

 

8,5

7. pád

444

4,9

1592

5,6

16,26

6,7

 

7,7

celkem

6662

73,7

23579

83,3

17429

71,9

 

75,8

 

 

 

 

 

 

 

 

 

plurál

 

 

 

 

 

 

 

 

1. pád

645

7,1

1069

3,8

1496

6,2

 

5,9

2. pád

573

6,3

1072

3,8

2160

8,9

 

7,6

3. pád

59

0,7

202

0,7

344

1,4

 

1,0

4. pád

785

8,7

1503

5,3

1520

6,3

 

4,9

5. pád

14

0,2

176

0,6

162

0,7

 

0,2

6. pád

168

1,9

393

1,4

626

2,6

 

2,4

7. pád

128

1,4

324

1,1

485

2,0

 

2,2

celkem

2372

26,3

4739

16,7

6793

28,1

 

24,2

sg.+pl.

9034

100   

28318

100   

24222

100   

450798

100   

Ve všech sledovaných skupinách převažují tvary singuláru nad plurálem. Co se týče pořadí jednotlivých pádů, skupiny se ne zcela shodují. V BMJ v singuláru jasně převládá nominativ vyjadřující původce, činitele děje (na prvním místě je nominativ také v D a C), jako druhý nejfrekventovanější tvar je akuzativ singuláru označující cíl, výsledek děje a tak je tomu i v D. Z ostatních pádů v singuláru má relativně silnější postavení ještě genitiv (především v D a H), příp. lokál, nejmenší zastoupení téměř ve všech skupinách dativ. Ve vokativu singuláru je skupina D svými 12,1 % velmi charakteristická pro mluvený jazyk (BMJ – 3,5 %; skupina H má jen 0,2 %).

V plurálu je zastoupení pádů obdobné jako v singuláru, tzn. že tu střídavě na prvních třech místech figurují akuzativ, nominativ a genitiv, zatímco na 6. pozici všude existuje dativ a nejméně je zastoupen vokativ. Rozdíly mezi skupinami nejsou nijak výrazné.

 

[21]3.2. Frekvence tvarů sloves

3.2.1. Celkové zastoupení slovesných tvarů

Tab. č. 5 

 

BMJ

%  

D   

%  

H   

%  

C   

%  

Ind. préz. akt.

5786

49,4

16493

50,8

7209

44,9

15038

39,0

Imperativ

412

3,5

2378

7,3

339

2,1

7547

2,6

Préteritum

 

 

 

 

 

 

 

 

(perf. ind. akt.)

3284

28,0

6045

18,6

3073

19,1

101466

34,4

Infinitiv

1133

9,7

4014

12,4

2728

17,0

32450

11,0

Přechodníky

0

0   

13

0,0

36

0,2

2610

0,9

Plusquamperf.

0

0   

3

0,0

6

0,0

66

0,0

Kondicionál préz.

622

5,3

2111

6,5

1185

7,4

14950

5,1

Kondicionál min.

0

0   

96

0,4

29

0,2

810

0,3

Složené futurum

150

1,3

615

1,9

383

2,4

3090

1,0

Pasivum

330

2,8

683

2,1

1083

6,7

16699

5,7

Celkem

11717

100   

32451

100   

16071

100   

294726

100   

Vytkněme jen nejvýraznější rozdíly v zastoupení slovesných tvarů (srovnáváme BMJ, D a H; C zůstává jako možnost obecnější orientace).

V indikativu prézenta aktiva, nejčastějším slovesném tvaru, se jednotlivé skupiny příliš neliší. V BMJ má také dominantní postavení – na rozdíl od D a H – préteritum. Skupina D a do jisté míry i BMJ převažují i v imperativu. Naopak pasivum je v D a BMJ zastoupeno méně. Některé tvary pak nebyly v BMJ zaznamenány vůbec (přechodníky, plusquamperfektum, kondicionál minulý), v D a H minimálně.

 

3.2.2. Frekvence osob a čísel u jednotlivých slovesných tvarů (s výjimkou těch, které mají v BMJ nulové zastoupení)

3.2.2.1. Indikativ préz. akt.

Tab. č. 6

 

BMJ

%  

D   

%  

H   

%  

C   

%  

1. osoba sg.

1037

17,9

4250

25,8

735

10,2

 

11,1

2. osoba sg.

689

11,9

1848

11,2

10

0,1

 

4,8

3. osoba sg.

2674

46,2

6960

42,2

3880

53,8

 

58,9

celkem sg.

4400

76,0

13058

79,2

4625

64,1

 

74,8

 

 

 

 

 

 

 

 

 

1. osoba pl.

273

4,7

777

4,7

1074

14,9

 

7,1

2. osoba pl.

281

4,9

1641

9,9

206

2,9

 

3,2

3. osoba pl.

832

14,4

1017

6,2

1304

18,1

 

14,9

celkem pl.

1386

24,0

3435

20,8

2584

35,9

 

25,2

sg.+pl.

5786

100   

16493

100   

7209

100   

115038

100   

Poměr mezi tvary singuláru a plurálu je v BMJ a C zhruba 3:1, v D se tomuto poměru blíží a v H je spíše 2:1. Ve všech skupinách převažuje výrazně 3. osoba, následuje 1. osoba a nejméně je zastoupena 2. osoba. Skupiny BMJ a D jsou si zastoupením 2. osoby velmi blízké, zvl. v singuláru. Ve skupině H se 2. osoba sg. téměř nevyskytuje.

I v plurálu je u tří skupin pořadí stejné jako v singuláru, jen v D má 2. osoba silnější postavení než 3. a 1. osoba.

 

[22]3.2.2.2. Imperativ

Tab. č. 7 

 

BMJ

%  

D   

%  

H   

%  

C   

%  

2. osoba sg.

286

69,4

1244

52,3

18

5,3

 

52,5

3. osoba sg.

0

0   

101

4,2

37

10,9

 

4,2

celkem sg.

286

69,4

1345

56,5

55

16,2

 

56,7

 

 

 

 

 

 

 

 

 

1. osoba pl.

11

2,7

50

2,1

93

27,4

 

9,6

2. osoba pl.

115

27,9

962

40,5

184

54,3

 

32,3

3. osoba pl.

0

0   

21

0,9

7

2,1

 

1,4

celkem pl.

126

30,6

1033

43,5

284

83,8

 

43,3

sg.+pl.

412

100   

2378

100   

339

100   

7547

100   

Postavení imperativu se dosti liší u BMJ a u skupin D, H, C. Poměrně velký počet imperativních tvarů má skupina D. Co se počtu i procentuálního zastoupení týče, málo jsou – pochopitelně – zastoupeny singulárové tvary ve skupině H. V BMJ a v D převládají tvary 2. osoby sg., naopak v H 2. osoby pl. Poměrně vysoké procento má 1. osoba pl. v H. V BMJ se nevyskytují vůbec 3. osoba sg. a 3. osoba pl.

 

3.2.2.3. Infinitiv

Tab. č. 8 

 

BMJ

D

H

C

 

1133

4014

2728

32450

% z celkového počtu sloves

(9,7)

(12,4)

(17,0)

(11,0)

Infinitiv má v BMJ poměrně nízké zastoupení ve srovnání s D a H.

 

3.2.2.4. Préteritum (perfektum ind. akt.)

Tab. č. 9 

 

BMJ

%  

D   

%  

H   

%  

C   

%  

1. osoba sg.

685

20,9

1654

27,4

196

6,4

 

7,3

2. osoba sg.

126

3,8

554

9,2

1

0,0

 

1,6

3. osoba sg.

1648

50,2

2524

41,7

1684

54,8

 

69,8

celkem sg.

2459

74,9

4732

78,3

1881

61,2

 

78,7

 

 

 

 

 

 

 

 

 

1. osoba pl.

257

7,8

262

4,3

375

12,2

 

2,3

2. osoba pl.

45

1,4

581

9,6

39

1,3

 

1,1

3. osoba pl.

523

15,9

470

7,8

778

25,3

 

17,9

celkem pl.

825

25,1

1313

21,7

1192

38,8

 

21,3

sg.+pl.

3284

100   

6045

100   

3073

100   

101466

100   

Také v préteritu mají ve všech skupinách silnou převahu tvary singulárové, a to – až na H (61,2 %) – v poměru 3:1. Nejužívanější je 3. osoba sg., dále ještě 1. osoba sg. v D a BMJ; pozoruhodné jsou nulový výskyt 2. osoby sg. v H a hojněji zastoupená 2. osoba pl. v D.

 

[23]3.2.2.5. Kondicionál préz.

Tab. č. 10

 

BMJ

%  

D   

%  

H   

%  

C   

%  

1. osoba sg.

205

33,0

675

32,0

131

11,0

 

14,4

2. osoba sg.

57

9,1

263

12,4

0

0   

 

5,2

3. osoba sg.

237

38,1

757

35,9

550

46,4

 

55,7

celkem sg.

499

80,2

1695

80,3

681

57,4

 

75,3

 

 

 

 

 

 

 

 

 

1. osoba pl.

46

7,4

101

4,8

232

19,6

 

7,1

2. osoba pl.

21

3,4

188

8,9

46

3,9

 

3,3

3. osoba pl.

56

9,0

127

6,0

226

19,1

 

14,3

celkem pl.

123

19,8

414

19,7

504

42,6

 

24,7

sg.+pl.

622

100   

2111

100   

1185

100   

14950

100   

Kondicionál prézenta je dalším ze slovesných tvarů, v nichž v BMJ a D (i C) jsou tvary singuláru a plurálu v poměru 3:1. Ve skupině H je výskyt 2. osoby sg. nulový, zatímco v D a BMJ je nad průměrem (viz C).

 

3.2.2.6. Složené futurum

Tab. č. 11

 

BMJ

%  

D   

%  

H   

%  

C   

%  

1. osoba sg.

32

21,3

167

27,2

29

7,6

 

15,1

2. osoba sg.

16

10,7

85

13,8

0

0   

 

8,5

3. osoba sg.

51

34,0

205

33,3

140

36,5

 

42,7

celkem sg.

99

66,0

457

74,3

169

44,1

 

66,3

 

 

 

 

 

 

 

 

 

1. osoba pl.

19

12,7

74

12,0

121

31,6

 

13,5

2. osoba pl.

13

8,6

46

7,5

9

2,3

 

4,3

3. osoba pl.

19

12,7

38

6,2

84

21,9

 

15,9

celkem pl.

51

34,0

158

25,7

214

55,9

 

33,7

sg. + pl.

150

100   

615

100   

383

100   

3090

100   

Ve složeném futuru ve všech skupinách vynikají tvary 3. osoby sg., v BMJ a v D ještě 1. osoby sg. Je třeba upozornit na rozdíl 2. osoby sg. i pl. v BMJ a v D, i když jen malý, a v H (sg. 0 %, pl. 2,3 %).

 

3.2.2.7. Pasivum

Tab. č. 12 

 

BMJ

%  

D   

%  

H   

%  

C   

%  

složené

13

3,9

432

63,3

820

75,7

 

69,3

zvratné

317

96,1

251

36,7

263

24,3

 

30,7

složené+zvratné

330

100   

683

100   

1083

100   

16699

100   

V použití dvou forem pasiva se BMJ výrazně liší od FSČ, a to téměř výhradním zastoupením pasiva v podobě zvratné, zatímco D a H (i C) mají častěji pasivum složené.

Tvary přechodníků, kondicionálu minulého a plusquamperfekta se v našem materiálu z BMJ nevyskytly vůbec. Ale i ve skupinách D, H a C jsou tyto tvary velmi málo frekventované.

 

4. Tento článek je jen dílčí sonda do problematiky, tolik složité a rozvětvené. Posuďme, co se podařilo vytěžit z našeho materiálu.

[24]Slovní zásoba BMJ je ovlivňována skutečností, že má většinou dialogický charakter (v tom je mu blízká skupina D), a pokud monologický, pak v něm převládají krátká dynamická vypravování a jednoduché popisy a úvahy.[11] Kromě jazykových prostředků, které jsou běžné v obou formách jazykových projevů, tj. písemné i psané, jako jsou spojky, předložky, zájmena a základní slovesa, slovní zásoba BMJ silně vyzdvihuje funkci částic. Částice no, jo, tak, že, a, jednotlivé i v nejrůznějších kombinacích (no jo, že jo, no tak, no a apod.) fungují jako důležité prostředky kontaktové, resp. jako souhlasné reakce. Funkci částic nabývají také zájmena on/von a to.[12]

I tvary substantiv a sloves signalizují rozdíly mezi BMJ a sledovanými skupinami FSČ.

Ve frekvenci pádů jsou v BMJ nejvýznamnější nominativ a akuzativ, a to jak v singuláru, tak i v plurálu (i když tam v menším počtu). Ve skupině D a H mají tyto pády rovněž silné postavení, ve srovnání s ostatními pády však tolik nevynikají. Jejich postavení se blíží genitiv singuláru i plurálu, v menší míře i lokál, zvláště ve skupině H. Vokativ je silněji zastoupen ve skupině D, v menší míře i v BMJ, ale v H a C minimálně.

V použití slovesných tvarů se BMJ se skupinami D a H v mnohém shoduje, např. v největším zastoupení tvarů indikativu préz. akt. a préterita i ve využití jednotlivých osob v obou číslech.[13] Za pozornost stojí, že BMJ užívá více 2. osoby singuláru, a to ve všech frekventovaných tvarech, nejvíce pak v imperativu.

Z obou sledovaných slovních druhů se v BMJ více využívá sloves, což odpovídá dynamičtějším projevům v BMJ.

Prostředky zde vytčenými se BMJ shoduje či odlišuje od skupin, reprezentujících ve FSČ mluvený jazyk. Je zřejmé, že skupina D v sledovaných jevech se více blíží BMJ než skupina H, která jako reprezentant mluveného jazyka sloužit nemůže.

 

LITERATURA

 

DEJMEK, B.: Běžně mluvený jazyk (městská mluva) města Přelouče. Pedagogická fakulta, Hradec Králové 1976.

DEJMEK, B.: Mluva nejstarší generace Hradce Králové. Pedagogická fakulta, Hradec Králové 1981.

DEJMEK, B.: Běžně mluvený jazyk nejmladší generace Hradce Králové. Pedagogická fakulta, Hradec Králové 1987.

HOFFMANNOVÁ, J. – MÜLLEROVÁ, O. – ZEMAN, J.: Konverzace v češtině při rodinných a přátelských návštěvách. Trizonia, Praha 1999.

JEDLIČKA, A.: Spisovný jazyk v současné komunikaci. UK, Praha 1978.

JELÍNEK, J. – BEČKA, J. V. – TĚŠITELOVÁ, M.: Frekvence slov, slovních druhů a tvarů v českém jazyce. SPN, Praha 1961.

ŠONKOVÁ, J.: Mluvená čeština a korpusová lingvistika. SaS, 61, 2000, s. 190–202.

 

[25]R É S U M É

Frequency of noun and verb words and forms in everyday spoken language

The author engages in quantitative analysis of everyday spoken language (běžně mluvený jazyk – BMJ); he focuses primarily on the frequency of noun and verb words and forms. He compares the results of his analyses with the conclusions of the seminal work on Czech quantitative linguistics – Frekvence slov, slovních druhů a tvarů v českém jazyce (Frequency of Words, Word Types and Forms in the Czech Language) (FSČ). Spoken language in FSČ is represented or simulated by dramas (D) and utterances published in the press (H). The author demonstrates that many BMJ devices and those of groups D and H coincide but many also differ. The differences are evident both in the frequency of vocabulary and in the forms of nouns and verbs.

BMJ usually has the character of dialogue and numerous uninflected words are used, particularly prepositions and conjunctions; the inflected words particularly include personal and demonstrative words. Of the uninflected words, particles play a specific role, whether as contact elements or as affirmative reactions (no, jo, tak, že, a – or in reciprocal combinations). The most important position among pronouns (as in the case of FSČ) is taken by ten (often coming close to the function of the definite article) and von (which is often expressive and superfluous – vono to bylo mokrý).

More verbs are used in BMJ than nouns. Some verbal forms have a higher frequency in BMJ than is given in FSČ, e. g. the 2nd person singular, especially in the active present indicative, the past, the present conditional and particularly in the imperative. As for the passive, the reflexive form (řeklo se) was found almost exclusively in BMJ. Transgressives, past conditionals and past perfects do not occur in BMJ.


[1] Poněvadž FSČ používáme jako základního pramene a budeme se často na něj odvolávat a s ním srovnávat, odkazy na něj budeme uvádět přímo v textu.

[2] K našemu pojetí BMJ blíže viz Dejmek, 1976, 1981, 1987. – O komplexní mluvenosti viz Jedlička, 1978, s. 44.

[3] Tento článek je přizpůsoben k prezentaci v časopisu, a nemůže tedy obsahovat všechny zjištěné údaje a tabulky, které by bylo možné vytěžit z materiálu, jímž disponujeme. Některé další údaje jsou uloženy u autora.

[4] Oproti jazykovému výzkumu prováděnému v Přelouči v letech 1966–68 jsme počet respondentů omezili na 7. Z původního počtu 10 respondentů jsme vyřadili ty, kteří se počtem slov i útržkovitostí materiálu vymykali ze skupiny ostatních respondentů.

[5] Ve FSČ první číslo označuje absolutní frekvenci, druhé číslo počet skupin, v nichž je slovo zastoupeno, a třetí číslo počet pramenů uvnitř skupin. Jak tato čísla ovlivňují celkové pořadí viz FSČ (s. 28).

[6] Celkové výsledky (C) uvádíme proto, abychom využili konečné sumarizace všech skupin a kategorií ve FSČ. C vypovídací hodnotu jistě má, ale detailnější porovnávání provádíme jen u BMJ, D a H. U C také – kromě frekvence slov – neuvádíme reálná čísla, nýbrž jen jejich procentuální zastoupení.

[7] Číslo za lomítkem u BMJ, D a H označuje počet pramenů, resp. R.

[8] Číslo za lomítkem u FSČ znamená počet skupin.

[9] Ale i v D, H a C jsme v tab. č. 2 uvedli součet hesel ten, tenhle, tenhleten a tento. Pořadí se tím nikde nezměnilo.

[10] Nerozlišujeme jako FSČ jo (pořadí v C 1713) a (2645). Vzhledem k různému počtu pramenů ve skupinách D i C obě hesla nesčítáme a přebíráme jen frekvenci a pořadí jo. Ve skupině H nejsou jo ani obsaženy.

[11] To dokázaly všechny naše výzkumy v Přelouči i v Hradci Králové.

[12] Ke kontaktovým částicím a souhlasným reakcím viz také Hoffmannová – Müllerová – Zeman, 1999, s. 157–158.

[13] Shody a rozdíly jsou uvedeny pod příslušnými tabulkami.

Pod Zámečkem 212
500 06 Hradec Králové 6

Slovo a slovesnost, volume 63 (2002), number 1, pp. 15-25

Previous Jana Hoffmannová, Olga Müllerová: Čeština v dialogu věkově rozdílných mluvčích

Next Světla Čmejrková: Identita slova a prolínání hlasů v dialogu, konverzaci a institucionální komunikaci