Marie Těšitelová
[Articles]
К частоте категорий глагола / Sur la fréquence des catégories verbales
Slovanské sloveso svou bohatou morfologií a zajímavou, ale i složitou problematikou s tím spojenou přitahovalo a stále přitahuje pozornost lingvistů, slavistů i specialistů v jednotlivých slovanských jazycích.[1] Celkem společným rysem všech prací tímto zájmem podnícených, a to i metodologicky rozdílných je, že se sice především zabývají jednotlivými slovesnými kategoriemi, ale většinou musí mít stále na zřeteli i vztah k ostatním kategoriím vyjadřovaným slovesem nejen v rovině morfologické, ale i syntaktické, popř. i k výstavbě větších celků, než je věta. Tato vlastnost slovesa a jeho kategorií nám zvlášť vynikne, analyzujeme-li text při aplikaci statistických
Styl | Ind. préz. aktivního |
Σ | |||||
sg. | pl. | ||||||
1. os. | 2. os. | 3. os. | 1. os. | 2. os. | 3. os. | ||
| 7.364 | 3.571 | 31.750 | 2.287 | 1.757 | 7.341 | 54.070 |
A—C |
|
|
|
|
|
|
|
| 13,62 | 6,60 | 58,72 | 4,23 | 3,25 | 13,58 | 100,— |
| 4.254 | 1.848 | 6.960 | 777 | 1.641 | 1.017 | 16.493 |
D |
|
|
|
|
|
|
|
| 25,77 | 11,20 | 42,20 | 4,71 | 9,95 | 6,17 | 100,— |
| 215 | 7 | 20.370 | 3.322 | 35 | 5.820 | 29.769 |
E—G |
|
|
|
|
|
|
|
| 0,72 | 0,02 | 68,43 | 11,16 | 0,12 | 19,55 | 100,— |
| 1.461 | 40 | 5.642 | 809 | 172 | 1.340 | 9.464 |
MP |
|
|
|
|
|
|
|
| 15,44 | 0,42 | 59,62 | 8,55 | 1,82 | 14,15 | 100,— |
| 12.794 | 5.484 | 67.806 | 8.090 | 3.704 | 17.160 | 115.038 |
FSČ |
|
|
|
|
|
|
|
| 11,12 | 4,76 | 58,94 | 7,04 | 3,22 | 14,92 | 100,— |
Tab. č. 1
[53]metod. V této stati ponecháme stranou problémy spjaté s morfologií slovesa při stanovení jednotky textu[2] k tomu účelu a soustředíme se na problematiku zpracovávání statistických dat o jednotlivých slovesných kategoriích v rámci roviny morfologické a budeme svá tvrzení podle potřeby demonstrovat na příkladech z češtiny.
Ukázalo se již při statistickém zpracování kategorií substantiva,[3] že frekvenci pádu je třeba vyčíslit a hodnotit se zřetelem k frekvenci čísla, popř. i rodu, tedy že se ukazují významné rozdíly ve frekvenci jednotlivých pádů v singuláru a plurálu i rozdíly mezi jednotlivými rody, maskuliny, femininy a neutry. Při zjišťování frekvence slovesných kategorií je situace analogická; komplikována je však ještě tím, že tu musíme brát v úvahu více kategorií, osobu, číslo, čas, způsob, slovesný rod, ev. i vid. To by se snad zdálo samozřejmým, ale jak dále ještě doložím, u slovesných kategorií ukazuje se mnohem těsnější vztah, než je tomu u kategorií substantiva. Frekvence jednotlivých slovesných kategorií se projevuje jako frekvence jednotlivých slovních tvarů; pro zjednodušení mluvíme zpravidla o frekvenci jednotlivých slovesných tvarů. Vzhledem k jednotlivým kategoriím vyskytují se základní rozdíly ve frekvenci mezi jednotlivými slovesnými tvary a ty reagují velmi citlivě na různé faktory, jazykové i stylové, ale i tematické apod., jak dále ukážeme na dvojím materiálu:
A) na materiálu frekvenčního slovníku češtiny (FSČ[4]), jednak vzatém jako celek, jednak diferencovaném podle funkčních stylů, stylu uměleckého, rozlišeného podle druhu projevu na prózu, poezii (podle FSČ skupiny A-C) a na dramata (podle FSČ skup. D) a stylu naučného (podle FSČ skup. E-G) a mimo FSČ na skupině odborných mluvených projevů (dále OMP) celkem v tomto rozsahu:
Styl. skupina | Počet slov | Počet sloves. tvarů | % |
A—C | 846.150 | 171.515 | 20,27 |
D | 140.215 | 32.451 | 23,14 |
E—G | 403.930 | 56.360 | 13,95 |
OMP | 111.558 | 16.391 | 14,69 |
Celkem | 1,501.853 | 276.717 | 18,43 |
B) na vybraných 4 textech stylu uměleckého: K. Čapek, Život a dílo skladatele Foltýna (N = 21.963 slov), I. Kříž, Úsek častých nehod (N = 21.963 slov), V. Vančura, Konec starých časů (N = 30.281 slov), J. Otčenášek, Kulhavý Orfeus (N = 30.281 slov), na 4 textech stylu naučného: K. Chochola, Spalovací motory (N = 31.655 slov), E. Severin a V. Kasika, Průmyslová televize (N = 31.655 slov), B. Gloss, Plánování práce (N = 18.085 slov), J. Janko, Základy statistické indukce (N = 17.249 slov).
[54] Styl | Ind. prét. aktivního |
Σ | |||||
sg. | pl. | ||||||
1. os. | 2. os. | 3. os. | 1. os. | 2. os. | 3. os. | ||
| 5.378 | 1.019 | 56.806 | 1.156 | 426 | 13.293 | 78.078 |
A—C |
|
|
|
|
|
|
|
| 6,89 | 1,31 | 72,76 | 1,48 | 0,54 | 17,02 | 100,— |
| 1.654 | 554 | 2.524 | 262 | 581 | 470 | 6.045 |
D |
|
|
|
|
|
|
|
| 27,36 | 9,16 | 41,76 | 4,33 | 9,62 | 7,77 | 100,— |
| 90 | 3 | 6.341 | 416 | 6 | 2.373 | 9.229 |
E—G |
|
|
|
|
|
|
|
| 0,97 | 0,03 | 68,71 | 4,51 | 0,07 | 25,71 | 100,— |
| 461 | 13 | 652 | 215 | 67 | 123 | 1.531 |
MP |
|
|
|
|
|
|
|
| 30,11 | 0,85 | 42,58 | 14,04 | 4,38 | 8,04 | 100,— |
| 7.462 | 1.591 | 70.783 | 2.402 | 1.077 | 18.151 | 101.466 |
FSČ |
|
|
|
|
|
|
|
| 7,36 | 1,56 | 69,77 | 2,36 | 1,07 | 17,88 | 100,— |
Tab. č. 2
Podle FSČ (tab. č. 31) jsou nejfrekventovanějšími slovesnými tvary (1) indikativ prézentu aktivního (39,03 %), dále (2) indikativ préterita aktivního (34,43 %), (3) podstatně méně pak kondicionál prézentu aktivního (5,07 %). Těmto tvarům budeme věnovat zvláštní pozornost se zřetelem k jednotlivým slovesným kategoriím.
Jak ukazují naše tabulky č. 1 a 2, má v indikativu prézentu i préterita (bez zřetele k vidu) a to v singuláru i v plurálu, nejvyšší frekvenci zpravidla 3. osoba. Potvrzuje to ostatně i FSČ; se zřetelem k času je však v některých stylových skupinách podstatně vyšší frekvence 3. os. sg. v préteritu než v prézentu. Platí to zejména o stylu uměleckém, avšak s vyloučením dramat, kde je relativní hodnota frekvence 3. os. sg. minimální. Souvisí to jednak s mluvenou formou projevu, jak ukazuje i situace (relativní shoda) v OMP, jednak s probíháním dramatického děje.
Pokud jde o projevy stylu naučného, má tu celkem jednoznačně relativně nejvyšší frekvenci 3. os. v préz. (výrazně překračuje normu FSČ) i v prét. akt. (celkem se shoduje s normou FSČ). Souvisí to s tím, že v psaných projevech naučného stylu [55]častěji mluvíme o někom nebo o něčem, než je tomu v projevech mluvených, kde se uplatňuje situace, souvislost apod. (Při detailnější analýze by ovšem bylo třeba rozlišit i užití 3. os. sg. v konstrukcích osobních a neosobních.)
Již na těchto několika příkladech se ukazuje, jak velký vliv mají na volbu gramatických kategorií slovesa způsob projevu a funkční styl, často i ve vzájemné kombinaci. Zůstaňme ještě u frekvence osoby v ind. préz. a prét. akt.
V mluvených projevech stylu uměleckého, reprezentovaných v našem materiálu dramaty (D), je v singuláru préz. i prét. nižší frekvence 3. os. ve srovnání s poměry v ostatních stylových skupinách, naproti tomu vyšší frekvence 1. a 2. os. V plurálu má ve skupině D relativně nejvyšší frekvenci 2. os., což lze vysvětlit jednak relativně nižším počtem tvarů plurálových (20 % k 80 % tvarů singulárových), jednak frekvencí jazykových prostředků typických pro mluvené projevy, oslovování, zejm. vykání.[5] — Mluvené projevy odborné (OMP) mají — ve srovnání s odbornými projevy psanými (E—G) — nižší frekvenci 3. os. sg., relativně však vyšší než v dramatech D, což lze vyložit zřejmě jako znak odborného projevu. Znakem mluvenosti je u OMP i relativně vyšší frekvence 1. os. sg., než je tomu v psaných odborných projevech, i když proti skupině D asi o 10 % nižší.
Charakterem mluveného projevu odborného lze vysvětlit i relativně největší frekvenci 1. os. pl. v OMP, vřazení mluvčího mezi posluchače typu uvedli jsme ještě jeden příklad apod., popř. tzv. plurál skromnosti typu dospěli jsme k tomuto závěru apod. Ovšem všechna tato zjištění budou vyžadovat zvláštního ověření, až budeme mít dostatek materiálu reprezentativního pro mluvené projevy i dostatek jejich základních kvantitativních charakteristik.
Pokud jde o psané projevy stylu uměleckého a naučného, i FSČ, kde psané projevy převládají, má v pl. ind. préz. i prét. akt. jednoznačnou číselnou převahu 3. os., ve stylu naučném — jak lze ostatně očekávat — jasně převládá.
Všimněme si ještě tvarů kondicionálu prézentu aktivního (tab. č. 3); opět se v jejich frekvenci výrazně odlišují projevy psané od projevů mluvených. V psaných projevech stylu uměleckého jsou jednotlivé tvary kond. préz. akt. v podstatě stejně frekventované jako tvary ind. préz. akt., tj. relativně největší frekvenci tu má 3. os. sg. i pl. V zásadě totéž platí i pro FSČ, zejména pokud jde o tvary plurálové. — V textech stylu naučného při jednoznačné početní převaze 3. os. sg. i pl. mírně stoupá frekvence 1. os. pl. na újmu frekvence 3. os. pl.; jde zřejmě o jistý rys odborného projevu, jak ostatně ukazují frekvence 1. os. pl. v OMP, podmíněný pravděpodobně příčinami, které jsme již vysvětlili výše.
V projevech mluvených, a to jak skupiny D, tak i OMP, se liší frekvence tvarů kond. préz. akt. v singuláru: Výrazně vyšší frekvenci — než v tvarech ind. préz. akt. — má v obou případech 1. os. sg., a to na účet frekvence 3. os. sg. Tedy v 1. os. sg. kond. préz. akt. (v OMP i v 1. os. pl.) užíváme častěji slovesných tvarů vyjadřujících podmínku. Poznamenejme, že v kond. min. akt. v skupině D má 1. os. dokonce vyšší frekvenci (45,86 %) než v 3. os. sg. (27,08 %). Naproti tomu v OPM má jak v sg., tak i v pl. největší frekvenci 3. os.
Všechna data uvedená v tabulkách č. 1—3 můžeme pokládat za jistou normu pro frekvenci jednotlivých slovesných morfologických kategorií, a to se zřetelem jednak k projevům psaným i mluveným, jednak k dvěma významným funkčním stylům, uměleckému a naučnému. Pokud jde o data týkající se FSČ, možno uvažovat o normě českého jazyka. Pokládám za užitečné uvedené normy konfrontovat ještě s některými texty, a to psanými projevy stylu uměleckého a naučného (srov. výčet na s. 3), které byly vybrány tak, aby v jednotlivých dvojicích textů byla eliminována délka
[56] Styl | Kond. préz. aktivního |
Σ + | |||||
sg. | pl. | ||||||
1. os. | 2. os. | 3. os. | 1. os. | 2. os. | 3. os. | ||
| 1.310 | 506 | 4.967 | 276 | 240 | 1.142 | 8.441 |
A—C |
|
|
|
|
|
|
|
| 15,52 | 6,00 | 58,84 | 3,27 | 2,84 | 13,53 | 100,— |
| 675 | 263 | 757 | 101 | 188 | 127 | 2.111 |
D |
|
|
|
|
|
|
|
| 31,97 | 12,45 | 35,86 | 4,79 | 8,91 | 6,02 | 100,— |
| 20 | 2 | 1.602 | 360 | 5 | 390 | 2.379 |
E—G |
|
|
|
|
|
|
|
| 0,84 | 0,08 | 67,34 | 15,13 | 0,21 | 16,40 | 100,— |
| 412 | 3 | 684 | 307 | 33 | 119 | 1.558 |
OMP |
|
|
|
|
|
|
|
| 26,44 | 0,19 | 43,90 | 19,70 | 2,12 | 7,65 | 100,— |
| 2.162 | 774 | 8.328 | 1.058 | 492 | 2.136 | 14.950 |
FSČ |
|
|
|
|
|
|
|
| 14,46 | 5,17 | 55,73 | 7,07 | 3,29 | 14,28 | 100,— |
Tab. č. 3
textu N jako jeden z významných činitelů, které mají vliv na frekvenci jazykových jevů. (Pro nedostatek místa příslušné tabulky zvlášť neuvádíme.)
Pokud srovnáváme frekvenci tvarů ind. préz. akt. v textech stylu uměleckého, prozaických, a to s normou FSČ a pro skupinu A—C, zjišťujeme, že je tu zachována základní proporcionalita ve frekvenci jednotlivých tvarů, tj. relativně největší frekvenci tu má 3. os. sg. i pl. Ve srovnání s normou A—C je v jednotlivých prozaických textech relativně více frekventována 1. os. sg., v pl. nacházíme značné kolísání ve frekvenci 1. a 2. os., které mají vůbec poměrně malou frekvenci. Projevuje se tu zřejmě nejen rys individuálního autorského stylu, ale i zejména podíl řeči přímé, nepřímé, popř. polopřímé. Např. v textu K. Čapka (Život a dílo …), kde téměř celý text tvoří výpovědi jednotlivých svědků, má vysokou frekvenci 1. os. sg. (27,24 %), ale i 3. os. sg. (51,69 %); tvary plurálové jsou poměrně slabě zastoupeny (asi 14 % všech tvarů ind. préz. akt.). Relativně vysoká frekvence 3. os. sg. ukazuje na zastoupení slohových postupů, vyprávění a popisu, a ovšem i na podíl řeči nepřímé. — Zhruba analogická situace v textech uměleckého stylu se ukazuje ve frekvenci tvarů ind. prét. akt., ovšem s tím rozdílem, že v některých textech je relativně vysoká frekvence 1. os. sg. (K. Čapek — 17,76 %, Vl. Vančura — 20,76 %) zejména [57]tam, kde se hojně užívá řeči přímé. Jako individuální rys stylu autora je třeba zřejmě označit to, že v textu Vančurově je 1. os. ind. prét. akt. více frekventovaná než v ind. préz. akt. (18,15 %). Autorským stylem, ale i slohovým postupem (velkým podílem vyprávění) lze vysvětlit relativně vysokou frekvenci 3. os. sg. v textu I. Kříže (86,81 %) a J. Otčenáška (80,85 %).
V textech stylu naučného převládá — jak lze ostatně očekávat — frekvence 3. os. sg. i pl., avšak i tu nacházíme v jednotlivých textech zajímavé odchylky, a to zejména v tvarech plurálových. Např. v textu Jankově má 1. os. pl. ind. préz. i prét. akt. výrazně větší frekvenci (33,05 %, 37,25 %) než 3. os. pl. (13,70 %, 21,57 procenta); stejnou situaci nacházíme v textu o průmyslové televizi, a to v tvarech préteritálních, v tvarech prézentních jsou obě osoby relativně stejně zastoupeny. Velká frekvence 1. os. pl. je v odborných textech podmíněna vedle plurálu skromnosti zejména ztotožněním autora s čtenářem, což je celkem běžný úzus v textech naučného stylu, srov. např. Oba případy můžeme uvažovat společně, když řekneme, že funkce F má … Relativně velká frekvence tvarů 1. os. pl. je ovšem vyvolána i převahou výkladu, hojného zejména v textech matematických, postupy popisné mají vliv na frekvenci 3. os. sg. i pl., a to tak, že v tvarech préteritálních má 3. os. pl. větší frekvenci než v tvarech prézentních (srov. normu E—G). Za zvláštní zmínku stojí ještě fakt, že 1. a 2. os. sg. a 2. os. pl. se v jednotlivých odborných textech prakticky nevyskytují.
Pokud jde o zastoupení tvarů kond. prézentu aktivního v textech stylu uměleckého, nacházíme vcelku shodu s normou A—C (tab. č. 3). Jako tomu bylo u tvarů zejména ind. préz. akt., má relativně největší frekvenci 3. os. sg., avšak v textech s hojným výskytem přímé řeči roste frekvence 1. os. sg. Zvlášť nápadné je to v textu Vančurově (31,78 %, tj. téměř dvojnásobek normy) a v textu Čapkově (23,74 %), což lze do značné míry vysvětlit nejen zastoupením přímé řeči, ale i tematikou textu, úvahovými pasážemi apod. Pro tento výklad svědčí i frekvence 1. os. sg. v textu Křížově (12,84 %) a Otčenáškově (14,96 %), kde převládají postupy výkladové a popisné. Naproti tomu ovšem u Otčenáška — ve srovnání s ostatními texty prozaickými — významně překračuje normu 2. os. sg. (17,52 %) a v rámci plurálu i 2. os. pl. (6,21 %). To je zřejmě podmíněno živým dialogem, který je výraznou součástí Otčenáškova textu; v textu Vančurově to platí o 2. os. pl. (9,33 %). Velmi dobře se tu ukazuje rozdíl mezi oběma texty, u Otčenáška převládá tykání, u Vančury vykání, což je ostatně v souladu s tematikou obou textů a jejich zpracováním.
V textech odborných jsou tvary kond. préz. akt. doloženy v singuláru jen v 3. os., což ostatně vzhledem k druhu stylu nepřekvapuje, v plurále 1. os. konkuruje 3. os. (v textu o spalovacích motorech a o plánování). V matematickém textu Jankově má 1. os. pl. dokonce výraznou číselnou převahu (47,32 %), což lze vyložit specifickými vlastnostmi odborného textu vůbec a matematického zvláště (srov. i výše).
Analogickým způsobem bychom mohli pokračovat v dokládání frekvence jednotlivých slovesných tvarů, resp. slovesných kategorií a v jejich analýze i interpretaci. Zajímavá by byla např. i data o frekvenci antipréterita, kond. min. apod. Pro nedostatek místa však je v této stati neuvádíme, frekvence všech slovesných kategorií ostatně ani není cílem tohoto článku. I na základě několika uvedených příkladů můžeme — podle mého názoru — vyvodit několik závěrů o frekvenci slovesných kategorií:
Frekvenci jednotlivých slovesných kategorií je třeba zjišťovat ve vztahu ke kategoriím ostatním. Úlohy jednotlivých kategorií v jednotlivých slovesných tvarech nejsou vždy dost jasné a často je můžeme zhodnotit až v konfrontaci s celým systémem slovesných tvarů. To je výrazný rys statistické analýzy slovesa z hlediska morfologického, který je v praxi příčinou velkých potíží při statistické analýze slovesných [58]tvarů a jejich interpretaci. I proto je tato oblast dosud poměrně málo zpracována, méně než tvarosloví jména, zejména substantiva.
Frekvence slovesných tvarů a jejich kategorií je podmíněna nejen vlastnostmi jazyka, ale uplatňuje se tu velmi výrazně i vliv druhu projevu (psanost a mluvenost), dále funkční styl a stylové postupy, ale i individuální styl autora a tematika, a to i v rámci stylu naučného. Frekvence jednotlivých slovesných tvarů, resp. i jejich kategorií je v jednotlivých zkoumaných stylech a textech, popř. u jednotlivých autorů obvykle tak výrazně diferencována, že při jejím zjišťování vystačíme se zcela jednoduchým statistickým aparátem, jaký uvádíme v našem případě, a že kvantitativní rozdíly ve frekvenci jednotlivých slovesných tvarů většinou ani nevyžadují speciálního ověřování.
R É S U M É
Die Autorin untersucht einige Eigenschaften der Verbalkategorien im Tschechischen vom statistischen Gesichtspunkt aus. Sie verwertet dazu: (1) die Daten des tschechischen Häufigkeitswörterbuchs (s. Anm. 4) über die betreffende „Norm“ im Stil der Belletristik (A-C), der Dramen (D) und der Fachliteratur (E-G) und außerdem auch neugewonnene Daten über gesprochene fachliche Äußerungen (OMP) und (2) die Daten über die Frequenz der analysierten Kategorien in je 4 Texten aus der Belletristik und Fachliteratur. Aus der sprachstatistischen Analyse der erwähnten Daten ergeben sich folgende Schlußfolgerungen:
Die Frequenz der einzelnen Verbalkategorien (d.h. der Kategorien der Person, des Numerus, Tempus, Modus und Genus) muß in der Einheit mit der Frequenz der anderen Kategorien untersucht werden, obwohl manche von diesen Kategorien scheinbar selbständig auftritt oder deutlich zu einer anderen Kategorie in engerer Beziehung steht, wie z. B. die Person zum Numerus. Die Frequenz der Verbalformen und ihrer Kategorien ist nicht nur durch die Eigenschaften der Sprache, sondern auch durch die Form der Äußerungen (geschrieben - gesprochen), durch den Funktionalstil und verschiedene Stilverfahren und schließlich auch durch den individuellen Autorenstil, durch das Thema u.ä. bedingt. In einzelnen Stilgattungen bzw. bei einzelnen Autoren ist die Frequenz der einzelnen Verbalkategorien — natürlich in bestimmten Relationen — se deutlich differenziert, daß man bei ihrer Ermittelung mit einem einfachen statistischen Apparat auskommt.
[1] Srov. zejm. B. Havránek, Genera verbi v slovanských jazycích I, II, Praha 1928, 1937; týž, Srovnávací studium gramatické stavby slovanských jazyků, Slavia 22, 1953, 241—249. Dále např. M. Dokulil, K modální výstavbě věty, Studie a práce lingvistické I, Praha 1954, 255—262. Nejnověji např. J. Panevová - E. Benešová - P. Sgall, Čas a modalita v češtině, Praha 1971.
[2] Srov. M. Těšitelová, K statistickému výzkumu slovní zásoby, SaS 22, 1961, s. 172n.
[3] Srov. M. Těšitelová, K frekvenci pádů v současné spisovné češtině, SaS 30, 1969, 269—275.
[4] J. Jelínek - J. V. Bečka - M. Těšitelová, Frekvence slov, slovních druhů a tvarů v českém jazyce, Praha 1961.
[5] J. Mistrík tu mluví o osobách „konverzačních, situačních“, srov. Štylistika slovenského jazyka, Bratislava l970, s. 134n.
Slovo a slovesnost, volume 34 (1973), number 1, pp. 52-58
Previous Jan Chloupek: (Ne)aktuálnost slovesného děje
Next Pavel Trost: Poznámky o relativní větě
© 2011 – HTML 4.01 – CSS 2.1