Časopis Slovo a slovesnost
en cz

Na okraj Slovníku Franze Kafky

Marie Těšitelová, Milada Vančatová

[Články]

(pdf)

По поводу словаря Ф. Кафки / A la marge du vocabulaire de F. Kafka

Studium autorských slovníků patří k základním problémům jak lexikologickým, tak i stylistickým. Z hlediska metodologického se tu významně uplatňují zejména v posledních letech metody matematické, resp. statistické, ať již řadíme tuto problematiku do lexikologie, nebo do stylistiky.[1] Statistické metody mohou zde přinést odpověď na mnohé otázky, které kvalitativní analýza nadhodí a řeší pouze — ve shodě se svou povahou — z jednoho aspektu. K těmto otázkám náleží zvl. tzv. sporné autorství[2] a dále i hodnocení autorských slovníků vůbec. V tomto případě jde zpravidla o studium, jak autor využívá slovního bohatství jazyka a jak lze hodnotit jeho slovník v porovnání s jiným autorem, popř. s jistou skupinou autorů. Do této oblasti možno zařadit i problematiku slovníku Franze Kafky. V rámci složité otázky Kafkova jazyka[3] zaujímá — jak známo — slovník zvláštní postavení a hodnotí se často jako chudý.[4] Poukazuje se zejména na to, že Kafka neznal němčinu v plném jejím slovním bohatství zvláště proto, že žil v českém prostředí a že jeho kontakty s německy mluvícím obyvatelstvem byly omezené. Problém Kafkova [422]slovníku je jistě složitý a jeho řešení bude vyžadovat analýzy, která by co do metod byla mnohostranná a co do materiálu co možná široce fundovaná.[5] Domníváme se, že se tu z hlediska metodologického mohou s užitkem uplatnit i statistické metody, a snažíme se v tomto příspěvku naznačit jejich možnosti a pokoušíme se o některé jejich aplikace, byť i na materiále zatím — z technických důvodů — značně omezeném.

Využíváme tu materiálu práce cit. v pozn. 5, a to: slovníku Kafkovy sbírky povídek Ein Landarzt (12 620 slov), dále slovníku Kafkovy povídky Ein Bericht für eine Akademie (2934 slov, dále jen Bericht) a pro porovnání slovníku povídky A. Schnitzlera Blumen (2934 slov). Schnitzler byl Kafkův současník, který žil a tvořil — na rozdíl od F. Kafky — jen v prostředí vídeňském.

Problematikou tzv. bohatství slovníku z hlediska statistických metod se zabýval zejména P. Guiraud (o. c. v pozn. 1), ale i jiní autoři.[6]

P. Guiraud se pokusil postihnout je jednoduchou formulí

, popř. ,

kde V znamená počet různých slov v textu, tj. slovník, N celkový počet slov, slovních tvarů, délku textu, počítají-li se do ní slova plnovýznamová i tzv. slova pomocná, popř. 2N, počítají-li se do délky textu jen slova plnovýznamová.

Měřeno touto formulí vychází pro Kafkův slovník v povídce Bericht hodnota R = 17, pro slovník Schnitzlerovy povídky Blumen R = 14. Srovnáno s průměrem, který uvádí P. Guiraud pro francouzštinu, R = 20,50, popř. s tím, který vychází jako průměr pro beletrii v češtině, R = 33,13 (zjištěno pro skupinu A v českém frekvenčním slovníku), je tedy „slovníkové bohatství“ jak u Kafky, tak ovšem i u Schnitzlera malé. Ale se zřetelem k tomu, že jde o relativně stejně dlouhé texty, svědčí tato hodnota i při dané hrubé míře ve prospěch slovníku F. Kafky.

Jedinou hodnotou nelze samozřejmě vystihnout to, co představuje bohatství slovníku v pravém slova smyslu. Nadto Guiraudova formule zjednodušuje skutečnost především tím, že hodnotí tzv. bohatství slovníku v závislosti na délce textu, tj. delšímu textu odpovídá přirozeně „bohatší“ slovník, ale v jisté proporcionalitě.

Poznamenejme, že termín bohatství slovníku je nevýhodný tím, že navozuje jisté hodnocení, což není ve shodě se skutečnou situací, kdy jde především o stanovení rozsahu slovníku, hodnocení má tu význam druhotný. Větší počet slov v slovníku nemusí ještě znamenat „bohatší“ slovník, neboť tu záleží na mnoha jiných činitelích, např. jak se slova opakují, která slova volíme apod., což je podmíněno zejména stylovou příslušností textu, individuálními stylovými zvláštnostmi autora, závislostí na tématě apod., nehledě na to, že „bohatství“ samo není jednoznačně ani kladnou, ani zápornou stylovou hodnotou.

Druhým problémem uvedené Guiraudovy formule je rozlišování tzv. slov [423]plnovýznamových a slov pomocných, mezi nimiž nelze vždy vést přesnou dělící čáru, a proto i jejich proporcionalita kolísá.

P. Guiraud předpokládá pro francouzštinu poměr slov významových a pomocných 50 : 50. Pro češtinu však tento poměr neplatí, jak bude ukázáno jinde; počítáme-li ke slovům pomocným jen předložky, spojky, citoslovce a částice, jde o poměr 80 : 20; řadíme-li k slovům plnovýznamovým jen substantiva, adjektiva, slovesa a adverbia, jak se s tím setkáváme u P. Guirauda, připadá na ně 65—75 % celého textu. Na textu Kafkově (Ein Landarzt) se ukazuje, že pro němčinu je v prvém případě tento poměr 72 : 28, v druhém případě připadá na slova plnovýznamová asi 54 % délky textu.

Rozdíly mezi češtinou na straně jedné a francouzštinou a němčinou na straně druhé jsou zřejmě způsobeny zejména úlohou členu v těchto jazycích. To jsou však problémy, které by zasloužily zvláštní pozornosti jak z hlediska struktury typologické, tak i lexikální. Souvisí to ovšem i se složitou otázkou klasifikace druhů slov.[7]

Avšak i při respektování zmíněných faktorů by se údaj o „bohatství“ Kafkova slovníku zřejmě nezměnil:

 

U Schnitzlera je situace obdobná R = 13,50 ≐ 14.

Uvedená čísla sama o sobě nemohou ovšem postihnout tzv. bohatství slovníku; vypovídají nám vlastně jen o poměru slovníku k délce textu. I z hlediska kvantitativního je nutno při hodnocení slovníku textu vzít v úvahu i jiné činitele. O jednom z nich tu již byla učiněna zmínka. Je to frekvence jednotlivých slov, resp. lexikálních jednotek. Čím je průměrné opakování slov nižší, tím více obsahuje lexikálních jednotek, které mohou být do jisté míry ukazatelem bohatství slovníku.[8]

P. Guiraud tu klade důraz na slova nejvíce frekventovaná a snaží se vyjádřit jejich koncentraci formulí

 

tj. poměr 50 prvních nejfrekventovanějších plnovýznamových slov k délce textu N. Podle něho je tento poměr konstantní, představuje 18 % všeho textu bez zřetele k jeho charakteru.

Pro češtinu se však ukázalo, že ani tato formule neplatí; zatím jen uveďme, že např. pro beletrii je tu rozpětí 29—21 %. Pro Kafkovu sbírku Landarzt vychází koncentrace podstatně nižší, asi 12 %. Souvisí to se známým faktem, že čím je tematika nějakého textu bohatší, tím méně lexikálních jednotek se častěji opakuje. Proto v monotematických dílech, např. v úzce odborných textech, je více slov s frekvencí nejvyšší a vyšší. To dosvědčuje komplementární rys autorského slovníku, tj. čím více slov má frekvenci vyšší a nejvyšší, tím méně jich má frekvenci nižší a nejnižší a naopak.

Na českém materiále se jasně ukázalo, že tu má klíčové postavení třída slov s frekvencí 1—10 a že je třeba přihlížet k rozdílům v čtyřech zmíněných plnovýznamových kategoriích slov, jako jsou substantiva, adjektiva, slovesa a adverbia. Na tomto pozadí pokusíme se zhodnotit i Kafkův slovník povíd[424]ky Bericht a sbírky povídek Ein Landarzt (bližší údaje srov. o. c. v pozn. 5). Výsledky analýzy povídky Bericht srovnáme s výsledky analýzy Schnitzlerovy povídky Blumen; jiné srovnání je zatím u nás pro němčinu bohužel nemožné.

V třídě slov s frekvencí 1—10 vydělují se jako zvláštní skupina slova s frekvencí 1, která jsou z hlediska tzv. bohatství autorského slovníku velmi významná. Pro Kafkův slovník vychází jejich relativní procento značně vysoké:

Počet slov s frekvencí 1

Autor

Subst.

Adj.

Slovesa

Adv.

 

Počet

%

Počet

%

Počet

%

Počet

%

Kafka

Bericht

219

73,99

92

80,70

185

71,43

79

58,52

Schnitzler

Blumen

169

71,91

73

67,59

127

67,55

50

41,32

Kafka

Ein Landarzt

732

66,67

324

73,30

468

61,42

147

48,36

Tabulka č. 1

 

I když vzhledem k omezené délce dvou srovnávaných povídek, Kafka, Bericht a Schnitzler, Blumen, ale i Kafkovy sbírky Ein Landarzt jsou naše závěry nutně omezené, lze na pozadí srovnání s výsledky v češtině konstatovat některé — zřejmě charakteristické — rysy Kafkova slovníku. Samozřejmým požadavkem tu ovšem je potřeba ověřit je na reprezentativním materiálu.

Předběžně však lze pro Kafkův slovník konstatovat: Relativně velký počet substantiv s frekvencí 1 v Kafkově slovníku (ale ovšem i v slovníku Schnitzlerově) je do značné míry podmíněn i nominálním charakterem němčiny. Pro češtinu byla zatím konstatována maximální hodnota 55 %. Jako individuální odchylky Kafkova slovníku lze označit počet adjektiv, sloves a adverbií; v nich se totiž zpravidla nejvíce projevuje individuální rys autorského slovníku. Např. počet adjektiv s frekvencí 1 obvykle převyšuje příslušný počet substantiv. I když pro Kafku bylo konstatováno (o. c. v pozn. 5, s. 32), že se adjektiva u něho vyskytují častěji v přísudku se sponou než v přívlastku, a i když pro němčinu vzrůstá počet adjektiv počtem participií, přesto lze usuzovat, že i tu se projevuje individuální rys Kafkova slovníku.

Pokud jde o slovesa, lze jejich vyšší procento u Kafky vyložit jeho zálibou v hromadění synonym, srov. např. pohybová slovesa kommen, gehen, springen, folgen, abgehen, begleiten, durchgaloppieren apod., slovesných dvojic bez předpon a s předponami, např. kratzen aufkratzen, strecken ausstrecken apod. U Schnitzlera má relativně velkou frekvenci slovesa sein; synonyma tu nacházíme v menší míře než u Kafky.

Také v počtu adverbií jsou u Kafky významné rozdíly, které jsou do značné míry zřejmě pro něho typické; pro češtinu je tu např. maximální hodnota 50,17 %, minimální 41,52 % (tedy zhruba shodná jako u Schnitzlera).

O významu slov s frekvencí 1—10 pro hodnocení autorského slovníku svědčí fakt, že tato slova představují např. v češtině v beletristických textech maximálně 97 %, minimálně 80 %. Pro slovník Kafkův a Schnitzlerův jsou vzhledem [425]k jejich délce tyto hodnoty vyšší, někde dosahují 100 %, jak ukazuje následující tabulka:

Počet slov s frekvencí 1—10

Autor

Subst.

Adj.

Slovesa

Adv.

Počet

%

Počet

%

Počet

%

Počet

%

Kafka

Bericht

293

98,99

114

100

256

98,55

130

96,29

Schnitzler

Blumen

233

99,16

107

99,08

178

94,67

109

90,09

Kafka

Ein Landarzt

1076

98,00

437

98,86

733

96,19

276

90,78

Tabulka č. 2

 

Nehledíc k omezenému rozsahu textů je možno konstatovat, že s výjimkou adverbií (ale i ona se celkem shodují s maximální hodnotou pro češtinu) počet slov s frekvencí 1—10 téměř pokrývá celý slovník příslušného díla.

Jak pro češtinu, tak i pro němčinu bylo by tu možno stanovit jistou normu; odchylky od ní se nezdají v češtině většinou příliš významné, zejména v rámci jednotlivých stylů. Nejlépe však vyniknou, všimneme-li si rozdílu jednotlivých skupin slov s frekvencí 1—10, jak pro němčinu ukazuje tabulka č. 3.

Autor, dílo

% různých slov s frekvencí 1—10

Subst.

Adj.

Slovesa

Adv.

Kafka

Bericht

92,34

100

81,63

68,21

Schnitzler

Blumen

92,75

93,92

65,01

52,44

Kafka

Ein Landarzt

84,50

88,39

59,98

42,60

Tabulka č. 3

 

Je zajímavé sledovat, jaké rozdíly se projevují (1) mezi Kafkou a Schnitzlerem, (2) mezi dvěma Kafkovými díly.

(1) Celková shoda v relativním (vysokém) počtu substantiv u Kafky a Schnitzlera je zřejmě do značné míry podmíněna charakterem němčiny; v češtině dosahuje maximální hodnoty 54,75 %. Je pozoruhodné, že se ani v češtině v rámci jednoho stylu neprojevují významnější rozdíly v relativním počtu substantiv. U ostatních druhů slov jsou významné rozdíly, a to jak v užívání adjektiv, tak i sloves, což zřejmě souvisí se zálibou v hromadění jejich synonym, a konečně i adverbií, která v jiných jazycích, např. v češtině, jsou zřejmě příznačná pro individualitu autorského slovníku.

(2) I když v Kafkově sbírce Ein Landarzt dochází vzhledem k její polytematičnosti k rovnoměrnějšímu rozložení frekvence slov v rámci skupiny 1—10, projevuje se tu významný rozdíl zejména v počtu adjektiv, který bude zřejmě individuálním rysem Kafkova slovníku. Posoudit významnost rozdílů u sloves a adverbií není za daného stavu šetření zatím dobře možno. Lze však konsta[426]tovat, že se zejména na počtu sloves projevují individuální rozdíly v autorském stylu.

Z toho, co tu bylo v náznacích uvedeno, vyplývá, že z hlediska kvantitativního nelze Kafkův slovník nikterak hodnotit jako chudý, ba naopak. Srovnání s ukázkou z díla Schnitzlerova ukazuje odchylky, které možno označit jako originální rysy Kafkova slovníku, ale ovšem též Schnitzlerova, svědčící o jeho „bohatství“, patrně i sui generis. U Kafky se zvlášť výrazně tento fakt projevuje v užívání adjektiv a sloves, do jisté míry i adverbií. Jinou otázkou, speciální, ovšem je, jak hodnotit, kterých slov autor užívá. Z toho, co tu bylo naznačeno, i podrobnější rozbor v práci citované v pozn. 5, srov. např. originalitu Kafkovu v tvoření složenin (s. 27), naznačuje, že i tu je autor do jisté míry svůj, že ani po této stránce nelze jeho slovník označit jako „chudý“. Ovšem všechny tyto závěry předpokládají ověření na reprezentativnějším materiále, pokud jde o dílo Kafkovo i Schnitzlerovo, i nutné srovnání s parametry pro němčinu a prohloubení užitých statistických metod.

 

R É S U M É

Marginalbemerkungen zu Kafkas Wortschatz

Die Autoren befassen sich mit der Problematik des sogenannten Wortschatzreichtums vor allem vom kritischen Standpunkt zur Guirauds Formel  oder . Zur Beurteilung des Wortschatzes genügt nicht eine einzelne statistische Angabe, sondern es zeigt sich notwendig mehrere Daten einzuführen. Für das entscheidende Kriterium des Wortschatzreichtums halten sie statistische Daten über die Klasse der Wörter mit der Frequenz 1—10. Im Lichte dieser Erwägungen und auf der Grundlage der statistischen Daten über Kafkas Prosa, und zwar Landarztcyklus und die Erzählung Ein Bericht für eine Akademie (diese vergleichend mit der Erzählung Blumen von A. Schnitzler) schließen die Autoren vorläufig über Kafkas Wortschatz folgendes: Vom statistischen Standpunkt aus kann man Kafkas Wortschatz überhaupt nicht als „arm bezeichnen (vgl. Kl. Hermsdorf und Kl. Wagenbach), sondern im Gegenteil, Kafkas Wortschatz — auch im Vergleich mit dem Wiener Schriftsteller Schnitzler und mit dem Tschechischen — wird vom eigenartigen Wortgebrauch, besonders was die Adjektiven, Verben und Adverbien betrifft, gekennzeichnet. Die Überprüfung dieser Schlußfolgerungen auf dem repräsentativen Material wird vorausgesetzt.


[1] Např. G. U. Yule, The Statistical Study of Literary Vocabulary, Cambridge 1944; P. Guiraud, Les caractères statistiques du vocabulaire, Paris 1964.

[2] Srov. G. U. Yule, o. c. v pozn. 1, dále např. A. Ellegård, Who was Junius? Stockholm 1962; týž, A Statistical Method for Determining Authorship. The Junius Letters, 1769—1772, Stockholm 1962; viz též P. Vašák, SaS 27, 1966, 364—370.

[3] Srov. P. Trost, Franz Kafka und das Prager Deutsch, Germ. Prag. 3, 1964, 29—37.

[4] Srov. Kl. Hermsdorf, Kafka. Weltbild und Roman, Berlin 1961; Kl. Wagenbach, Franz Kafka. Eine Biographie seiner Jugend, Bern 1958.

[5] První pokus o řešení otázky Kafkova slovníku představuje diplomová práce M. Vančatové Slovník drobných próz Franze Kafky, Praha 1967 (v rukopise), která vznikla za vedení P. Trosta a konzultace M. Těšitelové; o materiál i o některé výsledky této práce se opíráme i v tomto článku.

[6] Srov. zejm. G. Herdan, Quantitative Linguistics, London 1964; Wł. Kuraszkiewicz, La richesse du vocabulaire dans quelques grands textes polonais en vers, Wrocław—Warszawa—Kraków; J. Woronczak, Metody obliczania wskaźników bogactwa słownikowego tekstów, sb. Poetyka i matematyka, Warszawa 1965, s. 145—163; J. Mistrík, Matematiko-statističeskije metody v stilistike, VJaz 1967, č. 3, s. 43n.; M. Těšitelová, O tzv. bohatství slovníku (v rukopise).

[7] Srov. např. pro češtinu B. Havránek, sb. Rusko-české studie, Praha 1960, s. 465n.

[8] Srov. též R. Posner, Use and Abuse of Stylistic Statistics, Archivum Linguisticum 15, 1963, 111—139.

Slovo a slovesnost, ročník 28 (1967), číslo 4, s. 421-426

Předchozí Bohumil Trnka: Alfred — Alured

Následující Karel Svoboda: Dvě úvahy ke spisu K. Welkeho o „modálních“ slovesech v němčině (O komunikačním efektu a o modálních slovesech)