Časopis Slovo a slovesnost
en cz

Bulharská práce o struktuře slova v slovanských jazycích

Marie Ludvíková, Ludmila Uhlířová

[Rozhledy]

(pdf)

Болгарская работа о структуре слова в славянских языках / Un ouvrage bulgare consacré à la structure du mot dans les langues slaves

V r. 1971 vydalo nakladatelství BAV v Sofii obsáhlou monografii kolektivu vedeného Ivanem Lekovem Vănšna struktura na dumata v slavjanskite ezici (328 s.). Má část teoretickou (45 s.) a část ilustrativní (materiálovou); tuto část sestavili D. Staniševová, M. Dejanovová, M. Čalăkov, E. Balevská-Stankulovová a M. Vălčkovová (není uvedeno, který ze spoluautorů odpovídá za který jazyk). Jak napovídá název knihy i jméno hlavního autora, jde o dílo z oblasti srovnávací jazykovědy slovanských jazyků, a to konkrétně o dílo, zabývající se porovnáním struktur grafematické, fonologické a fonetické (tyto tři aspekty jazyka tvoří dohromady vnější strukturu slova na rozdíl od struktury vnitřní, sémantické) v ruštině, ukrajinštině, běloruštině, polštině, češtině, slovenštině, srbocharvátštině, slovinštině a bulharštině.

Teoretický úvod začíná stručnou výběrovou bibliografií prací z kvantitativní fonologie a grafematiky za léta 1852 až 1969; jsou v ní také několikrát uvedena TCLP, Vachkův - Dubského lingvistický slovník pražské školy (nikoli však česky psané stati Mathesiovy), z novějších našich autorů M. Komárek, J. Horecký, M. Ludvíková a J. Kraus. Z prací sovětských se podrobněji probírá kniha G. P. Torsujeva Voprosy fonetičeskoj struktury slova z r. 1962, k níž se Lekov hlásí jakožto k významnému inspiračnímu zdroji. Podotýká, že práce Torsujevova, týkající se angličtiny, vznikala současně s prací bulharskou, byla však publikována dříve; v oblasti porovnávání jazyků příbuzných má bulharská kniha prioritu.

[238]Vnější struktura slova se definuje jakožto „grafémově-fonémově-zvuková stránka, zobecněná neutrálně jako grafémová“ (s. 10). Zdůrazňuje se, že při konkrétní materiálové analýze se sice vychází od grafémů, protože však mezi grafémy a fonémy je v slovanských jazycích obvykle shoda, je možno — podle názoru autora — považovat charakteristiku vnější struktury slova současně i za charakteristiku fonémovou. Z tohoto důvodu se nepovažuje v daném případě za nemožný termín „grafofoném“ (v pozn. na s. 10); (v souvislém výkladu však autor tohoto termínu neužívá, střídá se označení grafém a foném).

Prostředkem popisu vnější struktury slova jsou grafémové (fonémové) kombinace na počátku a na konci slov a na morfémovém švu. Cílem popisu je co nejúplnější zachycení vztahu mezi grafémem a jeho pozicí a typologická charakteristika možných grafémových kombinací z aspektu kvalitativního i kvantitativního. Za základ analýzy se berou slova v jejich základních podobách, tj. tak, jak jsou uváděna v slovnících. (Na s. 10 nahoře je sice zmínka i o charakteristice úplného paradigmatu, příklady v ilustrativní části však uvádějí jen tyto tvary základní; porovnání poměrů v paradigmatu a v slovníku je vyloženo v krátké kapitole na s. 35—38, kvantitativně však zpracováno není.)

Materiálová část je zpracována na podkladě dvojjazyčných slovníků středního typu (tj. v průměru o rozsahu 50 000 slov). Celkový rozsah materiálu dosahuje téměř půl miliónu slov (byl zpracován ručně). Vzhledem k tomu, že pro tento účel byly (ručně) sestaveny i pomocné retrográdní slovníky jazyka rus., bulh., čes., pol. a sch., je materiálová báze rozsahem skutečně úctyhodná. — Rádi bychom však dodali, že přibližná shoda v rozsahu slovníků ještě nezaručuje hlubší shodu kvalitativní, tj. v koncepcích slovníků, ve výběru hesel v nich a ve způsobu jejich zpracování (např. u předpon velmi záleží na tom, jak jsou v slovníku zachyceny); porovnatelnost dat pro jednotlivé jazyky je tudíž možná jen v hrubých rysech.

Český materiál byl zpracován podle slovníku C. Romanské Češko-bălgarski rečnik (přepracované 3. vyd. z r. 1961). V předmluvě k tomuto vydání se uvádí rozsah slovníku 35 000 slov. Na s. 12 monografie se říká, že rozsah retográdního slovníku pořízeného na základě slovníku C. Romanské je 40 000 slov. Nejde-li o tiskařskou chybu, stálo by za zmínku, jak se v tomto případě retrográdní slovník pořizoval. — Je škoda, že popis techniky zpracování materiálu (zásady výběru a způsob excerpce ze slovníků apod.) vůbec chybí; z toho také plynou značné rozdíly ve zpracování jednotlivých jazyků.

Analytická část obsahuje strukturní rozbor a interpretaci kvantitativních dat. Pozornost se tu soustřeďuje na tři hlavní otázky: a) poziční charakteristiku grafémů v slově (které grafémové kombinace jsou přípustné v dané slovní pozici, tj. na počátku, na morfémovém švu a na konci slova); b) strukturu grafémových posloupností; c) jejich frekvenci. Tato část obsahuje mnoho nových poznatků a právě v nich spočívá hlavní přínos knihy. Zmíníme se alespoň o některých z nich:

a) Konstatuje se, že shodně ve všech slovanských jazycích nejfrekventovanějším vokálem na počátku slova je o, a to díky předponám o-, ob-, od- atd. Na druhém místě je vokál u (v bulh. i), opět díky výskytu v předponách. Pořadí frekvence vokálů na počátku slova v češt. je podle zpracovaného materiálu následující: o, u/ú, a, e, i. — Za závažnou chybu však považujeme, že se při analýze čes. materiálu nerozlišují dlouhé a krátké vokály, a to nejen zde, ale (nedůsledně) i na některých dalších místech v knize. Rozdíl v délce vokálu je v češtině funkční a má být respektován (je grafematický, fonologický i fonetický). — Podobně frekvence konsonantů na počátku slova je ovlivněna předponami. Nejvyšší frekvenci, a to opět shodně ve všech slovanských jazycích, má grafém p, po něm následuje v v zápsl. a výchsl. (s výjimkou češtiny, kde je druhým nejfrekventovanějším konsonantem k) a s v jihosl. Vysokou frekvenci mají dále konsonanty z, n a r. Konsonantické skupiny na počátku slova [239]jsou zpravidla nejvýše čtyřčlenné; vícečlenné skupiny obsahují vždy slabikotvorné r a l.

V češtině byla tato otázka zkoumána z hlediska frekvence slov v textu. V práci M. Těšitelové[1] pojednávající o četnosti počátečních písmen na podkladě frekvenčního slovníku češtiny[2] se uvádí pořadí, které je pro vokály s posuzovanou knihou shodné a pro konsonanty jen málo odlišné (repertoár jednotek na prvních šesti místech zůstává téměř stejný):

bulh. zpracování:

p, k, s, z, n, r

Těšitelová:

p, s, v, z, n, k

b) Konsonantickým sousedstvím na morfémovém švu se rozumí jednak kombinace poslední souhlásky prefixu s počáteční souhláskou (jednou, popř. více) slovního základu (např. skupiny -db-, -dl-, -dk-, -dčl-, -dhl-, -dpl-, -dstr-, -dzdv- atd. u slov s předponou nad-), jednak kombinace poslední souhlásky/souhlásek kmene s první souhláskou sufixu (např. -bk-, -rk-, -ctk-, -stk-, -hrstk- u slov se sufixem -ka apod.). Konstatuje se, že většina slov. jazyků má na prefixálním morfémovém švu skupiny o dvou až čtyřech konsonantech, na sufixálním morfémovém švu o dvou až pěti. Vícečlenné konsonantické skupiny se objevují jen omezeně.

c) Frekvence vokálů na konci slova je výrazně ovlivněna tvarem infinitivu. — Protože v slovníku C. Romanské je uváděna podoba českého infinitivu na -ti (jak je tradicí i v heslech našich slovníků), řadí se čeština překvapivě do skupiny jazyků, v nichž -i je na konci slova nejfrekventovanějším vokálem (na rozdíl od frekvencí textových, kde na prvním místě frekvenčního pořadí pro konce slova v češtině stojí -e[3]). Do téže skupiny patří ještě jazyky ukraj., sch. a slovin., zatímco v sloven., pol., ruš. a bulh. má nejvyšší četnost vokál -a. O řetězech konsonantů na konci slova všeobecně platí, že jejich kombinatorické možnosti jsou omezenější než na počátku slova.

d) Konstatuje se vliv paradigmatu na vnější strukturu konce slova.[4] Tak např. grafematická struktura slova v nominativu se může lišit od jeho struktury v tzv. nepřímých pádech (křest-křtu), podobně infinitiv od prézentu (čísti-čtu, žíti-žnu) apod. Tyto úvahy jsou zaměřeny všeobecněji, bez přímých poukazů na kvantitativní data.

Na závěr teoretické části autor shrnuje ty obecné rysy (tj. ty kombinatorické vlastnosti jednotek) vnější struktury slova, které shledal společnými pro všechny slovanské jazyky nebo pro jejich většinu, i ty rysy, které jsou specifické pro jednotlivé slovanské jazyky, popř. jejich skupiny. Shody se projevují např. v principech výběru prvků (konsonantů a vokálů) na počátku slova a zčásti i na jeho konci, ve skladbě některých konsonantických skupin na morfémovém švu, charakteristickým rysem se jeví i tendence k hromadění konsonantů spíše na počátku slova než na konci (tohoto jevu využili H. Kučera a G. Monroe jako pomocného kritéria pro stanovení slabičné hranice[5]). Naproti tomu se slovanské jazyky liší složením a délkou konsonantických posloupností na počátku a na konci slova; např. v slovanských jazycích jsou na počátku slov pravidlem dvou- až tříčlenné posloupnosti, v pol. jsou však běžné i posloupnosti čtyřčlenné. Rovněž měkkostní korelace si v jednotlivých jazycích zachovávají [240]svou specifičnost: např. v ruš., běloruš. a pol. se palatály kombinují volněji jak s nepalatálami, tak mezi sebou, zatímco v ostatních slov. jazycích zpravidla tvoří kombinace s nepalatálami a jejich schopnost tvořit kombinace mezi sebou je značně omezena. Autor věnuje pozornost i symetrii a tranzitivnosti jakožto obecným vlastnostem slovanských fonologických systémů.

Rozsáhlá empirická část obsahuje tabulky a seznamy následujících typů vokalických a konsonantických řetězců v různých pozicích slova a jejich četností: počátkové smíšené řetězce (VC-, CV-, VVC-, CCV-, VCV-, CVC-, VCC-, CVV-), konsonantické sousedství na morfémovém švu prefixálním a sufixálním (pro jednotlivé prefixy a sufixy zvlášť) a koncové smíšené řetězce (-VC, -CV, -VVC, -CCV, -VCV, -VCC, -CVV).

Tak např. pro češt. se uvádějí jako nejfrekventovanější tyto počátkové skupiny CV: po- s četností 2602, za- 2014, vi- 1875, na- 1638, ro- 1281, ne- 1088, ko- 1056 a dále tyto počátkové skupiny CCV: pře- 1063, pro- 935, při- 636 atd. Na konci slova se uvádějí jako skupiny s vysokou frekvencí -ik 629, -ti 749, -ni 2322, -ny 2409, -ka 1773 atd.

Vzhledem k tomu, že kniha nerozlišuje délku vokálů, tj. že počítá dohromady -ik a -ík, -ti a -tí, -ni a -ní atd., ztrácejí údaje o četnostech v češt. na ceně. Lze sice předpokládat, že vysoká frekvence -ni je ovlivněna právě vysokou frekvencí -ní u subst. verbálních a měkkých adjektiv, podobně vysoká frekvence -ny, -ky je způsobena frekvencí -ný, -ký u tvrdých adjektiv, ale kvantitativní relace krátkých a dlouhých vokálů jsou takto zcela zanedbány.

Jako poslední tabulky v knize jsou uvedeny absolutní četnosti pádů v ruš., pol., češt. a sch., a to odděleně pro vědeckou prózu a publicistiku, dramata a uměleckou prózu. Není řečeno, zda jde o pády substantiv nebo vůbec o pády skloňovaných slovních druhů, a dále, na základě jakého materiálu se k těmto číslům dospělo, popř. odkud jsou převzata. Pro ilustraci uveďme údaje, které se udávají pro česká dramata, a porovnejme je se značně odlišnými údaji o frekvenci pádů substantiv ve skupině D (dramata) ve FSČ, o. c. v pozn. 2 (bulharská práce uvádí pouze absolutní četnosti, pro snazší porovnatelnost zde dodáváme i četnosti relativní):

 

frekv.

nom.

gen.

dat.

akus.

vok.

lok.

instr.

celkem

Lekov

abs.

1759

457

151

709

248

461

215

4000

rel.

43,97

11,42

3,78

17,73

6,20

11,52

5,38

FSČ

rel.

27,63

14,55

3,92

26,36

12,76

8,01

6,77

K srovnání se nabízejí i údaje v čl. M. Těšitelové,[6] kde se uvádí pořadí pádů podle klesajících četností v české umělecké próze: 1. nom., 2. sg. akus./pl. gen., 3. sg. gen./pl. akus., 4. instr., 5. lok., 6. dat., 7. vok. V bulh. statistice je 1. nom., 2. gen., 3. akus., 4. lok., 5. instr., 6. dat., 7. vok. Pořadí je tedy v obou statistikách zhruba shodné, pouze s výměnou 2. a 3. místa u gen. a akus. v sg. a 4. a 5. místa u lok. a instr.

Dodejme ještě, že jde patrně o frekvence jednotlivých pádů, nikoli o frekvence pádových koncovek, jak se praví v nadpise k tabulkám na s. 325 i v obsahu knihy na s. 329.

Lekovova koncepce zdůrazňuje v prvé řadě to, co je společné grafematickému a fonematickému (popř. zvukovému) plánu jazyka, ale ponechává stranou ty rysy, [241]které činí tyto jazykové plány relativně samostatnými, autonomními. Zdá se však, jako by jednotlivé úseky materiálové části knihy byly zpracovány podle ne zcela jednotných kritérií, v nichž někdy převládal zřetel spíše k fonémové stránce (u polštiny a ruštiny), jindy zase spíše ke stránce grafémové (např. u češtiny). Bylo by ovšem žádoucí, aby byla zvolena jedna z rovin a důsledně respektována. Tato nevymezenost studované roviny a jednotky je jedním z nedostatků práce; většinou si nejsme jisti, na které z rovin se právě pohybujeme. Nelze rovněž souhlasit s pojímáním grafému; grafém není jakýkoli psaný znak, ale znak, patřící do jisté soustavy. Např. a a á jsou v češtině dva různé grafémy a fonémy, naopak i a y jsou dva grafémy, ale jeden foném; ě je jeden grafém, ale fonologicky značí buď měkkost předcházejícího d, t, n, nebo skupinu -je-, resp. -ňe-. Vedle toho grafematická stránka textu není neutralizací stránky fonematické a fonetické, jak se praví v úvodu, ale i specifickou vlastností jeho psané formy (termín grafofoném by zkresloval).

Řada nejasných bodů je i u slov synchronně domácích i cizích, v otázkách periferních jazykových jevů (např. zařazování fonémových kombinací v citoslovcích do fonologického systému jazyka, jako ouha v češ.) apod. Vyřešením těchto problémů by se zamezilo četným nepřesnostem v jazykových údajích, které se pak ovšem přenášejí i do kvantitativních dat.

Bohužel jen menší část frekvenčních seznamů, totiž jen koncové tříčlenné kombinace, je opatřena příklady. Příklady slouží vždy — v jakékoli lingvistické práci — za určité kontrolní kritérium přesnosti celé práce a mohou ovšem prozradit i některé její nedostatky. Tak např. v teoretické části na s. 10 se zdůrazňuje, že východiskem analýzy je sice stránka grafematická, ale „nezanedbává se, kde je to nutné, ani fonetický (normativně výslovnostní) obraz slova“. Avšak slova jako team, foyer, pissoir, bulla, glossa aj., která jsou uvedena jako příklady na skupinu VVC, resp. CCV na konci slova v češtině, tj. -eam, -yer, -oir, -lla, -ssa, dokazují, že jde v těchto případech o čistě grafematickou analýzu bez ohledu na výslovnost.

Zanedbání délky vokálů v češtině stírá významové rozdíly mezi slovy (náraz/naráz) a vede k slučování k sobě nepatřících kombinací prvků, např. i/í v slovech šip místo správného šíp, -piř m. -píř (klempíř), -sic m. -síc (měsíc) atd., a to jak v slovech domácích, tak v slovech cizích. — Není jasné, proč diftong ou se u počátkových řetězců počítá za dva vokalické elementy (např. na s. 122 se u typu VVC- uvádějí i ouh-, ouř-, ouš-, ouv-; u typu CVV- fou-, hou-, chou-, lou- atd.), zatímco u koncových řetězců za jeden vokalický element (u typu -VCV se uvádí např. -ouha, -ouba, -ouda, -ouka; u typu -CCV např. -tkou, -dnou, -vnou apod.). Někde se nerozlišuje ani i a y, např. -ati: hrbatý.

Autoři recenzované práce měli k dispozici pouze jediný dosud existující česko-bulharský slovník,[7] totiž slovník C. Romanské, který však nepostihuje dobře slovní zásobu současné češtiny. Mj. jsou tu uvedeny i některé speciální termíny (vačnatci, bičíkovci, ostnokožci) a poměrně značný je i podíl slov cizích, včetně zeměpisných názvů (koloid, yak, nuncius, kokain, podagra, kokila; Izrael, Seul, Olymp, Libye).

Do seznamů grafémových kombinací v knize se vloudilo nemalé množství chyb. Tak např. hned v 1. sloupci (o 26 heslech) na s. 293 je nevyjimaic m. správného nevyjímajíc, čuněik m. čuník, meloum m. meloun; v 2. sloupci (o 28 heslech) na téže stránce milien m. milieu, kadmiun m. kadmium, bibiár m. biliár, galimatyás m. galimatyáš a záhadné slovo zteer; na s. 294 v 1. sloupci (o 50 heslech) je brazda m. brázda, pohadka m. pohádka, barka m. bárka, chaska m. cháska a škrobačka(?). Podobně je tomu i na dalších stránkách seznamu čes. grafémových kombinací. Bohužel nejde o pouhá tis[242]kařská nedorozumění, protože každá chyba se opakuje dvakrát: chybná podoba slova souhlasí s příslušnou kombinací, na kterou je slovo uvedeno jako příklad, např. meloum je uvedeno jako příklad na koncovou skupinu -oum atd. Je ovšem otázka, nakolik je vinen slovník C. Romanské (viz pozn. 7) a kolik chyb vzniklo při kvantitativní analýze samé. Slova jako nareis (s. 293), čelda (293), duďsi (295), podží (296), hlaka (297), šálvý (297), jádroké (298), kozun (304), emiš (306), pendous (306) aj., která jsou rodilému mluvčímu nesrozumitelná, jsme nenašli ani v slovníku C. Romanské. Chyby tohoto druhu tedy vznikly zřejmě při sestavování pomocného retrográdního slovníku češtiny; empirická část knihy týkající se češtiny měla být před odevzdáním do tisku ještě důkladně zrevidována, a to i podle posledního vydání Pravidel českého pravopisu (z r. 1966) (již tím by se byla materiálová část vyhnula takovým chybám, jako řazení slov hockey, essay mezi slova s -CVV — nová Pravidla zde píší ej).

Je pochopitelné, že při tak rozsáhlé práci, zejm. byla-li celá vykonána bez pomoci počítače, nelze se všem chybám vyhnout. Avšak je-li chyb mnoho (např. až 25 % chybných údajů na s. 293), snižuje to nutně cenu pracně získaných kvantitativních dat a možnost spolehlivě jich dále používat. Proto hlavní cenu recenzované knihy nespatřujeme v její části empirické a kvantitativní, i když tato část představuje větší díl knihy, ale spíše ve výkladech teoretických. Porovnání bylo provedeno s cílem dát odpověď na otázku, zda existuje obecná „vnější“ struktura slov společná několika nebo všem slovanským jazykům. Autor dospívá k závěru, že lze sice odkrýt některé obecné rysy plynoucí ze skutečnosti, že jde o jazyky příbuzné, avšak odvodit nějaký obecně slovanský typ není možné. Domnívá se právem, že modelováním jednotlivých typů se dosáhne výstižnějšího srovnávacího popisu než hledáním obecného typu.

O knize jako celku je třeba zdůraznit, že jde o zajímavý a rozsáhlý pokus porovnat slovanské jazyky na jejich nejnižší rovině. Bylo by jistě na prospěch věci, kdyby jednotlivé jazyky mohly být zpracovány zvlášť, specialisty příslušných zemí, podle jednotných teoretických kritérií a metodických postupů, podobně jako se o to usiluje např. v dialektologii (v připravovaném slovanském jazykovém atlase) nebo ve fonetice (v komisi pro fonetiku a fonologii slovanských jazyků), aby porovnání bylo opravdu spolehlivé po stránce kvalitativní i kvantitativní. Jinak by bylo třeba spolupracovníků opravdu dobře znalých příslušného jazyka, a toho právě z hlediska českého materiálu — a přirozeně z toho hlediska je kniha recenzována — nebylo. Lze jen doufat, že materiál z ostatních jazyků je zpracován spolehlivěji a že tedy toto rozsáhlé dílo bude moci sloužit jako užitečné a inspirující východisko k dalšímu bádání v oblasti typologie slovanských jazyků.


[1] M. Těšitelová, O entropii počátečních písmen v češtině, Informační bulletin pro otázky jazykovědné 5, 1965, 31—37.

[2] J. Jelínek - J. V. Bečka - M. Těšitelová, Frekvence slov, slovních druhů a tvarů v českém jazyce, Praha 1961.

[4] Pro češt. D. Konečná - J. Hronek, Morfologická analýza podle posledního písmene, SlavPrag IV, 1962, 259—263.

[5] H. Kučera - G. Monroe, A Comparative Quantitative Phonology of Russian, Czech and German, New York 1968, s. 51.

[6] M. Těšitelová, K frekvenci pádů v současné spisovné češtině, SaS 30, 1969, 269—275.

[7] Nedávno vyšel značně lepší a obsáhlejší slovník slovensko-bulharský, viz o tom zprávu v SaS 33, 1972, 269—270. — O slovníku Romanské — přes tři vydání — je obecně známo, i v Bulharsku, že nevyhovuje, proto se připravuje slovník nový. — Nebylo však nesnadné vybrat jiný dvojjazyčný slovník český.

Slovo a slovesnost, ročník 34 (1973), číslo 3, s. 237-242

Předchozí Miroslav Grepl: Sémantika predikačních kategorií v generativním popisu

Následující Josef Hrbáček: Slovenská monografie o frazeologii