Časopis Slovo a slovesnost
en cz

Morfematický slovník češtiny

Vladimír Mejstřík

[Chronicles]

(pdf)

Морфематический словарь чешского языка / Le dictionnaire morphématique du tchèque

Strojové zpracování jazykového materiálu nepochybně patří dnes k novým metodám, které prohlubují pohled jazykovědy na uspořádání a členění systému jazykových prostředků a tvarů zejména po stránce formální. Také Retrográdní morfematický slovník češtiny, který vyšel péčí nakladatelství Academia v r. 1975 v rozsahu 648 s., zpracovala jeho autorka E. Slavíčková touto metodou. Předtím ovšem předcházela autorčina důkladná teoretická i praktická analýza, s jejímiž výsledky se jazykovědná veřejnost měla příležitost seznámit v několika statích v odborných časopisech a sbornících.[1]

Stručný úvod ke Slovníku se omezuje především na objasnění materiálových východisek Slovníku a nastínění jeho pracovních postupů. V třetí části úvodu autorka komentuje některé otázky morfémové analýzy slov, zejména problém jejich jednoznačného členění (segmentace). Při určování morfémů v slovech se setkáváme s „překrýváním“ morfémů, s tím, [172]že je možno je členit více způsoby; to je dáno vývojovým procesem deetymologizace (ztrácí se povědomí o členitosti slova), popř. druhotným rozdělením (přerozdělením, perintegrací) morfémů uvnitř slova. Jak potom jednoznačně určit morfémy? Autorka volí za základní hledisko své morfémové analýzy princip opakovatelnosti. Podle něho je morfém slova náležitě určen tehdy, jestliže slovní útvar, který se nám jako daný morfém jeví, se opakuje i v jiných slovech (např. kořenový morfém med- v slovech med, medový, s hláskovou obměnou kouř-/kuř- v slovech kouř, kouřit, se supletivností vz-ít, ber-e). Kořenový morfém lze však také určit na základě opakovatelnosti (formálně i sémanticky identifikovaných) přípon nebo předpon u slov téhož významového okruhu (např. kořenový morfém mal- u dnes slovotvorně nezřetelného slova malina analogicky podle ostružina, jeřabina aj.).

Téhož principu užívá autorka i při vydělování předpon a přípon. V případech, že tyto morfémy ztratily svou významově funkční samostatnost a že splývají s kořenovým morfémem natolik, že je jejich vyčlenění sporné, pracuje E. Slavíčková s pojmem jaderného kořenového morfému a tzv. rozšiřujících elementů (např. jaderný kořenový morfém u slov věda, vědět, dovědět se je -věd-, u slov svědčit, dosvědčit, přesvědčit se k tomuto jadernému morfému připojují zleva i zprava rozšiřující elementy -s- a -č-, do- a pře- jsou pak prefixální morfémy). Jaderné kořenové morfémy jsou jednak identifikované (dovedeme je určit z řady slovotvorně příbuzných slov, např. uvedený typ -věd-), jednak tzv. reziduální (zbytkové). Ty lze stanovit pouze na základě faktu, že okolní morfémy (předpony nebo přípony) jsou opakovatelné, tudíž vyčlenitelné, i v jiných slovech. To, co po jejich oddělení zbude, je reziduální kořenový morfém (např. -šet- ve slově pošetilý analogicky podle pobloudilý atp.). U sufixálních morfémů (přípon) je situace o to složitější, že některé rozšiřující elementy mají určitou funkci (např. spojovací samohláska v složených slovech nebo tematická samohláska sloves), jiné žádnou určitou funkci nemají, jsou prázdné (srov. modl-i-tb/a/, kde -i- je rozšiřující prvek funkční, -t- prázdný). Jak je patrno, morfematická analýza ve vlastním smyslu, tj. vlastní rozbor vnitřní struktury slova, nutně předpokládá konfrontaci tohoto slova s jinými slovy, s jinými shodnými funkčními útvary v jazyce. Z toho je zřejmé, že ani morfematická formální analýza, ač usiluje o důslednou formalizaci a — řečeno autorčinými slovy (s. 26) — „do jisté míry o nezávislost na postupu analýzy slovotvorné“, se bez využití principů analýzy slovotvorné a rozborů lexikálně sémantických neobejde. Jinak by např. nemohlo dojít ani k vydělení kořenových morfémů homonymních, užití principu opakovatelnosti by se stalo pouze mechanickou záležitostí. Platí tu naopak teze, že morfematická analýza je jen lineárním průnikem analýzy slovotvorné (a tvarotvorné) nebo šíře pojato, konfrontační analýzy mezislovních vztahů.[2]

Vlastní morfematický slovník E. Slavíčkové obsahuje na 64 000 takto morfematicky členěných slov. Za výchozí heslář posloužily dvojjazyčné slovníky česko-německé J. Volného a H. Siebenscheina a Stručný etymologický slovník Holuba - Kopečného (především pro přejatá slova). Výběr byl korigován Slovníkem spisovného jazyka českého tak, že byla vyloučena okrajová slova české slovní zásoby. Každému slovu se dostalo základní číselné klasifikační charakteristiky. Indexem 0 jsou označena slova autosémantická, nesložená, domácího původu, obecná (tzn. apelativa), stylisticky neutrální, jednoznačná, současná (kontemporální), s jasnou morfematickou strukturou (např. železnice, severák, mravní). Indexy 1—9 signalizují pak slova s odlišnými vlastnostmi: (1) jsou slova synsémantická, (2) složená, (3) přejatá, event. (9) nejasného původu, (4) vlastní (česká jména křestní a zeměpisná), (5) stylově příznaková, (6) homonymní, (7) zobecnělá od vlastních jmen (tzv. eponyma, např. rentgen), (8) slova zastaralá a knižní. Označení (6) se týká ovšem především homonymie kořenových morfémů, řidčeji homonymie, popř. polysémie celých slov (např. kač-k-a ‚kačena‘ má jednou index 0, 6, tj.: 0 … slovo daných „neutrálních“ vlastností, 6 … homonymní kořenový morfém, podruhé 5, 6 — ve významu ‚koruna‘: 5 … stylově příznakové slovo). Číselné charakteristiky samy, byť mají určitou informativní hodnotu, nejsou jistě hlavním přínosem práce (indexy se opírají o kvalifikátory Slovníku spisovného jazyka [173]českého), neboť některé z indexů mají značně proměnnou povahu a vyžadovaly by i propracovanější diferenciace (zejména se to týká stylové roviny, kde by bylo třeba minimálně lišit případy expresivity, příslušnosti k útvarům národního jazyka a k stylovým vrstvám atp.). Otázky homonymie a polysémie jsou jistě složitější, než jak mohou vystihnout jednomístné nebo dvojmístné indexy. Autorčina snaha jednoznačně řešit případy morfematické segmentace u slov, kde skutečné vztahy mezi morfémy připouštějí více než jednu interpretaci, zkresluje ovšem do jisté míry reálné vztahy v jazyce. Adekvátnějším řešením by bylo vyčlenit v takovém případě vedle jednoznačných kategorií i kategorie s alternativní interpretací a volit takový způsob notace, kterým by se dala taková dvojí, popř. vícerá interpretace zachytit.[3]

Soupis českých morfémů označila autorka jako retrográdní slovník ve shodě s tím, že morfematicky členěná slova jsou tu z praktických důvodů uspořádána v pořádku retrográdním. Je to jednak výhoda, např. pro zpracování sufixální (a konverzní) derivace, jednak však i nevýhoda (prefixální odvozování je tím znepřehledněno). Ideální by přirozeně bylo, kdyby lexikální materiál mohl být předveden jak v přímém, tak inverzním abecedním pořádku, a nadto ještě podle kořenů. Výhodou retrográdního uspořádání je to, že slovník E. Slavíčkové může do jisté míry suplovat stále bohužel chybějící retrográdní slovník češtiny,[4] nemůže jej ovšem plně nahradit, především proto, že její materiál, založený na překladovém slovníku, představuje jen část celkové slovní zásoby zachycené v našem Příručním slovníku jazyka českého i Slovníku spisovného jazyka českého.[5]

Strojové zpracování poskytlo autorce další kombinační možnosti, z nichž kromě retrográdního slovníku morfematicky rozčleněných slov, který představuje zároveň inventář kořenových, prefixálních a sufixálních morfémů, je v knize představeno dalších 12 seznamů. Jde zejména o seznam kořenových morfémů vyčleněných ze současné české stylisticky neutrální slovní zásoby (včetně variant je jich 1737) a o seznam nejfrekventovanějších kořenových morfémů. (Byly vyčleněny ty, které mají nejméně frekvenci 50.) Pro zajímavost uvádíme, že nejfrekventovanější kořeny v češtině jsou stá-, sed-, č(e)t-, jm-, lež-, táh- a ved-. Další seznamy zachycují soubory sufixálních a prefixálních morfémů, a to jednotlivých, jejich dvojic, popř. trojic.[6] Závěrečný seznam knihy podává inventář homonymních (homografních) kořenových morfémů domácích i cizích. Je jich 653, postrádáme však teoretické zdůvodnění toho, co autorka za homonymní útvary považuje; bylo by to zvlášť účelné pro to, že pojetí homonymie dosud v jazykovědných pracích (i našich) kolísá.

Z toho, co zde bylo ve stručnosti představeno, vyplývá, že kniha E. Slavíčkové může posloužit jak specialistům lingvistům, tak i informatice a automatizovanému zpracování informací.


[1] Srov. E. Slavíčková, Rozbor a kvantitativní hodnocení českých kořenových morfémů, sb. Problémy kybernetiky, Praha 1965, 360—371; táž, Některé problémy morfémové analýzy češtiny, SaS 28, 1967, 7—17, aj.

[2] Viz M. Dokulil, Tvoření slov v češtině 1, Praha 1962, zejm. kapit. Morfologická stavba slova, Slovotvorná analýza, Slovotvorné složky slova.

[3] Připomínáme v této souvislosti — podle našeho soudu — velmi oprávněný požadavek A. Juillanda, Structural Relations, Janua linguarum 15, Hague 1961, že má-li jazyková teorie být práva pojmové skutečnosti, musí si konečně uvědomit, že vedle jasně vyhraněných kategorií A a non A (popř. B) je třeba počítat i s kategoriemi i A i non A (B), popř. A nebo non A (B), popř. spíše A než non A (B) apod.

[4] Tento slovník leží již řadu let v rukopise v ÚJČ a ke škodě naší i světové jazykovědy se nenašla schůdná cesta k jeho vydání. Je to trapné, uvážíme-li, že čeština je dnes prakticky poslední ze slovanských jazyků, která tuto neocenitelnou pomůcku pro různé potřeby jazykovědy i jiných oborů dosud nemá. rd

[5] Příruční slovník jazyka českého obsahuje na 250 000 slov, Slovník spisovného jazyka českého, na němž je retrográdní slovník ÚJČ založen, na 192 000 slov české slovní zásoby.

[6] Soubory afixálních morfémů přinesly už dříve zejména práce Tvoření slov v češtině 2, Praha 1967, a V. Šmilauera Novočeské tvoření slov, Praha 1971. Lexikální zpracování předpon podává Slovník spisovného jazyka českého 1—4, Praha 1960—71, seznamy nejběžnějších předpon, přípon i prvních částí přejatých složených slov přinese v slovotvorné příloze i Slovník spisovné češtiny (v tisku).

Slovo a slovesnost, volume 38 (1977), number 2, pp. 171-173

Previous Josef Hrbáček: Nová sovětská práce o větě

Next Karel Horálek: Věta a výpověď