Jitka Štindlová
[Rozhledy]
Еще раз о ретроградных словарях / Pour la seconde fois à propos des dictionnaires rétrogrades
Retrográdním slovníkům jsme v SaS již před několika lety věnovali pozornost.[1] Hlavním záměrem zmíněného informativního příspěvku bylo upozornit na to, že sestavení retrográdního slovníku je prací mechanickou, pro člověka velice únavnou, která přímo volá po strojovém zpracování.
A dnes už máme k dispozici čtyři publikované retrográdní slovníky, při jejichž sestavování se užívalo strojů na zpracování informací; jsou to slovníky současných jazyků: angličtiny, francouzštiny, italštiny a němčiny.[2]
Slovníkový materiál byl uspořádán na různém strojovém vybavení, jednak děrnoštítkovém (slovník italský a německý), jednak na samočinných počítačích (slovník anglický a francouzský). Vstupním materiálem byly záznamy slov na děrných štítcích a děrných páskách. Pouze anglický slovník nebyl tištěn ze zvláštní sazby, ale vznikl ofotografováním výstupních strojových výpisů.
1. Nejstarší z uvedených retrográdních slovníků je retrográdní slovník italský: [371]M. L. Alinei, Dizionario inverso italiano con indice a liste di frequenza delle terminazioni (Mouton 1962, 607 s.).[3] Vyšel jako I. svazek řady jazykovědných a lexikografických studií Ústavu italského jazyka a literatury utrechtské university, kterou řídí Maria H. J. Fermina a Mario L. Alinei a která se má zaměřit především na publikace materiálu automatizované jazykovědné analýzy.[4]
Slovník obsahuje 43 506 slov vzatých z etymologického slovníku italštiny Prontuario Etimologico della Lingua Italiana, tedy slovníku, který usiluje o zachycení historie slov a snaží se vysvětlit jejich původ. Slovník vyšel r. 1958 v Torinu, jeho autory jsou B. Migliorini a A. Duro. Jen něco málo bylo z tohoto slovníku vyloučeno (některé morfémy zařazené do slovníku, jako např. anti- nebo vlastní jména) a asi 200 slov bylo nově zařazeno. Jde tedy celkem jen o malé změny v repertoáru předlohového slovníku, a proto by zřejmě nebylo nesnadné uvést tyto doplňky a omezení pro přesnou informaci v úplném seznamu v úvodu nebo závěru. (Rozdílná situace je u Materova slovníku němčiny, viz dále.)
Principy, na nichž byl slovník zpracován, formuloval Alinei jasně a stručně v úvodu: (1) Slova jsou řazena důsledně abecedně, a to od posledního do prvního písmene. — (2) Homografní slova se opakují jen potud, pokud jsou etymologicky různá. — Užití tohoto kritéria je umožněno tím, že předlohou byl etymologický slovník. — (3) Slova s různým přízvukem se opakují (např. metonìmia a metonimìa). (Přízvuk není bohužel v tisku označován, takže jen znalost jazyka prokazuje, že nejde o homografní jednotky etymologicky různé.) — (4) Zvratná slovesa se opakují také v podobě nezvratné.
Kriticky je možné stavět se jen k 3. bodu, a to k tomu, že kritérium pro opakování homografní jednotky je různý přízvuk. Jde totiž o širší otázku, je-li vůbec možno důsledně respektovat podobu grafickou a zároveň i zvukovou realizaci, která není graficky zachycena. Zdá se, že oba tyto plány je třeba důsledně oddělit (viz dále princip retrográdního slovníku francouzského).
Alinei jako první autor retrográdního slovníku uvádí součty slov se shodnými posledními, dvěma posledními a třemi posledními písmeny; ke slovníku připojuje i přehledy o počtu slov končících na stejné písmeno, na stejný digram a trigram a uvádí jejich absolutní i jejich relativní četnosti.
Grafická úprava slovníku je vynikající; je nejpřehlednější ze všech publikovaných slovníků tohoto typu. Snad tento dojem způsobuje skutečnost, že slova jsou tištěna kapitálkami. To je ovšem umožněno poměrně nevelkým rozsahem slovníku.
2. Retrográdní slovník angličtiny vyšel jako součást neprodejného slovníku angličtiny ve Filadelfii r. 1963: A. F. Brown, Normal and Reverse English Word List. Byl zpracován jazykovědným oddělením (Linguistics Department) pensylvánské university ve smlouvě s Air Force Office of Scientific Research a vydán (ofotografováním výstupních strojních výpisů počítače Univac I) v počtu 200 exemplářů.[5]
Slovník má osm dílů, z toho tři obsahují retrográdní uspořádání slov („Solid Entries“) a jeden retrográdní uspořádání sousloví, a to nejčastěji psaných s divizem („Broken Entries“). Slova byla převzata z pěti slovníků: Chamblrsʼs Technical Dictionary (vydal C. F. Tweeney a L. E. C. Hughes 1958), Dorlandʼs Illustrated Medical Dictionary (23. vydání 1960), Howard W. Samsʼs Modern Dictionary of Electronics [372](zpracoval R. F. Graf, 1962), A Dictionary of Scientific Terms (I. F. Henderson a W. D. Henderson, 1960, Websterʼs New International Dictionary of the English Language, 2. vyd., 1961).
Slovník není ovšem úplným heslářem uvedených předlohových slovníků, nýbrž mnohá slova byla vyloučena, např. většina vlastních jmen nebo některá přídavná jména. Celkem bylo zaznamenáno 417 000 lexikálních jednotek. Mnohé se shodovaly, opakovaly, a proto se musely vyloučit. Do slovníku bylo zařazeno celkem 354 252 jednotek, z toho 268 473 jednoslovných a 85 779 sousloví. Je to tedy nejrozsáhlejší z dosavadních retrográdních slovníků; má sloužit jako studijní materiál při analýze angličtiny pro úzký okruh zájemců.
Současně s výpisem a jeho reprodukcí byly tyto „hesláře“ zaznamenávány v různých verzích na magnetickou pásku pro archívování a další strojové zpracování. Pro speciální zájemce může být páska okopírována nebo mohou být podle ní vyrobeny i děrné štítky.
Slovník doprovázejí, a to je dost podivuhodné, neboť jde o slovník zpracovaný na samočinném počítači, jen velmi skromné informace statistického charakteru, o různě dlouhých slovech (Unbroken Entries) v slovníku.
3. Retrográdní slovník němčiny: E. Mater, Rückläufiges Wörterbuch der deutschen Gegenwartsprache (s. 693).[6] Vznikl jako „vedlejší produkt“ při opatřování materiálu pro evidenci německé slovní zásoby pro perspektivní strojové zpracování informací. Je založen (a to je zajímavé) na dvoujazyčném dvousvazkovém Německo-maďarském slovníku E. Halásze (Deutsch-ungarisches Wörterbuch) z r. 1952 (138 000 heslových slov). Tento slovník byl vybrán z několika důvodů: Především proto, že v době, kdy se materiál připravoval, byl to nejnovější dokončený slovník založený na rozsáhlé excerpci. Vzhledem ke struktuře maďarštiny hojně zařazoval složeniny, na rozdíl od podobných slovníků dvojjazyčných. A konečně že obsahoval ve značné míře odborné názvy, zvl. z věd přírodních a výrobních oblastí.
Obsah slovníku však autor porovnal i se slovníky jinými a na základě toho a dále konsultací s nakladatelstvím a vlastní excerpce vyloučil asi 10 % slov a téměř stejný počet slov (tj. asi 10 000) doplnil. Omezení se týkala především zastaralých grafických podob, odkazů, částí slov (např. 1. částí složenin multi-), vlastních jmen osobních a sousloví. Doplněna pak byla některá slova podle dalších slovníků (zvl. Slovníku současné němčiny (Wörterbuch der deutschen Sprache der Gegenwart), vycházejícího za redakce R. Klappenbachové). Byly to především poslední části složenin, které přesto, že existují jako samostatné lexikální jednotky ve slovníku, vyskytovaly se jen v podobách s předponami. Vylučováním a přidáváním slov si Mater velice znesnadnil práci a jistě v mnoha případech lze klást otázku, proč bylo zařazeno právě toto slovo, popř. proč nikoli.
Při sestavování tohoto slovníku bylo využito děrnoštítkových strojů (firmy Bull), ne dokonale adaptovaných pro německý grafematický systém; proto za strojovým zpracováním musela následovat ještě namáhavá práce člověka, bylo nutno přemísťovat celé skupiny slov na příslušná místa podle normalizovaného abecedního pořadí (např. ä nebo ü stroje interpretovaly jako dva grafémy a + e, u + e). Při této revizi nebylo nesnadné vyloučit některé skupiny slov, např. pravopisných dublet, a zavést i velká písmena, která ve strojovém zpracování nebyla odlišena od malých.
Materův slovník nás upozorňuje na důležitou problematiku: Je-li totiž nutné a vhodné držet se při retrográdním uspořádávání slov normy pro abecední třídění?[7] Nebylo by výhodné stanovit každému grafickému znaku v abecedě jeho místo?
[373]V Maternově slovníku může být např. nepohodlným rozhození slov stejného základu, např.:
losen lösen ablösen auflösen auslösen … | erlosen verlosen auslosen auslösen |
Norma pro abecední řazení českých grafémů (je jich 42) vytváří 31 řadících jednotek. Podle ní při třídění splývá y a ý nebo e, é, ě apod. — V češtině by jistě např. splývání adjektiv na -ý a adverbií na -y (hezký // hezky) znesnadňovalo další práci s retrográdně uspořádaným lexikálním materiálem; podobně krásné // krásně atd. Domníváme se, že je pro retrográdní řazení možno teoreticky zdůvodnit princip důsledného osamostatnění každého grafického znaku.
K Materově slovníku nejsou připojeny žádné statistické přehledy, ani nejsou uváděny číselné údaje uvnitř slovníku, a to je jistě škoda. V druhém vydání tohoto slovníku, které se připravuje, by bylo dobře je doplnit.
4. Posledním ze čtyř publikovaných retrográdních slovníků sestavených pomocí strojů je slovník francouzštiny: A. Juilland, Dictionnaire inverse de la langue française (Haag, Mouton 1965, 503 s.). Příprava pro tento slovník byla velice náročná a pracná, neboť jde o retrográdní uspořádání fonologických přepisů slov. Bylo tedy třeba nejprve stanovit repertoár francouzských fonémů (celkem 36) a jejich pořadí a dále sestavit potřebná pravidla pro přepis slov. Přestože má slovník poměrně rozsáhlý úvod, zůstává mnoho nejasného, např. i to, odkud pochází jeho lexikální fond; mluví se jen o slovní zásobě běžných slovníků („dictionnaires usuels“).
Není dále jasno, zda se i při přípravě materiálu, tj. při přepisu podob, využívalo strojů. Materiál nebyl zpracován na jediném pracovišti. Práce začaly v r. 1958 na pensylvánské universitě, v r. 1961 pokračovaly na universitě stanfordské a slovník byl dokončen v r. 1963 v Paříži. (Není známo kde.)
Více než 40 stránek slovníku zabírá přehled zakončení slov (až po třetí foném od konce) a údaje o jejich početním zastoupení.
Např. | a 544 |
aa 2
ba 18 |
kaa 1 naa 1
dba 8 eba 2 iba 1 |
Takový přehled a obsah, i když zabere poměrně hodně místa, je velice užitečný, protože hledání v retrográdním slovníku je přece jenom poněkud namáhavé. A jde-li o uspořádávání fonologických přepisů, je hledání ještě obtížnější.
K slovníku je připojeno i 70 stran statistických přehledů (tabulek i diagramů) inspirovaných, můžeme snad právem říci, slovníkem Alineiho, hodnotící výsledky retrográdního řazení. Hlavním smyslem retrográdního uspořádání bylo totiž stanovit hierarchii francouzských fonémů podle jejich frekvence na konci slov a vytvořit podklady pro porovnání těchto výsledků šetření ve slovníku, tedy v lexikálním systému, s výsledky získanými z analýzy textů. Jakých a jak zpracovaných, nikde se neříká. Ve statistických přehledech jsou srovnány výsledky zpracování slovníku s výsledky, ke kterým došel Alinei, přesto, že jde o fonémy a grafémy a o materiál francouzský a italský. To je ovšem vážný nedostatek statistických příloh tohoto slovníku, zvláště když se nikde nenaznačuje, že by se uvažovalo o zpracování retrográdního slovníku francouzštiny též na principu grafematickém. A přece takový slovník by byl vhodný pro srovnávání a pro mnohostrannou jazykovědnou analýzu. A přitom by jeho výroba ze stejného materiálu pomocí strojů byla zcela jednoduchá.
[374]Juillandův slovník ukázal, že je užitečné řadit retrográdně slova i podle fonologických přepisů a že je výhodné naprosto oddělit řazení slov podle fonologických a event. i fonetických přepisů od řazení podle grafematických struktur. Autor sám srovnáváním s výsledky, ke kterým došel Alinei, potvrzuje potřebu obou. (Retrográdní slovník francouzštiny spočívající na grafematickém principu připravuje za vedení B. Quemady besançonské mechanografické středisko.)
Publikované retrográdní slovníky nám poskytují mnohá poučení pro zpracování retrográdního slovníku češtiny, které bude na základě vycházejícího Slovníku spisovného jazyka českého provedeno rovněž pomocí strojů na zpracování informací.
[1] Srov. J. Štindlová, Retrográdní slovníky, SaS 21, 1960, 270—272. Širší informaci J. Štindlové Sur le classement inverse des mots et sur ce quʼon apelle „dictionnaire inverse“ v Cahiers de lexicologie (Besançon) 2, 1960, 79—86.
[2] Připravují se i další, viz např. zprávu F. Pappa O gotovjaščemsja obratnom slovare vengerskogo jazyka, Computational linguistics III, Budapest 1964, 205—211. Zároveň však vznikají i retrográdní slovníky bez pomoci moderních technických prostředků, např. nedávno publikovaný polský slovník Indeks a tergo do Słownika języka polskiego S. B. Lindego, který za redakce W. Doroszewského zpracovaly: R. Grzegorszykowa, Z. Kurzowa a J. Puzynina. (Vyd. Wydawnictwo Uniwersytetu Warszawskiego 1965, 392 s.)
[3] Slovník Alineův recenzoval Giulio C. Lepschy v Linguistics (Haag) 1964, č. 3, s. 116—123 a R. Bachturina a I. A. Meľčuk ve Voprosach jazykoznanija 1965, č. 5, s. 128—133.
[4] Blíže o tomto programu informoval M. Alinei na 4. sjezdu italských lingvistů v Magonze (duben—květen 1962) Lessicografia italiana con lʼausilio di macchine a schede perforate all ʼUniversità di Utrecht. Prime esperienze e prosperite.
[5] Nevím, zda je v ČSSR. Děkuji za zapůjčení dr. E. Materovi.
[6] Vydal v Lipsku r. 1965 VEB bibliographisches Institut. Slovník je rozebrán; v požadavcích exportu knih z NDR je na třetím místě.
[7] Mater řadí podle abecední normy „Duden“.
Slovo a slovesnost, ročník 27 (1966), číslo 4, s. 370-374
Předchozí Pavel Vašák: Statistika a sporné autorství
Následující Karel Hausenblas: K významnému životnímu jubileu akademika Jana Mukařovského
© 2011 – HTML 4.01 – CSS 2.1