Časopis Slovo a slovesnost
en cz

Frekvenční slovník mluvené bulharštiny

Ludmila Uhlířová

[Kronika]

(pdf)

Частотный словарь разговорного болгарского языка / A frequency dictionary of spoken Bulgarian

Čestoten rečnik na bălgarskata razgovorna reč (Nauka i izkustvo, Sofie 1987, 236 s.) od Cvetanky Nikolovové, vědecké pracovnice Laboratoře aplikované lingvistiky při Ústavu pro zahraniční studenty G. A. Násira v Sofii, je prvním a dosud jediným fenkvenčním slovníkem bulharštiny, který vyšel tiskem, a tedy i prvním z několika v Bulharsku zahájených projektů kvantitativního výzkumu slovní zásoby, který byl takto úspěšně završen.

Specifickým rysem tohoto frekvenčního slovníku je především materiálová báze. Tvoří ji běžně mluvené projevy mluvčích žijících a pracujících v Sofii, tj. skutečně nepřipravené (spontánní), „neoficiální“ dialogy, situačně zakotvené, vyznačující se určitou „ledabylostí“ (bulh. nebrežnost, snizenost, s. 12) v rovině lexikální, fonetické i syntaktické. Korpus o rozsahu 100 000 slov byl pořízen formou magnetofonových nahrávek (se skrytým mikrofonem) v obchodech, úřadech, domácnostech apod. Za pozornost stojí už skutečnost, že k získání korpusu bylo nejprve provedeno přibližně 110 hodin nahrávek; z nich bylo vybráno 14 hodin takových, které vyhovovaly nejlépe po technické stránce (nejmenším šumem, a tudíž největší srozumitelností), a ty pak byly dále zpracovávány. Ukázky zápisu několika nahrávek jsou ve slovníku otištěny. Už péčí o kvalitu jazykového materiálu je slovník velice cenný.

Etapa nahrávání trvala tři roky a probíhala v letech 1975–1977. Jazyková situace v sedmdesátých letech v Sofii prodělávala – a dodnes stále ještě prodělává – výrazné proměny: „jednotná sofijská norma“ mluvené bulharštiny „je teprve v procesu utváření“ (s. 14), západní a východní interdialekt se prolínají, aniž zatím splynuly v jediný. Frekvenční slovník odráží jistou etapu tohoto procesu, viděnou očima lexikografky, a to se snahou o pokud možno maximální úplnost: V slovníkových seznamech je zahrnuta veškerá slovní zásoba obsažená v nahrávkách, včetně slov nespisovných, slangových, vulgarismů i příležitostných výrazů idiolektických. I v tom je nesporná hodnota slovníku. Co slovník neobsahuje, je skutečná fonetická podoba jednotlivých lexémů a jejich tvarů, pokud neodpovídá současné pravopisné normě; nedozvíme se např., jaký je frekvenční poměr variant typu mljako a mleko, goljam a golem, nie govorim a nie [72]govorime apod., jež jsou pro vývoj současné bulharštiny velmi charakteristické. Nicméně vzhledem k tomu, že frekvenční slovník má být pouze první položkou z řady plánovaných publikací o mluvené bulharštině, je reálný předpoklad, že výslovnostní variantnosti normy bude pozornost přiměřená její důležitosti věnována v budoucnu.

Vlastní zpracování jazykového materiálu bylo provedeno tradiční lexikografickou technikou bez použití počítače. Korpus skládající se celkem ze 113 původních zápisů jazykových projevů nestejné délky rozdělila autorka do pěti podvýběrů o stejném rozsahu, tj. tak, aby každý podvýběr obsahoval 20 000 slovních tvarů. Podvýběry byly zpracovány jednotlivě a teprve potom byly údaje sumarizovány. Každé lexikální heslo v abecedním seznamu, který je nejdůležitější částí slovníku, obsahuje jednak údaje o absolutních četnostech všech doložených slovních tvarů lexému v každém z pěti podvýběrů zvlášť a jednak sumární četnost lexému v celém korpusu. Informace o tom, zda se lexém, resp. některý jeho tvar, vyskytuje jen v jednom, popř. ve dvou až ve všech pěti podvýběrech, nesporně má význam jako důležitý ukazatel užšího či širšího (nadindividuálního) využití slova v jazyce. Je škoda, že se autorka nezmiňuje o tom, podle jakých kritérií podvýběry utvořila, ani o tom, proč je jich právě pět (souvisí to zřejmě s obsahovou, tematickou povahou nahrávek).

To, že abecední seznam lexémů obsahuje zároveň údaje o frekvenci jednotlivých slovních tvarů, je další velkou předností slovníku. Lze totiž studovat využití dublet; k zajímavým zjištěním patří např. to, že v mluvených projevech není vůbec doložen kratší tvar pro 2. a 3. os. aoristu slovesa săm, tj. be; vyskytuje se pouze tvar delší, beše. Kratší tvar můžeme tedy v dnešní bulharštině považovat za výlučný prostředek psaného spisovného jazyka. – Uvádění frekvenčních tvarových spekter u jednotlivých hesel je ovšem umožněno tím, že v bulharštině jsou velmi chudá tvarová spektra jmen (bulharština, jak je známo, nemá morfologickou kategorii pádu); bohatší je paradigma slovesné – např. tvarové spektrum nejfrekventovanějšího bulharského slovesa săm má ve frekvenčním slovníku 28 položek, tj. 28 doložených různých tvarů.

Abecední seznam zahrnuje celkem 6600 lexémů a přibližně 1300 slovních tvarů. Kromě abecedního seznamu pořídila autorka, jak je to ve frekvenčních slovnících obvyklé, také seznam frekvenční, uspořádaný podle klesající frekvence a zahrnující všechny lexémy s frekvencí 10 a vyšší. Tento seznam má 806 položek, které dohromady pokrývají 85 % slovní zásoby korpusu.

Frekvenční slovník zřetelně ukazuje řadu charakteristických rysů mluvené bulharštiny. Projevují se jak ve frekvenčním rozložení slovních druhů, tak ve funkčním zatížení konkrétních lexikálních položek i jejich jednotlivých tvarů. Nápadná je např. nízká frekvence substantiv, totiž 15,79 %, a adjektiv, 3,83 %, v poměru k vysoké frekvenci sloves, 22,84 %. Situační zakotvenost mluvených projevů se odráží i ve vysoké frekvenci zájmen, zejména zájmen osobních a ukazovacích, 18,34 %, spontánnost se podílí na vysoké frekvenci částic, 7,49 %, atd. Ukazuje se dále, že mezi vysoce frekventované lexémy patří vedle slov všeobecné slovní zásoby (jichž je ovšem většina) i některá slova, jejichž vysoké funkční zatížení je specifickým rysem právě dané komunikační sféry: jsou mezi nimi např. vysoce polysémní tranzitivní slovesa gledam, chvaštam, puskam, opravjam, některá verba dicendi, např. vikam, razpravjam, i slovesa konkrétních činností, např. kupuvam, plaštam aj. Bezprostřední vztah mezi komunikanty, stejně jako rys neoficiálnosti se výrazně odrážejí např. ve frekvenčním rozložení kategorie slovesné osoby, zejm. ve vysoké frekvenci tvarů 1. os. sg.

Vysoká frekvence předložek (na, v, za, ot, po, …), částic (da, ne, li, …) i dalších polyfunkčních lexémů (edin, …) odráží gramatickou strukturu bulharštiny jako celku.

Frekvenční slovník mluvené bulharštiny je slovníkem dobré úrovně jak po stránce teoretickolingvistické (vlastním frekvenčním seznamům předcházejí výklady o pojetí hovorové bulharštiny a o jazykové situaci v Sofii), tak po stránce metodologické (je uveden např. přehled nejdůležitějších ve světě dosud vyšlých frekvenčních slovníků), a v neposlední řadě i po stránce technické (bezchybný tisk) a uživatelské (návod k užívání slovníku je krátkou sice, ale zasvěcenou studií o možnostech lingvistické interpretace statistických dat). Protože základem slovníku je dostatečně reprezentativní materiálový korpus, lze ho doporučit jako spolehlivý zdroj také pro kvantitativní i nekvantitativní konfrontační studium slovní zásoby slovanských jazyků.

Slovo a slovesnost, ročník 52 (1991), číslo 1, s. 71-72

Předchozí Jan Kořenský: Sovětský sborník o problematice překladu

Následující Ladislav Nebeský: Algebraický přístup k jazyku