Časopis Slovo a slovesnost
en cz

Ukrajinské sborníky o statistické a strukturní lingvistice

Jiří Kraus

[Kronika]

(pdf)

Украинские сборники о статистической и структурной лингвистике / Recueils ukrainiens sur la linguistique statistique et structurale

S prvními výsledky pracovišť soustředěných organizačně i metodologicky kolem kyjevského Ústavu jazykovědy A. A. Potebni seznamují sborníky Strukturno-matematična lingvistika (Kyjev 1965, 150 s., dále I) a Statistični ta strukturni lingvistični modeli (Kyjev 1966, 162 s., dále II). Jádrem obou sborníků jsou stati zachycující rozsáhlou přípravu akademické mluvnice ukrajinského jazyka, nechybějí zde však ani studie věnované komparatistice nebo jazykům jiným (moldavštině, ruštině). Vedle prací se zaměřením obecnějším přinášejí sborníky — a v tom je podle našeho názoru jejich hlavní přednost — mnoho zajímavých konkrétních výsledků a aplikací statistických. Předmětem zájmu autorů jsou různé plány jazyka (pět statí se týká fonologie; čtyři morfologie, šest syntaxe a devět lexikologie; čtyři studie jsou zaměřeny obecně) i aplikace mluvnického popisu na řešení problematiky automatického referování. Příznivě se projevuje zvláště možnost zpracovat jazyková data na samočinných počítačích, realizovaná jako výsledek spolupráce s kyjevským Ústavem kybernetiky. V tomto stručném přehledu se zastavíme především u těch prací, které považujeme za nejzajímavější.

V. S. Perebejnosová (Opakování fonémů a struktura slova v současné ukrajinštině, ukr., II, 36—44) podává statistický popis 300 000 fonémů[1] ze šesti stylových oblastí (dramata, umělecká [324]próza, poezie, sociálně politická literatura, mluvené projevy, vědecká próza). V každé oblasti je zastoupeno 50 textových úseků po 1 000 fonémech. Autorka udává jak četnosti nejčastějších fonémů podle oblastí, tak i míru nerovnoměrnosti jejich opakování v reálném textovém úseku pomocí tzv. geometrického rozložení. Pro strukturu ukrajinského slova (a dodejme: též slabiky) je přiznačná skutečnost, že mezi dvěma stejnými samohláskami bývá nejčastěji jen jeden foném (typ mama, tata, baba). Zajímavý je autorčin názor (na němž je celý výzkum založen), že rozložení fonémů je jedním z příznaků funkčně stylistického rozlišení. Výsledky podobných výzkumů celkem přesvědčivě potvrzují názor, že při řešení stylometrických otázek „mohou účinněji pomáhat jevy co nejméně nápadné, neuvědomělé“[2] (to platí především o některých, zdánlivě všedních nebo nepříznačných mírách, jako je např. průměrná délka věty nebo slova, jejichž statistický popis má svou tradici. Domníváme se ovšem, že uvedené statistické charakteristiky nelze chápat izolovaně jako výhradní kritérium pro zařazení textu do některé funkční oblasti, ale považujeme je za dílčí projevy vnitřních vlastností textu podobně jako komplex psychologických testů odhaluje strukturu ústředního faktoru osobnosti). Fonologický plán, který je z hlediska stylového i tematického zařazení plánem nejabstraktnějším, je podle našeho názoru spíše charakteristikou jazykovou než stylovou, přesto však výsledky ukrajinského pracoviště mohou napomoci řešení této problematiky právě cennými údaji materiálovými. Ty jsou pro oblast fonologie shrnuty i v dalších sborníkových studiích (L. M. Gridneva, Rozložení samohlásek, souhlásek a pauz v současné ukrajinštině, ukr., II, 45—53; M. P. Muravicka, Četnost dvoufonémových koncových spojení v současné ukrajinštině, ukr., II, 54—61) týkajících se ukrajinštiny a ve studii V. V. Kaluginové Pokus o statistiku písmen v moldavských textech (rusky, I, 128—133) založené na rozboru 50 000 grafémů (tj. písmen i interpunkčních znamének) ve dvou románech moldavského klasika I. Krjangeho.

Pravděpodobnostmi výskytu jednotlivých tvarů ukrajinského slovesa v žánrově rozlišených textech se zabývá stať V. M. Rusanovského Statistické charakteristiky tvarů ukrajinského slovesa (ukr., II, 62—69). Autor vychází z důsledného binárního dělení slovesných kategorií (rozlišuje např. časy minulé a neminulé, neminulé pak dělí na přítomný a budoucí) a připisuje jim relativní četnosti, charakterizující individuální rozdíly mezi zkoumanými autory. Předpokladem tohoto popisu je znalost sémantických vlastností slovesa (týž autor, ukr., I, 56—64), které jsou vymezovány statisticky a distribučně. 4 000 sloves je tak rozděleno na 81 významových tříd. — Transformační analýza je podkladem jemnějšího třídění pasívních (I, 30—39) a nominálních (II, 180—116) konstrukcí v studiích Alexejenkových. Autor zde vychází z aplikativního generativního modelu, rozpracovaného S. K. Šaumjanem, jehož stať Kybernetika a jazyk (rusky, II, 3—21) uvádí druhý ze sborníků. Šaumjan vytýká Chomskému, že jeho koncepce ignoruje paradigmatickou osu a hypostazuje osu syntagmatickou. To vede i k známým nevýhodám při aplikaci generativní gramatiky na rozbor jazyků s volným slovosledem. Šaumjan, ve shodě se svým dvoustupňovým pojetím jazykového zobecnění, rozlišuje úroveň konstruktů (genotyp) a úroveň pozorování (fenotyp), mezi nimiž je vztah vzájemné korespondence. Vnitřní vztahy mezi jazykovými objekty se zkoumají na základě vztahu dominance, abstrahované od lineárního způsobu výstavby těchto vztahů.[3] Na popis lexikálního systému aplikuje tento model V. S. Perebejnosová v studii Zkoumání lexikálního systému na základě aplikativního generativního modelu (ukr., I, 65—83). Pomocí generátoru tříd symbolů zkoumá autorka proces vytváření slovesných tva[325]rů odvozených od základu -čit- a zjišťuje četnosti jejich výskytu. Podobným přístupem lze charakterizovat i zajímavý rozbor ukrajinských toponym, provedený M. M. Pesčakovou (I, 84—106 a II, 97—107). Originálním pojetím se vyznačuje i stať I. M. Krejna Modelování lexikální aktivity slova (ukr., II, 117—123): Každé slovo se charakterizuje řadou příznaků (počet významů, frazeologických spojení, složených lexémů a slovotvorných typů), mezi nimiž se počítají korelace, lexikální váha se pak definuje jako součet jednotlivých korelací a je podkladem pro výpočet tzv. lexikální aktivity slova. Krejnův rozbor, provedený na poměrně omezeném materiálu, by mohl být jedním z předpokladů soustavného kvalitativního a kvantitativního popisu slovníku. — O přípravách na sestavení frekvenčního slovníku současné ukrajištiny informují A. O. Stognij a V. S. Perebejnosová (I, 107—112); materiál o rozsahu 2,5 miliónu slovních tvarů, získaný rozborem pěti stylových oblastí, bude zpracován na samočinných počítačích. Zpracování se zúčastní pracovníci kyjevského Ústavu jazykovědy, Ústavu kybernetiky a Ševčenkovy university.

Ze studií věnovaných automatické analýze a zpracování textu upozorníme alespoň na zajímavou stať I. P. Sevba Některé charakteristiky souvislého textu a problémy automatického anotování (rusky, II, 124—137), zkoumající typy větných spojení. Jednotkou popisu je odstavec; postupně se sestavuje procedura, která vede k redukci odstavce na jednoduché standardizované věty. Nejzávažnějším krokem této redukce je tzv. lexikální identifikace, jíž se slova s referenčním významem nahrazují odpovídajícími konstantními názvy. Tato stať je názornou ilustrací vztahu mezi lingvistickou teorií a praxí automatického zpracování dat.

V celkovém hodnocení obou sborníků chceme především zdůraznit komplexnost přístupu většiny autorů ke zkoumanému materiálu, snahu o syntézu algebraických i statistických metod a hledání rovnováhy mezi modelováním jevů synchronních a diachronních. Ověřování reprezentativnosti zjišťovaných výsledků je ve všech pracích nutným předpokladem dalšího zobecnění. Jsme tedy toho názoru, že oba sborníky jsou velmi vhodnou diskusní základnou pro vypracování projektu připravované ukrajinské mluvnice a zároveň zajímavým metodologickým příspěvkem k řešení problematiky strukturní a statistické lingvistiky.


[1] Srov. též V. S. Perebejnos, Častota i sočetajemosť fonem sovremennogo ukrainskogo jazyka, Seminar: Avtomatizacija inform. rabot i voprosy prikl. lingvistiki, Kijev 1965.

[3] Srov. i jeho Transformacionnyj metod v strukturnoj lingvistike, Moskva 1964, a O. Leška, K Šaumjanově definici fonému, SaS 27, 1966, 205—208.

Slovo a slovesnost, ročník 28 (1967), číslo 3, s. 323-325

Předchozí Františka Havlová: Sovětské symposium o autorských slovnících

Následující Jan Průcha: Nové lingvistické časopisy v SSSR