Časopis Slovo a slovesnost
en cz

Sovětská práce o frekvenci slovních spojení v angličtině

Jiří Kraus

[Kronika]

(pdf)

Советская работа о частоте словосочетаний в английском языке / Un ouvrage soviétique sur la fréquence des locutions en anglais

Pozoruhodná řada sovětských studií zahrnujících kvantitativní popis a rozbor nejrůznějších stylových, žánrových a tematických variant psaného i mluveného jazyka byla obohacena o další příspěvek. Je to třísvazkový Častotnyj slovar’ sočetajemosti sovremennogo anglijskogo jazyka, vycházející v Moskvě za redakce N. O. Volkové, G. Z. Ginzburga, V. I. Perebejnosové, A. V. Senkina a S. S. Chidekelja (1. č. obsahuje principy sestavení slovníku, 1971, 76 s., 2. č. vlastní slovník ve dvou svazcích, 1972, 213 s. a 228 s.).

Sestavení frekvenčního slovníku víceslovných kombinací je úkolem velice náročným především na rozsah souboru, z něhož je materiál excerpován. Na přípravě tohoto díla, vesměs zpracovávaného ručně, spolupracovalo třicet ústavů a vysokoškolských kateder z mnoha republik Sovětského svazu. Základní soubor slovníku tvoří 124 děl umělecké prózy (asi 7 miliónů slov), 9 divadelních her (300 tisíc slov), 12 pramenů publicistických (250 tisíc slov) a 15 vědeckotechnických (500 tisíc slov). Převaha uměleckých žánrů je tedy zcela výrazná; autoři ji sice nezdůvodňují, ale patrně předpokládají, že dramata a dialogy v beletrii významnou měrou odrážejí i styl hovorový, který jinak samostatně zastoupen není.

Slovník byl sestavován ve dvou etapách. Nejdříve byl vybrán na základě Thorndikeova a Lorgeova frekvenčního slovníku angličtiny[1] tisíc nejčastějších plnovýznamových slov (tj. 498 subst., 285 sloves, 139 adjektiv, 62 adverbií a 7 slov bez přesné slovnědruhové charakteristiky — alone, but, else, half, ill, like, sure), jejichž výskyt se pak v další etapě zaznamenával na excerpční lístky a stal se východiskem dalšího zpracování. Pro každou dvojici větných členů (syntagma, slovosočetanije) v rámci věty slovník udává jeden ze tří typů syntaktického vztahu — souřadné, podřadné a predikativní. U spojení podřadných (v čes. syntaktické terminologii určovacích, determinačních) se rozlišují konstrukce jádrové, v nichž analyzovaný větný člen má funkci řídící, a nejádrové, v nichž tento člen závisí na jiném, jímž je řízen (rozdělení vztahů jádrových a nejádrových tedy charakterizuje dvojí pohled na týž jev). Slovník je uspořádán podle typů (modelů) těchto vztahů, např. modely slovesa jsou a) souřadné (she dressed, put her laces on her neck), b) jádrové (make again; appear as follows; stood with his head down), c) nejádrové neboli adjunktní (a place to enter) a d) predikativní (I see). Analogicky se klasifikují i modely ostatních plnovýznamových slovních druhů, např. substantiv: a) neither time nor opportunity, b) my house; time to come, c) my sister’s room; made no decision except one, d) the boy became a doctor. U každého spojení se udává celková absolutní četnost ve všech excerpovaných souborech, dále počet pramenů (textů) a počet základních jednotek výběru, tj. minimálních výběrů o délce tisíc slov, v nichž se syntagma vyskytlo, např. make difference 30/12/28, make fuss 17/6/16.

V slovníku se uplatňuje dvojí přístup k popisu syntaktických konstrukcí — první se omezuje na zkoumání frekvencí lexikální náplně jednotlivých syntagmat (u vybraných sloves), druhý charakterizuje syntaktické vztahy v rámci rozsáhlejších větných úseků, řetězů, označených symboly. Tyto řetězy, obsahující frekvenční soupis posloupnosti syntagmat v rámci věty, představují jádro slovníku, např. VD + VprpN + NV NVDprpN 2/2/2 (he makes resolutely for the door). Úplný seznam elementárních konstrukcí je uveden přehledně na počátku 1. svazku (s. 12—20) a je uspořádán (1) podle slovních druhů (sloves, substantiv a adverbií) a (2) podle typů vztahů — a) souřadné, b) jádrové, c) adjunktní, d) predikativní. Takto klasifikované elementární konstrukce jsou opatřeny pořadovými čísly, která umožňují orientaci v uspořádání rozsáhlejších řetězů syntagmat. [184]Struktura slovníkového hesla tedy vypadá takto:

102 + 113 + 301 + 415 (pořadová čísla soupisu konstrukcí)

VN + VprpN + NV + VbutV NVbutV’NprpN (symbolický zápis konstrukcí; před šipkou v uspořádání systematickém, po šipce v uspořádání lineárním)

The maid murmured but made no effort at (further) conversation

(Při jediném výskytu se frekvence neuvádí.)

V uceleném a systematickém třídění syntaktické problematiky spočívá největší význam slovníku, který, pokud je nám známo, je prvním frekvenčním slovníkem syntaktických konstrukcí vůbec. Z toho vyplývá skutečnost, že se autoři museli při jeho sestavování vypořádat s řadou problémů zcela nově. Výsledek jejich práce je uspokojivý a celkové uspořádání poměrně přehledné, i když bohužel grafická úprava všech tří sešitů stejně jako měnění principů zpracování v průběhu díla orientaci v slovníku poněkud znesnadňují. Lze však předpokládat, že po uvážení kritických připomínek k tomuto vydání bude následovat znění definitivní, které si vyžádá užití diferencovaných typů písma a přehlednější výklad principů sestavení a užívání slovníku.

Hlavní těžiště práce spočívá v hlubším poznání lexikálních a syntaktických vlastností slova a jeho valencí v současné psané angličtině a rovněž v možnosti diferencovat centrální syntagmata a jejich řetězy od periferních. Autoři pečlivě rozlišují homonyma, např. slovo right zde vystupuje jako substantivum (all rights reserved), adjektivum (he is all right), příslovce (he did it all right) nebo jako součást citoslověčného výrazu all right. Toto rozlišení, pro jazyk typu angličtiny tak důležité, přináší řadu cenných poznatků především pro diferencované chápání syntaktických konstrukcí.

Spolu s využitím závěrů slovníku v oblasti teorie slovní zásoby, gramatiky, stylistiky a typologie počítají autoři s uplatněním výsledků i při jazykovém vyučování a při automatickém zpracovávání textů. Účelnějšímu užití slovníkových údajů v této oblasti aplikací by však napomohlo zřetelnější stylové a žánrové rozlišení materiálu, z něhož byl slovník sestaven, a především vyšší zastoupení pramenů stylu vědeckého a novinového, u nichž lze očekávat větší stereotypnost syntaktických konstrukcí, a tedy i vyšší četnost základních a centrálních kategorií.

Definitivní zpracování slovníku, které by přineslo další údaje v prvním vydání pro nedostatek místa neotištěné a které by zpřesnilo a prohloubilo dosavadní výklad, namnoze pouze předběžně koncipovaný, mohlo by znamenat závažný krok vpřed při sestavování frekvenčních slovníků, u nichž se projevuje zřetelná snaha obsáhnout vyšší počet jazykových jevů a tak hlouběji poznat jazykový systém a jeho fungování.


[1] The Teacher’s Word Book of 30,000 Words, New York 1944.

Slovo a slovesnost, ročník 34 (1973), číslo 2, s. 183-184

Předchozí Jan Kořenský, BHk (= Bohuslav Havránek): Zasedání Mezinárodní komise pro studium gramatické stavby slovanských jazyků

Následující Iva Nebeská: Dvě nové práce ze sovětské psycholingvistiky