Časopis Slovo a slovesnost
en cz

K formě závislostních gramatik

Svatava Machová

[Rozhledy]

(pdf)

К форме зависимостных грамматик / Sur la forme des grammaires de dépendence

1. Závislostní gramatiky vycházejí z konstatování syntaktické závislosti některých větných členů na jiných. Tento typ popisu má v evropské kontinentální lingvistice dlouhou tradici, i když termínu závislostní gramatika (ZG) se začalo užívat poměrně nedávno. Autoři těch tradičních gramatik, které bychom dnes mohli nazvat závislostními, se většinou nezabývali formálním vymezením závislosti. O tom, který z větných členů je třeba označit jako závislý, resp. nezávislý, se rozhodovalo vždy alespoň podle jednoho ze tří níže uvedených kritérií:

(1) závislým je ten člen a, který v důsledku přítomnosti členu b přijímá jisté morfologické charakteristiky, např. novému (a) stolu (b), zahrada (b) kvetla (a);

(2) závislým je ten člen a, který se ve větné konstrukci nemůže vyskytovat bez členu b, zatímco člen b se může vyskytovat bez členu a, např. číst (b) na zahradě (a). S tímto kritériem nelze adekvátně rozhodnout o konstrukcích typu octla se (b) v podivném království (a) či potkala (b) bílého králíka (a);

(3) nezávislým je v nějaké konstrukci ten člen b, který reprezentuje skupinu členů vně dané konstrukce.

2. V české lingvistice má závislostní koncepce své pevné místo. Rozvíjela se částečně i pod vlivem mluvnické tradice ruské a byla zpracována ve svých základních aspektech v pražské škole (srov. pojem syntagmatu už u B. Havránka s kol., rozbor pojmu závislosti u K. Hausenblase, Danešovy větné vzorce).[1] Vedle pražské školy rozpracovává závislostní koncepci zejména Vl. Šmilauer. Mezi větnými členy rozeznává vztahy predikace, determinace, apozice, koordinace a parenteze. Za vztah závislostní pokládá jen determinaci: Ve vztahu determinace mohou být dva členy, jež nejsou rovnocenné. Jedním členem vztahu je člen závislý, který určuje a současně předpokládá druhý člen — člen řídící. Naproti tomu ve vztahu predikace mohou být dva členy, které jsou rovnocenné a navzájem se předpokládají. Grafické znázornění větné struktury, kterého se někdy v českých syntaxích užívá,[2] je blízké jejímu zachycení v podobě vrcholového závislostního stromu (viz níže).

I v ruské a sovětské lingvistice byly — jak je uvedeno výše — formulovány gramatiky, které bychom dnes mohli označit jako závislostní. Na syntaktické ro[144]vině se vycházelo ze dvou pojmů, věta a slovní spojení (slovosočetanije).[3] Slovním spojením se rozumí spojení několika plnovýznamových slov spjatých významově i gramaticky. Nejmenším slovním spojením je slovní spojení dvouslovné. V mnoha případech jsou slova ve dvouslovném slovním spojení nerovnoprávná, jedno slovo závisí na druhém. Řídící slovo se např. u A. M. Gvozdeva[4] nazývá jádrovým (steržnevym) či podřizujícím (dominujícím) a závislé se nazývá podřízeným. Diagram, kterým se v ruských gramatikách zobrazují vztahy mezi slovy, se podobá závislostnímu vrcholovému stromu, jehož vrcholem je podmět ve dvojčlenných větách a hlavní člen ve větách jednočlenných.

První pokus o teoreticky ucelené zpracování ZG nacházíme u L. Tesnièra. Ve své syntaxi pojednávající o gramatických kategoriích a zákonech jejich uspořádání v jazyce vymezuje větu jako hierarchickou strukturu tvořenou jedním nebo více uzly. Základem věty je slovesný uzel, který ji celou řídí, nikoli subjekt. Každý uzel může mít jistou valenci, nulovou (nemůže na něm záviset žádný uzel) nebo nenulovou (může na něm záviset jistý počet dalších uzlů). Tesnière zkoumá především valenci slovesných uzlů a dělí uzly, které závisejí na slovese, na aktanty (actants) a na okolnostní určení (circonstants).[5] Každý aktant zaujímá ve větné struktuře jisté místo a je podle něho označován jako první, druhý, třetí a popř. i čtvrtý aktant. První aktant se v sémantické rovině interpretuje jako konatel (tj. činitel nebo nositel) děje, druhý jako zasažený objekt, třetí jako objekt, v jehož prospěch či neprospěch se něco děje (nepřímý předmět), čtvrtý jako nástroj nebo prostředek. Počet aktantů je omezen a pro každé sloveso lze vždy stanovit jak počet aktantů, tak jejich ohodnocení, zatímco počet okolnostních určení stanovit nelze. Toto pojetí má blíže k sémantické a logické analýze věty, v níž nemá subjekt podstatně jinou pozici než jiné argumenty slovesného predikátu.

V terminologii J. Kuryłowicze odpovídá závislosti mezi prvky větné struktury vztah mezi členem „základním“ a nějakým dalším členem „konstrukce“.[6] Základními jsou ty členy, které zastupují celou konstrukci v jejích „vnějších vztazích“, což v terminologii u nás obvyklejší znamená, že vztahy syntaktické dvojice (konstrukce) k jiným větným členům jsou vyjádřeny stejně jako vztahy řídícího (rozvíjeného, určovaného, základního) členu této dvojice k oněm jiným členům. Z hlediska větně členské platnosti neexistuje tedy rozdíl mezi členem určujícím celou syntaktickou dvojici a členem určujícím jen její řídící slovo. Toto měřítko lze považovat za rozhodující pro určení řídícího členu dvojice (tedy směru vztahu závislosti) i tam, kde by samo uspořádání prostředků (shoda ap.) ukazovalo na směr opačný (a kde nelze vystačit s jednoduchým měřítkem, podle něhož je řídícím ten člen, který „nemůže být nepřítomen“ — neboť někdy nemůže být nepřítomen ani člen rozvíjející).

3. Formální vlastnosti závislostních gramatik se začaly šíře studovat v souvislosti se strojovým překladem a pojmy závislostní gramatika a závislostní struktury byly zformulovány zejména K. E. Harperem a D. G. Haysem v r. 1959 a nezávisle na [145]nich G. S. Cejtinem a L. N. Zasorinovou v r. 1961; podrobný formální rozbor z hlediska generativního přináší Gaifmanova práce z r. 1965.[7]

Závislostní gramatika obvykle obsahuje tři soubory pravidel:

(a) pravidla klasifikace slovních tvarů. Pro každý slovní tvar jsou určeny třídy, do kterých patří. Každý slovní tvar musí patřit alespoň do jedné třídy. Symboly označující tyto třídy tvoří pomocnou abecedu gramatiky;

(b) pravidla tvoření všech možných keřů z těchto tříd. Keř je elementární strom skládající se ze slova řídícího a ze slov na něm přímo závislých;

(c) pravidla, kterými jsou určeny třídy, jež mohou být vrcholem nějaké možné závislostní struktury.

Příklad: V nějakém jazyce L se vyskytují slovní tvary a1, … am, b1, …, bn, c1, …, cp. Představme si pro tento jazyk ZG s následujícími pravidly:

Soubor (a):

aiA, biB, ciC.

Soubor (b):

 

A

 

C

 

C

 

 

/ \

 

/ \

 

/|\

 

 

B   C

 

B   B

 

A B A

Soubor (c):

vrcholem závislostní struktury může být pouze třída A.

Pak závislostní struktury jazyka L jsou např. tyto:

1)

ai

2)

ai

3)

ai

 

/ \

 

/ \

 

/ \

 

bi   ci

 

bi   ci

 

bi   ci

 

 

 

            / \

 

            /|\

 

 

 

          bi   bi

 

         ai bi ai

 

 

 

 

 

        / \

 

 

 

 

 

      bi   ci

 

 

 

 

 

           / \

 

 

 

 

 

         bi   bi

V generativní závislostní gramatice probíhá generování větné struktury takto: podle pravidel ze souboru (c) se zvolí nějaká třída, která může být vrcholem závislostní struktury. Tento vrchol se stane výchozím uzlem, který shodně s naším příkladem označíme A. K tomuto uzlu se na základě pravidel ze souboru (b) hledá nějaký možný keř. Jakmile je nalezen, změní se výchozí uzel A na keř se základním uzlem A a uzel A se poté změní podle nějakého vhodného pravidla ze souboru (a) na určitý slovní tvar. Tak se postupuje pro všechny uzly, dokud se nezíská strom, jehož uzly jsou pouze slovní tvary.

4. Vzhledem k tomu, že pravidla souboru (b) lze formulovat různě — že lze různě vymezit množinu možných keřů — rozlišují se různé typy ZG.

Jsou-li zadány možné tvary keřů seznamem, bude počet rozdílných keřů konečný a také šířka keřů bude konečná. Tohoto typu je např. ZG Gaifmanova. H. Gaifman [146](1965) předpokládá, že na každém slovním tvaru patřícím do dané třídy může záviset jistý počet slovních tvarů jistým způsobem — že tedy každý slovní tvar může mít v keři, který řídí, pouze omezený počet závislých slovních tvarů, ve stanovených funkcích, kterým se říká místa; a že každé místo (charakterizované jistým druhem závislosti) může být obsazeno pouze jedním slovním tvarem a ne několika (několikanásobné větné členy se pokládají za jeden člen a obsazují pouze jedno místo).

Jiným typem ZG je gramatika S. Ja. Fitialova,[8] který definuje orientovanou nekontextovou gramatiku, spojující určité rysy závislostní a frázové gramatiky: v jejích orientovaných pravidlech je na pravé straně vždy jeden výskyt symbolů označen jako hlavní, řídící. Skutečnost, že slovní tvar b může záviset na slovním tvaru a, nazývá podle Tesnièra valencí. Pro každý slovní tvar je podle jeho názoru možno sepsat všechny jeho valence. Na valence klade tato omezení: některé valence lze realizovat jen v tom případě, že se současně realizují i nějaké další, a některé valence se v dané struktuře smějí realizovat pouze jednou.

Jiné vlastnosti má závislostní struktura ve funkčním generativním popisu (FGP), jak ho formuloval P. Sgall.[9] Závislostní struktury jsou v této gramatice zachycovány grafy speciálního typu, tzv. vrcholovými stromy, jejichž keře (na rozdíl od Gaifmanovy ZG) mají neomezenou šířku.[10] Vrcholový strom lze vymezit jako dvojici (U, Z), kde U je konečná abstraktní množina (interpretovaná jako množina uzlů) a Z je binární relace definovaná na U tak, že (U, Z) je souvislý graf. Z(uk, uj) znamená, že uzel uk je v relaci přímé syntaktické závislosti Z na uzlu uj. Z*(ul, un) znamená, že pro každé (ui, ui+1) pro 1 i n—1 platí Z(ui, ui+i), tedy že ul je nepřímo podřízeno uzlu un. V množině U existuje jediný uzel ur (interpretovaný jako vrchol stromu), pro který neexistuje žádný uzel ui takový, že by platilo Z(ur, ui) — tzn. že vrchol stromu nezávisí na žádném jiném uzlu. Platí-li Z(ui, uj), neplatí Z(uj, ui), tzn. že jde o antisymetrickou relaci. Ke každému uzlu uk pro k r existuje právě jeden uzel uj takový, že platí Z(uk, uj) — tzn. že každý uzel s výjimkou vrcholu přímo závisí právě na jednom uzlu (def. vrcholového stromu viz např. Harper, Hays, o. c. v pozn. 7).

Uzly vrcholového stromu Sgallovy gramatiky jsou ohodnoceny — hodnoty jsou v různých rovinách různé, v generativní složce to jsou komplexní terminální symboly, v nižších rovinách pak názvy komplexních jednotek těchto rovin. Hrany vrcholového stromu jsou ohodnoceny názvy syntaktických vztahů (ve Sgallově gramatice se v generativní složce rozlišuje 6 hlavních syntaktických vztahů). Vrcholem stromu zachycujícího větnou strukturu dvojčlenné věty v tektogramatické rovině může být pouze symbol označující sémantické sloveso. Vedle závislostní relace je na množině uzlů U v této gramatice definována také relace W (interpretovaná jako pořadí zleva doprava). W(ui, uj) znamená, že uzel uj následuje za uzlem ui. Relace W je [147]úplným uspořádáním, všechny uzly jsou tedy uspořádány zleva doprava. Na morfologické rovině FGP toto uspořádání odpovídá slovosledu věty, v rovině tektogramatické pak stupnici výpovědní dynamičnosti. Vrcholový strom FGP je projektivním stromem, tzn. že pro každé tři uzly ui, uk, uj z množiny U takové, že W(ui, uj) a takové, že buďto Z(ui, uj) nebo Z(uj, ui) platí, že pro každý uzel uk takový, že W(ui, uk) a W(uk, uj) je Z*(uk, ui) nebo Z*(uk, uj). Jinak řečeno, projektivním je strom, platí-li pro každé tři uzly ui, uk, uj z množiny U, že když uzel uj následuje za uzlem ui a současně uzel ui závisí buďto na uzlu uj nebo uzel uj závisí na uzlu ui, pak pro každý uzel uk takový, který následuje za uzlem ui a předchází před uzlem uj, platí, že je (třeba nepřímo) podřízen buďto uzlu ui, nebo uzlu uj.[11] Příklad projektivního vrcholového stromu z roviny větně členské (ohodnocení uzlů je zapsáno zjednodušeně, pouze slovním tvarem, zatímco ve FGP je v této rovině uzel ohodnocen lexikálním symbolem s mnoha charakteristikami různého typu):

    přečetl

    Sb / \ Ob

Karel     dopis

               \ At

              přišel

            Sb / \ Ad

        který     včera

 Příklad neprojektivního vrcholového stromu:

 

5. Ukazuje se, že závislostní typ gramatik nachází stále širší uplatnění, jak v souvislosti s přípravou strojového překladu, tak v obecných lingvistických teoriích a že se z principů závislostního popisu často vychází i tam, kde autor užívá teoretického rámce jiného (z různých aspektů to lze říci o C. J. Fillmorovi, J. J. Katzovi i o S. K. Šaumjanovi). Bázový komponent transformační generativní gramatiky sice obvykle vychází z koncepce bezprostředních složek,[12] ale bylo již prokázáno, že i v rámci transformačního popisu lze pracovat s gramatikou závislostní: pro řešení některých problémů, např. při rozhodování o užití nějaké transformace nebo pro odstranění některých mnohoznačností, je to dokonce velice vhodné.[13]


[1] B. Havránek - L. Kopecký - E. Starý - A. Získal, Cvičebnice jazyka českého pro 1. tř. středních škol, Praha 1945; K. Hausenblas, Syntaktická závislost, způsoby a prostředky jejího vyjadřování, Bull. VŠRJL 2, 1958, 23—48; F. Daneš, Syntaktický model a syntaktický vzorec, Čs. předn. pro V. mezinár. sjezd slavistů v Sofii, Praha 1963, 115—124 — nověji Vědecká synchronní mluvnice spisovné češtiny, základní koncepce a problémy, Praha 1974.

[2] Např. Vl. Šmilauer, Novočeská skladba, Praha 1947; Učebnice větného rozboru, skriptum UK, Praha 1958.

[3] A. M. Peškovskij, Russkij sintaksis v naučnom osveščenii, Moskva 1914; A. A. Šachmatov, Sintaksis russkogo jazyka, Leningrad 1925; Grammatika russkogo jazyka (akademičeskaja), tom 2, Moskva 1954; Grammatika sovremennogo russkogo literaturnogo jazyka, red. N. Ju. Švedova, Moskva 1970.

[4] A. M. Gvozdev, Sovremennyj russkij literaturnyj jazyk, tom 2, Moskva 1961.

[5] L. Tesnière, Eléments de syntaxe structurale, Paris 1959 — srov. už předválečné práce téhož autora, zejm. Comment construire une syntaxe, Bull. de la Faculté des Lettres de Strasbourg, Strasbourg 1934. U Tesnièra je nejasné, zda jde o vztahy formální, či sémantické. O tom podrobný výklad F. Daneš-Z. Hlavsa-J. Kořenský, Práce o sémantické struktuře věty, Praha 1973, s. 14.

[6] J. Kuryłowicz, Les structures fondamentales de la langue: groupe et proposition, Studia philosophica 3, 1948, 203—209.

[7] K. E. Harper, D. G. Hays, The Use of Machines in the Construction of a Grammar and Computer Program for Structural Analysis, Proc. Int. Congr. Inf. Proc., UNESCO, Paris 1959; G. S. Cejtin, L. N. Zasorina, O vydelenii konfiguracij v russkom predloženii, Dokl. na konf. po obrabotke inf., mašinnomu perevodu i avtom. čteniju textov, VINITI, Moskva 1961; H. Gaifman, Dependency Systems and Phrase-Structure Systems, Information and Control 8, 1965, 304—337.

[8] S. Ja. Fitialov, Ob ekvivalentnosti grammatik NS i grammatik zavisimostej, ve sb. Problemy strukturnoj lingvistiki 1967, red. S. K. Šaumjan, Moskva 1968, 71—102.

[9] P. Sgall, Functional Sentence Perspective in a Generative Description, PSML 2, 1967a, 203—225; E. Benešová - E. Hajičová - P. Sgall, Remarks on Topic/Comment Articulation, The Prague Bulletin of Mathematical Linguistics 20, 1973, 3—42. Jde tu o generativní složku čistě závislostní, na rozdíl od dříve koncipovaného modelu (viz např. P. Sgall, Generativní popis jazyka a česká deklinace, Praha 1967b), ve kterém se věta dělí na část podmětovou, přísudkovou a ty pak na další složky, takže je zachycena struktura závislostní i složková, podobně jako ve Fitialovově orientované gramatice. Potřeby popisu aktuálního členění věty a nejasnost sémantické relevance větší či menší těsnosti ve vztahu závislého a řídícího členu vedly k tomu, že se od zachycování složkové struktury v pozdějších pracích upouští. (O konfrontaci těchto dvou koncepcí viz S. Machová, Tectogrammatical Level in the Generative Description of the Czech Language, v tisku pro PSML 5.)

[10] O vzájemném vztahu různě formulovaných ZG srov. A. Goralčíková, On One Type of Dependency Grammars, The Prague Bulletin of Mathematical Linguistics 21, 1974, 11—26; M. Plátek, Questions of Graphs and Automata in Generative Description of Language, tamtéž, s. 27—64.

[11] K pojmu projektivita viz P. Sgall, o. c. v pozn. 9, Y. Lecerf, Programmes des conflits, modèle des conflits, La traduction automatique 1, 1960, č. 4, 11—20, č. 5, 17—36; S. Marcus, Sur la notion de projectivité, Zeitschrift für mathem. Logik und Grundl. d. Mathem. 11, 1965, 181—192; L. Nebeský, Algebraic Properties of Trees, AUC, Philol. Monographia 25, Praha 1969.

[12] O vztahu mezi koncepcí závislostní a bezprostředně složkovou viz P. Novák, Některé otázky syntaktické analýzy (z hlediska strojového překladu), SaS 23, 1962, 9—20.

[13] J. J. Robinsonová, Dependency Structures and Transformational Rules, Language 46, 1970, 259—285.

Slovo a slovesnost, ročník 36 (1975), číslo 2, s. 143-147

Předchozí František Daneš: K novější kritické literatuře o generativně transformační sémantice

Následující Anna Jirsová: Kritický přehled prací o sémantické struktuře věty