Časopis Slovo a slovesnost
en cz

Generativní systémy v lingvistice

Petr Sgall

[Discussion]

(pdf)

Генеративные системы в лингвистике / Les systèmes génératifs dans la linguistique

1.1. Algebraická teorie gramatiky se dnes stává středem zájmu mnohých lingvistů i matematiků. Zatímco první ji někdy víceméně ztotožňují s transformační gramatikou, spatřují druzí v tomto bodě spíše slabé místo teorie N. Chomského a těžiště jeho přínosu vidí jinde. Domníváme se, že jádro této teorie je v samém přístupu, v tom, že jazykový systém se stává předmětem matematického popisu. Konkrétní podoba tohoto popisu a aparát, jakého se pro něj užívá, to už pak jsou otázky další, zčásti dosud nejasné.

Ještě před pokusem o zachycení jazykového systému matematickými prostředky je třeba neformálně tento objekt zkoumání natolik charakterizovat, aby bylo možno říci, co do popisovaného objektu zahrnujeme a co nikoli, jaké jsou běžné, „intuitivní“ představy o jeho struktuře ap. Postup zvolený Chomským je ten, že za základní objekt zkoumání se považuje množina gramaticky správných vět (tedy vět jako jednotek systému, nikoli výpovědí), označovaná termínem jazyk; proč se mluví o větách „gramaticky správných“, k tomu srov. odst. 3.1.

Úkolem vědeckého popisu jazyka pak je podat vymezení této množiny a zároveň přiřadit každé větě určitou strukturní charakteristiku. Oba tyto úkoly si ostatně lingvistika odedávna kladla, nebyly však jasně formulovány, ani nebyly vždy dostatečně odlišovány od některých jiných úkolů lingvistiky (srov. 1.2). Novum je právě v matematickém přístupu, spojeném s použitím postupů vypracovaných v matematice a logice pro popis systémů různého druhu. Vysoký stupeň abstrakce daný tímto přístupem umožňuje pak mj. využití hledisek moderní metodologie věd a srovnání lingvistických objektů s jinými (s logickými systémy ap.) na základě prostředků potřebných k jejich formálnímu popisu. Na druhé straně je tento přístup těsně spojen i s požadavky nových aplikací lingvistiky, souvisejících s možnostmi automatizace. Jednou z podmínek automatizace je právě explicitní formální popis, který nic nepřenechává povědomí a zkušenosti čtenáře nebo žáka.[1] Tyto požadavky dnes nelze splnit pro popis jazyka v celém rozsahu (zejm. ne pro sémantiku a stylistiku), jsou však aktuální při popisu mluvnické stavby a hláskosloví.

Pro vymezení množiny má matematika různé prostředky. Necháme-li stranou prostý výčet prvků množiny, jsou tu především dva typy procedur, kterými muže být množina vymezena: První z nich, procedura generativní, je soubor pravidel, která umožňují generovat, „vypočítat“ nebo „vyjmenovat“ (rus. perečislit’, angl. enumerate) všechny prvky množiny (příklady viz 2.2); druhá, procedura rekognoskativní, je soubor pravidel umožňující zjistit, je-li daný objekt prvkem množiny, nebo ne.[2]

[275]Generativní gramatika je určitý druh generativní procedury, totiž soustava pravidel, jejichž uplatnění vede a) ke generování kterékoli gramaticky správné věty, ale žádného jiného řetězu symbolů, a zároveň b) k přiřazení vhodného strukturního popisu této větě.[3] Podle těchto dvou cílů se rozlišuje a) generativní síla gramatiky (gramatiky „silnějšího“ typu mohou generativně vymezit i takové množiny vět, které nelze vymezit gramatikami slabšími, srov. 2.2) a b) explikativní síla (různé typy gramatik mohou v různé míře osvětlovat strukturní vlastnosti jazyků, srov. 2.3).

Teorie, která se generativními (a rekognoskativními) gramatikami zabývá, tedy algebraická teorie gramatiky, souvisí co do své stránky matematické těsně s matematickou teorií automatů i s teorií rekurzívních funkcí, teorií algoritmů a jinými disciplínami blízkými pomezí matematiky a logiky; naproti tomu její stránka lingvistická je převážně empirická a týká se zejména otázek adekvátnosti té či oné gramatiky pro popis daného jazyka.[4] Rozdíl mezi přístupem matematika a lingvisty tak zůstává zachován, ale vzniká obor společný jim oběma a umožňující vypracovat formální aparát pro popis struktury přirozených jazyků (východiskem tu jsou určité typy kombinatorických systémů),[5] který může být zcela exaktně konfrontován s jinými matematickými systémy, zejm. s automaty.[6]

 

1.2. Konkrétní lingvistická koncepce, kterou Chomsky formálně zpracovává, navazuje na deskriptivismus, ale v některých zásadních otázkách se od něho radikálně liší. Chomsky je žák Harrisův, východiskem teorie gramatiky mu byla koncepce bezprostředních složek, a také lingvistický podklad pro transformační složku gramatiky (která má v jeho pojetí gramatiky koncepci bezprostředních složek doplňovat)[7] získal od svého učitele. Na rozdíl od deskriptivismu se však nesnaží o vytvoření procedury, která by jen na základě dostatečně rozsáhlého souboru textů umožnila vypracovat popis jazyka, v němž jsou tyto texty formulovány. Chomsky vytyčuje (pro první etapu) cíl skromnější, zato reálnější: zabývat se hodnocením popisu jazykového systému, nikoli způsobem vzniku tohoto popisu.[8] Formálně popsat badatelský postup lingvisty, to je cílem teprve budoucího bádání.[9]

Třetí úkol, vzdálenější než popis jazykového systému, ale bližší než procedura sestavující tento popis, je model uživatele jazyka. Generativní gramatika má sice některé rysy podobné modelu mluvčího, a někdy proto bývá za jeho součást pokládána,[10] ve své dnešní podobě však se s ním překrývá jen zčásti. Vždyť mluvčí při formulaci výpovědi nepostupuje podle pravidel generativní gramatiky, nevybírá nejdříve gramatické konstrukce větné, pak postupně další syntak[276]tické konstrukce a nakonec jednotlivé morfémy. Podobně i vztah mezi rekognoskativní procedurou a činností posluchače má ovšem své problémy.

Zásadní význam tu má Chomského rozlišování znalostí uživatele jazyka od jeho schopností tak či onak svých znalostí užívat.[11] Nejde prostě o to, zjistit studiem textu, jakým systémem byl text generován, ale o složité vztahy mezi jazykovým systémem (znalostmi uživatelů), jeho fungováním v komunikačním procesu (které závisí jak na systému, tak na schopnostech uživatelů) a textem jako výsledkem činnosti mluvčího. Generativní gramatika přitom chce být a je popisem systému samého (patrně ne úplným). Tento systém tu však není zachycen jako inventář jednotek a jejich utřídění, nýbrž jako soustava pravidel, jako fungující systém se vstupem a výstupem, takže právě může být srovnán s matematickým automatem (abstraktně formulovaným).

 

1.3. První rozsáhlá práce N. Chomského o generativních gramatikách (Logical Structure of Linguistic Theory, 1955) zůstala nevydána (bývá citována z mikrofilmu). V knize Syntactic Structures[12] shrnul pak lingvistickou problematiku své teorie. Přesnější matematická formulace je obsažena v několika dalších studiích,[13] na které navazuje už poměrně bohatá matematická literatura, zejm. z okruhu Y. Bar-Hillela a z harvardské skupiny Oettingerovy.[14] Metodologické otázky byly prodiskutovány na dvou konferencích,[15] kde se právě ukázal široký zájem matematiků a logiků o otázky algebraické lingvistiky, i určitá omezení dosavadního přístupu (srov. 3.2.). Některé podněty přinesla pak sovětská konference o transformační metodě, orientovaná spíš lingvisticky; důležitý je tu Šaumjanův požadavek generativního systému o dvou stupních.[16]

Soustavný generativní popis některého jazyka nebyl dosud podán; nejrozsáhlejší jsou zatím Leesovy práce o angličtině a Bierwischovy o němčině, fonologickou složku zpracoval M. Halle pro ruštinu.[17] Ukazuje se, že původní schéma transformační gramatiky musí být doplněno, že půjde o celou řadu složek různě spolu spojených, z nichž některé se uplatňují cyklicky (tj. několikrát, v různých etapách generování jedné věty.[18]

 

[277]2.1. Pokusíme se nyní (bez matematických symbolů) stručně vystihnout hlavní rysy používaného matematického aparátu. Jedním z jeho předpokladů je vymezení souboru fonetických symbolů, kterými má být zapsána kterákoli generovaná věta po skončení procesu generování (zvaného „derivace“). První etapu derivace věty tvoří uplatnění pravidel syntaktických, kterými je (především postupným rozvíjením, tj. nahrazováním jednoho symbolu řetězem symbolů) generován řetěz morfémů;[19] ten je pak v druhé etapě pravidly fonologickými (morfonologickými) převeden na odpovídající řetěz zmíněných symbolů fonetických (hlásek, kombinací distinktivních rysů). Je však výhodné (srov. Halle, op. cit.), aby byl zápis lexikálních morfémů v závěru první etapy blízký zápisu fonologickému, kdežto gramatické morfémy (či spíše sémata, např. singulár, dativ) jsou v této fázi ještě označeny jen symboly morfologickými.

Syntaktická složka gramatiky, která rozhoduje o síle gramatiky a o jejím zařazení do určitého typu, pracuje se dvěma soubory symbolů: koncovými (terminálními) a pomocnými (nonterminálními). Koncové jsou ty, které se objevují v zápisu věty po skončení první etapy derivace, tedy symboly pro zápis morfémů (viz výš) a symboly hraniční (pro začátek a konec věty i pro různé typy švů a pauz). Ostatní symboly jsou pomocné; zvlášť jsou vyznačeny výchozí řetězy symbolů, kterými se derivace vět začíná. Pomocné symboly (a popř. i koncové symboly gramatických morfémů) jsou zde tím, čím jsou gramatické termíny v jiných mluvnických popisech. Jejich postavení zde však není dáno vztahem k tradičním pojmům, ale je matematicky vymezeno na základě relace „přepiš“, označované šipkou. Gramatika je pak soubor pravidel, z nichž každé označuje možnost přepsání jednoho řetězu řetězem jiným (přepisovací pravidla), popř. i pravidel složitějších, transformačních, jejichž uplatnění je omezeno nejen na určitý řetěz symbolů, ale i na způsob, jakým byl tento řetěz generován (na tzv. derivační historii řetězu).[20]

 

2.2. Gramatická pravidla mají různou podobu, tzn. vyhovují různým formálním podmínkám, omezením. Přesná formulace těchto omezení je právě nutná pro formalizaci gramatiky. Gramatiky se třídí do různých typů podle toho, jakým omezením vyhovují jejich pravidla. Některé hlavní typy tvoří tuto stupnici, kde formální omezení jsou postupně slabší a slabší, zatímco generativní síla gramatik se v souvislosti s tím zvyšuje:

a) Gramatiky s konečným počtem stavů:[21] každé pravidlo má na levé straně (před šipkou) jen jeden symbol, na pravé straně jen jeden symbol koncový, popř. spojený s jedním symbolem pomocným, přičemž ve všech pravidlech téže gramatiky musí být na pravé straně shodné pořadí: pomocný symbol je buď vždy vpravo, nebo vždy vlevo od koncového.

b) Frázové gramatiky nekontextové: na levé straně každého pravidla je jeden symbol, vpravo neprázdný řetěz symbolů.

c) Frázové gramatiky kontextové: obsahují nadto i pravidla zahrnující řetězy symbolů, které mají úlohu kontextu omezujícího možnost uplatnění pravidla, např. „ABNCD přepiš na ABMPCD“.

d) Gramatiky transformační: obsahují také pravidla, která nepodléhají těmto omezením a jejichž možnost uplatnění není vymezena jen řetězem symbolů, ale i dalšími podmínkami (týkajícími se strukturního popisu věty).

Derivace věty může být zachycena ve formě grafu určitého typu, tzv. stromu (což plně postačuje u gramatik prvních dvou typů); vrchol stromu je označen výchozím symbolem gramatiky, ostatní uzly symboly pomocnými, nebo koncovými. Mějme např. gramatiku s pravidly:[22]

[278]1. S

 

 

 

         2. N

 

 

 

         3. N

 

 

přijel N

nečekaný

milý

nový

další

   .

   .

   .

host

 

 

 

 

 

 

N

Pak můžeme postupným uplatněním pravidel 1., 2d, 2a, 3. generovat větu, jejíž derivace by byla zachycena stromem z obr. 1. Derivací je větě přiřazen strukturní popis, znázorněný zde stromem. (Ten může u některých gramatik odpovídat několika derivacím lišícím se jen nevýznamnými rozdíly v pořadí uplatnění pravidel.)

        S

       / \

přijel    N

           / \

     další    N

               / \

  nečekaný   N

                  |

                host

Obr. 1

 

Obsahuje-li gramatika jen pravidla téhož typu, jako jsou výše uvedená (1.—3.), jde o gramatiku s konečným počtem stavů. I taková gramatika může však generovat věty libovolně dlouhé; tak v našem příkladu by zřejmě bylo možné neustále znovu aplikovat pravidlo 2. Takové možnosti dosahuje gramatika tím, že obsahuje tzv. rekurzívní symboly, tj. pomocné symboly, které se po rozvití mohou v derivaci znovu objevit (a být tedy znovu rozvity), jako naše N.

Každý jazyk, který lze vymezit gramatikou typu a), lze vymezit i gramatikou typu b), existují však jazyky vymezitelné gramatikou typu b) a nikoli typu a). Podobný je i vztah mezi typem b) a c). Čím jsou dány tyto rozdíly v generativní síle, to můžeme stručně a neformálně shrnout takto: Frázová nekontextová gramatika může (na rozdíl od gramatiky s konečným počtem stavů) vymezovat také ty jazyky, k jejichž generativnímu vymezení jsou nutná pravidla s tzv. sebezapouštěním (selfembedding) rekurzívních symbolů; jde o pravidla jako např.:

          4. S N A P

          5. A že S

Uplatníme-li tato pravidla, dostaneme strom z obr. 2, kde je druhý výskyt symbolu S „zapuštěn“ mezi jiné symboly. Chápeme-li N jako symbol pro substantiva určitého typu v nominativu,[23] P jako symbol pro přísudek, je zřejmé, že nelze říci, kolikrát (nanejvýš) mohou být tato pravidla uplatněna při generování jedné věty (máme-li na mysli jen znalosti uživatele jazyka, ne fyziologická ap. omezení jeho schopností).[24]

     S

  /  |  \

N   A   P

   /   \

 že     S

Obr. 2

Kontextové frázové gramatiky mohou — na rozdíl od nekontextových — generovat i takové množiny řetězů symbolů, pro jejichž generativní vymezení je nutná změna pořadí symbolů v řetězu (srov. 2.3.).

Pravidla v gramatice jsou obvykle buď neuspořádána (zejm. frázová pravidla v syntaktické složce), takže při každém kroku derivace lze uplatnit kterékoli pravidlo (je-li ovšem jeho levá strana obsažena v řetězu získaném předcházejícími kroky), nebo jsou uspořádána tak, že po uplatnění pravidla n-tého zjišťujeme, zda vyhovuje pro daný řetěz pravidlo n + 1-ní atd. Tento [279]druhý postup, obvyklý zejm. ve složce fonologické[25] a transformační, vyžaduje rozlišení pravidel obligatorních a fakultativních.

Velmi důležité pro vývoj teoretické jazykovědy je, že se podařilo některé typy gramatik konfrontovat s typy automatů a dokázat, že jsou co do generativní síly ekvivalentní (mohou vymezovat tytéž jazyky, i když popř. připisují stejným větám různé struktury). N. Chomsky dokázal, že gramatiky s konečným počtem stavů jsou v tomto smyslu ekvivalentní s konečnými automaty,[26] dále byla dokázána ekvivalence nekontextových frázových gramatik s gramatikami závislostními, prediktivními, se zásobníkovými automaty aj.[27]

2.3. Přinejmenším stejně nutné jako studium generativní síly gramatik (a automatů) je i zkoumání jejich síly explikativní, které je však daleko obtížnější a je dosud v počátcích. Závažnost otázek explikativní síly se ukáže, jakmile chceme posoudit, které typy gramatik jsou vhodné pro popis přirozených jazyků. Je to zřejmé už ze stručného přehledu argumentů, které N. Chomsky a jeho spolupracovníci uvádějí na podporu svého názoru, že pro tento účel jsou vhodné gramatiky transformační, nikoli některý jiný (slabší) typ.

Nevhodnost gramatik s konečným počtem stavů se vyvozuje převážně z jejich nedostatečné generativní síly — totiž z toho, že nemohou zachytit neomezené sebezapouštění.[28] U ostatních typů gramatik se však argumenty týkají převážně explikativní síly (a popř. jednoduchosti gramatik), většinou nikoli síly generativní;[29] jinak řečeno, nevhodnost frázových gramatik pro přirozené jazyky se nevyvozuje z toho, že by tyto gramatiky nestačily k vymezení přirozeného jazyka, ale z toho, že by některým jeho větám přiřazovaly strukturní popis, který neodpovídá lingvistickým požadavkům. Ty jsou zatím formulovány dost nejasně — mluví se o shodě s povědomím uživatelů jazyka v takových bodech jako: a) členění věty na část podmětovou a přísudkovou ap. i tam, kde slovosled průhlednost tohoto členění porušuje, b) větě má být přiřazeno tolik strukturních popisů, kolik různých gramaticky správných interpretací má, c) věty, které jsou si svou stavbou podobné (jako věta oznamovací a tázací, aktivní a pasívní, podřadné souvětí a odpovídající věta s nominalizací) mají mít také strukturní popisy sobě blízké, d) gramatika nemá větám připisovat více strukturního členění, než kolik ho podle povědomí mají (souřadné řetězy nemají být členěny jako postupně rozvité aj.).

Frázové gramatiky nekontextové jsou odmítány proto, že neodpovídají plně požadavkům c) a d), a dále proto, že by musely být značně složité, tj. musely by obsahovat velmi mnoho pomocných symbolů a pravidel (např. by bylo třeba rozlišit tu nejen různé druhy slov a jejich syntakticky výrazně odlišné podskupiny, jako slovesa přechodná a nepřechodná, ale i skupiny charakterizované jen určitou syntaktickou zvláštností, např. jména osob a slovesa pojící se jen s nimi, jména zvířat atd.). Tato složitost by byla zčásti odstraněna použitím gramatiky kontextové (a podobně v rámci gramatiky transformační zařazením frázové složky kontextové, nikoli nekontextové), protože tam lze formulovat slovníková pravidla selekce (výběru lexikálních morfémů) jako pravidla kontextová, tzn. vybírat např. slovesa k podmětu označujícímu osobu na základě jiného pravidla než k podmětu označujícímu zvíře, věc, abstraktum, ale většina pravidel předcházejících nemusí na tyto rozdíly brát zřetel.

Tento argument ostatně není zcela obecně přijímán. Mnoho badatelů pracuje — nezávisle na sobě — s různými generativními a rekognoskativními gramatikami, které jsou ekvivalentní gramatikám nekontextovým, a považuje je za vyhovující.[30] Není zcela jasné, zda by bylo výhodné [280]užívat pro lexikální selekci pravidel kontextových, když tu v zásadě stačí nekontextová: získáváme tím sice na jednoduchosti, ale jen za tu cenu, že se spokojujeme s generativním systémem daleko obecnějším, který nám o formálních vlastnostech přirozených jazyků říká velmi málo, protože je schopen generovat množiny s velmi různými vlastnostmi.[31] A vlastní výhoda kontextových gramatik, pokud jde o generativní sílu — možnost změny pořadí symbolů — je pro popis přirozeného jazyka spíš nevýhodou. Můžeme tu sice např. větám jako John has money a Has John money? připsat strukturní popisy, které budou mít určitou část společnou, jak to vyžaduje hledisko c) uvedené výše, ale nemůžeme přitom dodržet hledisko a).[32]

Přijmeme-li uvedené argumenty, pak jako vhodné pro popis přirozených jazyků zůstávají jen gramatiky transformační, mající hlavně tu výhodu, že obsahují i pravidla, která nemění jen řetěz symbolů na jiný řetěz, ale mění celé strukturní popisy. Tím je pak dáno, že „v případě transformačního modelu nemusí symboly a struktury, … které se v průběhu generování věty přepisují a transformují, mít skutečný přímý vztah k žádné z jejích jednotlivých podčástí“ a že získáváme model méně atomistický než u systému frázového (Chomsky, LZLT 5n.).

 

3.1. Pokud jde o přehlednou charakteristiku transformačních gramatik, odkazujeme na článek B. Palka (SaS 24, 1963, 140—151). Je však třeba říci, že i transformační gramatika ve své dnešní podobě má, jak se postupně ukazuje, různé nevýhody. Z matematického hlediska je závažné, že se dosud nepodařilo formálně vymezit transformační gramatiky a přesně je co do generativní síly porovnat na jedné straně s kontextovými frázovými gramatikami, na druhé straně s universálním Turingovým strojem; pro obecnou charakteristiku formálních vlastností přirozených jazyků přinesly zatím práce o transformační gramatice poměrně málo zajímavých konkrétních výsledků;[33] také otázka obecné existence rekognoskativní procedury pro transformační gramatiky není ještě vyjasněna.[34]

Námitky uváděné proti stanovisku Chomského některými lingvisty (Hill, Ray, Dixon aj.) a soustřeďující se většinou kolem pojmu gramatické správnosti nemají ten význam, jaký jim jejich autoři připisují.[35] Jde tu o složité empirické otázky, týkající se hranice mezi těmi řetězy, které mají být považovány za věty odpovídající normě daného jazyka, a těmi, které se sice jako výpovědi mohou objevit v textu tohoto jazyka, mohou být také posluchačem přijaty a vhodně sémanticky interpretovány, ale které normě daného jazyka plně neodpovídají (může jít o odchylky aktualizační, nebo i o přeřeknutí aj.) a nemají tedy být jeho gramatikou generovány. Dále pak jde o nalezení metody, jak tuto hranici (jistě stupňovitou, s přechodným pásmem všelijak členitelným) zjišťovat a empiricky studovat. Všechny tyto otázky je však třeba klást i při zcela nematematické formulaci gramatik; důležitost matematického přístupu ukazuje právě i to, že nutně vede ke zjištění nejasnosti a aktuálnosti takových otázek.

 

3.2. Závažnější jsou podle našeho názoru některé námitky jiné. N. Chomsky považuje generativní gramatiku za teorii daného jazyka (na rozdíl od teorie gramatiky, která by pak byla metateorií, a od celkové lingvistické teorie) a uplatňuje pak na ni některá měřítka, která se v dnešní metodologii věd v této souvislosti často uvádějí (např. jednoduchost, adekvátnost danému účelu, stupeň formalizace). V této souvislosti také charakterizuje pomocné symboly generativní gramatiky (kromě symbolu výchozího) jako symboly nemající vlastní přímou interpretaci v popisovaném objektu. Jsou interpretovány jen prostřednictvím symbolů koncových, s nimiž jsou spojeny [281]pravidly dané gramatiky.[36] Proti tomu namítá H. Putman (ve sb. uv. v pozn. 10, s. 38), že teorie má být víc než jen počítací zařízení, jehož vnitřní struktura by byla přímé interpretaci nepřístupná. Ostatně argumenty týkající se explikativní síly gramatik (viz 2.3) ukazují podle našeho názoru samy, že na vnitřní strukturu generativní gramatiky se kladou určité požadavky, které při dosavadním přístupu nejsou plně ujasněny.

K jejich ujasnění přispívá stanovisko H. B. Curryho, jednoho z nejvýznačnějších odborníků v oblasti matematické logiky. Curry (v témž sborníku, s. 56n.) vytýká Chomskému, že jeho gramatika (ve své syntaktické složce) nerozlišuje vlastní syntaktickou strukturu jazyka od prostředků její reprezentace. S podobným požadavkem vystoupil i S. K. Šaumjan, který se pokusil vybudovat generativní systém rozlišující oba stupně (srov. pozn. 16). Z obou těchto příspěvku je zřejmé, že přirozené jazyky se mezi sebou liší značně víc v rovině syntaktických prostředků než v rovině vlastní syntaktické stavby.

Je tedy možno říci, že uplatnění tohoto hlediska souvisí s jiným nedostatkem dosavadních generativních gramatik, totiž s tím, že se vždy zaměřovaly na popis jednoho jazyka a že tu zůstávaly stranou zřetele obecně lingvistické. Stejně jako byly dříve nejasné otázky, zda lze v angličtině mluvit o pádech, v čínštině o slovních druzích atd. atd. (pro nejasné vymezení těchto mluvnických pojmů), zůstává i nyní nejasný vztah mezi symboly jako NP a VP v generativní mluvnici angličtiny a mezi podobnými symboly v gramatice němčiny atd., ačkoli sám matematický přístup dává určité předpoklady k řešení těchto otázek.

Uvedené hledisko je však, jak jsme přesvědčeni, v těsném vztahu i k další dosud otevřené otázce, totiž ke vztahu mezi gramatikou a sémantikou. Přes určité retardační vlivy některých deskriptivistických hledisek se postupně ukázalo, že generativní gramatika není úplným popisem jazykového systému a že musí být doplněna o popis sémantiky.[37] Jednou z nejaktuálnějších otázek algebraické lingvistiky nyní je právě toto spojení popisu gramatického a sémantického. Dosavadní práce směřující k tomuto spojení chápou však sémantiku v podstatě jen jako lexikální (popř. morfologickou), kdežto zpracování syntaxe ponechávají víceméně bez sémantického zřetele.[38] Zůstává tu tedy určitá mezera, protože chybí zpracování vztahů, které jsme zvyklí — na základě prací Mathesiových, Havránkových a jejich žáků — nazývat významovou stavbou věty.

 

3.3. Zdá se, že tuto mezeru by bylo možno překlenout a tak celý generativní systém pevněji skloubit, nebudou-li se gramatika a sémantika chápat jako dvě různé složky generativního systému, nýbrž spojí-li se těsněji. Jistě stojí za bližší prozkoumání otázka, zda je možné vybudovat generativní systém, který by měl jako první složku pravidla pro popis významové stavby s rekurzívními vlastnostmi (a včetně selekce lexikálních a morfologických významů) a jako další složky pak pravidla, která by jednotky významové stavby převáděla postupně na jednotky stavby formálně syntaktické, morfologické, morfonologické, popř. fonologické a konečně fonetické. Takový systém by mohl být ve shodě s uvedeným požadavkem Curryho a mohl by se stát nejen aparátem pro popis jednoho jazyka, ale i východiskem studia obecně lingvistického — právě proto, že ve významové stavbě se různé jazyky shodují ve větší míře než v rovinách nižších, i když se ovšem ani zde neshodují úplně. Bylo by také třeba zjistit, zda takový systém bude [282]zachovávat určité výhody transformačních gramatik (viz výše v závěru odst. 2.3), protože i zde bude při derivaci věty postupně měněn celý strukturní popis, nikoli jen řetěz symbolů. Další otázka je, postačí-li po formální stránce pro tento účel systém jednodušší, slabší než transformační gramatika.[39]

Dobrým podkladem pro takový přístup ke generativnímu popisu jazyka může být právě funkční hledisko pražské školy. Také jiný aktuální úkol algebraické lingvistiky — přechod od věty jako jednotky k jednotkám vyšším — může být řešen s navázáním na některé závažné práce pražské školy (práce Mathesiovy a jeho pokračovatelů o aktuálním členění, některé novější stati Skaličkovy aj.). Má tedy naše matematická lingvistika i v této oblasti na co navazovat, a bude-li umět využít své výhodné situace, může přispět k řešení aktuálních otázek lingvistické teorie.


[1] I když konstruování generativních gramatik není nějaký „výhonek pokusů užít elektronkových počítačů“, jak upozorňuje N. Chomsky ve svém referátu na IX. mezinárodním sjezdu lingvistů v Cambridge, Mass. (citujeme zde podle překladového výtahu rozmnoženého Jazykovědným sdružením pod názvem Logický základ lingvistické teorie, 1963, s. 8; dále jen LZLT), přesto je třeba vidět, že příprava strojového překladu byla jedním z rozhodujících impulsů pro vytvoření algebraické teorie gramatiky, jak to ukazuje vývoj většiny pracovišť. Na tom nic nemění ani to, že automatizace překladu v dohledné době zřejmě nebude úplná, jak nyní po Bar-Hillelovi přiznává i A. G. Oettinger (ve sb. Beiträge zur Sprachkunde und Informationsverarbeitung 2, 1963, 17—32; srov. referát E. Hajičové, který vyjde v SaS).

[2] Výklad těchto otázek podává R. B. Lees, O vozmožnostjach proverki lingvističeskich položenij, VJaz 11, 1962, č. 4, s. 47—55; problematiku rekognoskativních gramatik, kterou zde probírat nemůžeme, zpracovali zejm. Y. Bar-Hillel a J. Lambek, vycházejíce z podnětů K. Ajdukiewicze (viz K. Berka, Logik o jazyce, SaS 23, 1962, s. 273—276 a literaturu tam uvedenou).

[3] O kritériích této vhodnosti, zatím ne plně ujasněných, viz dále v odst. 2.3. — Je ovšem možné zpracovávat matematickými metodami otázky strukturního popisu vět samy o sobě, bez cíle z odst. a). Tak postupuje Y. Bar-Hillel, On syntactical categories, Journal of Symbolic Logic 15, 1950, s. 1—16 a nověji někteří badatelé sovětští (jejichž výsledky shrnuje I. I. Revzin ve své knize Modeli jazyka, Moskva 1962 — srov. i její recenzi od K. Berky a P. Nováka v SaS 24, s. 133—140), stejně jako rumunský matematik S. Marcus (viz jeho knihu Lingvistică matematică. Modele matematice in lingvistică, Bukurešť 1963, o ní zde s. 319n.).

[4] Viz Y. Bar-Hillel, Four Lectures on Algebraic Linguistics and Machine Translation, Jerusalem 1962.

[5] Viz M. Davis, Computability and Unsolvability, New York l958, zejm. kap. 6.

[6] Automat se tu chápe jako matematická abstrakce, bez přímého vztahu k druhům samočinných počítačů, k jejich fyzikálním a technickým vlastnostem, jen jako předmět matematické teorie.

[7] Viz B. Palek, Informace o transformační gramatice, SaS 24, 1963, 140—151.

[8] Viz N. Chomsky, Syntactic Structures, ’s-Gravenhage 1957, kap. 6; odtud pak vyplývá i např. změna kritérií pro stanovení fonologických jednotek a zčásti jejich nahrazení jednotkami morfonologickými (viz N. Chomsky, LZLT 37—77 a M Halle, The Sound Pattern of Russian, ’s-Gravenhage 1959, s. 19—24).

[9] Viz zejm. N. Chomsky, Explanatory Models in Linguistics, Proc. of Intern. Congr. for Logic, Methodology and Philosophy of Science, Stanford Univ. 1960, vyd. 1962.

[10] Např. L. Doležel, Východiska teorie uměleckého stylu, Česká literatura 12, 1964, s. 2—3; srov. však výklad N. Chomského v stati On the Notion „Rule of Grammar“, sb. Structure of Language and Its Mathematical Aspects, Proc. of Symposia in Applied Mathematics 12, 1961, s. 6—24.

[11] K tomuto rozlišení „znalost — schopnost“ (competence performance) viz zejm. Chomského práci cit. v pozn. 9, dále též LZLT 3.

[12] Syntactic Structures, 1957 (3. vyd. 1963), ruský překlad ve sb. Novoje v lingvistike 2, Moskva 1962 (český se připravuje); zčásti dospěl k podobnému pojetí už F. W. Harwood, Axiomatic Syntax, Language 31, 1955, 409—415.

[13] N. Chomsky, On Certain Formal Properties of Grammars, Information and Control 2, 1959, 137—167 (rus. překl. viz Kibernetičeskij sbornik 5, 1962, 279—311); dále viz jeho stať uvedenou v pozn. 10; širší shrnutí těchto otázek podává nyní N. Chomsky (zčásti spolu s G. A. Millerem) ve třech kapitolách obsažených v knize Handbook of Mathematical Psychology II (vyd. D. Luce, E. Bush, F. Galanter), New York 1963.

[14] Viz zejm. Y. Bar-Hillel, M. Perles, E. Shamir, On Formal Properties of Simple Phrase Structure Grammars, Jerusalem 1960 (Applied Logic Branch of the Hebrew Univ., Techn. Rep. 4); H. Gaifman, Dependency Systems and Phrase Structure Systems, Rand Corporation P 2315, 1961. — R. J. Evey, The Theory and Application of Pushdown Store Machines, Comput. Lab. of Harvard Univ., Rep. NSF-10, Cambridge, Mass., 1963; Sheila Greibach, Inverses of Phrase Structure Generators, tamtéž, Rep. NSF-11, 1963.

[15] Jde o symposium Americké matematické společnosti zachycené ve sb. uved. zde v pozn. 10 (viz rec. P. Nováka v SaS 25, 1964, s. 139n.) a o metodologický kongres známý ze sb. uved. v pozn. 9.

[16] Viz Tezisy dokladov na konf. po strukt. lingv., posvjaščennoj problemam transformacionnogo metoda, Moskva 1961. — Viz nyní S. K. Šaumjan - P. A. Soboleva, Applikativnaja model’ i isčislenije transformacij v russkom jazyke, Moskva 1963; Šaumjanův pokus o vybudování takového systému však nelze považovat za zdařilý (viz P. Novák, Mathematical Models of Linguistic Objects ve sb. Prague Studies in Mathematical Linguistics, v tisku).

[17] Viz zejm. R. B. Lees, A Grammar of English Nominalizations, Baltimore 1960; R. B. Lees, E. S. Klima, Rules for English Pronominalization, Language 39, 1963, s. 17—28; M. Bierwisch, Ein Modell für die syntaktische Struktur deutscher Nominalgruppen, Zeitschr. f. Phonetik, Sprachw. und Kommunik. 14, 1962, s. 244—278; týž Grammatik des deutschen Verbs, Studia Grammatica 2, Berlin 1963; W. Motsch, Syntax des deutschen Adjektivs, Studia grammatica 3, Berlin 1964; monografii M. Halleho jsme uvedli v pozn. 8.

[18] O postavení různých složek transformační gramatiky viz Ch. J. Fillmore, The Position of Embedding Transformations in a Grammar, Word 19, 1963, 208—231; o cyklech ve fonologické složce např. M. Halle, O pravilach russkogo sprjaženija, ’s-Gravenhage 1963 (referát pro V. mezinár. sjezd slavistů).

[19] Srov. M. Bierwisch, Über den theoretischen Status des Morphems, Studia Gramatica I, 1962, s. 51—89.

[20] Tento stručný informativní přehled má usnadnit první orientaci v pracích matematicky formulovaných, naprosto si ovšem neklade za cíl je nahradit.

[21] Název naznačuje, že jde o gramatiky odpovídající z matematického hlediska konečným automatům, tedy zařízením, která mohou nabývat jen konečného počtu vnitřních stavů.

[22] Jde ovšem (zde i v dalším) jen o dílčí příklady; výchozím symbolem je S; svorky označují možnost výběru (jde o zkrácený zápis několika pravidel); každé české slovo na pravé straně pravidla je třeba chápat vždy jako jediný koncový symbol; necháváme stranou symboly hraniční. — K pojmu stromu srov. J. Sedláček, Kombinatorika v teorii a praxi. Úvod do teorie grafů, Praha 1964, s. 46.

[23] Může jít např. o substantiva zařazená u Vl. Šmilauera, Novočeská skladba, Praha 1947, do odst. 563 (poznání, upozornění …).

[24] Srov. např. diskusi mezi N. Chomským a V. H. Yngvem ve sb. uved. v pozn. 10.

[25] V. M. Halle, On the Role of Simplicity in Linguistic Descriptions, týž sb. s. 89—94.

[26] Viz jeho On Certain Formal Properties

[27] Srov. výše uv. práce H. Gaifmana, R. Eveyho a S. Greibachové; k prediktivním gramatikám srov. referát J. Panevové a L. Uhlířové v tomto ročníku SaS, s. 144—148.

[28] Viz Syntactic Structures a On Certain Formal Properties …; ani zde však nejde jen o generativní sílu (vždyť otázka neomezenosti sebezapouštění není po stránce lingvistické zcela vyjasněna); některé jiné argumenty Chomského, obsažené v dalších statích, tu necháváme stranou, neboť jsou, jak se zdá, sporné z hlediska matematického.

[29] Viz dále: jde o argumenty známé z výše uv. prací N. Chomského a R. B. Leese; srov. však i P. Postal, Constituent Structure, ’s-Gravenhage a Bloomington 1964, s. 75n., kde jde i o některé jevy týkající se otázek generativní síly (zejm. v jazyce mohawk).

[30] Srov. o tom Y. Bar-Hillel, Four Lectures … a Oettingerova slova ze stati uv. zde v pozn. 1: „máme nyní dostatečné důvody k tomu, abychom považovali zásobníkový převodník (pushdown store transducer) za „přirozené“ zařízení a ne jen za postup výhodný z hlediska programování“ (s. 23).

[31] Srov. výše uv. práci R. Eveyho.

[32] Srov. R. B. Lees, O pereformulirovanii transformacionnych grammatik, VJaz 1961, č. 6, s. 45n.

[33] Jde totiž o systém velmi obecný (srov. výše o podobné nevýhodě frázových kontextových gramatik; viz N. Chomsky, On the Notion …, pozn. 27 o závažnosti této nevýhody; teprve dokončení formalizace transformačních gramatik by ji plně vyloučilo).

[34] Srov. stať H. Putnama ve sborníku uv. v pozn. 10.

[35] A. A. Hill, Gramaticality, Word 17, 1961, s. 1—10 (viz odpověď N. Chomského, tamtéž, 219—239, přeloženou ve VJaz 1962, č. 4); P. S. Ray, The Logic of Linguistics, Methodos XIII, 51—52, 1961, s. 239—254; R. M. W. Dixon, Linguistic Science and Logic, ’s-Gravenhage 1963.

[36] Názorněji, i když méně přesně, lze toto stanovisko formulovat asi tak: V gramatikách Chomského je S symbolem odpovídajícím empirickému pojmu (gramaticky správné) věty; ostatní pomocné symboly, jako NP, Verb atd. (a podobně tradiční mluvnické pojmy v neformalizovaných gramatikách), nemají přímou interpretaci ve větách jazyka a mohou být s jednotlivými podčástmi těchto vět spojovány jen prostřednictvím koncových symbolů. Nelze tedy definovat např. pojem „jmenná fráze“ (symbol NP) jinak než právě generativním systémem. Pomocné symboly tohoto typu jsou tu považovány za „konstrukty“ v terminologii známé např. z prací Šaumjanových.

[37] Viz N. Chomsky, LZLT, s. 6 a § 2.3.

[38] Tak zejm. J. J. Katz, J. A. Fodor, The Structure of Semantic Theory, Language 39, 1963, 170—210. — Pozn. korekt.: Z referátů N. Chomského a J. J. Katze zaslaných symposiu „o znaku a systému v jazyce“ (Magdeburk, září 1964) vyplývá, že v poslední době byla podoba transformačního generativního systému značně změněna právě s ohledem na nutnost tohoto těsnějšího spojení gramatiky a sémantiky.

[39] Podrobněji viz P. Sgall, Zur Frage der Ebenen im Sprachsystem, Travaux linguistiques de Prague 1, 1964, s. 95n.

Slovo a slovesnost, volume 25 (1964), number 4, pp. 274-282

Previous Jaroslav Zima, Zdeňka Sochová: Diskuse o pravopise. Slovesa s předponami s(e)- a z(e)- v slovníku a v pravopise

Next Kolektiv oddělení matematické a aplikované lingvistiky v ÚJČ ČSAV: Sovětský sborník strukturní lingvistiky