Časopis Slovo a slovesnost
en cz

Kritéria gramatičnosti (Korpus jako argument a inspirace)

František Štícha

[Articles]

(pdf)

Criteria of grammaticality (Corpus as an argument and challenge)

Je nepochybné, že rychle rostoucí a zkvalitňující se korpusy, k nimž patří i Český národní korpus, předznamenávají novou éru v dějinách lingvistiky. Jakkoli nelze předpokládat, že v dohledné době ani ryzí teoretická lingvistika se bez korpusu neobejde (není ostatně ani nutné ani žádoucí to proklamovat), lze zajisté tvrdit, že lingvistiku „deskriptivní“ či „popisnou“, jíž jde – zjednodušeně řečeno – o pravidla a/nebo pravidelnosti výskytu potenciálních entit jazykového systému v reálném diskursu (v textech, promluvách, v „parole“), si nelze v budoucnu – dříve či později – představit jinak než jako lingvistiku „korpusovou“; minimálně v tom smyslu, že všechna její tvrzení o „existenci“, stylové hodnotě, frekvenci, textové distribuci či (míře) gramatičnosti uvažovaného výrazu budou vždy podložena korpusovými nálezy. Název „korpusová lingvistika“ pak eo ipso ztratí smysl a přestane být užíván.

V tomto článku chceme hovořit o „gramatičnosti“ a jejích kritériích speciálně s ohledem na možnosti, které ve zcela netušené míře a kvalitě takřka rázem vyvstaly zejména před empirickým syntaktikem se vznikem korpusu zpracovaného tím způsobem, že zadáním určité konfigurace kategoriálních proměnných v něm lze hledat syntaktické struktury (včetně struktur slovosledných) a zjišťovat či ověřovat jejich languově-parolový status (tj. status jazykového prostředku z hlediska míry jeho ustálenosti, interiorizace a konvencionalizace – srov. např. Nebeská, 1996 – prostřednictvím jeho frekvence a textové distribuce). Chceme-li hovořit o „gramatičnosti“, bude však vhodné nejprve upozornit na to, čemu říkáme „gramatika“, neboť – jakkoli jde o termíny pojmově souvztažné – tohoto termínu se neužívá (jak je ostatně v lingvistice běžné) jednotně. Protože se tu samozřejmě nemůžeme pouštět do širokých souvislostí, které označení ‚gramatika‘ s sebou nese, lze říci, že ‚gramatikou‘ principiálně rozumíme to, co V. Mathesius, jak známo, nazýval „prostředky usouvztažňovacími“, které spolu s „prostředky pojmenovacími“ tvoří jazyk, jazykový systém, langue. Jakkoli se názvem ‚gramatika‘ leckdy (implicite) rozumí pouze ‚morfologie‘ (nemluvě o tom, že laik často gramatikou rozumí i pravopis, který principiálně je – a to jen zčásti – důsledkem morfologie nebo syntaxe), nevidíme důvodu pro to, abychom z komplexu a systému jazykových ‚prostředků usouvztažňovacích‘ vyčleňovali syntax, ani pro to, abychom z těchto prostředků vyčleňovali pravidelné usouvztažňovací prostředky slovosledné čili slovosled. Usouvztažňovacími prostředky jsou nepochybně i prostředky slovotvorné, a tedy i ty lze pojmout pod termín gramatika. ‚Gramatičností‘ jazykového prostředku v nejobecnějším vymezení rozumíme jeho zapojenost do gramatiky, tj. do systému gramatických prostředků daného jazyka, jeho integritu v rámci gramatiky, tj. jeho gramatickou systémovost. S pojmem ‚gramatičnosti‘ bezprostředně souvisí pojem ‚noremnosti‘ (srov. Nebeská, 1996). Na rozdíl od tradičního pojetí (Nebeská, 1996) termín ‚norma‘ budeme vztahovat nikoli na jazykový prostředek či soustavu jazykových prostředků, jak se někdy i dnes děje, nýbrž na proces komunikativního [162]aktu: závaznost výběru jazykové formy vzhledem k obsahu jazykové jednotky a k sociální funkci komunikátu; v případě norem syntaktických, jimiž se budeme speciálně zabývat, půjde konkrétněji o závaznost výběru syntaktické konstrukce vzhledem k obsahu věty (výpovědi) a k sociální funkci komunikátu, do něhož je zapojena.

Gramatický výzkum spočívající v korpusových šetřeních a teoretickém vyhodnocování získaných výsledků umožňuje nejen (s tím či oním záměrem) hledat a nalézat odpovídající množství dokladů více či méně obecných syntaktických struktur (včetně struktur slovosledných) s velmi rozdílnou frekvencí výskytu, ale také zjišťovat jak podmínky a pravidla distribuce těchto struktur, tak eo ipso též podmínky a pravidla jejich komunikativního použití. Korpusové nálezy jsou proto pro empirického gramatika velkou výzvou klást nové otázky také v souvislosti s pojmy ‚akceptabilita‘ a ‚gramatičnost‘ syntaktických struktur. V souvislosti s těmito nálezy, neselektivními a objektivními, a tedy dostatečně reprezentativními pro vyvození obecně aplikovatelných pravidel, nutně vyvstává potřeba pojmy ‚akceptabilita‘ a ‚gramatičnost‘ nově, resp. precizněji profilovat. Spíše než o komplikovanost teoretických souvislostí a pojmových vazeb při vymezování a definici těchto pojmů půjde tu však o možnost dohody gramatiků o tom, zda daný korpus národního jazyka (čítající několik set miliónů slovních forem relativně úplného spektra žánrů a stylů) lze akceptovat jako textový zdroj relativně úplné soustavy komunikativně relevantních syntaktických struktur jazykového systému daného jazyka.[1] Budeme-li tento korpus akceptovat jako zdroj aproximativně úplné soustavy řečově realizovaných a interiorizovaných entit, tj. aproximativně úplný „langue“, pak nám to nejen značně usnadní – jak se pokusím ukázat v tomto příspěvku – rozhodovací úsilí při hodnocení jazykových jevů z hlediska jejich gramatičnosti, ale zároveň tak získáme jednoduchý, nicméně patrně jediný možný objektivní argument.[2] Hledání objektivních argumentů ovšem nemusí znamenat, že přehlížíme ten fakt, že i naše subjektivní hodnocení jazykových jevů mají svou nezastupitelnou hodnotu. Koneckonců nám často při korpusových šetřeních půjde o to, abychom potvrdili, nebo vyvrátili svá subjektivní hodnocení.

Problematika pojmů ‚akceptabilita/přijatelnost‘ a ‚gramatičnost‘ (a z nich derivovaných atributivních pojmů ‚přijatelný‘ a ‚gramatický‘) pramení ovšem už ve známém obecném paradoxu mezi samozřejmostí spontánní praktické aplikace těchto pojmů při hodnocení gramatických jevů a nesamozřejmostí jejich teoretického odůvodnění, které bývá aplikováno ad hoc a nezřídka vychází z nekonzistentních zdrojů (srov. Štícha, [163]2000). Nicméně lze říci, že (z hlediska lingvisty) ‚přijatelný‘ je v tradičním smyslu přirozeně a samozřejmě ten jazykový prostředek, který lze v komunikaci daným jazykem bezvýhradně použít (tj. lingvista sám nemá žádné výhrady ani nepočítá s žádnými výhradami vůči němu ze strany ostatních uživatelů daného jazyka), zatímco ‚nepřijatelný‘ je ten výraz,[3] který – podle mínění lingvisty – v komunikaci daným jazykem použít nelze, anebo ho lze použít jen za (velmi) speciálních komunikativních okolností. Např. věta Dneska večer se budu dívat na televizi může být hodnocena jako přijatelná, neboť proti jejímu komunikativnímu použití nelze najít rozumné důvody; v tomto smyslu jde o větu bezvýhradně použitelnou. Naproti tomu teoreticky v úvahu braná potenciálně konkurenční struktura s prézentem namísto futura *Dneska večer se dívám na televizi může být hodnocena jako nepřijatelná, pokud by měla vyjadřovat tutéž neutrální informaci o plánované budoucí činnosti, jakou vyjadřuje věta s futurem. Jakkoli dosavadní lingvistické výzkumy a veškerá zkušenost s užíváním jazyka ukazují, že subjektivní hodnocení jazykového výrazu z hlediska vhodnosti jeho komunikativního použití má obecně spíše graduální než polární (a tedy nikoli „bezvýhradnostní“) povahu, analýza korpusových nálezů ukazuje, že může být teoreticky adekvátní a žádoucí vedle jevů graduálních postulovat i relace polární. Mohli bychom postupovat tak, že termín-pojem ‚akceptabilita/přijatelnost‘ bychom vztahovali na reálné jevy languově-parolové a jejich graduálnost či „škálovitost“ (a hovořili bychom pak o tom, že nějaká struktura je více přijatelná než jiná), zatímco termín-pojem ‚gramatičnost‘ bychom vyhradili pro potenciální jevy primárně languové, systémové a jejich polaritu (uvažovaná struktura je buď gramatická, nebo negramatická). Potencialitu bychom mohli vidět a vzhledem ke korpusu definovat jako polární konstrukt: nulová potencialita jazykové struktury bude znamenat nulovou realizovanost v korpusu; takovou potenciální strukturu označíme za negramatickou. Pozitivní potencialita jazykové struktury bude naopak znamenat její doloženost v korpusu; sama doloženost struktury v korpusu ovšem ještě nemusí znamenat její gramatičnost (viz níže).

Nyní si ještě položme otázku, co nás vede k tomu, abychom rozlišovali struktury gramatické od negramatických, či – jinak viděno – abychom zjišťovali nejen to, co v jazyce (zastupovaném korpusem ve výše definovaném smyslu) je, ale také, co v něm není. G. Francisová (2000) např. konfrontací vlastního výzkumného projektu s dosavadními „tradičními“ gramatikami (např. Quirk – Svartvik, 1966) implikuje negativní postoj vůči tomu, co nazývá kontrastivní gramatikou, když mj. říká: „naším cílem je sestavit pokud možno nekontrastivní gramatiku, která ukazuje, jak je každá jednotka nebo struktura užívána sama o sobě a nikoli v porovnání se členy téhož nebo kontrastujícího paradigmatu“ (s. 346). Toto stanovisko má nepochybně své zdroje a své oprávnění. Nicméně ukazovat, jaké struktury v určitém jazyce existují a jak jsou užívány samy o sobě, může i gramatika principiálně kontrastivní – pokud nemá dobré důvody vidět a ukazovat daný jev kontrastivně. Na rozdíl od Francisové se domníváme,[4] že kontrastivní vidění jazykových struktur je (resp. mělo by být) jedním [164]ze základních heuristických principů lingvistiky. Vždyť patrně téměř nic z toho, co v jazyce existuje, není takové povahy, aby to nemohlo být jinak, a je jen věcí historické náhody (jakkoli tato náhoda má své příčiny), že v daném jazyce v dané době se nějaký obsah vyjadřuje určitým jazykovým způsobem, a ne způsobem jiným. Právě proto stojí vždy za to zjišťovat a ukazovat, zda určitý obsah, který má být komunikován, lze či nelze vyjádřit různými jazykovými způsoby. Je – kromě aspektů obecně poznávacích – i nejméně jeden ryze praktický důvod pro to, abychom zjišťovali, co v nějakém jazyce je i není možné: možnost poskytnout informaci o tom zejména tomu, kdo tento jazyk studuje jako cizí jazyk.

Studium akceptability a gramatičnosti syntaktických struktur prostřednictvím korpusových rešerší, analýzy nálezů a z ní vyvozených teoretických závěrů nás v souladu s postulovanými premisami nově vede k několika obecným heuristickým stanoviskům:

(a) Syntaktickou strukturu je třeba pojímat velmi obecně jako konfiguraci dvou nebo více elementů – (kategorií) lexémů a/nebo slovních forem –, z nichž alespoň jeden je kategoriální proměnná; v případě slovesných predikátů s nulovou valencí je ovšem třeba jako syntaktickou strukturu uvažovat i jedinou lexikálně proměnnou (Prší; Sněží apod.). Jaké druhy syntaktických struktur lze pro daný jazyk postulovat, musí být předmětem soustavného výzkumu.

(b) Existence syntaktické struktury v rámci daného jazyka (nikoli konkrétně lexikálně obsazené věty) znamená její relativně nejen frekvenčně, ale i kvalitativně významný výskyt v textech reprezentativního korpusu; v závislosti na speciálních okolnostech, které bude třeba teprve cílevědomě a soustavně zkoumat, může frekvenčně významný výskyt syntaktické struktury znamenat i jen několik málo dokladů; v takovém případě půjde o struktury z periférie gramatického systému a lze předpokládat, že velmi nízká frekvence doloženosti bude odpovídat lingvistově povědomí o její vzácnosti.

(c) Je třeba rozlišovat ryze formální lineární struktury[5] slovosledné, nelineární struktury formálněsyntaktické (syntaktické vzorce) a struktury syntakticko-sémantické (komplexní vzorce), dané jak formální konfigurací kategoriálních proměnných, tak sémantickou konfigurací hodnot významových (srov. Daneš – Hlavsa a kol., 1987).

(d) U formálních struktur slovosledných bude relevantní vždy počítat s jejich potenciální konkurenčností, vzhledem ke dvěma okolnostem: (a) Vazba strukturních elementů daná pouze lineárním uspořádáním lexikálních proměnných nemá povahu ‚syntaktické jednotky‘, a jeví se proto i jako principiálně „narušitelnější“ (i když nor[165]my jejího respektování bývají velmi silné) než vazba, která je konfigurací určitého počtu různých kategoriálních proměnných, a tedy syntaktickou jednotkou. (b) Je dostatečně známo, že v mnoha případech ten slovosled, který se v jednom jazyce jeví jako naprosto přirozený, je v jiném jazyce naprosto nepřijatelný. Heuristický předpoklad potenciality jevů slovosledných nás povede k zjišťování slovosledných norem a jejich různé síly. Nulový nebo silně menšinový a výjimečný výskyt potenciálně konkurenční struktury (např. 2 doklady na 10 000) lze pokládat za ukazatel negramatičnosti této struktury.

(e) Je třeba teoreticky rozlišit ty nelineární struktury, o nichž již víme nebo předpokládáme, že jejich sémantický obsah je vyjadřován i strukturou nebo strukturami konkurenční(mi), od struktur, u nichž žádnou formální konkurenci nepředpokládáme; u (teoreticky) bezkonkurenčních nelineárních (neslovosledných) formálněsyntaktických struktur bude pro jejich systémový status, a tedy gramatičnost rozhodující pouze absolutní frekvence výskytu a distribuce v textech: relevantní výskyt bude znamenat gramatičnost, nulový výskyt negramatičnost[6] uvažované struktury.

(f) U (potenciálně) konkurenčních struktur formálněsyntaktických bude v řadě případů pro jejich gramatičnost rozhodující poměrná frekvence výskytu a distribuce v textech (např. poměr 15 000 výskytů struktury ‚a‘ : 1 výskyt konkurenční struktury ‚b‘ bude obvykle znamenat negramatičnost struktury ‚b‘).

(g) V komplikovanějších případech (potenciálně) konkurenčních struktur formálněsyntaktických, u nichž lze zjistit jisté formální závislostní vztahy, a v případě struktur syntakticko-sémantických bude třeba při hodnotící analýze nálezů, zejména při nepříliš výrazném frekvenčním poměru konkurenčních struktur, uplatňovat známou triádu (Daneš, 1979) ‚norma‘ (dokumentovaná počtem a kvalitou dokladů) – funkčnost (nepřímo signalizovaná kvalitou dokladů a jejich textovou distribucí) – systémovost (vyvozená jako lingvistický konstrukt z noremních syntagmaticko-paradigmatických vazeb jazykových elementů).

(h) Nulová doloženost jevu nemusí automaticky vždy znamenat jeho negramatičnost, stejně jako řada dokladů nemusí vždy automaticky znamenat gramatičnost.[7]

[166](i) Rozsah poměrné frekvence (např. 150 : 20, 1500 : 2, 15 000 : 0) u konkurenčních formálních struktur téhož obsahu, přičemž v žádné z nich nejde o porušení nějaké strukturní závislosti, lze vidět jako demonstraci různé síly či pevnosti spontánně respektovaných norem při výběru jazykových prostředků. Informace o pevnosti normy, kterou lze zjistit vyhodnocením korpusových nálezů, může mít značný praktický význam nejen pro výuku cizích jazyků, ale např. i pro ty kreativní jazykové tvůrce, kteří se – ať vědomě, či nevědomě – podrobují řádu ovládajícímu naši existenci, tedy i řádu jazykovému.

Vše nasvědčuje tomu, že před existencí dnešní podoby korpusů mnohdy jediným kritériem ‚nepřijatelnosti‘ či ‚negramatičnosti‘ jazykového výrazu bylo a mohlo být (v případech málo frekventovaných struktur) mínění lingvisty či mínění té či oné skupiny uživatelů daného jazyka. Mohl-li např. gramatik v předkorpusové éře tvrdit, že věta *Ten obraz se mi zkazil je ‚negramatická‘ či ‚nepřijatelná‘, mohl pro to mít jediný jasný důvod, který by bylo lze formulovat např. takto: „Vzhledem ke svým jazykově-řečovým a lingvistickým zkušenostem tvrdím, že tuto větu, reprezentující určitý typ syntakticko-sémantické struktury, a tedy i jiné věty téže struktury nelze v normální komunikaci použít, resp. že větu tohoto typu by nikdo v normální komunikaci neužil.“ Argumentace tohoto typu také nepochybně bývaly implicite obsaženy ve výrocích o nepřijatelnosti či negramatičnosti syntaktických struktur, ať se tyto výroky opíraly o jakoukoli teorii (vyjma teorií generativistických). Že se tvrzení o nepřijatelnosti či negramatičnosti syntaktických struktur týkala „normální“ komunikace, se obvykle jen mlčky předpokládalo; přitom sotva existovala šance zjišťovat, jaká případná nenormální (či speciální) komunikace by umožnila danou strukturu, prohlašovanou za nepřijatelnou či negramatickou, použít. (Případ tzv. „nesmyslných vět“, srov. Daneš – Čmejrková, 1991, zde necháváme stranou, neboť v nich jde o konkrétně lexikálně obsazené výpovědi, nikoli o syntaktické struktury.) Samozřejmě ani ten největší korpus nemůže nikdy obsáhnout veškeré dosud realizované texty a promluvy a ani tento korpus nám tedy neumožní vědět, zda je možné, že uvažovaná struktura pokládaná za negramatickou nebyla dosud nikdy nikým použita. Tuto informaci je ostatně možno pokládat za nepodstatnou. Vždyť víme a/nebo předpokládáme, že velké množství syntaktických struktur různého stupně obecnosti má vysokou textovou frekvenci a že vzhledem k těmto vysokofrekvenčním strukturám i relativně nízkofrekvenční struktury, vyskytující se jednou na několik set či tisíc stran textu určitého žánru nebo stylu, budou mít ve velkém reprezentativním korpusu desítky či stovky výskytů. Nulový výskyt hledané struktury lze pak pokládat za objektivní potvrzení lingvistova soudu, založeného na jeho řečově-jazykové zkušenosti (tzv. ‚introspekci‘), o relativní neexistenci takové struktury v daném jazyce, a tedy i její negramatičnosti. Pouze korpus nám na druhé straně nepochybně umožní zjistit použití výrazů a struktur, jejichž existenci v daném jazyce bychom nepředpokládali.

Po tomto obecném úvodu se nyní můžeme věnovat korpusovým nálezům, jimiž bude lze obecné postuláty konkrétně demonstrovat. Půjde při tom nejprve o struktury slovosledné, poté o struktury formálněsyntaktické a nakonec o struktury syntakticko-sémantické.

[167]První z formálních vlastností slovosledných, které jsme v korpusu[8] zjišťovali, je pozice morfému se – jakožto jedné z příklonek – bezprostředně po spojce nebo vztažném zájmenu. Aniž známe přesné statistické údaje, z řečové zkušenosti můžeme vyvodit, že morfém se a patrně i kterékoli jiné klitikum musí stát, resp. – za normálních okolností – stává ve vztažné větě vždy bezprostředně po vztažném jenž nebo který, např. Událost, jíž/které se nenadál. Negramatické by tedy bylo *Událost, jíž/které nenadál se. Totéž se zdá platit i o pozici klitika ve vedlejší větě s hypotaktickou spojkou subordinační, např. Ujistila mě, že se mýlím; Řekla mi, abych se nebál. Negramatické by pak byly struktury *Ujistila mě, že mýlím se; *Řekla mi, abych nebál se.[9] Obráceně pak se zdá, že platí, že klitikum nikdy nestojí bezprostředně po koordinační spojce ale: *Teď tady není, ale se vrátí za chvíli namísto Teď tady není, ale vrátí se za chvíli. Protože slovosledná pravidla – obecně viděno – se poměrně často nezdají být příliš pevná a neporušitelná a – viděno konkrétněji – souhrn slovosledných pravidel pro postavení klitik po spojce se pro lingvistovo vnímání zdá být dosti nepřehledný, rozhodneme se hledat v korpusu. Není přitom třeba lámat si příliš hlavu tím, čím začneme, neboť hledání v tomtéž množství textů lze snadno znovu a znovu opakovat a zadávané dotazy lze nejrůzněji variovat; prohlídka dokladů získaných jedním hledáním nás přitom často bude inspirovat k zadávání dalších a dalších dotazů, formulovaných buď třeba speciálněji, nebo naopak obecněji. Rozhodneme se proto pro začátek např. pro nejjednodušší možné hledání nějaké struktury, tj. pro posloupnost dvou konkrétních slovních forem, v našem případě např. pro posloupnost slovních forem ale se. Zjistíme, že v korpusu je pro tuto posloupnost 6 dokladů, z nich však ani jediný není dokladem struktury, v níž spojka bezprostředně uvozuje větu. Naproti tomu pro slovoslednou strukturu ‚ale + sloveso + se‘ je v korpusu 7107 dokladů. Tyto korpusové nálezy umožňují jednoznačný závěr: slovosledné struktury, v nichž klitikum se nestojí bezprostředně po větněkoordinační spojce ale (ty lze zapsat např. jako ‚…, ale + verbum finitum + se‘ nebo ‚…, ale + determinující větný člen + se + determinující větný člen + verbum finitum‘), představují vzhledem k potenciální konkurenční protikladné slovosledné struktuře velmi pevnou slovoslednou normu: tato norma není potenciální konkurenční strukturou v korpusu ani jednou porušena; slovoslednou strukturu s klitikem se bezprostředně po větněkoordinační spojce ale (např. *…, ale se říká, že …) lze proto prohlásit za negramatickou. Nyní nás bude zajímat, zda stejně jednoznačně dopadne hledání potenciálně konkurenčních formálních slovosledných struktur, v nichž klitikum se buď následuje, nebo nenásleduje bezprostředně po spojce uvozující vztažnou větu: pro strukturu ‚lexém jenž + slovní forma se + slovní druh ‚sloveso‘‘ existuje 13 879 dokladů, pro konkurenční strukturu opačnou ‚lexém jenž + slovní druh ‚sloveso‘ + slovní forma se‘ je v korpusu 40 dokladů. Tedy téměř 14 000 dokladů proti 40. Co znamená těchto – spíše výjimečných – 40 dokladů (tj. 0,3 % z celkového počtu dokladů) formální slovosledné [168]struktury, kterou bychom bez praktické možnosti podobných statistických šetření bez větších rozpaků prohlásili za negramatickou? Podíváme-li se na těchto 40 dokladů, zjišťujeme: 13 z nich pochází z poezie a také zbývajících 27 dokladů (proti téměř 14 tisícům) náleží textům s vysokou mírou stylizace; i v textech publicistických jde o věty víceméně výrazně stylizované, popř. o věty nápadné svým obsahem, např.:

Tak místo vzestupu státu čekají nás stávky, jejichž smysl je záhadný, a řvoucí dav, jímž toulají se páni se spokojenými úsměvy

V prvním voze jel buršák s obrovským volským rohem, do něhož vejde se nejméně 5 litrů piva a jehož obsah musí řádný burš vypíti najednou.

Kromě všech těch běžných maloměšťáckých rituálů, které popsali Poláček nebo Vančura a jimž vzepřít se je těžké a mnohdy i nebezpečné, je tam všechno ještě umocněno životem té fabriky

Mezi všemi 40 doklady je jediná věta – z publicistiky – která nemá – kromě dané slovosledné inverze – patrnou osobitou stylizaci:

Téměř každý druhý občan, jenž touží se přestěhovat, uvádí jako svůj cíl konkrétní cizí zemi, nejvíce lidí by si pak za svou novou vlast zvolilo Maďarsko

Z toho lze vyvodit několik závěrů: (a) Slovosledná struktura ‚jenž + sloveso + se[10] je v současné češtině (poměrně málo využívaným) prostředkem osobité stylizace dané výpovědi, a bezprostředním motivem jejího použití jsou patrně zpravidla rytmické stylizační důvody (o nich existuje dostatek literatury, srov. např. Daneš, 1957; Uhlířová, 1987). (b) Pokud ve větě obsahující tento slovosled nelze zjistit jiné prostředky osobité stylizace, lze usoudit, že takovým prostředkem má být v dané větě právě tento slovosled, pokud je i z celého textu taková snaha o osobitou stylizaci patrná. (c) Je-li věta s daným slovosledem součástí textu stylizačně neutrálního, lze dovodit, že daný slovosled je v této větě z jazykově-komunikativního hlediska nefunkční, a lze jej pak hodnotit jako nesprávný, vadný a v dané větě daného textu nepřijatelný. (d) Vzhledem k poměru daných konkurenčních slovosledných struktur (téměř) 14 000 : 40 i k textovému charakteru daných 40 dokladů lze říci, že v případě struktury ‚jenž + se + sloveso‘ jde o poměrně velmi pevnou slovoslednou normu, která bývá jen poměrně zřídka, patrně zpravidla z rytmických důvodů, porušována. Konkurenční formu pak vzhledem k těmto frekvenčně-distribučním poměrům lze pokládat za principiálně negramatickou, avšak ze stylizačních důvodů omezeně přijatelnou. Toto zdánlivě kontroverzní stanovisko lze odůvodnit poukazem na známý fakt, že v uměleckém textu (a v textech jinak příznakových, srov. např. Hoffmannová, 2001) je porušování různých jazykových norem dosti běžným jazykově komunikativním jevem.

Druhou z formálních vlastností slovosledných, které jsme v korpusu zjišťovali, je pozice morfému se vzhledem k linearitě atributivního adjektiva a jím determinovaného substantiva. Přitom jsme předpokládali, že morfém se nemůže stát, resp. – přesněji řečeno – nikdy (za normálních okolností) nestojí mezi atributivním adjektivem [169]a je bezprostředně následujícím substantivem, např. …jídelní se stůl…. Budeme-li nyní hledat konkurenční slovosledné struktury typu ‚adjektivní atribut + substantivum + se‘ vs. ‚adjektivní atribut + se + substantivum‘ dostupnými vyhledávacími prostředky (dosud nelze vyhledávat větné členy, nýbrž pouze slovní druhy a jejich gramatické kategorie), dostaneme příliš mnoho dokladů na to, aby práce vynaložená na jejich přečtení a analýzu vyvážila očekávané výsledky. Uchýlíme se proto k náhradnímu (nikoli však nouzovému) řešení: Vyhledávanou strukturu doplníme o slovní druh slovesa umístěného na čtvrté pozici a budeme hledat tyto struktury: (a) ‚adjektivum + substantivum + se + sloveso‘; (b) adjektivum + se + substantivum + sloveso v prézentu nebo futuru‘. Pro strukturu (a)[11] existuje v korpusu 75 299 dokladů, pro strukturu (b) 197 dokladů. Z těchto 197 dokladů je však pouze 7, v nichž se adjektivum sémanticky váže na následující substantivum, z nich pak jsou to jen 4, kde adjektivum se substantivem tvoří syntagma; všechny tyto čtyři doklady, v nichž je atributivní adjektivum od substantiva, které určuje, odděleno morfémem se, jsou doklady z poezie:

s tolikerými se ohni promísí; rodové se smlouvy dotýká; kde lehké se paláce rodí; v svobodnou se domovinu vrací.

Jde tu o speciální případ obvyklé slovosledné inverze české poezie 19. století, a těchto dokladů by bylo patrně daleko více, kdyby korpus obsahoval i beletrii tohoto, dnes již předminulého, století. Pro nás je však podstatné něco jiného: korpusová šetření nejen potvrdila předpoklad, že reflexívní morfém se mezi adjektivní atribut a jím určované substantivum (mimo poetické či poetizační texty) nevkládá, ale poměrná frekvence mnoha tisíc proti několika výjimečným dokladům zároveň opět vyjevila, že tato norma je normou téměř absolutně pevnou a neporušitelnou, jakkoli je tato neporušitelnost vázána aspekty stylovými. Že máloco platí opravdu absolutně, ukazuje však jediný náš doklad, v němž je daná slovosledná norma porušena ve výpovědi, která evidentně nemá mít poetizační funkci:

Na zdejší předvánoční knižní se trh dostává po sedmi letech od svého prvního vydání další Johnsonovo kompendium věnované tentokrát „zrození moderní doby“.

I když lze předpokládat, že oněch 75 000 dokladů hledané struktury ‚adj. + subst. + se + sloveso‘ nejsou všechno doklady existující jazykové slovosledné struktury, přesto půjde nepochybně o mnoho tisíc dokladů proti jednomu jedinému. Nejde-li tu o žádný funkční záměr, neboť jde o typickou větu ryze informativní komunikativní funkce, lze slovosled ‚na knižní se trh dostává…‘ pokládat jednoznačně za nepozornostní či nedbalostní chybu. Z toho je vidět, že jsou-li pro to jazykově komunikativní důvody, lze i tutéž jazykovou strukturu hodnotit jednou jako chybu, podruhé jako komunikativně funkční jev.

Přejděme nyní k nelineárním strukturám formálněsyntaktickým. První z našich příkladů se týká syntaktického jevu spíše perifernějšího než centrálního, zato jeho výskyt [170]v textech podává významné svědectví o síle jeho systémovosti. Jde o syntaktickou vazbu přací partikule kéž na kategoriální tvar predikátu; přirozeně při tom půjde o kategorii času a modu, tj. o to, který z časů a modů se s touto partikulí (obvykle nebo výhradně, tj. noremně) spojuje. Naše řečová zkušenost nám např. může říkat, že přací partikule kéž se obvykle spojuje s predikátovým tvarem kondicionálovým, např. Kéž by zapršelo. Protože však tu jde o méně běžnou, spíše knižní či jinak stylově příznakovou formu přací věty, která se v běžné každodenní komunikaci vyskytuje patrně poměrně zřídka a ani v psaných textech není – to už nyní můžeme tvrdit, neboť máme provedenu prohlídku korpusu – frekventovaná, mohou nastat pochybnosti, zda a v jakých případech se kromě kondicionálu užívá také indikativu (Kéž zaprší). Protože vyslovované přání se vztahuje k budoucnosti, lze – v případě méně frekventovaného jevu i v rozporu s naší řečovou zkušeností – zapochybovat o tom, zda se – třeba jen příležitostně a zřídka – kromě indikativu prézenta nepoužije také složeného futura (jakkoli bychom věty typu *Kéž bude pršet před existencí korpusů patrně bez rozpaků označili za negramatické). Nyní nás však bude zajímat, do jaké míry naše řečová zkušenost odpovídá normě, a jde-li o normu, jak je tato norma pevná. Hledáme-li jednoduše slovo kéž, nalezneme 292 dokladů, u nichž po abecedním utřídění pravého kontextu snadno zjistíme, že mezi těmito doklady ve větě uvozené partikulí kéž se složené futurum nevyskytuje ani jednou. Ve shodě s naší introspekcí dále zjišťujeme, že vedle výrazně převládajícího kondicionálu se vyskytuje i prézens, a to převážně, nikoli však výjimečně, u sloves dokonavých, např. Celou noc budeš spočívat v mé náruči a kéž ti tato noc přinese štěstí, o němž jsi snila. Nulovým výskytem struktury (kéž + složené futurum) uvažované jako potenciálně konkurenční se strukturou o mnoha dokladech (kéž + kondicionál) nám korpus znovu vyjevil polarizační sílu potenciality jazykového systému, která dává vzniknout normám natolik pevným, že jsou spontánně respektovány i těmi nejkreativnějšími autory (Hrabal, básníci aj.), kteří jsou v korpusu zastoupeni. To, že vyspělý uživatel jazyka, ba dokonce lingvista může mít pocit, že uvažovaná struktura, která v korpusu není doložena, je komunikativně přijatelná, je sice faktem, který je třeba respektovat, nicméně tento fakt nic nemění na tom, že ve skutečnosti je (přesněji řečeno, jak ukazuje korpus, dosud byla) při spontánní volbě mezi potenciálně konkurenčními strukturami vždy dána přednost jen jedné z nich.[12]

Dosud jsme měli co činit se strukturami potenciálně si konkurujícími pouze formálně, tj. aniž by jejich reálně se vyskytující či jen uvažovaná záměna měla vliv na sémantickou funkci výpovědi. Šlo tu tedy o potenciální a/nebo reálnou existenci formálních strukturních jednotek a v této souvislosti bychom mohli mluvit o normách uzuálně systémových (Štícha, in: Kraus et al., 1981). Nyní nám půjde o konkurenci těch formálněsyntaktických struktur, jejichž záměna není libovolná, nýbrž naopak [171]podléhá striktním sémanticko-komunikativním pravidlům, jakkoli tato pravidla mohou být obtížně vyvoditelná a nesnadno formulovatelná. Zde již nejde jen o potenciální a/nebo reálnou existenci strukturní jednotky, nýbrž jde o konkurenci souvztažných struktur vzhledem k určité sémanticko-komunikativní funkci; v této souvislosti bychom mohli mluvit o normách funkčně strukturních (Štícha, in: Kraus et al., 1981). Odlišná významová komunikativní funkce konkurenčních syntaktických struktur je ovšem v mnoha případech natolik abstraktní a vyvázaná z (téměř) jakýchkoli formálních vazeb, že bývá velmi obtížné naše subjektivní přesvědčení o gramatičnosti dokazovat. Korpusová šetření nás však i v těchto případech nepochybně povedou k formulovatelné objektivizaci našich předpokladů. Jako první příklad existence funkčně strukturních norem jsme zvolili konkurenční souvztažné struktury začleňování vedlejší věty nebo infinitivu do nadřazeného predikátu s kataforickým ‚to‘ nebo bez něj. Např. Udělal (jen) to, co po něm chtěli vs. Udělal, co po něm chtěli. Anebo: Vadí mi (hlavně) to, že … vs. Vadí mi, že … Jde tu o velmi široké a rozsáhlé pole konkurenčních jevů téhož řádu, avšak s různou mírou obecnosti a speciálnosti, které bude nyní možno systematicky zkoumat pomocí korpusových rešerší. Zde nám nemůže jít o nic jiného než o ilustraci toho, co lze hledat a nalézat v korpusu a jaké závěry z toho lze vyvozovat. Máme-li např. – na základě své řečové zkušenosti – pocit, že kataforické to lze v češtině – např. na rozdíl od němčiny – užívat jen značně omezeně, a to v řadě případů jen tehdy, je-li na kataforickém to větný důraz, což znamená, že obsah začleňovaného predikátu („polopredikátu“, v případě infinitivu) je vytýkán do implicitního protikladu, můžeme např. věty *Tvrdí to, že mě neviděl anebo *Odmítl to, odpovědět na tuto otázku, v nichž uvedenou funkci kataforického znaku nebudeme předpokládat, označit za negramatické. Hledáme-li v korpusu, zjišťujeme např., že hledaná struktura ‚sloveso + to + , + že‘ je sice v korpusu obsažena téměř 5000krát, avšak struktura ‚lexém tvrdit + to + , + žeani jedenkrát; struktura ‚lexém odmítnout + infinitiv‘ má v korpusu 4232 dokladů, avšak struktura ‚lexém odmítnout + to (+ ,) + infinitiv‘ má pouze jeden doklad, ale v něm je to anaforické; struktura ‚lexém zjistit + , + že‘ má 8587 dokladů, avšak struktura ‚lexém zjistit + to + , + žeani jediný. Budeme-li v těchto rešerších pokračovat, a veškeré výsledky budou potvrzovat náš předpoklad o speciální vytýkací funkci kataforického to, musí být noremní absence kataforického to chápána jako nikoli ryze formální vlastnost subsystému české syntaxe, nýbrž jako jeho sémanticko-komunikativní funkce. Výsledkem těchto šetření může být např. i seznam sloves, která ve funkci predikátu začleňujícího vedlejší větu nebo infinitiv noremně (závazně) vyžadují absenci kataforického to, neboť v korpusu byl zjištěn nulový výskyt; to nás pak bude opravňovat k tomu, abychom věty typu *Odmítl to, odpovědět na tuto otázku vzhledem k porušení pevné, reálně existující a zjistitelné normy označili za negramatické. Protože takto vyvozovaná hodnocení vazeb jevů languových a parolových budou mít objektivní fundament, budou principiálně nezpochybnitelná.

Jako další příklad jsme zvolili strukturu, již tvoří vazba spojky uvozující větu a přítomnost nebo nepřítomnost subjektového osobního zájmena bezprostředně po spojce. V ČNK máme např. doloženy tyto věty:

[172]1. Struktura bez zájmena:

(a) Byla velice nešťastná, protože jsem ji nemiloval a protože jsem s ní jakživ nechtěl nikam jít.

(b) Vjel jsem si prsty do vlasů a začal jsem si střídavě třít ruce a nohy, protože jsem je měl ztuhlé

(c) Nakonec mě z nemocnice vyhodili, protože jsem jim vykradla trezor s léky

2. Struktura se zájmenem:

(a) Myslíte si, že jsme spojeni, protože já mluvím a vy nasloucháte.

(b) Raději se vyhýbám označení vážná hudba, protože já beru všechny druhy hudby vážně.

(c) Nebyl vůbec v souladu s mým založením, protože já jsem ve své podstatě velmi umírněný člověk.

Začneme-li uvažovat např. o možnosti užít v češtině osobní zájmeno bezprostředně po subordinačních spojkách protože nebo abych dříve, než provedeme korpusová šetření, můžeme dojít k závěru, že pokud osobní zájmeno v dané větě nevyjadřuje kontrast daného subjektu se subjektem jiným – jak je tomu v dokladu 2 (a) – nebo pokud ve vedlejší větě s protože není elipsa pomocného slovesa jsem (… protože já ji nemiloval), je v řadě jiných případů tato možnost nereálná a struktura s osobním zájmenem po těchto spojkách v neutrálních komunikativních kontextech je komunikativně nefunkční, je porušením funkčně strukturní normy, a v tomto smyslu je negramatická, např. *Přišel jsem pozdě, protože jsem zaspal; *Chtěla, abych jí pomohl namísto Přišel jsem pozdě, protože jsem zaspal; Chtěla, abych jí pomohl.[13] Korpusová šetření snadno potvrdí naši řečovou zkušenost, že užívání osobního zájmena po mnohých spojkách je relativně řídké. Např. poměr hledaných výrazů ‚protože jsem : protože já jsem‘ je 2484 : 96, poměr abych : abych já je 15 549 : 60 (tj. zájmeno se užívá pouze v 0,38 % vedlejších vět se subjektem v 1. os. sg. uvozených spojkou abych, v nichž toto zájmeno následuje bezprostředně po spojce). Na druhé straně z korpusových dokladů zjistíme, že obecná funkce tematizace subjektu pomocí osobního zájmena po spojce uvozující začleněnou větu se uplatňuje mnohem šíře, než jsme předpokládali, a že ne vždy jde o explicitní (doklad 2 (a)) nebo implicitní kontrast s jiným subjektem, např. vs. ostatní (doklad 2 (b)) nebo vs. on (doklad 2 (c)). Jakkoli můžeme nabýt dojmu, že obecnou funkcí užití osobního zájmena v české větě vůbec (tedy nikoli jen po té či oné spojce či druhu spojky nebo souvětí atd.) je tematizace subjektu, není snadné prokázat, za kterých jazykových okolností bývá tato tematizace realizována a za kterých je vyloučena. Např. ve větě Byla nešťastná, protože já jsem ji nemiloval užitím osobního zájmena může mít autor výpovědi subjektivní záměr jazykovým prostředkem (tj. užitím osobního zájmena ) postavit do protikladu dvě témata výpovědi: psychický stav, ve kterém se nacházela ona vs. psychický stav, v němž jsem se nacházel . Je teoretickým problémem, zda a jak lze dokázat, že tematizace subjektu pomocí osobního zájmena v některých větách není sémanticko-komunikativně funkční. Pokud pomocí korpusových šetření zjistíme určité formálně-sémantické závislosti podmiňující přítomnost a absenci osobního zájmena, budeme pak moci stanovit, které formálně-sémantické struktury adekvátní užití osobního zájmena vylučují, tj. jsou negramatické. Je však rovněž možné, že v případě da[173]ného jevu nedokážeme ani pomocí rozsáhlých korpusových šetření zjistit a explikovat existenci potenciální systémové polarizace konkurenčních struktur s osobním zájmenem a struktur s absencí tohoto zájmena, a možnosti prohlásit některé struktury s osobním zájmenem za negramatické se budeme muset vzdát.

Jako poslední příklad funkčně strukturní normy a na ní závislého statusu gramatičnosti jsme zvolili dobře známý protiklad aktiva a pasíva. Lze myslím pokládat za prokázané a dnes již i obecně akceptované, že centrální sémanticko-komunikativní funkcí pasíva je[14] perspektivizovat výpověď tak, že se v ní nějaká situace verbálně reprezentuje nikoli z hlediska toho, „co dělá (udělal, bude dělat) agens“, nýbrž z hlediska toho, „co se – vzhledem k danému objektu – děje (stalo, bude dít)“. Přijmeme-li toto stanovisko, pak lze za plně přijatelné a gramatické pokládat i věty jako Státním zástupcem byl vzat do vazby X.Y., v nichž agens je v pozici tématu v počátkové větné pozici. Naproti tomu věty, jejichž komunikativní hodnotou je sdělit, „co někdo dělá“, jsou noremně konstruovány pouze aktivně, např. Kolegyně toho Dostojevského již přečetla. Potenciálně konkurenční pasívní strukturu větné výpovědi téhož kognitivního obsahu, tj. obsahu reprezentujícího tutéž objektivní situaci *Kolegyní byl ten Dostojevský již přečten, musíme proto pokládat za negramatickou, neboť potenciální sémanticko-komunikativní hodnota (struktura) této konkrétní výpovědi s pasívem je v rozporu se zjištěnou obecnou sémantickou funkcí pasíva referovat o tom, „co se stalo“, nikoli z aktivní perspektivy činnosti subjektu. Na jiných příkladech konkurence aktiva a pasíva lze ukázat, že gramatičnost syntaktické struktury nemusí vždy znamenat její obvyklost a bezvýhradnou přijatelnost. Např. pasívní strukturu věty Byl jsem štípnut včelou lze pokládat za gramatickou,[15] je-li komunikativní funkcí této věty spíše sdělit, „co se (mi) stalo“, než sdělit, „co udělala včela“. Přesto – v rozporu s tím, že tu jde o formálně-sémantickou závislost určitého typu a – jinak řečeno – pasívní strukturu dané věty lze pokládat za funkci jejího komunikativního obsahu – je pasívní struktura této věty v rozporu s územ a jím podmíněnou normou zvolit pro tuto výpověď aktivum: Štípla mě včela; proto se nám také věty Byl jsem štípnut včelou a podobně i Byl jsem kousnut psem apod. mohou jevit jako (značně) nepřirozené, až komické.[16] Jiné případy vět s pasívem ukazují, jak pevnost „výběrových norem“ (Štícha, 1994), tj. norem výběru jedné ze dvou konkurenčních struktur (obecněji: jednoho ze dvou konkurenčních výrazů), může záviset na (ne)vyhraněnosti odpovídající struktury významové. Např. původce děje se lexikálně vyjadřuje v českých pasívních větách zpravidla jen tehdy, je-li tímto původcem zřejmý agens, činitel děje, nikoli však subjekt té sémantické role, kterou nazýváme ‚mediátor‘; např. Člun byl převržen mohutnou vlnou (‚vlna‘ se pojímá jako činitel) vs. *Místnost byla zaplňována unikajícím plynem (‚plyn‘ se pojímá spíše jako ‚mediátor‘, prostředek děje, niko[174]li jako činitel). Protože však sémantické hranice jednotlivých rolí původce děje jsou neostré a plynule přecházející jedna v druhou, nelze tu počítat s normami příliš pevnými a nebudeme se tu patrně moci plně spoléhat ani na korpusová šetření. Dnes ovšem můžeme těžko předvídat, co vše korpusové výzkumy v budoucnosti dokážou odhalit.

V gramatikách a syntaktických studiích se mnohdy uvažuje o gramatičnosti takových struktur, které i ve velkých korpusech budeme jen obtížně nalézat nebo je nenalezneme vůbec. G. Francisová (2000) o takových případech zajímavě říká, že „jsou nepřirozené“, protože „ukazují spíše na potencialitu než na to, co je reálné“ (s. 346). V této souvislosti Francisová cituje mj. anglickou příkladovou větu, jejíž český ekvivalent zní Walter hrál na klavír v Chicagu častěji, než jeho bratr dirigoval koncerty v ostatních místech Spojených států, převzatou z gramatiky R. Quirka – R. Svartvika (1966). O větách obsahujících struktury daného typu, tj. srovnávací struktury o více proměnných (subjekt, zde Walter vs. jeho bratr a predikát s jeho objektem a místním určením, zde hrát na klavír v Chicagu vs. dirigovat koncerty v ostatních místech), Francisová říká, že sice nejsou negramatické (aniž ovšem toto své stanovisko zdůvodňuje), avšak nesplňují „základní normy konverzační relevance“, a proto jsou nepřirozené. Francisová dále zajímavě tvrdí, že „Ačkoli v reálných korpusech se opravdu často vyskytují některé velmi zvláštní příklady, jejich nezvyklost má zřídka kdy umělý ráz“ (s. 346). Implicitní výhrady a nedůvěra Francisové ke smysluplnosti zkoumání „potenciálnosti jevů jazykových“ jsou ovšem nepochybně podmíněny jejím zaměřením na lexikálně motivovanou syntax, a neměly by nás proto odrazovat od jiných záměrů. Ostatně pokud jde o ony výhrady vůči umělosti mnohých vykonstruovaných struktur obecně a umělosti srovnávací struktury o více proměnných speciálně, může se ukázat, že při jiném lexikálním obsazení či mírné modifikaci dané struktury nemusíme již danou větu pociťovat jako nepřirozenou, a tuto naši řečovou zkušenost pak mohou potvrdit i korpusové nálezy. Pokud jde o výše citovanou větu, zdá se, že srovnávací struktury o čtyřech proměnných budou opravdu vzácné (nicméně při určitém lexikálním obsazení a v určitém kontextu nemusí znít „vykonstruovaně“); nicméně srovnávací věty o třech proměnných, např. věty typu Barokní skladatel napsal víc oper, než kolik romantik zkomponoval symfonií, v nichž se srovnávají různé slovesné predikáty a jejich různě lexikálně obsazené předměty, lze nejen pokládat za přirozené, ale můžeme je také nalézt v korpusu. Hledáme-li strukturu ‚substantivum + (,) + než + (,) + kolik‘, nalezneme 177 dokladů, mezi nimi i tyto dva: Divadlo Bolka Polívky podstatně větší sál, než kolik je zájemců o televizní dokumenty; Vybíral si týdně víc peněz, než kolik ukládali jeho bratři a sestry. Jak vidět, tvrzení Francisové o vykonstruovanosti a komunikativní neadekvátnosti srovnávacích struktur o více proměnných nemá obecnou platnost.

Budeme-li studium dynamiky vztahů languově-parolových stavět na fundamentu nálezů ve velkých reprezentativních korpusech textů daného národního jazyka, budeme se v budoucnu moci ve velmi mnohých případech oprostit od nikdy nekončících sporů o to, co je a co není gramatické (přijatelné, správné). Je však zároveň třeba říci, že dosud nevíme, nakolik existence těchto korpusů vůbec může motivovat, podněcovat, či dokonce umožňovat gramatickou analýzu.

 

[175]LITERATURA

 

BOLINGER, D.: Judgements of grammaticality. Lingua, 1968, s. 34–40.

DANEŠ, F.: Intonace a věta ve spisovné češtině. Praha 1957.

DANEŠ, F.: Postoje a hodnotící kritéria při kodifikaci. In: Aktuální otázky jazykové kultury v socialistické společnosti. Academia, Praha 1979, s. 79–91.

DANEŠ, F. – ČMERJKOVÁ, S.: Semantics in discourse: a dynamic view. In: Proceedings of LP ‘90. Linguistics and Phonetics: Prospects and Applications. Ed. by B. Palek and P. Janota. Charles University Press, Prague 1991, s. 172–180.

DANEŠ, F. – HLAVSA, Z. a kol.: Větné vzorce v češtině. Academia, Praha 1987 (2. vyd.).

FILLMORE, Ch. J.: „Corpus linguistics“ or „Computer-aided armchair linguistics“. In: Directions in Corpus Linguistics. Ed. J. Svartvik. Mouton de Gruyter, Berlin – New York 1992, s. 35–60.

FRANCIS, G.: Korpusový přístup ke gramatice. Principy, metody a příklady (A corpus–driven approach to grammar – principles, methods and examples). Přel. K. Pala a V. Petkevič. In: Studie z korpusové lingvistiky. Nakl. Karolinum, Praha 2000, s. 345–362.

GREENBAUM, S. (ed.): Acceptability in Language. Mouton, The Hague 1985.

HOFFMANNOVÁ, J.: Specifické možnosti češtiny pro hru s jazykem. In: Čeština – univerzália a specifika. II. Ed. Z. Hladká – P. Karlík. Brno 2001, s. 251–258.

KRAUS, J. – KUCHAŘ, J. – STICH, A. – ŠTÍCHA, F.: Současný stav a vývojové perspektivy kodifikace spisovné češtiny. SaS, 42, 1981, s. 228–237.

MATHESIUS, V.: O potenciálnosti jevů jazykových. In: Jazyk, kultura a slovesnost. Odeon, Praha 1982, s. 9–28.

NEBESKÁ, I.: Jazyk – norma – spisovnost. UK, Praha 1996.

QUIRK, R. – SVARTVIK, J.: Investigating Linguistic Acceptability. Mouton, The Hague 1966.

ŠTÍCHA, F.: K pojmu a popisu jazykové normy. In: Funkční lingvistika a dialektika. Linguistica XVII/1. Ústav pro jazyk český, Praha 1988, s. 190–196.

ŠTÍCHA, F.: Acceptability and the scope of grammar. In: The Syntax of Sentence and Text. A Festschrift for František Daneš. Ed. by S. Čmejrková and F. Štícha. John Benjamins, Amsterdam – Philadelphia 1994, s. 341–357.

ŠTÍCHA, F.: Nad velkou Gramatikou německého jazyka. SaS, 61, 2000, s. 218–231.

UHLÍŘOVÁ, L.: Knížka o slovosledu. Academia, Praha 1987.

 

R É S U M É

Kriterien der Grammatikalität (Das Korpus als Argument und Inspiration)

Grammatikalität eines (komplexen) sprachlichen Ausdrucks wird als dessen Sprachsystembezogenheit aufgefasst. Was grammatisch ist, wird von dem Sprachbenutzer und/oder Linguisten als richtig und akzeptabel bewertet. Was ungrammatisch ist, wird als falsch und nicht akzeptabel bewertet. Im Aufsatz wird vorgeschlagen, dass Grammatikalität als Systembezogenheit durch statistische und textuell-distributive Auswertungen der Korpusbefunde erschlossen wird. Das Korpus wird dabei als eine präzedenslose Herausforderung für den Grammatiker gesehen, neue Fragen in bezug auf die Begriffe der Grammatikalität und Akzeptabilität grammatischer Phänomene zu stellen.


[1] V této souvislosti stojí za to ocitovat některé výroky V. Mathesia z jeho slavné studie (1911/1982): „Obsahuje tedy jazyk teoreticky (tučně F. Š.) všecky jevy jazykové, které se vyskytují v konkrétních promluvách … Ve skutečnosti (tučně F. Š.) … ovšem jazykozpyt … všímá si proto … téměř vždy jen rysů hlavních (tučně F. Š.).“ Dále: „Zdánlivá jednoduchost jevů jazykových se považuje často ne za výsledek jazykozpytné metody, nýbrž za skutečnou jejich vlastnost …“ Dále: „Stejně jako teorie potenciálnosti pomohla zjistit pravidelnost ve slovosledu zdánlivě zcela volném, pomáhá zjišťovat formální pravidelnosti i jinde, kde by jich nikdo nečekal …“ Co by asi řekl V. Mathesius tomu, že nyní lze studovat kdykoli kterýkoli jev najednou ve stovkách knih a ohromném množství jiných textů všech nebo téměř všech psaných žánrů (k nimž v blízké budoucnosti nepochybně přibudou i autentické diskursy mluvené), aniž je k daleko skromnějším cílům třeba celoživotního či alespoň mnohaletého díla mimořádně pilných jedinců?

[2] G. Francisová (2000, s. 347) např. soudí, že korpus je „jedinou spolehlivou autoritou, kterou musíme respektovat“.

[3] V dalších výkladech nebudu již hovořit o ‚jazykovém výrazu‘ obecně, nýbrž půjde speciálně a výhradně o přijatelnost a gramatičnost syntaktických struktur.

[4] A domníval se to, jak známo, už téměř před jedním stoletím i náš vynikající lingvista V. Mathesius.

[5] Linearita je v jistém smyslu přirozeně podstatou jazyka vůbec: jinak než v postupném řazení znaků za sebou v času či prostoru si jazykovou komunikaci sotva umíme představit. Na druhé straně lze a je třeba rozlišit ty lineární jazykové struktury, které jsou na této linearitě založeny, tak, že jde o určitou posloupnost určitých slovních forem či kategorií, tj. ty struktury, jimž běžně říkáme slovosled, od těch struktur, které jsou založeny na – nikoli nutně lineární – konfiguraci určitého počtu určitých elementů – těmto strukturám lze pak říkat, abychom je v případě takové potřeby odlišili od struktur slovosledných, struktury nelineární. – Hovoříme-li o formálních strukturách slovosledných, jde o pevné normy lineární posloupnosti kategoriálních proměnných, např. posloupnost spojky a klitického zájmena, v jiných jazycích např. též pevné pořadí určitých větných členů apod. Jiná je otázka linearity výrazů, které jsou na sobě závislé svým obsahem; zde jde již o normy funkčně strukturní (Štícha, in: Kraus et al., 1981) a jimi podmíněnou gramatičnost.

[6] Tvrzení Ch. J. Fillmora (1992), že „korpus nám nedokáže říci, co není možné“, protože „neexistují korpusy ohvězdičkovaných příkladů“, je scestné. Samozřejmě že nám korpus přímo neřekne, co není možné. Avšak uvažujeme-li např. o tom, zda se vedle určité frekventované struktury užívá také s ní tak či onak souvztažná struktura synonymní, jejíž existenci teoreticky předpokládáme, pak nám poměrná frekvence mnoha stovek či tisíc dokladů první struktury proti nulovému výskytu druhé struktury říká velmi mnoho; nepřímo pak právě i to, že tato struktura „není možná“ (chceme-li se vyjadřovat normálně, tj. – ve smyslu Mathesiově – „po stránce formální obvykle“).

[7] V prvním případě jde o možnost vzhledem k pevným systémovým vazbám ze stylizačních důvodů okazionálně použít výrazu, který nemusíme nalézt ani ve velkém korpusu; např. si lze i v běžné řeči představit užití deminutivní formy nůsek (ta existuje v odborném názvosloví) namísto noremní formy nosík (Štícha, 1981); jde tu o teoretické souvislosti známé u nás zejména z Dokulilovy teorie odvozování slov. V druhém případě jde o to, že z důvodů mechanické analogie může dojít a také docházívá k porušování existujících strukturních závislostí, např. genitiv komparativu ve struktuře typu ‚není nic + komparativ‘ (není nic jednoduššího), kde genitiv adjektiva je závislý na kvantifikátoru nic (závislost genitivního tvaru jména na určujícím výrazu existuje, jak známo, u substantivních číslovek počínaje číslovkou pět a u zájmenných adverbiálních kvantifikátorů jako něco, nic, mnoho, málo), se mechanicky přenese i do souvztažné struktury ‚nic není + adjektivum‘ a strukturně daný predikativní nominativ (Všechno je možné; Něco není možné; Nic není jednoduché; Nic není jednodušší) se zamění genitivem: *nic není jednoduššího, náležitým v konkurenční struktuře synonymní (není nic jednoduššího).

[8] Budeme-li dále užívat slovo ‚korpus‘ v souvislosti s nálezy, půjde vždy o Český národní korpus.

[9] L. Uhlířová (1987, s. 84) na toto téma říká: „Běžně říkáme například Slíbil, že se vrátí ve středu, a nikoli Slíbil, že vrátí se ve středu.

[10] Zda lze daná zobecnění vztáhnout na jakoukoli příklonku (ze třídy výrazů, které takto označíme – srov. k tomu Uhlířová, 1987), popř. pouze na některé z nich, nemohu v tuto chvíli – jakkoli se to zdá pravděpodobné – pro absenci potřebného výzkumu rozhodnout.

[11] Vyhledávaná struktura ovšem pochopitelně často není totožná s některou ze syntaktických struktur existujících v daném jazyce; bude proto vhodné technicky rozlišovat struktury vyhledávané od struktur jazykových.

[12] Např. F. Daneš v recenzi tohoto článku soudí, že jsou přijatelné věty jako Kéž to bude mít stále na mysli. Je zajímavé, že i autorovi této stati se tato Danešova věta jeví jako výrazně přijatelnější než věta Kéž bude pršet. Nicméně oněch téměř 300 dokladů s kondicionálem či indikativem prézenta bez jediného dokladu se složeným futurem je faktem přinejmenším stejně důležitým, a to faktem udivujícím, a přitom faktem objektivním a nezpochybnitelným.

[13] Necháváme tu stranou případy formálně nevyhraněné a nedostatečně uspořádané běžně mluvené řeči, v níž k podobným porušováním norem standardního jazyka docházívá.

[14] Jistá definiční variantnost nemusí vylučovat identitu definovaného. S tímto jevem bychom se naopak měli smířit, pokud definovaným objektem je jev relativně difúzní v tom smyslu, že jde o intersubjektivní mentální hodnotu, která nemá pevnou a diskrétní vazbu na diskrétní jazykovou formu, a nelze jej proto absolutně objektivizovat.

[15] Vzhledem k obsahu tohoto článku zde koriguji své dřívější stanovisko, kdy jsem tuto větu označoval za negramatickou.

[16] V němčině jsou věty jako Ich bin von einer Biene gestochen worden zcela normální a přirozené.

Ústav pro jazyk český AV ČR
Letenská 4, 118 51 Praha 1

Slovo a slovesnost, volume 62 (2001), number 3, pp. 161-175

Previous Markéta Slezáková: Konference o interakční lingvistice v belgickém Spa

Next Vít Dovalil: K souvislostem mezi jazykovou normou a varietou