Jaroslav Peregrin
[Články]
Formal representation of context
Vysloví-li člověk (rozumnou) oznamovací větu, bývá pravdivá nebo nepravdivá. Jakými okolnostmi je její pravdivostní hodnota dána? Zcela obecně jde o tři různé druhy okolností:
(i) Určité okolnosti (konkrétně historické okolnosti vývoje jazyka) určují, co slova, ze kterých se tato věta skládá, znamenají.
(ii) Jiné okolnosti (kontext výpovědi této věty) mohou určovat, k čemu některé výrazy v této větě (já, tady, …) odkazují.
(iii) Další okolnosti (odpovídající tomu, o čem tato věta hovoří) určují, zda se věci mají tak, jak věta říká.
Vezměme například větu
(1) Já mám hlad.
vyslovenou mnou v době, když toto píšu. Tato věta je pravdivá, a to díky tomu, že (i) slova v ní znamenají to, co v češtině znamenají, (ii) zájmeno já odkazuje ke mně (protože jsem ji vyslovil já); a (iii) já mám teď skutečně hlad.
Můžeme to vidět tak, že okolnosti typu (i) určují, co věta vyjadřuje, přičemž v některých případech to ovšem určují neúplně a je třeba to zkompletovat za pomoci okolností typu (ii). Okolnosti typu (iii) pak určují, zda je to, co je vyjadřováno, momentálně pravdivé.
Zabýváme-li se nějakým určitým jazykem, pak závislost (i) odpadá: to, že slova mají ten určitý význam, který ve studovaném jazyce mají, prostě předpokládáme. Z hlediska sémantiky (případně pragmatiky) jsou tedy zásadní závislosti typů (ii) a (iii). (Pokud jde ovšem o ty druhé, úkolem teorie jazyka může být zkoumat jak na nich pravdivostní hodnota závisí, nikoli jaká tato pravdivostní hodnota fakticky je: úkolem teorie jazyka jistě není stanovovat, zda je třeba věta Prší v tom či onom okamžiku pravdivá.)
Nahlédneme-li jako to, co je pro sémantiku zásadní, závislosti typu (iii), vede nás to k závěru, že význam je záležitostí pravdivostních podmínek. Rozumět větě, jak říká L. Wittgenstein v Traktátu (1922, § 4.024), znamená prostě vědět, za jakých okolností je pravdivá. Chceme-li nyní takto chápaný význam rekonstruovat jako abstraktní objekt, využijeme k tomu pojem možného světa. Představíme-li si vedle našeho aktuálního světa jiné možné světy, můžeme říci, že význam věty je funkce, která každému z těchto světů přiřazuje pravdivostní hodnotu (podle toho, zda je příslušná věta v tomto světě pravdivá nebo nepravdivá). Taková funkce se pak nazývá intenzí:
význam (= intenze) + možný svět ⇒ pravdivostní hodnota.
[9]Na této explikaci závislostí typu (iii) je založena tzv. intenzionální sémantika, rozpracovaná především R. Montaguem a ve variantě dobře známé u nás P. Tichým (viz zejména Montague, 1974; Tichý, 1988; viz též Tichý, 1996; Materna, 1995, či Materna a Štěpán, 2000). O těchto sémantických teoriích je toho v české odborné literatuře dostupného tolik, že se jimi tady nebudeme podrobně zabývat.[1]
‚Možnosvětová‘ intenzionální sémantika, v níž se protnuly některé filosofické a logické teorie a která se rozvinula zejména v sedmdesátých letech minulého století, se ukázala být relativně plodným paradigmatem sémantické analýzy; chceme-li však v jejím rámci analyzovat přirozený jazyk tak, jak je, se vším všudy, a nikoli jenom nějakou jeho omezenou a standardizovanou část, stojíme před problémem analyzování indexických výrazů, které se při svém jazykovém fungování opírají o závislosti typu (ii). Jak se to tedy vlastně se závislostmi typu (ii) má? Do jaké míry patří nebo nepatří do sémantiky?
Naše tendence odpovědět na tuto otázku pozitivně nebo negativně bude pravděpodobně ovlivněna tím, jak se na jazyk díváme a co považujeme za jeho principiální funkci. Jeden z tradičních přístupů k sémantice vidí jazyk především jako nástroj artikulace a uchovávání vědění. Soustředíme-li se na tuto jistě zásadně důležitou funkci jazyka, budeme náchylní považovat za dokonalé věty jedině ty, které vyjadřují myšlenky nezávislé na kontextu – to jest u kterých se žádná závislost typu (ii) nevyskytuje. Věta Já mám hlad se bude z tohoto hlediska jevit jenom jako jakási recyklovatelná pomůcka pro lenochy, kterým je zatěžko říci něco takového jako
(2) Jaroslav Peregrin má dne 23. 6. 2002 v 21:55 hodin hlad.
Říkejme tomu, co ustanovují okolnosti typu (i), význam výrazu a tomu, co je ustanovováno navíc okolnostmi typu (ii), jeho obsah.[2] S použitím této terminologie tedy můžeme říci, že význam by měl být něčím, co v určitém kontextu dá určitý obsah. (Samozřejmě že ne každá věta musí záviset na kontextu netriviálně – některé mohou dávat tentýž obsah v jakémkoli kontextu.)
Z toho, že obsah je obecně zkompletován až kontextem, vyplývá, že obsah nemá věta in abstracto, ale až věta zasazená v určitém kontextu, to jest až určitá výpověď. Namísto obsah bychom tedy mohli říkat význam výpovědi – tady je ale nebezpečí dvojznačnosti, protože významem výpovědi se někdy rozumí něco jiného, totiž to, co je určitou výpovědí v určitém kontextu sdělováno – a to může být něco radikálně odlišného od toho, co je obsahem použité věty. (Vyslovím-li větu (1) v určitém kontextu, může být jejím obsahem to, co udává věta (2). Avšak touto výpovědí mohu ve skutečnosti vyjadřovat něco zcela jiného – třeba své rozhořčení, že jsem nebyl v restauraci po dlouhou dobu obsloužen. A protože právě tohle se často označuje termínem význam výpovědi (utterance meaning), zůstaneme my u termínu obsah. K tomu se vrátíme ještě později.)
[10]Prvním, kdo se pokusil kontexty systematicky zabudovat do možnosvětové sémantiky, byl americký sémantik D. Kaplan (1979). Ten konstatoval, že významem věty není její intenze, ale to, co nazval jejím charakterem: funkce, která přiřazuje kontextům intenze. Tak například charakterem věty (1) je funkce, která přiřazuje výše zmíněnému kontextu intenzi odpovídající větě (2),[3] zatímco jiným kontextům obecně intenze zcela jiné. Ve zkratce tedy můžeme psát
význam (= charakter) + kontext ⇒ intenze.
Kde se ovšem kontexty, které jsou charaktery (a potažmo je vyjadřujícími větami) ‚konzumovány‘, berou? Částečně jsou tvořeny mimojazykovými okolnostmi výpovědi; avšak částečně jsou dotvářeny i jazykovou aktivitou. Řeknu-li
(3) On má hlad,
mohu tím odkazovat k někomu, kdo prostě stojí vedle mne a na koho ukazuji, avšak i k někomu, kdo v dohledu vůbec není a předmětem odkazování se mohl stát jedině díky tomu, že jsem se o něm zmínil předchozí větou.
To znamená, že výpovědi nejenom ‚konzumují‘ kontexty, ale kontexty také ‚produkují‘ (viz Peregrin, 2000b). Na to v rámci formální sémantiky upozornil především R. Stalnaker: podle něj kaplanovský charakter produkuje nejenom intenzi, ale současně přetváří původní kontext v kontext nový. Řeknu-li
(4) Karel už chce jít na večeři,
vytvořím tím určitý kontext, kontext ve kterém nebude nepřípadné použít například větu (3). (V mnohých jiných kontextech by to nepřípadné jistě bylo – představme si, že bychom ji použili v situaci, kdy by předtím nebyla o nikom řeč a ani v bezprostředním okolí by se nenacházel nikdo, na koho by se on mohlo vztahovat.) Věta (4) tedy produkuje ten druh kontextu, který může být konzumován takovými větami, jako je (3).
Podle Stalnakera (1970) tedy platí
význam + (starý) kontext ⇒ intenze + (nový) kontext.
To lze rozložit na dvě části, odpovídající dvěma ‚účinkům‘ významu v kontextu:
význam + (starý) kontext ⇒ intenze,
význam + (starý) kontext ⇒ (nový) kontext.
Můžeme i rozlišit dvě složky významu, které tyto dva ‚účinky‘ uskutečňují: tou první je kaplanovský charakter, té druhé pak budeme říkat potenciál změny kontextu (nebo krátce jenom potenciál[4]):
charakter + (starý) kontext ⇒ intenze,
potenciál + (starý) kontext ⇒ (nový) kontext.
Podívejme se nyní na tu druhou.
Jak může výpověď produkovat kontext? Mnozí, zejména logicky a informaticky orientovaní sémantikové často používají namísto výrazu kontext výraz informační stav. Tím zdůrazňují jeden podstatný aspekt kontextu – kontext jakožto ‚shromaždiště‘ přesvědčení, na kterých se již mluvčí a posluchač dohodli či jež předpokládají jako samozřejmá. Tak za normálních okolností, konstatuji-li (4) a nebude-li proti tomu můj posluchač protestovat, stane se (4) sdíleným přesvědčením, na které se lze později odvolávat či z něj vyvozovat důsledky. (‚Sdílené přesvědčení‘ ovšem nemusí být přesvědčením v pravém slova smyslu – ani já, ani můj posluchač tomu nemusí v pravém slova smyslu věřit. Podstatné je, že se to pro účely současného diskurzu bere za přijaté.) Takto je kontext často chápán například v rámci prací tzv. amsterodamské logicko-lingvistické školy (viz nejnověji van Benthem et al., 2001); a tímto směrem odkazuje i termín zásoba sdílených znalostí, který používají Sgall et al. (1986).
Vidíme-li kontext jako informační stav, tj. jako soubor sdílených přesvědčení, můžeme způsob, jak ho výpověď modifikuje, vidět prostě jenom jako přidání další informace, totiž propozice, která je obsahem aktuální výpovědi. Může samozřejmě dojít ke konfliktům, protože kontext nemůže být tvořen jakýmkoli souborem propozic, ale pouze souborem, který je do určité míry koherentní. To znamená, že bude-li se například někdo snažit prostřednictvím své výpovědi rozšířit informační stav o propozici, která je v rozporu s těmi, které již v kontextu jsou, prostě to nepůjde – povede to buďto k odmítnutí této propozice, nebo k revizi stávajícího kontextu a k vyřazení některých z těch propozic, které do něj dosud patřily.
V rámci intenzionální sémantiky je propozice ztotožnitelná s určitou množinou možných světů, totiž všech těch, ve kterých je tato propozice pravdivá. Množinou možných světů, ve které jsou pravdivé dvě (nebo více) propozice, je zřejmě průnik těchto propozic. To znamená, že kontext jakožto množinu propozic je v tomto rámci možné ztotožnit s množinou možných světů, totiž průnikem všech těchto propozic. To také znamená, že přidání každé další propozice znamená zmenšení množiny možných světů, které tvoří aktuální kontext, a sice takové, že se z něj vyloučí všechny ty možné světy, které nepatří do přidávané propozice.
V tomto rámci si tedy můžeme diskurz představovat jako vylučování možných světů. Na začátku jsou k dispozici všechny možné světy; a postupně se jednotlivými výpověďmi některé vylučují – totiž ty, které nejsou slučitelné s tím, co je konstatováno a přijímáno. Prohlásí-li někdo (4), vylučuje tím všechny možné světy, ve kterých Karel nechce jít na večeři; a prohlásí-li na to někdo (3), vylučuje tím dále z těchto možných světů ty, ve kterých Karel sice chce jít na večeři, ale nemá hlad.
Tento model kinematiky diskurzu a informačních stavů byl rozpracován opět zejména R. Stalnakerem (1978); a schematicky si ho můžeme zachytit následujícím způsobem:
intenze + (starý) kontext (= intenzeK) ⇒ (nový) kontext (= intenze∩intenzeK).
Tady tedy vlastně nevyvstává potřeba rozpolcení významu na charakter a potenciál: změnu kontextu působí prostě intenze, která je předtím vyprodukována z charakteru a kontextu.
[12]Problém s tímto modelem je v tom, že nám bezprostředně neposkytuje prostředky pro vypořádání se právě s těmi problémy, které nás k nutnosti vpuštění kontextů do sémantiky přivedly, totiž problémů exemplifikovaných větami typu (3), to jest problémů anaforické reference. Podle právě uvedeného modelu se totiž diskurz zdá ‚fungovat‘ do té doby, než se objeví výpověď, která je v rozporu s tím, co už bylo přijato. Neobsahuje-li již kontext žádný možný svět, ve kterém má Karel hlad, a prohlásí-li někdo, že Karel hlad má, není to možné prostě přijmout (protože průnikem této propozice s kontextem by již byla prázdná množina možných světů, a diskurz by tedy nemohl netriviálně pokračovat). Prohlásí-li však někdo (3) v situaci, kdy není z kontextu zřejmé, ke komu by mělo odkazovat zájmeno on, nejde tu přímo o rozpor – jde spíše o to, že tato výpověď je v tomto kontextu jaksi nepřípadná.
Zdá se tedy, že bychom měli rozlišit dva základní druhy možného konfliktu mezi výpovědí a jejím kontextem – rozpor (výpověď přináší nějakou informaci, která je neslučitelná s tím, co už je v rámci kontextu přijato) a nepřípadnost (výpověď odkazuje k něčemu, co by mělo být kontextem určeno, ale není). Model kontextů jakožto informačních stavů dobře explikuje ten první případ; zdá se ale, že pro ten druhý bychom potřebovali vidět kontext ještě poněkud jinak.
Zdá se totiž, že z hlediska odkazování, jaké je charakteristické pro zájmena (a obecněji pro další anaforické prvky jazyka), je třeba především vědět, jaké entity byly v rámci předchozího diskurzu zmiňovány a jsou tedy v tomto smyslu salientní – to jest jsou ‚k mání‘ jakožto potenciální předměty anaforické reference. Z tohoto hlediska bychom tedy potřebovali kontext vidět jako jakési ‚individuárium‘, soubor aktuálně salientních osob, věcí atd., ke kterým lze aktuálně odkazovat pomocí zájmen ap. Tak konstatuji-li (4), stane se prvkem kontextu-individuária Karel, a následuje-li (3), bude on interpretováno jako odkazující k němu.
Individuárium ovšem obsahuje nikoli jenom individua, ale i různé vlastnosti, které pomáhají při jejich identifikaci. Tak například řeknu-li
(5) Karel se má dobře, ten je řezník, Miloš je ale nezaměstnaný,
bude individuárium vzniklého kontextu obsahovat nejenom dvě individua Karla a Miloše, ale i informaci o tom, že ten první je řezník a ten druhý nezaměstnaný, takže naváže-li se dále větou
(6) Mohl bych pro toho nezaměstnaného něco udělat?
bude jasné, že tato fráze odkazuje k Milošovi, a nikoli ke Karlovi.[5]
Modelem kontextu, který se zdá z tohoto hlediska nejužitečnější, je tedy model ‚dvoukomorový‘, skládající se z individuária, tvořeného individui, která jsou aktuálně salientní, a ‚informatoria‘ ve kterém se skladují aktuálně salientní informace (které se obvykle těchto individuí týkají). Právě na tomto modelu je založena v současné době [13]mezi lingvisty ve světě asi nejpopulárnější metoda modelování kontextu, na které je postavena Kampova tzv. teorie reprezentace diskurzu (DRT – viz Kamp a Reyle, 1993; viz též Peregrin, 1998, kap. 6, a literatura uvedená tam).
Struktura reprezentace diskurzu, která v rámci DRT zachycuje kontext/informační stav, se skutečně skládá ze dvou částí, z nichž první obsahuje jakási ‚formální‘ individua a druhá je tvořena propozicemi. Tak větě (5) by odpovídala struktura
u | v |
u = Karel | |
řezník(u) | |
má-se-dobře(u) | |
v = Miloš | |
nezaměstnaný(v) |
To ovšem zdaleka není jediný možný přístup. Tak například v rámci Groenendijkovy a Stokhofovy (1991) dynamické predikátové logiky (DPL) je kontext modelován ‚teleologicky‘: totiž jakožto ustanovující propojení mezi potenciálními anaforicky referujícími výrazy a jejich aktuálními referenty. (Tak například kontext vytvořený větou (5) by byl chápán jako propojující výraz ten řezník s Karlem – v tom smyslu, že bude-li tento výraz následně užit, pak bude fungovat jako označení Karla. V rámci formálního jazyka DPL jsou ovšem s potenciálními referenty propojovány speciální ‚anaforické‘ výrazy, kterým Groenendijk a Stokhof říkají diskurzní značky.) Takovýto model kontextu, na rozdíl od toho, který je nabízen DRT, se ovšem víceméně omezuje na chápání kontextu jakožto individuária, a tedy spíše na explikaci anaforických aspektů závislosti na kontextu, než aspektů informačně-teoretických.
Další možností je využít právě toho, že individua, která se dostávají do individuária, se tam dostávají spolu s informacemi o svých vlastnostech, a stávají se tak momentálními ‚reprezentanty‘ tříd nositelů těchto vlastností. Řeknu-li (5), stane se pro mě z hlediska salience Karel reprezentantem řezníků a Miloš reprezentantem nezaměstnaných – a z tohoto pohledu je tedy to, že při následném užití (6) bude ten řezník odkazovat ke Karlovi, dáno právě tímto faktem. Z tohoto hlediska se pak jeví možné zachytit kontext jako přiřazení ‚reprezentantů‘ třídám individuí či vlastnostem, to jest jako výběrovou funkci, přiřazující množině nějaký její prvek či vlastnosti nějakého jejího nositele (viz Peregrin a von Heusinger, 1997; výklad základních principů fungování systémů dynamické sémantiky s odkazy na příslušnou literaturu je možné najít v Peregrin, 1996, a Peregrin, 1998, kap. 6).
Teorie jako DRT ovšem sémantiku rekonstruují prostě jako záležitost budování a přebudovávání kontextů či informačních stavů: podle DRT je popis toho, co je na větě sémanticky relevantní, vyčerpán popisem toho, jakým způsobem tato věta modifikuje aktuální strukturu reprezentace diskurzu (to jest kontext tvaru individuárium+informatorium). Jinými slovy, za sémanticky relevantní se bere pouze potenciál změny kontex[14]tu věty. Výše jsme viděli, jak se Stalnakerovi podařil jistý druh redukce potenciálu na charakter (nahlédl totiž potenciál jako pouhou schopnost věty vytvořit nový kontext jako průnik existujícího kontextu s její intenzí) – a tady se zdá, že se naopak implicitně předpokládá nějaká forma redukovatelnosti charakteru, a tím i celého významu, na potenciál.
Jedna možnost se může zdát naskýtat. Připomeňme si, jaká je funkce charakteru:
charakter + kontext ⇒ intenze.
Přitom
intenze + možný svět ⇒ pravdivostní hodnota,
takže můžeme zkráceně psát
charakter + kontext + možný svět ⇒ pravdivostní hodnota.
Avšak není vlastně kontext, ve kterém je učiněna výpověď, a možný svět, který určuje, zda je tato výpověď pravdivá, záležitostí fakticky jedněch a týchž okolností? Pravdivostní hodnotu výroku (1) přece získám tak, že nejprve zjistím, kdo tento výrok v aktuálním světě proslovuje, a pak zjistím, jestli má tato osoba v tomtéž aktuálním světě hlad – v obou případech tedy jde o stav téhož (aktuálního) světa, a totéž zřejmě platí, když uvažuji o proslovení tohoto výroku za nějakých jiných, hypotetických okolností, to jest v jiném možném světě. Nešlo by tedy tento vzorec zjednodušit prostě na
charakter + možný svět / kontext ⇒ pravdivostní hodnota?
Nazývejme takový hybrid, který by byl schopen hrát jak roli kontextu, tak roli možného světa, světokontextem. Pokud by se nám něco takového podařilo definovat, naskýtala by se možnost nejen redukovat charakter prostě na intenzi (to jest na něco, co nám spolu s možným světem dává pravdivostní hodnotu), ale následně tuto intenzi a tudíž i charakter zredukovat na potenciál. Jakmile bychom totiž mohli charakter vidět jako něco, co dává pravdivostní hodnotu v konfrontaci se světokontextem, mohli bychom ho nahlédnout prostě jenom jako vyjádření toho, ve kterých světokontextech je daný výrok ‚úspěšný‘ v tom smyslu, že do nich ‚pasuje‘ – zatímco potenciál určuje, jaký nový kontext výpověď z daného kontextu vyrobí, charakter by podle této teorie určoval jenom to, zda vyrobí vůbec nějaký, nebo zda z důvodů ‚nepasování‘ nevyrobí vůbec žádný. Jestliže tedy potenciál věty (3) spočívá v tom, že se individuárium daného kontextu obohatí o informaci, že individuum, které tam je, má hlad, pak bychom jeho charakter prostě ztotožnili s množinou těch světokontextů, ve kterých k takovému obohacení vůbec může dojít, to jest takových, že chápány jako kontext ve svém individuáriu obsahují právě jedno individuum, a chápány jako svět v nich má toto individuum hlad.
Tato úvaha ale podstatně závisí na tom, zda se nám podaří uvést kontext a možný svět ‚na společný jmenovatel‘ – to jest najít nějakou udržitelnou definici světokontextu. Jaký je tedy principiální rozdíl mezi okolnostmi typu (ii), které jsme zachytili jako kontext, a okolnostmi typu (iii), které jsou rekonstruovány jako možný svět? První, co nás asi napadne, je to, že možný svět je ‚větší‘; to ale není podstatný rozdíl. Na pravdivostní hodnotu věty má obvykle vliv jenom zlomek celého možného světa – a na druhé stra[15]ně za kontext bychom jistě mohli, kdybychom chtěli, také brát nejenom nejužší okolí místa výpovědi, ale třeba i celý okolní svět. Podstatnější je, že kontext má jakoby ‚střed‘ – je soustředěn kolem nějakého mluvčího, který se nachází na nějakém místě v nějakém čase a některé entity se mu jeví jako aktuálně salientní. Kdybychom o takový ‚střed‘ obohatili možný svět, nic by nám, zdá se, nebránilo ho využít jako kontext.
Nazvěme soustředěným možným světem[6] možný svět, ve kterém je jakožto ‚střed‘ vyznačena nějaká osoba (nacházející se na nějakém místě v nějakém čase, případně jsoucí v nějakých vztazích k jiným entitám). Soustředěné možné světy můžeme využívat prostě jako prosté možné světy (když ignorujeme jejich střed), nebo jako kontexty. Kdybychom tedy kontext výpovědi zachytili jako soustředěný možný svět, mohli bychom ho využít nejenom jako kontext (určující okolnosti výpovědi typu (ii)), ale i jako onen možný svět, který určuje okolnosti typu (iii) a skrze ně i pravdivostní hodnotu výroku. Od charakteru se tak dostaneme k pravdivostní hodnotě dvojím použitím téhož soustředěného možného světa.
Vraťme se k větě (1). Představme si dvě osoby, mne, který mám aktuálně hlad, a mého přítele N.N., který hlad nemá. Představme si navíc možný svět W, ve kterém je tomu naopak: N.N. má hlad, já nikoli. To nám dává čtyři soustředěné možné světy: aktuální svět soustředěný na mne (W1), aktuální svět soustředěný na N.N. (W2), svět W soustředěný na mne (W3), a W soustředěný na N.N. (W4). Uvažujeme tedy čtyři kontexty, reprezentované soustředěnými světy W1 až W4, z nichž každému přiřazuje charakter věty (1) intenzi, to jest množinu možných světů, z nichž opět uvažujeme ty, které jsou reprezentovány W1 až W4. Tak například kontextu W1 je přiřazena intenze odpovídající následující množině možných světů (kde znaménko + znamená, že příslušný možný svět do vymezované množiny patří):
W1 | W2 | W3 | W4 | … |
+ | + | - | - | … |
Například + v prvním sloupci je dáno tím, že je (1) vyhodnocována v kontextu daném W1, takže já odkazuje ke mně (protože W1 je soustředěný na mne), a její pravdivost je vyhodnocována opět vzhledem k W1, což je aktuální svět, takže je pravdivá (protože já mám v aktuálním světě skutečně hlad). Určíme-li intenze pro další uvažované kontexty, dostaneme obdobnou tabulku s více řádky (označenými světy, které tvoří příslušný kontext):
| W1 | W2 | W3 | W4 | … |
W1 | + | + | - | - | … |
W2 | - | - | + | + | … |
W3 | + | + | - | - | … |
W4 | - | - | + | + | … |
… | … | … | … | … | … |
Pokud bychom nyní měli určovat pravdivostní hodnotu vždy vzhledem právě k tomu možnému světu, který je totožný s kontextem výpovědi, dostali bychom propozici, která tvoří diagonálu této tabulky, to jest propozici
[16]W1 | W2 | W3 | W4 | … |
+ | - | - | + | … |
Problém je v tom, že takto sice správně zachytíme závislost pravdivosti věty na kontextu její výpovědi, ale po cestě zcela ztratíme cokoli, co by bylo použitelné jako explikát významu. Názorně je to vidět na příkladě věty
(7) Já mluvím.
Tato věta je zřejmě pravdivá v kterémkoli myslitelném kontextu – diagonála příslušné tabulky totiž obsahuje samá plus.[7] Kdybychom však měli jako intenzi vyjadřovanou (7) vidět tuto propozici, dospěli bychom k závěru, že tato věta vyjadřuje stejnou intenzi jako třeba věta (8), a je od ní tudíž sémanticky nerozlišitelná.
(8) Každý pes je zvíře.
(8) je totiž zjevně pravdivá nezávisle na kontextu užití, a je tedy pravdivá v jakémkoli kontextu vzhledem k jakémukoli možnému světu (takže i jí příslušná tabulka by obsahovala jedině hodnoty plus).[8] Z toho, jak se zdá, vyplývá, že adekvátní sémantická teorie se neobejde bez dvou stupňů závislosti pravdivostní hodnoty na okolnostech, které jsou explikovány v rámci kaplanovského charakteru (srov. Lewis, 1981). Zdá se to ovšem také naznačovat, že redukovatelnost významu na potenciál, kterou se teorie jako DRT zdají víceméně implicitně předpokládat, není neproblematická (srov. Stalnaker, 1999).
Formalizace kontextů ovšem formální sémantice otevírá i zcela nové cesty analýzy jazyka a diskurzu. To lze ukázat na příkladu sémantických analýz anglického určitého členu: ten byl tradičně vykládán (v duchu klasické analýzy B. Russella, 1905) jako vyjadřující funkci, která přiřazuje množinám individua tak, že jednoprvkové množině přiřadí její jediný prvek a pro každou jinou je nedefinována či vede k nějak anomálnímu výsledku (podrobněji viz Peregrin, 2000b). (Takže například výraz the president of the USA označuje prezidenta USA, protože ten je jediným prvkem extenze obecné jmenné fráze president of the USA; zatímco výrazy the king of the USA či the citizen of the USA neoznačují nic, protože extenze king of the USA je prázdná, zatímco extenze citizen of the USA má více než jeden prvek.) To by ovšem znamenalo, že výraz jako the table by nebylo možné korektně použít, pokud by existoval více než jeden stůl.
Nechceme-li se však vyhýbat pojmu kontextu, můžeme v této analýze nahradit jedinečnost saliencí či ‚referenční dosažitelností‘: použití the table nepředpokládá, že existuje jediný stůl, ale že existuje stůl, který je z hlediska aktuálního diskurzu salientní, to jest který je nějakým způsobem ‚kontextuálně vysvícen‘ (to může být stůl, o kte[17]rém se právě hovořilo, či stůl, u kterého právě stojíme atd.). Tímto způsobem se formální sémantika podstatným způsobem přiblížila možnosti analyzování jazyka tak, jak fakticky funguje v rámci diskurzu.[9]
S tím ovšem úzce souvisí i analýza toho, čemu se v rámci české lingvistiky říká aktuální členění a co bývalo v rámci tradičnějších přístupů po cestě od přirozeného jazyka k jeho formálně-sémantickým modelům odfiltrováváno. Ony dvě části, na které se výpověď z hlediska aktuálního členění dělí, východisko a jádro výpovědi, totiž mohou být charakterizovány právě prostřednictvím svého vztahu ke kontextu: východisko je obecně tím, co výpověď ‚zakotvuje‘ v aktuálním kontextu, zatímco jádro je tím, co přináší nějakou novou informaci (o kterou je pak kontext obohacen).
Z toho vyplývá, že se tyto dvě části charakteristicky liší tím, jakým způsobem ovlivňují výslednou pravdivostní hodnotu výpovědi (viz Peregrin, 1995). Východisko předpokládá oporu v rámci existujícího kontextu, a pokud mu ji kontext nepostytuje, prostě do něj ‚nepasuje‘, a příslušná výpověď je tedy spíše nepatřičná než nepravdivá. (Pokud je ovšem možné kontext o potřebnou oporu přímočaře obohatit, může být tato výpověď brána jako implicitně obsahující instrukci k právě takovému obohacení. To je proces, v souvislosti s nímž se obvykle hovoří o akomodaci.) Jádro naproti tomu jako takové nepředpokládá nic, a má tedy co dělat už přímo s pravdivostí či nepravdivostí výpovědi. Hledání cest optimálního modelování problémů souvisejících s aktuálním členěním pomocí formálních modelů kontextu je ovšem podnikem velice komplikovaným a dosud zdaleka ne završeným (viz Hajičová et al., 1998).
Na závěr dvě poznámky, které by měly pomoci předejít nedorozuměním. Na sémantiku samozřejmě můžeme jít i z jiné strany než z té, ze které se soustředíme na poznávání a vědění (a ze které se k ní obvykle přibližují logikové). Jako místo, kde se projevuje povaha jazyka, můžeme totiž také nahlédnout každodenní komunikaci. A z tohoto hlediska nám asi nebudou připadat příliš smysluplné pochybnosti o tom, že do sémantiky patří kontexty a závislost na kontextu – ta je totiž v běžné komunikaci natolik všudypřítomná, že kdybychom ji chtěli vynechat, měli bychom problémy, aby nám zbylo vůbec nějaké pole působnosti.
Z hlediska běžné komunikace se také stává urgentní potřeba jasně rozlišovat mezi významem věty a významem výpovědi. To ovšem nejde o rozlišení mezi úrovněmi (ii) a (iii) výše – jak už jsme se o tom výše zmínili, v rámci běžné komunikace se stává, že to, co v intuitivním slova smyslu říkáme nějakou výpovědí, je něco zcela jiného, než co říká věta, která je prostředkem této výpovědi. Řeknu-li Už jsem večeřel, může to v jedné situaci znamenat jenom to, co znamená toto věta, totiž že už jsem večeřel, v jiné to může znamenat Děkuji, k jídlu nic nechci a v jiné to může znamenat i třeba něco jako Ne, opravdu nechci, abyste mně dávali do ruky toho brouka.
[18]Klasický model vztahu mezi tím, co znamená věta, která je užita pro učinění výpovědi, a co znamená tato výpověď, byl artikulován oxfordským filosofem H. P. Gricem. Grice říká, že význam věty je jenom jedním z východisek procedury, kterou posluchač určuje význam výpovědi. Dalšími východisky jsou obecná pravidla diskurzu, o kterých se předpokládá, že je účastníci dodržují.[10]
Druhá poznámka se týká Carnapova (1942) klasického dělení teorie jazyka na syntax (nauku o vztazích mezi výrazy navzájem), sémantiku (nauku o vztazích mezi výrazy a tím, co označují) a pragmatiku (nauku o vztazích mezi výrazy a jejich uživateli). Zdá se, že pojem kontextu spadá do poslední z nich. O kontextu pak, jak se zdá, hovoříme nikoli v souvislosti s jazykem jako abstraktním systémem, ale až v souvislosti se způsobem, jak je nějaký element jazyka nějakým mluvčím užit.
Uvažme ale problém sémantické analýzy zájmen, jako je on. Co takové zájmeno znamená? Co se člověk naučí, když mu porozumí? Zdá se, že není dost dobře možné, abychom na takovéto otázky odpověděli, aniž bychom se o pojem kontextu tak či onak opřeli. To znamená, že pokud se chceme zabývat významy celého spektra výrazů jazyka, kontextům se stěží vyhneme.
Nepoukazuje tohle ale jenom na to, že zájmena, jako je on, vlastně nemají žádnou sémantiku, ale jenom ‚pragmatiku‘? Že pro takové zájmeno tu není žádná entita, kterou by označovalo, ale jenom určitá pravidla smysluplného užití v rámci diskurzu? Neznamená to, že zájmena jsou tedy jen jakýmisi ‚sémanticky pomocnými‘ prvky, které nějak podporují ty výrazy jazyka, které jsou nositeli skutečné sémantiky?
Zdá se mi, že tato fakta nepoukazují ani tak na to, že zájmena nemají význam (jak by jim pak bylo lze porozumět?), jako na to, že carnapovské vymezení sémantiky (a s ním celá carnapovská trichotomie) není pro přirozený jazyk příliš použitelné (to jsem se snažil podrobně ukázat na jiném místě – viz Peregrin, 1999). To totiž předpokládá, že všechny výrazy jsou svého druhu jména a jejich významy jsou jimi pojmenovávané předměty (nebo se na tyto předměty nějak redukují). To však, domnívám se, neplatí v podstatě o žádném výrazu jazyka (možná s výjimkou některých vlastních jmen). Jak jsem argumentoval na jiných místech, význam je obecně nejlépe nahlédnutelný jako role tohoto výrazu, která je mu udělována pravidly, jimiž se smysluplné užívání tohoto jazyka řídí – takže sémantika je v poslední instanci studiem těchto pravidel (viz Peregrin, 1994, 2000a a 2001). Z tohoto hlediska tedy není mezi sémantikou zájmena a třeba obecného jména rozdíl ‚kvalitativní‘, ale jenom ‚kvantitativní‘ (pravidla sémanticky určující to druhé se zřejmě budou nějakým podstatnějším způsobem odvolávat na nějaký určitý druh entit).[11]
[19]LITERATURA
BENTHEM, J. P. van – DEKKER, J. – EIJCK, J. van – RIJKE, M. de – VENEMA, Y.: Logic in Action. ILLC, Amsterdam 2001.
CARNAP, R.: Introduction to Semantics. Harvard University Press, Cambridge, Mass. 1942.
GROENENDIJK, J. – STOKHOF, M.: Dynamic predicate logic. Linguistics and Philosophy, 14, 1991, s. 39–101.
HAJIČOVÁ, E. – OLIVA, K. – SGALL, P.: Odkazování v gramatice a v textu. SaS, 48, 1987, s. 99–212.
HAJIČOVÁ, E. – PARTEE, B. H. – SGALL, P.: Topic-focus Articulation, Tripartite Structures, and Semantic Content. Kluwer, Dordrecht 1998.
HEUSINGER, K. von: Salienz und Referenz. Akademie, Berlin 1997.
KAMP, H. – REYLE, U.: From Discourse to Logic. Kluwer, Dordrecht 1993.
KAPLAN, D.: On the logic of demonstratives. Journal of Philosophical Logic, 8, 1979, s. 81–98.
KOŤÁTKO, P.: Význam a komunikace. Filosofia, Praha 1998.
LEWIS, D. K.: Attitudes De Dicto and De Se. Philosophical Review, 8, 1979a, s. 513–543.
LEWIS, D. K.: Scorekeeping in a language-game. Journal of Philosophical Logic, 8, 1979b, s. 339–359.
LEWIS, D. K.: Index, context, and content. In: S. Kanger – S. Öhman (eds.), Philosophy and Grammar. Reidel, Dordrecht 1981, s. 513–543.
MATERNA, P.: Svět pojmů a logika. Filosofia, Praha 1995.
MATERNA, P. – ŠTĚPÁN, J.: Filosofická logika: nová cesta. Nakladatelství Olomouc, Olomouc 2000.
MONTAGUE, R.: Formal Philosophy: Selected Papers. Ed. R. Thomason. Yale University Press, New Haven 1974.
PEREGRIN, J.: O čem je sémantika? SaS, 55, 1994, s. 106–115.
PEREGRIN, J.: Topic, focus and the logic of language. In: I. Kohlhof – S. Winkler – H. B. Drubig (eds.), Sprachtheoretische Grundlagen für die Komputerlinguistik. IBM Deutschland, Heidelberg 1995, s. 49–57.
PEREGRIN, J.: Dynamická sémantika. ORGANON F, 4, 1996, s. 333–348.
PEREGRIN, J.: Úvod do teoretické sémantiky. Karolinum, Praha 1998. Skripta FF UK.
PEREGRIN, J.: The pragmatization of semantics. In: K. Turmer (ed.), The Semantics/Pragmatics Interface from Different Points of View. Elsevier, North-Hollard 1999, s. 419–442.
PEREGRIN, J.: Význam a struktura. OIKOYMENH, Praha 2000a.
PEREGRIN, J.: Reference and inference: the case of anaphora. In: K. von Heusinger – U. Egli (eds.), Reference and Anaphoric Relations. Kluwer, Dordrecht 2000b, s. 269–286.
PEREGRIN, J.: Co je to jazyk? Aluze, 2001, č. 3, s. 70–76.
PEREGRIN, J. – HEUSINGER, K. von: Dynamic semantics with choice functions. In: H. Kamp – B. H. Partee (eds.), Context-Dependence in the Analysis of Linguistic Meaning, I. Universität Stuttgart, Stuttgart 1997, s. 329–354.
RUSSELL, B.: On denoting. Mind, 14, 1905, s. 479–493; český překlad O označení ve výboru Russellových prací Logika, jazyk, věda. Ed. L. Tondl – K. Berka. Svoboda, Praha 1967.
SGALL, P. – HAJIČOVÁ, E. – PANEVOVÁ, J.: The Meaning of the Sentence in its Semantic and Pragmatic Aspects. Academia, Praha 1986.
SPERBER, D. – WILSON, D.: Pragmatics, modularity and mind-reading. Mind & Language, 17, 2002, s. 3–23.
STALNAKER, R.: Pragmatics. Synthèse, 22, 1970, s. 272–89; přetištěno v Stalnaker, 1999.
STALNAKER, R.: Assertion. In: P. Cole (ed.), Syntax and Semantics, 9: Pragmatics. Academic Press, New York 1978, s. 315–322; přetištěno v Stalnaker, 1999.
STALNAKER, R.: Introduction. In: R. Stalnaker, Context and Content. Oxford University Press, Oxford 1999.
STALNAKER, R.: On considering a possible world as actual. In: Proceedings of the Aristotelian Society. Supplementary volume, 65, 2001, s. 141–156.
[20]TICHÝ, P.: The Foundations of Frege’s Logic. de Gruyter, Berlin 1988.
TICHÝ, P.: O čem mluvíme? (Vybrané stati k logice a sémantice). Filosofia, Praha 1996.
WITTGENSTEIN, L.: Tractatus Logico-Philosophicus. Routledge, London 1922; český překlad OIKOYMENH, Praha 1993.
R É S U M É
The truth of an utterance generally depends on what the words uttered mean and what is the current state of the world: but also on the context of the utterance. Within formal semantics this was first accounted for, by Kaplan, by means of explicating meanings as functions from contexts to intensions. Stalnaker then brought the attention to the fact that utteraces not only ‘consume’ contexts but also ‘produce’ new ones; and that context is thus what mediates the interplay between subsequent utterances. In this paper we point out that context can be considered either from the viewpoint of the information it contains (which delimits what can be subsequently consistently claimed), or from the viewpoint of individuals which it contains (which determines what can be subsequently succesfully anaphorically referred to). We discuss the possibilities of explicating contexts within the framework of formal semantics and we also discuss the question to which extent contexts belong to semantics.
[*] Autor děkuje Petru Sgallovi za podnětné kritické připomínky k předchozí verzi tohoto článku.
[1] Viz Peregrin (1998, kap. 3), kde je možné najít odkazy na další literaturu. Zcela stranou v tomto článku ponecháváme fakt, že mnoho proponentů intenzionální sémantiky (včetně Tichého i Montaguových pokračovatelů) postupně dospělo k závěru, že intenze není dostatečně ‚jemným‘ explikátem významu a přesunuli se k různým ‚hyperintenzionálním‘ verzím sémantiky (ibid., kap. 4).
[2] Sgall et al. (1986) zde používají namísto mého obsah termín smysl (sense).
[3] To jest intenzi, která je větou (2) vyjadřována v každém kontextu.
[4] Tento termín pochází, nakolik je mi známo, od I. Heimové.
[5] Strategie, jak mezi více salientními objekty vybrat ten, ke kterému je aktuálně odkazováno, jsou samozřejmě fakticky mnohem komplikovanější (viz např. Hajičová et al., 1988).
[6] Tento termín pochází od D. Lewise (1979a).
[7] To je ovšem pozoruhodnou explikací faktu, že intuitivně je (7) empirický výrok, který však nemůže nebýt pravdivý (srov. Stalnaker, 2001).
[8] Všimněme si, že tady nejde o nerozlišitelnost dvou analytických vět (která bývá standardním motivem opuštění klasické intenzionální sémantiky ve prospěch sémantiky hyperintenzionální – viz pozn. 1) – (7) není analytická, ale kontingentní (empirická) věta, a její odlišení od (8) by tedy nemělo být pro intenzionální sémantiku problémem. Z právě popsané sémantické analýzy však obě tyto věty vycházejí jako sémanticky identické.
[9] Průkopníkem tohoto pohledu uvnitř formální sémantiky byl v době, kdy byla ještě ovládána zejména logiky a filosofy, především Lewis (1979b). Jak v rámci tohoto interdisciplinárního hnutí postupně sílil vliv lingvistů, stával se ovšem tento pohled čím dál samozřejmější. Přehled nedávného stavu věcí v této oblasti podává von Heusinger (1997).
[10] Od Griceových dob se objevila celá řada dalších teorií, které způsob, jakým se posluchač dobere významu výpovědi, vysvětlují různými jinými způsoby. Vlivnou se stala například teorie komunikace jako ‚čtení mysli‘ (Sperber a Wilson, 2002): podle ní spočívá pochopení významu výpovědi v poznání toho, co mluvčí svou výpovědí myslí – a význam použité věty je tu opět jenom jedním ze zdrojů, o které se při tomto poznávání opíráme. V Česku tematizoval tento aspekt vztahu významu a komunikace především Koťátko (1998).
[11] Je ale takovéto pojetí sémantiky vůbec slučitelné s formální sémantikou, která, jak se zdá, významy explikuje právě jako nějaké výrazem pojmenovávané objekty? Domnívám se, že je – ovšem když objekty, které formální sémantika výrazům přiřazuje jakožto explikáty jejich významů, chápeme nikoli jako objekty, které by tyto výrazy doslova pojmenovávaly, ale spíše jako určité rekonstrukce jejich sémantických rolí (viz Peregrin, 2000a, kap. 8).
Filosofický ústav AV ČR
Jilská 1, 110 00 Praha 1
Slovo a slovesnost, ročník 64 (2003), číslo 1, s. 8-20
Předchozí Jan Kořenský: Procesuální gramatika v kontextu současných tendencí lingvistického myšlení
Následující Jindra Konopková: Způsoby vyjádření mlčení v uměleckém textu
© 2011 – HTML 4.01 – CSS 2.1