Eva Buráňová
[Články]
Об отношении вещественного значения и языкового выражения / Remarks on the relation of the content and its expression by linguistic
Výzkum na poli lingvistické sémantiky zřetelně ukázal, že je tato oblast vždy těsně spjata s pojmem významu, který je ve smyslu „signifiant - signifié“ vázán na jazykovou formu a jen na jejím základě je rozpoznatelný a ověřitelný, ať už se jedná o sémantiku lexikální,[1] nebo o sémantické kategorie větné struktury.[2] Je tedy zřejmé, že je třeba rozlišovat mezi tím, co patří k lingvistickému významu podmíněnému formou, a tím, co patří k vědomostem o objektu (Coseriu - Geckeler, 1974) a k věcnému obsahu. Avšak otázka věcného obsahu a příslušné roviny, k níž tento pojem patří (obsahové, gnozeologicko-logické, myšlenkové, kognitivní, ontologické aj.), a strukturace této roviny není již tak jasná. V české lingvistice, jak konstatoval Dokulil (Materiály, 1976), se většinou přijímá předpoklad, že tu jde již o jevy nelingvistické, obsahy v lidském vědomí, které mají svou strukturu a jsou dále jazykem nějak zpracovány. Charakter vztahu mezi touto nejazykovou rovinou a rovinami jazykového systému budí v posledních letech zájem lingvistů.[3]
Musíme jistě souhlasit s Geckelerem (1971), že obsahová stránka je jakožto psychická rovina pro vědecký průzkum mnohem obtížnější než jazyková stránka materiální (výrazová), a to nejen pro nesnadnější postižitelnost, ale hlavně pro veliký počet jevů ve srovnání s gramatickými významy. Proto bude z hlediska jejího zkoumání asi předním úkolem snaha o nějaké uspořádání, o poznání struktury této bohaté zásoby, snaha stanovit kategorie a hierarchii vztahů mezi kategoriemi, pokud tu existují. V sémantice bylo v tomto ohledu dosaženo významných výsledků, běžně se pracuje s kategoriemi sémů, sémémů, archisémů, sémantických příznaků[4] apod., v čemž tkví podle Geckelera stěžejní význam strukturní sémantiky. Podle Horeckého (1980) jsou např. sémantickými příznaky ty prvky významové stránky jazyka, kterými je možno charakterizovat větší soubory slov. Občas se setkáváme též s pokusy stanovit i pro obsahovou rovinu kategorie — jako např. noémy (s nimi pracoval již G. F. Meier — viz zprávu o konferenci v Magdeburce Těšitelová - Budovičová - Dokulil, 1965; dále např. Gulyga - Šendel’s, 1976; Horecký, 1980),[5] virtuémy (Geckeler, 1971), avšak důsledná strukturace je zde otázkou budoucnosti.
Prozatím je zřejmé, že se pojmová strukturace mimojazykové reality promítá nějakým způsobem do jazyka a zanechává tam své stopy, protože myšlení a řeč jsou v těsném spojení a jde o proces vzájemného ovlivňování (většinou myslíme „jazykově“).[6] V tomto smyslu se v posledních letech mluví o tzv. vnitřních[7] nebo [19]skrytých kategoriích a gramatice. Např. podle Kacnel’sona (1972) existují ve větách pro vyvození skrytých kategorií patřících do roviny jazykového myšlení dostatečně jasné ukazatele, a to v podobě gramatických forem, které mohou mít v tomto smyslu distinktivní funkci. Protože nemají v jazyce samostatné vyjádření, můžeme je vysledovat v organizaci větné struktury (Kacnel’son, tamtéž), jejich přítomnost v jazyce je prokazatelná, ačkoli nedostatkem vlastních výrazových prostředků vlastně parazitují na výrazových prostředcích spjatých se „zjevnými“ kategoriemi (Běličová, 1980). Že nejde o nijak jednoduché vztahy, naznačuje úvaha Sgalla a Panevové o „vyrozumívání“ obsahů z významových jednotek (Sgall - Panevová, 1976).
Někteří lingvisté zastávají v tomto směru názor, že nejvyšším zobecněním na rovině obsahu je stanovení kategorie substance a kategorie příznaku, na jejichž základě lze obecně popsat mimojazykovou realitu.[8] Účelem tohoto článku je přispět k tomuto předpokladu, a to z hlediska omezeného pole empirického zkoumání.
Zachycení relevantního obsahu sdělení je klíčovým problémem v automatických informačních systémech, které slouží k ukládání a vyhledávání informací (různé systémy umělé inteligence, systémy pro automatické zodpovídání dotazů a automatické řízení, faktografické systémy aj.), zejména pokud jsou založeny na porozumění přirozenému jazyku. Představme si intuitivní sestavení souhrnu znalostí o jisté vymezené tematické oblasti (např. přírodovědné), kdy expert vybere údaje nutné pro práci v daném oboru a uloží je do báze dat (znalostí) v podobě některého z užívaných modelů. Tato data ukládá tedy tak, že odhadne jejich věcnou relevanci bez ohledu na různorodé ekvivalentní možnosti jejich jazykového vyjádření, podobně zaznamená jejich hierarchii a vzájemné vztahy. Zakódované podoby těchto dat představují tak pojmy zastupující jevy mimojazykové skutečnosti. Můžeme však také naopak předložit počítačovému systému nějaká sdělení v přirozeném jazyce (texty), která mají být při některé z počítačových aplikací zpracována tak, aby jejich konečné zápisy sloužily k vyhledávání potřebných údajů v bázi dat (znalostí) na základě shody. Vhodnou lingvistickou analýzou sdělení je tedy třeba dospět k takovému zhuštění jazykového materiálu a jeho filtraci, aby zbývající jednotky a vztahy mezi nimi byly na jedné straně postačující a na druhé straně nezbytné (nikoli tedy nadbytečné) pro záznam věcného obsahu zpracovávaného textu. Ať vyjádříme soubor takto získaných údajů jakkoli, je zřejmé, že má-li být tato podoba srovnána s údaji uloženými již v bázi dat, je už oproštěna od vázanosti na původní konkrétní vyjádření v přirozeném jazyce. Všechna jazyková sdělení výrazově různorodá, avšak z hlediska věcného obsahu synonymní, se tedy po analýze zapíší jednotně. Budeme dále mluvit o tzv. věcně obsahovém jádru lexému[9] a věcně obsahovém jádru věty. Jde o to, na jakém základě lze tento obsah zachytit.
V informačních systémech bývá zobrazován úsek reálného světa jako soubor entit, z nichž každá má jisté vlastnosti a mezi nimiž existují určité vztahy. Nejde tu však o všestranné zachycení části skutečnosti beze zbytku, tj. všech existujících entit, vlastností a vztahů, ale o popis z hlediska pohledu uživatele informačního systému v rámci dané tematické oblasti. Z úseku reálného života ho zajímají jen jisté jevy a souvislosti. Přestože je tedy teoreticky počet entit libovolný, při praktických aplikacích se vybírají obyčejně jen jisté typy entit a vše ostatní z daného úseku je z hlediska pohledu uživatele chápáno v podobě vlastností těchto entit. Jev reálného světa může tedy být ve formálním systému buď entitou, nebo vlastností, což závisí na zorném úhlu uživatelů. Tak např. Praha může být v jednom systému [20]hodnotou vlastnosti ‚bydliště‘, v jiném — např. v kulturně historické oblasti — entitou, která sama má soubor vlastností.
Vztah entita — vlastnost (v terminologii informačních systémů tzv. atribut) je v podstatě obdoba vztahu substance — příznak, jak se s ním setkáváme v lingvistice. Tak např. Dokulil (1962) předpokládá nad rovinou onomaziologických kategorií (substance, vlastnost, děj, okolnost) rovinu gnozeologicko-logickou, kde je možno počítat s kategorií předmětovosti (substance) a příznaků (vlastnost a děj jsou zde svou podstatou též příznaky, okolnost je vlastně příznakem příznaku). Substancí může být člověk, živá bytost, neživý předmět ap. Podrobnější klasifikace onomaziologických kategorií souvisí již s otázkou jazykového vyjádření, se slovotvornou strukturou.[10] Podobně Kacnel’son (1972) nalézá v tzv. „jazykově-myšlenkové“ oblasti dvě základní kategorie — předměty a jejich příznaky, přičemž označení předmět chápe v reálném smyslu slova, přisuzuje je pouze předmětům materiálním (živým i neživým), zatímco tradiční gramatika podle jeho soudu počítá mezi „předměty“ prakticky vše, co nalézá formální vyjádření v kategorii substantiv.
Mohli bychom říci, že pojem substance představuje živý nebo neživý materiální objekt, který se nachází nebo přemísťuje někde v prostoru, a příznak představuje vlastnost, kterou člověk připisuje substanci buď na základě svých smyslů (něco je označeno jako drsné, hranaté, slané, voní, šumí), nebo na základě myšlení, dedukce (v důsledku chování předmětů — vhodný, nevhodný, lakomý, řídící).[11]
Souhrn našich znalostí o reálném světě obsažený v pojmových strukturách má zřejmě spíše statický charakter. (Tato „statičnost“ nebrání ovšem neustálé aktualizaci poznatků.) Odraz mimojazykové skutečnosti v obsahové (logicko-gnozeologické) rovině se někdy uvádí do těsného vztahu s oblastí terminologie (nomenklatury) v jazyce, kde prý skutečně slova zastupují „věci“ (Geckeler, 1971) a nomenklatura prezentuje objektivní klasifikaci konstruovanou na logických distinkcích (Coseriu - Geckeler, 1974). V některých pracích se soudí, že odpovídající odraz mimojazykové reality lze hledat i v jednoduchých větných formách oznamovacího způsobu, v přítomném čase a s modalitou skutečnosti.[12] O podobném abstrahování od aktualizačních kategorií a od konkrétní formy se uvažuje při definování propozice v sémantické rovině věty, tzv. předmětné sémantické složky.[13] Na této rovině se však jakožto se základem počítá s predikační strukturou, osnovu propozice tvoří predikát se souborem participantů s příslušnými sémantickými rolemi; jde tedy spíše o dynamický, dějový model „stavu věcí“, i když oproštěný od aktualizačních složek. Domnívám se, že je tento dějový rámec sémantického jádra těsně spojen s podstatou jazykového vyjádření, se základní — tj. komunikační funkcí jazyka; chceme-li o reálném světě něco vypovědět, používáme dynamického vy[21]jádření v podobě větných, a to převážně predikačních struktur.[14] Naproti tomu věcně obsahové (pojmové) jádro věty je možno znázornit jako jakési „zpředmětnění“, na volbě syntaktické struktury nezáleží, pouze na zachování vzájemného vztahu substancí a příznaků. (Je příznačné, že na obsahové rovině mizí rozdíl mezi dějem a vlastností, srov. Dokulilovo tvrzení uvedené výše.) Nejjednodušším, nikoli však závazným znázorněním této úrovně jsou jmenné struktury.
Každá substance má soubor příznaků. Příznaky mohou mít hierarchické uspořádání podle stupně obecnosti, které se pokusím znázornit obrázkem 1. Vysvětlení symbolů: S = substance, P = kategorie (třída) příznaku, p = konečná hodnota příznaku.
Obr. 1 Příklad věcně obsahové hierarchie
Přiřazení příznaku substanci je označeno na obrázku písmenem d, vztah obecnosti písmenem o (tj. vztah mezi kategorií a subkategorií, tedy vztah genus proximum — differentia specifica), přiřazení konečné hodnoty (identifikačního příznaku) písmenem i. Kategorizace substancí (S : S1, S2) připomíná spíše vztah celek — části. Můžeme si ji představit jako skutečné seskupování individuí a předmětů v reálném světě podle kritérií (podle příslušnosti do skupiny). Tak např. tytéž jedince žijící v jednom domě bychom mohli rozdělit jednou do skupin žen a mužů, jindy do skupin obyvatelů jednotlivých poschodí, do skupin podle profesí apod., pokud nás budou zajímat jednotlivé vlastnosti právě těchto skupin lidí. Avšak např. protiklad muž — žena může právě tak dobře zůstat na úrovni vlastnosti (jako hodnoty příznaku pohlaví). Záleží tedy na účelu vypracování kategorizace určité oblasti; podle něho stanovíme výchozí úroveň se souborem substancí, jak ještě dále uvedeme.
Domnívám se, že vzhledem k této relativnosti je nutné rozlišovat systém a jeho fungování nejen ve sféře jazyka, ale též v myšlenkově obsahové rovině, asi tak, jak ukazuje obr. 2 na s. 22.
Pokusíme se dále stanovit obecné typy jednotek, které by vystačily k popisu
[22]
Obr. 2
Pozn. Bližší vysvětlení některých částí obrázku bude následovat. Dvojice „slovo — věta (větná struktura)“ a „pojmenování — výpověď“ je zde chápáno ve smyslu Dokulilově (Dokulil, 1958). „Fungování systému“ se chápe ve smyslu „situační zakotvenosti“ (Dokulil - Daneš, 1958).
věcně obsahových jader lexémů, tj. kategorií substancí a jednotlivých druhů příznaků (jde tedy o okruh problémů týkajících se pole c v tabulce na obr. 2). Protože nás však zajímá především vztah k jejich jazykovému vyjádření (pole a), musíme se zmínit ještě o vlastnostech specifických právě pro jazyk. V „reálném světě“, jak konstatuje Kacnel’son (Materiály, 1976, s. 101), „neexistují v mimojazykové skutečnosti předměty odděleně od procesů, kterých se účastní, ani odděleně od příznaků jim vlastních“.[15] Jazyk však „do jisté míry odděluje to, co je ve skutečnosti samé dáno v živém a pevném svazku“ (tamtéž), „stanoví někdy distinkce, které v mimojazykové realitě přesně neexistují“, a ty „musí být chápány jako strukturace, které člověk cestou jazyka zavádí do reality“ (Coseriu - Geckeler, 1974). Proto se v jazykové slovní zásobě setkáváme jak s lexémy vyjadřujícími základní substance odděleně od příznaků (např. člověk) — v níže uvedeném přehledu typ 1, tak s lexémy vyjadřujícími odděleně pouze příznaky (národnost) — typ 2, 3, 4, tak i s lexémy, v nichž je spojen přímo význam substance i jejího příznaku — typ 5. Pro poslední typ srov. Kacnel’sonův příklad slova otec: toto slovo představuje osobu („živý předmět“), která je však charakterizována příznakem vztahu k nejbližšímu potomstvu. Podobně Dokulil (1962) mluví v takovém případě o jednoduchém onomaziologickém příznaku, který je přisuzován bezintenčně (zpěvák, učitel). Uvedené typy srov. tab. 1 na s. 23.
Použijme dále jako ilustraci poznatky získané při práci na vytváření počítačového dotazovacího systému DOSYS.[16] Účelem tohoto systému je automatické zodpovídání dotazů formulovaných v češtině na základě komunikace s bází dat. Platí tedy zásady popsané výše, podle nichž má být výsledkem analýzy dotazu takový soubor údajů, který se může porovnávat s informacemi uloženými v bázi dat (tedy věcně obsahové jádro dotazu), a na základě toho může být vydána odpověď obsahující věcné sdělení, které uživatel systému požaduje. Jelikož má tedy systém zachytit pouze relevantní věcné informace (na rozdíl např. od systémů strojového překladu, kde je třeba zachovávat nejen obsahovou, ale i formální analogii všech jednotek vstupního i výstupního jazyka), nemusí lingvistická analýza obsáhnout všechny úrovně jazyka. [23]Zahrnuje pouze identifikaci těch jevů v jazykovém sdělení (dotazu), které jsou nezbytné k stanovenému účelu. Analýza má dvě hlavní východiska. Jednak se opírá o co největší využití slovníkových informací (analýza lexikální), jednak o zjišťování strukturních vztahů mezi slovními jednotkami sdělení (analýza strukturní). Postupy vypracované analýzy jsou podrobněji popsány jinde.[17] Dotazovací systém DOSYS je prozatím určen pro dvě tematické oblasti: pro přijímací řízení studentů na Karlově univerzitě a pro lékařskou oblast rodinné anamnézy pacientů s některými vybranými chorobami.
Tab. 1 | |||
Typy věcně obsahových jader lexémů | |||
Význam symbolů jako u obr. 1, symbol § označuje kategoriálnost, třídu. | |||
Typ 1. | § S |
| kategorie substance (živé, neživé) |
Typ 2. | § P |
| kategorie příznaku (vlastnosti) |
Typ 3. | § PP (PP ⊂ P) |
| subkategorie příznaku (vlastnosti), tj. sama je též |
| § PPP (PPP ⊂ PP) | kategorií; PP ⊂ P čti PP je subkategorií P | |
| atd. |
| |
Typ 4. | P = p |
|
|
| PP = p | konečná hodnota příznaku, nekategoriální, | |
| PPP = p | identifikační | |
| atd. |
| |
Typ 5. | § S + (P = p) |
|
|
| § S + (PP = p) |
| |
| atd. | kategorie substance přímo charakterizovaná | |
| § S + (PP ⊂ P) | příznakem (kategoriálním nebo konečným) | |
| § S + (PPP ⊂ PP) |
| |
| atd. |
|
Obr. 3
[24]Pro informaci uvedeme část pojmové hierarchie z oblasti přijímacího řízení. Zde byla jako entita určena osoba studenta (označíme ji X) se souborem vlastností, které označíme pro naše příklady takto: A — forma studia, B a C — fakulta a obor, na něž se student hlásí, D — věk, E — národnost, F — pohlaví, G — kraj, odkud student přichází, H — délka praxe, I — výchozí škola, J — výsledek přijímací zkoušky, K — výsledek přijímacího řízení atd. Některé z těchto kategorií se dělí na subkategorie, viz obr. 3 na s. 23.
Ve slovníku mají lexémy této tematické oblasti kromě údajů o slovním druhu též zápis věcně obsahového jádra podle výše uvedených obecných typů 1—5. Např. student: § X; fakulta, obor, kraj, národnost: § B, § C, § G, § E; český: § GG1 (GG1 ⊂ G)/E = český (tato jednotka je homonymní, označuje buď kategorii krajů, nebo konkrétní údaj o národnosti); Jihočeský: GG1 = jihočeský; Slovák: § X + (E = slovenský) (tj. student, jehož národnost je slovenská); přijímací řízení: §K; přijat: KK1 = přijat; přijat na 2. odvolání: KK3 = přijat; (výsledek) 1. odvolání: § KK2 (KK2 ⊂ K); vyjádření děkana: § KKK1 (KKK1 ⊂ KK2); matematický (obor): § CC1 (CC1 ⊂ C); teoretická kybernetika: CC1 = 11088 (číslo oboru) atd.
Hierarchii v rámci typu 5 můžeme lépe ilustrovat zjednodušeným příkladem z oblasti zoologie představovaným např. lexémy savec — šelma — kočka — lev, kde jde o přímé spojení substance (§ S — zvíře) s příznakem (§ P — fyziologické vlastnosti zvířat) v jedné lexikální jednotce:
savec: | § S + (PP ⊂ P) |
šelma: | § S + (PPP ⊂ PP) |
kočka: | § S + (PPPP ⊂ PPP) |
lev: | § S + (PPPP = p) |
Jde-li však pouze o vlastnosti (odděleně od substance), dostávají samy kategoriální příznak; lexémy kočkovitý, kočkovitost, vlastnosti koček aj. mají zápis § PPPP (PPPP ⊂ PPP), vlastnosti savců, savcovitost aj. § PP (PP ⊂ P), obecně vyjádřeno § Pn (Pn ⊂ Pn—1). Přitom se předpokládá, že známe-li např. příznak PPPP, je dosažitelný pomocí soupisů příznaků nejen přímo nadřazený příznak PPP, nýbrž i PP a P.
Je-li v tematické oblasti substancí více, musí se stanovit vztahy mezi nimi. Např. v lékařské oblasti byla jako substance určena osoba pacienta (jako substance základní) a osoba příbuzného, která byla identifikována pomocí substance pacienta (svým vztahem k pacientovi). U lexémů vyjadřujících substance musí být tento vzájemný vztah též vyjádřen (např. zápisem X → Y, označujícím, která ze substancí je základní). Z hlediska věcného obsahu je ovšem možno namítnout, že jednotka příbuzný (označíme § Y) je rovněž charakterizována určitým příznakem a je podkategorií pojmu člověk; podobně je tomu u označení student (‚člověk, který studuje‘), pacient (‚člověk, který je nemocen‘), takže by měly být zapsány jako typ 5, např. § S + (P = p). Ale při konkrétním zpracování tematických oblastí nemá toto nejvyšší zobecnění obvykle praktický smysl; začíná se většinou až na rovině dvou nebo několika entit (substancí), viz na obr. 1 přerušovanou čáru. Stanovení entit je dáno tím, že každá z nich má soubor vlastností, které nás z daného hlediska zajímají. Vlastnosti, které nás nezajímají, můžeme ponechat stranou. Budeme-li chtít např. popisovat slovní zásobu potřebnou pro komunikaci o světě ptáků, můžeme jako základní substanci zvolit pojem pták a zabývat se dále bližší klasifikací, aniž bychom brali pro daný popis v úvahu, že ptáci jsou podkategorií obratlovců apod.
Z uvedeného vyplývá, jak bylo výše naznačeno, že v jednotlivých zkoumaných oblastech máme již co dělat s konkrétními představami pojmů různých skupin komunikujících lidí, s funkčním využitím pojmové soustavy, tedy s polem g v tabulce z obr. 2, a na základě toho s připisováním konkrétních obsahů jazykovým jednotkám (vztah představy k pojmenování — viz pole g a e tabulky).
[25]Zbývá si povšimnout toho, jak lze z tohoto zorného úhlu obecně popsat substančně příznakové struktury (viz pole d na obr. 2), tj. věcně obsahová jádra vět.
Na základě práce s lingvistickou analýzou z oblasti přijímacího řízení jsme dospěli k názoru, že substančně příznaková struktura tázacích vět (nebo vět, které jsou z hlediska věcného obsahu s nimi ekvivalentní) má tři základní části: I — typ dotazu (je to označení úkonu, který je nutno provést pro zodpovězení dotazu), II — informační centrum dotazu (tj. věcně obsahová třída, která je v centru zájmu tazatele, o níž se chce něco dovědět), III — tzv. podmínky (tj. vyjádření věcného obsahu všech ostatních relevantních údajů dotazu).
Všimněme si, jaké je z hlediska zachycení věcného obsahu dotazů rozvrstvení slovní zásoby ve slovníku oblasti přijímacího řízení.[18] Slovník obsahuje následující druhy jednotek:
(1.) lexémy nesoucí relevantní informaci o substancích a jejich příznacích (tj. představující realizované typy věcně obsahových jader 1—5, viz přehled uvedený výše);
(2.) lexémy sloužící k vyjádření vzájemných vztahů lexémů skupiny 1 a mající tyto konkrétní funkce:
a) připojují k sobě těsněji nebo méně těsně jednotlivé lexémy skupiny 1 (jsou to např. výrazy a, a zároveň, nebo, jak — tak aj.),
b) srovnávají lexémy skupiny 1 mezi sebou (méně, více, jiný, právě tolik aj.),
c) podávají kvantifikační charakteristiku lexémů skupiny 1 (žádný, každý, jednotlivý, alespoň, maximálně, pouze, dva, tři aj.);
(3.) lexémy typické pro větné typy otázek, vyjadřující, jaký úkon má být za účelem zodpovězení dotazu proveden (kde — seznam, který — seznam, kolik — počet, zda — ano/ne, odkud — seznam aj.), tedy označující podrobnější klasifikaci doplňovacích a zjišťovacích otázek;
(4.) lexémy s pomocnou funkcí, sloužící pouze k rozpoznání struktur jednotlivých významových úseků dotazu (většina sloves, vztažná zájmena, předložky aj.);
(5.) lexémy, o nichž se předpokládá, že se v dotazech příslušného oboru mohou vyskytnout, ale pro věcný obsah nejsou relevantní; mají zvláštní označení a při vlastní analýze dotazu se s nimi již nepracuje.
Pouze údaje reprezentované lexémy skupiny 1, 2 a 3 se objeví ve věcně obsahovém zápisu dotazu.
Uveďme několik příkladů dotazů s konečnými zápisy jejich věcně obsahového jádra (myšlenky) po lexikální i strukturní analýze (srov. pole h na obr. 2).
(1) | Z kterých krajů jsou studenti, kteří se hlásí na denní studium právnické fakulty a kteří jsou doporučeni zkušební komisí? |
Pro účely tohoto článku nás nezajímá metoda a pravidla lingvistické analýzy systému DOSYS. Podotkněme pouze, že k věcně obsahovému zápisu se dospělo analýzou na základě jazykové reprezentace dotazu, a to dokumentuje, že obsahové kategorie jsou vyvoditelné (rozpoznatelné) pomocí jazykových prostředků a že zde existují spojitosti, i když o jejich systémovém charakteru zatím mnoho nevíme. Uvedeme rovnou výsledný zápis věcně obsahového jádra:
I: | seznam |
II: | G |
III: | A = denní & B = právn. fakulta & J = doporučen |
G, A, B, J jsou kategoriální věcně obsahové třídy označující vlastnosti vztahující se v této tematické oblasti k osobě studenta.
Interpretace záznamu: Žádám, aby byl vyhotoven seznam krajů (G), z nichž se [26]hlásí studenti s těmito vlastnostmi: forma studia (A) je denní, fakulta (B) je právnická, vyjádření zkušební komise (J) je „doporučen“.
Táž fakta tvořící věcný obsah dotazu mohou mít rozmanité jazykové vyjádření[19] (srovnej výše srovnání s propozicí):
(2) | Z kterých krajů přicházejí zájemci o denní studium PF, kteří jsou doporučeni zkušební komisí? |
(3) | Z jakých krajů jsou studenti, kteří se přihlašují na denní studium PF a které zkušební komise doporučuje? |
(4) | Chtěl bych vědět, z kterých krajů jsou studenti hlásící se na formu denního studia a na PF, kteří byli doporučeni při přijímací zkoušce? |
(5) | Z kterých krajů se hlásí uchazeči o denní studium na právech, kteří mají od zkušební komise vyjádření doporučen? |
(6) | Žádám seznam krajů, z nichž se hlásí zájemci o denní studium na PF s výsledkem přijímací zkoušky doporučen. |
Všechny tyto dotazy mají po průchodu algoritmem lingvistické analýzy systému DOSYS týž výše uvedený věcně obsahový zápis.[20] U následujícího dotazu však nelze mluvit o obsahové totožnosti s předešlými, fakta jsou pozměněna:
(7) | Z kterých krajů jsou chlapci, kteří se hlásí na denní studium na filozofické fakultě a mají doporučení? |
Věcný obsah tu byl pozměněn ve třech ohledech. Za prvé lexikální jednotka chlapci přináší informaci navíc, osoba studenta je zde blíže charakterizována příznakem pohlaví, v našem případě podmínkou pohlaví = muž. Za druhé údaj právnická je zaměněn věcně zcela odlišným údajem filozofická. A konečně za třetí je v dané oblasti výraz doporučení bez bližšího určení nedostatečný; student totiž může dostat doporučení od zkušební komise, nebo z výchozí střední školy, a to je již jiná věcně obsahová třída. Sám výraz doporučení je tu tedy dvojznačný. V dotazech (1) až (6) je vyřešena obsahová homonymie výrazu doporučení pomocí kontextu (doporučení od zkušební komise, výsledek přijímací zkoušky doporučen).
Opět si tu uvědomujeme dynamičnost, závislost na kontextu situace, zrelativnění, k němuž dochází při funkčních aplikacích. Uveďme ještě další příklad. Při pozměněném obsahu dotazu (7) jsme upozornili, že změna výrazu student na chlapec s sebou nese obohacení o příznak pohlaví = muž. Tak tomu je např. v oblasti přijímacího řízení, kde se příznak pohlaví explicitně rozlišuje. Představíme-li si však oblast, v níž jsou zahrnuti pouze muži, budou tu výrazy student a muž rovnocenné, neboť se příznak pohlaví = muž automaticky předpokládá. Jazyk svou pružností podobné předpoklady umožňuje.[21] A tak se v představách pojmů zachycují pouze ty příznaky, které dané společenství lidí považuje za relevantní, a stačí, aby pouze ony byly ve slovníku konkrétní dílčí oblasti zahrnuty.
Jiné příklady dotazů a jejich věcně obsahových jader:
(8) | Kolik procent z uchazečů o studium na filozofické fakultě tvoří dívky přicházející z gymnázií? |
[27]I: | výpočet procent |
II. | X |
III: | B = FF & F = žena & I = gymnázium |
(9) | Kolik studentů, kteří se hlásí z gymnázií nebo průmyslovek na MFF, má praxi delší než dva roky? |
I: | počet |
II.: | X |
III: | (I = gymnázium ∨ I = průmyslovka) & B = MFF & H > 2 |
(10) | Jsou na MFF obory, na které se nehlásí žádné ženy? |
I: | zjištění ano/ne |
II: | C |
III: | B = MFF & X (ø: F = žena) |
Co se týče slovního druhu lexikálních jednotek podílejících se na zápisu věcně obsahového jádra dotazu, lze konstatovat, že věcnou informaci o daném úseku světa nesou ve velké většině jména (substantiva, adjektiva). Slovesa slouží uvnitř jednotlivých tematických oblastí vzhledem k předpokládanému zde kontextu často jen jako spojení příznaku se substancí. Tak např. v oblasti přijímacího řízení nemají pro konečný záznam význam slovesa hlásit se, přihlašovat se, přicházet, absolvovat, bydlet, dostat a většina ostatních sloves, jejichž výskyt se v dotazech předpokládá a kterých se využívá pouze při strukturní analýze dotazů pro nalezení jednotlivých významových úseků (při stanovení „co k čemu patří“), srovnej ve výše uvedeném přehledu slovníkových jednotek skupinu 4. Podobnou funkci plní často přídavná jména slovesná, předložky, některé spojky, vztažná zájmena aj. Pokud však mají některé lexikální jednotky uvedených slovních druhů nebo tvarů v příslušném tematickém úseku z hlediska věcného obsahu relevantní úlohu, zapisují se jako ostatní příznaky. (Srov. konstatování M. Dokulila (1962), že lze slovesa chápat na obsahové úrovni rovněž jako příznaky substancí.) Tak např. jako hodnoty věcně obsahové třídy „vyjádření zkušební komise“ vystupují lexikální jednotky doporučen, zvažuje se, nedoporučen.[22] Rozdíly v gramatických významech času a modality, o nichž jsme se zmiňovali výše, neměly v systému DOSYS pro zachycení věcně obsahového jádra důležitost; pokud by však takový údaj z hlediska daného účelu relevantní byl, dá se snadno zachytit v podobě různě modifikovaných variant dějových příznaků.
Závěr: Práce na slovníku a lingvistické analýze v dotazovacím systému DOSYS ukázala, že algoritmickým rozborem českých vět (dotazů) je možno dospět k věcně obsahovému jádru, nezávislému na volbě konkrétního jazykového vyjádření dotazu, nebo lépe řečeno společnému pro rozmanitá obsahově synonymní jazyková vyjádření; toto věcně obsahové jádro můžeme popsat pomocí substancí, jejich vlastností a vztahu mezi substancemi. Poznatky získané tímto způsobem v podstatě empirickým mají tedy svůj dílčí přínos i pro sám jazykový výzkum. Ukazuje se, že nejenom lingvistika má důležitou úlohu při tvorbě počítačových aplikačních systémů, ale i naopak — použité exaktní metody mohou přispět k zevrubnějšímu poznání některých lingvistických jevů, struktur a vztahů, které nebývají navenek zcela zřetelné.
Domnívám se, že nejschůdnější cesta k postupnému poznávání obsahové roviny vede přes popis jednotlivých dílčích úseků světa. Obecné typy věcně obsahových jader lexémů by mohly posloužit v lexikografické práci jako nejobecnější charakteristika. Teoreticky si lze představit, že by bylo možno po věcně obsahové stránce [28]budovat popis jednoho lexému postupným skládáním věcně obsahových jader téhož lexému v různých tematických oblastech, za předpokladu, že by každá oblast měla své konkrétní obsazení věcně obsahových tříd substancí a příznaků s příslušnou hierarchií za použití týchž obecných typů věcně obsahových jader. Různé znalosti (myšlenky) o dílčích oblastech je možno pak chápat jako konkrétní projev obecných obsahových substančně příznakových struktur. Zde se vracím k předpokládané analogii jazyka a myšlení znázorněné na obr. 2. Podobně jako mají věty na jedné straně svá strukturní pravidla a na druhé straně nekonečný počet situačně zakotvených rozmanitých výskytů, tak se i omezený soubor substančně příznakových struktur realizuje mnohotvárně v konkrétních výskytech uvnitř jednotlivých dílčích úseků reálného světa.
LITERATURA
BĚLIČOVÁ-KŘÍŽKOVÁ, H.: Sémantická struktura věty, tzv. hloubková struktura a intence slovesného děje. SaS, 41, 1980, s. 265—273.
BURÁŇOVÁ, E. - ECKHARDT, P. - MACHOVÁ, S. - ŘÍHA, A.: The question-answering system on a simple database. Computers and artificial intelligence, 1, 1982, s. 409—417.
BURÁŇOVÁ, E. - MACHOVÁ, S.: Automatický dotazovací systém pro přijímací řízení na Univerzitě Karlově. Automatizované informační a řídící systémy ve školství, 1984, č. 5, s. 51—63.
COSERIU, E. - GECKELER, H.: Linguistics and semantics. In: Current trends in linguistics, 12. Hague - Paris 1974, s. 103—171.
DANEŠ, F. - HLAVSA, Z. - KOŘENSKÝ, J. a kol.: Práce o sémantické struktuře věty. Praha 1973.
DOKULIL, M.: Tvoření slov v češtině. I. Teorie odvozování slov. Praha 1962.
DOKULIL, M.: Zum wechselseitigen Verhältnis zwischen Wortbildung und Syntax. TLP, 1, 1966, s. 215—224.
DOKULIL, M. - DANEŠ, F.: K tzv. významové a mluvnické stavbě věty. In: O vědeckém poznání soudobých jazyků. Praha 1958, s. 231—246.
GECKELER, H.: Strukturelle Semantik und Wortfeldtheorie. München 1971.
GREIMAS, A. J.: Sémantique structurale. Paris 1971.
GULYGA, E. V. - ŠENDEL’S, E. I.: O komponentnom analize značimych jedinic jazyka. In: Principy i metody semantičeskich issledovanij. Moskva 1976, s. 291—314.
HORÁLEK, K.: K pojmu „ostenze“. SaS, 34, 1973, s. 27—29.
HORÁLEK, K.: Sémantika a gramatika. SaS, 36, 1975, s. 81—83.
HORECKÝ, J.: Sémantické príznaky a ich typológia. In: Sémantický seminár 1979/80. Ústav pre informácie a riadenie kultúry. Bratislava 1980, s. 72—85.
KACNEL’SON, S. D.: Tipologija jazyka i rečevoje myšlenije. Leningrad 1972.
KOŘENSKÝ, J.: Slovo, věta, onomaziologická kategorie. SaS, 33, 1972, s. 193—198.
LEISI, E.: Der Wortinhalt. Heidelberg 1961.
LEXIKOGRAFICKÝ KOLEKTIV ÚJČ: K výkladovým postojům v jednojazyčné lexikografii. SaS, 36, 1975, s. 84—91.
MACHOVÁ, S.: Meaning of lexical units in computer dictionaries. In: International conference on meaning and lexicography. Ed. J. Tomaszczyk - B. Lewandowska-Tomaszczyk. Łodż 1985, s. 52—56.
MATERIÁLY PRO PŘÍPRAVU NOVÉ VĚDECKÉ MLUVNICE SPISOVNÉ ČEŠTINY. Praha 1976. Interní tisk ÚJČ ČSAV. (Dále Materiály.)
NĚMEC, I.: Jazykové ztvárnění psychického odrazu skutečnosti v lexikální význam. SaS, 41, 1980, s. 26—31.
PROBLEME DER SEMANTISCHEN ANALYSE. Ed. D. Viehweger. Studia grammatica, XV. Berlin 1977.
SGALL, P. - PANEVOVÁ, J.: Obsah, význam a gramatika se sémantickou bází. SaS, 37, 1976, s. 14—25.
[29]SGALL, P.: Teoretická lingvistika ve věku počítačů. SaS, 44, 1983, s. 305—311.
ŠOLTYS, O.: Ke vztahu predikace a centrace. SaS, 47, 1986, s. 1—15.
ŠTĚPÁN, J.: O pojmenování barev a jeho využití v současné češtině. SaS, 44, 1983, s. 22—29.
TĚŠITELOVÁ, M. a kol.: Psaná a mluvená odborná čeština z kvantitativního hlediska. Linguistica IV. Praha 1983. Interní tisk ÚJČ ČSAV.
TĚŠITELOVÁ, M. - BUDOVIČOVÁ, V. - DOKULIL, M.: II. mezinárodní lingvistické symposion v Magdeburce. SaS, 26, 1965, s. 191—200.
R É S U M É
Необходимо отличать значение, связанное всегда с языковой формой, от вещественного содержания как нелингвистической категории. Одна из возможностей, как приблизиться к познанию уровня вещественного содержания — это попытаться описать внеязыковую реальность с привлечением категории субстанции и категории признака. Под субстанцией здесь имеется ввиду живой или неживой материальный объект, а под признаком — свойство, которое человек приписывает субстанции на основании органов чувств, или на основании мышления. Главное внимание в настоящей статье посвящается отношению между проявлением вещественного содержания с помощью этих категорий и языковым выражением, иными словами, определяется так наз. вещественно содержательное ядро как в лексемах, так и в структурах предложения. При этом используется опыт, полученный при работе над автоматической вопросной системой, разрабатываемой в Вычислительном центре на Математико-физическом факультете. Предлагается пять общих типов вещественно содержательных ядер лексем и субстантно признаковая структура вопросительных предложений. Результаты анализа приводят к выводу, что в когнитивной сфере, подобно тому, как и в языке, необходимо различать существование системы как таковой и то, как она действует. За наиболее приемлемый путь к познанию уровня содержания можно считать постепенное описание отдельных тематических областей. Вещественно содержательные типы понятий здесь проявляются как конкретные представления отдельных групп людей при коммуникации. Подобным же образом ограниченный репертуар субстантно признаковых структур многообразно реализуется внутри отдельных тематических областей в конкретных употреблениях.
[1] Srov. vyjádření Horeckého (1980), že ke spolehlivým sémantickým příznakům je možno dospět tak, že se hledá opora ve formálních prvcích přirozeného jazyka.
[2] Např. již u Dokulila - Daneše (1958) čteme, že se obsah (jakožto odraz skutečnosti ve vědomí) teprve prostřednictvím mluvnické formy transformuje v jazykový význam.
[3] Tak např. Běličová-Křížková (1980) konstatuje zájem o zjišťování izomorfismu mezi způsoby jazykového ztvárnění a strukturací myšlenkových obsahů, Gulyga - Šendel’s (1976) se zmiňují o snahách určovat ve větě nejen sémantické vztahy, ale i bezprostřední odraz situací mimojazykové skutečnosti, a podobně jiní.
[4] Viz např. Greimasův propracovaný sémiologický systém (Greimas, 1971).
[5] Podle Meiera je noém nejmenší jednotka noetického, pojmového plánu komunikačního procesu. Podle charakteristiky Horeckého patří noémy do předsémantické oblasti, jsou to jazykově nerelevantní pojmové abstraktní elementy, kdežto sémy patří do jazykového znaku.
[6] Hodnotnou charakteristiku podává Němec (1980, s. 29): „Psychický odraz skutečnosti je jazykově ztvárněn v lexikální význam tím, že její vyabstrahované rysy potřebné k dorozumění mezi uživateli daného jazyka tento jazyk kategoriálně vyjadřuje svými prostředky formálními.“
[7] Jde tu o jiný význam slova „vnitřní“, než jak se používá v oblasti tvoření slov, kde „vnitřní jazyková forma” znamená sémanticky motivovanou, etymologickou stránku lexikálních jednotek.
[8] „Pojem jakožto výsledek kognitivního vztahu člověka k vnějšímu světu neodráží všechno z předmětu, ale jen jeho podstatné vlastnosti, stránky, vztahy ve formě příznaků“ (Probleme der semantischen Analyse, 1977, s. 29).
[9] Termín lexém používám v témže smyslu jako např. Coseriu (Coseriu - Geckeler, 1974): odpovídá jednomu pojmu, avšak jeden pojem může být vyjádřen více slovy.
[10] O způsobu jazykové (lexikální, větné) realizace onomaziologických kategorií viz též Kořenský (1972). Lexikografický kolektiv ÚJČ při práci na lexikografických výkladech jednotek jednojazyčných slovníků (Lexikografický kolektiv, 1975) věnuje pozornost zachycování onomaziologických příznaků a pojmové hierarchie.
[11] Hmotný předmět živý i neživý (substance) lze charakterizovat i pomocí jiného předmětu, v podobě okolnostního určení, které se tak stává příznakem (např. rozlišujeme-li vozidla s motorem a bez motoru). Předměty jsou tedy substance, avšak mohou fungovat i v roli příznaku, kdežto nemateriální jevy mohou být pouze příznakem (děje, vztahy, vlastnosti). Historický vývoj od označování vlastností pomocí konkrétních předmětů až k abstraktnímu nezávislému označení ukazuje výstižně na příkladu pojmenování barev J. Štěpán (1983).
[12] Takto soudí např. Gulyga - Šendel’s (1976). Podle jejich názoru musí jít v takových větách o konkrétní substantiva a slovesa s konkrétním dějem, jinak jde již o abstrakci různého stupně.
[13] Propozice je označována též jako sémantický základ věty (extrakt) (Teoretické základy, 1975), „konfigurace sémanticky usouvztažněných lexémů“ (Adamec, Materiály), „sémantická konfigurace aktantů“ (Hlavsa, Materiály) ap. Podle Horálka (1975) vyjadřuje propozice věcný obsah, který zůstává nezměněn při různém postoji mluvčího k vyjadřování skutečnosti. Podle Šoltyse (1986) patří propozice do roviny myšlenkových obsahů.
[14] Klíčovým problémem popisu větné sémantiky je proto sloveso a jeho sémantická valence, jak ukazují Daneš - Hlavsa - Kořenský a kol. (1973).
[15] Leisi (1961) upozorňuje, že při použití ostenzívní definice (Zeigdefinition) můžeme na něco ukázat se slovy to je zelené, avšak neukazujeme přitom na vlastnost, nýbrž na předmět, podobně jako nelze izolovaně ukazovat na činnosti, ale jen na bytosti činnosti vykonávající. K ostenzi viz Horálek (1973).
[16] Tento systém je vytvářen ve Výpočetním centru UK při matematicko-fyzikální fakultě v Praze, viz např. Buráňová - Eckhardt - Machová - Říha (1982).
[17] Viz např. Buráňová - Machová (1984); zde je též rámcově charakterizován systém DOSYS a jeho hlavní složky.
[18] O principech vytváření slovníku v rámci tematické oblasti pojednává Machová (1985).
[19] Tím je míněno jak synonymní vyjádření lexikální, tak použití různých syntaktických forem. Srov. konstatování M. Dokulila (1966), že větné členy nemají bezprostřední souvislost s myšlenkovými obsahy, ale označují je nepřímo.
[20] Přestože pro účely systému DOSYS byly analyzovány pouze věty otázkového typu, je zřejmé, že bychom stejným způsobem dostali věcně obsahový zápis indikativních vět, který se v podstatě shoduje se zápisem zjišťovacích otázek (s vynecháním příznaku otázkové operace ano/ne).
[21] Sgall (1983) upozorňuje na to, že k charakteristickým vlastnostem přirozeného jazyka patří jeho volnost, mluvčí může redukovat své sdělení, ví-li, že mu bude porozuměno.
[22] To, že je ve zkoumaných oblastech přijímacího řízení a lékařské rodinné anamnézy takových relevantních sloves málo, souvisí též se specializovanou povahou tematických oblastí. Těšitelová (1983) upozorňuje, že se v lexiku odborného jazyka významně uplatňuje z hlediska kvalitativního i kvantitativního právě jméno.
Slovo a slovesnost, ročník 48 (1987), číslo 1, s. 18-29
Předchozí Simeon Romportl: K pojetí teorie a metodologie přirozeného jazyka
Následující Jiří Nekvapil, Jiří Zeman: Sémiotické poznámky ke vzniku českých písňových textů
© 2011 – HTML 4.01 – CSS 2.1