Časopis Slovo a slovesnost
en cz

Ještě k jednomu modelu jazykového kódování

Lubomír Doležel

[Články]

(pdf)

Еще по поводу одной модели языкового кодирования / Une fois de plus à propos d’un modèle du codage linguistique

V několika svých posledních pracích, zejména pak v stati Model stylistické složky jazykového kódování (SaS 26, 1965, 223—235) jsem se pokusil o formální vymezení základních pojmů teoretické stylistiky, vycházeje přitom z pojetí pražské školy a z Mathesiových myšlenek o jazykovém kódování (tj. produkování jazykových sdělení mluvčím). Cílem mých pokusů je nalézt takový matematicko-logický model, který by umožnil zobrazit vzájemné vztahy a působení těchto elementárních pojmů teoretické stylistiky: výběrové alternativy, objektivní a subjektivní faktory kódování, stylové charakteristiky. K tomu jsem navrhl model náhodného automatu, jsa si ovšem vědom toho, že sama matematická teorie tohoto typu je nejen velmi složitá, ale také nedostatečně rozpracovaná. Měl jsem přitom na mysli rovněž možnost, že by někdy v budoucnu mohlo být mého návrhu využito v konstrukci syntetického modelu všech složek jazykového kódování v jednotné terminologii abstraktních automatů (různých typů). Protože sám nejsem matematikem, omezil jsem se v podstatě jen na návrh modelu a jeho lingvistickou interpretaci, přejímaje přitom elementární poučení o náhodných automatech z dostupných pramenů. Další rozvinutí formální stránky modelu (jež je ovšem předpokladem jeho celkového rozpracování) spadá především do kompetence matematika.

Rozbor, který mé koncepci, a zejména citovanému článku, věnoval P. Novák (SaS 27, 1966, 29—40), přináší řadu cenných dílčích připomínek a zpřesnění. Novákův soustavný zájem o mé práce je proto v zásadě stimulující a napomáhá mi k přesnějšímu formulování koncepce. To platí především o těch oddílech rozboru, které sám Novák označuje jako „spíše popisné“ (tj. odd. 1, 2.1, 2.2, 3.2). Vedle toho však Novák formuluje kritické námitky proti mé koncepci, které sám považuje za „zásadní“ (jsou obsaženy zejm. v odd. 2.3, 2.4 a 3.1). Závěrečný oddíl pak obsahuje úvahu, která má odpovědět na otázku, proč — podle Nováka — došlo v mých pracích k závažným „nedorozuměním“.

Chtěl bych se ve své odpovědi soustředit především na Novákovy „zásadní“ výtky (v uvedených oddílech). Předtím však bych chtěl zaujmout stanovisko k interpretaci pojmu selekce. Je třeba přiznat, že v mé stati se termínu selekce užívá v dvojím smyslu; jednak ve smyslu konkrétního výběrového aktu, jednak v obecném smyslu „přiřazení pravděpodobnosti výskytu jednotlivým výběrovým alternativám“. Třebaže bude napříště třeba tyto dva významy terminologicky rozlišit, není myslím pochyb o tom, o který význam může jít v pravděpodobnostním modelu selekce. Podstatou selekce je přiřazení pravděpodobnosti výskytu výběrovým alternativám; toto rozložení pravděpodobnosti pak jednoznačně (v statistickém smyslu) určuje výsledky konkrétních výběrových aktů.[1] [237]Ta platí i o známém urnovém modelu připomínaném Novákem: teorii pravděpodobnosti nezajímá, jakou kouli vyberu v konkrétním výběrovém aktu, nýbrž to, jaké je rozložení pravděpodobnosti jednotlivých výsledků pokusu. Ve smyslu tohoto výkladu ovšem nedovedu pochopit, proč můj popis selekce jako „transformace abecedy alternativ A v náhodnou proměnnou ω (A) s určitým rozložením pravděpodobností“ podle Nováka spíše „mate“, když předtím Novák sám popsal selekci jako „přiřazení pravděpodobnosti výskytu“ jednotlivým výběrovým alternativám. Nehledě na toto nedorozumění, shodujeme se snad nyní s Novákem v tom, že pravděpodobnostnímu modelu selekce nemůže jít o zobrazení konkrétní výběrové situace, nýbrž o zobrazení obecných podmínek, za nichž konkrétní výběrové akty probíhají. Avšak obraťme se nyní k Novákovým kritickým připomínkám „zásadním“:

1. Novák odmítá možnost navrhnout náhodný automat jako model stylistické selekce poukazem na to, že takový automat by fungoval zcela jinak, než jak by měl fungovat. V odd. 2.32 uvádí příklad výběru ze tří alternativ (ze synonym: Honza, klouček, uličník); po třech krocích „za udaných podmínek“ generuje automat na výstupu řetěz Honza uličník klouček, a to s pravděpodobností 1/3 . 1/3 . 2/5 = 2/45. „Na tomto příkladě vidíme, že formální systém funguje zcela jinak, než by podle D-ova předchozího neformálního popisu stylistické složky jazykového kódování měl. Místo výběru jednoho prvku z abecedy alternativ … generuje řetězy z prvků abecedy alternativ.“ Přitom však v odd. 2.41 Novák cituje tento můj předpoklad o fungování automatu: „Po n krocích generuje selektor řetězec symbolů o délce n, který se vyznačuje určitým rozložením pravděpodobností ω (A).“ Srovnáme-li tento popis fungování automatu s formulací Novákovou, můžeme být překvapeni jedině pozoruhodnou shodou.

V čem tedy spočívá jádro nedorozumění? Podle mého názoru ve dvou okolnostech: a) Novák trvá na tom, že můj model selekce má být modelem konkrétního výběrového aktu a že by tedy měl zobrazit „výběr jednoho prvku z abecedy alternativ“. Přesně vzato, není ovšem ani tento předpoklad nesplnitelný; automat generuje určitý řetěz prvků z abecedy alternativ právě tím, že při každém kroku (při každém konkrétním výběrovém aktu) vybírá (generuje) jeden prvek na základě určitého rozložení pravděpodobností. To je jeden důsledek tohoto vztahu mezi „selekcí“ jako přiřazením pravděpodobností a „konkrétním výběrovým aktem“, jak jsem ho naznačil výše. Co je však důležitější, v mém modelu selekce, jak již řečeno, nejde o zobrazení konkrétního výběrového aktu; selektor má fungovat tak, aby generoval stylové parametry jako obecná rozložení pravděpodobností alternativ, odpovídající proměnlivým podmínkám kódování. b) Druhý zdroj nedorozumění spočívá podle mého soudu v tom, že Novák ve skutečnosti izoloval model selektoru z celkového schématu jazykového kódování a interpretuje ho tak, jako by selektor sám o sobě měl generovat řetězce totožné s jazykovými sděleními. Jinými slovy, v Novákově interpretaci se stylistický selektor, který funguje jen jako jedna složka jazykového kódování, mění v primitivní generativní gramatiku, jejíž nevhodnost byla dokázána již Chomským.

V duchu mé koncepce by bylo třeba Novákem uvedený příklad vykládat takto: Při kódování sdělení o n slovech generuje selektor m-krát (m < n) prvky z abecedy alternativ Honza, klouček, uličník podle rozložení pravdě[238]podobností, které je určeno vstupní abecedou Q a maticí M (s, q). V kódovaném sdělení se pak budou jmenované prvky vyskytovat s určitým rozložením četností, jež odpovídá (v statistickém smyslu) stylovému parametru generovanému selektorem.

Novák tuší (odd. 2.31), že situace je složitější, než jak ji ve svém příkladu interpretuje. Uvažuje o tom, že by „D. musil mít pro každý akt výběru jiný automat (aspoň s jinou abecedou alternativ a s jinou funkcí Ψ)“. První část úvahy je nepřesná, správná cesta je naznačena v závorce. Posuzováno z hlediska výběrových alternativ, musí být přirozeně pro každou množinu alternativ zadány příslušné funkce. Jedině tak lze vysvětlit, proč se různé stylové charakteristiky, tj. množiny různých jazykových prvků, vyznačují různými rozloženími četností. Zadání příslušných funkcí je nepochybně těžký problém, avšak nedotýká se samé adekvátnosti modelu.

Je příznačné, že Novák zavrhuje naznačený správný výklad pouze subjektivistickým dohadem: „Že si tuto skutečnost (tj. nutnost zadání automatu pro každou množinu alternativ — L. D.) D. neuvědomuje, je vidět z toho, že vůbec neuvažuje, jakým způsobem by tyto automaty byly na sebe napojeny.“ Ve skutečnosti jsem ovšem o zmíněném napojení automatů neuvažoval proto, že jde, jak jistě i Novák uzná, o problém, který je obtížný i pro vyspělého matematika.

Novákovo vytržení selektoru z několikastupňového schématu jazykového kódování lze doložit ještě na dvou jeho „zásadních“ výtkách:

2. Novák vytýká, že v mém modelu nemá svůj protějšek empirická množina E (množina mimojazykových událostí, jež vstupují do operace kódování). Prosté nahlédnutí do mých schémat (s. 225 a 233) by mu však ukázalo, že stylistický selektor nemá žádné přímé spojení s množinou E, a že tedy tato množina nepatří k základním pojmům stylistiky, jež mají být v modelu zobrazeny. Stylistická selekce se týká výběru alternativních jazykových prostředků, nikoli výběru mimojazykových skutečností.[2] Vztahy jazykových prostředků (zejm. denotátů) k množině E je třeba popsat v modelu sémantické etapy kódování. Pokud pak se týká „výběru“ samé množiny E, poznamenal jsem výslovně v pozn. 6, že ji považuji za zadanou působením faktorů, jež leží mimo lingvistickou kompetenci. Zobrazení výběru „událostí“, jež budou ve sdělení zakódovány, nepatří tedy podle mého pojetí do modelu jazykového kódování.

3. Zcela nepochopitelného posunu se Novák dopustil v odd. 3.1. Po správném konstatování, že „stylových charakteristik je velmi mnoho“, Novák klade tuto otázku: „Jak mohou být tyto různé charakteristiky „empirickým obrazem“ D-ových parametrů, které — jak jsme viděli — zachycují pravděpodobnosti výskytu pojmenování mimojazykových událostí?“ (prolož. — L. D.). A dále pokračuje: „Dá se však uznat, že D. vlastně implicitně navrhuje novou stylovou charakteristiku zachycující pravděpodobnosti výskytu alternativních pojmenování (?) a že přirozeně je možné zkoumat em[239]pirické vztahy mezi touto stylovou charakteristikou a styl. charakteristikami jinými.“

Rád bych si přečetl aspoň jedno tvrzení ze svých prací, které opravňuje Nováka k tomu, aby zúžil můj pojem stylového parametru na rozložení pravděpodobností výskytu pojmenování. Novák přešel přinejmenším dvě skutečnosti, v mém článku zcela jasně formulované: a) Množina alternativ je obecná v tom smyslu, že může být interpretována jednak jako množina synonymních pojmenování, jednak jako množina funkčně ekvivalentních syntaktických konstrukcí (viz zejm. s. 224n., 229). b) Selekce má dvě podetapy, z nichž druhá se týká výběru syntaktických konstrukcí, a tedy generuje „syntaktické“ stylové parametry (viz zejm. s. 224n., 233). Novák tedy opět přehlédl elementární skutečnost, že mé schéma kódování má více stupňů. Za těchto okolností ovšem může stylistický selektor generovat jak lexikální, tak syntaktické stylové parametry, přičemž parametry typu „poměr sloveso — adjektivum“ mohou být snadno odvozeny jako rozložení tříd příslušných alternativ.

Závěr. Z uvedených tří poznámek k Novákově kritice nutně plyne závěr, že Novák mou koncepci zkreslil tím, že vytrhl model stylistické selekce z vícestupňového schématu jazykového kódování a interpretoval ho jako primitivní generativní gramatiku. Tento Novákův zásadní postup ovšem vyvolává otázku, jak k tomu mohlo dojít u lingvisty, který svou snahou po maximální přesnosti dovede odhalovat i velmi skryté konfúze.

Domnívám se, že jednou příčinou je jeho apriorní přístup, který mu brání proniknout k podstatě rozebírané práce; zmíněný přístup se téměř nikdy nemůže vyhnout jistému zkreslení.

Druhý důvod Novákova neporozumění je, podle mého názoru, závažnější: Je to metodologický a teoretický monoteismus, který uvádí pojmy a termíny rozebírané soustavy mechanicky na pojmy a termíny jediné, „zadané“ soustavy, resp. interpretuje je ve smyslu této soustavy. V konkrétní situaci naší matematické lingvistiky se metodologický monoteismus projevuje především apriorním odmítáním statistických metod a probabilistních modelů a jednostranným vyzdvihováním určité soustavy generativní gramatiky. Domnívám se však, že zdravý a přirozený vývoj matematické lingvistiky u nás může být zaručen jedině tím, že budou vyhledávány a používány nejrůznější matematické metody a modely, adekvátní analyzované a vykládané jazykové skutečnosti. Oblast stylistiky a jazykové komunikace vůbec, vyznačující se působením složitých a nestabilních faktorů individuálního i sociálního chování,[3] charakterizovaná nepravidelnostmi, odchylkami a deformacemi, je pak zcela nezvládnutelná bez zavedení modelů probabilistních.[4]

 

R É S U M É

More Remarks on a Model of Language Encoding

The consideration of three basic objections, as expressed in P. Novákʼs criticism (cf. SaS 27, 1966, 29—40) of my article A model of the Stylistic Component of Language [240]Encoding (SaS 26, 1965, 223—235), viz (1) refusal ot the probabilistic automaton as a model of stylistic selection, (2) the model lacking representation of the empirical set E, (3) the different stylistic characteristics expressing but the probabilities of occurence of denominations (lexical units) — necessarily leads to the conclusion that Novák altered the sense of my conception by isolating the model of stylistic selection from the multi-level frame of language encoding and interpreting it as a primitive generative grammar. The main reasin of Novákʼs misinterpretation consists, in my opinion, in his methodological and theoretical monotheism, leading him to interpret notions and terms of the analyzed system in notions and terms of a unique given system of linguistic description. When explaining stylistic phenomena, however, the necessity of probabilistic models is quite obvious.


[1] Srov. u Nováka: „Podle přidělených pravděpodobností P (Vi) je později vybrán jediný prvek vi z množiny Vi“ (s. 32).

[2] Tím se zároveň ve své koncepci liším od Mathesiova náznaku, který může být vykládán v tom smyslu, že Mathesius zahrnoval výběr pojmenovávaných „úseků skutečnosti“ do operací kódování promluvy.

[3] Srov. N. Chomsky, Aspects of the Theory of Syntax, M. I. T. Press 1965, s. 4.

[4] Vzhledem ke své delší nepřítomnosti v ČSSR považuji tuto polemiku pro sebe za ukončenou.

Slovo a slovesnost, ročník 27 (1966), číslo 3, s. 236-240

Předchozí Jacob Mey (Oslo): Word-Classes in automatic syntactic analysis

Následující Ľubomír Ďurovič: Nad dielom Alfa Sommerfelta