Časopis Slovo a slovesnost
en cz

K užívání matematických pojmů v lingvistice

Petr Sgall

[Kronika]

(pdf)

О применении математических понятий в лингвистике / Sur l’emploi des concepts mathématiques en linguistique

Rychle vzrůstající zájem o uplatnění matematických postupů v jazykovědě není u nás dosud podložen systematickou matematickou erudicí lingvistů, ani soustavnou prací většího počtu zkušených matematiků. Rozvoj tzv. matematické lingvistiky postupuje zatím často spíš do šířky než do hloubky, a to ovšem není nejlepší základ pro budování nových lingvistických oborů; přináší to i nebezpečí různých „dětských nemocí“. O jedné z nich psal nedávno Fr. Zítek,[1] který ukázal, že nemá velký význam uplatňování matematických postupů bez předchozí přesné formulace lingvistického problému. Jiní matematikové zase upozorňují na to, že nejvhodnějším směrem ve vzájemné spolupráci matematiky a lingvistiky není ani konstruování různých matematických systémů a studium jejích formálních vlastností, pokud není jasno o významu těchto systémů pro samo studium jazyků.

Chceme se v této glose zastavit u jiného aspektu některých statí z matematické lingvistiky, který považujeme za nevhodný průvodní rys rozvoje tohoto oboru; jde o to, že se užívá výrazů přejatých z matematiky, ale nedodržují se přitom matematické zvyklosti omezující možnosti jejich užívání, tzn. přejímají se právě výrazy, a nikoli matematické pojmy jim odpovídající. Matematické pojmy jsou obvykle pevně začleněny do určitých pojmových soustav; kdybychom si zvykli užívat volněji jen příslušných termínů — bez důsledného respektování vztahů mezi pojmy v takové soustavě —, mohlo by to ve svých důsledcích vést k tomu, že by tyto termíny dostaly v lingvistice nové lexikální funkce, ale co do vztahu k matematice by naznačovaly jen jakési analogie (jako termíny kmen, rodina ap., které jsou památkou na období, kdy důležitou metodologickou inspiraci poskytovala jazykovědě biologie); nebo by takové terminologické výpůjčky zůstaly bez ustáleného lingvistického významu jako prostředky svědčící jen o jistém dobovém ovzduší ve vývoji naší vědy.

Takové volnější užívání jednotlivých výrazů převzatých z matematiky bychom patrně mohli doložit z nejrůznějších ling[84]vistických statí orientovaných na uplatnění nejnovějších metod. U některých slov (např. model) je ostatně situace taková, že zřejmě bude třeba smířit se s tím, že jejich význam v lingvistice je jiný než v matematice. U slov jako izomorfismus lze doufat, že volnější, nematematické užívání opět ustoupí.

Obtížnější je situace tam, kde se programově tvoří terminologie určitých úseků matematické lingvistiky. Zde je jistě vhodné vybírat přejímané výrazy co nejpečlivěji. Z tohoto hlediska nejsou podle našeho názoru např. v stylistice nejšťastněji voleny výrazy jazyková konstanta a stylistická proměnná, které nedávno navrhl L. Doležel.[2] Jde tu o určité „charakteristiky“ (snad lépe parametry) sdělení, z nichž první jsou „udržovány na stabilních hodnotách, které nevykazují statisticky významnou fluktuaci“ (např. rozložení četností písmen, ev. fonémů), kdežto druhé takovou fluktuaci vykazují. Obsah těchto vymezení je celkem jasný, není však jasné, proč se volí právě uvedené termíny. Užívá-li se tu slova proměnná ve smyslu „proměnné veličiny“,[3] pak je důležité, že kontrast proměnná-konstanta v tomto smyslu je korelativní: nejenže „jazykové konstanty“ jsou „proměnnými“ z hlediska obecné lingvistiky, ale právě část „stylistických proměnných“ je v uved. článku považována za konstantní pro daný styl. Nebylo by pak lépe mluvit buď o „jazykových konstantách“ a „jazykových proměnných“, nebo spíš o „konstantách jazykových, stylových“ atd.? Tím by se jasněji dalo najevo, že nejde o rozdíl mezi „proměnnými“ a „konstantními“ jako dvěma druhy veličin (vždyť konstanta je v tomto smyslu jen zvláštním mezním případem proměnné), nýbrž o zjištění, které parametry jsou charakteristické pro jazyk, které pro styl aj. Potřeba pečlivé analýzy je v takových případech o to naléhavější, že v matematice má termín „proměnná“ řadu významů značně odlišných.[4]

I když jazykové jevy, o které tu jde, byly např. v pražské škole známy už dřív,[5] jistě je jejich soustavné studium dnes aktuální a určité doplnění dosavadní terminologie je na místě. Mohly by však být zvoleny výrazy vhodnější. Podobně i užívání termínů jako axióm (s. 1; nepůjde spíš o definici?) není zatím dostatečně podloženo.

Nebylo by snad třeba se u otázek tohoto druhu zastavovat, kdyby nešlo o programovou práci, která má naši matematickou lingvistiku reprezentovat na mezinárodním fóru a zároveň i před odborníky jiných věd (zejm. literární teorie) a která přesto obsahuje vedle uvedeného sporného způsobu vyjadřování i nepřesnosti věcné. Charakteristika tří „etap procesu kódování“ na s. 2—3 není totiž [85]v souhlasu se současnými poznatky teoretické lingvistiky v několika věcech:

a) Generativní gramatika není a nechce být modelem činnosti mluvčího, popř. její etapy; jak je známo právě z prací N. Chomského, jde tu jen o matematické vymezení množiny gramaticky správných vět, spojené s přiřazením strukturních ukazatelů jednotlivým větám. Generativní systém může být chápán jako popis určitého aparátu, který má mluvčí k dispozici, ale ne přímo jako popis některé části sdělovacího procesu (fungování jazyka). Jistě je aktuálním úkolem další studium činnosti mluvčího, jejích jednotlivých složek, popř. i formulace takového generativního systému, který by měl blíže k formálnímu popisu určitých složek činnosti mluvčího (zejm. k popisu jeho jazykových znalostí). Ale jedním ze základních předpokladů práce na takových aktuálních úkolech je to, že budeme odhalovat rozdíl v položení těchto otázek.

b) „Proces syntézy větných celků z množiny vyhledaných slov — základů“ nemůže postupovat podle pravidel generativní gramatiky, už proto ne, že generativní gramatika (zejm. v té podobě, jakou charakterizuje Chomského kniha na uved. místě citovaná) je formulována tak, že derivace věty postupuje naopak od výběru určité větné stavby k výběru lexikálních jednotek; formulace větného celku mluvčím má zřejmě časový postup jiný, než je uvedený postup derivace věty podle generativní gramatiky.

c) O uvedených třech „etapách“ se na s. 2 říká, že jsou „patrně paralelní“, což už samo ukazuje nevýstižnost slova „etapa“, nehledě k tomu, že i sám počet těchto „etap“ je jistě sporný; vychází spíše z tradičního členění lingvistiky a pomíjí problematiku některých úseků, které by mohly být považovány za další „etapy“ (např. kontextové členění).

Modelem generativní gramatiky není „program pro determinovaný automat“, jak se předpokládá na s. 3. Matematická teorie automatů, která se těmito otázkami zabývá, všímá si automatů jako abstraktně vzatých matematických systémů, nikoli tedy samočinných počítačů s určitými fyzikálními vlastnostmi (pro které se sestavují programy atd.). Závažnější ovšem je, že pravidla generativní gramatiky (snad kromě zvláštních případů, jež bychom sotva nazvali gramatikou) nemají „deterministickou povahu“, nýbrž naopak, často umožňují i volbu pokračování,[6] a bývají proto zpravidla konfrontována právě s automaty indeterministickými (např. co do své generativní síly). Pravidla gramatická nelze proto na tomto podkladě oddělovat od jiných pravidel výběru jazykových prostředků. Statistický popis stylistických jevů by odpovídal automatu pravděpodobnostnímu,[7] ale je možné představit si i generativní systém, který by tuto podmínku také splňoval, ačkoli by v něm stylistické jevy přímo popisovány nebyly (byly by jen přiřazeny pravděpodobnosti jednotlivým fakultativním nebo alternativním pravidlům).[8] Na druhé straně není jisté, že tzv. třetí „etapa“ může být popsána „pouze za pomoci modelů statistické povahy“; jisté je jen to, že dosáhnout v této oblasti vyšších cílů je přinejmenším nesmírně obtížné.

Nejde mi zde však o polemiku. Chtěl jsem především upozornit, že pro uplatnění matematických metod v jazykovědě je přesnost vyjadřování a jeho shoda s matematickým nutným předpokladem.


[1] Fr. Zítek, Aplikace matematiky v lingvistice a některé jejich „dětské nemoci“, Čs. rusistika 9, 1964, 113—116 (k čl. Č. Nováčka, tamže 8, 1963). — Otázkou matematických a matematickolingvistických termínů, o které se zmiňujeme dále, se u nás zabýval P. Novák, K vytváření terminologie matematické lingvistiky, Čs. terminologický časopis 2, 1963, 234—237.

[2] Ve svém příspěvku předneseném na V. mezin. sjezdu slavistů v Sofii a otištěném v časop. Česká literatura 12, 1964, č. 1, 1—8; rozšířené znění (v bodech, o které nám zde jde, nezměněné) přinesly VJaz 13, 1964, č. 2, 19—29.

[3] M. Katětov, Jaká je logická výstavba matematiky, Praha 1950, 70—72.

[4] Ze šesti významů rozlišených K. Mengerem ve studii A Counterpart of Occam’s Razor in Pure and Applied Mathematics — Ontological Uses, Synthese 12, 1960, 415—428, přichází tu podle našeho názoru v úvahu jen význam (2), týkající se výroků o funkcích; je charakteristické, že Menger sám v tomto významu užívá slova nonconstant, nikoli variable; srov. též M. Mačavariani, O vzaimootnošenii matematiki i lingvistiki, VJaz 12, 1963, č. 3, s. 87.

[5] Viz zejm. N. Trubetzkoy, Grundzüge der Phonologie, TCLP 7, 1939, s. 233 o tom, že délka významových jednotek je (z hlediska statistiky) podmíněna stylem, kdežto frekvence fonémů nikoli. Úvahy obsažené na následujících stránkách Trubeckého díla mají také pro kvantitativní lingvistiku dosud svou důležitost; domyšleny např. ukazují, že vztah mezi frekvencí fonému (popř. grafému) a jeho kombinatorními schopnostmi sotva lze charakterizovat tak, jak to činí L. Doležel a J. Průcha v SaS 25, 1964, s. 166; nejen směr, ale i bezprostřednost závislosti je tu přinejmenším sporná, a postulovaný „základní zákon“ by patrně měl být hodnocen střízlivěji.

[6] Jinak by nebyla možná např. pravidla typu  ap., s kterými je možno se setkat v kterékoli práci o generativních gramatikách.

[7] Viz nyní M. O. Rabin, Probabilistic Automata, Information and Control 6, 1963, 230—245.

[8] Srov. nyní I. I. Revzin, VJaz 13, 1964, č. 3, s. 147, kde se tyto pravděpodobnosti spojují dost přímočaře se stupněm gramatické správnosti.

Slovo a slovesnost, ročník 26 (1965), číslo 1, s. 83-85

Předchozí Vlasta Straková: Sborník prací o otázkách slovanské lingvistické terminologie

Následující Emanuel Michálek: Studie o českých pozemkových knihách 16. a 17. století