Časopis Slovo a slovesnost
en cz

O perspektivách lingvistiky jako empirické vědy

Nikolaj Savický

[Články]

(pdf)

О перспективах лингвистики как эмпирической науки / Les perspectives de la linguistique comme une science empirique

V mnoha strukturalistických a generativistických konstrukcích vystupuje apriorní spekulace do té míry do popředí, že to nutí k úvahám o návratu k předvědeckému scholastickému typu myšlení. Ostatně v poslední době nechybí ani otevřené volání po návratu k tradicím středověké scholastiky.

Tento návrat apriorismu má zřejmě dvojí příčiny — jednak ideologické, jednak lingvistické v užším smyslu.

Snahy o rehabilitaci otevřeně idealistického přístupu k jazyku jsou zpravidla samými autory explicitně vyhlašovány — nejnověji jde o „neokarteziánství“, v němž čistě spekulativní metoda našla své nejadekvátnější vyjádření.

Složitější je otázka po vnitřně jazykovědných příčinách popularity těchto návratů k předvědecké minulosti. Svou úlohu zde nepochybně hraje relativní vyčerpanost empirických faktů o jazycích, zejm. indoevropských. Někdy se zdá, že všechna podstatná fakta o těchto jazycích, přístupná empirickému pozorování, jsou již popsána a nezbývá, než se věnovat snahám o pochopení jejich „hlubšího smyslu“, což lze dělat libovolným způsobem, a tudíž libovolně dlouho. V radikální podobě toto vysvětlení přijímá např. W. Mańczak, který soustavně poukazuje na apriorismus systémů F. de Saussura, L. Hjelmsleva i N. Chomského a vysvětluje popularitu těchto systémů tím, že „jazykovědci jsou v mnohem větší míře než lékaři nebo astronomové vystaveni pokušení zabývat se zdánlivými problémy, neboť počet reálných nevyřešených problémů se s pokrokem jazykovědy neúprosně zmenšuje, zatímco zástupy jazykovědců stále rostou“.[1] Při četbě lingvistické produkce je často těžké se ubránit dojmu, že Mańczak má v podstatě pravdu. Přece však soudím, že rozdíl mezi situací v přírodních vědách a v jazykovědě není tak velký, jak se Mańczakovi jeví. Pokud jde o množství faktů, které čekají na objevení, jsou na tom přírodní vědy o něco hůře, jazykověda a příbuzné obory o něco lépe, než soudí.

Kompetentní fyzikové a jiní přírodovědci, když uvažují o perspektivách svých oborů, často konstatují, že všechno, co bylo lze objevit snadno, bylo již objeveno, a nyní probíhá pronikání do oblastí těžko přístupných — do oblastí velmi vysokých tlaků, teplot, rychlostí, objektů z lidského hlediska velmi malých nebo velmi velkých, — což vše vyžaduje mj. velmi nákladná zařízení.

V jazykovědě je situace ve skutečnosti analogická; existuje oblast frekventovaných jevů, která je dobře popsána, a oblast jevů málo frekventovaných, často ojedinělých (oblast, vyznačující se, jak uvidíme dále, proměnlivým obsahem, ale trvale velkým rozsahem), která popsána není.

V československé lingvistice, kde tradice racionálně empirického přístupu k jazykovým jevům jsou velmi silné, jsou tyto skutečnosti vcelku dobře známy; zdá se mi však, že z nich nebyly vyvozeny závěry natolik explicitní, že by mohly sloužit jako prostředek orientace v metodologických zmatcích, jimiž už dlouho prochází světová, zejména západní jazykověda.

O existenci oblasti nepopsaných jevů ve slovní zásobě se můžeme přesvědčit jednoduchým experimentem: vezměme jakkoli velký slovník a jakýkoli text, který nebyl při zpracování tohoto slovníku využit — najdeme v textu slova, která ve slovníku nejsou.

Neomezený růst počtu jednotek při rozšiřování zkoumaného textu vyplývá z po[200]znatků kvantitativní lingvistiky. Slova s frekvencí 1 a 2 tvoří asi polovinu hesláře jak při zkoumání poměrně malých výběrů,[2] tak i při zkoumání velkého korpusu.[3]

Tuto skutečnost lze vyvodit i ze Zipfova zákona o (přibližné) konstantnosti součinu ranku a frekvence slova, pokud interpretaci tohoto zákona nebanalizujeme tím, že všem slovům o stejné frekvenci n připisujeme jednotně rank jen o jednu jednotku vyšší, než všem slovům o frekvenci n — 1. Při takové interpretaci nám totiž součin r.f u velkých skupin slov se stejnou frekvencí prudce klesá a celý zákon pro slova s nízkou frekvencí ztrácí smysl.[4] Tomuto paradoxu se lze patrně poměrně snadno vyhnout tím, že za rank slov s nízkou frekvencí budeme považovat průměrné pořadové číslo skupiny slov o stejné frekvenci. Formulace takto upravená je pak práva závažnosti té skutečnosti, že čím nižší frekvence, tím více slov tuto frekvenci vykazuje.

Sama tato skutečnost pak nutí k úvaze o plynulosti hranice mezi hapax a „normálním“ slovem. V tomto „nízkofrekvenčním pásmu“ se můžeme ovšem poprvé setkat i s neologismy, které v budoucnosti čeká „závratná kariéra“. Rozšíření zkoumaného korpusu vyřeší některé takové problémy, nastolí však ještě více nových. Význam tohoto „nízkofrekvenčního pásma“ s jeho vnitřní dynamikou uniká mj. i Mańczakovi, který připisuje velký význam kvantitativním charakteristikám jazyka a dovede je v mnoha případech zajímavým způsobem využívat, evidentně však podceňuje právě kvantitativně zachytitelnou rozmanitost jazyka.

Lexikografovi, který pracuje na velkém slovníku, je existence obrovského množství dosud nepopsaných jazykových faktů každodenní skutečností. Nejde přitom jen o nová málo frekventovaná slova, ale i o nové, málo frekventované významy slov, jejichž významy frekventovanější jsou již popsány. Přitom je třeba si uvědomit, že např. mezi okazionální metaforou a ustáleným samostatným významem slova existuje plynulá stupnice přechodů. Ojediněle zaregistrované významy vytvářejí stejné problémy jako ojediněle zaregistrovaná slova.

Stejně jako jednotlivá slova, tak i velké gramatické třídy (slovní druhy, slovotvorné typy, morfologické kategorie, větné konstrukce …) mají bohatou polysémii statisticky diferencovanou (významy nejčastější, časté, řídké, ojedinělé, …). Normální cestou vědeckého poznání je postupný přechod od častých a popsaných významů k významům méně častým — postupné obohacování popisu. Skutečný vývoj však nejde vždy touto cestou. Spor mezi aprioristickou představou o dokonalé vzájemné korespondenci formy a funkce v gramatice na straně jedné a empirickým poznáním variabilnosti významů na všech úrovních struktury jazyka na straně druhé trvá již po staletí. Je velmi poučné sledovat vývoj snahy vyrovnat se s fakty, které narušují požadovanou jednotu významu slovních druhů (od antiky a středověku, přes gramatiku Port-Royal, k Jespersenovi, Kuryłowiczovi a dnešním teoretikům nominalizací, i ke skepsi Chomského), např. s vývojem nauky o bezvýjimečnosti hláskoslovných změn; na jedné straně pohyb ve svém celku značně erratický, na druhé straně kumulativní pokrok poznání. Srov. dále slova J. Zubatého z r. 1901: „Také otázkou (se zabývá Delbrück), je-li pro jednotlivé tvary mluvnické předpokládati vždy i původní jednotný význam. I tato otázka patří k oněm, k nimž jazykozpyt rád odpovídá ne výsledkem vědeckého soudu, nýbrž aprioristickým theorematem. Jazykozpyt dlouho vězel, a z veliké míry posud vězí v předsudku, že jednotnost tvaru předpokládá jednotnost významu; a kde není této, že bývala původně.“[5]

[201]I dnes se objevují práce obhajující realistický přístup, nedávno např. zajímavý článek P. Nováka,[6] převládá však tendence znovu tuto polysémii zcela popřít ve prospěch „invariantních významů“, popř. transformačními operacemi ji vymanévrovat ze zorného pole.

Analyzujeme-li mnohovýznamnost takových starých slov bez zřetelných znaků odvozenosti, jako čes. cesta, práce, rus. puť, chod, starořec. hodos, ergon, která mají význam jak předmětu, tak děje, zkoumáme tím dílčí případy mnohovýznamnosti substantiv jako slovního druhu. Skutečnost, že tyto druhy významu se vyskytují u téhož (neodvozeného) slova, ukazuje současně, že výskyt dějového nebo nedějového významu není jednoznačně určen slovotvornou strukturou.

Dále, chceme-li pokročit kupředu v analýze sémantiky slovních druhů, musíme překročit rámec klasické (v podstatě aristotelovské) trojice (nebo čtveřice) pojmů: „předmět“ („substance“), „děj“, „vlastnost“, popř. zbytková kategorie „vztahu“ nebo „okolnosti“. Takovéto překročení může probíhat pouze induktivně, postupem od významů jednotlivých slov. Požadujeme-li např., aby takové skupiny slov, jako čas, doba, období, byly ve slovníku popsány jednotně, postulujeme tím rovněž jeden z dílčích významů substantiv jako slovního druhu — sémantický okruh „časový úsek“, dále vnitřně strukturovaný podle takových příznaků jako opakovanost - jednorázovost, konstantní délka - proměnlivá délka apod., které se objevují jako diferenční znaky v sémantice jednotlivých slov i celé skupiny. Existenci této sémantické diferencovanosti substantiv (která, opakuji, není jednoznačně podmíněna slovotvornou strukturou, nejde tedy o výsledek „nominalizací“ v jakémkoliv ověřitelném smyslu) můžeme sledovat libovolně daleko do minulosti indoevropských jazyků, pokud je přístupna našemu pozorování.

Existují ovšem i sémantické okruhy slov a gramatických prostředků, které se v čase výrazně vyvíjejí a diferencují — nejdůležitější mezi nimi je patrně skupina lexikálních a gramatických prostředků pro vyjadřování způsobů existence a platnosti obecných zákonitostí pohybu hmoty v přírodě a lidské společnosti.

Reálné obohacování jazyka (na rozdíl od samoúčelného vytváření jazykových novot) probíhá paralelně ve všech živých jazycích. Toto je jeden z projevů charakteru přirozených jazyků jako univerzálních vyjadřovacích systémů, který opětovně zdůrazňuje K. Horálek, jenž rovněž upozornil na závažnou skutečnost, že sémantické korespondence mezi jazyky se prosazují především u prvků, jejichž sémantika je založena na racionálním poznání skutečnosti, které je odvozeno z empirie a kontrolováno praxí.[7] K tomu je možno dodat, že to, co nedovedeme přeložit do jiného jazyka, nedovedeme zpravidla ani parafrázovat v daném jazyce; schopnost „vyjádřit něco jinými slovy“ je však jediným spolehlivým kritériem pochopení sémantiky výrazu. To, co se nedá přeložit ani parafrázovat, je buď slovní hříčka, nebo výraz o sémantice v širokém smyslu interjekcionální, tj. takové, která je určována výhradně momentální situací — srov. neobratnost všech pokusů vykládat nebo překládat citoslovce.

Objektivnost sémantické analýzy ať již jednotlivých slov či gramatických útvarů můžeme tedy zajistit jen tehdy, stojíme-li na stanovisku primárnosti věcných obsahů. Jazyk je především prostředek praktické komunikace mezi lidmi a musí být stejně diferencovaný jako oblasti praktické činnosti člověka. Při rozšiřování oblasti praktické činnosti do hloubky (jemnější diferencování jevů, pochopení hlubších souvislostí mezi nimi) i do šířky diferencuje se i jazyk. Nemůže být tudíž žádný zásadní rozdíl mezi bohatstvím poznaných jevů ve vesmíru a bohatstvím sémantické struktury jazyka — jedno se odráží v druhém. Jde „jen“ o to, nezavírat programově oči před tímto bohatstvím ve prospěch aprioristických schémat.

 

[202]R É S U M É

О перспективах лингвистики как эмпирической науки

Ответ на вопрос, является ли возврат к априоризму в языкознании неизбежным следствием того, что все эмпирические данные о языке уже исчерпаны, следует искать в области низкочастотных явлений, в частности из области лексики и грамматической семантики. Здесь зарождаются новые факты языка и новые данные яазыкознания.


[1] W. Mańczak, Z zagadnień językoznawstwa ogólnego, Wrocław—Warszawa—Kraków 1970, s. 315, překl. N. S.

[2] Srov. M. Těšitelová, Otázky lexikální statistiky, Praha 1974, s. 52—54, 67—68 aj.

[3] V práci J. Jelínek — J. V. Bečka — M. Těšitelová, Frekvence slov, slovních druhů a tvarů v českém jazyce, Praha 1961, nacházíme na s. 28 tyto souhrnné údaje: celkem bylo zjištěno 54 486 různých slov, z toho frekvenci 2 mělo 7 762 slov, frekvenci 1 mělo 20 467 slov.

[4] Srov. M. Těšitelová, o. c., s. 82: „… skutečná platnost konstantnosti výrazu r.f se týká pouze toho úseku jednotek, kde se rank slova kryje s pořadím“. Srov. též tab. 43 na s. 230—231.

[5] J. Zubatý, Srovnávací skladba jazyků indoevropských, Studie a články II, Praha 1954, s. 22—23.

[6] P. Novák, O „klamu“ gramatické formy, SaS 34, 1973, 146—149.

[7] K. Horálek, Filozofie jazyka, Praha 1967, s. 92.

Slovo a slovesnost, ročník 39 (1978), číslo 3-4, s. 199-202

Předchozí Jaroslav Popela: K Stěpanovovým postulátům současné lingvistiky

Následující † Bohuslav Havránek: Logizující a psychologizující typ rozboru jazykového vyjadřování