Časopis Slovo a slovesnost
en cz

Výzkum mluvené češtiny: jeho situace a potřeby

František Čermák, Petr Sgall

[Články]

(pdf)

Research in spoken Czech: its situation and needs

1. Úvod

Mluvená i psaná norma jazyka mají svou sféru primární, prototypickou, i sekundární, více méně periferní (příznakovou). Pro normu mluvenou je primární sférou běžný hovor a vyprávění, zvláště mezi účastníky, kteří se znají, nikoli čtení psaných textů nebo projevy předem připravené nejen obsahově, ale i co do své výrazové formy. S uplatněním pojmů zavedených Garvinem (1994, s. 64) můžeme říct, že základní doménou mluveného jazyka jsou promluvy konverzační, zatímco nejtypičtějším projevem jazyka písemného je tištěný text. Píšeme-li zde o výzkumu mluveného jazyka v dnešní české lingvistice, máme na mysli tuto jeho sféru prototypickou, základní, tedy běžně mluvenou češtinu. I v komunikaci mluvené je možné hledat její standardní podobu, tedy útvar, který užívá nesporně většina českých mluvčích, byť v nestejné míře (nepovažujeme tedy za vhodné označovat všechny nespisovné jevy jako substandardní).

O aktuálnosti výzkumu mluveného jazyka, více však v podobě připomínaných desiderat, se najde zmínek více; od nich a dílčích příspěvků ke skutečnému komplexnímu a rozsáhlému výzkumu je však daleko. Připomeňme si jen ten prostý fakt, že na rozdíl od češtiny psané (spisovné) nemá mluvená čeština k dispozici žádný systematický deskriptivní popis fonologie, morfologie, syntaxe ani lexikonu. Pro upřesnění otázky výzkumu mluveného jazyka je tedy třeba se soustředit jak na jeho kvantitu, především ve smyslu rozsahu záběru a vynaloženého úsilí, tak i na kvalitu, především ve smyslu spolehlivosti a jednoznačnosti užitých kritérií a ovšem i jeho vlastního obsahu. Jasně je přitom třeba odlišovat oblast pravidel a oblast prostředků, přičemž obojí můžou být společné více útvarům, především češtině mluvené a spisovné. Co vše by se dále mělo stát předmětem výzkumu, vedle toho, co je jako manka naznačené výše, je však věcí jak diskuze, tak ovšem i možností. Soustavný výzkum mluvené řeči by měl brát na zřetel hlavní prototypické rysy mluveného jazyka (MJ) proti jazyku psanému (PJ), které lze stručně zachytit např. takto (srov. Čermák, 1987, 1993b a v tisku; Crystal, 1988):

 

1. MJ je časově vázaný, přechodný a dynamicky proměnlivý, s promluvami probíhajícími hic et nunc, a to mj. za fyzické přítomnosti účastníků, především v neformálních a neveřejných situacích.

2. MJ je spontánní, a tato skutečnost i potřeba paralelního přemýšlení při komunikaci proto obvykle znemožňují složitější mluvní strategii a záměr a vedou k méně specifickému lexikonu (nejde-li o odbornou komunikaci), volnějším strukturám, opakování apod.

3. V důsledku průběhu hic et nunc využívají fyzicky přítomní účastníci při MJ i mimojazykových signálů k modifikaci a doplnění sémantické stránky; to pak umožňuje mj. i užití jak vágnějšího slovníku, tak výraznější deixe.

4. Mnoho z odstínů prozodických rysů MJ, které komunikaci modifikují a člení (intonace, rytmus aj.), nemá odpovídající korelát v PJ, a nelze je tudíž ani spolehlivě zapsat.

[16]5. MJ má mnoho prostředků, fonologických, morfologických, lexikálních a dalších, charakteristických jen pro něj, přičemž některé z nich (zvl. kontrakce, emocionální slova včetně nadávek) se nepíšou vůbec, nebo jen omezeně, řada z nich však má zpravidla výrazně více variant. Nejvýraznějšími a velmi rozsáhlými doménami lexikálních prostředků, které jsou např. v psaném spisovném jazyce okrajové nebo zcela chybějí, jsou frazeologie, slang (výrazná většina z obojího se do spisovného jazyka nezařazuje) a univerbizace (nápadná je tu zvlášť velká většina univerbizovaných proprií, která se za spisovná považují málokdy).

6. MJ má z komunikativních funkcí zvlášť blízko k funkci fatické (solidárnost, blízkost aj.), popř. konativní (apelové), je hlavní doménou vyjadřování subjektivního a hodnotícího (evaluativního), zvlášť mezi partnery sociálně rovnocennými.

7. MJ nemá výraznou možnost zpětné vazby a opravení formulace a realizuje se v proudu mluvy plném překrývání více linií, důsledků chyb a přeřeknutí i přeryvů. Důraz na orientující deiktičnost má proto často i typickou podobu výrazného zapojení stereotypů nejrůznějšího druhu.

 

2. Situace

Mnoho bylo ve výzkumu mluvené češtiny (včetně sbírání dokladů pro něj) už od šedesátých let vykonáno na univerzitní půdě.[1] Ještě výrazněji to platí, vezmeme-li v úvahu i zahraniční práce tak či onak (dlouhodobými i krátkými pobyty svých autorů aj.) vázané právě na Karlovu univerzitu.[2] Dnes se důležitost výzkumu různých typů promluv a rozsáhlého sběru dokladů uznává i v AV ČR.[3] Přesto korpus mlu[17]vené češtiny i rozsáhlý počítačový korpus psaných textů (Český národní korpus, ČNK) vznikají převážně na Filozofické fakultě UK, se kterou spolupracují ústavy Fakulty matematicko-fyzikální a Masarykovy univerzity i pracovníci ÚJČ AV ČR. Právě ČNK, do něhož bude korpus mluvené češtiny začleněn, se zřejmě (pro svou rozsáhlost i pro postupně prováděné mluvnické aj. značkování výskytů slov) stane základní bází budoucího výzkumu jazyka.

Pro výzkum vedený v Ústavu pro jazyk český je zjevně spíš charakteristické, že se tu věnuje pozornost vedle psaného jazyka té sféře jazyka mluveného, kterou jsme označili jako příznakovou, totiž připraveným rozhlasovým a jiným projevům ve speciálních situacích. To bylo plně pochopitelné v minulých desetiletích, kdy zejména zásluhou M. Těšitelové byly mluvené projevy aspoň tohoto druhu soustavně zpracovávány zároveň s projevy psanými. Dnes se však předmětem studia postupně a konečně stávají také mluvené projevy primární sféry; i poslední publikace ale stále ukazují spíš na pozornost věnovanou výstavbě promluvy, jejím komunikačním vlastnostem (spontánnost/vázanost, segmentace aj.) nebo populárněji formulovaným radám a návodům, a méně tedy vyjadřovacím prostředkům či snaze o reprezentativnost.[4] Zřetel k hierarchii nespisovných jevů (a jejich vztahu ke spisovným), který tu chybí, by byl pro čtenáře zajímavý i potřebný, protože v každodenním hovoru narážejí na obtíže spojené se vztahem spisovné a obecné češtiny, o kterých se už dlouho ví.[5] Možnost plnějšího lingvistického využití materiálu záslužně shromážděného v práci Müllerové, Hoffmannové a Schneiderové (1992) se tu zatím opomíjí, ačkoli jde o příležitost k přezkoumání Kučerových předpokladů týkajících se oscilace mezi normou spisovné a obecné češtiny a k jejich upřesnění v dnešní situaci.[6]

Závažnost výzkumu mluvené češtiny je, vedle potřeby dospět ke spolehlivému mapování a systematickému popisu této významné oblasti češtiny, dána především tím, že jeho výsledky by mohly být relevantní pro informování mluvčích o různých aspektech rozvrstvení českého národního jazyka, pro poznání skutečných funkcí jeho různých podob a pro další aktivity v oblasti jazykové kultury. K tomu, aby se dosáhlo výsledků směrodatných, je ovšem třeba zpracovat reprezentativní soubory dat dostatečně rozsáhlé, a to z hlediska jazykových prostředků i pravidel užití, aby aspoň jádro zjištěných kvantitativních údajů mělo statistickou platnost a bylo [18]skutečně reprezentativní, jak bylo už kdysi upozorněno.[7] I dnes platí, že tu bude nutná spolupráce s matematiky a že je třeba nejdřív se shodnout jak na obecné metodologii, tak na jednotných zásadách třídění materiálu.

 

3. Některá řešení a problémy

Dnes je zřejmé, že z více důvodů musí jít o zpracování počítačové. Na tom je založena práce J. Šonkové (1995), vzniklá v kontextu zmíněného projektu zpracovávaného na Filozofické fakultě KU. Ta se prozatím soustřeďuje na vytvoření korpusu o 40 000 slovních výskytů, mluvnicky označkovaného a uvedeného do podoby báze dat. V souladu s koncepcí širšího projektu, do něhož patří (viz dál), se s problémem sběru výchozích dat vyrovnává dvojím způsobem: jednak tak, že nevolí ani cestu ankety (která není plně spolehlivá), ani soubor zcela bezprostředních rozhovorů (ve kterých se často hromadí jevy pro otázky rozvrstvení češtiny méně zajímavé), ale iniciuje rozhovory otázkami obecné povahy, formulovanými tak, aby byla stimulována odpověď „co nejpřirozenější“, ne nutně spisovná. Takto se i tematicky a lexikálně míří k co nejobecnějšímu výrazivu.

Už v otázkách se tedy projevuje určitá míra střídání jevů spisovné a obecné češtiny; např. tu chybí protetické v-, jsou tu tvary výhradně spisovné, jako např. instr. plur. s muži nebo gen. sing. odborné literatury, ale zároveň podoby nespisovné, jako různý změny, otcové byli přísný, každej, mladejch lidí. Výběr jednotlivých tvarů by si jistě zasloužil další diskuzi, ale vcelku lze říct, že uvedený postup splnil svůj účel. Autorka vedle toho však pracuje i s autentickými nahrávkami neformálních dialogů bez předem daných tematických omezení, čímž se vyvažuje tematicky usměrňovaný první přístup. K zajímavým autorčiným výsledkům patří zjištění, že 58 % výskytů slovních tvarů v jejím souboru je společných spisovné a obecné češtině. To jen potvrzuje nutnost škálovitého přístupu ke zkoumání dané problematiky, ve kterém je třeba počítat s rozsáhlým průnikem jevů společných mluvenému i psanému jazyku.

Komplex otázek, které bude třeba v souvislosti s výzkumem mluvené češtiny řešit, zahrnuje jak otázky metodologické a koncepční, tak deskriptivní. Vypracování jednotných zásad třídění jevů samotné mluvené češtiny, které je, jak jsme se už zmínili, nezbytným předpokladem výzkumu dostatečně rozsáhlého a soustavného, by mělo být založeno na využití všech dosavadních zkušeností. Bude třeba přihlédnout k výhodám a nevýhodám různých způsobů získávání výchozích dat, tzn. zhodnotit jak postupy založené na anketách (zejm. u Kučery), tak využití plných textů rozhovorů a vyprávění (viz už Kravčišinová a Bednářová, 1968, nověji zejm. Hammer, 1985, 1986, 1993), pokud možno i typově reprezentativních, i iniciujících otázek (jako u Šonkové).

Dalším rozměrem dané problematiky, otevřeným pro diskuzi, jsou otázky týkající se výběru mluvčích. Pro rozsáhlé, statisticky využitelné soubory bude důležité, v jakých proporcích mají být zastoupeni mluvčí z různých skupin. Jedním nezbytným zřetelem je rozdělení geografické: nakolik má jít o mluvčí z Prahy a z různých oblastí Čech i Moravy (protože důležitý bude nejen souhrnný obraz, ale i zřetel [19]k porovnání situace typické pro jednotlivá území).[8] Dále jde o mluvčí s různým stupněm nebo i zaměřením vzdělání (sonda J. Šonkové nasvědčuje tomu, že tyto rozdíly, podobně jako rozdíly pohlaví a věku, nemají na míru užití prostředků toho či onoho z obou kódů podstatný vliv, ale to je třeba v dalším výzkumu ověřovat), s různým povoláním atd.

Podobně bude vhodné na základě dosavadních publikací (např. Sgall et al., 1992;[9] Čermák, 1987, 1993a; Hammer, 1993) a co nejširší diskuze, která tu je velmi žádoucí, znovu zvážit, jak mají být tříděny a v jakých proporcích mají být využívány mluvní situace různého stupně oficiálnosti či veřejné povahy ap. (ale také, jak všechny relevantní situace vymezit a poznat, což je problém). Půjde jak o to, nakolik je jejich využívání možné a spolehlivé, resp. reprezentativní, tak o to, nakolik vybočují (pokud vůbec) z periferní a příznakové podoblasti mluveného jazyka.

Jiným významným problémovým okruhem jsou sociologicky relevantní, ale dost obtížně sledovatelné a proto opomíjené aspekty jako pocity a postoje mluvčích (viz Daneš, 1976; Hronek, 1968), zvl. postoje hodnotící, včetně projevů ne/jistoty a bezpečí vyjadřování, i např. chyby a jejich opravování. Pro studium těchto aspektů, včetně motivace výběru vyjadřovacích prostředků, nestačí statisticky vyhodnocený materiál; je nutné přihlížet tu (jednotlivými hlubšími sondami aj.) k individuálním podmínkám. V dnešní situaci češtiny by např. byla zajímavá otázka, jak se snaha (třeba přemrštěná) užívat v okolí dítěte (ze strany matky, v jeslích, školkách apod.) i v běžném hovoru jen (nebo co nejvíc) tvary spisovné projevuje ve svých důsledcích v úzu dítěte i později, popř. i v dospělosti.

Podstatným ohledem, dnes aktuálnějším zřejmě než jindy, je ovšem i ohled ekonomický. Zpracovávají-li se dnes rozsáhlé počítačové textové korpusy (Český národní korpus si klade za nepříliš vzdálený cíl rozsah aspoň 100 miliónů slov), pak to jsou jazykové zdroje v podstatě jen textové, a tedy většinou psaného jazyka. Pořídit však korpus mluveného jazyka je mnohonásobně, řádově dražší, a proto jsou takové soubory i v zahraničí k dispozici zatím jen v omezené míře (srov. Čermák, 1995). Dokud nebudou k dispozici prostředky k automatickému převodu zvukové stránky jazyka do psané a počítačově čitelné podoby, je proto třeba „dobře hospodařit“ už při volbě sond a povahy menších korpusů mluveného jazyka.[10]

Závažný soubor otázek se týká vlastního lingvistického třídění hláskoslovných, tvaroslovných i syntaktických a lexikálních jevů a s tím souvisejících otázek distribuce jazykových prostředků. Chtěli bychom tu ilustrovat některé náročnější body [20]možností tohoto třídění, vycházejíce z té jeho podoby, která se zatím uplatňuje při vytváření počítačového korpusu mluvené češtiny v Ústavu bohemistických studií Filozofické fakulty UK. Jejich pojetí a podoba jsou v řadě případů ovšem dány specifickým počítačovým záznamem (zvláště ve smyslu potřeby jednoznačného zařazování charakteristik způsobem „ano-ne“, zatím bez možnosti škálovitého přístupu) a primárním, ne však jediným, cílem získat tak frekvence základního lexikonu češtiny, v češtině vlastně poprvé (o potřebě škálovitého přístupu však srov. výš).

Oba druhy sledovaných kategorií, systémové a textové, byly proti tradičním přístupům obohaceny a/nebo modifikovány. Vedle běžných systémových kategorií (jako vid slovesa, rod substantiva či druh zájmena) se sleduje navíc zvlášť široká sémantika substantiv (rozlišují se osoba od živočicha a věci konkrétní či abstraktní, a to i s ohledem na ne/počitatelnost) a především, z jiného hlediska, jednoslovnost a víceslovnost (u všech slovních druhů včetně proprií, v propojení s frazeologií). Proti základní kategorizaci deseti slovních druhů se tu takto pracuje s třinácti kategoriemi: vedle 10 slovních druhů jsou vyčleňovány a řazeny zvlášť citátové výrazy cizojazyčné, neslovní zkratky a frazémy a idiomy (přičemž gramatické frazémy se začleňují jako subtypy k slovním druhům). Zároveň bylo nutné v návaznosti na zesílený a konsekventní důraz na funkci (viz též dál) přehodnotit a reklasifikovat jak jednotlivé přechodné případy na hranicích více slovních druhů, tak i některé rozsáhlejší partie slov (výrazně byla přehodnocena a rozšířena zvláště kategorie partikulí, mající v mluveném jazyce dominantní postavení).

Další kategorie, ať už určené přímo textovými výskyty či dané volbou a realizací systémového potenciálu, zahrnují, spolu s běžnými kategoriemi typu pád, číslo, slovesný rod aj., systematicky sledovanou valenci (kromě citoslovcí u všech slovních druhů) a v zásadě distribučně pojatou syntaktickou funkci (např. u adjektiv se mj. odlišuje funkce atributivní od predikátové).

Pokud jde o jevy v plném smyslu textové, má každá klasifikovaná položka jako poslední určení rys označený jako styl; vedle skutečně určované textové platnosti položky (tj. jako (1) základní = mluvené a neformální, (2) neutrální = mluvené i psané, (3) knižní a (4) vulgární = tabuové), byť v nestejné míře, bude na výstupu cílem zjistit mj. prolínání stylu zde označovaného jako základní a neutrální.

Podstatným faktorem, který výběr sledovaných jevů omezil, je skutečnost, málo dosud reflektovaná, že prostředky tradiční větné syntaxe nestačí na polověty a nejrůznější, často nedokončené a víceznačné, struktury mluveného projevu a že je tu třeba vyvinout přístupy nové: syntax je jiná než ve spisovné češtině především v tom, že samy hranice věty jsou, proti (ve smyslu mathesiovském) nominativním celkům, nezřetelné. Ani zde jejich vyznačení nechybí vždy, ale je třeba obecně zvážit, zda a jak by bylo vhodné uplatnit přístup počítající s několika stupni místo pouhého „ano/ne“.

Vzhledem k těmto obtížím muselo zatím být upuštěno od sledování větné syntaxe na úrovni větněčlenské kategorizace, jež je v jednotlivých přístupech velmi rozkolísaná. Mnohé lze ovšem pro syntax, byť v jiném smyslu, rekonstruovat právě z důsledně pokryté valence, jejíž všestranný popis zatím naopak chybí u češtiny spisovné. V jiném ohledu, daném mnohonásobným častým překrýváním a neutralizacemi, bylo nutné zavést prakticky u každé sledované položky i možnost „nelze [21]určit“ (potenciálně tak vzniká zásobárna materiálu pro jemnější budoucí teorie, kterými lze pak tato „odsunutá řešení“ znovu otevřít). Vlastní otázky fonetické si tento projekt za cíl neklade, i když nahraný materiál je zvláště vhodný např. pro sledování suprasegmentálních aspektů.

Počítačovým okódováním se každému textovému tvaru v nahrávkách přiřazuje sled čísel zachycující jeho platnost i jeho lemmata (lemma stylové, tj. v zásadě mluvené či spisovné podle platnosti textového tvaru, i lemma spisovné, to zvl. jako společný jmenovatel kvůli umožnění i souhrnných statistik všech stylů dohromady). Příklad uvádíme v tab. na s. 25, kde např. kód 587863-2711, platný pro kombinaci tvarů by a řekly (v korpusu jsou jako celky traktovány a koindexovány jak gramatické kombinace tvarů, tak frazémy), označuje platnost obou tvarů jakožto: verbum (5), patřící mezi perfektiva mutační s agensem (8), s valencí subjektovou i valencí nesubjektovou neakuzativní (78), ve tvaru 3. osoby plurálu (6) prézentního kondicionálu aktíva (3), v platnosti finitní (-) a víceslovné nezvratné formě (2) ve femininu plurálu (7), a to v kladné podobě (1) v základním stylu (1); pochází z nahrávky ZVBF 51 (tj. č. 51 od ženské starší mluvčí základního vzdělání ve formálním rozhovoru).

Důležitý je ovšem předpoklad dobré datové základny. V daném přístupu, s úspěchem ověřeném už na nizozemštině (de Jong, 1979, na základě vývodů řady sociolingvistů), s ohledem na nesmírnou nákladnost pořízení mluvených dat a potřebu jejich reprezentativní podoby a množství, se při získávání dat vychází z několika obecných předpokladů:

(1) jazyk obyvatel hlavního města, resp. metropole, je vždy jiný než u ostatních oblastí a je určitým průsečíkem a zároveň vzhledem ke „koncentrické“ migraci obvykle i nejbohatším zdrojem smíšení geograficky různých útvarů a druhů jazyka bez monolitní převahy jednoho z nich (i když situace Prahy je do určité míry specifická);

(2) přijatelným a v daných okolnostech získatelným minimem je půl miliónu textových slov (zde začíná většina frekvenčních slovníků jiných jazyků);

(3) k zajištění autentičnosti, reprezentativnosti (především ve smyslu tematické nenáhodnosti, příznačné pro veškerá data dosavadní) a minimálně přijatelné variability nahraných textů je možné kombinovat data získávaná jak řízeným způsobem (širokými tematicky návodnými otázkami, jde o tzv. formální nahrávku, viz výše mj. problém stylu těchto otázek), tak způsobem neřízeným (tzv. neformální nahrávky, tj. tematicky neomezené, neurčené, výlučně však mezi mluvčími, kteří se vzájemně znají, kvůli zajištění jisté otevřenosti); zároveň je nutné sledovat různost úzu mluvčích podle věku, pohlaví, vzdělání a místního původu.

Teprve podrobné zpracování zásad výzkumu, beroucí v úvahu všechny zmíněné aspekty (a jistě i řadu dalších, které se v diskuzích už vynořily nebo ještě vynoří), umožní výzkum dostatečného rozsahu a úrovně, který naše bohemistika potřebuje. Jak jsme uvedli, úplnější poznání mluvené normy může být užitečné zejména pro jazykovou kulturu češtiny, a to ovšem češtiny psané i mluvené (bez zužování jazykové kultury pouze na otázku spisovnosti). Nechceme přece, aby do spisovné normy dále pronikaly „nemluvné“, více méně knižní tvary (ať už původu hyperkorektního nebo jiného) a aby se jí mluvčí vyhýbali, vedle pocitu nejistoty, i z tohoto [22]důvodu.[11] Neměli bychom se tedy při posuzování, zda ten či onen tvar má být za spisovný považován, orientovat převážně na postoje mluvčích snažících se o spisovné vyjadřování, které často navíc ve všech detailech neovládají, dnes mj. také v důsledku nešťastného rozkolísání normy, které jde zčásti na vrub poslední pravopisné úpravy. Má-li se spisovná čeština (zejména pro účely orální komunikace) postupně zbavovat přemíry knižních prvků, pak by mělo kritérium „mluvnosti“ tvarů, tedy především jejich přítomnosti v prototypických komunikačních situacích mluvené češtiny, výrazně nabýt na důležitosti.[12]

Podstatné ovšem je, že by naše jazyková kultura měla důsledněji pokračovat ve směru nastoupeném už na začátku třicátých let V. Mathesiem, B. Havránkem a R. Jakobsonem, od postojů preskriptivních k toleranci a k maximální informovanosti mluvčích o daném stavu a tendencích z něho vyplývajících, a tedy i ve snaze o sbližování mluveného a psaného jazyka. Nelze ztrácet ze zřetele ani variantnost a variabilitu jazyka, které jsou přirozenými manifestacemi jeho vývoje, probíhajícího právě a především prostřednictvím jazyka mluveného. Mluvený i psaný úzus se podstatně proměňuje, typické tvary mluvené češtiny stále ve značné míře ztrácejí vysloveně nespisovný charakter[13] a i tvary dosud nespisovné se ozývají v situacích, které v první polovině století daleko víc vyžadovaly přísnou spisovnost.[14]

Spatřuje-li Starý (1987, 1994) ve vývoji české teorie jazykové kultury zásadní zklamání funkční lingvistiky, je třeba připomenout, že navzdory vší její nedůslednosti tu přece šlo o zřejmý krok vpřed ve srovnání s předcházejícím stavem. Nedůslednost lze ovšem vidět jak na straně teorie samé, která obecný funkční pohled nedoplnila soustavnou konkretizací kritérií pro kodifikační a jinou činnost, tak na straně této praktické činnosti. Ta zůstala dodnes poplatná staršímu normativnímu, [23]tedy preskriptivnímu hledisku, ačkoli by ve shodě s požadavky klasického Pražského lingvistického kroužku bylo zapotřebí hledat východiska pro důsledný přechod k hledisku deskriptivnímu. Uvádí-li se, že kodifikační, poradenská ap. aktivita je dnes daleko tolerantnější než dřív, znamená to, že tato nutnost zásadní změny hlediska není reflektována. Dosud přežívá snaha kodifikací přirozený vývoj ovlivňovat (často bez patřičných podkladů), vyžadovat užívání více méně knižních tvarů i mimo knižní styl a přirozenou jazykovou variantnost (začínající v mluveném jazyce) potlačovat. Teoretické řešení tohoto rozporu přirozené vývojové variability jazyka a „potřeby“ jejího kodifikačního stabilizačního potlačování dosud bohužel chybí. Je třeba dát Starému za pravdu v tom, že česká teorie spisovného jazyka tento aspekt nikdy důsledně nereflektovala (přes některé závažné formulace Mathesiovy), což je v očividném rozporu se základním funkčním stanoviskem. V jistém smyslu se pak i sama historie kodifikačních opatření může jevit také jako historie marného bránění a brzdění průniku mluveného jazyka do spisovného: každá následující kodifikační reforma zavádí mnohé z toho, co předchozí blokovala.

Dodejme ještě, že zvláště citlivou a u nás v zásadě neřešenou otázkou je pak zcela obecně i reálné prošetření souvztažnosti knižního s diachronním: zřejmě leccos, co se považuje za synchronní jev knižní, je díky kodifikaci (i působení školy apod.) udržováno při životě uměle, i když svou podstatou je to už záležitost diachronní. To je pak zcela proti duchu moderní lingvistiky.[15]

 

LITERATURA

 

BĚLIČ, J.: Kdo zavřel okno? Otevři ho. , 44, 1961, s. 266–271.

BĚLIČ, J.: Ke zkoumání městské mluvy. AUC. SlavPrag 4, 1962, s. 569–575.

BRABCOVÁ, R.: Městská mluva v Brandýse n. L. Praha 1973.

CRYSTAL, D.: The English Language. London 1988.

ČERMÁK, F.: Relations of spoken and written Czech (with special reference to the varying degree of acceptability of spoken elements in written language). Wiener Slawistischer Almanach, 20, 1987, s. 133–150.

ČERMÁK, F.: Spoken Czech. In: E. Eckert (ed.), 1993a, s. 27–41.

ČERMÁK, F.: Lexis in spoken and written language. SaS, 54, 1993b, s. 173–177.

ČERMÁK, F.: Jazykový korpus: Prostředek a zdroj poznání. SaS, 56, 1995, s. 119–140.

ČERMÁK, F.: Obecná a spisovná čeština: Poměr, funkce a metodologie. In: R. Šrámek (ed.), Spisovnost a nespisovnost dnes (Šlapanice u Brna 17.–19. ledna 1995). Sborník prací PF MU. Brno 1996, s. 14–18.

ČMEJRKOVÁ, S. – DANEŠ, F. – HAVLOVÁ, E. (ed.): Writing vs Speaking. Tübingen 1994.

DANEŠ, F.: Americká studie o mluvené češtině. , 40, 1957, s. 296–300.

DANEŠ, F.: Values and attitudes in language standardization. Južnoslovenski filolog, 32, 1976, s. 3–27.

DANEŠ, F.: Pojem ’spisovného jazyka’ v dnešních společenských podmínkách. In: Dynamika současné češtiny z hlediska lingvistické teorie a školské praxe. Praha 1988.

DANEŠ, F.: Situace češtiny: perspektiva i retrospektiva. In: J. Jančáková et al. (ed.), 1995, s. 23–31.

[24]DEJMEK, B.: Běžně mluvený jazyk (městská mluva) města Přelouče. Hradec Králové 1976.

DEJMEK, B.: Mluva nejstarší generace Hradce Králové. Hradec Králové 1981.

DEJMEK, B.: Hierarchie a dynamika obecněčeských hláskových jevů. SaS, 47, 1986a, s. 131–138.

DEJMEK, B.: Soustava koncovek v pl. préz., délka tvarů, jejich zastoupení a funkce v běžně mluvených projevech v Hradci Králové. , 69, 1986b, s. 136–140.

DEJMEK, B.: Sociolinguistic aspects of research into urban speech. In: J. Chloupek – J. Nekvapil (ed.), 1987a, s. 106–122.

DEJMEK, B.: Běžně mluvený jazyk nejmladší generace Hradce Králové – hláskosloví a morfologie. Hradec Králové 1987b.

ECKERT, E.: Varieties of Czech. Studies in Czech Sociolinguistics. Amsterdam – Atlanta 1993.

GARVIN, P.: The analysis of spoken and written data in the light of language data processing. In: S. Čmejrková – F. Daneš – E. Havlová (ed.), 1994, s. 63–75.

Grant „Český jazyk v Evropě na přelomu tisíciletí“. JazAkt, 31, 1994, s. 94–99.

HAMMER, L.: Prague Colloquial Czech: A Case Study in Code-switching. Bloomington, Ind. 1985.

HAMMER, L.: Code-switching in Colloquial Czech. In: J. L. Mey (ed.), Language and Discourse: Test and Protest. Amsterdam 1986, s. 455–473.

HAMMER, L.: The function of code switching in Prague Colloquial Czech. In: E. Eckert (ed.), 1993 s. 63–78.

HAUSENBLAS, K.: Styly jazykových projevů a rozvrstvení jazyka. SaS, 23, 1962, s. 189–201.

HRONEK, J.: O motivaci výběru jazykových prostředků v běžně mluveném projevu. In: SlavPrag, X, 1968, s. 321–328.

HRONEK, J.: K otázkám hláskosloví obecné češtiny. In: SlavPrag, XIII, 1971, s. 227–240.

HRONEK, J.: Obecná čeština. Praha 1972.

CHLOUPEK, J. – NEKVAPIL, J. (ed.): Reader in Czech Sociolinguistics. Amsterdam – Praha 1987.

JANČÁKOVÁ, J. – KOMÁREK, M. – ULIČNÝ, O. (ed.): Spisovná čeština a jazyková kultura 1993. Praha 1995.

JELÍNEK, M.: Posuny v stylistické charakteristice jazykových prostředků a jejich kodifikace. In: Aktuální otázky jazykové kultury v socialistické společnosti. Red. J. Kuchař. Praha 1979.

JONG, E. de (ed.): Spreektaal. Woordfrequenties in gesproken Nederlands. Utrecht 1979.

KRAVČIŠINOVÁ, K. – BEDNÁŘOVÁ, B.: Z výzkumu běžně mluvené češtiny. In: SlavPrag, X, 1968, s. 305–320.

KRČMOVÁ, M.: Protetické v- v brněnské městské mluvě. , 57, 1974, s. 243–248.

KRČMOVÁ, M.: Běžně mluvený jazyk v Brně. Brno 1981.

KUČERA, H.: Phonemic variations of spoken Czech. Slavic Word (Supplement to Word 11), 1955, s. 575–602.

KUČERA, H.: Inquiry into coexistent phonemic systems in Slavic languages. In: American Contributions to the Fourth International Congress of Slavicists. The Hague 1958, s. 169–189.

KUČERA, H.: The Phonology of Czech. The Hague 1961.

KUČERA, H.: Language variability, rule interdependency and the grammar of Czech. Linguistic Inquiry, 4, 1973, s. 499–521.

MÜLLEROVÁ, O.: Mluvený text a jeho syntaktická výstavba. Praha 1994.

MÜLLEROVÁ, O. – HOFFMANNOVÁ, J.: Kapitoly o dialogu. Praha 1994.

[25]MÜLLEROVÁ, O. – HOFFMANNOVÁ, J. – SCHNEIDEROVÁ, E: Mluvená čeština v autentických textech. H + H, Jinočany 1992.

NOVÁK, P.: O smysl diskuse o mluvené češtině. SaS, 23, 1962, s. 266–272.

SGALL, P. – HRONEK, J.: Čeština bez příkras. Praha 1992.

SGALL, P. – HRONEK, J. – STICH, A. – HORECKÝ, J.: Variation in Language: Code Switching in Czech as a Challenge for Sociolinguistics. Amsterdam 1992.

SGALL, P. – TRNKOVÁ, A.: K metodám zkoumání běžně mluvené češtiny. , 46, 1963, s. 28–35.

STARÝ, Z.: Theory of standard language – (a) failure of functionalism. In: Abstracts of Section Papers, XIVth International Congress of Linguists. Berlin 1987, s. 250.

STARÝ, Z.: Ve jménu funkce a intervence. AUC. Philol. Monogr. CXXIII. Praha 1994.

ŠONKOVÁ, J.: Lingvistické zpracování jazyka na počítači: Morfologie mluvené češtiny. Kandidátská disertační práce. Praha 1995.

VEY, M.: Morphologie du tchèque parlé. Paris 1946.

 

… no a dnešní děti, ty by1 nám hnedle řekly1, že sme2 ňáký2 takový2 divný2

 

no

049111

NO

NO

a

038111

A

A

dnešní

21010321-11

DNEŠNÍ

DNEŠNÍ

děti

111032191

DÍTĚ

DÍTĚ

ty

34032111

TEN

TEN

by řekly

587863-2711

ŘÍCT

ŘÍCT

nám

31052311

MY

MY

hnedle

024411

HNEDLE

HNEDLE

že

82221

ŽE

ŽE

sme ňáký takový divný F15-1

BEJT TAKOVEJ ŇÁKEJ DIVNEJ

 

 

 

BÝT TAKOVÝ NĚJAKÝ DIVNÝ

 

           

 

R É S U M É

Research in spoken Czech: its situation and needs

A corpus of spoken discourses is being compiled and organized as a data base in the frame of the project of the Czech National Corpus at the Faculty of Philosophy, Charles University, Prague. The numerous differences between written Czech (with its high degree of bookish items) and the spoken language (in which many colloquial phenomena are used) makes this research especially important. The results may be of great significance not only for linguistic research itself and for the description of Czech, but also for topical issues of the codification of the Standard norm. As a background to the presentation of the corpus a number of issues relevant for the spoken language research are discussed.


[1] Tehdy byly formulovány určité požadavky na metodu tohoto výzkumu, viz Sgall a Trnková (1963), a pak i konkrétní výsledky získané rozborem souboru promluv, viz Kravčišinová a Bednářová (1968), a celková charakteristika obecné češtiny (zejména jejího tvarosloví a hláskosloví) i dílčí rozbor některých psychologických aspektů běžného hovoru, viz Hronek (1968, 1971, 1972). Zhruba zároveň probíhaly výzkumné práce navazující na iniciativu Běličovu (1962; v. i Hausenblas, 1962) a vzniklé na dalších fakultách a univerzitách, především viz Dejmek (1976, 1981, 1986a,b, 1987a,b), Brabcová (1973), Krčmová (1974, 1981). Nově, v těsné souvislosti s prací na počítačovém korpusu mluvené češtiny, navazuje na tehdy dosažené výsledky Šonková (1995). Jinou povahu má ovšem výzkum nářečí, který dnes začíná přinášet ovoce v Českém jazykovém atlasu, jehož publikace bohužel může být jen velmi pomalá.

[2] První monografií o morfologii běžně mluvené češtiny je kniha sepsaná francouzským lingvistou na základě materiálu z dvacátých let (Vey, 1946). Rozhodující význam pro poznání skutečné povahy českého hovorového vyjadřování jako oscilace mezi dvěma normami měla stať Kučerova (1955); viz i Daneš (1957, 1988 o pojmu „hovorové češtiny“); také další Kučerovy publikace (1958, 1961, 1973) jsou významné pro poznání fonologie a morfonologie mluvené češtiny. Z novějších zahraničních prací uveďme zejména Hammer (1985, 1986).

[3] Jak je uvedeno ve stati o výzkumném projektu ÚJČ (Grant, 1994, s. 94), výzkum synchronního stavu jazyka vyžaduje „stanovit ustálené i nově vznikající jazykové situace a odpovídající typy diskurzů“ a tedy „rozsáhlý sběr jazykových dokladů, při němž budou využity textové korpusy již existující (nejen v Ústavu pro jazyk český, ale i na pracovištích v regionech)“, to obojí lze tudíž považovat za náplň tohoto projektu. Poněkud zaráží, že tu chybí zmínka o rozsáhlých pracích a korpusech právě mimo AV. Avšak vůči proponovaným typům a tedy třídění situací a diskurzů lze především vznést zásadní námitky poučené mj. i neúspěšností takového počínání kdekoliv v zahraničí (podobně jako u pokusů o realistické typologie textů, s nimiž by se dalo v terénu pracovat); není ostatně jasná ani metodologie vymezování těchto situací a diskurzů, jejich odlišení v případě míšení a splývání, ani záruka reprezentativního pokrytí celé sféry promluvy. Není-li toto objektivně garantováno, musí jít jen o více méně náhodný výběr a smysl takového zkoumání se jak výrazně snižuje, tak potenciálně pluralizuje, protože výběrů může být libovolně mnoho. V tomto smyslu jde v uvedeném projektu tudíž o směřování k tomu, proti čemu se korpusová lingvistika svým akcentem na náhodnost a vzorek vědomě staví.

[4] Viz Müllerová (1994); Müllerová a Hoffmannová (1994); autorky bohužel nevěnují soustavnější pozornost studiu hláskosloví a tvarosloví; jen stručně obecně uvádějí, že jejich korpus textů obsahuje z nespisovných jevů zejména prvky obecné češtiny (s. 6). Zůstává pak nejasné, jak chápat např. formulaci „příklady vytvořené mají podobu, jaká by se nejspíše vyskytovala ve skutečné komunikaci“ (tamtéž). Snad se v těchto příkladech uvádějí i jevy nespisovné, ale pak lze vidět určitou asymetrii v tom, že na s. 85 v doporučení č. 28 autorky kladou otázku, zda „je např. vhodné přizpůsobit se partnerovi, který mluví nespisovně …“ (formulace této otázky by mohla čtenáře vést k dojmu, že autorky od něho užití nespisovných tvarů neočekávají).

[5] Jak píše Novák (1962, s. 267), nejednotná slohová platnost výrazových prostředků nebo rozdílné hodnocení situace může vést k tomu, že něco zní někomu příliš strojeně, pedantsky, něco příliš familiárně, a tedy obojí nevhodně, aniž to mluvčí zamýšlel; pozornost se pak příliš upoutává na způsob mluvení místo na obsah, mluvený jazyk není nástrojem v plném smyslu neselhávajícím.

[6] Navrhují-li někteří bohemisté, aby se místo ’oscilace’ nebo ’střídání kódů’ mluvilo o jejich ’míšení’, znamená to, že ve vývoji vztahu mezi spisovnou a obecnou češtinou spatřují vznikání třetího útvaru? Jestliže ano, lišil by se takový nový útvar nějak podstatně od Havránkovy „vyšší obecné češtiny“? Ať tak či onak, i tyto otázky ukazují na nezbytnost dalšího výzkumu.

[7] Viz Sgall a Trnková (1963); tam se také konstatuje, že je třeba zkoumat především ty body, ve kterých má čeština víc než jednu variantu, ať už je jedna z nich vlastní češtině spisovné a druhá obecné, nebo jsou rozděleny jinak.

[8] Vedle pozornosti, která by měla být věnována zeměpisným i vývojovým variantám uvnitř obecné češtiny, je tu i specifická potřeba výzkumu současné situace (a jejího pohybu) v moravských městech i na venkově (zejména na západě Moravy). Je třeba si uvědomovat na jedné straně kvantitativní nepoměr mezi obecnou češtinou a oblastmi moravských (inter)dialektů a na druhé straně důsledky toho, že mnozí mluvčí z těchto oblastí nepociťují knižnost výlučně spisovných tvarů jako překážku jejich užívání v běžném hovoru (nebo ji nepociťují tak silně, jako je to běžné v Čechách).

[9] V této knize, publikované bohužel jen v zahraničí, jsme měli možnost podrobně přihlédnout k novějšímu vývoji sociolingvistiky a k zařazení specifické situace češtiny do širších souvislostí; v popularizačně zaměřené knížce Sgall a Hronek (1992) taková možnost nebyla.

[10] Členy tohoto výzkumného týmu zpracovávajícího pod vedením Fr. Čermáka univerzitní projekt Frekvence mluvené češtiny (podporovaný grantem UK) jsou v různé míře A. Adamovičová, J. Pešička, P. Savický, Z. Smetanová, J. Šimandl a J. Šonková. V těsné metodologické návaznosti a součinnosti se začal sbírat i materiál z mluveného jazyka v oblasti Brna, a to zásluhou týmu Z. Hladké a M. Nekuly.

[11] Viz Bělič (1961); jde tu např. o jevy jako typ oni sází, jejichž chybnou povahu výrazně pociťuje mnoho mluvčích v Čechách. U jiných mluvčích je toto povědomí oslabováno jednak tím, že se na Moravě většinou setkáme s variantami jinými než sázej(í) (takže je tu silná tendence po užívání tvarů v základním jazykovém povědomí nezakotvených), jednak i tím, že u vzorů trpí a prosí je -ej(í) na většině území Čech rozšířeno jako nespisovné a před jeho užíváním jsou mluvčí varováni. Působí jistě i to, že v části jihozápadních Čech je oni sází v běžném hovoru „doma“, ale to je oblast dost omezená.

[12] Tato přemíra knižních prvků má své staré příčiny. Daneš (1995, s. 26) píše, s jakými pocity četl, že „legenda o vlastenecké povinnosti pečovat o jazyk způsobila mnoho zlého“, ale na citovaném místě (Sgall a Hronek, 1992, s. 97) tato věta není. Ne legenda sama, nýbrž její setrvačnost (z kontextu je zřejmé, že jde o příliš dlouhé soustředění národní orientace na brusičství) se tam označuje za jeden z pramenů „povinně vyžadované nemluvnosti“, tj. „slabých míst“ češtiny, jejichž existenci Daneš (l.c.) uznává. Takové zkreslování může jen dál odvádět pozornost bohemistiky od těchto slabých míst, tedy od závažných úkolů. V citovaném sborníku (Jančáková et al., 1995) posilují tuto nešťastnou tendenci i četné redakční připomínky neobvyklého druhu, jejichž hypertrofie (zejm. na s. 88) nesvědčí o odborné převaze redakce nad autory, ale jen o tom, že diskuse o stěžejních problémech tu sklouzává na nevhodnou úroveň.

[13] O základní povaze této tendence viz už Jelínek (1979).

[14] Jak uvedl P. Sgall (na loňské konferenci o mluvené češtině ve Šlapanicích), během padesáti let jeho působení na Karlově univerzitě zde došlo k velmi výraznému posunu. Kdysi bylo spíš výjimečné, že učitelé Filozofické fakulty stylisticky vhodně užívali i jevy nespisovné; ačkoli by se to mohlo zdát paradoxní, z tří takových výrazných osobností jeden byl profesorem lingvistiky, druhý logiky a třetí estetiky. Naproti tomu dnes je zcela běžné slyšet nespisovné tvary v posluchárnách humanitních i jiných oborů, a k netypickým jevům patří i mezi vysokoškolskými učiteli právě výhradní užívání tvarů spisovných. K podobnému posunu zřejmě došlo i v jiných prostředích, včetně neoficiálního veřejného hovoru i prózy, dramatu, filmu, populární hudby aj.

[15] Pozoruhodný je v tomto smyslu např. vývoj anglického slovníkářství, kde jen zdánlivě paradoxně komerční orientace a tvrdá tržní konkurence autorům dovolí ve stále nových slovnících, obvykle většího středního rozsahu, jen v omezené míře ponechávat věci staré či neužívané. Dnes tuto orientaci ostatně potvrzuje i korpusový materiál, ze kterého tyto slovníky téměř bez výjimky vycházejí.

Slovo a slovesnost, ročník 58 (1997), číslo 1, s. 15-25

Předchozí Eva Koktová: Ke klasifikaci českého souvětí

Následující František Štícha: Komputační korpusy a empirická gramatika