Karel Kučera
[Articles]
Development of orthographic efficiency and complexity in Czech texts from the end of the 13th century to the end of the 20th century
V zásadě lze říci, že celkové, přehledové výklady vývoje české psací soustavy a pravopisu (např. Gebauer, 1894; Havránek, 1936, 1980: zde zejm. s. 27n., 44n., 67n., 88n., 105n., 127n.; Komárek, 1969: zejm. s. 75–79 a 159–160; Křístek, 1979; Cuřín, 1985: zejm. s. 21n., 35, 47n., 77n., 107n., 117n., 126n.) se soustřeďují především na dějiny modifikací středověké latinské abecedy při zaznamenávání českých textů (stranou se obvykle ponechávají relativně nečetné případy, kdy bylo k záznamu češtiny využito hlaholice). Osu těchto výkladů tvoří zpravidla triáda pravopis jednoduchý (primitivní) – pravopis spřežkový – pravopis diakritický, od níž se pak odvíjejí podrobnější charakteristiky dalších změn (změny v platnosti jednotlivých grafémů, reformy pravopisu aj.), charakteristiky vyhraněných stavů (starší a mladší spřežkový pravopis, bratrský pravopis), souvislostí a vlivů (souvislosti jazykově systémové, kulturní, historické, vliv knihtisku, mluvnic atd.). Velká část vývojových změn spadajících do tohoto širokého základního rámce je v současnosti popsána do značné hloubky jak v hlavních principech a souvislostech (např. Vachek, 1942; Havránek, 1980; Sgall, 1986, 1994), tak v detailech (zejm. Porák, 1979; dále např. Cejnar, 1969; Lutterer, 1969; o novějším vývoji zejm. Sedláček, 1993, aj.).
I při zběžném srovnávání textů z různých období vývoje českého jazyka však lze vycítit také existenci jiných vývojových linií a tendencí, které mají jen částečnou souvislost s vystřídáním zmíněných tří pravopisných principů a které zřejmě nejsou vždy dost dobře uchopitelné bez kvantifikace, tj. jen tradičním způsobem popisu obvykle převažujícím v historické lingvistice (v podstatě jde o popis detailní, na rozdíl od popisu statistického, resp. kvantitativního, ve smyslu rozlišení u Carnapa, 1977), a zůstávají proto formulovány přinejlepším jen v nejobecnějších konturách a do značné míry intuitivně, bez důkazů. V následujícím textu se pokoušíme na základě vybraných kvantitativních charakteristik v základních rysech postihnout dvě takové vývojové linie, jejichž průběh – pokud je nám známo – nebyl dosud přímo na jazykovém materiálu detailněji demonstrován ani v češtině, ani v jiném jazyce. První z těchto linií představuje vývoj účinnosti (ekonomičnosti, efektivity) pravopisu, druhou je vývoj jeho složitosti, resp. (ne)jednoznačnosti (přesnější terminologické vymezení pro účely kvantifikace viz níže).
Kvantitativní charakteristiky, které uvádíme v souvislosti s těmito dvěma vývojovými liniemi, byly získány autorovým účelovým rozpracováním části diachronního korpusu (součást Českého národního korpusu) vznikajícího s podporou komplexního grantu GA ČR 405/96/K214 a projektu MŠMT pro podporu výzkumu na vysokých školách VS96139; programové nástroje na zpracování jazykového materiálu z různých vývojových období češtiny vyvinul autor v rámci grantu GA ČR č. 405/95/0190. Soubor textových vzorků, který byl sestaven pro získání elementárních kvantitativních charakteristik vývoje českého pravopisu, pokrývá období od 2. pol. 13. stol. do současnosti a je složen z 16 textových sond pocházejících vždy z doby okolo poloviny a okolo konce století. Rozsah sond ve výchozí, transliterované podobě se pohybuje v rozmezí 20 000 – 20 008 znaků, tj. písmen a mezer (interpunkce je zcela vypuštěna, odstraněny byly rovněž číslice, různé nepísmenové znaky a citátové cizí výrazy; uvedené nevelké rozdíly v délce vyplývají z toho, že připadla-li hranice 20 000 znaků dovnitř slova, bylo toto slovo vždy zahrnuto do sondy jako celek); 20 000 znaků odpovídá přibližně 2500 – 3000 slovům, a jde tedy [179]o vzorky, které podle zjištění M. Těšitelové (1980, s. 40; 1985, zejm. s. 35n. a 153) mají rozsah postačující v češtině k získání spolehlivých jazykových charakteristik. Jedinou výjimku co do vyrovnanosti délky textových vzorků tvoří orientační první sonda (vzorek z 2. pol. 13. stol.), jejíž rozsah zůstal vzhledem ke krátkosti a mizivému počtu dochovaných autentických textů omezen na 4294 znaků. Mimo počáteční tři sondy, které reprezentují stavy jazyka a pravopisu z 2. pol. 13. stol. a z období kolem let 1300 a 1350, je každá sonda tvořena jedním souvislým textem (náhodným vzorkem). Sondy 1250 a 1300 jsou složeny z několika textových zlomků a krátkých glos a sonda 1350 sestává z několika nenavazujících částí biblického textu.
Jednotlivé sondy představují vzorky z následujících textů: Sonda 1250 (2. pol. 13. stol): píseň Ostrovská (PísOstr v soupisu pramenů Staročeského slovníku, 1968), Túlec sv. Bonaventury (Túl), české glosy homiliáře Opatovického (GlosOpat). – Sonda 1300: zlomek Legendy o Panně Marii (LegMar), Šafaříkův zlomek Legendy o apoštolích (LegApŠ), Durychův zlomek Legendy o apoštolích (LegApD), zlomek Legendy o Pilátovi (LegPil), drkolenský zlomek Legendy o Jidášovi (LegJidD), muzejní zlomek Legendy o Jidášovi (LegJidM), klementinský zlomek Legendy o sv. Jakubovi Menším (LegJakK). – Sonda 1350: Bible drážďanská (BiblDrážď). – Sonda 1400: Tomáš ze Štítného, O bojování hřiechóv s šlechetnostmi (Sborník Vyšehradský, ŠtítVyš, rkp. z r. 1396). – Sonda 1450: Bible mlynářčina (BiblMlyn, rkp. z pol. 15. stol.) – Sonda 1500: Raimund Lullius, Praktika testamentu (AlchLull, rkp. z r. 1500). – Sonda 1550: Sebastian Münster, Kozmografia česká (dále Kozm, tisk, Praha 1554). – Sonda 1600: Kryštof Harant z Polžic a Bezdružic, Cesta z Království českého do Benátek … (tisk, Praha 1608). – Sonda 1650: Jan Ámos Komenský, Kšaft umírající matky, jednoty bratrské (tisk, Lešno 1650). – Sonda 1700: Kryštof Fišer, Hospodářství polní (tisk, Praha 1705). – Sonda 1750: František Václav Kyba, Velká panna sluncem oděná … (tisk, Praha 1748). – Sonda 1800: Václav Matěj Kramerius, Dobrá rada v potřebě (tisk, Praha 1803). – Sonda 1850: časopis Lumír (tisk, 30. 6. 1853). – Sonda 1900: Josef K. Šlejhar, Lípa (tisk, Praha 1908). – Sonda 1950: Bohumil Říha, Venkovan (tisk, Praha 1955). – Sonda 2000: Tomáš Hájek, Animatum (tisk, Praha 1995).
Uvedené sondy byly transliterací převedeny do počítačově čitelné podoby a z té byl s využitím zvlášť vytvořených programových nástrojů pořízen jejich fonologický přepis. Přepis jednotlivých starších vzorků jako celek odráží současné představy o vývoji českého fonologického systému, jak je shrnují Lamprecht, Šlosar a Bauer (1986), avšak při transkripci, resp. fonologické rekonstrukci starších sond jsme se nevyhnuli některým zjednodušením. Šlo zejména o problémy vývoje souhláskové měkkosti a souvisící problémy fonologické platnosti grafiky ie, ye: v naší transkripci palatalizované b', d', f', m', n', p', s', t', v', z' před e byly považovány za fonémy pouze v sondě 1250. Před ě, ie, i, í byly tyto palatalizované souhlásky interpretovány jako fonémy až do sondy 1350 včetně. Palatalizované l' bylo chápáno jako foném pouze v sondě 1250. Dlouhé a krátké ě jsme chápali jako dva monoftongy do sondy 1350 včetně, od sondy 1400 dále bylo ie, ye v příslušných pozicích interpretováno jako skupiny /je/, /ňe/ (tj. /bježet/, /mňesto/ ap.) nebo diftong /ie/ (stejně jako u diftongu uo jsme se ani zde nepokoušeli zavést do fonologických rekonstrukcí předpokládatelné různé vývojové podoby tohoto diftongu, jako např. jé, ijé, íje ap.); v pozdějších textech, po monoftongizaci ie>í, je ie, ye přepisováno jako /ije/. Pro přesnost dále uvádíme, že ve fonologickém přepisu textových sond nebylo nikde rozlišováno slabičné a neslabičné r, l a že ve fonologické podobě sondy 1400 a všech sond dalších byla uplatněna asimilace a neutralizace znělosti v obvyklém dnešním rozsahu. Autor si plně uvědomuje námitky, které je možno vznést proti jeho zjednodušené interpretaci některých jevů: nelze např. vůbec vyloučit, že neutralizace znělosti na konci slov nebyla kolem r. 1400 ještě plně rozšířená; historická depalatalizace nepochybně představovala dlouhodobý proces, který postupoval nestejně rychle u jednotlivých hlásek a v různém hláskovém okolí a který se jen nedokonale obrážel v psaných textech, a stanovení víceméně jednotných časových hranic je zde tedy sporné, podobně jako chápání některých palatalizovaných souhlásek v některých pozicích jako fonémů – atd. Vedle řady možných námitek uvedeného typu si však autor uvědomuje i skutečnost, že sporné případy tvoří v každé sondě jen malou část korelací foném-grafém, které byly východiskem níže uváděných charakteristik, a že případné dílčí posuny v časovém vymezení jednotlivých jevů by se projevily jen v poměru sousedních sond a neměly by podstatný vliv na celkový kvantitativně ztvárněný obraz vývoje účinnosti a složitosti, který níže podáváme. Pro získání tohoto obrazu [180]měly zásadní význam vlastně jen dva aspekty fonologické interpretace: 1. rozhodnutí, zda danému grafému (resp. skupině grafémů) odpovídá jeden foném, nebo naopak skupina fonémů, a 2. rozhodnutí, zda je tento foném odlišný od fonémů korelujících s jinými grafémy (skupinami grafémů), nebo je s nimi totožný (resp. jde jen o variantu fonému).
Níže uváděné kvantitativní charakteristiky jsou výsledkem poloautomatické analýzy a porovnání takto vzniklých transliterovaných a fonologických verzí jednotlivých textů.
Účinnost pravopisu byla kvantifikována jako procentuálně vyjádřený poměr počtu fonémů (včetně mezislovních předělů) k počtu grafémů (včetně mezer) užitých k zápisu těchto fonémů. Za grafémy byly považovány pouze jednotlivé znaky, nikoli jejich skupiny, tj. spřežky jako ch, ij, cz, czz ap. (jiný přístup jsme uplatnili při kvantifikaci složitosti českého pravopisu, viz níže). Při tomto způsobu kvantifikace účinnosti písemného záznamu má tedy např. zápis na chodbě stoprocentní účinnost, protože v něm bylo užito počtu grafémů a mezer, který se shoduje s počtem fonémů a mezislovních předělů v odpovídající fonologické podobě /na xodbje/; zápis na schodech má pak účinnost nižší (81,82%), protože 9 fonémům (včetně jednoho mezislovního předělu) /na sxodex/ v něm odpovídá 11 grafémů (včetně jedné mezery), a zápis ve věštbě má naopak účinnost vyšší (112,22%), neboť 11 fonémů /ve vježdbje/ je tu zapsáno jen 9 grafémy (obojí opět včetně mezislovních předělů a mezer). Výsledky kvantifikace pro uvedených 16 textových sond jsou shrnuty v tabulce 1 a v grafu 1.
ROK | ÚČINNOST | ROK | ÚČINNOST |
1250 | 96,83 % | 1650 | 98,99 % |
1300 | 86,97 % | 1700 | 98,32 % |
1350 | 91,73 % | 1750 | 99,23 % |
1400 | 93,65 % | 1800 | 99,25 % |
1450 | 98,61 % | 1850 | 99,80 % |
1500 | 94,02 % | 1900 | 99,63 % |
1550 | 96,05 % | 1950 | 99,51 % |
1600 | 98,52 % | 2000 | 99,73 % |
Tabulka 1.
Zjištěný vývoj účinnosti písemného záznamu se v některých bodech patrně liší od vývoje, který bychom intuitivně očekávali na základě dosavadních detailních popisů. Prvním takovým bodem (postihujícím charakteristiku spíše ne zcela uvědomovanou než neočekávanou) je pozoruhodně vysoká účinnost textů psaných tzv. jednoduchým, primitivním pravopisem (sonda 1250): dosahuje hodnoty, k níž se české písemné záznamy znovu dopracovaly až zhruba o dvě století později. Vysoká účinnost tohoto pravopisu je ovšem účinností již relativně vysoce standardizovaného pravopisného systému, avšak systému cizího, určeného pro záznam jazyka s výrazně menším počtem fonémů (odtud i značná nejednoznačnost českých textů zapsaných tímto pravopisem, viz níže). V porovnání s následujícími systémy, již přizpůsobenými, resp. přizpůsobovanými českému repertoáru fonémů, je zřejmé, že vysoká účinnost primitivního pravopisu vyplývá především z malé frekvence spřežek (v daných textech se objevuje ojediněle pouze ie, ye, někdy užívané k zápisu fonému /ě/, a ch, kterého se vedle písmen h a c ojediněle užívalo k zápisu /x/ a /č/); jistou úlohu tu však má i relativně časté písařské zkracování záznamu s využitím nadepsané titly a zkracování tradičně označované jako zkracování „pomocí
[181]
Graf 1. Vývoj účinnosti českého pravopisu
znaménka“ a „pomocí koncovky“ (např. Kopecký, 1978, s. 14n.), jejichž vlivem se ekonomičnost záznamu v těchto raných textech zvyšuje zhruba o 0,4 %.
Následující pokles účinnosti, který s sebou přineslo uplatnění staršího spřežkového pravopisu (sonda 1300), není sám o sobě překvapivý; z dnešního hlediska je pozoruhodná spíše jeho relativní nevýraznost, neboť při zběžném srovnání tehdejších textů s obvyklou transkripcí pomocí dnešního pravopisu (srov. např. bra zzie prechz na morse – bra sě preč na moře, LegJid) by bylo lze očekávat větší rozdíl v účinnosti než necelých 13 % (účinnost 86,97 % v r. 1300 proti 99,74 % v současnosti). Dojem mimořádně malé účinnosti staršího spřežkového systému je však u uživatele dnešního českého pravopisu zřejmě vyvoláván spíše výskytem některých nápadně neekonomických prvků (např. spřežka chz, užívaná k zápisu fonému /č/) než neekonomičností celých záznamů, neboť i ve starším spřežkovém pravopise má samozřejmě většina českých fonémů jednopísmenné ekvivalenty. Český spřežkový systém se ostatně brzy výrazně zefektivňuje: tzv. mladší spřežkový pravopis (sondy 1350 a 1400) s sebou přináší zhruba pětiprocentní vzrůst účinnosti, vyplývající především z toho, že z psaných textů mizí trigrafy a ustupuje užívání digrafů při zápisu fonémů /c/, /s/ a /z/, běžné ve starším spřežkovém systému; současně však – v protikladu k těmto zefektivňujícím faktorům – ve zkoumaných textech poněkud klesá frekvence výše zmíněných písařských zkratek.
V polovině 15. stol. se účinnost českého pravopisu poprvé výrazněji přibližuje dnešní úrovni: v rámci zkoumaných šestnácti textových sond je tu poprvé s relativně velmi vysokou důsledností využito diakritického pravopisu, podstatně ekonomičtějšího než pravopis spřežkový; neefektivnost přetrvávajícího úzu některých spřežek (zejména ie, ye, ij, ch a digrafu k označení /š/) je tu do značné míry kompenzována častějším využíváním tradičních písařských zkratek. Výrazný vzestup účinnosti souvisící s uplatněním diakritického pravopisu opravňuje ke konstatování, že přechod od spřežkového principu k principu diakritickému je primárně přechodem od méně účinného principu k principu účinnějšímu (níže, v souvislosti s vývojem složitosti českého pravopisu, ukazujeme, že tento přechod nijak neovlivnil složitost textů). Jak je zřejmé z grafu 1, účinnost písemného záznamu v sondě 1450 je o tolik vyšší než v okolních sondách, že mohou vzniknout pochyby, zda v příslušném textu (tzv. Mlynářčina bible) nejde jen o náhodnou odchylku, [182]tj. zda tu nedošlo jen ke zcela výjimečnému souběhu obou uvedených zefektivňujících faktorů (značně důsledná aplikace diakritického pravopisu a vysoká frekvence písařských zkratek). Z analýzy doplňkové kontrolní sondy (Deník panoše Jaroslava, CestJar, rkp. z r. 1464), pořízené k ověření věrohodnosti, resp. typičnosti sondy 1450, však vyplývá, že vysoká efektivnost záznamu v Mlynářčině bibli zřejmě není v době kolem poloviny 15. stol. výjimečná. Přestože zmíněné dvě památky jsou shodou okolností značně rozdílné (BiblMlyn se vyznačuje pečlivým zápisem, v nemalé míře reprezentativním, CestJar má naopak povahu zběžného záznamu spíše pro osobní potřebu), rozdíl v jejich účinnosti není zásadní (97,48 % u BiblMlyn, 96,04 % u CestJar); frekvence spřežek v CestJar je sice celkově vyšší, ale je – podobně jako v BiblMlyn – kompenzována častým výskytem tradičních písařských zkratek.
Pozoruhodné je, že v 2. pol. 15. stol. (text AlchLull) a v 1. pol. 16. stol. (text Kozm) účinnost českých písemných záznamů znatelně poklesá (o více než 3 %) a k úrovni roku 1450 znovu vystupuje až kolem roku 1600. Výraznost tohoto poklesu nás vedla k pořízení další doplňkové kontrolní sondy (tzv. Pasionál kališnický, PasKal, z r. 1495). Náhodný výběr opět vyústil ve dvojici značně rozdílných památek (AlchLull je alchymistický text, převahou svých charakteristik odborný, PasKal text náboženský, v zásadě epický; AlchLull je rukopis, PasKal je prvotisk) a opět se ukázalo, že rozdíl v účinnosti jejich záznamu není zásadní (94,02 % u AlchLull, 95,46 % u PasKal). Zjištěný pokles účinnosti českého pravopisu po r. 1450 tedy nepovažujeme za náhodný (ukazuje na něj ostatně také hodnota zjištěná sondou 1550). Jak lze očekávat, menší účinnost písemného záznamu v textech z období kolem let 1500 a 1550 (AlchLull, PasKal, Kozm) vyplývá z toho, že ve srovnání s texty kolem roku 1450 (BiblMlyn, CestJar) se zde vyskytuje méně tradičních písařských zkratek (tj. méně zkracování pomocí titly, pomocí znaménka a pomocí koncovky) a naopak více spřežek. Dosavadní popisy vývoje českého pravopisu tuto situaci explicitně nezaznamenávají ani nevysvětlují, do jisté míry se na ni snad vztahuje Gebauerovo (1894) a Komárkovo (1969) konstatování, že diakritický pravopis byl hojně využit v některých památkách především z prvních desetiletí 15. stol., a současný poukaz na to, že „písaři a později i tisky z 15. a 16. stol. užívají i nadále ponejvíce pravopisu spřežkového, tu a tam s diakritickými znaménky“ (Komárek, 1969, s. 159).
Problém je, jak zjištěný zřetelný pokles účinosti českého pravopisu mezi lety 1450 a 1600 vysvětlit. Přechodné (zřejmě však více než stoleté) zřetelné zvýšení frekvence spřežek na úkor písmen s diakritickými znaménky zjevně nesouhlasí s víceméně obecně rozšířenou představou, že diakritický princip se sice zvolna a s kolísáním u jednotlivých písařů a tiskařů, nicméně trvale šířil na úkor principu spřežkového (obvyklé jsou formulace jako např. „nevešel tento pravopis ihned obecně v užívání, nýbrž dlouho se ještě drží pravopis spřežkový“, Havránek, 1980, s. 44 aj.). Fakt klesající frekvence zkratek, která v této době provází pokles frekvence písmen s diakritickými znaménky na úkor spřežek je naproti tomu sice v souladu s obecně přijímaným konstatováním (např. Kopecký, 1978, s. 20), že tradiční písařské zkratky z textů postupně mizí (opět s kolísáním u jednotlivých písařů a tiskařů), avšak tato dlouhodobá tendence je zřejmě příliš obecná na to, aby jí bylo možno vysvětlit speciální případ, jakým je zmíněný dobový pokles účinnosti záznamu v českých rukopisech a tiscích po roce 1450.
Domníváme se, že do výkladu tohoto poklesu je třeba zapojit faktor, jehož vliv na vývoj pravopisu se v české lingvistické tradici sice obecně nijak nepodceňuje, avšak jehož souvislost s účinností záznamu není na první pohled zřejmá. Tímto faktorem je [183]knihtisk, uvedený do našich zemí právě v období po roce 1450 a postupně zde získávající postavení prestižní formy písemného záznamu. Podle našeho názoru lze vyjít ze skutečnosti detailně dokumentované Porákem (1979), že užívání spřežek v tiscích bylo v řadě případů (zejména u majuskulí, u ozdobnějších typů písma v titulcích, mezititulcích aj., ale také např. u běžného „krátkého“ nespřežkového koncového š, psaného nejčastěji s vodorovnou čárkou nebo dvěma tečkami na místě dnešního háčku) záležitostí technickou a řídilo se vybavením tiskárny nebo – zejména šlo-li o dílo většího rozsahu – i jen momentálním nedostatkem příslušné litery při sazbě konkrétního úseku textu. Sám tento fakt ovšem postačuje pouze k vysvětlení toho, proč po roce 1450 přibývá spřežek v tiscích (v našem případě PasKal a Kozm), nikoli toho, proč současně přibývá spřežek také v rukopisech (AlchLull). Podle našeho názoru je spojovacím článkem mezi vývojem v tiscích a v rukopisech již zmíněná vzrůstající prestiž knihtisku a spolu s tím i tiskařského úzu, který se v 16. stol. s pomocí gramatiků ustaluje a stává se závaznou normou (srov. Porák, 1979, s. 158). Domníváme se, že vzrůst frekvence spřežek v rukopisech v období reprezentovaném v našem materiále sondami 1500 a 1550, tj. v období, kdy se konstituoval rozdíl mezi písařským a tiskařským územ, je možno vyložit tím, že písaři začali v některých rysech napodobovat prestižnější tisky a došlo tak k paradoxnímu jevu, kdy užívání spřežek, u tiskařů vynucené především nedostatečným vybavením tiskárny, avšak soustředěné – jak řečeno – zejména na tak exponovaná místa v textu, jako byly titulky, se pro písaře stalo záležitostí hodnou napodobení, příznakem nového stylu. Podle našeho názoru, založeného zatím převážně na povšechné autopsii, navíc není vyloučeno, že další, podrobnější průzkum by mohl prokázat podobný dočasný posun i v poněkud mladších tiscích (případy, kdy tiskař již prokazatelně měl v daném typu písma k dispozici litery s diakritickým znaménkem, ale na exponovaných místech dával přesto často přednost některým spřežkám jakožto výraznějším, v jistém smyslu snad i okázalejším, ornamentálnějším prvkům). Obě hypotézy (a případný vliv jiných faktorů) by bylo třeba ověřit na podstatně hustší síti zvlášť pořízených sond, jaká v současné době není k dispozici. Podaří-li se v budoucnu uvedené souvislosti podrobněji prokázat, bude zřejmě na místě formulovat závěr, že spřežky nebyly po roce 1400 jen zvolna ustupujícím a zastarávajícím prostředkem vytlačovaným na okraj úzu progresivnějšími prvky diakritického systému, nýbrž že po jistou dobu existovala tendence k jejich využití v platnosti ozvláštněných, stylově příznakových grafických prostředků. Pro vývoj účinnosti českého pravopisu mezi léty 1450 a 1600 by taková tendence zřejmě poskytovala uspokojivé vysvětlení.
Počínaje obdobím kolem roku 1550 sledovaly naše sondy pouze vývoj pravopisu v tiscích, neboť diachronní složka Českého národního korpusu dosud nezahrnuje natolik rozsáhlou a rovnoměrnou síť mladších rukopisů, aby umožňovala pomocí náhodných vzorků kvantifikovat rozdíly mezi pravopisným vývojem v českých rukopisech a v českých tiscích po roce 1500 (tento výzkum však bude vhodné při nejbližší příležitosti provést a zjistit tak, jak z kvantitativního hlediska vlastně vypadal dlouhodobý vývoj rozdílů mezi písařským a tiskařským územ a o jak trvalé rozdíly vlastně šlo). Pokud jde o tisky, vývoj účinnosti po roce 1550 probíhá v souladu s představami, k nimž lze dospět na základě již dobře známých a obecně přijímaných vývojových charakteristik. Přelom představuje období kolem roku 1600, kdy je již vysoce konsolidován bratrský pravopis a z úzu většiny tiskařů – především vlivem Kralické bible a pečlivých Veleslavínových tisků – ustupuje řada starších spřežek (cž, ij, rž aj.); účinnost grafického záznamu zde [184]stoupá na 98,52 %, a dosahuje tedy znovu úrovně záznamů z období kolem roku 1450 a přibližuje se na dosah úrovni dnešní.
V letech 1600–1850 se účinnost pravopisu vyvíjí už jen velmi zvolna a nevýrazně: celkově zde dochází k vzestupu zhruba o 1 % během více než dvou století. Z analyzovaných textů v tomto období dále ustupují a nakonec zcela mizí spřežky zmíněné v předchozím odstavci a vytrácí se zvyk mnoha starších tiskařů mechanicky označovat foném /f/ digrafem ff. Vedle různého stupně důslednosti provedení těchto vývojových změn vyplývají drobné rozdíly mezi jednotlivými sondami do jisté míry rovněž z různé frekvence přejatých slov, která s sebou často nesou mírné zvýšení průměrné účinnosti písemného záznamu (srov. korelace grafémů a fonémů v případech, které jsou příznačné pro přejatá slova, jako např. x – /ks, gz/; ia – /ija/; ie – /ije/ ap.). Tradiční písařské zkratky v analyzovaných dobových tiscích jsou z hlediska účinnosti záznamu již jevem zcela okrajovým (poslední výskyt v našich vzorcích lze najít v sondě 1750), bez znatelného vlivu na hodnotu získaných údajů. Zjištěný vývoj účinnosti v tiscích tohoto období tak z hlediska kvantitativního celkově potvrzuje konstatování, že bratrského pravopisu se užívalo „bez podstatných změn až (…) do konce 18. stol.“ (Komárek, 1969, s. 159; obdobně i u dalších zmiňovaných autorů).
K poslednímu – už jen nevýraznému – posunu v dosavadním vývoji účinnosti českého pravopisu dochází podle očekávání v polovině 19. stol., kdy se do zkoumaných textových sond poprvé promítají výsledky pravopisných reforem z 1. pol. 19. stol. S výjimkou ch z dobových tisků mizí poslední spřežky (zejména tradiční digraf dotud užívaný k označení /š/) a texty tak dosahují dnešní účinnosti. Nepodstatné kolísání v maximálním rozsahu 0,3 % zaznamenané sondami 1850–2000 je působeno vedlejšími vlivy, jako jsou výše zmíněné rozdíly ve frekvenci přejatých slov a náhodné rozdíly ve frekvenci „neefektivní“ spřežky ch a naproti tomu efektivnějších prvků (zejména dvojčlenných skupin grafémů bě, mě, pě, vě odpovídajících trojčlenným skupinám fonémů /bje/, /mňe/ nebo /mje/, /pje/, /vje/).
Druhou charakteristikou, jejíž vývoj jsme na uvedeném materiále sledovali, byla složitost pravopisu (tento termín není hodnotící; máme-li na mysli vyšší míru komplikovanosti, užíváme v dalším textu výrazu obtížnost). Ke kvantifikaci složitosti jsme zvolili postup, k jehož popisu je třeba alespoň stručně upřesnit užívání některých pojmů v následujícím textu a ve výsledných kvantitativních charakteristikách.
Při kvantifikaci složitosti českého pravopisu byla zjišťována frekvence korelací mezi jednotlivými grafémy (včetně specifických několikačlenných skupin grafémů) a odpovídajícími fonémy (včetně specifických několikačlenných skupin fonémů). Za specifické skupiny, při kvantifikaci postavené na roveň jednotlivým grafémům a fonémům, jsme považovali kombinace fonémů jako /bje/, /ťe/, /ňi/, /ije/ ap. a kombinace grafémů jako bě, tě, ni, ie, ije, yje, ch ap., tj. případy, pro které Sgall volí označení „řetěz fonémů“ a „řetěz grafémů“ (srov. Sgall, 1994, zejm. s. 174; zde i podrobnější výklad k tomu, proč je při srovnávání fonologické a písemné podoby textu v češtině vhodné pracovat nejen s jednotlivými grafémy a fonémy, ale i s některými jejich skupinami). Tuto skutečnost na příslušných místech v textu explicitně uvádíme, avšak v popisech grafů pro nedostatek místa užíváme pouze výrazů „foném“ a „grafém“ místo explicitních formulací jako „foném, resp. skupina fonémů“, „grafém/skupina grafémů“ ap.
Jako samostatné grafémy byly při kvantifikaci důsledně započítávány členy dvojic ú-ů, i-y, í-ý, v-u (i v době, kdy oba grafémy mohly označovat foném u, popř. ú), ij-j (slou[185]žící zápisu fonému /í/), dále tzv. dlouhé a krátké s, spřežky využívající dlouhého a krátkého s k zápisu fonému /š/, a také členy dvojic tvořených na jedné straně běžným zápisem fonému (resp. fonémové skupiny) a na straně druhé zápisem zkráceným „pomocí koncovky“ nebo „pomocí znaménka“. Jinak řečeno, jako grafémy byly při kvantifikaci započítávány i ty prvky, které v určité době měly či jen mohly mít povahu variant grafémů (zejména variant kombinatorních). K tomuto kroku nás vedla především skutečnost, že nutnost – nebo i jen možnost – volby mezi členy těchto párů (ať už jim v jednotlivých případech a jednotlivých obdobích přiznáváme jakýkoli status) a nutnost členy těchto párů jednoznačně interpretovat se nevyhnutelně podílí na celkové složitosti pravopisné soustavy. K povšechnému začlenění těchto případů mezi grafémy přispěla svým dílem ovšem i faktická nevyhraněnost rozdílu „grafém – (kombinatorní) varianta grafému“, vyplývající z neustálenosti pravopisu ve starších obdobích, a časově nevyhraněná proměnlivost přechodů variant grafémů v grafémy (např. i a y, mající dnes postavení dvou grafémů, lze ve starších fázích vývoje českého pravopisu považovat většinou spíše – nikoli vždy a jednoznačně – za varianty).
V dalším textu užíváme termínu pravopisná standardizace. Na rozdíl od současných zvyklostí nemáme na mysli jen standardizaci prostřednictvím kodifikací novodobého typu, jako jsou např. pravidla pravopisu nebo autoritativní slovníky, ale jde nám o faktické ustalování, resp. ustálení pravopisného úzu daného jazyka projevující se tím, že uživatelé pravopisu směřují k psaní jednotlivých fonémů, skupin fonémů, slov a jejich tvarů víceméně jednotným způsobem, resp. několika málo způsoby (viz existenci dublet i v dnešním vysoce standardizovaném českém pravopisu). Obecně vzato může toto ustalování vyplývat jak z vlivu cíleně formulovaných doporučení, příkazů nebo kodifikací, tak z explicitně neformulované tradice, z vlivu některých vynikajících významných a rozšířených publikací (např. bible, korán) ap. Jinak řečeno, rozumíme standardizací fakticky existující omezení možnosti individuálního nebo nahodilého užívání prostředků příslušné psací soustavy. Jsme si ovšem vědomi, že možnost individuálního nebo nahodilého úzu není v jednotlivostech zcela vyloučena ani v plně standardizovaných soustavách, avšak její využití se předpokládá víceméně jen ve výjimečných, zejména ozvláštněných případech (srov. např. anglické nite, lite, v současnosti často užívané záměrně na místě standardního night, light, nebo hříčky typu IN XS ‘in excess’, objevující se v posledních desetiletích často zejména v názvech anglických a amerických hudebních skupin a jejich písní a šířící se odtud mezi příslušníky mladších generací; k ojedinělým případům, kdy se podobných možností záměrně využívá v rozsáhlejších textech, patří některé povídky a básně Johna Lennona, srov. Lennon, 1968).
Kvantifikaci složitosti pravopisných soustav bylo v poslední době věnováno několik studií (z nich nejvýznamnější je zřejmě Van den Bosch – Content – Daelemans – De Gelder, 1994; zde i odkazy k dalším). Jejich výsledkem byla nejen zajímavá srovnání některých současných národních pravopisných soustav (česká k nim nepatřila), ale např. i kvantitativní podpora pro tvrzení (u nás nikoli nové, srov. zejm. Sgall – Novák, 1965), že složitost pravopisu se jeví podstatně jinak z hlediska píšícího a z hlediska čtenáře.
Dosavadní kvantifikace složitosti pravopisu mají tři společné vlastnosti: 1. materiálem pro získání kvantitativních charakteristik jsou soubory izolovaných slov, nikoli texty; 2. kvantitativní charakteristiky jsou získávány srovnáním fonologického zápisu vybraných slov s jejich obvyklým (standardním) zápisem pomocí příslušné pravopisné [186]soustavy; 3. získané kvantitativní charakteristiky (jedna pro postižení složitosti zkoumané pravopisné soustavy z hlediska čtenáře a jedna pro postižení složitosti z hlediska píšícího) mají globální charakter, tj. nepostihují (a ani si nekladou za cíl postihnout) hlavní faktory, které se podílejí na výsledné hodnotě příslušné charakteristiky. Ze studie Van den Bosche – Contenta – Daelemanse – De Geldera (1994) je zřejmé, že kvantifikace vycházející z těchto principů mohou být adekvátní pro porovnání složitosti vysoce standardizovaných soustav, tj. pro porovnání toho druhu, pro jaký byly navrženy a také použity (současná pravopisná soustava francouzská, anglická a nizozemská). Rozšíříme-li však srovnání na soustavy – resp. vývojové stavy soustav – s výrazně odlišným stupněm standardizace, jeví se naznačená metoda jako prakticky nevyužitelná a její výsledky jako příliš globální, nedostatečně diferencované. Její nevyužitelnost se ukazuje už při výběru výchozího materiálu: při kvantifikaci vývoje složitosti v průběhu sedmi století nelze totiž vycházet z izolovaných slov zapsaných obvyklým (standardním) způsobem, neboť ve starších vývojových fázích pravopisu bychom ve velkém počtu případů nebyli vůbec s to vybrat nejen standardní způsob zápisu, ale mnohdy ani takový způsob zápisu, který by byl v dané soustavě – resp. v konkrétním jejím vývojovém stavu – jednoznačně nebo aspoň výrazně preferovaný (srov. např. starší české podoby jako rzieka – rzyeka – rzeka – ržeka; dielo – dyelo; dijlo – djlo aj., které si v různých obdobích různým způsobem konkurovaly). Jako problematické se v takovém případě jeví také vyjádření složitosti zkoumané pravopisné soustavy (resp. jednotlivých jejích vývojových stavů) pomocí pouhých dvou globálních kvantitativních charakteristik: je tu totiž zřejmě třeba jasně odlišit, jakou měrou jsou v soustavě zastoupeny jevy jednoznačné, jevy standardizované a jevy nepravidelné, neboť každá z těchto tří skupin představuje svébytný aspekt složitosti a podílí se na obtížnosti příslušné soustavy jinou měrou než skupiny ostatní.
Vzhledem k různorodosti srovnávaného materiálu, představujícího realizaci tří odlišných pravopisných principů na výrazně odlišných stupních standardizace, jsme pro kvantifikaci vývoje složitosti českého pravopisu zvolili následující postup:
1. Pomocí zvlášť vytvořeného programu byla transliterovaná podoba každého z výše uvedených 16 textových vzorků porovnána s jeho fonologickým přepisem; materiálem pro získání kvantitativních charakteristik byly tedy textové sondy v plné míře odrážející dobovou rozkolísanost – nebo naopak ustálenost – pravopisu, nikoli soubory izolovaných slov ve zvolené standardizované pravopisné podobě. Naše kvantifikace – stejně jako zmiňované kvantifikace zahraniční – je založena na srovnání fonémů (resp. skupin fonémů, viz výše) s odpovídajícími grafémy (skupinami grafémů). Vzhledem k této úrovni srovnání byly pro účely kvantifikace složitosti ze souborů vyřazeny (celkem nečetné) případy, v nichž byl zápis krácen pomocí titly, neboť toto krácení není vázáno na fonémy, resp. jejich vyhraněné několikačlenné skupiny, nýbrž na celá slova.
2. Porovnáním grafémů (grafémových skupin) v transliterované verzi textu s odpovídajícími fonémy (fonémovými skupinami) v transkribované verzi textu byly získány celkem čtyři dvojice charakteristik, v každé dvojici jedna charakteristika reprezentující složitost pravopisné soustavy z hlediska píšícího a druhá reprezentující složitost z hlediska čtenáře. Každá z těchto čtyř podvojných charakteristik (dále nazývaných asymetrie, jednoznačnost, standardizovanost a nepravidelnost; podrobněji viz níže) postihuje jiný aspekt složitosti pravopisné soustavy.
3. Pro získání porovnatelných kvantitativních charakteristik byly zjišťovány: a. počet grafémů (grafémových skupin) odpovídající každému jednotlivému fonému (fonémové [187]skupině) a počet fonémů (fonémových skupin) odpovídajících každému jednotlivému grafému (grafémové skupině); b. procentuální zastoupení jednoznačných přechodů v každém vzorku (výrazu přechod užíváme ve shodě se Starým, 1992, zejm. s. 37n.); c. procentuální zastoupení standardizovaných přechodů; d. procentuální zastoupení nepravidelných přechodů.
Za jednoznačné přechody byly pro účely kvantifikace považovány z hlediska čtenáře všechny případy, kdy v daném textu odpovídal jednomu určitému grafému nebo jedné určité skupině grafémů vždy jen jeden určitý foném nebo jedna určitá skupina fonémů. Z hlediska píšícího byly analogicky považovány za jednoznačné ty přechody, kdy jednomu určitému fonému (skupině) odpovídal vždy jen jeden určitý grafém (skupina). Například byl-li foném /m/ v určitém textu zapsán vždy grafémem m, foném /í/ vždy zapsán jako ij a skupina fonémů /ťe/ jako tě, byly přechody /m/ – m, /í/ – ij, /ťe/ – tě započítány jako jednoznačné z hlediska píšícího; podobně pokud např. grafémům a grafémovým skupinám a, x, bě odpovídaly ve fonologickém přepisu daného textu vždy fonémy či skupiny /a/, /ks/, /bje/, byly přechody a – /a/, x – /ks/, bě – /bje/ započítány jako jednoznačné z hlediska čtenáře.
Přechody, které v daném textu nebyly jednoznačné, byly dále děleny na standardizované a nepravidelné. Oba typy přechodů jsou asymetrické, neboť jediné jednotce na jedné straně odpovídá vždy více než jedna jednotka na straně druhé, tj. jednomu fonému, resp. skupině fonémů, odpovídá několik grafémů, resp. skupin grafémů, a naopak. Za standardizované přechody byly považovány ty případy, kdy v daném textu jednomu určitému grafému nebo grafémové skupině odpovídalo několik fonémů nebo fonémových skupin (resp. jednomu určitému fonému/fonémové skupině několik grafémů/grafémových skupin), avšak nikoli nahodile, nýbrž s pravidelnou, ustálenou distribucí. Tak například odpovídal-li fonému /ú/ v daném textu v určitých pozicích pravidelně grafém ú a v jiných pozicích pravidelně grafém ů, byl přechod /ú/ – ú, ů započítán jako jeden standardizovaný přechod z hlediska píšícího; podobně pokud grafému v odpovídal v určitých případech foném /v/ a v jiných (vlivem asimilace nebo neutralizace znělosti) foném /f/, byl přechod v – /v/, /f/ započítán jako jeden standardizovaný přechod z hlediska čtenáře. (Při naší kvantifikaci byly standardizované přechody vznikající v neutralizační pozici postaveny na roveň standardním přechodům vznikajícím asimilací znělosti, a případy jako kov /kof/ – kovu /kovu/ byly tedy započítány jako vztah grafému v ke dvěma fonémům (/f/, /v/), nikoli jako vztah grafému k jednomu archifonému. Uvědomujeme si výhrady, které je možno vznést jak proti takovému praktickému rozčlenění archifonému na dva fonémy, tak proti opačnému postupu, který by při kvantifikaci vedl ke ztotožnění archifonému s fonémem.) V zásadě naše standardizované přechody odpovídají případům, které Sgall (1994, s. 173) v novodobých kodifikovaných pravopisných soustavách charakterizuje slovy: „Tam, kde není splněna podmínka jednoznačnosti pravopisu (výslovnosti), určují pravidla pravopisu (výslovnosti) pro daný jazyk podmínky výběru toho nebo onoho způsobu psaní (výslovnosti) pro daný foném (grafém).“ Podmínky výběru jednotlivých způsobů psaní a výslovnosti byly ovšem ve starší době často dány pouze tradicí, napodobením úzu některé prestižní publikace ap., jak bylo naznačeno výše.
Za nepravidelné přechody byly považovány ty případy, kdy jednomu určitému fonému nebo fonémové skupině odpovídalo v daném textu několik grafémů nebo grafémových skupin (resp. jednomu určitému grafému/grafémové skupině několik [188]fonémů/fonémových skupin), a to více či méně nahodile. Pokud v daném textu odpovídaly například fonému /č/ nahodile grafémy a grafémové skupiny č, c, cž, cz (nepravidelné užívání diakritických znamének a spřežek), byl přechod /č/ – č, c, cž, cz započítán jako jeden nepravidelný přechod z hlediska píšícího; podobně pokud skupině grafémů cz odpovídaly nahodile fonémy /č/, /c/, byl přechod cz – /č/, /c/ započítán jako jeden nepravidelný přechod z hlediska čtenáře.
Naznačené dělení určené pro potřeby vývojové kvantifikace se liší od dělení, která pro potřeby svých analýz vypracovali jak Sgall (1994, s. 173n.), tak Starý (1992, s. 29). (Sgall rozlišuje: a. případy plně jednoznačné, b. relativně jednoznačné, c. pravidelné odchylky, d. morfematické odchylky, e. diferenční odchylky, f. lexikální odchylky a plně nepravidelné případy; Starý vyděluje přechody jednoznačné a nejednoznačné; nejednoznačné se pak dále dělí na ty, jejichž nejednoznačnost je odstranitelná v rámci rozsáhlejšího úseku projevu, a ty, jejichž nejednoznačnost je permanentní, což jsou jednak dublety, jednak případy, kdy vztah mluvní a psací soustavy není vztahem nutnosti.) Odlišnost našeho dělení vyplývá především ze skutečnosti, že oba autoři analyzují soustavy již konstituované, zkonsolidované, standardizované, nikoli soustavy, které se teprv konstituují, konsolidují či postupně standardizují, tj. soustavy, s nimiž máme co do činění po většinu dosavadního vývoje češtiny. V zásadě platí, že Sgallovy případy plně jednoznačné odpovídají našim jednoznačným přechodům, všechny ostatní skupiny vydělené u Sgalla odpovídají našim (nejednoznačným) standardizovaným přechodům, což se vztahuje i na jeho „plně nepravidelné případy“ (např. sypat, myslet, zpěv), které jsou sice nepravidelné z hlediska systému a funkce (podle Sgallova vymezení „jsou dány jen tradicí, bez synchronního funkčního využití“), ale z hlediska čtenáře i píšícího jsou plně standardizované v tom smyslu, že způsob psaní tu není libovolný, je stanoven kodifikací, tradicí atd. Pokud jde o dělení Starého, jeho rozdíl mezi jednoznačnými a nejednoznačnými přechody odpovídá našemu rozdílu mezi jednoznačnými přechody a (nejednoznačnými) přechody standardizovanými, ovšem za předpokladu, že termín dubleta vztahujeme pouze na případy standardizované (tj. např. na současné kodifikované případy jako kubismus – kubizmus atd. nebo starší dvojice typu maso – masso, něco – nětco ap.), nikoli na případy silně rozkolísaného, popř. teprv se formujícího úzu, jaké jsme uvedli výše jako příklady nepravidelných přechodů. Se Starého přechody bez vztahu nutnosti mezi mluvní a psací soustavou nepracujeme, neboť podle autorova vymezení (Starý, 1992, s. 26n.) jde o přechody v piktografických soustavách a těmi české texty nebyly běžně zaznamenávány. Jak je zřejmé, naše členění ve skutečnosti pouze přidává k oběma citovaným dělením skupinu nepravidelných přechodů, které se v současné češtině v zásadě nevyskytují (za výjimku by snad bylo možno považovat přechodné případy momentálně nestandardizovaného, a tedy dočasně nahodile kolísajícího psaní některých přejímaných – nikoli ještě přejatých – slov; jde o případy jako cocktail, coctail, koktail, kokteil, koktejl … zhruba z přelomu 50. a 60. let nebo novější boutique, boutic, boutik, butic, butik, butyk). Naše kvantitativní údaje lze tedy bez větší nepřesnosti vztáhnout k pojmům užívaným u obou autorů.
Při naznačeném lišení jednoznačných, standardizovaných a nepravidelných přechodů lze navíc naše kvantitativní charakteristiky uvést do souladu i s některými výrazy terminologické nebo částečně terminologické povahy (zejména „ustálenost“, „neustálenost“ a „rozkolísanost“, viz níže), kterých se v souvislosti s různými aspekty složitosti pravopisné soustavy už tradičně užívá v historicky, resp. vývojově orientovaných pracích, [189]popř. i v pracích jiných. Celkově se navrženým lišením tří druhů přechodů snažíme zjemnit prostou opozici „jednoznačnost – nejednoznačnost“, s níž se obvykle pracuje v dosavadních kvantifikacích složitosti pravopisu. Pokoušíme-li se charakterizovat složitost nestandardizovaných nebo jen částečně standardizovaných pravopisných soustav, jeví se takové zjemnění jako nevyhnutelné, protože míra obtížnosti nejednoznačných standardizovaných přechodů se zásadně liší od míry obtížnosti nejednoznačných nepravidelných přechodů, a každý z těchto dvou druhů tedy výrazně jinak ovlivňuje celkovou vnímanou obtížnost příslušné soustavy jak z hlediska píšícího, tak z hlediska čtenáře.
Jak už bylo řečeno, naše kvantifikace složitosti českého pravopisu vyúsťuje do čtyř charakteristik, pro něž volíme označení asymetrie, jednoznačnost, standardizovanost a nepravidelnost.
Asymetričnost vztahu foném/fonémová skupina – grafém/grafémová skupina a grafém/grafémová skupina – foném/fonémová skupina byla kvantifikována z hlediska píšícího jako průměrný počet různých grafémů (skupin) odpovídajících v daném textu jednomu fonému (skupině); z hlediska čtenáře byla kvantifikována analogicky jako průměrný počet různých fonémů (skupin) odpovídajících v daném textu jednomu grafému (skupině). Hodnota asymetrie v tomto pojetí tedy vyjadřuje průměrný počet způsobů, jimiž byl v daném textu zapsán jeden foném nebo vyhraněná skupina fonémů, a průměrný počet způsobů, jimiž bylo v daném textu možno číst jeden grafém (vyhraněnou skupinu grafémů).
Jednoznačnost daného stavu pravopisné soustavy z hlediska píšícího je kvantifikována jako procentuální zastoupení jednoznačných přechodů foném/fonémová skupina – grafém/grafémová skupina; z hlediska čtenáře je kvantifikována jako procentuální zastoupení jednoznačných přechodů grafém/grafémová skupina – foném/fonémová skupina. Procentuální zastoupení se přitom týkalo typů (types), nikoli exemplářů, výskytů (tokens); stejně tomu bylo i při kvantifikaci standardizovanosti a nepravidelnosti.
Standardizovanost byla z hlediska píšícího kvantifikována jako procentuální zastoupení standardních přechodů foném/fonémová skupina – grafém/grafémová skupina; z hlediska čtenáře jako procentuální zastoupení standardních přechodů grafém/grafémová skupina – foném/fonémová skupina. Standardizovanost v tomto slova smyslu odpovídá výrazu ustálenost, kterého se někdy užívá v souvislosti s konkrétními vývojovými stavy pravopisných soustav.
Nepravidelnost byla z hlediska píšícího kvantifikována jako procentuální zastoupení nepravidelných přechodů foném/fonémová skupina – grafém/grafémová skupina, z hlediska čtenáře jako procentuální zastoupení nepravidelných přechodů grafém/grafémová skupina – foném/fonémová skupina. Zvýšený výskyt nepravidelných přechodů ve starších památkách bývá často označován jako rozkolísanost nebo neustálenost dobového pravopisného úzu; v tomto smyslu jsou oba výrazy synonymní s nepravidelností v našem pojetí, a procento nepravidelných přechodů v textu lze tedy chápat i jako vyjádření míry rozkolísanosti, resp. neustálenosti.
Výsledky kvantifikace uvedených aspektů složitosti českého pravopisu jsou shrnuty v tabulce 2 (sloupce 2 – 9) a v grafech 2 – 5. Při jejich interpretaci je třeba mít na mysli vzájemnou souvislost a pravý význam zjištěných hodnot čtyř zkoumaných charakteristik. Z nich pouze asymetrie postihuje složitost pravopisu globálně: ukazuje, jak dalece je pravopisná soustava v daném bodě svého vývoje vzdálena od ideálního stavu, tj. od [190]stavu plné jednoznačnosti, jemuž odpovídá hodnota 1; při této hodnotě asymetrie by jednomu fonému odpovídal právě jeden grafém (ideální stav z hlediska píšícího) a jednomu grafému právě jeden foném (ideální stav z hlediska čtenáře). Jak je zřejmé (a jak je dobře známo), plné jednoznačnosti nedosahuje český pravopis ani dnes, i když se jí – alespoň z hlediska čtenáře – blíží svými hodnotami okolo 1,2 v posledních sondách. Z hlediska čtenáře je současný pravopis vzdálen od ideálního stavu především vlivem případů, ve kterých dochází k asimilaci, resp. neutralizaci znělosti (srov. dvojice jako zub – zubu, svatý – svatba, v nichž jedinému grafému odpovídají dva fonémy), a vlivem grafémových skupin di, ni, ti, jimž odpovídají dvojice fonémových skupin /ďi/, /di/; /ňi/, /ni/; /ťi/, /ti/ (rozdíl mezi domácími a přejatými slovy); jiné vlivy jsou tu jen okrajové a jsou zpravidla spojeny s přejatými slovy (např. korelace x – /ks/, /gz/). Z hlediska píšícího je ovšem dnešní český pravopis vzdálen ideálnímu stavu podstatně více než z hlediska čtenáře (hodnoty mezi 1,62 a 1,98 v posledních sondách); případů, které se podílejí na vyšších hodnotách asymetrie z hlediska píšícího, je nepoměrně větší počet a jsou velmi různorodé (viz přehled a podrobnou analýzu u Sgalla, 1994). Uvedený výrazný rozdíl mezi hodnotami asymetrie z hlediska čtenáře a píšícího mimo jiné tvoří obecné pozadí pro skutečnost, že v češtině jsou homografy (stálý učebnicový příklad: panický) jevem zcela ojedinělým, kdežto homofony (být – bít – beat, zpráva – správa, kůra – kúra atd.) jsou poměrně hojné.
ROK | asymetrie: | asymetrie: | jednoznačnost: | jednoznačnost: | standardizace: | standardizace: | nepravidelnost: | nepravidelnost: |
|
|
| % | % | % | % | % | % |
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
1250 | 2,28 | 2,24 | 40,74 | 35,19 | 1,85 | 11,11 | 57,41 | 53,70 |
1300 | 3,16 | 2,13 | 29,31 | 38,55 | 6,90 | 7,23 | 63,79 | 54,22 |
1350 | 2,21 | 2,00 | 45,90 | 46,77 | 4,92 | 9,68 | 48,18 | 43,55 |
1400 | 2,44 | 1,64 | 24,00 | 61,19 | 18,00 | 7,46 | 58,00 | 31,34 |
1450 | 2,33 | 1,63 | 33,93 | 54,79 | 17,86 | 13,70 | 48,21 | 31,51 |
1500 | 2,47 | 1,51 | 39,34 | 55,13 | 21,31 | 7,69 | 39,34 | 37,18 |
1550 | 2,61 | 1,36 | 32,76 | 65,91 | 25,86 | 12,50 | 41,38 | 21,59 |
1600 | 2,09 | 1,34 | 55,36 | 63,89 | 33,93 | 27,78 | 10,71 | 8,33 |
1650 | 2,09 | 1,27 | 52,54 | 73,68 | 35,59 | 18,42 | 11,86 | 7,89 |
1700 | 2,16 | 1,26 | 55,56 | 74,32 | 35,19 | 16,22 | 9,26 | 9,46 |
1750 | 2,02 | 1,27 | 51,92 | 71,64 | 42,31 | 16,42 | 5,77 | 11,94 |
1800 | 1,83 | 1,19 | 64,71 | 77,42 | 33,33 | 17,74 | 1,96 | 4,84 |
1850 | 1,85 | 1,21 | 63,46 | 77,05 | 36,54 | 22,95 | 0,00 | 0,00 |
1900 | 1,95 | 1,19 | 55,36 | 74,65 | 44,64 | 25,35 | 0,00 | 0,00 |
1950 | 1,62 | 1,15 | 65,91 | 83,33 | 34,09 | 16,67 | 0,00 | 0,00 |
2000 | 1,98 | 1,20 | 56,36 | 72,86 | 43,64 | 27,14 | 0,00 | 0,00 |
Tabulka 2.
Obecně vzato, vyšší hodnoty asymetrie mezi repertoárem fonémů a repertoárem grafémů užívaných v daném jazyce znamenají větší složitost pravopisu, ale nemusejí nevyhnutelně znamenat jeho větší obtížnost. Jednotlivé druhy přechodů mezi fonémy a grafémy (a naopak) představují pro uživatele rozdílně obtížné součásti příslušné pravo[191]pisné soustavy, a proto je hodnoty asymetrie jako globální charakteristiky třeba vidět v souvislosti s hodnotami jednoznačnosti, standardizovanosti a nepravidelnosti, tj. dílčích charakteristik, které udávají, jak se na zjištěné hodnotě asymetrie podílejí uvedené tři typy přechodů. Ani vztah těchto přechodů k obtížnosti pravopisu však není přímočarý. Pouze hodnoty jednoznačnosti, vyjadřující zastoupení ideální složky v pravopisné soustavě, mají stejný význam pro čtenáře i pro píšícího, a to v tom smyslu, že vyšší hodnoty jednoznačnosti znamenají vždy větší uživatelskou výhodnost, větší snadnost dané soustavy. Hodnoty standardizace a nepravidelnosti mají naproti tomu pro oba uživatele soustavy význam podstatně rozdílný.
Pro čtenáře představují nepravidelné přechody bezpochyby nejkomplikovanější případy při užívání dané soustavy, případy, které je třeba zjednoznačňovat s pomocí kontextu (například: při neoznačování kvantity a tzv. měkkosti souhlásek a při nestandardizovaném užívání spřežek a grafémů i, y, běžném v nejstarších vývojových fázích českého pravopisu, nebyl ani zběhlý český čtenář s to z obrazu slova samého zjistit, zda např. zzwaty interpretovat jako svatý, svatí, sváti, svátý, zváti, žváti atd.). Interpretace standardizovaných přechodů je naproti tomu pro čtenáře zautomatizovaná, do značné míry mechanická (např. průměrný dnešní čtenář interpretuje psané totiž zcela automaticky jako /toťiš/, aniž aktuálně vnímá nejednoznačnost přechodů ti – /ťi/, /ti/ a ž – /ž/, /š/. Za základní míru obtížnosti pravopisné soustavy z hlediska čtenáře lze tedy v rámci naší kvantifikace považovat zastoupení nepravidelných přechodů, tj. hodnoty nepravidelnosti.
Pro píšícího naproti tomu jsou (resp. po většinu dosavadního vývoje českého pravopisu byly) nepravidelné přechody složkou podstatně méně komplikovanou než přechody standardizované. Standardizované přechody představují pro píšícího osvojování a aplikaci pravidel, pravopisných zvyklostí, tradic ap., přičemž tato aplikace – jak je dobře známo i ze současnosti – v řadě případů vzdoruje automatizování, vyžaduje víceméně stálou vědomou aktivitu a ani pro zběhlého uživatele odborně standardizovaného pravopisu není vždy bez obtíží. Na druhé straně přechody nepravidelné z hlediska píšícího představují (až do poloviny minulého století, kdy z českého pravopisu mizejí pod vlivem kodifikací, viz tabulka 2, sloupce 8 a 9, a graf 5) oblast více či méně uvolněného úzu, oblast rozkolísanosti a jisté libovůle, popř. oblast tápání či experimentování, v krajním případě otevřenou až anarchii (o pravopisné anarchii se mluví např. v souvislosti s Hankovými pravopisnými experimenty v Prvotinách pěkných umění; srov. Cuřín, 1985, s. 80). Za základní míru obtížnosti pravopisné soustavy z hlediska píšícího lze tedy v rámci naší kvantifikace považovat zastoupení standardizovaných přechodů, tj. hodnoty standardizace.
Jak je zřetelně vidět z grafů 4 a 5, od roku 1850 do současnosti má nepravidelnost českého pravopisu (zdůrazněme: nepravidelnost v našem pojetí) nulovou hodnotu; srov. k tomu Sgallovu (1994, s. 279) formulaci „český pravopis je od poloviny minulého století vcelku ustálen“, detailně rozebírá toto období završující se standardizace, resp. přímo kodifikace Sedláček (1993). Z hlediska čtenáře to znamená, že z českého pravopisu zmizely přechody, které představovaly jádro obtížnosti, a zůstaly jen přechody standardizované (mající menší zastoupení než z hlediska píšícího a jsoucí navíc z hlediska čtenáře vysoce zautomatizované, viz výše) a přechody jednoznačné, ideální, mající výrazně vyšší zastoupení než z hlediska píšícího. Z hlediska píšícího naopak nedošlo odstraněním nepravidelných přechodů k žádnému výraznému zjednodušení,
– průměrný počet různých grafémů užívaných k zápisu jednoho fonému
– průměrný počet různých fonémů označovaných jedním grafémem
Graf 2. Vývoj asymetrie foném-grafém a grafém-foném
neboť podstatu obtížnosti z jeho hlediska tvoří standardizované přechody, jejichž procentuální zastoupení zůstalo víceméně nezměněno (k výkyvům viz níže). Tyto skutečnosti lze považovat za průkaznou kvantitativní podporu pro konstatování, že „čtení (…) je v češtině (…) spojeno s obtížemi daleko menšími než psaní“ (Sgall, 1994, s. 282, podobně na s. 271).
Zjištěnými kvantitativními charakteristikami lze navíc prokázat, že toto konstatování platí pro český pravopis již po několik staletí. Charakteristika představující jádro obtížnosti z hlediska čtenáře (nepravidelnost) přesahuje v počátečních obdobích vývoje českého pravopisu velmi výrazně hodnotu charakteristiky postihující jádro obtížnosti z hlediska píšícího (standardizovanost); porovnáme-li hodnoty obou charakteristik v tabulce 2 (sloupce 6 a 9), zjistíme, že je čtení obtížnější než psaní po celou dobu užívání jednoduchého a staršího i mladšího spřežkového pravopisu a více než sto let po uvedení pravopisu diakritického. Obě charakteristiky se protínají mezi léty 1500 a 1550: nepravidelnost z hlediska čtenáře v tomto období klesá z hodnoty 37,18 % na 21,59 %, standardizace z hlediska píšícího naopak stoupá z 21,31 % na 25,86 % (povšimněme si, že jde právě o dobu, kdy prodělává první skutečný rozmach knihtisk a kdy vzniká první česká mluvnice, v nemalé míře věnovaná právě pravopisným otázkám). Hodnoty obou charakteristik se brzy nato, kolem roku 1600, navzájem prudce oddalují (nepravidelnost klesá na 8,33 %, standardizace vzrůstá na 33,93 %) a zůstávají trvale vzdáleny až do současnosti, přičemž rozdíl mezi nimi roste z 25 % na více než 40 % – a se vzrůstající obtížností psaní roste ovšem i počet příruček, které se přímo psaním zabývají, standardizují ho, kodifikují, vysvětlují. Celkově lze tedy říci, že v českých tiscích je čtení výrazně snazší než psaní od přelomu 16. a 17. století.
Na základě vývoje charakteristik představujících jádro obtížnosti pravopisu z hlediska píšícího (kódujícího) a čtenáře (dekódujícího) můžeme dospět i k některým obecnějším závěrům. Z hlediska píšícího obtížnost českého pravopisu během sedmi století výrazně vzrostla (v 2. pol. 13. stol. má standardizace hodnotu 1,85 %, na konci 20. stol. 43,64 %), z hlediska čtenáře naopak výrazně klesla (nepravidelnost má na počátku dosavadního vývoje hodnotu 53,7 %, na konci 0 %). Znamená to, že během vývoje českého pravopisu
[193]
– procento jednoznačných přechodů foném-grafém (hledisko píšícího)
– procento jednoznačných přechodů grafém-foném (hledisko čtenáře)
Graf 3. Vývoj jednoznačnosti českého pravopisu
se velká část „komunikačního břemena“ (Tobin, 1990, s. 59) přesunula z dekódujícího na kódujícího a ten během doby postupně vytvářel – za cenu vzrůstajících obtíží – stále jednoznačnější, z hlediska dekódujícího méně nepravidelné texty. Stěží lze předpokládat, že píšící přebíral toto břemeno samovolně, spontánně, neboť kódující i dekódující mají přirozený sklon ulehčovat si svou úlohu, nikoli ji trvale činit obtížnější, a snaží se tedy přesouvat břemeno úspěchu komunikačního aktu v co největší míře na svůj komunikační protějšek. Oboustranná minimalizace úsilí musí ovšem mít jisté meze, nemá-li dojít ke zhroucení komunikace. Pokud takové nebezpečí hrozí, zvyšuje se obvykle úsilí na straně kódujícího v tom smyslu, že se snaží volit znaky jednoznačnější, snadněji interpretovatelné ze strany dekódujícího (srov. Tobin, 1990, s. 58). Toto obecné pozadí měl nepochybně i vývoj složitosti českého pravopisu. Jak je zřejmé z vysokého zastoupení nepravidelných přechodů (viz graf 5) a z mizivého zastoupení přechodů standardizovaných (graf 4), počáteční období vývoje se vyznačovalo jen velmi malým písařským úsilím o volbu znaků snadno interpretovatelných čtenářem. Zátěž inferenčních schopností dekódujícího by z obecného pohledu byla v této době téměř neúnosná, kdyby nešlo naprostou většinou o záznamy (glosy, krátké překlady ap.) určené víceméně pro soukromou potřebu, tj. o texty, u nichž píšící/kódující byl totožný se čtenářem/dekódujícím, nebo o texty (biblický text, modlitby, bohoslužebné formule, ale také legendy aj.) určené omezenému okruhu zasvěcených čtenářů a předčitatelů (srov. Cuřín, 1985, s. 23). Šlo o dekódující, kteří nepochybně sdíleli velké množství informací a zvyklostí s kódujícím, a byli proto schopni snáze číst i zápisy z obecného hlediska velmi těžko interpretovatelné, pokud se týkaly obvyklých témat. (I dnes ostatně soukromé psané texty nebo texty určené zasvěcencům, resp. odborníkům v dané oblasti často obsahují prvky, které jsou z obecného hlediska málo srozumitelné, jako např. neobvyklé symboly, zkratky ap.)
Spolu s tím, jak okruh předpokládaných čtenářů rostl a přestával se omezovat na malé skupiny zasvěcených vzdělanců, vzrůstaly také nároky čtenářů na snadnější interpretovatelnost psaných textů a tlaky na písaře (mezi předpokládanými čtenáři byli samozřejmě i zadavatelé opisů, jejichž přání mohl písař stěží zcela ignorovat; navíc tu působila
– procento standardizovaných přechodů foném-grafém (hledisko píšícího)
– procento standardizovaných přechodů grafém-foném (hledisko čtenáře)
Graf 4. Vývoj standardizovanosti českého pravopisu
skutečnost, že i sám písař se stával stále častěji čtenářem textů jiných než svých vlastních, a problémy spojené s jejich čtením tedy plně pociťoval). V době, kdy většina textů definitivně ztratila vázanost na malé, z komunikačního hlediska výjimečné skupiny čtenářů s vysokým inferenčním potenciálem, tj. zejména když došlo k rozmachu knihtisku, byl již kódující nucen přejmout značnou část zmíněného komunikačního břemena a zajistit co možná snadnou interpretovatelnost textu pro „průměrného“ čtenáře. Zřetel ke čtenáři tak byl v podstatě vynucen měnícím se kulturním a sociálním kontextem, v němž texty fungovaly, a trvale vzrůstal; postupem času se tak začala formovat představa o pravopisné kultivovanosti a vyhraňovat se ponětí o závazných rysech textů určených veřejnosti. V roce 1533 autoři první české mluvnice již upozorňují na závazky písařů a tiskařů ke čtenáři velmi důrazně: „kdež v psání a v mluvení není srovnání, z toho veliký zmatek a nerozum v slovích i v řeči musí pocházeti. (…) ti, kteříž biblí tiskli (…), někde takto, jinde jinače ta též slova psali, a čtenáři ke čtení žádné zprávy nedali“ (srov. Čejka – Šlosar – Nechutová, 1991, s. 20).
Obecné komunikační souvislosti i některé obecnější skutečnosti z vývoje českého pravopisu jsme připomněli na podporu závěru, k němuž nás vede výše konstatovaný dlouhodobý výrazný růst obtížnosti českého pravopisu z hlediska píšícího a naopak dlouhodobé výrazné klesání obtížnosti českého pravopisu z hlediska čtenáře. Tento závěr zní: určující osou vývoje složitosti českého pravopisu je vývoj k menší obtížnosti čtení; vývoj v oblasti psaní (jeho zpravidelňování, ustalování, standardizace – a tím ovšem vzrůstající obtížnost) je této základní ose podřízen, resp. je od ní odvozen. Uvedený závěr nijak neupozaďuje píšícího (písaře, tiskaře, popř. tiskárenského korektora atd.) ani reformátora, standardizátora či kodifikátora (Hus, Optát, Blahoslav, Šteyer aj., až do současnosti) jako realizátory vývoje, ale naznačuje, že základní příčina vývoje složitosti pravopisu byla abstraktnější: byly jí vzrůstající potřeby a vzrůstající tlak vzrůstajícího počtu čtenářů na jednoznačnější, přesnější, a tedy snáze interpretovatelný, dekódovatelný záznam textu. Aktivita píšících a jejich rostoucí zřetel ke čtenáři jsou v tomto smyslu až sekundární, jsou reakcí na tento tlak.
– procento nepravidelných přechodů foném-grafém (hledisko píšícího)
– procento nepravidelných přechodů foném-grafém (hledisko čtenáře)
Graf 5. Vývoj nepravidelnosti českého pravopisu
Působení uvedených vývojových mechanismů je nepochybně třeba vidět v příslušných souvislostech sociálních, kulturních i technických, avšak o primárnosti vývoje k menší obtížnosti čtení svědčí do značné míry i hladký, stabilní pokles hodnot asymetrie z hlediska čtenáře (sloupec 3 tabulky 2 a graf 2: průměrný počet fonémů označovaných jedním grafémem). Je to právě tato globální vývojová charakteristika a její trvalé směřování k minimální asymetrii (a tedy maximální jednoznačnosti) z hlediska čtenáře, které zůstává po celých sedm století prosto jakýchkoli výraznějších výkyvů, nezasaženo takovými změnami, jako je střídání pravopisných principů, nástup knihtisku, zásadní přelom v ustálenosti pravopisného úzu ve 2. polovině 16. stol. nebo úpravy pravopisu v 1. polovině 19. stol. Z hlediska vývoje složitosti to znamená, že tyto změny, mající v popisech vývoje českého pravopisu centrální postavení, jsou ve skutečnosti změny v prostředcích a jejich úzu, nikoli (hodnoceno z hlediska čtenáře) změny ve výsledcích užívání těchto prostředků. Ve shodě s tímto konstatováním kolísají hodnoty asymetrie z hlediska píšícího (sloupec 2 tabulky 2 a graf 2: průměrný počet grafémů užívaných k zápisu jednoho fonému) podstatně výrazněji: mimořádným výkyvem se v nich obráží nástup spřežkového pravopisu (sonda 1300), stoupají mezi roky 1450 a 1550 (zvýšené užívání spřežek šířící se z dobových tisků zmíněné již výše, v souvislosti s vývojem účinnosti v tomto období), klesají vlivem ustálení v rámci bratrského pravopisu (sonda 1600) a výrazně reagují na změny v počtu cizích prvků v textu (sonda 1950; podrobněji viz níže). Značná rozkolísanost vývoje asymetrie z hlediska píšícího obráží proměnlivost množství prostředků, které měl písař či tiskař k dispozici a do jisté míry (a do jisté doby, v zásadních rysech ne déle než do konce 16. stol.) jistě i hledání či tápání píšícího, jeho spontánní, nesystematickou volbu z nabízejících se prostředků. Jako celek výkyvy ve vývoji asymetrie z hlediska píšícího naznačují, že (na rozdíl od vývoje asymetrie z hlediska čtenáře) nejde o vývoj v hlavní, vysoce nezávislé vývojové linii, nýbrž o vývoj v linii sekundární, závislý na množství vnějších vlivů.
Hodnoty dílčích charakteristik (jednoznačnost, standardizovanost a nepravidelnost) kolísají ve většině případů ještě podstatně výrazněji než hodnoty asymetrie z hlediska [196]píšícího, avšak jejich výkyvy jsou působeny v zásadě stejnými vlivy. Část výkyvů je ovšem v obou případech dána do jisté míry i faktory náhodnými. Patří k nim opět výskyt cizích prvků v daném textovém vzorku, projevující se z hlediska píšícího i čtenáře poklesem hodnot jednoznačnosti a vzrůstem hodnot standardizovanosti a asymetrie z hlediska píšícího. Míru tohoto vlivu lze posoudit porovnáním hodnot uvedených charakteristik v sondách 1900, 1950 a 2000: v sondách 1900 a 2000 se vyskytují cizí prvky v množství běžném v nové češtině a působí naznačené změny; v textovém vzorku 1950 (Říhův Venkovan) se naproti tomu cizí pravopisné prvky prakticky nevyskytují, a hodnoty jsou tedy znatelně odchylné. V uvedených třech novočeských sondách jde zhruba o desetiprocentní výkyvy působené – v případě přítomnosti cizích prvků – zvýšeným množstvím nejednoznačných standardizovaných přechodů (případy zčásti zmiňované už výše: /ije/ – ie, ije, /di/ – dy, di, x – /ks/, /gz/ atd.). V textových vzorcích z doby před rokem 1850 bylo zastoupení cizích pravopisných prvků relativně velmi malé a vcelku vyrovnané, a nelze tedy předpokládat, že mělo výraznější vliv na výsledné hodnoty.
Přes uvedené náhodné odchylky, resp. kolísání lze ovšem z průběhu změn v jednotlivých dílčích charakteristikách spolehlivě posoudit vliv rozmanitých konkrétních faktorů na složitost českého pravopisu. Pokud jde o postupné vystřídání pravopisu jednoduchého, spřežkového a diakritického, je i z vývoje jednoznačnosti, standardizovanosti a nepravidelnosti zřejmé, že z hlediska složitosti neměly tyto změny tak zásadní význam, jaký jim obvykle přisuzujeme (srov. malý odraz těchto změn v celkových hodnotách asymetrie, o němž byla řeč výše). Přechod z pravopisu spřežkového na diakritický ani dílčí rozdíl mezi starším a mladším spřežkovým pravopisem není z vývoje sledovaných charakteristik zřetelný; výraznou změnu hodnot působí pouze přechod od jednoduchého pravopisu ke spřežkovému (sonda 1300). Z hodnot jednotlivých aspektů složitosti je přitom zřejmá skutečnost, že uvedení (staršího) spřežkového pravopisu znamenalo z krátkodobého hlediska spíše zkomplikování situace než její zlepšení, neboť hodnoty asymetrie, nepravidelnosti a standardizace z hlediska písaře vzrostly (naopak hodnota jednoznačnosti z jeho pohledu klesla), a tento stav přitom nebyl vyvažován žádným mimořádně výrazným pozitivním posunem na straně čtenáře. Z toho, jak příznivě se po roce 1300 vyvíjela složitost z hlediska čtenáře a jak rychle se změnily nepříznivé hodnoty na straně píšícího, je zřejmé, že spřežkový pravopis byl kolem roku 1300 uváděn do písařské praxe nikoli pro své okamžité výhody, ale pro svůj potenciál, tj. s vizí podstatně překračující hranice soudobého stavu. Takový přístup je jistě obdivuhodný nejen z hlediska doby, v níž byl uplatněn (nezapomeňme, že ve své počáteční fázi byl spřežkový pravopis navíc velmi neekonomický a psací materiál byl na přelomu 13. a 14. stol. ještě značně nákladný, srov. výše), ale i z hlediska širšího, neboť pravopisné reformy a zásahy, které přišly později, svědčily mnohdy o mnohem menším smyslu pro delší vývojovou perspektivu. Obecně – na základě vývoje složitosti i účinnosti – lze konstatovat, že přechod od pravopisu jednoduchého k pravopisu spřežkovému byl přechodem od principu relativně vysoce účinného, ale vývojově uzavřeného, neumožňujícího jednoznačný zápis českého textu z hlediska čtenáře, k principu málo účinnému, avšak vývojově otevřenému, který jednoznačný záznam umožňoval; vlivem okolností ovšem vývoj úzu spřežkového pravopisu v češtině k vysoce jednoznačným záznamům nikdy nedospěl. Přecházení k pravopisu diakritickému, které vývoj spřežkového pravopisu přerušilo, je z hlediska složitosti změnou jen vnějškovou, vlastně málo závažnou, avšak představuje velmi významný krok z hlediska účinnosti. Lze tedy konstatovat, že přechod od [197]pravopisu spřežkového k diakritickému je přechodem od méně účinné soustavy k soustavě účinnější; nejde však o přechod principiální, neboť obě modifikace latinky a jejího úzu umožňují jednoznačný záznam.
Na rozdíl od přechodů mezi jednoduchým, spřežkovým a diakritickým pravopisem odráží většina dílčích charakteristik (a také jedna charakteristika globální: asymetrie z hlediska píšícího) velmi výrazně ustálení pravopisného úzu v rámci tzv. bratrského pravopisu (srov. vývojový zlom v sondě 1600 na grafech 2 – 5). Zastoupení nepravidelných přechodů z hlediska píšícího tu poklesá o 30 %, což znamená, že jde o největší pokles neustálenosti písařského, resp. tiskařského úzu v historii českého pravopisu. Znamená to současně, že rozšíření bratrského pravopisu prostřednictvím prestižních dobových tisků (zejména ovšem Bible kralické) a prvních mluvnic představuje zásadní přelom v užívání českého pravopisu z hlediska píšících – přelom, za jehož významem daleko zaostávají všechny obrozenské i pozdější kodifikace. Bratrský pravopis a vliv bratrských tisků by tedy měl mít ve výkladech o vývoji českého pravopisu podstatně významnější místo než doposud (vlivem převládající současné krátkodobé perspektivy je obvykle více prostoru věnováno novodobým kodifikacím, upravujícím úzus vlastně už jen v jednotlivostech), neboť z hlediska formování současné české pravopisné soustavy představuje stejně zásadní (i když povrchově méně nápadný) přelom jako přechod mezi jednotlivými pravopisnými principy.
Závěry, k nimž vedla kvantifikace vývoje účinnosti a složitosti českého pravopisu, lze shrnout do následujících bodů:
1. Zjištěný vývoj účinnosti českého pravopisu v obecných rysech odpovídá představám, k nimž je možno dospět na základě dosavadních detailních popisů. Výrazněji se od nich odlišuje v období mezi rokem 1450 a 1600, kdy dochází ke zřetelnému poklesu účinnosti, vyvolanému podle našeho názoru primárně technickými omezeními v tehdejších tiskárnách (tato omezení vyústila v častější užívání spřežek v tiscích) a sekundárně napodobením tisků v rukopisech.
2. Zjištěný vývoj složitosti naznačuje, že v českém pravopise existují významné vývojové linie, které jsou velkou měrou nezávislé na hlavní ose dosavadních popisů, tj. na trojici pravopis jednoduchý – pravopis spřežkový – pravopis diakritický; vývoj asymetrie grafém-foném představuje zřejmě nejvýznamnější z takových linií.
3. Ve vývoji jednotlivých aspektů složitosti českého pravopisu (jednoznačnosti, standardizovanosti a nepravidelnosti) se jako nejvýraznější změna projevuje ustálení pravopisného úzu v tzv. bratrském pravopisu okolo roku 1600.
4. Osou dosavadního vývoje složitosti českého pravopisu je vývoj k menší obtížnosti čtení; vzhledem k této ose je vývoj směřující k vyšší jednoznačnosti, standardizovanosti (a tedy obtížnosti) psaní až sekundární, odvozený (vyvolaný potřebami ze strany čtenářů).
5. V počátečním období vývoje českého pravopisu je čtení z obecného hlediska výrazně obtížnější než psaní, velká nejednoznačnost záznamu je však v té době vyvažována mimořádnými inferenčními možnostmi předpokládaného čtenáře: dobové české zápisy jsou určeny převážně pro soukromou potřebu (píšící/kódující je totožný se čtenářem/dekódujícím) nebo pro potřebu omezeného okruhu zasvěcených čtenářů (texty náboženské a texty určené k předčítání).
6. Obtížnost čtení a obtížnost psaní se vyrovnávají v 1. pol. 16. stol., tj. v době prvního skutečného rozmachu knihtisku a době vydání první české mluvnice. Přibližně od [198]přelomu 16. a 17. stol. je čtení v češtině výrazně snadnější než psaní. Přelom 16. a 17. stol. se tak celkově jeví jako zdaleka nevýznamnější období z hlediska vývoje složitosti českého pravopisu (viz i bod 3).
7. Z hlediska účinnosti a složitosti se přechod od jednoduchého pravopisu ke spřežkovému jeví jako přechod od principu, který je relativně vysoce účinný, ale neumožňuje z hlediska čtenáře jednoznačný zápis českého textu, k principu málo účinnému, avšak umožňujícímu jednoznačný záznam. Přechod od spřežkového pravopisu k diakritickému je přechodem od méně účinného principu k principu účinnějšímu; oba principy přitom umožňují jednoznačný záznam.
Některé naše závěry představují nepochybně jen explicitní formulace změn a souvislostí, které jsou natolik zřejmé, že je dosavadní popisy ponechávaly nevysloveny. Jsme si rovněž vědomi jak dílčí povahy našich charakteristik (jde koneckonců jen o dvě linie z těch, které by bylo možno ve vývoji českého pravopisu sledovat) a jejich částečné relativnosti vyplývající z různých možností přístupu k některým fonologickým a pravopisným jevům, tak jejich neúplnosti (naše kvantifikace složitosti vůbec nepostihuje např. obtíže, které píšícímu působí – podle našeho názoru do značné míry uměle a zbytečně – novodobé komplikované zásady psaní velkých písmen). K postižení dalších vývojových linií, stejně tak jako ke zpřesnění a širšímu ověření našich závěrů bude třeba podstatně rozsáhlejšího materiálu umožňujícího zachycení vývoje v hustší síti časových sond. Taková materiálová základna není v současné době bohužel k dispozici; v budoucnu by však i těmto zvýšeným nárokům měla vyhovět budovaná diachronní složka Českého národního korpusu.
LITERATURA
CARNAP, R.: Two Essays on Entropy. Ed. A. Schimony. University of California Press, Berkeley – Los Angeles – London 1977.
CEJNAR, J.: Odraz znělostní asimilace sykavek v spřežkových pravopisných systémech v češtině. SaS, 30, 1969, s. 150n.
COULMAS, F.: The Writing Systems of the World. Basil Blackwell, New York – Oxford 1989.
CUŘÍN, F.: Vývoj spisovné češtiny. SPN, Praha 1985.
ČADIL, J.: Psaný jazyk, grafémy, psané texty. SaS, 54, 1993, s. 9–17.
ČEJKA, M. – ŠLOSAR, D. – NECHUTOVÁ, J.: Gramatika česká Jana Blahoslava. MU, Brno 1991.
GEBAUER, J.: Historická mluvnice jazyka českého I. Hláskosloví. Praha 1894, zde zejm. s. 11–16.
HAVRÁNEK, B.: Vývoj českého spisovného jazyka. Skripta FF UK. SPN, Praha 1980.
HAVRÁNEK, B.: Vývoj českého spisovného jazyka. Československá jazykověda, řada II. Praha 1936.
KOMÁREK, M.: Historická mluvnice česká I. Hláskosloví. SPN, Praha 1969 (3. vyd.).
KOPECKÝ, M.: Úvod do studia staročeských rukopisů a tisků. SPN, Praha 1978.
KŘÍSTEK, V.: Staročeské pravopisné systémy. In: J. Bělič – A. Kamiš – K. Kučera: Malý staročeský slovník. SPN, Praha 1979, s. 693–704.
LAMPRECHT, A. – ŠLOSAR, D. – BAUER, J.: Historická mluvnice češtiny. SPN, Praha 1986.
LENNON, J.: The Penguin John Lennon. Penguin Books, Harmondswoth 1968.
LUTTERER, I.: K dvěma systémům spřežkového pravopisu v češtině 14. století. SlavPrag, XI, 1969, s. 73–78.
PORÁK, J.: Humanistická čeština. Hláskosloví a pravopis. UK, Praha 1979.
SEDLÁČEK, M.: K vývoji českého pravopisu. NŘ, 76, 1993, s. 57–71 a 126–138.
SGALL, P.: Lingvistický pohled na český pravopis. SaS, 55, 1994, s. 168–177 a 270–286.
SGALL, P.: Charakteristika českého pravopisu. In: Questions of Orthography and Transliteration. Praha 1986, s. 47–100.
[199]SGALL, P. – NOVÁK, P.: Ke způsobu uvažování (o pravopisu a jiných „historických danostech“). ČJL, 15, 1965, s. 315–320.
Staročeský slovník. Úvodní stati, soupis pramenů a zkratek. Academia, Praha 1968.
STARÝ, Z.: Psací soustavy a český pravopis. Karolinum, Praha 1992.
TĚŠITELOVÁ, M.: Využití statistických metod v gramatice. Academia, Praha 1980.
TĚŠITELOVÁ, M.: Kvantitativní charakteristiky současné češtiny. Academia, Praha 1985.
TOBIN, Y.: Semiotics and Linguistics. Longman, London – New York 1990.
VAN DEN BOSCH, A. – CONTENT, A. – DAELEMANS, W. – DE GELDER, B.: Measuring the complexity of writing systems. Journal of Quantitative Linguistics, I, 1994, s. 178–188.
VACHEK, J.: K obecným otázkám pravopisu a psané normy jazyka. SaS, 25, 1964, s. 117–126.
VACHEK, J.: Psaný jazyk a pravopis. In: Čtení o jazyce a poezii. Praha 1942, s. 229–306.
R É S U M É
To describe the changes in the efficiency and complexity of the Czech writing system over the more than seven centuries, a corpus of 16 commesurate text samples has been built (the samples being approximately 50 years apart, covering the entire history of Czech written texts) and software tools have been developed for a phonological transcription of the samples and their analysis. The orthographic efficiency has been quantified as a ratio of the length of the text measured in phonemes and its length measured in graphemes. The orthographic complexity has been quantified in four ways, each of them reflecting a different facet of the phoneme-grapheme and grapheme-phoneme relations, both from the reader’s and the writer’s points of view. The resulting four characteristics of orthographic complexity, labeled asymmetry, transparency, standardization, and irregularity, have been represented in several charts compiled from the corpus data. Among other results, the quantitative analysis has shown that efficiency of the Czech writing system dropped rather unexpectedly after 1450, probably as a result of technical limitations in early prints. It has also shown that the reading of Czech texts was more difficult than writing until the end of the 15th century; as a result of continuing regularization of writing, reading has been markedly easier than writing from the end of the 16th century on. From the point of view of orthographic complexity the orthographic regularization which took place in the 2nd half of the 16th century represents a more significant point in development than the transition from the primitive to the combinatorial and from the combinatorial to the diacritical orthographic systems in Czech.
Slovo a slovesnost, volume 59 (1998), number 3, pp. 178-199
Previous Jan Hajič, Eva Hajičová, Jarmila Panevová, Petr Sgall: Syntax v Českém národním korpusu
Next Robert Adam: Jazyk Rakovnické hry vánoční I
© 2011 – HTML 4.01 – CSS 2.1