en cz

Vědecké a technické možnosti rozvoje české lexikografie

Igor Němec

[Rozhledy]

Linguistic and technical possibilities of the development of the Czech lexicography

1. Lexikografie jistě není výjimkou mezi společenskými disciplínami české vědy, které předešlá éra poznamenala jistou zaostalostí. Jen když svou pozornost zaměříme na lexikografické popisy současné češtiny, je nám jasné, že ona zaostalost tkví především ve dvou skutečnostech: jednak v nedostatečně hluboké, a tedy ne dost vědecké lexikologické analýze české slovní zásoby (1.1.), jednak v nevyužití počítačové techniky při této analýze i při zpracování jejích výsledků v lexikografickém popisu (1.2.).

1.1. Po stránce vědecké analýzy se existující slovníky současné češtiny vyznačují řadou nedostatků. Na prvním místě musíme uvést nepřihlížení k slovotvornému významu heslového slova (jak právem vytýká Dokulil, 1978, s. 244n.) a k sémantické spojitelnosti (kompatibilitě) heslového slova s jinými lexikálními jednotkami v kontextu. O potřebě vymezení komponentů lexikálního významu slova na základě jeho paradigmatické příslušnosti k různým lexikálním subsystémům (zvl. slovotvornému) byla již řeč na jiném místě (Němec, 1987, s. 235–236; 1991, s. 1n.). Zde si více všimněme sémantické spojitelnosti. Např. české substantivum pamětník je v SSJČ (1964, s. 496) definováno jako ‚kdo něco pamatuje, něco zažil, je očitým svědkem, současníkem někoho, něčeho minulého’, podobně též v SSČ (1978, s. 324) ‚kdo něco pamatuje, zažil’; ale to je v podstatě vystižení významu slovotvorného, který je zde na význam lexikální zúžen sémantickým valenčním komponentem ‚něco dávného’. Vždyť pamětník není člověk pamatující něco nedávno minulého, např. schůzku před týdnem nebo včerejší fotbalový zápas, a také se oním valenčním komponentem dávnosti vyznačují příslušná spojitelná slova–určení (pamětník starých časů, věkovití pamětníci, Husův pamětník apod., viz Němec, 1986). Stejně tak např. u slovesa vyjadřovat ani SSČ, ani SSJČ neuvádí valenční sém vystihující, co vše lze vyjadřovat. V SSJČ sice uvedené příklady naznačují, že pozici doplnění tohoto slovesa zaujímají substantiva se sémantickým komponentem ‚co je ve vědomí’ (názor, pohrdání, radost, cit, spokojenost), ale sám úzus SSJČ dokládá i spojení s doplněním bez onoho komponentu: vyjadřovat místo (1964, s. 1), směřování (1964, s. 14), celek (1971, s. 443), dobu (1971, s. 444) aj. Podobnou sémantickou spojitelnost slovesa vyjadřovat uvádí také SSČ – jinou ve svém lexikografickém popisu (1978, s. 638) a jinou ve svém úzu (při popisu významu předložek). Uživatel našich slovníků se z jejich lexikografického popisu nedoví, co všechno mohou sdělovat česká slovesa sdělování. Můžeme říci vyprávět pohádky, divy o statečnosti, své osudy (SSJČ, 1971, s. 312), ale je možné dnes říci vyprávět či vypravovat své hříchy, tajné věci, jako to bylo možné v staré češtině? A proč je to stěží možné? To vyřeší jen hlubší analýza významových komponentů a distribuce jednotek sémantického pole (subsystému) českých sloves dicendi a jejich spojitelných slov v pozici doplnění. Samozřejmě, vědecká syntax již k tomu řešení významně přispěla (zejména rozlišováním informace diktální a syžetové – Daneš – Hlavsa a kol., 1987, § 5.21), ale takové poznatky nejsou ještě v naší lexikografii náležitě uplatněny, podobně jako lexikologické učení o valenčních (kompatibilních) sémech (Filipec, 1985, s. 68).

1.1.1. Pokud jde o vědeckou analýzu prohlubující lexikografický popis, je třeba věnovat [49]zvláštní pozornost kritériím pro správné systémové zařazení lexikálních jednotek. Uveďme příklad z oblasti vidového zařazení. – Všímáme-li si údajů o vidu českých sloves v SSJČ, překvapí nás, že sloveso telefonovat (1966, s. 784) je hodnoceno jako nedokonavé, kdežto telegrafovat (ibid.) jako nedokonavé i dokonavé, přestože u obou je možno tvořit perfektivní protějšek s předponou za– a futurum s budu. Přitom vědecká analýza dokonavosti, nedokonavosti i obojvidovosti byla již provedena v monografii F. Kopečného (1962, s. 41–43). Pokud jde o novější lexikografický popis v SSČ (1978), je ovšem třeba říci, že zatímco ono vidové zařazení sloves ponechává neopravené (s. 558), zpřesňuje již výrazně slovnědruhové zařazení lexikálních jednotek. Např. slovo zřejmě SSJČ (1971, s. 855) ještě hodnotí jako příslovce, kdežto SSČ (1978, s. 727) již přesněji jako příslovce i modální částici. Tak i jinde v podobných případech. SSČ (1978) ovšem upřesňuje lexikografický popis české slovní zásoby i v jiných směrech. Např. na rozdíl od SSJČ (1964) nevidí již základní obecný sémantický komponent distributiv v sému ‚postupně’, nýbrž v sému ‚hromadně’; srov. postřílet ‚postupně zastřelit’ (SSJČ, 1964, s. 795), poztrácet se ‚postupně se ztratit’ (tamtéž, s. 850), a proti tomu postřílet ‚hromadně (a postupně) zastřelit’ (SSČ, 1978, s. 370), poztrácet se ‚hromadně (a postupně) se ztratit’ (tamtéž, s. 378). Komponent ‚hromadně’ je zde systémově základní, obligatorní, kdežto ‚postupně’ je pouze potenciální (proto je správně uveden v závorkách): např. postřílet označuje vždy hromadný zásah, zásah hromadného objektu, nikoli vždy však zásah postupný, tj. ‚jednoho po druhém’ (postřílet zajatce u zdi je možno i současně, salvou).

1.1.2. Při podrobné analýze slovní zásoby ovšem narážíme také na jevy, které ani novější slovník s nevelkým rozsahem nemůže adekvátně popsat, protože jde o případy dosud v odborné literatuře nevybavené jednoduchými klasifikačními kritérii. Podle našeho mínění jde především o popis implicitního vyjadřování. Není snadné vždy přesně rozlišit všechny druhy elipsy doplnění slovesa – kontextovou a konsituační (typ A otevřel obálku a četl), elipsu všeobecného či neurčitého předmětu (B sestra čte na zahradě), vyjadřující schopnost děje (C dítě už čte), kvalifikující sémantický subjekt děje (D bratr učí ‚je učitelem’), elipsu specifikující lexikální význam slovesa (E manželka rozhazuje ‚utrácí peníze’). Jednosvazkový SSČ (1978) klasifikuje tyto typy méně přesně a důsledně než velký výkladový StčS (1968, s. 26), viz Němec (1989), i když soudobá lexikologie zná hlubší kritéria pro rozlišení elips doplnění, které mění a které nemění lexikální význam předmětového slovesa, zejména typy B a E (Coseriu, 1970, s. 55). Elipsa B (sestra čte na zahradě) nemění lexikální význam předmětového slovesa, protože nezmenšuje počet jeho sémů, vyjadřuje totiž jeho valenční sém, který slovníky vystihují pomocí neurčitého zájmena (číst ‚vnímat zrakem NĚCO NAPSANÉHO NEBO VYTIŠTĚNÉHO a vyrozumívat smysl toho’); je to sém shodný s archisémémem spojitelných slov–doplnění předmětového slovesa (knihu, dopis, řádky, vyhlášku…, tj. ‚NĚCO NAPSANÉHO NEBO VYTIŠTĚNÉHO’) – tzv. valenční sém selekční (selektivní). Proti tomu elipsa E (manželka rozhazuje) mění lexikální význam předmětového slovesa, protože jej specifikuje metaforizací a zúžením valenčního sému (rozhazovat ‚házet na různé strany NĚCO HROMADNÉHO’ → rozhazovat bez předmětu ‚rozhazovat, tj. utrácet PENÍZE’); elipsa zde vyjadřuje sém shodný se sémémem jednoho ze spojitelných slov–doplnění základního předmětového slovesa (písek, slámu, PENÍZE, letáky…), je to tedy sém implikovaný jeho valenčním sémem (NĚCO HROMADNÉHO) – tzv. valenční sém implikační.

1.2. Druhým základním nedostatkem naší lexikografie je nesporně nevyužívání počítačové techniky. Je jasné, že právě tato technika snadno a rychle vyčlení opakovatelné komponenty lexikální formy a valence heslového slova, které pomáhají objektivněji určit jeho lexikální význam (Dokulil, 1978; Němec, 1980). Tato technika také umožní postihnout detailní fakta oné sémantické spojitelnosti slov. Ovšem aby nám vyjevila, který sémantický okruh slov – tj. okruh slov s kterým společným sémem – váže na sebe heslové slovo v té které valenční pozici, k tomu musí nejdříve lingvisté [50]vytvořit předpoklady vědeckou analýzou: musí nejdříve vyčlenit inventář relevantních sémantických komponentů, sémů (jako ‚dávný’ 1.1., ‚jsoucí ve vědomí’ 1.1.1., ‚hromadný’ 1.1.2., nebo ‚osoba’ a ‚počitatelnost’, na něž upozorňoval již Poldauf, 1971, s. 261 a 265). Nechceme-li funkci počítače omezit na úlohu lepší evidence lexikálního materiálu a dokonalejšího psacího stroje, pak se musíme zamyslet nad tím, v jakých směrech je třeba dosavadní lexikologickou analýzu prohloubit, aby počítačová technika se sama mohla automaticky podílet na lexikologické analýze. Víme, jak dlouho se dosud pracovalo na strojovém překladu, a dovedeme si představit, jakých nákladů a přípravných prací k tomu bylo zapotřebí; a přesto „mnoho otázek automatické analýzy přirozeného jazyka ještě není dořešeno” (Hajičová, 1986, s. 158). Ani využití počítačů v lexikografii není možné bez přípravné analytické práce odborníků–lexikologů. Vždyť uvažme jen, co je dosud málo zmapovaných oblastí slovní zásoby a kolik nepřesně zpracovaných jevů v dosavadních slovnících. Proto nemůžeme přijmout názor, že samo počítačové zpracování bez takových analýz zhodnotí dosavadní lexikografické výsledky, a že je tedy smysluplné prostě „přepsat SSJČ do počítače” (Čermák – Sgall a kol., 1991, s. 3, srov. i zde s. 41n.), aniž odstraníme jeho nedostatky neslučitelné již s dnešní úrovní české jazykovědy (1.1.). Takový názor nemůže sdílet, kdo má dlouhodobé zkušenosti ze soustavné analýzy celého lexikálního systému a s jeho lexikografickým vědeckým popisem a komu nezůstaly vzdáleny uznávané hodnoty české lexikografické tradice. S ohledem na využití počítačové techniky k explicitnímu popisu slovní zásoby vidíme tedy hlavní směry přípravné analýzy takto: nejen v sestavení inventáře sémů (1.2.1.), ale i v cílevědomém stanovení kritérií pro objektivní určení různých charakteristik lexikální jednotky (1.2.2.) a v promyšlení struktury definice jejího významu na základě struktury sémů dané její příslušností k jistým lexikálním subsystémům příslušného jazyka (1.2.3.).

1.2.1. Pro českou lexikografii mohou být sotva vzorem slovníky zpracované sice pomocí počítačové techniky, ale definující význam slov intuitivně; to znamená bez přihlížení k formálním ukazatelům obsahu lexikální znakové jednotky – slova nebo frazému – a bez inventarizace sémů, tj. komponentů lexikálního významu, jež jsou z velké části ztvárněny těmito formálními ukazateli (morfémy a valencemi). Nemůžeme v naší lexikografii nevyužívat poznatky pražské školy o vztahu lexikálního významu na jedné straně k slovotvorným strukturám (Dokulil, 1987) a na druhé straně k strukturám větným (Daneš – Hlavsa a kol., 1987), ale také k sémantickým polím (Němec, 1980). Chápeme-li lexikální význam jako obsah vědomí „jazykově ztvárněný” formou lexikální jednotky a jejím prostřednictvím i vztahem k jiným lexikálním jednotkám (srov. Filipec, 1985, s. 49), pak relevantní komponenty lexikálního významu jsou sémantické rysy (sémy) společné dané jednotce s lexikálními jednotkami téže formálně–významové nebo jen významové kategorie; jde o obecné významy jednotlivých lexikálních subsystémů, tj. jednotlivých slovních druhů, slovních čeledí, slovotvorných typů a podtypů, valenčních typů (jako jsou např. tranzitiva), sémantických polí (zde integrační sém a obecný význam jejich jednotek odpovídá jejich archisémému) apod. S lexikálním významem lexikální jednotky pak pracujeme jako s průnikem oněch obecných významů jejích nadřazených lexikálních subsystémů, který tvoří integrační sémy jednotek každého z nich a který specifikují diferenční sémy jednotek příslušného sémantického pole (Němec, 1980, s. 29; sémantické pole je jazykově vyčleněno spojitelností jeho jednotek s jinými lexikálními jednotkami, jejichž valenční sém odpovídá obecnému významu toho pole, viz 1.1.2.). Takováto komponentová analýza člení tedy lexikální význam nikoli na univerzální „noémy”, ale na „sémy”, jejichž počet a uspořádání v něm „sa opiera o systémovo–paradigmatické začlenenie do čiastkového systému a do komunikačnej situácie” (Blanár, 1984, s. 26). Proto umožňuje také objektivně, nikoli intuitivně určit význam nejen z doložených kontextů, ale i na základě systémových faktů, tj. oněch obecných významů dílčích lexikálních systémů. Důležité je to zejména tehdy, když analyzovaná jednotka má málo kontextových dokladů: jde-li [51]o jednotku novou, ještě málo rozšířenou, anebo o jednotku starého, neúplně doloženého jazyka. Např. stč. sloveso prohltiti je doloženo jen dvakrát (u Štítného o lidech o masopustě: prohltie tak mnoho… a jeden-li prohltí z řemeslníkov viece, nežli móž dobyti, viz StčS s.v.), ale z kontextu není příliš jasné, co je zde valenčním sémem, tj. archisémémem spojitelných slov–doplnění (1.1.2.). Nějaké jídlo? Nebo peníze? Systémové začlenění tohoto slovesa do příslušného slovotvorného typu nám to však ukáže: slovesa projiesti, propiti, prožrati s touž předponou, se slovesným základem téhož sémantického pole a také s osobním subjektem (kněží by umění zákona božího projedli; ženo, chceš jediný haléř propiti; dvě rádle jsme propili; vše by sehltali a prožrali aj. – StčS s.v.) tvoří dílčí systém s obecným slovotvorným významem ‚spotřebovat (obětovat) něco hodnotného na jídlo nebo pití’, a tento slovotvorný význam je v slovese prohltiti specifikován na význam lexikální ‚spotřebovat (utratit) nějakou částku na hltání, tj. na chtivé požívání potravy’ dvěma faktory: (a) kontextovým zúžením valenčního sému ‚něco hodnotného’ na ‚nějakou částku, sumu’ (výdělek řemeslníka) a (b) diferenčním sémem chtivosti základního slovesa hltiti v sémantickém poli sloves požívání. Aby takto pomohl určovat význam slova na základě faktů lexikálního systému počítač, k tomu ovšem musí nejdříve lexikolog vyčlenit inventář relevantních sémů studiem oněch nejrůznějších dílčích lexikálních systémů daného jazyka. Zatím nezbývá než pracně zjišťovat ony integrační sémy (obecné významy) příslušných subsystémů u každého heslového slova zvlášť a u každého dalšího souřadného vždy znovu.

1.2.2. Stejně tak, abychom mohli pomocí počítačové techniky vyjevit daný charakter heslového slova, např. vidový charakter dokonavosti nebo nedokonavosti, k tomu musí nejdříve lingvista vyčlenit spolehlivá příslušná kritéria, snadno uchopitelná počítačem. Pokud jde o kontextová kritéria určení vidu, byla již v naší odborné literatuře uvedena (Kopečný, 1962, s. 41–42; Němec, 1963, s. 92). Lexikograf může snadno a rychle pomocí počítače vyčlenit konstrukce směrodatné pro určení nedokonavého vidu (typu bude havarovat, začne havarovat, během havarování apod.), ale nemůže se na počítač spolehnout např. u novějších sloves cizího původu: když u nich nebude mít v paměti počítače uloženou ani jednu takovou průkaznou konstrukci, neznamená to ještě, že sloveso je dokonavé (jak nesprávně uvádí u havarovat SSJČ, 1960, s. 673), protože náhodný výběr u málo frekventovaného slova snadno může průkazné doklady pominout. Přesto je zde třeba přesně vid vystihnout, neboť bez přesného určení vidu slovesa není přesně určen ani jeho lexikální význam, ani jeho lexikální forma (paradigma tvarů). Lingvista musí mít hlubší povědomí také o tom, co je relevantní i za hranicí datové báze, ať jde o jevy centrální, nebo periferní, tj. zčásti jenom potenciální.

1.2.3. Centrální (C) a periferní (P) jsou nejenom významové jednotky v polysémní struktuře slova (srov. vyjadřovat C ‚slovy sdělovat něco myšleného nebo cítěného’ a vyjadřovat P v lingvistice o jazykových prostředcích ‚vystihovat nějakou označovanou skutečnost’, viz 1.1.), ale také významové rysy (sémy) v struktuře lexikálního významu: srov. odvrátit C ‚zamezit nějaké nežádoucí dění’ a P ironicky ‚zamezit nějaké žádoucí dění’, např. hrozila mu pochvala, ale včas ji odvrátil (centrální valenční sém slovesa ‚nežádoucí dění’ umožňuje vyjádřit, že běžně žádoucí děj–pochvala se zde chápe jako nežádoucí). Struktuře lexikálního významu má odpovídat struktura jeho definice, aby z ní bylo jasné, které sémy dané lexikální jednotky jsou centrální a které periferní. Slovníky to vystihují pomocí zkratek, např. „zvl.“ pro centrální a „popř.” pro perifernější (stč. paní ‚manželka – popř. dcera – pána, zvl. šlechtična’ – StčS s.v. paní II/1). Pro rozlišení centrálnosti a perifernosti je tedy nutné, aby se počítačové zjišťování frekvence neomezovalo pouze na výskyt lexikálních jednotek, ale aby sledovalo i výskyt jejich jistých užití v rámci daného lexikálního významu. O jaká různá užití jde a kolik jich může být, to ovšem u každé jednotky nezjistí počítač automaticky bez přípravné analýzy zkušeného lexikologa–lexikografa. Pokud jde o odraz struktury sémů v definici lexikálního významu, pak využití počítače usnadní inventář sémů: genus proximum v definici lexikálního významu odpovídá integračním sémům (obecnému významu) nejblíže nadřa[52]zeného lexikálního subsystému, tj. zpravidla archisémému příslušného sémantického pole (1.2.1.), a differentia specifica zase sémům diferenčním vzhledem k jiným lexikálním jednotkám téhož sémantického pole nebo téhož jiného lexikálního subsystému (Němec, 1982, s. 117n.). Méně můžeme chtít na lexikografické definici, aby její definiens byl zcela zaměnitelný za definiendum, než aby dostatečně rozhraničila definovaný význam od významu lexikálních jednotek sémanticky podobných, tj. synonymních nebo souřadných (Weinreich, 1962, s. 30). Tyto sémy diferenční i sémy konstituující genus proximum musí být ovšem v paměti počítače uloženy ve formě slov s vysokou frekvencí výskytu. Význam lexikální jednotky běžně užívaného, neodborného jazyka nemůže být definován slovy, jež mají nižší frekvenci než ona sama (tamtéž, s. 37). Ani nejnovější slovníky tento požadavek nesplňují. Např. SSČ (1978, s. 116) definuje slovo hmyz slovy ‚drobní členovci s třemi páry končetin’, kde se na vyjadřování genus proximum podílí zoologický termín členovci s nižší frekvencí než hmyz a kde jsou diferenční sémy vyjádřeny v pojetí odborném – v rozporu s běžným významem slova hmyz zahrnujícím i pavouky s čtyřmi páry končetin.

2. Lexikology vypracovaný soubor sémů, který slovy vysoké frekvence postihne opakovatelné podmínky rozdílného užití významově vzdálených i blízkých lexikálních jednotek v daném jazyce, nesporně pomocí počítače umožní výrazně zpřesnit lexikografický popis. Odbourá například starý slovníkářský zlozvyk, že se popis významu běžně užívaného slova nahrazuje popisem jeho denotátu, dokonce i odborným (srov. v PS, 1935–1937, s. 888 hmyz ‚třída členovců – Insecta, Hexapoda’). Samo užívání počítače při lexikografické práci bez řešení náročných lingvistických úkolů, jako je vypracování inventáře sémů, potřebných kritérií apod. (1.2.), nemůže lexikografickou práci výrazně zdokonalit. Přesto je třeba uplatnění počítačů v lexikografii rozvíjet, orientovat se na ně při řešení oněch hlubších lingvistických problémů. Jenomže si musíme být vědomi toho, jaké jsou reálné technické možnosti nynější české lexikografie k počítačovému zpracovávání. Je-li málo schůdné sejmutí pomocí scanneru pro novočeský slovníkový text vzhledem k jeho typografické složitosti (Čermák – Sgall a kol., 1991, s. 3), tím méně je to možné u staročeských rukopisů a paleografických edic. A jak dlouho bude trvat jen samo přepisování příslušné datové báze do počítače? To nejpotřebnější – stč. lexikální materiál čítající přes 1,5 miliónu kartotéčních lístků – by přepisovala jedna pracovnice déle než půl století. Bez nereálně vysokých nákladů je vytvoření počítačového fondu staré češtiny v nedohlednu. Přesto i autoři StčS v dohledné době přikročí k elementárnímu využití počítače při své práci: v první etapě budou do jeho paměti ukládat především úseky svého podrobně zpracovaného rukopisu StčS, aby se tak urychlila evidence systémově opakovatelných jevů staré češtiny i aplikace způsobů jejich již promyšleného zpracování – v zájmu větší jednoty i přesnosti dalšího slovníkového popisu. Vzhledem k značné časové a finanční náročnosti žádoucího uplatnění počítačové techniky se nám nejeví jiná reálná cesta rozvoje české lexikografie než prohlubovat lingvistickou kvalitu dosavadní lexikologické a lexikografické práce a zároveň při ní postupně využívat počítačů, jak se dá, ovšem kompetentně, s lexikografickou zasvěceností. To znamená promyšleně, bez zjednodušujících představ.

3. Nebezpečí zjednodušené představy o využití počítačů v lexikografii vidíme v tom, když by se tzv. počítačová lexikografie projektovala a rozvíjela bez skutečných odborníků–lexikografů, pouze za účasti odborníků na matematickou a počítačovou lingvistiku. Jistě nikdo nebude popírat částečnou pravdu, že „slovníky už dávno nevznikají technikou tužky a papíru” (Pala, 1991), ale je třeba k tomu říci pravdu úplnější: že tímto způsobem vznikají nadále také, a že mají-li projekty miliónové ceny přinést plody úměrné nákladům, neobejde se realizace takových projektů bez práce, kterou musí pomocí tužky a papíru vykonat znalec slovní zásoby a jejího lexikografického popisu. Nejde jen o to, že obrazovka počítače neposkytuje bez přetiskování [53]potřebně velkou plochu pro srovnávání údajů, jaká umožnila vypracovat dokonalý slovník našemu prvnímu vědeckému lexikografovi L. Kopeckému tím, že měl své údaje napsané tužkou na papírech rozložených po celé místnosti. Ale jde o více: nelze přece na jedné straně se pozastavovat nad „kuriozitou”, že druhé vydání SSJČ vycházející za 20 let po vydání prvním „nebylo nijak revidováno” (Pala, tamtéž), a na druhé straně plánovat jeho přepsání do počítače bez podstatné lexikografické revize. Je vůbec jasná představa o složitosti a rozsahu této nezbytné revize? Jsou náklady na ni započítány do projektu počítačového fondu češtiny? Právem tu lze vyslovit jisté obavy, neboť úloha lexikologů–lexikografů se v praxi matematické lingvistiky tradičně podceňuje. Bude třeba cílevědomě odolávat dvěma silným tendencím, s kterými se zatím setkáváme: že se matematické zpracování vyhýbá jevům, které musí pro ně nejdříve „zuchopitelnit” nepříliš jednoduchá analýza lingvisty lexikologa (3.1.), anebo že se taková analýza znalce slovní zásoby chápe jako samozřejmá služebná spolupráce nestojící za zmínku (3.2.). K tomu ovšem přistupuje ještě třetí dost rozšířená skutečnost, že nelexikolog poznatky uznávané lexikology nezná nebo je nerespektuje (3.3.).

3.1. Prvním případem je počítačové zpracovávání slovníku s intuitivními definicemi významu tam, kde by bylo možno podat objektivní definice na základě komponentové analýzy (1.2.1.). Ale závažné jsou i příklady starší. Připomeňme aspoň praxi FSČ (1961). Že se zde započítávají jako adverbia také částice (např. zřejmě), to je ovlivněno ještě tehdejší slovníkářskou praxí. Ale FSČ nerozlišuje ani tranzitivní sloveso nereflexívní a jeho reflexívní pasívum od slovesa reflexívního; obojí řadí do společného hesla (např. utopiti (se)) s odůvodněním, že by zde rozlišování „ztěžovalo tabulaci, protože rozdíl mezi jednotlivými druhy je v praxi někdy málo zřetelný” (s. 23). Takový důvod ovšem nemůže oprávnit ten postup, aby se frekvence dvou různých lexikálních jednotek (slov) uváděla dohromady, v součtu, nikoli u každé zvlášť.

3.2. Rozlišení různé slovnědruhové platnosti u jednotky se stejnou lexikální formou (např. i jako spojky a i jako částice) může být někdy obtížný úkol i v soudobém jazyce, natož při interpretaci starých textů. Vždyť je zde třeba i řešit, kdy je např. forma v ještě předložkou, a kdy již součástí adverbia (vdéli) apod. Když u nás pracovníci matematické lingvistiky prováděli kvantitativní rozbor slovní zásoby RKZ, RK, DalC aj., provedl příslušnou slovnědruhovou klasifikaci na základě svých kritérií znalec stč. slovní zásoby (vedoucí redaktor StčS); ale tato spolupráce odborníka–lexikologa byla považována za tak zanedbatelnou, že v publikovaných výsledcích (Nebeská, 1987; Králík, 1987) nebyla ani zaznamenána. Nejde tak o jméno konkrétní osoby (to se snad vypustilo v souvislosti s tím, že onen lexikolog byl normalizátory vyřazen z kategorie vědeckých pracovníků); avšak podstatné je, že zamlčením jeho náročné klasifikační práce bylo vytvořeno zdání, jako by na kvantitativní analýzu staré slovní zásoby včetně slovnědruhového určení každé jednotky v každém jednotlivém kontextovém užití stačila matematická lingvistika sama. Nestačila. Podobně nemůže stačit ani uplatnění počítačové techniky na vědecké zpracování slovní zásoby bez solidních lexikologických znalostí a lexikografických zkušeností.

3.3. Projekty počítačového fondu češtiny však potřebu těchto znalostí a zkušeností nezdůrazňují, ani o ní nemluví. Jestliže si klademe otázku, odkud se vzalo takové nedoceňování lexikologie, sotva nás nenapadne odpověď: je to nejspíš tím, že nelexikologové své lingvistické poznání patřičně nerozšiřují do oblasti lexikologie a lexikografie, i když se zabývají rozbory a projekty v oblasti slovní zásoby. Kdo prostudoval výklady o lexikalizovaných i nelexikalizovaných výrazech obrazných, nepochybuje o tom, že v mikrokontextech postavil se do řady za bratra a postavil se za bratra a jeho zájmy je rozdíl v lexikálním významu slovesa a ve funkci předložky. Přesto se mimo lexikologii setkáváme také s názorem, že tu může jít o jeden základní význam, který lze „chápat [54]poměrně široce, včetně významu přeneseného; např. ve větě Za krále Tomáše se postavil i jeho bratr bychom pak viděli uplatnění jediného významu předložky a rozdíl mezi fyzickým pohybem a morální nebo mocenskou podporou by byl záležitostí mimojazykového obsahu u předložky a snad i u slovesa, jejich význam by byl v tomto ohledu vágní” (Bémová – Panevová – Sgall, 1989, s. 130–131). Z hlediska lexikologického tu ovšem nejde jen o „záležitost mimojazykového obsahu”, ale i o různé jazykové ztvárnění – o různé začlenění paradigmatické (do systému sloves změny polohy a do systému synonym jako zastat se koho, podpořit koho, viz 1.2.1.) i různé začlenění syntagmatické (do různých valenčních struktur, větných vzorců, viz Daneš – Hlavsa a kol., 1987, s. 117–118; o rozdílu v sémech s. 102). Jak patrno, lexikologové k prospěchu svého poznání uplatňují poznatky syntaxe, i když syntaktické koncepce sami nevytvářejí. Tím spíše by měli být dokonale seznámeni s poznatky lexikologie a zkušenostmi lexikografie ti, kdož cílevědomě usilují o realizaci projektů počítačového zpracování slovní zásoby.

4. Náš článek právě sleduje ten cíl, a to bychom chtěli na závěr zdůraznit, aby při počítačovém zpracovávání české slovní zásoby nebyly nevyužity – nebo dokonce z technických důvodů potlačeny – podstatné možnosti kvalitativního prohloubení jejího lexikografického popisu. Máme-li učinit první krok k tomu cíli, musíme nejprve odstranit závažné nedostatky SSJČ a SSČ (1.1.). Na druhé straně bude nutno náležitě uplatnit novější lexikologické poznatky a lexikografické zkušenosti (1.2.). Bylo by ironií, kdyby moderní lexikografický popis češtiny nepracoval s relevantními sémantickými komponenty, když právě česká lingvistika rozpracovala soustavy distinktivních rysů u různých druhů slov – u denominativních adjektiv vztahových (Fiedlerová, 1981), u neurčitých zájmen (Křížková, 1971), u předložek (Běličová, 1984) aj. Bylo by mrháním vědecké práce, kdyby nebyly využity zkušenosti lexikografů, kteří cílevědomě a soustavně zakotvují interpretaci významu lexikálních jednotek v jejich paradigmatických vztazích a v jejich konstrukční i sémantické spojitelnosti (jde o prioritu StčS, zatím více uvědomovanou v zahraniční lexikografii, viz např. Sumikovová, 1980, s. 46). Totéž lze říci i o zkušenostech autorů připravovaného VSČS, který postihuje u nejčastějších českých sloves nejen jejich valenční potenciál, ale i sémantickou spojitelnost prostřednictvím „selektivních tendencí charakteristických pro obsazování valenčních pozic ve struktuře české věty” (Macháčková – Svozilová, 1990, s. 224; v lexikologickém pojetí jde v podstatě o centrální a periferní, potenciální valenční sémy, viz 1.2.3.). Jeho rukopis ukládaný již do paměti počítače by v budoucnu bylo ovšem třeba ještě doplnit jak o další hesla, tak i o další valenční sémy. Připomeňme, že právě valenční sémy heslových slov, shodné s archisémémy jejich slov spojitelných (1.1.2.), tvoří spojovací článek mezi oblastí významových komponentů a oblastí syntaktické spojitelnosti. Analyzovat jedno bez druhého sotva může být pro moderní lexikografické zpracování smysluplné. A naopak – obojí ve vzájemné souhře umožňuje objektivně řešit ústřední úkol lexikografie – určení lexikálního významu – na principu průniku integračních sémů příslušných lexikálních subsystémů (1.2.1.). To je právě princip založený na reálných faktech systému jazyka (nikoli na konstruktech lingvistů), a proto snadno uchopitelný technikou počítače, který má textové realizace tohoto systému ve své paměti. Proto StčS půjde při využívání počítače touto cestou.

LITERATURA

Běličová, H.: K podílu předložek na konstituování sémantické struktury věty. Slavia, 53, 1984, s. 225–243.

Bémová, A. – Panevová, J. – Sgall, P.: Znovu k významu prostých a předložkových pádů. SaS, 50, 1989, s. 128–136.

[55]Blanár, V.: Lexikálno–sémantická rekonštrukcia. Bratislava 1984.

Coseriu, E.: Einführung in die strukturelle Betrachtung des Wortschatzes. Tübingen 1970.

Čermák, F. – Sgall, P. a kol.: Počítačový fond češtiny (projekt skupiny pro počítačovou lexikografii). Praha 1991.

Daneš, F. – Hlavsa, Z. a kol.: Větné vzorce v češtině. Praha 1981; 2. vyd. 1987.

Dokulil, M.: K otázce prediktability lexikálního významu slovotvorně motivovaného slova. SaS, 39, 1978, s. 244–251.

Fiedlerová, A.: Denominativní vztahová adjektiva v Staročeském slovníku. LF, 104, 1981, s. 212–221.

Filipec, J.: Lexikologie. In: J. Filipec – F. Čermák, Česká lexikologie. Praha 1985, s. 13–165.

Hajičová, E.: Strojová lingvistika a její perspektivy ve světle nedávných mezinárodních konferencí. SaS, 47, 1986, s. 156–162.

Jelínek, J. – Bečka, J. – Těšitelová, M.: Frekvence slov, slovních druhů a tvarů v českém jazyce. Praha 1967. V textu FSČ.

Kopečný, F.: Slovesný vid v češtině. Praha 1962.

Králík, J.: Některé další statistiky o RK. In: M. Těšitelová a kol., O češtině v číslech. Praha 1987, s. 182–184.

Křížková, H.: Systém neurčitých zájmen v současných slovanských jazycích. Slavia, 40, 1971, s. 343–370.

Macháčková, E. – Svozilová, N.: Slovesná valence ve slovnících. SaS, 51, 1990, s. 219–230.

Nebeská, I.: RKZ ve světle kvantitativní lingvistiky. In: M. Těšitelová a kol., O češtině v číslech. Praha 1987, s. 177–181.

Němec, I.: Kopečný, F., Slovesný vid v češtině. Slavia, 32, 1963, s. 91–99.

Němec, I.: Jazykové ztvárnění psychického odrazu skutečnosti v lexikální význam. SaS, 41, 1980, s. 26–31.

Němec, I.: K problému slovníkové definice. NŘ, 65, 1982, s. 113–117.

Němec, I.: Pamětník. NŘ, 69, 1986, s. 110–111.

Němec, I.: Přínos české diachronní lexikologie pro lexikologii synchronní. LF, 110, 1987, s. 231–241.

Němec, I.: Ještě k funkcím lexikálního nevyjádření objektu děje ve větě. NŘ, 72, 1989, s. 119–131.

Němec, I.: Slovotvorný význam a valence latinských kompozit s komponentem –facere a –ficare. LF, 113, 1990, s. 1–7.

Pala, K.: Projekt už existuje. Lidové noviny 27. 7. 1991, s. 11.

Poldauf, I.: K dokončení Slovníku spisovného jazyka českého (1959–1972). SaS, 32, 1971, s. 258–267.

Příruční slovník jazyka českého. Praha 1935–1937. V textu PS.

Slovník spisovné češtiny pro školu a veřejnost. Praha 1978. V textu SSČ.

Slovník spisovného jazyka českého. Praha 1960, 1964, 1971. V textu SSJČ.

Staročeský slovník. Praha 1968 podnes. V textu StčS.

Sumikova, T. A.: K voprosu ob oboznačenii sil’nych podčinitel’nych svjazej glagola v istoričeskom slovare. In: Drevnerusskij jazyk. Moskva 1980, s. 38–50.

Valenční slovník českých sloves. Praha (připravuje se). V textu VSČS.

Weinreich, U.: Lexicographic definition in descriptive semiotics. In: Problems in Lexicography. IJAL 28/2. Bloomington 1962, s. 25–43.

Slovo a slovesnost, ročník 53 (1992), číslo 1, s. 48-55

Předchozí František Čermák, Jan Králík, Karel Pala: Počítačová lexikografie a čeština (počítačový fond češtiny)

Následující Světla Čmejrková: Jazykové vědomí a jazyková kultura (zamyšlení nad tzv. lidovým jazykozpytem)

Menu
O archivu
Archiv
Nová domovská stránka
Hledání v archivu: