Časopis Slovo a slovesnost
en cz

Projekt slovníku staré italštiny

Karel Kučera

[Recenze]

(pdf)

Projekt slovníku staré italštiny

Myšlenka vytvoření velkého slovníku zachycujícího slovní zásobu nejstarší vývojové fáze italského jazyka (Tesoro della Lingua Italiana delle Origini; zkr. TLIO) vznikla na počátku šedesátých let ve Florencii a poté, co získala finanční podporu Národní rady pro výzkum, ujala se její realizace florentská Accademia della Crusca (přípravné práce pro slovník zde probíhaly od roku 1965 po dvacet let). V roce 1985 byl celý projekt přenesen do nově založeného lexikografického centra Opera del Vocabolario Italiano (OVI), jehož sídlem je rovněž Florencie; slovník nejstarší italštiny zde vzniká [310]pod vedením ředitele centra prof. Pietra G. Beltramiho a nadále se na něm podílí i původní pracoviště, Accademia della Crusca.

Podobně jako některé další současné projekty historických jazykových slovníků (např. slovník rané střední nizozemštiny Vroegmiddelnederlands Woordenboek nebo staroanglický slovník Dictionary of Old English; srov. Pijnenburg – Schoonheim, 1996; Healey, 1997) vzniká Tesoro della Lingua Italiana delle Origini s využitím počítačového korpusu a příslušných programových nástrojů (v případě florentského projektu jde o renomovaný program DBT E. Picchiho). Korpus, z něhož TLIO vychází, obsahuje přes 1300 textů o celkovém rozsahu přibližně 15,6 milionu slovních výskytů a během nejbližších let se má rozrůst ještě zhruba o 20 % (srov. Bollettino III, s. 383n.; úplný soupis a popis textů vstupujících do korpusu viz Bibliografia dei testi, 1992). Tento elektronický soubor textů je v současné době zřejmě nejrozsáhlejším historickým korpusem v rámci románských jazyků a nepochybně představuje solidní základnu pro TLIO, jehož cílem je zachytit slovní zásobu italštiny od počátků (nejstarší staroitalský text v korpusu je tzv. Indovinello Veronese z přelomu 8. a 9. stol.) do roku 1375, tj. do Boccacciovy smrti (korpus však ve skutečnosti umožňuje práci i s texty poněkud mladšími, vzniklými do konce 14. stol.). Českému historickému lexikografovi nepochybně zní poněkud neobvykle, že korpus – základnu celého slovníku – tvoří pouze texty vydané ve spolehlivých edicích, tedy nikoli texty rukopisné; je však třeba říci, že stará italština (a zejména její nejstarší období, jehož se týká projekt TLIO) je v jiné situaci než stará čeština: edicemi je pokryta naprostá většina známých staroitalských textů a další edice jsou průběžně realizovány, mj. i péčí florentského centra OVI. Do budoucna se navíc pochopitelně předpokládá další růst korpusu – a ovšem také slovníkové databáze – podle toho, jak budou pořizována nová vydání již známých i nově objevených památek.

Tesoro della Lingua Italiana delle Origini je zřejmě prvním velkým historickým slovníkem, u něhož se počítá s tím, že základní formou publikace bude elektronická podoba zpřístupněná na internetu (informace o možnosti přístupu ke slovníkové databázi i obecnější přehled o projektu lze získat na URL http://www.csovi.fi.cnr.it). Autoři TLIO se přirozeně neuzavírají tomu, že by sekundárně publikovali celý slovník tiskem, avšak zatím jsou zřejmě podobné úvahy předčasné, neboť zpracování hesel potrvá nepochybně dlouhou řadu let a s touto perspektivou nelze dost dobře posoudit ani reálnost takové publikace (především z hlediska finančního), ani míru její žádanosti v době dokončení slovníku. (Dodejme, že otázka žádanosti není v delším časovém výhledu tak bezpředmětná, jak by se mohlo na první pohled zdát: bude-li totiž pokračovat rychlý příklon k elektronické formě publikování informací, jehož jsme svědky v posledních letech, není vyloučeno, že klasická knižní podoba slovníků bude postupně zatlačena do pozadí podobou elektronickou, jejíž výhody jsou nejzřejmější právě u větších a složitěji strukturovaných lexikografických děl. V této souvislosti je také třeba jednoznačně přivítat a podpořit prozíravé úsilí o postupnou elektronizaci prací i výstupů projektu Staročeského slovníku v oddělení vývoje jazyka ÚJČ AV ČR.)

Primární orientace projektu TLIO na slovníkovou databázi v elektronické podobě byla zvolena po zralé úvaze a naznačuje odklon od reprezentativních, ale svou pod[311]statou uzavřených, jen těžkopádně a nákladně modifikovatelných knižních výstupů a příklon k výstupům dynamickým, které lze plynule a trvale uvádět do souladu jak s vývojem příslušného výseku reality, tak s vývojem jeho poznání. Práci na slovníku (která vstoupila roku 1996 do stadia zpracovávání jednotlivých hesel) lze sledovat na výše uvedené internetové adrese, současně však – vzhledem k tomu, že tradiční tištěná forma publikování je, jak se zdá, dosud obecně přístupnější a prestižnější než forma elektronická – jsou výsledky postupně zveřejňovány i tiskem, v jednotlivých číslech bulletinu vydávaného florentským lexikografickým centrem. Vzhledem ke zmíněnému posunu od uzavřených k otevřeným výstupům nepřekvapí, že bulletin se svým cílem i obsahem zřetelně liší od sešitů, v nichž byla a jsou často postupně publikována velká slovníková díla u nás (v poslední době zejména Staročeský slovník) i jinde ve světě. Jádro jednotlivých čísel bulletinu (s výjimkou čísla prvního, věnovaného studiím o problematice různých aspektů projektu TLIO, viz Bollettino I, 1994) sice tvoří text nově zpracovaných hesel, avšak cíle této publikace jsou širší: vedle seznamování odborné veřejnosti s postupem prací na projektu a s prací centra vůbec jde redakci také o vyvolání připomínek a podnícení diskuse o použitých metodách i o způsobu zpracování jednotlivých hesel TLIO. Svazky bulletinu mají rozsah 300–400 stran a dosud v nich bylo vedle zpracovaných hesel publikováno také množství obecnějších informací o projektu, norma pro tvorbu slovníkových hesel TLIO, kritická vydání textů z daného období vývoje, seznamy autorů s výčtem hesel, která zpracovali, odborné studie a bibliografické přehledy.

Zpracovaná hesla TLIO byla publikována ve dvou posledních číslech bulletinu (Bollettino II, 1997; Bollettino III, 1998): k případným připomínkám a doplňkům zde bylo předloženo celkem 442 hesel, zatím vesměs substantiv, adjektiv, sloves a adverbií. Hesla jsou uváděna v abecedním pořadí, avšak v jednotlivých číslech bulletinu je vždy shrnuta práce nově dokončená různými autory, jimž byla přidělena ke zpracování slova z různých úseků celé abecedy, a celkově tedy jde – jak redakce sama zdůrazňuje – jen o nesouvislý aktuální přehled dokončených hesel, nikoli o uspořádaný, souvislý text slovníku v tradičním slova smyslu. Tento uvolněný postup práce je umožněn využitím výpočetní techniky a ukládáním hesel do databáze, pro niž není přísně abecední pořadí při zpracovávání ve skutečnosti o nic výhodnější než jakékoli pořadí jiné, neboť hesla lze kdykoli řadit a třídit nejen podle samotného heslového slova, ale i podle kterékoli jiné jejich součásti. Skutečnost, že autoři slovníku nemusejí postupovat podle abecedního pořádku, s sebou nese množství výhod, především ovšem tu, že mohou jednotně a systematicky zpracovávat celé skupiny sémanticky, slovotvorně, etymologicky nebo formálně – nikoli však nutně právě abecedně – blízkých a souvisejících slov.

Výstavbou hesla se TLIO v zásadě neliší od velkých historických lexikografických děl, tedy ani od našeho Staročeského slovníku (detaily viz Beltrami, 1998); drobné rozdíly jsou jen ojediněle koncepční povahy, většinou vyplývají buď z charakteru zpracovávaného jazykového materiálu, nebo z přesného dodržování databázového uspořádání informací, které vstupují do heslového odstavce (zde jde v zásadě o rozdíly formální, jako je důsledné oddělování a číslování jednotlivých součástí hesla). Zá[312]hlaví heslové stati tvoří heslové slovo se zkratkou slovního druhu a maximálně 8 charakteristikami (jejich počet může být menší, není-li účelné u daného hesla uvádět všechny, avšak každá charakteristika si zachovává své identifikační číslo; prakticky to znamená, že v databázi je vyčleněno 8 polí na předem stanovený druh informací o heslovém slově, ale jednotlivá pole mohou zůstat prázdná). Jde o následující číslované charakteristiky: 0.1 abecední seznam všech různých grafických zápisů tvarů heslového slova doložených v korpusu (jsou tu tedy uvedeny nejen všechny doložené tvary daného slova a jejich nářeční podoby, ale i všechny různé způsoby jejich psaní; u některých slov, zejména u sloves, jde o výčet mnoha desítek položek, který současně slouží jako lemmatizační pomůcka pro vyhledávání v textech a pro práci s nimi); 0.2 naznačení etymologických souvislostí heslového slova (zpravidla jde jen o velmi stručnou poznámku o původu slova s odkazem na příslušný etymologický slovník); 0.3 první výskyt nebo výskyty slova doložené v korpusu; 0.4 informace o omezenosti výskytu slova (může jít o informace různého druhu – od poznámky, že jde o hapax legomenon, až po detailní popis rozšíření slova v různých územních variantách italštiny; územnímu rozšíření jednotlivých slov ve staré italštině je přitom v TLIO věnována mimořádná pozornost, o čemž svědčí mj. i repertoár více než sta zkratek k označení jednotlivých historických italských dialektů); 0.5 poznámky o valenci slova, jeho vázanosti na určité frazémy ap.; 0.6 různé další poznámky (souvislosti s jinými hesly TLIO, s antroponymy a toponymy, slovotvorné poznámky, poznámky ke zpracování hesla aj.); 0.7 orientační přehled členění dalšího výkladu hesla na významové odstavce (pouze u rozsáhlých a komplikovaných hesel); 0.8 jméno zpracovatele hesla (pouze u hesel zpracovaných za účasti externích spolupracovníků). Pokud se některá z uvedených charakteristik různí podle jednotlivých významů daného slova (týká se to zejména charakteristik 0.4 a 0.5), je pod příslušným číslem uveden odkaz k jednotlivým částem významových odstavců.

Významový odstavec má dvě obligatorní složky, a to číslo významového odstavce a samotné vyjádření významu (pomocí novoitalských ekvivalentů, popř. uvedením podstatných znaků významu), a sedm složek nepovinných, uváděných v případě potřeby. K nepovinným složkám patří 1. zkratka naznačující, zda jde o nejstarší doložený význam, o význam nejbližší významu původnímu (etymologickému), o význam v korpusu nejběžnější nebo význam s nejjasnější referencí (toto jsou zároveň čtyři kritéria užívaná v TLIO pro řazení významových odstavců); 2. zkratka terminologického nebo stylistického zařazení; 3. morfologická či syntaktická poznámka; 4. upozornění na užívání slova v přeneseném významu; 5. a 6. „metajazykové poznámky“ (upřesnění a doplnění různého druhu, týkající se zpravidla valence, kolokability, úzu v příslovích ap.); 7. komentář (další potřebné či užitečné informace, např. o starších nebo novějších synonymech, o poškození textu na daném místě, o významových paralelách v rámci jiných hesel ap.).

V podobě publikované v bulletinu má dokladová část významového odstavce v zásadě jen funkci ilustrativní, neboť v elektronické podobě je slovníková databáze propojena s databází textovou, a je tedy možné volně procházet všechny doklady zvoleného lexému. Jak je v historických slovnících obvyklé, ve významovém odstavci je [313]vždy uváděn nejstarší doklad příslušného lexému v daném významu; v TLIO jsou navíc důsledně uváděny i nejstarší doklady v různých územních variantách staré italštiny, pokud na ně je výskyt lexému vázán. Novější doklady jsou v bulletinech vybírány obvykle v intervalech přibližně 10 let (u slov doložených relativně méně, resp. po kratší dobu) nebo 25 let (u slov doložených hojně a dlouhodobě).

Nelze vyloučit, že naznačené zásady uplatněné při zpracování prvních hesel TLIO, uveřejněných ve zmíněných dvou číslech bulletinu, doznají v detailech dílčích změn jak na základě zkušeností, tak v důsledku diskuse a připomínek ze strany odborné veřejnosti. Bez ohledu na to, zda se tak stane nebo ne, je však zřejmé, že florentský projekt je jako celek projektem úctyhodně rozsáhlým a všestranně dobře promyšleným, jehož výsledky spolehlivě pokryjí dosud jen okrajově zmapované období ve vývoji italštiny a významně tak přispějí i k poznání nejstarších vývojových fází románských jazyků vůbec.

 

LITERATURA

 

BELTRAMI, P. G.: Norme per la redazione del Tesoro della Lingua Italiana delle Origini. In: Bollettino dell’Opera del Vocabolario Italiano, 1998, s. 277–330.

Bibliografia dei testi in volgare fino al 1375 preparati per lo spoglio lessicale. Firenze 1992.

Bollettino dell’Opera del Vocabolario Italiano, I, 1994.

Bollettino dell’Opera del Vocabolario Italiano, II, 1997.

Bollettino dell’Opera del Vocabolario Italiano, III, 1998.

HEALEY, A. D.: Dictionary of Old English. In: International Medieval Research, 2, 1997, s. 55–62.

PIJNENBURG, W. J. J. – SCHOONHEIM, T. H.: Het Vroegmiddelnederlands Woordenboek (1200–1300). De geschiedenis van een project. In: Tijdschift voor Nederlandse Taal- en Letterkunde, 112, 1996, s. 152–164.

Ústav českého jazyka a teorie komunikace FF UK
nám. Jana Palacha 2, Praha 1

Slovo a slovesnost, ročník 61 (2000), číslo 4, s. 309-313

Předchozí Petr Sgall: Jakobson entre l’Est et l’Ouest, 1915–1939

Následující Michal Šulc, Vojko Gorjanc: Korpus slovinského jazyka FIDA