Časopis Slovo a slovesnost
en cz

5. kongres Euralexu ve finském Tampere

Renata Blatná, Jitka Radoňová

[Kronika]

(pdf)

The 5th congress of Euralex in Tampere, Finland

V srpnu 1922 uspořádala Evropská lexikografická asociace (Euralex) spolu s Univerzitou v Tampere již svůj 5. kongres. Na tradiční „bienále” lexikografů, korpusových lingvistů, nakladatelů a učitelů jazyků se sjelo 289 účastníků ze 40 zemí celého světa. Kongres byl zahájen rektorem Univerzity v Tampere prof. T. Pukkilou a prezidentem Euralexu prof. R. R. K. Hartmannem. Úvodní přednášku na téma „Lexikografie a korpusová lingvistika” přednesl prof. F. Karlsson z Helsinské univerzity.

Kongresu předcházel celodenní praktický seminář v dvojjazyčné lexikografii zaměřený na komputační zpracování překladového slovníku. Vedli jej S. Atkinsová (V. Británie), N. Calzolariová a E. Picchi (Itálie). S. Atkinsová nejprve podrobně popsala postup práce ve výchozím jazyce (angličtině). Identifikace jednotlivých slovníkových významů se opírá o a) diskrétní význam slova, b) rámec sémantických vztahů – liší se vztahy synonymické a antonymické, c) syntaktickou strukturu, d) kolokační vztahy, e) vlastní kolokační rámec. Pro práci s korpusem je však nutné navíc zvážit některé gramatické údaje. Hlavní náplní výkladu byla ukázka zpracování konkrétního anglického slova taste pro dvojjazyčný, anglicko–italský slovník. V rámci toho byl předváděn software vyvinutý v Istituto di Linguistica Computazionale E. Picchim, který umožňuje vyhledávat v korpusu nejfrekventovanější užití, typická pro dané významy, včetně co nejširšího kontextu. Dále je možné vyhledávat frazeologická spojení, na základě abecedního řazení kolokací (levých i pravých) je možné získat frekvenční údaje o celých syntaktických konstrukcích. Když jsou do „sémantických matric” na základě studia anglického korpusu doplněny další údaje (jde hlavně o doplnění příkladů a idiomatických spojení), dostává se tento „polotovar” do rukou italských lexikografů, kteří pracují s italským korpusem obdobným způsobem.

Celkem 70 kongresových příspěvků bylo rozděleno do šesti sekcí, plenárně byly předneseny přednášky J. Apresjana a J. Svartvika.

J. Apresjan (Rusko) se v příspěvku „Systémová lexikografie” zaměřil na tři hlavní body charakteristické pro moderní teoretickou lingvistiku, které jsou důležité pro systémovou lexikografii: 1) tzv. naivní obraz světa, který je [319]rozčlenitelný na řadu „naivních věd”, např. naivní geometrii, naivní fyziku apod., 2) lexikografický výzkum z hlediska makrolingvistického, tj. vymezení lexikografických typů a 3) lexikografický výzkum z hlediska mikrolingvistického, tj. vytváření lexikografického portrétu.

J. Svartvik (Švédsko) ve své přednášce „Slovní zásoba v korpusech angličtiny” stručně připomněl historii nové jazykovědné disciplíny – korpusové lingvistiky, která spadá svými počátky do 60. let, kdy začaly vznikat malé reprezentativní korpusy asi o milionu slov. V dnešní době lingvisté usilují o vybudování stamilionových korpusů využívajících nepřetržitého toku informací v elektronicky čitelné podobě. Pro Svartvika je primární neformální, spontánní mluvený jazyk, nejčastější forma, v níž se jazyk realizuje, a současně forma nejméně prozkoumaná (a nejen v angličtině). Od poloviny 70. let se Svartvik na Univerzitě v Lundu podílel na vybudování mluveného korpusu angličtiny. Jeho konečnou podobu, dnes distribuovanou spolu s korpusy psaných textů a třídícím softwarem na CD–ROM, tvoří 100 textů, celkem přibližně 500 tisíc slov. Takto omezený korpus je ovšem vhodný pouze pro studium gramatiky. Pro lexikografické zpracování by byl zcela nedostatečný.

Referáty v 1. sekci byly věnovány lexikografickým problémům z hlediska uživatele. Soustředily se do těchto problémových okruhů: (a) Frekvence slov a víceslovných spojení: P. Bogaards (Holandsko) došel na základě dotazníkové akce mezi studenty k závěru, že při vyhledávání víceslovných spojení ve slovnících se projevuje tendence hledat význam spojení pod méně frekventovaným komponentem. (b) Metajazyk: P. Stocková (V. Británie) se zabývala slovníkovými definicemi a tím, jak jsou ovlivněny kulturním prostředím národa, který jazyk užívá. Tak např. většina Angličanů považuje rajče za zeleninu, zatímco z encyklopedického hlediska se rajče řadí k ovoci. V definicích je proto nutné zvažovat, zda je tato encyklopedická informace relevantní. E. Walterová (V. Británie) řešila otázku, do jaké míry jsou synonyma nahrazující slovníkové definice pro uživatele transparentní. „Synonymní informaci” nepovažuje autorka za jednoznačnou. Proto uvádí typy dalších slovníkových informací, jako je typický kontext, kolokace, frazémy, stylistické a jiné hodnotící informace, jimiž je třeba synonyma doplnit. (c) Výběr příkladů: Tímto tématem se zabývala B. Lauferová (Nový Zéland). Srovnávala příklady převzaté z korpusu a příklady napsané přímo lexikografem a dospěla k těmto závěrům: 1) k pochopení nového slova nestačí většinou příklad, musí být kombinován s definicí, 2) příklady vytvořené lexikografem jsou více nápomocné než příklady autentické, 3) příklady vytvořené lexikografem jsou méně závislé na šíři slovní zásoby uživatele. (d) Přechod mezi výkladovými a překladovými slovníky: R. R. K. Hartmann (V. Británie) ve svém referátě propagoval smíšený slovník výkladovo–překladový a vyzdvihoval ho jako nejvhodnější slovníkový typ pro uživatele, kteří nejsou rodilými mluvčími.

2. sekce se zabývala problematikou terminologie a terminografie. Většina příspěvků se zaměřovala na vybudování terminologických bank a databází. Řešily se problémy kontextové exemplifikace termínů, dále problémy vícejazyčné, zejména anglicko–německé terminologické lexikografie. Účastníci byli také seznámeni s terminologickou bankou COGNITERM, informováni o způsobech využití terminologické banky TERO a o spojení terminologické banky se strojovým překladem – programu EIRETERM.

3. sekce zahrnula příspěvky zabývající se komputační lexikologií a lexikografií. Zásadním referátem zde byla zpráva pracovní skupiny řešící projekt TEI (Text Encoding Initiative). Úkolem skupiny je vypracovat návrh na použití SGML (Standard Generalized Markup Language) pro kódování počítačově čitelných slovníků, a to jak jednojazyčných, tak dvojjazyčných. Z lexikografického pohledu jednotné kódování významně usnadní např. tvorbu různých typů slovníku co do velikosti z jedné báze nebo výměnu lexikální informace mezi různými slovníky. V této sekci byla svými referáty výrazně zastoupena italská počítačová lingvistika, resp. její středisko v Pise, kde se v současné době podílejí např. na mezinárodním projektu Esprit Acquilex, jehož cílem je vybudovat vícejazyčnou lexikální databázi s použitím existujících jedno– a dvojjazyčných databází. E. Picchi a C. Petersová referovali o dvojjazyčné části Lexikografické pracovní stanice v Pise. Stanice má dvě hlavní části: systém plně automatizovaného vyhledávání informace v textu, umožňující i její třídění, a lexikální databázi. Jejím doplněním je dále slovníkový editor. Stanice původně pracovala pouze jednojazyčně (italština), nově byla adaptována pro dvojjazyčné fungování a obohacena o systém automatického vyhledávání v italsko–anglickém korpusu.

4. sekce byla věnována lingvistice v lexikografii. Příspěvky se zabývaly např. odrazem [320]morfologické a morfematické problematiky ve slovníku. M. Glovinská (Rusko) referovala o slovníku ruského slovesa. Slovníková hesla tu jsou složena z heslového slova, morfologických údajů, definic významu, typu vidové opozice, sady vidových a temporálních významů daného slovesa, rozdílů v kombinatorice, v zapojení do frazémů. P. ten Hacken (Švýcarsko) se ve svém referátu pokusil vymezit kritéria pro lexikalizované slovní spojení. V. Telijová (Rusko) seznámila posluchače s projektem „Maket slovarnoj staťji dlja Avtomatizirovannogo tolkovo–ideografičeskogo slovarja idiom”. Rozbor motivace idiomů by tu měl sloužit k vytvoření rovnováhy mezi levou, ruskou, a pravou, anglickou, stranou. Konotaci ve slovníkovém zpracování se věnoval K. Opitz (SRN). Dělí ji na soukromou a obecně sdílenou. Zatímco soukromá stojí mimo lexikografovu pozornost, „veřejné” konotace by mohly být do slovníku konotací zařazeny, i když i tady je spousta sporných otázek. Vyvozuje tyto závěry: 1) uvádění konotací ve slovníku je nemyslitelné bez lexikálního významu, 2) obecně platná interpretace určitých konotací může být dosažena jen v těch případech, kde jde o přechodné stadium k lexikalizaci. G. Nunberg (USA) ve svém příspěvku řešil otázku systematické polysémie, a to jak z lexikologického, tak lexikografického hlediska. Z lexikologického pohledu typ transferu „králík → jeho kožešina, maso” vysvětluje jako konvenční, pragmatické užití. Detailní lexikografický popis by měl obsahovat všechna pravidelná přenášení významu odrážející věcnou skutečnost. Syntagmatické vztahy, kterými se ve svém příspěvku zabýval L. de Stadler (JAR), se týkaly slovníkových definic ve vztahu k heslovému slovu. U těch heslových slov, resp. sloves, která se pojí s určitým inherentně daným prototypickým subjektem či objektem (pes štěká), je nutné v definici zvážit 1) stupeň ustálenosti daného prototypu, 2) unilaterálnost či bilaterálnost vztahu. T. van der Wouden (Holandsko) se zabýval kolokacemi ve vícejazyčném slovníku. Vycházel z jednojazyčného Meľčukova slovníku Explanatory Combinatory Dictionary, který operuje s lexikálními funkcemi.

5. sekce, tematicky zaměřená na proces tvorby slovníků, jeví určitou nekoherentnost, příspěvky jsou svým zaměřením velmi různorodé. Zdá se, že tato problematika není v současné době středem pozornosti. J. Ayto (V. Británie) dochází ve svém referátu k závěru, že i v otázkách pravopisu je třeba se důsledně řídit deskriptivním přístupem a vycházet z úzu, i kdyby byl takový pravopis vzhledem k etymologii slova mylný. D. Thompsonová (V. Británie) popisuje ve svém příspěvku průzkum nových lexikálních prvků užívaných v televizním vysílání. Během 51 hodin programu bylo zaregistrováno téměř 500 nových slov nebo významů, které nejsou zahrnuty do Concise Oxford Dictionary. R. Moonová (V. Británie) se zabývá otázkou ustálených slovních spojení v souvislosti s vytvářením jejich databáze. P. van Sterkenburg (Holandsko) referoval o Slovníku synonym Van Dale.

Příspěvky k problémům historické lexikografie v 6. sekci byly poměrně nepočetné, zmiňme se zde například o referátech A. M. Al–Kasimiho (Maroko) Je slovník citací slovníkem?, O. M. Karpovové (Rusko) o slovnících jazyka W. Shakespeara nebo H. Neetara (Estonsko) o etymologii v estonském dialektologickém slovníku.

Na kongresu měli lexikografové také možnost seznámit se s editačními slovníkovými programy Gestorlex, Synlex a DictEdit. Jejich podstata je obdobná. Např. DictEdit, jehož autorem je P. Masereew (Holandsko), je kombinací databázového programu (je to systém polí, která jsou navíc hierarchicky uspořádána, tj. existence některých polí je podmíněna existencí jiných) a textového procesoru (s tím rozdílem, že autor např. nemůže posunout kurzor na další pole, obsahuje-li pole, v němž pracuje, neúplnou informaci, některá pole automaticky zmizí, vyplníme-li jiná pole určitým způsobem atd.).

Kongresy Euralexu se stávají již tradiční možností seznámit se s projekty významných (a nejen evropských) lexikografických pracovišť. Nezanedbatelná je i příležitost prakticky si v počítačovém centru vyzkoušet prezentovaný software. Pro lexikografy obtížně se potýkající s přechodem od tradičních slovníkářských metod ke komputační lexikografii jsou významným podnětem posilujícím perspektivu jejich práce. Příští setkání se uskuteční v roce 1994 v Amsterodamu, o dva roky později v Pise a v roce 1998 by měla účastníky kongresu Euralexu přivítat ve spolupráci s Vídní Praha.

Slovo a slovesnost, ročník 54 (1993), číslo 4, s. 318-320

Předchozí red. (= Redakce): Eva Macháčková zemřela

Následující František Daneš: Odstavec jako centrální jednotka tematicko-kompoziční výstavby textu (na materiále textů výkladových)