Časopis Slovo a slovesnost
en cz

Jan Kořenský – František Cvrček – František Novák: Juristická a lingvistická analýza právních textů (právněinformatický přístup)

Ludmila Uhlířová

[Recenze]

(pdf)

Jan Kořenský – František Cvrček – František Novák: Juristická a lingvistická analýza právních textů (právněinformatický přístup)

Jan Kořenský – František Cvrček – František Novák: Juristická a lingvistická analýza právních textů (právněinformatický přístup). Academia, Praha 1999. 171 s.

 

Knížka dvou právníků z Ústavu teorie práva AV ČR a lingvisty z Ústavu pro jazyk český AV ČR je sice útlá, ale v mnoha ohledech průkopnická. Zaprvé – viděno z hlediska lingvistického – její autoři zakládají u nás novou oblast aplikované lingvistiky, lingvistiku právní. Zkoumají jazykovou strukturu právních textů v širokém časovém období 20. století. Zadruhé – viděno z hlediska teorie práva – předkládají rozsáhlou juristickou analýzu struktury právních pojmů a právních dokumentů různých typů, popisují náš právní řád z hlediska kvantitativního a verifikují celou řadu důležitých hypotéz o něm. Zatřetí – z hlediska právněinformatického – poprvé u nás organizují milionové databáze právních textů, které patří, jak konstatují, k nejrozsáhlejším v Evropě v daném oboru, vypracovávají programy pro automatické rozpoznávání jejich právních a jazykových vlastností a tím podstatně přispívají k rozvíjení právní informatiky, rovněž jednoho ze zcela nových oborů. Knížka tedy v plné míře vykazuje základní koncepční a metodologické atributy, které jsou tak charakteristické pro dnešní přístupy k analýze textu, totiž interdisciplinárnost a empirické opření o rozsáhlé datové soubory. Cílem multidisciplinární analýzy právních textů je přispět k adekvátnějšímu porozumění právním textům a k zvýšení efektivnosti právní komunikace v různých směrech [301]a na různých úrovních. Předpokládá se využití výsledků analýzy jak v legislativě samé, zejména pro přípravu a tvorbu právních předpisů, tak pro její soudní i vědeckou interpretaci. Jde o výzkum dlouhodobý, podporovaný postupně několika granty. V knize je prezentován průřez „průběžným stavem“ výzkumu za posledních pět let, k jehož nejdůležitějším výsledkům patří jednak podrobná teoretická rekonstrukce struktury právních dokumentů se zřetelem na „transtextové“ vazby, jednak lingvistická – strukturní a kvantitativní – analýza na rovině lexikální a syntaktické. Protože jde o průřez, musí čtenář počítat s tím, že obsah knihy je předkládán v několika rovinách obecnosti, od podrobně vyložených dílčích empirických výsledků dokumentovaných tabulkami, grafy a přehledy až po lakonicky resumující, ale teoreticky i aplikačně nesmírně závažná sdělení o jiných, neméně obsáhlých výsledcích analýz a o rozličných hypotézách.

Kompozičně je kniha uspořádána do sedmi kapitol, počínaje teoretickými a metodologickými východisky (autoři Cvrček, Kořenský, Novák), přes podrobný popis právních reálií České republiky, které jsou předmětem analýzy (Cvrček), kvantitativní popis právního jazyka (Cvrček), lingvistickou analýzu formální struktury právních pojmů (Kořenský), juristickou analýzu právních dokumentů a pojmů (Cvrček), otázky právní komunikace, tvorby právních předpisů a problému jejich intertextuality (Kořenský) až po možnosti a perspektivy využití výsledků analýz v legislativě (Novák).

V této zprávě budou komentovány především výsledky lingvistických analýz, nicméně je třeba zdůraznit, že i vlastní poznatky právnické jsou jak pro lingvisty, tak pro širokou odbornou i laickou veřejnost nesmírně zajímavé. Především je podán velmi podrobný přehled o našem právním řádu a na základě tohoto přehledu jsou ověřovány různé hypotézy. Podrobněji jsou v knize zmíněny ty z nich, které se autorům zdály zajímavé ve vztahu k převažujícímu obvyklému mínění právní komunity – celkově totiž autoři dospívají k závěru, pro laika bezpochyby neočekávanému, že „většina intuitivních představ se ukázala být mylná“ (s. 31). Vyvrací se například představa, panující mezi laickou veřejností i převážnou částí právníků, že právních předpisů je mnoho a jejich počet se neúměrně zvyšuje. Na popisu produkce právních předpisů se dokazuje, že o tzv. legislativní inflaci (definované jako roční přírůstek k platnému právnímu řádu, který převyšuje 5 % platného právního řádu, s. 33) „nelze rozumně mluvit“. Srovnáním s ostatními evropskými právními řády se dále ukazuje, že obecné civilizační tendence ovlivňují právní řády více než např. politický režim – náš právní řád se nejvíce blíží právnímu řádu Rakouska. Rovněž se ukazuje, že „ve vztahu k politickému režimu je zcela mylná představa, že bývalé tzv. socialistické státy trpěly nadprodukcí právních předpisů“ – právo tedy nebylo v tomto smyslu základním nástrojem řízení země (s. 37–38). Za pozornost stojí výsledky analýzy změn v našem právním řádu po r. 1990. V těchto letech se výrazně měnily tzv. primární předpisy – procento změn se jeví extrémní v porovnání se všemi obdobími minulými. Po r. 1993 se parlament zaměřil především na novelizace vlastních předpisů, přičemž novely nejsou rozloženy po celém právním řádu, ale týkají se převážně stejných předpisů (podrobněji k tomu s. 38–39). Důležité je z toho plynoucí konstatování, že „změny po roce 1993 z kvantitativního hlediska neměly v naší historii srovnání a lze důvodně předpokládat, že musely nastolit v našem právním řádu značně chaotickou situaci“ (s. 39).

[302]Tento poznatek má velký význam pro lingvisty, kteří se ve své odborné praxi nějak setkávají s texty právní povahy. Zmíněnou chaotickou situací lze totiž možná mimo jiné vysvětlit, proč například do jazykové poradny Ústavu pro jazyk český dochází v poslední době tolik dotazů s právní problematikou. Zřejmě lze mluvit i o jistém chaosu jazykově interpretačním. Nejen laická veřejnost, ale i osoby z kruhů právnických a expertních shledávají některé textace právních dokumentů nesrozumitelné, nejednoznačné, poskytující možnost dvojího výkladu (viz např. opakovaný dotaz na formulaci …podpis připojí předseda, popř. místopředseda a jeden člen představenstva – jsou vždy nutné dva podpisy?). Přibývá jednotlivců i institucí, kteří se obracejí na lingvisty v naději, že „gramatický“ rozbor, mnohdy rozbor izolovaného paragrafu či věty nebo i jediného slova určitého zákona bez jakéhokoli širšího kontextu, může fungovat jako argument v jejich sporu a rozhodnout v jejich prospěch (třeba i beznadějnou) právní při nebo například odvrátit velkou finanční ztrátu apod., a proto někdy dokonce naléhají, aby byla přijata „jejich“ interpretace, ba ve výjimečných případech nabízejí již předem vypracovanou vlastní slovní odpověď. Někteří jsou zklamáni, jiní naopak vítají, jestliže jazykový rozbor pouze potvrdí (nevyloučí) možnost dvojí interpretace věty. O problému, jak obtížné je v takových případech zaujmout „izolovaně filologické stanovisko“, se v recenzované knize píše na s. 133–134: „čistě ‘jazykový výklad’ musí být maximálně objektivizovanou právní interpretací, doplněnou interpretací lingvistickou všude tam, kde výklad nelze již opřít o právní konceptuální soustavu“. Soudím, že takto formulovaný názor sice naprosto přesně vystihuje požadavek či přání klienta jazykové poradny, ale v praxi jazykový rozbor takovou funkci neplní, a to z několika důvodů. Na jedné straně právníci vznášejí námitku, že „pouhá“ pravopisná, interpunkční, slovosledná či jiná „chyba“ ve znění věty není podstatná pro tu interpretaci, kterou mínili tvůrci právního textu a která je jediná správná, na druhé straně si lingvisté právem kladou obdobnou otázku, zda totiž například „mluvnicky“ správná, ale právnicky evidentně nezamýšlená interpretace souvětí opírající se o jedinou chybějící (či redundantní) interpunkční čárku může být argumentem jakékoli právní síly, a domnívají se, že jazyková interpretace může být nanejvýš jakýmsi podpůrným argumentem, který sice může, ale v zásadě nemusí být vůbec vzat v úvahu. Přitom nejen právníci mohou v určitých případech (podrobněji o takových případech viz s. 123) dospět „různou, ale přípustnou argumentací k rozdílným závěrům“, ale stejně tak lingvisté často nabízejí dvě alternativní řešení.

Právě z těchto důvodů je tak důležité a aktuální zabývat se právní lingvistikou (stejně jako např. sociologií práva), a protože autoři knihy zpracovávají toto téma do úctyhodné teoretické i empirické hloubky, doufejme, že to bude brzy mít příznivý důsledek i pro zatím tak obtížnou srozumitelnost právnické češtiny. V této souvislosti je nicméně třeba ocenit, že oba spoluautoři-právníci píší o komplikované problematice jasnou, čtivou češtinou nepostrádající stylovou dynamiku a že jejich kapitoly se čtou se skutečným potěšením.

Lingvistická analýza právních textů se opírá o strukturní a kvantitativní metodologii na několika úrovních. Ústředním předmětem analýz je právní termín a struktura věty. I když výchozími body analýz jsou formální, „povrchové“ vlastnosti slova a vě[303]ty, pro aplikaci v legislativě se považuje na základě dosavadních výsledků za nezbytné, aby analýzy vyústily do úrovně sémantické a pragmatické tak, aby jich bylo možno využít pro rekonstrukci právních pojmů, jejich obsahu a aby bylo možno identifikovat a zhodnotit jejich textové realizace, to vše na základě rozsáhlých, průběžně aktualizovaných databází právních textů s využitím efektivních programů a matematických modelů.

Pro automatické vyhledávání textových realizací „konceptuálních objektů“, tj. „slov a slovních spojení, která mají charakter právních termínů“, se ukázal z mnoha důvodů jako neschůdný zdánlivě jednoduchý postup lexikální, tj. takový, jehož základem by byl úplný soupis termínů doložených v korpusu (soupis by byl obsáhlý, každý korpus je otevřený, je nesnadné stanovit kritéria zařaditelnosti atd.). Sémantickým a pragmatickým požadavkům analýzy daleko lépe vyhovuje jiné, abstraktnější jazykové východisko, založené na morfologicko-syntaktických modelech konceptů a jejich „minimálního informačního okolí“. Empiricky nalezené modely jsou v knize podrobně popsány v základních termínech slovních druhů a pádů, např. trest odnětí svobody má strukturu S//S2S2 apod. Pro právní texty je charakteristická gramatická složitost vět s komplikovanými a rozsáhlými nominálními řetězci a s velkou „mírou naplněnosti právními termíny, resp. pojmy“. Potíže činí popis složitých gramatických struktur s diskontinuitními elementy (v důsledku volného slovosledu) a se zájmennými substituty. V současné etapě výzkumu však už autoři mají k dispozici programy, které umožňují automaticky rozpoznávat právní a gramatické struktury, vytvářet slovníky právních slov a slovních spojení, analyzovat odkazy, blízké a vzdálené kontexty, i různé další programy (s. 125).

Kvantitativní jazykové charakteristiky právních textů se týkají především roviny lexikální, částečně též morfologické. Metodologicky se opírají o pojetí pražské kvantitativní lingvistiky 70. a 80. let v pracích M. Těšitelové a jejího kolektivu. Frekvenční údaje získané z právních textů jsou s údaji z těchto prací konfrontovány. Databáze právních textů, z nichž byly kvantitativní charakteristiky zjišťovány, jsou však mnohonásobně většího rozsahu než korpus Těšitelové a kol. V tabulkách na s. 46–49 jsou uvedeny frekvence slovních druhů, a to v dvojím pojetí. Podrobnější klasifikace do sedmnácti slovních tříd (za samostatná jsou počítána např. modální a pomocná slovesa, trpné rody, posesivní adjektiva, tzv. nevýznamová příslovce aj.) vede k zajímavým frekvenčním poměrům, ale klasifikace sama i frekvence jsou bez komentáře. Komentovány jsou frekvenční poměry u klasického desatera slovních druhů (přesněji devatera, protože citoslovce mají nulovou frekvenci), a to porovnáním s korpusem administrativních textů u Těšitelové a kol. Konstatuje se, že právní texty potvrzují s dílčími odchylkami základní tendence v rozdělení slovních druhů v administrativních textech, přičemž za nejvýznamnější odchylku je považován relativně vysoký výskyt zájmen (s. 49, opakovaně na s. 67 a 106). Významnost odchylky, která činí +3,6 % v právních textech, není statisticky testována a o významnosti opačné odchylky, totiž o –3,6 % nižší frekvenci sloves v právních textech, se neuvažuje. Pro interpretaci rozdílu ve frekvenci zájmen by bylo velice zajímavé vědět, které druhy zájmen mají v právních textech vysokou frekvenci a jakou funkci či funkce mají ve struktuře práv[304]ních textů především. Není také vyloučeno, že rozdíl oněch 3,6 % je způsoben odlišným pojetím slovního druhu zájmen (v korpusu administrativních textů bylo pojetí poměrně úzké, opírající se o formálně morfologické příznaky) nebo tím, že oba korpusy nejsou z různých důvodů do detailů vzájemně porovnatelné. Srovnání frekvence zájmen v právních textech s frekvencí zájmen v textech věcného stylu (tj. ve větším, a tedy reprezentativnějším korpusu, obsahujícím vedle malého subkorpusu textů administrativních také větší subkorpusy textů odborných a publicistických) ukazuje totiž dobrou shodu, viz tab. na s. 49: rozdíl ve frekvenci zájmen mezi oběma korpusy činí jen 1,2 % ve prospěch textů právních.

Velice zajímavá jsou dále data o frekvencích rodů a životnosti substantiv a přehledy prvních padesáti nejfrekventovanějších substantiv, adjektiv a sloves (na prvních místech jsou, dle očekávání, slova s „formální rolí“, tj. slova typická např. pro změny a doplňování předpisů, pro citace, odkazy apod., viz s. 60). Nepotvrdilo se například tvrzení spojující vysokou frekvenci slova zákon s lidskými právy (s úpravou lidských práv a svobod); slovo zákon je nejfrekventovanější plnovýznamové slovo v celém právním řádu (s. 107). Porovnáním dvou korpusů právních textů, z r. 1984 a z r. 1998, se vyslovuje pozoruhodná hypotéza, že na základě četností slovních druhů a plnovýznamových slov v nejfrekventovanější vrstvě slovní zásoby bude možné v rámci právního jazyka rozlišit stylové podskupiny (s. 60).

Velmi záslužný z hlediska aplikačního i pro teorii kvantitativního modelování vlastností jazyka a textu je pokus aplikovat některé klasické kvantitativní charakteristiky slovníku, a to tzv. bohatství, koncentraci a rozptýlení slovníku (Guiraudovy charakteristiky v interpretaci Těšitelové), tedy charakteristiky založené na vztazích mezi délkou textu a velikostí jeho slovníku. Pro právní texty byla zjištěna vysoká koncentrace, chudost a nízký rozptyl slovníku. Podstatné je, že v daném případě jde o slovníkové charakteristiky speciálně orientované databáze textů. Autoři v této souvislosti kladou otázku, zda v případě veliké databáze například Guiraudovo bohatství slovníku ještě popisuje mechanismus závislosti slovníku na délce textu, anebo zda – jak jsou přesvědčeni – jde o mechanismus složitější, kterým bude potřeba se zabývat. Jejich otázka je otázkou principiální, přestože ji autoři formulují v konkrétních termínech. Obecně se totiž lze ptát, zda kvantitativní (statistické) vlastnosti textů omezené délky a kvantitativní (statistické) vlastnosti obrovských korpusů se skutečně řídí stejnými zákony „velkých čísel“, zda pro ně vyhovují stejné pravděpodobnostní modely apod.

Zjištění základních lexikálních charakteristik na velké databázi právních textů představuje významný přínos pro poznání kvantitativních vlastností češtiny. Autoři provedli mnohá další, originální (a inspirativní!) a rozsáhlá kvantitativní šetření, která však v knize nejsou (k lítosti lingvistově) blíže popsána, jen jejich výsledky jsou velmi stručně resumovány. Například na tzv. paradigmatickém slovníku (= všechny potenciální slovní tvary všech lexémů v textech, tj. jejich úplná paradigmata) o rozsahu jednoho milionu „byla vypočítána jednak teoretická a jednak empirická váha pádové a slovnědruhové homonymie a výsledný soubor byl redukován na úroveň pomocného slovníku pro právní termíny, kdy ani víceslovné spojení homonymii neodstraní“ (s. 105). Byla testována (a zamítnuta) hypotéza o zvýšeném výskytu adjektiv ve funk[305]ci „zpřesňující“ právní terminologii (s. 106). Byla vypočtena míra reprezentativnosti názvů předpisů vzhledem k frekvenci výskytů slov v daném textu (bylo zjištěno, že nadpisy jsou vysoce reprezentativní, s. 106). Konstatuje se, že „průměrná délka normativní věty se nijak zásadně neliší od délky věty v obecném základu českého jazyka“ (není však jasné, co se rozumí normativní větou), avšak nelze ji vhodně charakterizovat pomocí její průměrné délky. Z hlediska vlastního cíle kvantitativní analýzy není podstatné, jakou konkrétní numerickou hodnotu má každá jednotlivá zjištěná empirická charakteristika, ale celkové výsledky. Ty hodnotí autoři jako „závažné především ve vztahu k tradičním intuitivním představám právních teoretiků“ (s. 108).

O knize, kterou napsal „nadšený i skeptický“ (s. 140) tým tří vědců, by bylo možno říci ještě velmi mnoho pozitivního, vyzdvihnout originalitu i perspektivnost projektu a ocenit obrovské úsilí při budování otevřených a velice rozsáhlých databází, slovníků, tezaurů atd., exaktně popisujících právní řád a umožňujících automaticky rozpoznávat jeho jazykové i právní vlastnosti. To, čeho však je třeba si vážit nejvíce a bez čeho by nebylo možno dosáhnout těchto výsledků, je dokonalá pracovní souhra vědců z rozdílných oborů, která vyústila v obdivuhodnou interdisciplinární vyváženost výzkumu: Od analýzy jazykové roviny, která tvoří „povrchovou“ strukturu právních textů, se autoři snaží pronikat k jejich „hlubší“, pojmové struktuře, na níž pak testují, zda některý z problémů není „převoditelný na jazykovou úroveň a zde rozumně řešitelný“ (s. 109).

Ústav pro jazyk český AV ČR
Letenská 4, Praha 1

Slovo a slovesnost, ročník 61 (2000), číslo 4, s. 300-305

Předchozí Jiří Nekvapil: Code-Switching in Conversation. Language, Interaction and Identity

Následující Ludmila Uhlířová: Gejza Wimmer – Gabriel Altmann: Thesaurus of Univariate Discrete Probability Distributions