dalaman airport transfers
Časopis Slovo a slovesnost
en cz

Lingvistika a umělý intelekt

Petr Sgall

[Discussion]

(pdf)

Лингвистика и искусственный интеллект / La linguistique et l’intelligence artificielle

Závažnost lingvistiky v kontextu současné vědy stále stoupá, a to především v souvislosti s technickými aplikacemi a s teoretickými směry, které těmto aplikacím odpovídají. Zvyšování výkonnosti samočinných počítačů a růst jejich uplatnění v různých oblastech dříve vyhrazených duševní činnosti člověka vede přirozeně k tomu, že se z nových hledisek přistupuje ke stále širšímu okruhu lingvistických otázek. Čím dál víc pozornosti se věnuje teoriím, které nejsou přímo vázány na uplatnění počítačů, ale svým zaměřením na postupy moderní logiky a požadavky současné metodologie vědy poskytují pro automatizaci nutné předpoklady. Lingvistickým otázkám se tedy v celém světě ve stále větší míře věnují na jedné straně logikové, kteří spolu s lingvisty dnes už soustavně zpracovávají souvislosti mezi lingvistickou a logickou sémantikou i pragmatikou; na druhé straně stále rychleji roste počet nových prací rozšiřujících experimentování v automatickém porozumění textu na další a další oblasti — vedle strojového překladu, automatického indexování a jiných informatických úkolů (k nimž patří i systémy s „bankami dat“) se množí práce z oblasti konverzace člověka se strojem, robotiky a umělého intelektu.

Ústřední problematikou prvně uvedené, teoretické oblasti je problematika sémantická. V jejím vývoji je třeba zaznamenat především u nás už známou koncepci I. A. Meľčuka, J. D. Apresjana a A. K. Žolkovského,[1] kterou bychom mohli označit jako nové pojetí sémantiky pojmenování (zachycuje jak tvoření slov [206]a odpovídající prostředky supletivní, tak i víceméně pravidelná nebo idiomatická pojmenování víceslovná, často ovšem i syntagmata, která bychom z mathesiovského hlediska už za jediné pojmenování nepovažovali). Stále rychleji narůstá materiál zpracovaný z tohoto hlediska pro nově pojatý slovník ruštiny, což samo ukazuje životnost tohoto pohledu na vztahy mezi slovní zásobou a gramatickou stavbou jazyka.

Sémantika lingvistická postrádala až do nedávna hlubší a soustavnější kontakt se sémantikou logickou.[2] Nebylo to dáno snad jen neochotou lingvistů zvládat složité formální systémy, ale zejména také tím, že logické zpracování sémantiky se do značné míry omezovalo na tzv. obecně platné výroky, přesněji řečeno na výroky neobsahující výrazy egocentrické (v Russellově terminologii) nebo indexické (v terminologii Bar-Hillelově), čili to, co v lingvistice označujeme jako prvky deiktické, popř. šiftry. Toto omezení souvisí ovšem už se základním přístupem Tarského k logické sémantice, a jím je také podmíněna morrisovsko-carnapovská trichotomie syntaxe (vztahy mezi znaky), sémantiky (vztahy znaků k označovaným objektům) a pragmatiky (zahrnující i vztahy k uživatelům jazyka). Uplatnění této trichotomie na přirozený jazyk naráželo nutně na základní obtíže, neboť zde nelze obě poslední oblasti oddělit;[3] významy slov , ty, zde, teď, tento atd. nelze studovat zcela odděleně od významů slov jiných, ale zejména nelze studovat sémantiku vět a textů přirozených jazyků bez sémantického rozboru slovesných časů i jiných pragmaticky zabarvených kategorií — nemáme-li na mysli jen věty jako Třikrát tři je devět. Substantivum je podstatné jméno. Co je drahé, není laciné nebo Na vrcholu Popocatepetlu prší průměrně třicet dní v roce. (Poslední příklad, který není analytickým tvrzením, je už z uvedeného hlediska sporný: měli bychom se vlastně ptát, odekdy, popř. dokdy je toto tvrzení pravdivé, nejen zda je pravdivé.) Takové věty bez deixe jsou z lingvistického hlediska typy okrajové (nebo sporné). Hlubší studium jiných typů vět z hlediska logické sémantiky (včetně vět tázacích a rozkazovacích) bylo dlouho jen speciální záležitostí netradičních logických systémů, a teprve nedávno se podařilo šíře využít rozlišení věty a jejího užití (výpovědní události, tvrzení, popř. otázky, rozkazu)[4] i ke zpracování vztahu mezi významem v užším slova smyslu (popř. smyslem věty) a referencí (která je právě spojena s deixí a může se proto při různých užitích téže věty lišit).[5] Jak ukázala např. první konference o formální sémantice, konaná v Cambridgi v dubnu 1973, je tato koncepce v současné lingvistice široce přijímána, ať jde o Lakoffa a další příslušníky školy transformační, nebo např. o Bartschovou a Vennemanna nebo jiné přívržence různých evropských směrů algebraické lingvistiky.[6]

[207]Tento teoretický pohled na vztahy mezi přirozeným jazykem, světem, o němž jazyk vypovídá, a kontexty, v nichž se vět jazyka užívá jako tvrzení, otázek atd., je ovšem dosud spojen s mnoha otevřenými otázkami; pro naši lingvistiku může z nich být aktuální např. problém vztahu mezi ontologickým (kognitivním) obsahem a jazykově ztvárněným významem, otázka nutnosti této dichotomie, její vztah k takovým dvojicím jako extenze a intenze, ale též pragmatika a sémantika, i performance a kompetence, výpovědní událost a věta aj.[7] Dořešení těchto i dalších otázek teprve umožní plné využití nových teoretických koncepcí pro aplikace lingvistiky související s automatizací; zároveň ovšem je perspektiva těchto ekonomicky i jinak velmi efektivních aplikací závažným činitelem urychlujícím teoretický vývoj a slibujícím rozsáhlou a účinnou kontrolu jeho výsledků.

Zatím jsou aplikace snažící se o využití nejen morfologie a syntaxe, popř. lexikologie, ale také sémantiky, odkázány na přístupy spíše „inženýrské“, na cestu pokusů a omylů, která se s uvedeným teoretickým nástupem jistě může vhodně doplňovat. Z prací patřících k této oblasti nalezla velký ohlas studie T. Winograda,[8] která popisuje pokusy s umělým intelektem, přesněji s robotem, který podle psaných pokynů manipuluje s objekty určitého omezeného univerza (jde o přemísťování stavebnicových kostek různého tvaru a barvy, které se ostatně jen naznačuje), dovede odpovídat na otázky o tomto univerzu a v případě potřeby si vyžádat i upřesnění pokynu nebo dotazu: Na pokyn „Vezmi jehlan!“ odpoví „Nevím, který jehlan myslíš“, neboť jehlanů je na jeho stole několik; na otázku „Kolik předmětů je na zelených krychlích?“ neodpoví hned, žádá o upřesnění: „Nevím, co myslíš slovem na ve frázi na zelených krychlích; jde o přímo na povrchu nebo vůbec na něčem, i nepřímo?“ Zůstaneme-li jen u čistě lingvistických aspektů tohoto přístupu k automatickému porozumění textu (o formulaci odpovědí bohužel píše autor jen velmi stručně), musíme ovšem přiznat, že omezený rozsah slovníku (asi 200 slov) nedovoluje bezpečně posoudit, zda rozdíly mezi popisem jazyka zde užitým (založeným na Hallidayově teorii) a mezi dosud obvyklými typy explicitního popisu jsou tak hluboké a tak převratné, jak se někdy uvádí.

Na první pohled se zdá, že Winograd převrací mnohé z hodnot dosud považovaných za základní: při rozboru věty nepostupuje podle jednotlivých rovin, nýbrž zdůrazňuje, že člověk na rozdíl od takových deduktivních systémů, jako je predikátový kalkul, disponuje elementárními heuristickými pravidly, která mu pomáhají orientovat se v záplavě vnímaných jevů, a užívá těchto postupů i při vnímání a interpretaci řeči (s. 39),[9] kdy řeší víceznačnost jednotlivých slov a frází i s užitím širšího kontextu a věcných znalostí (s. 32n.). Při bližším přihlédnutí můžeme dojít k názoru, že rozdíly nejsou tak podstatné, neboť rozdělení rovin zde zůstává (tzv. morfografémika, syntax a sémantika jsou zpracovávány různými složkami systému), užití rekognoskativní gramatiky samo není ničím novým a uvedený heuristický proces se liší od postupu obvyklého především tím, že se nepracuje s celými zápisy věty na jednotlivých rovinách (zápisů by bylo třeba při víceznačnosti konstrukcí velmi mnoho), nýbrž už podle jednotlivých kratších úseků se vybírají jen ty odpovídající jednotky vyšších rovin, které v dané situaci a v daném kontextu věcně přicházejí v úvahu. Pro Winograda je tedy charakteristické, že chce modelovat (popisovat) sdělovací proces, performanci, parole, a nikoli jazykovou kompetenci.[10] [208]Do algebraické lingvistiky zde proniká pohled na jazyk v jeho fungování, ve sdělovacím procesu, a to ovšem může na celkovém zaměření oboru změnit mnohé, jak ve vztahu k jiným oborům, tak pokud jde o váhu a návaznost jednotlivých disciplín uvnitř lingvistiky. (Je např. zajímavé, jak se tu objevuje — ve formulaci patrně příliš vyostřené, s. 18 — těsný vztah mezi souřadným souvětím a textem, u nás dávno známý.) Winograd není jediný ani první, kdo explicitně zachycuje prvky fungování jazyka, ale daří se mu lépe než jiným adekvátními prostředky experimentálně zachycovat souvislosti různých stránek tohoto složitého procesu.

Lze namítnout, že lingvistická ani logická erudice nepatří k Winogradovým silným stránkám; ani mu nejde o nalezení specifických charakteristik přirozeného jazyka jako systému (srov. s. 43 o generativní síle jeho systému). Z toho ovšem nevyplývá, že by nemohl pro lingvistiku razit cestu do nové epochy; vždyť např. o F. Boppovi se říkalo, že na dobrého lingvistu se dost nevyzná v latině.

V každém případě i Winogradova práce znovu potvrzuje výhody těch lingvistických popisů, které postupují lineárně od výrazu k významu (a naopak). Podobně to platí i o řadě dalších prací, vznikajících víceméně současně, které se snaží na jednoduchém univerzu (ať je to systém vlakových nebo leteckých spojení, nebo robot, který má správně a účelně řídit auto) modelovat porozumění jazykovým informacím a provádění pokynů, popř. i složitější reakce.[11]


[1] Viz nyní zprávu A. Bémové a J. Weisheitelové v PBML 22 (v tisku).

[2] Na nutnost dalšího studia sémantiky lingvistické (i na její nové pojetí, dnes už ve světě široce uplatňované) jsme upozornili v SaS 25, 1964, s. 281; vztahy k sémantice logické jsme stručně probrali v Kybernetice 2, 1965, 457—467; nově (spolu s E. Benešovou a E. Hajičovou) v PBML 19, 1973, 29—58; 20, 1973, 3—42, zejm. §§ 2, 3, 4, 8.

[3] Ostatně např. Curry celou trichotomii z hlediska své kombinatorické logiky odmítá, jak jsme už upozornili v knize Generativní popis jazyka a česká deklinace, Praha 1967, s. 35; nově na Curryho stanovisko u nás navazuje L. Nebeský, SaS 34, 1973, 212—214, bohužel bez rozlišení významu a presupozice, s neujasněným termínem negramatických vět a se zavádějícím přiřazováním pravdivostních hodnot větám přirozeného jazyka.

[4] Srov. k těmto otázkám např. P. F. Strawson, Introduction to Logical Theory, Londýn 19675, 174n.; Y. Bar-Hillel, Indexical Expressions, Mind 63, 1954, 359—379, přetištěno v jeho knize Aspects of Language, Jerusalem 1970, 69—88.

[5] K návrhům na doplnění explicitního popisu sémantiky, které formulovali D. Scott, D. Lewis, R. Montague a další (po lingvistické stránce je tu důležitá práce Ö. Dahla On Points of Reference, Logical Grammar Reports, Göteborg 1972), srov. u nás stať P. Jirků v Kybernetice (v tisku).

[6] G. Lakoff, The Inseparability of Semantics and Pragmatics in a Natural Logic, rozmn., 1973; R. Bartsch - T. Vennemann, Semantic Structures, Frankfurt n. M. 1972.

[7] K jednoznačnému výsledku nedochází ani Ch. Rohrer, který rozbírá tuto problematiku z hlediska transformačního popisu v knize Funktionelle Sprachwissenschaft und transformationelle Grammatik, Mnichov 1971.

[8] Understanding Natural Language, Edinburgh 1972, 195 s.

[9] Připomeňme, že k základním charakteristikám přirozeného jazyka spojeným s touto orientací patří aktuální členění věty (srov. § 4.1 ve výše cit. stati v PBML 20); Winograd píše o potřebě „imperativní podoby“ sémantického zápisu (s. 116), ale Hallidayova termínu focus bohužel užívá jen okrajově (s. 139n.).

[10] Jeho cíl se tedy liší od cíle transformační gramatiky, o které se neprávem někdy soudilo, že je popisem činnosti; ve skutečnosti činnost mluvčího je jen ve velmi zprostředkovaném vztahu ke generativní gramatice a rozdílnost cílů tedy zčásti vysvětluje různost aparátu u Chomského aj. a u Winograda. Pokud jde o vztah k pragmatice, je tu ovšem situace podstatně zjednodušena tím, že se pracuje jen s jednou dvojicí mluvčích (člověk a robot) a jen s jednoduchými situacemi (konstelace několika kostek).

[11] Viz např. práce z okruhu D. G. Hayse, který uplatňuje hlediska lingvistická i psychologická (struktura paměti aj.): D. G. Hays, Types of Processes on Cognitive Networks, předn. na konferenci o strojové lingvistice v Pise, srpen 1973; T. Furugori, An Encyclopedic View of Understanding Natural Language (tamtéž); jiný pohled na otázky umělého intelektu přináší Y.-A. Wilks, Grammar, Meaning and the Machine Analysis of Language, London 1972; u nás patří do této oblasti práce O. Štěpánkové a J. M. Havla Some Results Concerning the Situation Calculus, rozmnož. Výrazných výsledků už dosahuje i skupina varšavská, viz zejm. J. St. Bień, Towards Computer Systems for Conversing in Polish, předn. na uvedené konferenci v Pise.

Slovo a slovesnost, volume 35 (1974), number 3, pp. 205-208

Previous Růžena Buchtelová: K technice výběru skupiny posuzovatelů pro hodnocení výslovnosti slov přejatých

Next Petr Piťha: K nové podobě Lambovy stratifikační gramatiky