Časopis Slovo a slovesnost
en cz

K pojmům type — token (K vývoji pojetí některých základních lingvistických pojmů a termínů)

Milena Turbová

[Discussion]

(pdf)

К понятиям тип – экземпляр / Concerning the concepts “type” – “token”

V rámci analýzy pojetí některých základních lingvistických pojmů a termínů byly v SaS již publikovány příspěvky věnované dichotomii langue — parole (Macháčková, 1987, 1989) a kompetence — performance (Turbová, 1988). Nabízí se tedy povšimnout si ještě obdobné distinkce type — token. Bude nás zajímat původ této distinkce, v kterých oblastech jazykovědného bádání se s ní pracuje a především to, zda a do jaké míry zdomácněla v české lingvistice.

Distinkce type — token představuje problematiku známou téměř od počátků filozofie, související s rozpornými stanovisky nominalismu a platonismu (viz Horálek, 1970; Palek, 1969; Strangová, 1968). Jako samostatná kategorie se konstituovala v oblasti sémiotického bádání v 1. pol. 20. stol. při řešení problematiky konvencionalizace znaku. S termíny type a token se poprvé setkáváme u Peirce; ten v rámci svého učení o třech strukturních kategoriích bytí rozlišuje tři druhy znaku. Podle toho, zda je znak pouhou kvalitou, skutečným faktem nebo zákonem, liší qualisignum, sinsignum (odpovídá token) a legisignum (odpovídá type). „Sinsignum je skutečná existující věc nebo událost, která je znakem. Legisignum je zákon, který je znakem. Tento zákon je zpravidla stanoven lidmi. Každý konvenční znak je legisignum. Značícím ovšem nebude jediný (jednotlivý) objekt, nýbrž obecný [153]typ, vybraný podle dohody. Každé legisignum značí prostřednictvím každé své jednotlivé aplikace, kterou můžeme nazvat jeho replikou“[1] (Lingvistické čítanky I, 1972, s. 22). Zatímco type je ztělesnění v token „embodied in a token“, základem identifikace přináležitosti jednotlivých token k určitému type není fyzická, ale funkční identita.[2] Pro token užívá Peirce také termíny replika (replica), ztělesnění (embodiment) a případ (instance).[3]

Takto je Peircovo pojetí interpretováno některými lingvisty: „… zdá se, že pro Peirce je např. type na rozdíl od token zobecněná jednotka nebo „forma“ odlišná od události, která je určitým případem nebo výskytem této jednotky formy“ (Pike, 1967, s. 617).[4]Výskyty neboli token existují v tom smyslu, že jsou to jevy s určitou lokací a časem výskytu; typy, např. slovo „the“, existují v tom smyslu, že jsou to pravidla určující tvar a funkci token“ (Strangová, 1969, s. 10).[5] „Sinsignum — sinsign — skutečná existující věc nebo událost, která je znakem; token — jednotlivý jev, který se udál jednou a jehož totožnost je omezena na to, co se stalo, nebo na jediný objekt nebo věc, která se nachází na jediném místě v jistém čase; tento jev nebo věc mají smysl jen z hlediska toho, kde a kdy se vyskytly, podobně je tomu i s tím nebo oním slovem, na určité řádce určité stránky určitého exempláře knihy. Legisignum — legisign — type — např. slovo nemůže být viditelně umístěno na stránce ani být slyšeno, neboť není jednotlivou věcí nebo jevem; neexistuje, pouze determinuje věci, které existují; je to tedy forma mající význam“ (Lingvistické čítanky I, 1972, s. 143).

Peircovy úvahy se promítly do prací dalších sémiotiků. Např. Carnap (1959) rozlišuje typ (design) jako třídu věcí, k níž náleží mnoho věcí („a class of things to which many things belong“, s. 6), jako vlastnost nebo třídu znaků — událostí („a property or class of sign-events“, s. 8) a událost (event) jako jedinou věc nebo událost („a single thing or event“, s. 6), fyzický objekt („a physical object“, s. 7). Událost se vyznačuje časoprostorovou určeností: „… existuje v určitém časovém momentu nebo během určitého časového intervalu a v každém časovém okamžiku během svého trvání zaujímá určité místo“ (s. 6).[6] Tuto distinkci liší na různých rovinách. Uvádí např. písmeno-událost (letter-event), slovo-událost (word-event), výraz-událost (expression-event), věta-událost (sentence-event); písmeno-type (letter--design), slovo-type (word-design) apod. Jednotlivé události konstituují typ na základě své podobnosti.[7] Odlišnou terminologii pro tuto distinkci užívá Morris [154](1946). Rozlišuje znak-druh (sign-family) a znak-prostředek (sign-vehicle). Jejich definici zakládá jako Carnap na rozlišení určitého fyzického jevu a třídy podobných jevů.[8] Martin (1958) užívá pro type termín symbol-typ (symbol-design), pro token symbol-událost (symbol-event). Type chápe jako třídu (soubor) konkrétních dostatečně podobných jevů (viz Palek, 1969, s. 264). Reichenbach (1966) rozlišuje symbol a token: „… Jednotlivý znak se nazývá token …“ (The individual sign is called a ‚token‘ …, s. 4), symbol je definován jako třída podobných token.[9] Lyons (1977) se vrací k terminologii type a token. Token je opět pojat jako jedinečná časoprostorově určená fyzická entita, vztah mezi type a token je vymezen jako dokládání příkladem (instantiation). Oproti podobnosti jednotlivých token, jež je základem formulací Carnapových a Morrisových, zdůrazňuje Lyons jejich strukturní či funkční identitu. Znovu zde podobně jako Peirce a Reichenbach připomíná úlohu konvence.[10]

V uvedených pracích z oblasti sémiotiky a sémantiky je vymezení type založeno na těchto pojmech: pravidlo, „forma“, jednotka, typ, vlastnost, třída, soubor; definice token spočívá na atributech jednotlivý, určitý, skutečně existující, fyzický, konkrétní, časoprostorově určitý, je charakterizován jako objekt nebo událost, jako případ, výskyt. Vztah type a token je chápán jako ztělesnění (embodiment) či doložení příkladem (instantiation). Vztah jednotlivých token, která tvoří type, je založen na podobnosti, na identitě fyzické, strukturní a funkční, na shodě s type, na zvyku, získaném zákonu, konvenci.

Lingvisty, kteří tuto distinkci (takto terminologicky vyznačenou) promýšlejí teoreticky, zajímá především její význam z hlediska metodologie popisu přirozeného jazyka. Uveďme např. B. Strangovou (1968). Její pojetí distinkce vychází z Peirce, připomíná však, že nejen jednotlivá slova, ale všechny jazykové formy tvoří komplex type — token. Chápe tedy jazyk jako systém type a současně realizaci tohoto systému.[11] Distinkce type — token umožňuje nový pohled na některé jevy, ale zejména dovoluje řešit dosud sporné otázky (např. terminologické odlišení rozdílného statutu pozičních variant fonémů a odlišné realizace hlásek ve stejném zvukovém okolí).[12] Navrhuje řešit pomocí distinkce type — token otázku identity jazyka a identity prvků v rámci jazyka a dále vztah situačního kontextu a významu výpovědí. Aplikaci distinkce type — token považuje za zvláště přínosnou při popisu prolínání synchronních a diachronních jevů v jazyce a při analýze mluvené podoby vysoce kultivovaných jazyků s dlouhou hluboce zakořeněnou literární tradicí. V těchto případech jde o tzv. posuny v type (type-shifts), změny v systému type [155]v průběhu historie jazyka. Také její terminologie je silně ovlivněna Peircem. Ve významu token užívá též termínů replika (replica), ztělesnění (embodiment), zastoupení (representamen) a dále pracuje s termíny token-segmenty (segment-tokens), type-fonémy (phoneme-types), token-morfy (morph-tokens), type-morfy (morph-types), token-výpovědi (utterrance-tokens), systém-type (type-system, speaker’s type-system).

V české lingvistice se k metodologickému užití opozice type — token vyjadřuje několik badatelů. První z nich, Palek (1969) formuluje svůj přístup takto: „Obecně vzato distinkci type — token lze chápat jako distinkci jednotlivina — na jejím základě zobecněný pojem a zavedení této distinkce do pojmového aparátu nějaké disciplíny jako vědomé vzetí faktu zobecňování v úvahu“ (s. 266). Považuje distinkci za užitečnou při výzkumu gramatických vlastností jazykových znaků, jejichž podoba je vázána na nějaké sémantické vztahy, které nejsou zachyceny běžnými syntaktickými vztahy. Jde např. o „obecné transformace, při nichž je nutno vyjádřit u určitých symbolů rovnost jejich lexikálního obsazení“, o případy „odkazování, resp. alteraci, kde je kladena podmínka rovnosti, resp. různosti denotátů“ (s. 266), o vztahy otázka — odpověď, o popis přímé řeči apod. Navrhuje tzv. relační přístup k této distinkci, tj. přihlížení k vnitřní strukturovanosti jazykového systému. Tento přístup spočívá jednak v relativizaci vzhledem k segmentaci, tzn. „posuzování type jistého segmentu jako token vzhledem k jistému segmentu bezprostředně „většímu“, a to pouze vůči němu“, jednak v relativizaci k rovině nebo plánu jazykového popisu nebo vzhledem k formálním požadavkům, k formálnímu aparátu popisu. K tomu přistupují ještě vnější požadavky, především sám cíl práce určuje, zda má smysl distinkce type — token užít. Takový relační přístup by podle Palkova názoru usnadnil orientaci v lingvistických diskusích o interpretaci jednotlivých termínů a odstranil by jejich zbytečné násobení. Zprvu se Palek přidržuje původních termínů; český výraz exemplář pro token zavrhuje pro jeho spojení s představou konkrétního prvku v jeho jedinečných vlastnostech, „pojmem token je zachycován především každý jedinečný výskyt tohoto prvku“ (1969, s. 263). Později se mu však již nevyhýbá: „… znak byl v podstatě pojat jako typ, nikoli jako jistý exemplář (token)“ (1988, s. 7). Při výkladu reference, extenze a denotace (1988) užívá též označení „tp-výraz“ a „tk-výraz“.

Horálek (1970) upozorňuje na skutečnost, že pojmová dichotomie type — token má v moderní jazykovědě starší tradici než v sémiotice: „Lingvistika s rozlišením type — token pracuje, přinejmenším již od dob Baudouinových. Nejen rozdíl mezi fonémem a hláskou, ale také mezi grafémem a různým grafickým vyjádřením hlásky a u jiných podobných dvojic jde o dichotomii type — token“ (s. 190). Připomíná také pokus K. Pikea „udělat protiklad type — token (u něho této dvojici odpovídá dvojice emic — etic podle rozdílu mezi fonologií a fonetikou) základem obecné teorie kulturní tvorby a lidského chování“ (1967, s. 191).

Daneš (1987) přistupuje k této distinkci z hlediska úvah o identitě, různosti nebo podobnosti jazykových jednotek. Volí termíny exemplář (specimen) — (základní) jazyková jednotka (basic linguistic unit). Exemplář určuje na rovině bezprostředního pozorování jako konkrétní jazykovou jednotlivinu, jako jazykový objekt nebo jednotku nultého řádu. Základní jazykové jednotky (představující první stupeň zobecnění) jsou exempláře shodné ve všech svých jazykově relevantních vlastnostech/rysech, liší se pouze vlastnostmi jazykově irelevantními. Podtřídy základních jazykových jednotek vznikají výběrem určité podmnožiny jazykově relevantních rysů. Představují tedy různé řady a typy zobecnění. Tato skutečnost je příčinou terminologických obtíží. Jednak nemají své pojmenování všechny třídy, jednak obsahuje-li třída vedle jazykových jednotek určitého řádu ještě další podtřídy, lze jazykové jednotky označit jak jménem příslušné třídy, tak jménem podtříd, k nimž náležejí. Východisko Daneš spatřuje v pojmenování tříd vždy v nejméně specifickém smyslu.

[156]Kořenský (1986) uvažuje o distinkci type — token globálně, jako o protikladu jazyk — řeč: „… představa o objektu jazykovědy v tomto smyslu je v zásadě dvojí: objektem jazykovědy je tzv. jazyk, objektem jazykovědy je řeč, řečová činnost. Tuto dvojí možnost představ o objektu jazykovědy lze postihnout terminologickými dvojicemi langue — parole, competence — performance a do jisté míry i type — token. V každém z uvedených případů jde však o konkrétní metodologické, do značné míry i filozoficky podmíněné pojetí protikladu jazyk — řeč. Žádná z terminologických dvojic není metodologicky nezávislá. Zejména pokud jde o relace mezi termíny langue kompetence type, velmi výrazně se v této souvislosti reflektují jednak konceptuální diference mezi evropskou a americkou jazykovědou, jednak také dynamika chápání globálních objektů jazykovědy“ (s. 18). K paralele vedené mezi langue a type viz např. Herdan, 1960; Chao, 1974; Strangová, 1969; Palek, 1969.[13]

U několika málo dalších badatelů nalezneme spíše příležitostné užití distinkce ve snaze o správnou interpretaci některého z jazykových jevů. Sgall a kol. (1986) např. charakterizují pomocí type — token povahu textu: „Text je token: nebo přesněji, spíše než sledem výpovědí je text sledem token výpovědí“ (s. 253).[14] Podobně charakterizují také protiklad věta — výpověď: „… jednotlivé výpovědi (užití, token, výskyty) vět …/… individual utterances (uses, tokens, occurrences) of sentence …“ (Sgall a kol., 1986, s. 54), … výpověď (token věta) …/… utterrance (sentence token) (s. 253).

Z. Hlavsa a J. Hlavsa (1984) užívají této distinkce k charakterizování situace. Uvažují o vztahu věta — situace jako o „syntaktickém ztělesnění saussurovské dichotomie signifiant — signifié“ a ustavují tuto korelaci:

 

 

signifiant

signifié

potential

sentence-type

situation-type

actual

sentence-token

situation-token

 

Type-situace je chápána jako abstrakce od určitých rysů určité token-situace. Příznaky potenciální a skutečný, vlastní jsou charakteristické pro terminologický aparát užívaný k popisu kompetence — performance.

Specifickou oblast využití distinkce type — token představuje kvantitativní lingvistika. Zde se však tyto termíny spojují spíše se jménem G. Herdana, jehož hlavní práce vycházejí v 60. letech (1960, 1964, 1966). Herdan užívá k jejich vymezení metod projektivní geometrie, zakládá je na paralele mezi body a přímkami na straně jedné a jazykovými formami a jejich lineární posloupností na straně druhé: „… připíšeme-li geometrickému bodu úlohu jazykových forem (fonémů, morfémů atd.), použijeme pro stručnost označení TYPE, a přímce úlohu lineární posloupnosti těchto forem (ve slovech, větách, textech apod.), budeme ji označovat jako TO[157]KEN, budou se v podstatě shodovat „types“ a „tokens“ jako jazykové „body“ a „přímky“ s formálními axiómy geometrie“ (Herdan, 1966, s. 333).[15] Jednoznačnější definici pojmů type — token Herdan nepodává (viz výtky B. Palka (1969) a Těšitelové (1974)), má vyplynout z komplexu jejich vztahů v jazyce. Jako type určuje v dalším výkladu podle příslušné jazykové roviny jazykové formy (lexémy, fonémy, pojmy apod.), jako token jejich lineární uspořádání, jejich opakované užití, jejich výskyt, četnost jejich výskytu a pravděpodobnost výskytu.[16] Za základní vlastnost této distinkce považuje tzv. dualitu, vzájemnou zaměnitelnost obou pojmů, identitu struktury obou členů a již zmíněné vymezení výskytu token jako lineární posloupnosti (paralelně k přímce v geometrii). Pokouší se také o vymezení vztahu type, token a textu: „Materiál psaného jazyka sestává z type (písmen nebo jejich spojení, slov), token (lineární posloupnosti type) a textů (uspořádání token v knize), tedy doslova „bodů“, „přímek“ a „rovin“ (1960, s. 224).[17] A konečně zavádí později hojně užívaný poměr type — token (t-t ratio) jako poměr slovníku daného textu k celkovému počtu slov v textu a logaritmický poměr type — token (logarithmic t-t ratio) neutralizující vliv délky textu.[18]

S distinkcí type — token se běžně v kvantitativní lingvistice pracuje jako s protikladem jazyková jednotka — její výskyt.[19] Především se však tento protiklad uplatňuje v oblasti lexikální statistiky. (Halliday např. (1976) považuje type — token (item — occurrence) za charakteristický rys slovníku.) Vyhranily se zde dva přístupy v souvislosti s tím, zda se distinkce aplikuje na jazyk flektivní či analytický. Buď se type chápe jako lexém, lexikální jednotka a token jako výskyt slova; sem patří např. Ellegårdovo (1962) pojetí type jako různých typů slov (different typical words) a token jako jejich opakované užití (their repeated use) či užití distinkce type — token v některých frekvenčních slovnících (např. Juilland - Chang-Rodriguez, 1964). Nebo se za type, jazykovou jednotku považuje tvar slova (rus. slovoforma) a token představuje výskyt tohoto tvaru. K takovému pojetí se přiklánějí zejména badatelé, jejichž mateřštinou je analytický jazyk. Požadují, aby mezi type a token byl vztah úplné formální korespondence.[20]

[158]V české lingvistice jsou zastoupena obě pojetí distinkce. Štindlová (1970) vychází z prací S. M. Lamba a L. Gouldové (1964) i z vlastních zkušeností se strojovým zpracováním textu a za token považuje „jakékoli slovo textu“, za type pak „formu, kteroukoli z podob ohebného slova, tedy i tvar základní, i každou tvarově odlišnou jednotku textu, prostě individuální grafickou jednotku textu“. Tuto distinkci doplňuje pojmem lemma chápaným jako „lexikální jednotka morfologicky charakterizovaná repertoárem svých tvarů a reprezentovaná základní (heslovou) podobou, reprezentativním tvarem“ (s. 69). Naproti tomu M. Těšitelová, autorka řady prací z kvantitativní lingvistiky, interpretuje distinkci ve smyslu lexém — výskyt, např. … výskyt slova (occurrence, tedy token) (1974, s. 181), … výrazu token se užívá pro označení výskytu tvaru slova (1974, s. 7), token — opakovaný výskyt tvaru slova, exempláře (1987, s. 159), type — lexikální jednotka, lexém, slovo různé (1987, s. 159); s termíny type token však v podstatě nepracuje. Užívá terminologie: slovo (popř. tvar slova) pro jakoukoli slovní jednotku textu, dále různý tvar slova pro výskyt tvaru slova a různé slovo pro lexikální jednotku, lexém. Sporadicky užívá termínů type — token Ludvíková: „Analyzovanou část přednášky tvoří souvislý text obsahující 5000 slabik (token), z toho 613 různých slabik (type) …“ (Ludvíková, 1972, s. 145).

Závěrem můžeme říci, že terminologická distinkce type — token zdaleka není v české lingvistice běžná. Přestože se objevila u Peirce již v r. 1906 (ve 30. letech vyšly jeho sebrané spisy) a poté v řadě sémiotických prací, teoretický zájem Palkův (patrně související s jeho překladem Peircova díla) koncem 60. let a následná reakce Horálkova na Palkovy úvahy jsou v podstatě ojedinělé. Paralelně s nimi bere na vědomí tyto termíny kvantitativní a strojová lingvistika (zejména pak lexikální statistika) ve dvojím různém chápání (tj. jako protiklad lexém — realizace a slovoforma — realizace). Její představitelé pracují s distinkcí jazyková jednotka — výskyt, ale termíny type — token plně neakceptují. Teprve v posledním desetiletí se tyto termíny objevují v pracích některých lingvistů, zejména v souvislosti s problematikou věty a výpovědi, věty a situace, v souvislosti s otázkami textové lingvistiky, s výzkumem řečové činnosti. Přihlédneme-li též k Danešovým teoretickým úvahám z nedávné doby, lze říci, že protiklad type — token je v české lingvistice pojímán jako protiklad libovolné jednotky jazykového systému a její realizace, výskytu. Objevuje se též snaha opustit jednotkový přístup a pojímat distinkci v celistvosti, jako protiklad jazyk, systém — konkrétní řeč. Palkovy formulace pak naznačují výklad distinkce jako označení vztahu jednotek dvou sousedních jazykových rovin.

 

LITERATURA

 

ALTENBERG, B.: Causal linking in spoken and written English. Studia Linguistica, 38, 1984, s. 20—69.

BACH, E.: An introduction to transformational grammars. New York - Chicago - San Francisco 1966.

CARNAP, R.: Introduction to semantics and formalization of logic. Cambridge, Massachusetts 1959. 1. vyd. 1942.

DAGENAIS, D. J. - BEADLE, K. K.: Written language: When and where to begin. In: Topics in language disorders, 4, 1984, s. 59—85.

DANEŠ, F.: Some thoughts on the sameness, diversity, and similarity of linguistic units. In: Explizite Beschreibung der Sprache und automatische Textbearbeitung. Praha 1987. Interní tisk MFF UK.

DARIAN, S.: Spoken and written communication: Their forms and functions. ITL, Review of applied linguistics 1983, č. 62, s. 27—51.

DULANEY, Earl F., Jr.: Changes in language behavior as a function of veracity. In: Human communication research, 9, 1982, s. 75—82.

ELLEGÅRD, A.: A statistical method for determining authorship. Göteborg 1962.

[159]HALLIDAY, M. A. K.: System and function in language. London 1976.

HERDAN, G.: Type-token mathematics. ’S-Gravenhage 1960.

HERDAN, G.: Quantitative linguistics. London 1964.

HERDAN, G.: The advanced theory of language as choice and chance. Berlin - Heidelberg - New York 1966.

HLAVSA, Z. - HLAVSA, J.: On the concept „situation“ in linguistics and social psychology. In: Text and the pragmatic aspects of language. Eds. J. Kořenský - J. Hoffmannová. Linguistica X. Praha 1984, s. 41—52. Interní tisk ÚJČ ČSAV.

HORÁLEK, K.: Type-token v lingvistice. SaS, 31, 1970, s. 190—191.

CHAO, Y. R.: Language and symbolic systems. Cambridge 1974.

JUILLAND, Al. - CHANG-RODRIGUEZ, E.: Frequency dietionary of Spanish words. Hague 1964.

KOŘENSKÝ, J.: Ke vztahu obecné a speciální teorie systémů z hlediska lingvistiky. In: Teoretické otázky jazykovědy. Ed. J. Nekvapil - O. Šoltys. Linguistica XVI. Praha 1986, s. 17—45. Interní tisk ÚJČ ČSAV.

LAMB, S. M. - GOULD, L.: Concordances from computers. Mechanolinguistics project. California 1964.

LINGVISTICKÉ ČÍTANKY I. Sémiotika sv. 1. Charles Sanders Peirce. Praha 1972.

LUDVÍKOVÁ, M.: Some quantitative aspects of the Czech syllable. PSML, 4, 1972, s. 141—154.

LYONS, J.: Introduction to theoretical linguistics. Cambridge 1968.

LYONS, J.: Semantics. Cambridge 1977.

MACHÁČKOVÁ, E.: O názorech na dichotomii langue a parole. SaS, 48, 1987, s. 232—239.

MACHÁČKOVÁ, E.: O názorech na dichotomii langue a parole (2. část). SaS, 50, 1989, s. 56—65.

MANSCHRECK, T. C. - MAHER, B. A. - BRENDAN, A. - HOOVER, T. M.: Repetition in schizophrenic speech. Language and speech, 28, 1985, s. 255—268.

MARTIN, R. M.: Truth and denotation. London 1958.

MATEY, CH. - KRETSCHMER, R.: A comparison of mother speech to Down’s syndrom, hearing-impaired, and normal-hearing children. The Volta Review, 87, 1985, s. 205—213.

MORRIS, CH.: Signs, language and behavior. New York 1946.

ODDĚLENÍ MATEMATICKÉ LINGVISTIKY V ÚJČ: Na okraj Herdanových knih o kvantitativní lingvistice. SaS, 28, 1967, s. 58—64.

PALEK, B.: Type-Token a lingvistika. SaS, 30, 1969, s. 263—268.

PALEK, B.: Referenční výstavba textu. Praha 1988.

PENG, F. C.: Sex differentiation in language variation: A sociologistic contribution to the language sciences. Language sciences, 4, 1982, s. 131—154.

PEIRCE, Ch. S.: Collected papers. Harvard University Press 1931—58.

PIKE, K. L.: Language in relation to a unified theory of the structure of human behavior. The Hague - Paris 1967.

REICHENBACH, H.: Elements of symbolic logic. New York 1966. 1. vyd. 1947.

SGALL, P. - HAJIČOVÁ, E. - PANEVOVÁ, J.: The meaning of the sentence in its semantic and pragmatic aspects. Praha 1986.

SILVERMAN, G.: The effect of topic and repetition of type-token ratios of spoken monologues. Language and speech, 20, 1977, s. 232—239.

STRANG, B.: Types and tokens in language. In: Proceedings of the University of Durham Philosophical Society, I. Series B (arts). No. 3, Durham 1968.

STRANG, B.: Modern English structure. Bristol 1969.

ŠTINDLOVÁ, J.: Záznam o zpracování textu pomocí strojů. SaS, 31, 1970, s. 64—70.

TĚŠITELOVÁ, M.: Na okraj nových frekvenčních slovníků. SaS, 26, 1965, s. 267—275.

TĚŠITELOVÁ, M.: Otázky lexikální statistiky. Studie a práce lingvistické 9. Praha 1974.

TĚŠITELOVÁ, M.: Kvantitativní lingvistika. Praha 1987. 1. vyd. 1977. Skripta UK.

TĚŠITELOVÁ, M.: Využití statistických metod v gramatice. Praha 1980.

TĚŠITELOVÁ, M. a kol.: Kvantitativní charakteristiky současné češtiny. Praha 1985.

TURBOVÁ, M.: K pojmům kompetence — performance. SaS, 49, 1988, s. 235—247.


[1] “A common method of estimating the amount of matter in a MS. or printed book is to count the number of words. There will ordinarily be about twenty ‘the’s’ on a page, and of course they count as twenty words. In another sense of the word “word”, however, there is but one word ‘the’ in the English language; and it is impossible that this word should lie visibly on a page or be heard in any voice, for the reason that it is not a single thing or single event. It does not exist; it only determines things that do exist (i.e. its mode of being is thirdness, not secondness). Such a definitely significant Form, I propose to term a Type. A single event which happens once and whose identity is limited to that one happening or a single object or thing which is in some single place at any one instant of time, such event or thing being significant only as occurring just where and when it does, such as this or that word on a single line of a single page of a single copy of a book, I will venture to call a Token… In order that a Type may be used, it has to be embodied… in a Token which shall be a sign of the Type, and thereby of the object the Type signifies… I propose to call such a Token of a Type an ‘Instance’ of the Type. Thus, there may be twenty Instances of the Type ‘the’ on a page“ (Peirce 1931, IV. 537; Strang, 1968, s. 13).

[2] “When we recognise different tokens as instances of the same word or type, we do so, not necessarily by virtue of physical identity between the corresponding successive sound-components of each, but by virtue of a functional identity between the corresponding sounds, taking the sound not for what it is as actually uttered, but as a sign or representamen of the appropriated word component” (Peirce, 1931, IV, s. 537).

[3] “We speak of writing or pronouncing the word “man” but it is only a ‘replica’, or embodiment of the word, that is pronounced or written. The word itself has no existence although it has a real being consisting in the fact that existents ‘will’ conform to it. It is a general mode of succession of three sounds or representamens of sounds, which becomes a sign only in the fact that a habit or acquired law, will cause replicas of it to be interpreted as meaning a man or men. The word and its meaning are both general rules, but the word alone of the two prescribes the qualities of its replicas in themselves …” (Peirce, 1931, II, s. 292).

[4] “… for Peirce, for example, a “type” as distinct from a “token“ seems to be a generalized unit or “form” as distinct from an event which is a particular instance or occurrence of that form unit” (Pike, 1967, s. 617).

[5] “The instances, or tokens, exist in the sense of being phenomena having a definite location and time of occurrence; the types, e.g. the word ‘the’, exist in the sense that they are rules determining the shape and function of the tokens” (Strang, 1969, s. 10).

[6] “… it is at a certain time-moment or during a certain time-interval, and at each time-moment within its duration it occupies a certain place” (Carnap, 1959, s. 6).

[7] “They are different (i.e. non-identical), although similar, their similarity enables you to recognize them as belonging to the same design“ (Carnap, 1959, s. 6).

[8] “A particular physical event — such as a given sound or mark or movement — which is a sign will be called a sign-vehicle. A set of similar sign-vehicles which for a given interpreter have the same significata will be called a sign-family“ (Morris, 1946, s. 39).

[9] “To have a convenient term we shall call these different kinds of tokens ‘similar‘ to each other, using the word ‘similar‘ to a somewhat wider sense. The class of similar tokens is called a ‘symbol‘… The coordination of these different kinds of tokens to one another is of course a matter of convention“ (Reichenbach, 1966, s. 5).

[10] “… tokens substantiate their types … Tokens are unique physical entities, located at a particular place in space or time. They are identified as tokens of the same type by virtue of their similarity with other unique physical entities and by virtue of their conformity to the type they instantiate“ (Lyons, 1977, s. 14) … “The categorization of tokens into types has just been described in terms of the process of pattern-recognition; and we have emphasized the importance of functional factors and conventional standards of identification what is all too often regarded as purely perceptual process“ (Lyons, 1977, s. 16).

[11] “Accordingly, no account of language which excludes from it the type-system can be valid, since that is what both causes and enables the tokens to function“ (Strang, 1969, s. 10).

[12] “Differences between positional variants, like differences between phonemes, are type-differences; differences between representamens of sound in the same phonetic context are token-differences. Strictly speaking, no two phonetic contexts are the same; one should speak of the same phonematic context, or the same context-type“ (Strang, 1968, s. 19).

[13] “When a speaker of the language makes an utterance, it is then speech, realized as an instance of a linguistic form. In the terminology of communication theory, a language is a system of ‘types‘ and utterance or speech in the language is a ‘token‘. The English language is a type“ (Chao, 1974, s. 11).

„V jazykovědě tato distinkce našla také uplatnění v protikladu parole — langue, ovšem z poněkud jiného zorného úhlu. Postulování langue jako soustavy jazykových norem u F. de Saussura je vědomou snahou konstatovat rozdíl mezi aktuálním, konkrétním projevem jazykového znaku a jeho obecným projevem v jazykových normách. V důsledcích pak vede k vydělení relevantních vlastností z komplexu vlastní znak tvořících. Opět obecně vzato, důraz se klade na distinkci „zvláštní — obecné“, v rámci každého znaku; pozornost se přitom soustřeďuje k popisu obecného. Distinkce type — token naproti tomu konfrontuje jedinečný výskyt jazykového jevu vázaný časoprostorovými podmínkami a jazykový jev od těchto podmínek abstrahovaný, přičemž žádný z obou členů distinkce není preferován“ (Palek, 1969, s. 266).

[14] “The text is a token: or more precisely, rather than a sequence of utterances, it is a sequence of utterance tokens“ (Sgall et al., 1986, s. 253).

[15] “It has now come to light that if we assign to the “point“ of geometry the role of linguistic forms (phoneme, morpheme, etc.) which we shall briefly refer to as TYPE, and to the “line“ that of linear sequence of such forms (in words, sentences, texts, etc.) which we shall refer to as TOKEN, there appears to be, on the whole, agreement between the properties of “types“ and “tokens“, as the linguistic “points“ and “lines“, and the formal axioms of geometry “ (Herdan, 1966, s. 333).

[16] “… linguistic forms (e.g. words) — their linear arrangement“ (Herdan, 1960, s. 257), vocabulary items of the dictionary — their repeated use in texts (s. 233), words — frequence (s. 232), phoneme — their sequence within words (s. 241), concepts — token (frequency of occurrence and probability of linguistic forms, number of cognitions) (s. 232).

[17] “The material of the written language consists of types (the letters or their combinations, words), tokens (the linear sequence of types) and texts (the arrangement of tokens throughout the book), and thus literally of “points“, “lines“ and “planes“ (Herdan, 1960, s. 244).

[18] V současné době se v hojné míře užívá poměru type — token k charakteristice projevu v nejrůznějších oblastech. V psycholingvistice se např. zkoumají odlišnosti pravdivých a nepravdivých sdělení (Dulaney, 1982), vliv tématu a opakování monologu na počet type v řeči (Silverman, 1977); v oblasti patologie řeči se takto charakterizuje projev dětí s opožděným vývojem řeči, analyzuje se opakování u schizofreniků (Manschreck - Maher - Brendan - Hoover, 1985), způsob komunikace matky se sluchově narušenými dětmi (Matey - Kretschmer, 1985). V oblasti sociolingvistiky se uvádí do vztahu poměr type - token a diferenciace pohlaví (Peng, 1982), charakterizuje se vztah mezi mluvenou a psanou komunikací (Altenberg 1984; Dagenais - Beadle, 1984; Darian, 1983) apod.

[19] “The important distinction between an item and an occurrence of an item is often denoted by the distinction between a type … and a token …“ (Bach, 1966, s. 156).

[20] “Each item in the text is a token (or instance) of some type. All like tokens are said to belong to one type, which may be thought of as having the same form as its tokens. Two tokens are alike if they consist of the same ordered string of characters“ (Lamb - Gould, 1964, s. 5).

Slovo a slovesnost, volume 51 (1990), number 2, pp. 152-159

Previous Jana Slavíčková: Konference o funkční lingvistice a dialektice

Next Eva Hajičová: K sedmdesátinám profesora Jána Horeckého