en cz

Nové směry ve výzkumu explozív

Blanka Borovičková, Vlastislav Maláč, Miluše Sedláková

[Articles]

Новые направления в исследовании смычных / Les tendences nouvelles dans la recherche des explosives

Když byly počátkem padesátých let publikovány četné a důkladné práce zabývající se podstatou akustické struktury hlásek z artikulačního a percepčního hlediska, zdálo se, že rozsáhlé experimenty, založené na moderních metodách, vyřešily s definitivní platností problematiku akustických korelátů fonémů. Zejména máme na mysli klasickou práci Jakobsona, Fanta a Halleho[1] a práce Haskinsových laboratoří,[2],[3],[4] které jsou založeny jednak na studiu trojrozměrných spektrogramů typu „vissible speech“,[5] jednak na ověřování zjištěných zákonitostí poslechem syntetického signálu. Počáteční optimismus plynoucí z přecenění technické stránky objektivních měřicích metod byl brzy korigován. Došlo k tomu zejména, když se dostavily první potíže s automatickou identifikací řečových jednotek samočinným počítačem.[6],[7],[8] A tak po deseti letech dalšího soustředěného výzkumu v oboru akustiky řeči je otázka závažnosti jednotlivých akustických veličin i nadále nedořešena. Navíc se objevuje značná komplexnost tohoto problému, zejména při hledání akustických korelátů explozívních fonémů. Stockholmský Speech Communication Seminar se stal v r. 1962 vlastně přehlídkou zklamaných nadějí prvních objektivních měření akustických veličin řečového signálu. Stal se však i přehlídkou nových fyzikálně technických parametrů zjistitelných ve spektru (průchody nulou, produkty korelační a autokorelační analýzy, primární akustický signál získaný inverzním filtrováním atd.), dokumentující úporné snahy po zvládnutí problému.[9] Zde bylo též jednoznačně konstatováno, že změny zřetelné v akustickém spektru nejsou vždy nositeli závažné informace. Naopak změny sotva postřehnutelné mohou být z percepčního hlediska mimořádně významné. Tento poznatek se týkal zejména explozív.[10],[11] V té době jsme již měli vlastní zkušenosti s analýzou řečového signálu pomocí trojrozměrných spektrogramů i s poslechovými testy, určujícími identifikační závažnost jednotlivých částí těchto akustických spekter.[12],[13] V dalších rozsáhlých experimentech, které byly [308]uskutečňovány ve spolupráci fonetiků a elektroakustiků, jsme si postupně prověřovali první vlastní výsledky a zaujímali jsme stanovisko k výsledkům zahraničním.[14]

Za dalších deset let jsme získali řadu cenných zkušeností z experimentů vlastních i publikovaných, zejména v zahraniční literatuře. Mnohé zjednodušené představy o percepční závažnosti jsme znovu kritizovali a revidovali. Zejména naše zkušenosti se syntetickým řečovým signálem od konce šedesátých let[15] nám odhalovaly mnohé slabiny dnes již dávných teorií. Přestali jsme např. věřit v absolutní hodnotu lokusu.[4],[16],[17] Vytvořili jsme si vlastní model produkce řeči založený na vícekanálovém řízení artikulačních pochodů[18],[19] jako základ pro vytvoření hláskové struktury z hlediska percepčního. Poslechové testy syntetických slabik typu CV ukázaly, že jsme schopni vytvořit všechny české hláskové kombinace s průměrnou poznatelností 94 %.[20] Z hlediska technického využití syntetického signálu je tato hodnota nesporným úspěchem. Z hlediska základního úkolu, totiž hledání akustických korelátů českých fonémů, je tento úspěch pouhým zjištěním, že technické vybavení našich laboratoří je způsobilé k experimentování pomocí syntetického signálu řeči. Proto přistupujeme znovu k řešení akustických korelátů fonémů a začínáme s oblastí nejsložitější: s fonémy explozívními. Toto téma je stále aktuální i ve světové literatuře.

Minulé období posunulo těžiště fonetického výzkumu z převážně fyzikálně technické oblasti do oblasti fyziologické a psychologické.[21] Přesun těžiště výzkumu má dva hlavní důvody: především si badatelé uvědomili mimořádnou závažnost znalosti fyziologických a psychologických postupů využívaných při sdělování informace řečí; druhým důvodem byla snaha odstranit nedostatek poznatků, který je právě v této oblasti fyziologie a psychologie značný. Z tohoto hlediska je dobré, že technická zařízení jsou dále velmi intenzívně využívána a neustále modernizována v souladu s překotným rozvojem slaboproudé elektrotechniky, elektroakustiky i počítačové techniky. Stoupající náročnost technických postupů, nezbytná k proniknutí alespoň do základních zákonitostí produkce a percepce řeči, neustále rozšiřuje komplexnost problematiky. Podtrhuje tím i její mezioborový charakter. I přes zvyšující se objem fyzikálně matematických prací je přesun těžiště výzkumu směrem k fyziologii a psychologii zřejmý. Máme za to, že je i nevyhnutelný. Kromě jiného zdůraznil, že metody a výsledky těchto technicky náročných experimentů jsou pouze prostředkem a podkladem k mimořádně náročné interpretaci. Zdaleka tedy nejsou konečným cílem, jak se někdy z počátku stávalo.

Tato orientace výzkumu přináší v posledních letech hojné ovoce. O tom jsme se mohli přesvědčit i na leningradském symposiu „Poslechová analýza a percepce řeči“ [309](srpen 1973). Na podobném symposiu v r. 1966 (také v Leningradě) byly předváděné modely percepce a produkce řeči experimentálně málo podložené a diskuse nebyla příliš konkrétní. Naproti tomu na symposiu v r. 1973 bylo patrno, že některé části předkládaných modelů vycházely z výsledků rozsáhlých experimentů, a diskuse byla v těchto bodech velmi konkrétní. Ale i v tak probádaných oblastech, jako je například kochleární mechanika,[22a] se objevují nové poznatky. Například poznatky J. J. Zwislockého[22b] o linearitě všech kochleárních pochodů byly překvapivým konstatováním, i když platnost Weberova-Fechnerova zákona[23] je běžnou skutečností každodenní praxe.

Jestliže při výzkumu kochleární mechaniky jsou pokusy na zvířatech velkým přínosem, jsou ostatní roviny fyziologie řeči odkázány na práce prováděné pouze na lidských objektech. Přímá pozorování a měření na jednotlivých rovinách nervové soustavy jsou velmi vzácná (např. při neurochirurgických zákrocích). Proto se veškeré experimenty provádějí pomocí metod nepřímých, v nichž převládají poslechové testy individuální i skupinové.

Poslech ve fonetice je staronovou metodou, ale přes veškerý pokrok technického uspořádání je metodou nejzávažnější. Poslechové hodnocení akustického signálu řeči nejen přirozeného, ale zejména umělého, je jediným způsobem, jak hledat a verifikovat závažnost jednotlivých akustických dějů z hlediska jejich percepčního významu (váhy).[12] Soudobé poslechové testy kladou důraz zejména na přesnost měření fyzikálních vlastností akustických stimulů a na způsob zpracování odpovědí statistickými postupy. V posledních letech se nově používá nejrůznějších syntetických zvuků. Ztrácejí ovšem hodnotu řeči tím, že původně řečový umělý signál se postupně zjednodušuje tak, až zbude pouze jediný tón, který už ani zdaleka nepřipomíná řečový signál. V amerických laboratořích byla v poslední době provedena celá řada takových experimentů. Např. I. G. Mattingly[24] srovnával dvouformantovou simulaci spojení CV s proměnnou počáteční frekvencí tranzientu druhého formantu (F2) se signálem samotného druhého formantu a se signálem tranzientu tohoto formantu (v trvání 40 ms). Tyto signály byly též reprodukovány pozpátku. Cílem bylo sledovat přítomnost nebo nepřítomnost zvýšení procenta diskriminační funkce[25] na fonémových hranicích. Takovými experimenty se ověřují dřívější hypotézy o odděleném zpracování řečových a obecných akustických signálů v percepčních pochodech,[26] na jejich základech se též vyslovují nové názory na percepční postupy. Např. bylo prověřeno rozdílné zpracování samohlásek a souhlásek postupem kontinuálním proti kategoriálnímu.[27] Vedle centrální teorie percepce řeči vznikla motorická teorie percepce řeči. Psychologicky je tato teorie založena na interiorizaci významu, na transformaci vnější řeči do plánu řeči vnitřní. Jde zvláště o práce Luriovy.[28] Z hlediska komunikačního zdůrazňuje tato teorie především to, že redukce informačního toku je uskutečňována využitím povelových struktur produkce [310]řečových jednotek, které je nutno dekódovat.[29] Stevensův příspěvek na leningradském symposiu 1973,[30] založený na experimentech vlastních i na experimentech jiných autorů, vyúsťuje v novou definici distinktivního rysu konsonantický. Tato definice je založena na protikladu přítomnosti nebo nepřítomnosti rychlé změny spektra hlásky. Stevens rozlišuje tři základní formy akustického spektra, které přispívají k dekódování akustického signálu do fonetických úseků a rysů:[31]

(1) Forma, jejíž spektrální znaky lze odvodit z kvazistacionární části odpovídající cílovým artikulačním postavením.

(2) Forma s pomalými časovými změnami spektra (v časovém rozmezí 50—100 ms), které lze analyzátorem odpovídajícím perifernímu sluchovému systému zaznamenávat bod po bodu.

(3) Forma s rychlými časovými změnami (s trváním mezi 10—30 ms), které již sluchový analyzátor neregistruje diskrétně, ale hodnotí spektrum součtovou (integrovanou) hodnotou. Uplatňují se zde oba principy mozkové činnosti, jejichž analogií může být analogový a digitální počítač.

V práci z r. 1973[30] Stevens předpokládá, že rychlé změny jsou identifikovány zvláštními vrozenými mechanismy (property detectors), které jsou schopny určit místo artikulace iniciálního konsonantu. Tyto vlastnosti konsonantu mohou být určovány absolutně, tedy bez kontextové závislosti. Jsou primární naproti distinkcím sekundárním, které jsou kontextově závislé. Přitom vyžadují v percepčním procesu uložení do krátkodobé paměti (s dobou uložení řádově jednu vteřinu). Tato paměť je označována jako prekategoriální. Současná neuropsychologie se snaží vysvětlit funkci vrozených mechanismů, ale práce, které v této oblasti byly provedeny, mají dosud diskutabilní charakter. Sama funkce krátkodobé paměti v procesu percepce řeči navazuje na dlouhodobé experimentální výzkumy pamětního procesu vůbec, zvláště na klasické práce Ebbinghausovy[32] a Millerovy.[33]

Zdá se, že celkové zaměření tohoto výzkumu je vedeno snahou po nalezení pevného absolutního bodu v percepčním procesu, na němž by bylo možno vybudovat pevnou percepční strukturu. Tuto snahu patrně zesiluje neudržitelnost lokusové teorie,[4] která byla postupně některými autory revidována[34] a jinými opouštěna[17],[18],[35] a u které setrvávali již jen ti nejkrajnější zastánci.[36] Ale ani nová Stevensova hypotéza není bez problémů. Je si jich vědom i sám autor, když píše, že primární distinkce hlásek nemusejí být vždy přítomny a že jsou pak nahrazovány distinkcemi sekundárními. Přitom jsou primární distinkce nejvýznamnější v období osvojování základních fonetických distinktivních rysů u malých dětí.

Poněkud zvláštní je interpretace využití exploze ve spojení s tranzienty formantové struktury následující samohlásky v rychlých změnách. V některých kombinacích CV využívají vrozené mechanismy jak explozi, tak část tranzientů, jinde pouze počátek tranzientů. Jako doklad jsou uváděny ještě nepublikované experimentální výsledky.

[311]Zajímavé je také tvrzení, že afrikáty jsou charakterizovány rychlou změnou spektra v detenzi souhlásky (na konci šumu). Podle našich spektrogramů[18] jsou takové změny patrné jen u některých pozičních variant; v našich poslechových testech umělých CV slabik[20] jsou sice časté záměny /s/ za /c/ a opačně, ale opět jen ve spojení s některými samohláskami. Přitom je spektrum šumu v jeho koncové části naprosto shodné jak pro /s/, tak pro /c/. Podobné záměny jsme pozorovali i ve dvojici /š/ a /č/. U většiny pozičních variant těchto konsonantů však byla poznatelnost mezi 90 až 100 %.

Závěrem bychom rádi uvedli další doklady o tom, že ani výsledky zdánlivě jednoduchých experimentů zahraničních laboratoří nelze bez předchozího experimentálního ověření převzít. Zaměříme se na klasický experiment Haskinsových laboratoří, zabývající se stanovením významu tranzientu druhého formantu při identifikaci iniciálních explozív,[27] který byl nedávno opakován ve zvětšeném rozsahu.[24] Již před časem jsme se zajímali o to, zda se projeví také u českých explozív /p, t, ť, k/ kategoriálnost při jejich identifikaci, jak to prokázaly oba zmíněné experimenty. Avšak naše výsledky se podstatně lišily od výsledků zahraničních. Přestože syntetický signál byl vytvořen na stockholmském syntetizéru OVE III během studijního pobytu v r. 1969 a přesto, že byl svými parametry téměř shodný se signálem užívaným Haskinsovými laboratořemi, nebyla kategoriálnost identifikace českých explozívních fonémů prokázána.[37] Její náznaky byly pouze mezi explozívami /p/ a /t/, /ť/ bylo zastoupeno jen částečně a vůbec chybělo /k/.

Když jsme v r. 1973 znovu začali zpracovávat akustické koreláty explozívních fonémů, rozhodli jsme se opakovat celý experiment s proměnným tranzientem F2 ve větším rozsahu.

V klasickém experimentu Haskinsových laboratoří byla měněna pouze jedna dimenze v posloupnosti akustických stimulů. Byla to výchozí frekvence tranzientu druhého formantu. Nás však zajímá kromě vlivu této výchozí frekvence na vjem iniciální explozívy též vliv samohlásky a vliv trvání tranzientu formantů. Proto jsme v našich stimulech měnili čtyři proměnné. První z nich měla dvě varianty: samohlásku /o/ a samohlásku /e/. Obě samohlásky měly shodný první formant. Základní spektrální hodnoty jsou patrné v obr. a. Druhou proměnnou bylo trvání tranzientu prvního formantu ve třech variantách uvedených graficky v obr. b. Třetí proměnnou bylo trvání tranzientu druhého formantu také ve třech variantách podle obr. c. Poslední, čtvrtou proměnnou byla výchozí frekvence tranzientu druhého formantu v osmi variantách vyznačených v obr. d. Vzájemnou kombinací všech variant čtyř proměnných jsme získali celkem 144 různých stimulů. (Obr. s. 312.)

Rozmanitost změn v posloupnosti stimulů byla použita k tomu, abychom zjistili vzájemnou interakci jednotlivých proměnných. Podle ní jsme poslechové testy rozdělili do několika skupin týkajících se jednotlivých proměnných.

Celý poslechový test byl tedy uvažován jako předpokus a byl poslechově hodnocen skupinou 15 vysokoškolských studentů z Prahy. Soubor stimulů nahodile uspořádaný byl rozdělen do 6 skupin po 24. Každá skupina byla uvedena syntetickým předsignálem „zapište“. Mezi jednotlivými skupinami byly pauzy 20 sec. Za třetí skupinou byla pauza 2 min. Jednotlivé stimuly následovaly ve čtyřvteřinových intervalech. Test byl uveden jednoduchou instrukcí: zapište hlásková spojení umělé řeči, která uslyšíte.

Výsledek předčil veškerá očekávání: posluchači vůbec neidentifikovali předložené akustické stimuly jako spojení explozíva + samohláska. Většinou sice hodnotili

[312]

stimuly jako dvojčlenné, ale iniciální člen byl explozívou jen ojediněle (v průměru 2,7 %). Když jsme znovu srovnávali naše a zahraniční experimenty, došli jsme k závěru, že hlavním důvodem tak rozdílných výsledků testování může být způsob jeho provedení, zejména vstupní instrukce. Proto jsme opakovali celý test znovu.

[313]Soubor stimulů jsme předložili posluchačům celkem třikrát, vždy s jinou instrukcí. První byla shodná s instrukcí v předcházejícím experimentu (a shodná též s instrukcí v experimentu z r. 1969); ve druhé instrukci byly posluchači žádáni, aby první člen dvojčlenných slabik typu CV hodnotili jako některou ze čtyř neznělých explozív /p, t, ť, k/; třetí opakování souboru mělo instrukci z druhého testu rozšířenou o výzvu zaměřit se také na samohlásku slabiky, v níž se může vyskytnout kromě /o/ též /e/ nebo samohláska /a/.

Výsledky podle očekávání prokázaly významnou závislost odpovědí posluchačů na instrukci. Průměrná hodnota odpovědí „iniciální explozíva“ byla 0,8 % v prvním opakování, 62,6 % v druhém opakování a 43,8 % v opakování třetím. Co do průměrného procenta odpovědí jsou výsledky druhého a třetího opakování srovnatelné s našimi výsledky z roku 1969 (60,3 %) přesto, že se instrukce v obou měřeních lišily. V experimentu z r. 1969 byla instrukce shodná s instrukcí užitou v prvním opakování testu r. 1973. Rozdíl testu spočíval v tom, že 15 stimulů s proměnným tranzientem F2 bylo promícháno s umělými slabikami typu CV (byly zastoupeny všechny české souhlásky i samohlásky). Z toho vyplývá další závažná skutečnost vnitřní organizace experimentu — jeho kontext ovlivňuje výsledky stejně významně jako navozující instrukce. Tento poznatek nám potvrdily i naše zkušenosti s experimentem určujícím vliv trvání střední souhlásky a samohlásky umělého slova /sasasa/ na kvantitu samohlásek. Experiment bude popsán později. Zde pouze uvádíme zkušenost, že posluchači v průběhu testu buď nabyli vhled do struktury testu, nebo ji vyabstrahovali a v důsledku toho podstatně změnili výrok o hodnotách stimulu.

Došli jsme tedy k závěrům, že i v tak jednoduchých experimentech, jakými byly naše testy, se podstatně uplatňuje celá řada proměnných. Máme-li fyzikálně ohodnocený stimulus, pak nejen jeho vlastnosti (viz obr. a—d), ale i instrukce je stejně závažnou proměnnou, s níž je nutno počítat. Vzhledem k tomu, že naše experimenty byly provedeny v rámci interpersonálního vztahu, je nutné vedle působení instrukce vzít v úvahu i procesuální charakteristiku motivace pokusných osob (zvláště motivační selhání). Záleží i na postojové orientaci pokusné osoby zvláště se zřetelem k momentu očekávání[38] a na formulaci instrukce samé, a konečně i na sémantickém zprostředkování vlastností stimulu, právě tak jako na schopnosti posluchače vyjádřit slyšené. Někdy jde o schopnost podřadit slyšené pod známé kategorie, jindy o závažný teoretický problém, který je vlastní metodologii poslechových testů, právě tak jako byl vlastní metodologii pokusů psychofyzických. V souvislosti s tímto metodologickým problémem klademe si otázku, nakolik je pokusná osoba s to verbálně označit slyšené, a nakolik vůbec jsou percepční data vyjádřitelná (význačně rozlišitelná) a sdělitelná běžnou řečí.

Stejně tak záleží na samém uspořádání testu, zvláště na počtu stimulů a počtu expozic stejného stimulu. Zdá se, že při malém počtu fyzikálně popsaných stimulů, ale často opakovaných, nemůžeme dojít k stejným výsledkům jako při velkém počtu fyzikálně popsaných stimulů, i když byly exponovány stejně často. Tato skutečnost zřejmě souvisí s diferenciační schopností posluchače, která je další proměnnou při úvaze testů našeho typu.

Tyto důležité poznatky o nefyzikálních proměnných, které se uplatňují v experimentech, nás nutí k prověřování jejich jednotlivých funkcí během experimentu a k zjišťování jejich závažnosti. Jednou z forem prověřování vlivu těchto proměnných je uspořádání předběžného poslechového testu. Hodnotíme-li naše experimenty z hlediska akustických proměnných našich stimulů tak, jak jsou uvedeny na obr. a—d, pak docházíme k těmto závěrům:

[314]a) Samohláska nemá vliv na celkové procento odpovědí „iniciální explozíva“. Zato se posunují frekvenční hranice oddělující jednotlivé explozívy v posloupnosti výchozích frekvencí tranzientu F2 (obr. d) souhlasně s rostoucí frekvencí druhého formantu. Např. horní hranice oblasti explozívy /p/ se přesunula z hodnoty 1,1 kHz u slabiky se samohláskou /o/ na 1,7 kHz u slabiky s /e/.

b) Z hlediska odpovědi „iniciální explozíva“ bylo maximální procento zjištěno u trvání tranzientu prvního formantu 30 ms. Hodnotíme-li tento vliv u jednotlivých explozív, pak se ukazuje tendence zkracovat tuto hodnotu u /p/ a prodlužovat u /k/ a zejména u /ť/.

c) Trvání tranzientu F2 vykazuje podobné tendence jako trvání tranzientu F1.

d) Nejvýraznější změny jsou podle očekávání způsobeny změnou výchozí frekvence tranzientu druhého formantu.

Protože závislost procenta identifikace iniciální explozívy na výchozí frekvenci tranzientu F2 byla podstatou poslechových testů Haskinsových laboratoří, uvedeme tuto část našich výsledků ve srovnání s jejich výsledky. Podstatně se lišíme ve dvou bodech.

Za prvé, procento identifikace v našem experimentu zdaleka nedosahuje hodnot 100 %, jak je tomu u výsledků zahraničních. Také oblasti jednotlivých explozív nejsou od sebe výrazně odděleny, ale vzájemně se překrývají ve velkém rozmezí. Z toho vyvozujeme, že naše testy nepotvrdily kategoriálnost vnímání explozív podle typu tranzientu. Do jaké míry odlišné hodnoty našich experimentů byly způsobeny rozdílností našich a anglických explozív a do jaké míry jde o další odlišnosti v metodě poslechových testů, prokáží nově prováděné experimenty.

Za druhé se lišíme pořadím explozív v posloupnosti výchozí frekvence tranzientu F2. Nejvýraznější je umístění explozívy /k/. Zatímco ve výsledcích zahraničních je pořadí /p, t, k/ se stoupající frekvencí, v našich výsledcích je pořadí explozív /k, p, t, ť/. Uspokojující vysvětlení tohoto jevu jsme zatím nenašli a bude předmětem dalšího výzkumu.

Podrobnější rozbor dalších výsledků našich experimentů přesahuje rámec této stati a je obsažen v laboratorní zprávě.[39] Zde jenom shrnujeme, že z hlediska našeho záměru splnil předpokus naše očekávání v tom, že jsme schopni vymezit obory jednotlivých proměnných při sestavování dalších poslechových testů. Dále nás naše předběžné výsledky upozornily na některé důležité rozdíly ve srovnání s výsledky zahraničními. Překvapujícím a nadmíru významným výsledkem je pak zjištění míry závažnosti vnitřní organizace poslechových testů a důležitosti přesné formulace a popisu instrukce dávané poslechové skupině.

Jestliže tedy foneticky nezaškolený a nezacvičený posluchač mění tak výrazně odpověď na daný stimulus, jak jsme prokázali v našich experimentech, tím více budou zatíženy individuální odpovědi vědeckých pracovníků, kteří znají jak celou problematiku experimentu, tak i její cíle.

Tím se dostáváme k otázce využití výsledků experimentální fonetiky v ostatních oborech zabývajících se zvukovou stránkou jazyka. Docházíme ke dvěma závažným zjištěním, která nejsou sice nová ve své podstatě, ale v rozsahu platnosti.

(1) Individuální poslechové hodnocení akustických dějů v řečovém signálu lze jen stěží použít jako vědecký důkaz jejich percepční závažnosti.

(2) Možnosti objektivního určování percepční závažnosti jednotlivých akustických prvků řečového spektra mají před sebou sice ještě dlouhou a náročnou výzkumnou cestu, avšak z hlediska objektivizace výzkumu zvukové stránky jazyka cestu nezbytnou.

[315]R É S U M É

A New Approach in the Research of Stop Consonants Perception

This article is introduced by a review of recent research in the field of experimental phonetics — determination of some distinctive features in particular. During the last 25 years many questions have been taken again into account. The most important features are rapid changes in speech spectrum. From this point of view stops play the most important role among the consonants. Data from auditory tests with synthetic CV speech signal are given. The results of influence of F1 and F2 transitions on listeners “initial stops” answer are compared with the results of similar experiments done by Haskins Laboratories. The presented results do not confirm the categorical perception according to the F2 transition. The sequence of the Czech stops is /k, p, t, ť/ contrary to the English /p, t, k/. The importance of instructions to listeners is expressed by the response percentage (0,8%, 62,6%, 43,8%) of partial auditory tests. The result depends on how the instruction was given.

[1] R. Jakobson - G. C. Fant - M. Halle, Preliminaries to Speech Analysis, M. I. T., Rep. 13 1952.

[2] F. S. Cooper - A. M. Liberman - J. M. Borst, The Inter-Conversion of Audible and Visible Patterns as a Basis for Research in the Perception of Speech, Proc. Natl. Acad. Sci. 37, 1951, 318—325.

[3] F. S. Cooper - P. C. Delattre - A. M. Liberman - J. M. Borst - L. J. Gerstman, Some Experiments on the Perception of Synthetic Speech Sounds, J. Acoust. Soc. Am. (dále JASA) 24, 1952, 597—606.

[4] A. M. Liberman - P. C. Delattre - F. S. Cooper - L. J. Gerstman, The Role of Consonant-Vowel Transitions in the Stop and Nasal Consonants, Psychol. Monographs 68, 1954, No. 379, 1—13.

[5] R. K. Potter - G. A. Kopp - H. C. Green, Visible Speech, New York 1947.

[6] P. B. Denes - M. V. Mathews, Spoken Digit Recognition Using Time-Frequency Pattern Matching, JASA 32, 1960, 1450—1455.

[7] J. Dreyfus-Graf, Phonetograph und Schallwellen-Quantelung, Proc. Stockholm Speech Comm. Seminar, R. I. T., Stockholm, Sweden, September 1962.

[8] H. F. Olson, Speech Machine Considerations, tamtéž.

[9] A. M. Liberman - K. S. Harris - H. S. Hoffman - B. C. Griffith, The Discrimination of Speech Sounds Within and Across Phoneme Boundaries, J. Expt. Psych. 54, 1957, 358—368.

[10] A. M. Liberman - F. S. Cooper - K. S. Harris - P. F. Mac Neilage, A Motor Theory of Speech Perception, cit. Proc. Stockholm Speech Comm. Seminar, R. I. T., Stockholm, Sweden, September 1962.

[11] G. C. Fant, Comments to “A Motor Theory of Speech Perception”, tamtéž.

[12] B. Borovičková, Spektrální analýza češtiny, kandidátská disertační práce, Praha 1962.

[13] B. Borovičková, Zjišťování relevantních oblastí hlásek v češtině, SaS 25, 1964, 23—30.

[14] B. Borovičková - V. Maláč, K automatické identifikaci řeči samočinným počítačem, Slaboproudý obzor 26, 7, 1965, 385—390.

[15] B. Borovičková - V. Maláč, Využití umělého akustického signálu řeči v experimentální fonetice, SaS 29, 1968, 398—406.

[16] B. Borovičková - V. Maláč, Towards the Basic Units of Speech from the Perception Point of View, sborník XVIII. mezinár. kongresu psychologie v Moskvě, symposium „Percepce řeči“ v Leningradě 1966.

[17] S. E. G. Öhman, Coarticulation in VCV Utterances, Spectrographic Measurements, JASA 39, 1966, 151—168.

[18] B. Borovičková - V. Maláč, The Spectral Analysis of Czech Sound Combinations, Rozpravy ČSAV 77, 14, Praha 1967.

[19] B. Borovičková - V. Maláč, Analýza a syntéza některých souhláskových skupin (v tisku).

[20] B. Borovičková - V. Maláč - M. Ptáček, Výzkum percepce řeči — simulace nejčetnějších dvoučlenných souhláskových skupin, laboratorní zpráva Tesla - Výzkumný ústav pro sdělovací techniku A. S. Popova (dále Tesla - VÚST) 1972.

[21] Termíny fyziologický a psychologický rozumíme postupy při produkci — generování — řeči od roviny artikulačních povelů až po rovinu cílových artikulačních úkonů, tedy fázi, v níž se mění akustické vlastnosti hláskovacího traktu. Ale obsahem termínů fyziologický a psychologický jsou pro nás i postupy při percepci řeči od vstupu akustického signálu do vnějšího ucha až po zpracování nejvyššími rovinami psychické činnosti.

[22a] Jde o teorii, která popisuje mechanické děje ve vnitřním uchu způsobené akustickým signálem.

[22b] J. J. Zwislocki, In Search of Physiological Correlates of Psychoacoustic Characteristics, Symposium Auditory Analysis and Perception of Speech, Leningrad, srpen 1973.

[23] Srov. např. F. Nachtikal, Technická fyzika, Učební texty vysokých škol, Praha 1951, s. 223.

[12] B. Borovičková, Spektrální analýza češtiny, kandidátská disertační práce, Praha 1962.

[24] I. G. Mattingly - A. M. Liberman - A. K. Syrdal - T. Halwes, Discrimination in Speech and Nonspeech Modes, Cognitive Psychology 2, 1971, 131—157.

[25] Diskriminační funkce je procento správného rozlišení ve dvojici podobných stimulů v závislosti na pořadovém čísle dvojice. Pořadí očíslování přitom odpovídá řadě postupně se měnící akustické kvality stimulu.

[26] B. Hála - M. Sovák, Hlas, řeč, sluch, základy fonetiky a logopedie, Praha 1962.

[27] A. M. Liberman - K. S. Harris - H. S. Hoffman - B. C. Griffith, The Discrimination of Speech Sounds Within and Across Phoneme Boundaries, J. Expt. Psycholog. 54, 1957, 358—368.

[28] A. R. Luria, Problemy i fakty nejrolingvistiky, Moskva 1968, 198—218.

[29] A. M. Liberman - F. S. Cooper - D. P. Shankweiler - M. Studdert - Kennedy, Perception of the Speech Code, Psychological Review 74, 1967, 431—461.

[30] K. N. Stevens, The Potential Role of Property Detectors in the Perception of Consonants, Symposium Auditory Analysis and Perception of Speech, Leningrad 1973.

[31] K. N. Stevens, The Role of Rapid Spectrum Changes in the Production and Perception of Speech, Form and Substance, Phonetic and Linguistic Papers presented to Eli Fischer-Jörgensen, Akademisk Forlag 1971, 95—101.

[30] K. N. Stevens, The Potential Role of Property Detectors in the Perception of Consonants, Symposium Auditory Analysis and Perception of Speech, Leningrad 1973.

[32] H. Ebbinghaus, Grundzüge der Psychologie, Leipzig 1911.

[33] G. A. Miller - E. Galanter - K. H. Pribram, Plans and the Structure of Behaviour, New York 1960.

[34] M. Romportl, K akustické podstatě a klasifikaci okluzív, AUC, Philol. 3, Slav. Prag. IV, 1962, 76—80.

[17] S. E. G. Öhman, Coarticulation in VCV Utterances, Spectrographic Measurements, JASA 39, 1966, 151—168.

[18] B. Borovičková - V. Maláč, The Spectral Analysis of Czech Sound Combinations, Rozpravy ČSAV 77, 14, Praha 1967.

[35] Eli Fischer-Jörgensen, Perceptual Studies of Danish Stop Consonants, Annual Report of the University of Copenhagen 1972, 75—175.

[36] P. Delattre, Coarticulation and the Locus Theory, Studia Linguistica XXIII, 1969, 1—26.

[18] B. Borovičková - V. Maláč, The Spectral Analysis of Czech Sound Combinations, Rozpravy ČSAV 77, 14, Praha 1967.

[24] I. G. Mattingly - A. M. Liberman - A. K. Syrdal - T. Halwes, Discrimination in Speech and Nonspeech Modes, Cognitive Psychology 2, 1971, 131—157.

[37] B. Borovičková - V. Maláč - S. Pauli, F2 — Transition in the Perception of Czech Stops, Quarterly Progress and Status Report 1970/1.

[38] Na takovéto a podobné momenty upozornil už Fr. Daneš, Intonace a věta ve spisovné češtině, Praha 1957, s. 40.

[39] V. Maláč - B. Borovičková - M. Ptáček - P. Dvořák - J. Šustek, Určování relevantních oblastí ve spektrech souhláskových skupin, dílčí výzkumná zpráva Tesla - VÚST č. 72048/1, 1974.

Slovo a slovesnost, volume 35 (1974), number 4, pp. 307-315

Previous František Čermák: Víceslovná pojmenování typu verbum — substantivum v češtině (Příspěvek k syntagmatice tzv. abstrakt)

Next Karel Horálek: O novou mluvnici češtiny

Menu
About
Archive
New Journal Home
Archive search: