Časopis Slovo a slovesnost
en cz

Studie o akustické analýze českých hlásek

Přemysl Janota

[Kronika]

(pdf)

Книга об акустическом анализе чешских гласных / L’étude de l’analyse acoustique des sons tchèques

Publikace B. Borovičkové a Vl. Maláče The Spectral Analysis of Czech Sound Combinations (Rozpravy ČSAV, roč. 77, seš. 14, Academia 1967, 68 + 50 + IX s.) je nesporně užitečnou prací v české fonetické literatuře a poskytuje i vhodný srovnávací materiál pro pracovníky zahraniční, zabývající se obdobnou problemati[449]kou v jiných jazycích; proto je též vhodné, že studie je vydána v anglickém jazyce.

Těžiště práce spočívá v soustavném a podrobném popisu souhláskových spekter; souhlásky nebyly analyzovány izolovaně, nýbrž v normalizovaném okolí vždy dvou stejných samohlásek nebo obdobně symetrických skupinách CVC. Hláskové kombinace tohoto typu jsou jistě vhodnou základnou pro další práci v oblasti spektrální analýzy řeči; autoři je také sami pokládají za východisko další práce.

V úvodu studie autoři vytyčují základní zaměření práce k automatické identifikaci řeči, cestu k ní vidí ve vytvoření modelu percepce řeči. Přihlížejí přitom k vzájemnému vztahu akustické, percepční a lingvistické úrovně. V úvodní kapitole uvádějí i vymezení svého pojetí relevantních oblastí akustického hláskového spektra. Z hlediska automatické identifikace řeči pak hledají pro každou oblast tři závažné hodnoty: důležitost relevantní oblasti z hlediska identifikace fonetické jednotky, minimální počet relevantních oblastí nutných pro identifikaci a schopnost zastupování jedné relevantní oblasti oblastí jinou. Při určování relevantních oblastí vycházejí autoři z akustické roviny a poslechovými testy zjišťují kombinace fyzikálních parametrů v relevantních oblastech. Zdůrazňují dále, že fonologie nepřihlíží k akustickému signálu deformovanému různými druhy zkreslení, s nímž se nutně vždy setkáváme při přenosu řeči elektroakustickými kanály, a zmiňují se o vyrovnávání určitých nedostatků komunikační cesty užitečnou redundancí. Upozorňují i na důležitost poslechových testů jako opatření proti subjektivním chybám. Při zjišťování relevantních oblastí si autoři jsou vědomi toho, že hranice mezi jednotlivými částmi spektra často nesouhlasí s hranicemi jednotek v rovině jazykového systému a že variabilita fyzikálních parametrů vede i k jejich vzájemnému překrývání. Z toho plyne i požadavek práce s kombinacemi zvukových jednotek, z nichž autoři, jak již bylo řečeno, volí jako východisko kombinace nejjednodušší. Nejde tu tedy o zaměření na podrobnou analýzu českých hláskových spojení, jak by se snad bylo možno domnívat podle názvu; stranou zůstávají zatím např. souhláskové skupiny. I tak byl ovšem rozsah analyzovaného materiálu velmi značný a jasné je tu i vysvětlení, proč byl počet mluvčích omezen na čtyři osoby s různou polohou hlasovou a velmi pečlivou výslovností.

V následujícím rozboru metodiky poslechových testů na deformovaném řečovém signálu autoři upozorňují na některé nesnáze, východisko z nich vidí především v užití syntetického signálu, k jehož aplikaci jsou ovšem výsledky poslechových testů nutným předpokladem.

V samostatné kapitole naznačují autoři postup automatické identifikace, opírající se o Stevensův model, a zdůrazňují důležitost postupu „analýza syntézou“ (analysis by synthesis) jakožto aproximace percepce řeči. V diagramu (obr. 2) je uveden plánovaný postup výzkumné práce v tomto směru.

Do tohoto celkového rozvrhu práce pak autoři v další kapitole zařazují provedenou etapu výzkumu, již podrobně popisují v dalších částech studie. Při rozboru metodického postupu upozorňují na Öhmanovu hypotézu o existenci nejméně dvou samostatných kanálů, ovládajících artikulační pohyby, kterou pak podrobněji vykládají a aplikují na zkoumaný český materiál. Poněkud problematické zde ovšem zůstává zařazení neurčité samohlásky vedle českých samohláskových fonémů, i když autoři správně upozorňují na to, že tato samohláska jako foném v češtině neexistuje, a klasifikují ji jako výchozí postavení traktu. Lze snad připustit, že tato hladina samohláskového kanálu je vhodná pro uspokojivý výklad realizace souhláskových skupin, méně přesvědčivé je však tvrzení, že „tato neutrální samohláska také tvoří artikulační bázi všech finálních konsonantů“ (s. 11).

Přehled výsledků samohláskových analýz je uveden ve třetí kapitole práce. Text kapitoly je velmi stručný a je v podstatě komentářem k přehledu zjištěných hodnot prvních a druhých formantů, znázorněných ve třinácti velmi výstižných grafech. Pro každého ze čtyř mluvčích jsou nakresleny vždy tři diagramy, a to pro samohlásky v iniciální, mediální a [450]finální pozici. Ve třináctém grafu jsou zakresleny průměrné hodnoty formantů pro všechny mluvčí a pro všechny pozice. Celý soubor grafů velmi dobře informuje o výsledcích analýzy samohlásek.

V závěru kapitoly jsou uvedeny průměrné hodnoty trvání samohlásek. Zde na první pohled překvapí, že průměrné trvání pěti různých samohlásek je prakticky stejné (184 ± 2 ms). Autoři tuto zvláštnost nevysvětlují, údaj je též spíše podružný. Domnívám se, že tu jde patrně o nivelizační vliv rytmického vyslovování hláskových skupin při zvukovém záznamu textu. Identickou průměrnou hodnotu trvání samohlásek a souhlásek lze jistě shodně s autory (s. 61) interpretovat jako náhodnou shodu.

Na kapitolu o samohláskách navazuje interpretace spektrálního rozboru souhlásek. Popisy jednotlivých souhláskových realizací jsou účelně doplněny obrazy spekter; ve schematických nákresech je uvedeno všech 1000 analyzovaných spektrogramů, 25 z nich je též reprodukováno autotypicky v původní formě. Obrazová část tak svým rozsahem značně přesahuje část textovou, reprodukce úplného překresleného spektrografického materiálu reprezentuje cenný soubor spektrálních údajů pro češtinu. V textu jsou uvedeny rozbory spektrogramů pro jednotlivé souhlásky i souhrnně společné akustické znaky celých souhláskových skupin. Především na tuto část budou po zhodnocení navazovat výsledky poslechových testů i pokusy se syntézou.

V závěrečné kapitole autoři analyzují vzájemné poměry trvání popsaných hlásek, mimo jiné konstatují vzájemné doplňování (vyrovnávání) trvání uvnitř kombinací CV. Závěrem (s. 61) podávají zhuštěný přehled získaných výsledků: Samohlásky jsou charakterizovány formantovým spektrem. Pro frikativy je charakteristické především šumové spektrum, pro závěrové souhlásky, s výjimkou okluzívní pauzy, přechodové jevy sousedních samohlásek, afrikáty vykazují znaky obou předcházejících skupin. Nazály jsou vedle spektra nazálního traktu charakterizovány transientami samohlásek podobně jako u explozív. Zbývající souhlásky (j, l, r) jsou vyznačeny především transientami formantového spektra, které jsou spojeny s transientami sousedních samohlásek. Souhláska (ř) nemůže být zatím klasifikována z hlediska relevance svého spektra.

V dodatku jsou uvedeny údaje o použité transkripci, charakteristika všech mluvčích a popis technických parametrů použitých přístrojů. Zvláštní zmínky zasluhuje spektrograf vlastní konstrukce, jehož popis je snad až příliš stručný, i když obsahuje všechna potřebná technická data o způsobu činnosti a vlastnostech (nedopatření v popisu stupnice u grafu 22 si technicky orientovaný čtenář opraví sám podle údajů v textu).

Celkově je práce moderní i po metodické stránce, dobře uspořádaná a podnětná. Zhuštěnou formou podává výsledky ucelené části výzkumu z aktuální oblasti akustické fonetiky.

Slovo a slovesnost, ročník 29 (1968), číslo 4, s. 448-450

Předchozí Jiří Kraus: Pomoc počítačů při rozboru uměleckého stylu

Následující Lumír Klimeš: Studie o slovotvorných procesech v nespisovné angličtině