Časopis Slovo a slovesnost
en cz

K metodě zvukového rozboru jazyka

Milan Romportl

[Články]

(pdf)

О методе звукового анализа языка / Sur la méthode de l’analyse acoustique de la langue

Je-li posluchač schopen identifikovat v slyšeném mluveném projevu, a to v kontextu neusnadňujícím porozumění, jazykovou jednotku lišící se alespoň jedním fonémem od jiné jednotky téhož jazyka a řádu, avšak mající jiný [209]význam,[1] musíme předpokládat, že se onen foném odlišuje v každé své zvukové realizaci (všude tam, kde není protiklad daného fonému a fonému, s nímž jej porovnáváme, zrušen) od každé realizace jiného fonému ve stejné pozici minimálně jedním rysem (a to především rysem akustickým).

Je to předpoklad již dříve vícekrát formulovaný a stál nepochybně na počátku každé předcházející úvahy, která vedla ve fonologii k rozlišení fonologicky relevantních rysů od rysů irelevantních, jak se dálo např. od počátků v pražské fonologické škole.[2] Přesto pokládáme za potřebné uvést tuto úvahu na tomto místě a v této formě, neboť stojí na počátku našich pozorování a úvah, které docházejí k závěrům v lecčems ne zcela totožným se závěry oněch fonologických škol, které s distinktivními fonologickými vlastnostmi pracují.[3]

1. Jsme si vědomi toho, že v normálně probíhajícím procesu dorozumívání (kdy posluchač může sledovat mluvčího nejen sluchem, ale i zrakem), je nositelem informace nejen signál akustický, ale i optický, který prostředkuje informaci také o artikulačních hodnotách. Přitom vedle složky akustické (a spolu s ní) vyvolává jev, který je možno označit jako motorickou rezonanci, projevující se např. tzv. vnitřním mluvením, svalovou aktivitou, která odpovídá zcela nebo částečně aktivitě při vlastní artikulaci slyšených zvukových prvků řeči. Ani tuto složku není možno zanedbat při analýze řeči. Poněvadž však i tato motorická rezonance, jakkoli důležitá při percepci řečového signálu a jeho analýze, je evokována převáženě signálem akustickým, nedopustíme se — jak doufám — přílišného zjednodušení, budeme-li zde brát pro ilustraci své teze v úvahu především složku akustickou, která je — jak se většinou i dnes uznává — při dorozumívání řečí složkou dominující.

K analýze akustického řečového signálu se v současnosti užívá řady přístrojů, o nichž je možno najít poučení v poměrně bohaté literatuře.[4] Základním zdrojem informací o jeho akustických složkách zůstává nadále — přes veškeré vystřízlivění v hodnocení jeho univerzální použitelnosti a spolehlivosti — zvukový spektrograf typu Visible Speech, ať se u nás užívá v běžném provedení jako sonagraf vyráběný v licenci firmou Kay Electric Co. nebo jako vývojový typ spektrografu Výzk. ústavu elektroakustiky v Praze na Jenerálce.[5] Známou hlavní předností tohoto způsobu záznamu je, že podává na rozdíl od většiny jiných registračních způsobů záznam trojrozměrný (s parametry: čas, frekvence, intenzita). Přitom je ovšem známo, že slabým bodem tohoto registračního způsobu je právě záznam složky dynamické a že je často nutno tento záznam konfrontovat se záznamy dvourozměrnými (frekvence — intenzita, např. v sekcích přímo na sonagrafu, resp. čas — intenzita na některém typu zvukoměru). Není však zcela vhodný k záznamu průběhu frekvence v čase, zvláště k záznamu tzv. základního tónu, pro nějž je vhodnější některý z typů melografů.

[210]Užitím těchto a dalších metod akustické analýzy odkryjeme v řečovém signálu řadu akustických rysů. Pokusíme se naznačit alespoň jejich hlavní typy: (1) přítomnost nebo nepřítomnost akustického signálu, trvání segmentu, v němž je signál přítomen nebo nepřítomen, poměr trvání těchto dvou segmentů; (2) celková úroveň hlasitosti v daném segmentu, resp. poměr celkové úrovně v několika segmentech, popř. změna úrovně v době trvání segmentu, nebo rozdíly v průběhu celkové úrovně v různých segmentech; (3) akustické spektrum diskrétní, kontinuální, popř. smíšené, poměr složek diskrétních a kontinuálních; (4) zesílení (formanty) v akustickém spektru, výška jednotlivých formantů, počet formantů, poměr jejich frekvencí, jejich intenzity; stacionárnost formantů nebo jejich pohyblivost, poměr částí stacionárních a tranzientních, směřování formantů (event. existence nebo absence úběžníku, resp. celé úběžné oblasti, jejich výška); (5) soustředění nebo rozptyl celkové energie, koncentrace energie v různých částech spektra; (6) trvání segmentu, poměr trvání několika segmentů, trvání segmentu v poměru k trvání větších celků; (7) prezence nebo absence základního tónu, jeho výška, změna jeho výšky v segmentu, poměr výšky a jejího průběhu v různých segmentech, poměr výšky (průběhu) v segmentu k výšce (průběhu) ve větších celcích.

Uvádíme zde nejvýznamnější typy akustických rysů, aniž vyjadřujeme jejich vzájemné vztahy. Neznamená to, že si nejsme vědomi, že mezi mnohými z nich existují závislosti různého druhu. Některé z rysů bychom mohli označit jako primární, jsou-li přímo akustickým vyjádřením artikulačního „záměru“ (např. koncentrace celkové energie v úzkém pásmu v nižších oblastech frekvenčního hláskového spektra, která může být vyjádřením dlouhého rezonátoru, popř. se zmenšeným zaokrouhleným retním otvorem). Naproti tomu bychom mohli řadu dalších rysů pokládat za sekundární, protože se objevují pouze jako jevy průvodní, toliko jako symptomy jistého artikulačního pochodu, který směřuje k jinému akustickému cíli (např. frekvenční změny vokalických formantů v sousedství konsonantů, jejich směřování k tzv. úběžným oblastem). Domníváme se, že rozdíl rysů primárních a sekundárních nebude v našich dalších úvahách pro hodnocení z hlediska synchronického důležitý, a dojdeme-li někde při hierarchizaci akustických rysů z tohoto hlediska k závěrům shodným, půjde tu obvykle o shodu náhodnou. Nejsou řídké případy, kdy rys „sekundární“ převáží závažností rys „primární“.

Z uvedených akustických rysů mohou mít pro další rozbor význam pouze ony, které je schopen postihnout posluchač normálním sluchem. Proto ze zjištěných akustických rysů budou respektovány pouze ty, které neleží mimo jeho hranice, a to jak pokud jde o frekvenční rozsah, tak i o intenzitu, ale i pokud jde o trvání segmentů. Je například známo, že možnost přesné identifikace výšky zcela krátkých tónových segmentů je nepřímo závislá na jejich trvání. Nezazní-li více než jediná perioda, je tónová výška neurčitelná a spektrum je zde prakticky spojité (vrchol v oblasti základní frekvence je nevýrazný) a výšku tónu není možno určit.[6] U zvuků neperiodického charakteru je situace ještě obtížnější. Kromě toho se častěji uplatňuje důležitý faktor, tzv. poststimulační adaptace sluchu, jíž je mnohdy podstatně omezeno vnímání frekvenč[211]ního pole v segmentu s celkovou specifickou hlasitostí podstatně menší, než má segment předcházející.

K zjištění závažnosti jednotlivých akustických rysů je kromě základní metody poslechových testů s nedeformovaným zvukovým signálem nutno častěji sáhnout k metodám, které souhrnně nazýváme metodami sluchové analýzy,[7] k nimž počítáme užití segmentátoru v nejrůznějších modifikacích, užití deformovaného signálu s omezeným počtem proměnných parametrů[8] apod.

2. Žádnou akustickou a čistě fonetickou analýzou nelze určit fonémy jazyka. K jejich určení je třeba fonologického rozboru založeného na pravidlech pro určování fonému.[9] Naše analýza může pouze vyjít ze správně určených fonémů jazyka a hledat jejich fonetické (akustické) ekvivalenty a rysy, které je navzájem odlišují.

Vycházejíce z úvahy uvedené na počátku této stati mohli bychom dojít k názoru, že z n realizací daného fonému fa (odlišného v nich od realizací všech dalších fonémů jazyka), z nichž v každé zjistíme množinu akustických rysů Ak, bude za akustický ekvivalent tohoto fonému možno pokládat průnik

 

(resp. za ekvivalenty dalších fonémů fb, fc … fn analogické průniky B, C N).

Již zkusmo provedená analýza však ukáže, že bychom tu někdy mohli dojít až k prázdné množině, neboť nejsou výjimkou případy, že realizaci fonému v různých pozicích konstituují ne zcela shodné rysy, a přichází-li foném ve větším počtu pozic, že může nastat případ, kdy z celkového počtu akustických rysů ani jediný nepřichází absolutně ve všech pozicích (např. pro okluzívu v pozici na počátku slova před vokálem V, sonórou S a konsonantem K, na konci po V, S, K, uprostřed slova v sousedství zástupců týchž kategorií — ovšem, pokud nejde o pozice neutralizační).

Jiná je ovšem situace, provedeme-li tuto analýzu pro jednotlivé pozice α ν, pro něž bychom stejnou metodou došli k výsledným průnikům Aα Av. Akustickým ekvivalentem daného fonému by byl teprve systém množin, který bychom označili kurentním , tedy

 

Množina Daα, tj. souhrn rysů, které odlišují foném fa od jiného fonému v pozici α, bude vyjádřena doplňkem průniků množin, které odpovídají alofonům oněch dvou fonémů v pozici α, tedy

 

Provedeme-li podobnou analýzu pro celou zásobu fonémů daného jazyka, potom dojdeme pro jednotlivé pozice až k nejmenším množinám rysů typu D dále v daném jazyce nerozložitelným, jimiž jsou jako nejmenšími zvukovými prostředky od sebe odlišovány realizace dvou fonémů, jinak od sebe zvukově neodlišené. Znamená to, že — podle tradiční terminologie — jsou takovéto [212]nejmenší množiny rysů typu D zvukovým vyjádřením distinktivní fonologické vlastnosti. Poněvadž však docházíme často i zde k rozdílným ekvivalentům pro různé pozice, budeme pro přesnost pokládat za zvukový ekvivalent distinktivní vlastnosti teprve systém množin, označený kurentním , tedy

 

Jestliže alespoň pro jednu pozici bude platit, že

Aα Bα = X, Bα Aα = Y                                            (5)

a bude splněna podmínka, že a) X Y a že b) X ani Y nejsou v analýze téhož systému v téže pozici dále dělitelné, potom stojí oba fonémy ve fonologickém distinktivním protikladu.

Platí-li pro totéž X a Y rovnice (5) i pro další dvojice fonémů, jde v jazyce o protiklad proporcionální, v opačném případě o protiklad izolovaný.

Platí-li rovnice (5) jen pro některé pozice, kdežto pro pozici jinou platí, že Aε = Bε, jde v pozici ε o zrušení, resp. neutralizaci tohoto protikladu.

Předběžně můžeme zde formulovat ve zjednodušené formě i některé další předpoklady, které však v části třetí ještě upřesníme. Prozatím zde předpokládejme, že a) při splnění podmínky Y = {ā | a X } bude sub (5) vyjádřen tzv. protiklad privativní, b) bude-li platit pro každé a X, b Y, je a < b, půjde o protiklad graduální a c) bude-li splněna podmínka, že X Y = ∅ a že, je-li a X, potom pro žádné b Y neplatí a < b, b < a, a pokud existuje , ani a = , a pokud existuje ā, ani ā = b, a pokud existuje ā i , ani ā = , půjde o tzv. protiklad ekvipolentní.

K přezkoušení správnosti naposled uvedených tvrzení se však budeme moci vrátit, až prozkoumáme závažnost jednotlivých akustických rysů, které vytvářejí distinktivní vlastnost.

3. Z našich vývodů uvedených v části druhé vyplývá, že nevylučujeme, že distinktivní vlastnost je akusticky vyjádřena souborem akustických rysů. Prozatímní výzkumy ukazují, že případy, kdy bychom mohli předpokládat, že akustickým korelátem distinktivním vlastnosti je jen jediný rys, jsou zcela výjimečné.

Uveďme jako příklad rozdíl mezi českými znělými a neznělými konsonanty, demonstrovaný na rozdílu alveolárních okluzív [t] a [d], které jsou reprezentanty českých fonémů /t/ a /d/, členů jednoho znělostního korelačního páru, a to v intervokalické pozici v slovech (a) medem a (b) metem. Uvádíme sonagramy výslovnosti dvou osob (1) muže a (2) ženy. Ačkoli absolutní hodnoty se budou u obou mluvčích lišit, vidíme na prvý pohled jisté shody, a to a) rozdíl ve znělosti (přítomnost hlasivkového tónu v realizaci /d/, jeho nepřítomnosti u /t/ — Z), b) rozdíl v charakteru exploze, zejména v intenzitě (I), projevující se zde u neznělé bohatšími zesíleními zejména ve vyšších oblastech, dále pak zvláště ve výslovnosti muže, navíc i výrazně delším trváním exploze (QEx), c) delším trváním závěrové části u neznělé (QK), d) delším trváním následujícího vokálu po znělé (QVp), e) poněkud delším trváním předcházejícího vokálu (QVa). Užití dalších metod akustické i sluchové analýzy by tato zjištění vcelku potvrdilo a snad i rozšířilo. Pokládejme však [213]tento příklad za vyhovující vzorek. Pak s použitím rovnice (3) bude pro intervokalickou pozici platit, že

DT = {Z—, I+, QK+, QVp—, QVa—, QEx+},                              (6)

DD bude obsahovat tytéž členy s opačnými znameními.

 

[214]Připouštíme-li, že distinktivní vlastnosti odpovídá vícečlenná množina rysů, pak musíme předpokládat, že celek distinktivní vlastnosti je redundantní (a že jeho redundance bude matematicky vyčíslitelná).

V další etapě musíme užít metod pro zkoumání závažnosti jednotlivých složek. Většinou jde o poslechové testy, jaké jsou obvyklé při sluchové analýze, kdy zkoumáme signál přirozený, deformovaný i syntetický, ale konfrontujeme její výsledky i s výsledky dalších testů, např. i psychologických.[10] Žádná z metod není však dosud natolik spolehlivá, abychom výsledky jimi dosažené mohli pokládat za definitivní,[11] konfrontace výsledků rozdílných metod však může vést k závěrům relativně spolehlivým.

Ukazuje se, že všechny akustické rysy, které vytvářejí množinu odpovídající distinktivní vlastnosti, nejsou obvykle stejně závažné, že jsou uvnitř celku distinktivní vlastnosti jistým způsobem uspořádány. Celek distinktivní vlastnosti vykazuje pak jistou strukturu s hierarchií akustických složek. Je tedy zřejmé, že nejde o množiny neuspořádané, nýbrž obvykle uspořádané (popř. částečně uspořádané).

Především bude třeba rozlišit prvky, které jsou podstatnými složkami a tvoří centrum struktury distinktivní vlastnosti a jež zde nazveme složkami interními, popř. centrálními, od prvků, které stojí na samém okraji a které označíme jako externí, periferní. Jde zde často o některé z rysů, které jsme nazvali v první části jako sekundární, symptomatické, nejde však výhradně o ně a naopak zdaleka ne všechny tyto sekundární rysy můžeme hodnotit jako externí. Tam, kde je potřebí vyjádřit poměr rysů centrálních (A, B) k periferním (c), užijeme schématu .

Jak jsme uvedli již na jiných místech,[12] není ovšem ani poměr mezi podstatnými rysy centrálními vždy stejný. Kromě případů, kde jeden (nebo i více) z rysů, který označujeme jako relevantní (A), je jasně nadřazen dalšímu (dalším) z rysů, který nazveme redundantním (B) a jejichž poměr vyjadřujeme vzorcem , může existovat mezi rysy poměr, kdy nelze určit nadřazenost některého z nich; oba (A1, A2) jsou pak relevantní a jejich vztah vyjadřujeme vzorcem {A1A2}. I v tomto případě je ovšem celek vlastnosti redundantní. (Podobný vztah však může existovat i mezi rysy redundantními, popř. i externími.)

Kdybychom měli na základě dosavadních empirických zjištění seřadit akustické rysy, které jsme v této části na základě analýzy určili za členy množiny vyjadřující akustický korelát distinktivní vlastnosti „znělost“ v intervokalické pozici, pak bychom došli k schematu . V jiném jazyce — i za předpokladu, že bychom zjistili shodný repertoár rysů — nemusí být shodná jejich hierarchie.

[215]Podle klasické fonologické klasifikace, kterou nacházíme především u Trubeckého, je pokládán protiklad tzv. znělosti za protiklad privativní (tj. jeden člen je charakterizován přítomností, druhý nepřítomností vlastnosti). Vycházejíce z ní, pokusili jsme se v závěru druhé části vyjádřit privativní opozici rovnicí (5) při splnění podmínky, že Y = {ā/a X}. Rozbor tu však ukázal, že z rysů, které se účastní na vytváření vlastnosti „znělost“, pouze na rys „znělost“ (Z), je možno vztáhnout onen předpoklad prezence a absence rysu. Všechny ostatní rysy této vlastnosti je možno charakterizovat pouze větším nebo menším množstvím příslušné vlastnosti, byly by tedy spíše rysy „graduálními“. Přitom — alespoň ony, které jsme označili jako redundantní, — jsou podle našich zjištění nedílnou součástí vlastnosti. Je-li tedy nutno, aby byl rozdíl privativních a graduálních opozic nadále zachován, musili bychom podmínku připojenou k rovnici (5) sub a) pozměnit takto: Při splnění podmínky, že alespoň pro rys v hierarchii rysů nejvyšší platí x X, Y, vyjadřuje rovnice (5) protiklad privativní.

Rovněž tak sub b) pozměníme podmínku takto: Bude-li platit vztah, že hierarchicky nejvyšší rysy a, b, pro něž platí a X, b Y, jsou v poměru a < b, pak jde o protiklad graduální. Podmínka sub c) může zůstat nezměněna.

4. Domníváme se, že z našich vývodů je nejspíše třeba respektovat jeden: že totiž není možno setrvávat v názoru, že distinktivní vlastnost je charakterizována toliko jedním rysem, relevantním, a ostatním přiznávat pouze podružnou potenci suplovat v případě nepřítomnosti relevantního rysu. Relevantní vlastnost se akusticky realizuje v složité struktuře, která funguje jako celek. Označujeme-li některé z jejích složek jako relevantní a jiné jako redundantní, jde pouze o záležitost terminologickou, rozdíl je pouze ve větším nebo menším podílu na fungování celku distinktivní vlastnosti.

Bylo by zde možno navázat návrhem na pojmenování distinktivních vlastností, když pokládáme označení názvem jediného rysu (byť i v hierarchii rysů obvykle nejvyššího) za zavádějící a domníváme se, že by bylo vhodnější užít jiného označení, např. metaforického, to však by přesáhlo hranice, které jsme si vytkli pro svou úvahu.

 

R É S U M É

On the method of phonic analysis of speech

If a hearer can identify in a speech in the context which does not facilitate the understanding a language unit differing in the same language at least one phoneme from another unit of the same order but of different meaning, we have to assume that the phoneme in question differs in each of its manifestations (wherever the opposition of the phoneme in question and the phoneme with which it is compared is not neutralized) from each manifestation of a different phoneme in the same position at least in one feature (phenomenon — namely manifested acoustically).

At each manifestation of a phoneme fa we can find by means of acoustical and physiological methods a set of acoustic phenomena Ak which can be perceived by a hearer. As an acoustic equivalent of the phoneme fa shall not be considered a mere [216]logical product of these sets in n manifestations of the phoneme fa i. e. , but rather a set system  = {Aα, Aβ, Aγ,} where α, β, … ν are single positions in which the phoneme is differentiated from other phonemes of the same language.

A set Daα = AαBα will be the set of phenomena which differentiate the phoneme fa from the phoneme fb in the position α. The smallest, in the same language nondivisible set of type D differentiating pairs of phonemes otherwise not differentiated will be an acoustic manifestation of a distinctive phonological feature for the position α. As its equivalent for the different positions is usually different, the set system  = {Dα, Dβ, Dγ} will be taken for this equivalent of distinctive feature.

Then both phonemes are in phonological distinctive opposition if at least for one position α holds Aα Bα = X and Bα Aα = Y and if the condition that neither X nor Y are divisible by an analysis of the system in the same position is fulfilled. By postulating other conditions we are able to differentiate a privative, gradual or equipolent opposition.

Using other methods (auditory physiologic-acoustical test, psychological tests etc.) we come to a conclusion that every member of the above defined sets is not of the same significance, that a set corresponding to an equivalent of distinctive feature is ordered (or partially ordered) with hierarchical structure.

There exist relations between central (A) and peripheral (c) members of sets expressed in formula , between central members there is a relation of relevant members (A) to redundant (B) in formula  or a relation if two equivalent members e. g. relevant (A1, A2) in a formula {A1A2}.

The whole of the distinctive feature whose acoustic equivalent is a set of several phenomena is — as one whole — practically always redundant. If we call some of its constituents relevant and others redundant, it is a matter of terminological convention, the difference being only in the role played by each in functioning of the whole distinctive feature.


[1] Např. fonémem /b/ ve větě Beru si kapesník od věty Peru si kapesník, resp. fonémem /u/ od věty Bere si kapesník atp.

[2] Srov. za mnohé N. Trubetzkoy, Grundzüge der Phonologie, TCLP 7, Praha 1939, s. 35 aj.

[3] V současnosti např. skupina představovaná R. Jakobsonem a M. Hallem a spolupracovníky, v jiném smyslu např. S. K. Šaumjan (Problemy teoretičeskoj fonologii, 1962). Též — ovšem z odlišných pozic — K. Horálek v řadě referátů a recenzí i diskusních příspěvků (naposledy v Proceedings of the 5th Intern. Congress of Phonetic Sciences — dále: Proceedings Münster —, Basel 1965, s. 364).

[4] Srov. naposled takový přehled v ref. F. S. Coopera Instrumental Methods for Research in Phonetics, Proceedings Münster, s. 142n.

[5] Srov. B. Borovičková, K otázce spektrální analýzy mluvené řeči, SaS 22, 1961, 263n., zejm. s. 265.

[6] Srov. zde i dále K. Sedláček, Základy audiologie, 1956, s. 126 aj.

[7] P. Janota - M. Romportl, Ein Beitrag zur phonetischen Methodik, AUC — Philologica, 1959, 1, s. 17n. (Tamtéž popis Janotova segmentátoru.)

[8] Např. B. Borovičková, o. c. v pozn. 5, zejm. s. 265n. aj.

[9] Nerozhodujeme zde o správnosti užitých pravidel. Základem zůstávají stále pravidla Trubeckého Grundzüge, s. 41n.

[10] Srov. např. G. Ungeheuer, Extensional-paradigmatische Bestimmung auditiver Qualitäten phonetischer Signale, Proceedings Münster, s. 556n. — Srov. též pozn. 7 a 8.

[11] Zejména se diskutuje o tom, zda změna normálních poměrů, např. přemístění segmentu do jiného okolí, nezmění natolik obvyklé poměry, že výsledky testů nelze pokládat za průkazné (srov. E. Petrovici, Možet li peresadka zvukov … rešať fonologičeskije voprosy? Slavica Prag. 4, 1962, s. 69n.).

[12] Např. Zu akustischen Korrelaten der distinktiven Merkmale, Proceedings Münster, s. 506n.; s podrobnějším upozorněním na vztahy interních a externích rysů v článku K rozboru zvukové stránky jazyka ve sb. přednášek na IX. letní škole slovanských studií v Praze 1965.

Slovo a slovesnost, ročník 27 (1966), číslo 3, s. 208-216

Předchozí Oldřich Leška: K Šaumjanově definici fonému

Následující Josef Vachek: Československé kolokvium o otázkách fonologie a fonetiky