Časopis Slovo a slovesnost
en cz

Zasedání komise o analýze a syntéze mluvené řeči ve Varšavě

Blanka Borovičková, Vlastislav Maláč

[Kronika]

(pdf)

Заседание комисии по анализу и синтезу произносимой речи в Варшаве / La réunion de la commision sur l’ analyse et la synthèse de la langue parlée à Varsovie

Ústav pro základní problémy techniky Polské akademie věd svolal první zasedání komise pro analýzu a syntézu mluvené řeči ve smyslu porady akademií věd socialistických zemí konané 1963 v Berlíně. Zasedání se konalo ve Varšavě 16.—17. ledna 1964 a mělo stanovit hranice, formy a metody mnohostranné spolupráce. Zúčastnili se ho zástupci pracovišť Maďarské akademie věd, Německé akademie věd, Polské akademie věd a Československé akademie věd.

Na programu zasedání byly jednak referáty členů polské pracovní skupiny, jednak sdělení ostatních zástupců o stavu výzkumných prací v oboru analýzy a syntézy řeči v jednotlivých zemích. Přednesené referáty a sdělení byly projednány a byla vypracována tematika v rámci mnohostranné spolupráce pro nejbližší období, byly rozděleny úkoly mezi jednotlivá pracoviště a stanovena akademie odpovědná za koordinaci určitého tématu.

Zasedání zahájil náměstek vědeckého sekretáře Polské akademie věd, předseda polské pracovní skupiny pro analýzu a syntézu řeči akad. I. Malecki a přednesl referát o základních problémech mezinárodní spolupráce v oboru analýzy a syntézy řeči. Z dalších referátů a sdělení vyplývá, že polský výzkum analýzy a syntézy řeči na pracovištích v Poznani, vedených W. Jassemem, je založen z hlediska fyzikálního na Fantově základní teorii publikované v knize „Acoustic Theory of Speech Production“ a z hlediska lingvistického na teorii akusticky pojatých distinktivních rysů vypracované Jakobsonem, Fantem a Hallem v „Preliminaries to Speech Analysis“. Na těchto pracovištích byl v r. 1962 popsán fonologický systém polštiny a v současné době je určována akustická podstata distinktivních rysů.

Další polské pracovní skupiny se zabývají možnostmi využít výsledků uvedeného základního výzkumu řeči pro technické účely, zejm. pro vývoj nových přenosových systémů se stoupající efektivností přenášené jazykové informace (vokodéry). První skupina, vedená J. Kacprowskim z Varšavy, připravuje program syntetizéru na základě exaktních zna[242]lostí akustickofonetické struktury řeči. Program je připravován pro syntetizér typu OVE II.[1] — Druhá skupina, vedená S. Schmidtem z Varšavy, se zabývá redukcí přirozené řeči s hlavním cílem zachovat srozumitelnost přenášené informace při maximálním odstranění redundance signálu. Druhým hlediskem tohoto problému je zachování přirozenosti přenášené řeči. — Třetí skupina, vedená J. Seidlerem z Gdaňska, se zabývá teorií kódování řeči a odolnosti signálu proti různému druhu zkreslení a šumu. J. Seidler se zmínil také o případném vhodném postupu překódování analogové funkce řeči do posloupností diskrétních hodnot vytvořením pulsů na časové ose, jejichž amplituda odpovídá časovým úsekům vytčeným vždy dvěma po sobě následujícími průchody nulou limitovaného signálu řeči. Soubor takto vytvořených posloupností pulsů je schopen diferencovat formantovou strukturu řeči.

Vratislavská vysoká škola technická (za vedení Z. Żyszkowského) se v řadě teoretických prací soustřeďuje na problematiku přenosu řeči, na hodnocení jeho kvality a v současné době začíná s realizací zvukového spektrometru typu „visible speech“.

Pracovníci z NDR, zastoupení na poradě I. Freitagem a W. Tscheschnerem z drážďanské techniky, se soustřeďují zejm. na problematiku komprese hovorového pásma ve frekvenční ose. V tomto oboru mají řadu praktických zkušeností, které získali na vokodéru zbudovaném na jejich pracovišti. Soustřeďují se na poslechové testy, jimiž ověřují vliv jednotlivých parametrů vokodéru na srozumitelnost přenášené informace a na přirozenost řeči.

Maďarská delegace (T. Tarnoczy a T. Hofmann z Budapešti) informovala o některých metodách analýzy řeči z hlediska dlouhodobých průměrů jejích parametrů. V ostatních oborech základního problému jsou na maďarských pracovištích v prvních začátcích.

Naše delegace informovala na zasedání o výsledcích výzkumu analýzy řeči, o metodě určování relevantních oblastí i o perspektivě využití výsledků analýzy a syntézy řeči zejm. pro automatickou identifikaci řeči počítačem, popř. pro modelování percepce řeči, které se provádí za vedení Fonetické laboratoře ÚJČ ČSAV. V diskusi podala zprávu i o ostatních pracovištích v Československu zabývajících se problematikou výzkumu řeči z tohoto hlediska, zejména o Fonetickém ústavu Karlovy university, který pracuje v oboru syntézy řeči a hlasového timbru, a o Fyzikálním ústavu ČVUT, který zjišťuje vyzařovací charakteristiky hlásek. — Bylo konstatováno, že naše pojetí analýzy a syntézy k využití pro automatickou identifikaci řeči je perspektivně aktuálnější než problematika frekvenční komprese hovorového pásma (vokodéry), která ztrácí na významu vlivem nových technik telekomunikační praxe, zejm. využitím vlnovodů a laserů.[2]


[1] Formantový syntetizér OVE II je schopen vytvářet podle předem připraveného programu plynulou řeč v rozsahu 2,5 vteřiny. Byl navržen a realizován v Speech Transmission Laboratory ve Stockholmu u G. Fanta. I na našich pracovištích budeme realizovat tento typ syntetizéru.

[2] Vlnovod je kovová trubka upravená pro přenos elektromagnetického vlnění vysoké frekvence. — Laser je zařízení, které je schopno generovat a zesilovat elektromagnetické záření o vlnových délkách v oboru infračerveného světla.

Slovo a slovesnost, ročník 25 (1964), číslo 3, s. 241-242

Předchozí Marie Ludvíková: Seminář matematické lingvistiky v Bukurešti

Následující Slavomír Utěšený: První maďarský regionální nářeční atlas; metodika a technika jeho zpracování