Časopis Slovo a slovesnost
en cz

Mluvená čeština v televizních debatách: korpus DIALOG

Světla Čmejrková, Lucie Jílková, Petr Kaderka

[Články]

(pdf)

Spoken Czech in television debates: The DIALOG corpus / Gesprochenes Tschechisch in Fernsehdebatten: das Korpus DIALOG

A B S T R A C T
The DIALOG corpus is one of two collections of spoken language gathered in the audio-visual studio at the Czech Language Institute of the Czech Academy of Sciences. The article begins by recalling the establishment of the corpus in 1997 as part of the project “Dialogue in a World of People and Machines”, defines the aim motivating the collection of data for this corpus, formulates distinctive criteria for this corpus as a specifically “spoken” one in terms of time, interaction and genre and partially even as topic-specific, and attempts to define the types of spoken dialogues which the corpus can aid in analysing. It characterizes speech in the media, which makes up a focal point here, and details the procedures for storing audio and video recordings of this speech and the resulting transcriptions. The second part provides an overview of the fundamentals of transcription systems and offers theoretical support for transcription method selection as determined by the aim of capturing segmental, supra-segmental, sequential, para-linguistic and extra-linguistic phenomena, including several examples of practical solutions. The third part reports on how this corpus has been thus far utilized in linguistic research, both in the creation of a contemporary Czech theory of dialogue and in the analysis of specific features of spoken Czech. The article concludes by detailing the prospects for further use of this corpus.

Z U S A M M E N F A S S U N G
Das Korpus DIALOG ist eine von zwei Sammlungen gesprochener Sprache, die im audiovisuellen Studio des Instituts für tschechische Sprache der Akademie der Wissenschaften der Tschechischen Republik archiviert sind. Im ersten Teil des Aufsatzes wird die Entstehung des Korpus im Jahre 1997 im Rahmen des Projektes „Dialog in der Welt der Menschen und Maschinen“ behandelt, der Zweck definiert, mit dem die Datenerhebung für dieses Korpus motiviert wurde, die distinktiven Merkmale dieses spezialisierten Korpus formuliert, das als ein zeitlich, interaktionell, genremäßig und teilweise auch thematisch abgegrenztes gesprochenes Korpus zu betrachten ist. Es wird auch versucht, die Texttypen zu definieren, von denen das Korpus Zeugnis ablegen kann. Der erste Teil informiert ebenfalls über die technischen Details der Archivierung der Audio- und Videoaufnahmen, über die Digitalisierungsarbeiten etc. Der zweite Teil bietet einen Überblick über die allgemeinen Prinzipien der Transkriptionssysteme und bringt eine theoretische Begründung des ausgewählten Transkriptionssystems in Hinblick auf die Notation der sequenziellen, segmentalen, suprasegmentalen und paralinguistischen Erscheinungen, einschließlich der praktischen Beispiele der angenommenen Lösung. Der dritte Teil berichtet über die bisherige Nutzung des Korpus DIALOG in der tschechischen Linguistik, einerseits für die Entwicklung der tschechischen Dialogtheorie, andererseits für die Analyse der spezifischen Merkmale des gesprochenen Tschechisch. Im Schlusskapitel werden die Perspektiven der weiteren Nutzung des Korpus DIALOG aufgezeigt.

Daný článek je on-line k dispozici v databázi CEEOL.

Ústav pro jazyk český AV ČR
Letenská 4, 118 51 Praha 1
cmejrkova@ujc.cas.cz
jilkova@ujc.cas.cz
kaderka@ujc.cas.cz

Slovo a slovesnost, ročník 65 (2004), číslo 4, s. 243-269

Předchozí -pčks-: Český komitét slavistů na nové funkční období ustaven

Následující František Daneš: Nad knihou Jazyk, média, politika