German SpeechDat-Car

View resource name in all available languages

Base de données SpeechDat-Car de l'allemand

ID:

ELRA-S0122

The German SpeechDat-Car database comprises 338 German speakers recorded over the mobile telephone network. This database is partitioned into 17 DVDs and 1 CD. The speech databases made within the SpeechDat-Car project were validated by SPEX, the Netherlands, to assess their compliance with the SpeechDat-Car format and content specifications.

The speech data files are in two formats. The signal data format for the in-car mobile platform recordings is 16 kHz, 16 bit, uncompressed unsigned integers in Intel format (lo-hi byte order); the channels are multiplexed in a single file, with the channel sequence being 0-1-2-3. The format of the fixed platform audio files is 8 kHz, 8 bit alaw encoding. Each signal file is accompanied by an ASCII SAM label file which contains the relevant descriptive information.

Each speaker uttered the following items:
- 2 voice activation keywords
- 1 sequence of 10 isolated digits
- 7 connected digits : 1 sheet number (4+ digits), 1 spontaneous telephone number (9-11 digits), 3 read telephone numbers, 1 credit card number (16 digits), 1 PIN code (6 digits)
- 3 dates : 1 spontaneous date (e.g. birthday), 1 prompted date, 1 relative or general date expression
- 2 word spotting phrases using an application word (embedded)
- German data phrases
- 4 isolated digits
- 7 spelled words : 1 spontaneous (own forename or surname), 1 spelling of directory city name, 4 real word/name, 1 artificial name for coverage
- 1 money amount
- 1 natural number
- 7 directory assistance names : 1 spontaneous (own forename or surname), 1 city of birth / growing up (spontaneous), 2 most frequent cities, 2 most frequent company/agency, 1 "forename surname"
- 9 phonetically rich sentences
- 2 time phrases : 1 time of day (spontaneous), 1 time phrase (word style)
- 4 phonetically rich words
- 69 application words: 13 mobile phone application words, 22 IVR function keywords, 32 car products keywords, 2 additional common application words
- 2 additional language dependent keywords
- spontaneous sentences

The following age distribution has been obtained: 187 speakers are between 16 and 30, 72 speakers are between 31 and 45, 70 speakers are between 46 and 60, and 9 speakers are over 60.

A pronunciation lexicon with a phonemic transcription in SAMPA is also included.

View resource description in all available languages

La base de données SpeechDat-Car de l'allemand est composée de 338 enregistrements réalisés à travers le réseau téléphonique mobile. La base de données est répartie en 17 DVDs et 1 CD. Les bases orales réalisées lors du projet SpeechDat-Car ont été validées par SPEX, Pays-Bas, afin de contrôler leur adéquation avec le format SpeechDat-Car et les spécifications de contenu.

Les fichiers de données sont présentés dans deux formats : le format du signal, pour les enregistrements réalisés sur la plateforme mobile installée dans la voiture, est de 16 kHz, 16 bits; les canaux sont multiplexés dans un fichier unique, avec une séquence de 0-1-2-3. Le format des fichiers audio de la plateforme fixe est de 8 kHz, codage sur 8 bits loi A. Chaque énoncé est stocké dans un fichier séparé et est accompagné d'un fichier d'étiquetage ASCII SAM.

Les éléments suivants ont été enregistrés :

- 2 mots-clés d'activation vocale
- 1 séquence de 10 chiffres isolés
- 7 chiffres connectés : 1 numéro permettant d'identifier la feuille de prompt (4+ chiffres), 1 numéro de téléphone spontané, 3 numéros de téléphone lus, 1 numéro de carte de crédit (16 chiffres), 1 code confidentiel (6 chiffres)
- 3 dates : 1 date spontanée (ex. anniversaire), 1 date lue, 1 date générale
- 2 expressions utilisant un mot de commande
- expressions allemandes
- 4 chiffres isolés
- 7 mots épelés : 1 spontané (nom ou prénom du locuteur), 1 nom de ville provenant d'un annuaire de renseignements téléphoniques, 4 mots/noms réels, 1 nom artificiel pour couverture
- 1 montant en devises
- 1 nombre naturel
- 7 noms provenant d'un annuaire de renseignements téléphoniques : 1 spontané (nom ou prénom du locuteur), 1 nom de ville de naissance/d'origine du locuteur (spontané), 2 noms de ville parmi les plus fréquentes, 2 noms de compagnie/société parmi les plus fréquentes, 1 répétition de "prénom nom"
- 9 phrases phonétiquement riches
- 2 phrases comportant une notion de temps : 1 jour (spontané), 1 phrase comportant une notion de temps
- 4 mots phonétiquement riches
- 69 mots de commande: 13 mots de commande dans le domaine de la téléphonie mobile, 22 mots de fonction dans le domaine des serveurs vocaux interactifs, 32 mots-clés de produits du domaine de l'automobile et 2 mots de commande courants supplémentaires
- 2 mots-clés dépendants de la langue supplémentaires
- phrases spontanées

Les classes d'âge sont réparties comme suit : 187 locuteurs ont entre 16 et 30 ans, 72 locuteurs ont entre 31 et 45 ans, 70 locuteurs ont entre 46 et 60 ans, et 9 locuteurs ont plus de 60 ans.

Un lexique de prononciation avec sa transcription phonétique en SAMPA est également fourni.

You don’t have the permission to edit this resource.
People who looked at this resource also viewed the following:
Resources from the same project