See What's NEW

MDT-AA007 Mandarin Chinese Conversational Speech Recognition Corpus—Telephony

* Open Source Training Datasets Terms of Use and Privacy Policy

This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License

Download

Languages

ZH-CN

Recording Environment

Indoor Environments

Duration

1,000 h

Data Content

Chinese Telephone Spontaneous Conversation Speech Corpus

File Format

WAV, TXT

Speech Parameters

PCM /Mono/16bits/8KHz

Recording Equipment

Mobile

Field of Application

ASR

Data Sensitive Items

Nil

Magic Data

open source duration

5.2 h

Sample

No related data? Contact us

Why MD Datasets

Full Compliance

ISO/IEC 27001 & ISO/IEC 27701:2019 compliant

Multiple Dimension

Audio, text, image, and video multi-modal data

Extensive Scope

Conversational, scripted, and spontaneous data covering extensive domains

High Accuracy

Expertise secured quality result

TOP

Talk to Magic Data

MDT-AA007 Mandarin Chinese Conversational Speech Recognition Corpus—Telephony

Sample

No related data? Contact us

Related Datasets

MDT-AG022 Mandarin Chinese Conversational Speech Corpus

MDT-AE005 Zhengzhou Dialect Speech Corpus—Daily Use Sentence

MDT-AE052 Sichuan Dialect Conversational Speech Corpus

MDT-AF024 Filipino English Scripted Speech Corpus—Keyword Spotting

MDT-AE016 Filipino English Scripted Speech Corpus—Daily Use Sentence

MDT-AE018 Filipino/Tagalog Scripted Speech Corpus—Daily Use Sentence

Why MD Datasets

Full Compliance

Multiple Dimension

Extensive Scope

High Accuracy