Common Voice
| Common Voice | |
|---|---|
| | |
| Предварительный просмотр главной страницы сайта Common Voice в апреле 2021 года | |
| Тип | voice dataset[вд] и краудсорсинг |
| Разработчик | Mozilla Foundation |
| Языки интерфейса | Многоязычный (список языков) |
| Дата выпуска | 19 июня 2017 |
| Последняя версия | |
| Репозиторий | github.com/mozilla/voice… |
| Лицензия | Creative Commons CC0 |
| Сайт | commonvoice.mozilla.org |
Common Voice — краудсорсинговый проект, запущенный Mozilla для создания бесплатной базы данных для программного обеспечения распознавания речи. Проект поддерживается волонтерами, которые записывают образцы предложений с помощью микрофона и прослушивают записи других пользователей. Транскрибированные предложения будут собраны в базу данных голосов, доступную под лицензией CC0, являющейся общественным достоянием. Эта лицензия гарантирует, что разработчики могут использовать эту базу данных для голосовых приложений без ограничений и затрат.

Common Voice появился как ответ голосовым помощникам крупных компаний, таких как Amazon Alexa, Siri или Google Assistant.
Голосовая база данных
База данных English Common Voice является второй по величине свободно доступной голосовой базой данных после LibriSpeech. К моменту публикации первых данных 29 ноября 2017 года, более 20 000 пользователей по всему миру записали 400 000 подтвержденных предложений, общей продолжительностью 500 часов.[2]
В феврале 2019 года была выпущена первая партия языков. В неё вошли 18 языков: английский, французский, немецкий и севернокитайский, но также и менее распространенные языки, такие как валлийский и кабильский. В общей сложности она включала почти 1400 часов записанных голосовых данных от более чем 42 000 авторов.[3]
Примечания
- ↑ Release release-v1.159.0 · common-voice/common-voice (англ.)
- ↑ Announcing the Initial Release of Mozilla’s Open Source Speech Recognition Model and Voice Dataset. blog mozilla.org (29 ноября 2017). Дата обращения: 14 февраля 2020. Архивировано 29 ноября 2017 года.
- ↑ Mozilla updates Common Voice dataset with 1,400 hours of speech across 18 languages. VentureBeat (28 февраля 2019). Дата обращения: 14 февраля 2020. Архивировано 4 марта 2019 года.
Content Disclaimer
Informasi ini disarikan dari Wikipedia dan disajikan kembali untuk tujuan edukasi. Konten tersedia di bawah lisensi CC BY-SA 3.0. Kami tidak bertanggung jawab atas ketidakakuratan data yang bersumber dari kontribusi publik tersebut.
- The information displayed on this website is sourced in part or in whole from Wikipedia and has been adapted for the purpose of restating it. We strive to provide accurate and relevant information, however:
- There is no guarantee of absolute accuracy. Wikipedia is an open, collaborative project that can be edited by anyone, so information is subject to change.
- It is not intended to constitute professional advice. The content displayed is for informational and educational purposes only. For important decisions (e.g., medical, legal, or financial), please consult a professional.
- Content copyright. Wikipedia is licensed under the Creative Commons Attribution-ShareAlike License (CC BY-SA). This means that content may be reused with appropriate attribution and shared under a similar license.
- Responsible use. Any risk arising from the use of information from this website is entirely the responsibility of the user.