Intel представила величезні набори даних, які спростять навчання ші розпізнаванню мови

59

На що проходить в ці дні щорічній конференції neural information processing systems( neurips), яка присвячена штучному інтелекту і машинному навчанню, компанія intel представила два проекти, які пов’язані з розпізнаванням і транскрибуванням розмовної мови. Проект the people’s speech націлений на вирішення завдань “автоматичного розпізнавання мови«, тоді як проект multilingual spoken words corpus (mswc) призначений для»пошуку ключових слів”.

В рамках кожного з проектів були створені набори даних, що містять значний обсяг аудіоданих і входять до числа найбільших колекцій у своєму класі. Обидві ініціативи були запущені в 2018 році, щоб визначити і звести в єдиний набір даних 50 найбільш використовуваних мов світу, а потім знайти застосування цієї інформації. В рамках the people’s speech і mswc інженери intel співпрацювали з колегами з alibaba, oracle, google, baidu та ін.

В рамках проекту people’s speech розробники створили набір даних, що включає в себе десятки тисяч годин контрольованого розмовного аудіо. В даний час це один з найбільших у своєму класі наборів даних англійською мовою, ліцензований для академічного та комерційного використання і доступний для безкоштовного скачування.

В цей же час mswc — це набір аудіоречових даних, що містить понад 300 тис.ключових слів на десятках мовах і доступний для інтелектуальних пристроїв. Набір даних mswc охоплює мови, якими розмовляють понад 5 млрд людей і сприяє розробці голосових додатків для широкої аудиторії. Обидва набори даних будуть доступні розробникам.