24.01.2023

10 тысяч озвученных ИИ текстов появится в «Строках» уже в 2023 году

Разработчикам удалось добиться того, что на первоначальную подготовку аудиокниги уходит всего 30-60 минут

Скриншот с сайта MTS AI
Скриншот с сайта MTS AI

Текст: ГодЛитературы.РФ

Компания по предоставлению цифровых, медийных и телекоммуникационных сервисов «МТС», в которую входит книжный сервис «Строки», сообщила о старте проекта по озвучиванию до 10 тысяч произведений с помощью технологий искусственного интеллекта, запущенного MTS AI.

Создание аудиокниг из текстовых произведений MTS AI осуществит на основе возможностей собственной платформы для распознавания и синтеза речи Audiogram. В этом продукте используются нейронные сети, машинное обучение и технологии обработки естественного языка (NLP). Платформа позволяет записывать аудиопроизведения в распространенном формате EPUB.

«В перспективе использование технологий синтеза речи позволит издательствам и электронным библиотекам существенно сократить время на подготовку аудиоверсии книги и снизить затраты на производство аудиоконтента. Команде MTS AI удалось добиться того, чтобы на подготовку первоначальной версии аудиокниг уходило 30-60 минут, тогда как студийная запись живым голосом занимает кратно больше времени, до нескольких дней с учетом технической обработки и монтажа», — комментирует технический директор MTS AI Дмитрий Буланцев.

Возможности платформы позволяют не только синтезировать речь, но и правильно расставлять ударения и паузы, воспроизводить интонации, характерные для текстов, в том числе вопросительные, побудительные.

Как сообщают в компании, технология MTS AI для озвучивания текстов и платформа для распознавания и синтеза речи Audiogram может использоваться не только для озвучивания книг, но и в образовательных процессах, в том числе в EdTech, для подготовки аудиолекций, для озвучивания видео, статей, для создания материалов для людей с ограниченными возможностями, в том числе слабовидящих.