Теперь искусственный интеллект используется для аудиодескрипции

После того как люди узнали об ИИ, кажется, он стал развиваться с неимоверной скоростью. Как будто каждую неделю искусственный интеллект учится решать новые задачи. Вот и тифлокомментирование (аудиодескрипция) стало одним из них. Звуковое описание – это формат повествования, который описывает важные визуальные элементы посредством звука. Этой функцией пользуются слепые или люди, у которых очень плохое зрение. Традиционно аудиоописание создавалось с использованием человеческих голосов, сценаристов и съемочных групп. Однако в прошлом году несколько международных стриминговых сервисов, включая Netflix и Amazon Prime, начали предлагать аудиоописания, которые частично генерируются с помощью искусственного интеллекта.

Предполагается, что искусственный интеллект сможет моментально обработать информацию и передать ее человеку в голосовом формате. Промо к новой функции ИИ стал рекламный ролик Google Pixel 8, который снял слепой режиссер Адам Морс. Он продемонстрировал, как система на базе искусственного интеллекта использует звуковые и тактильные (вибрацию) сигналы вместе с анимаций для передачи информации слепому пользователю.

Вообще среди производителей гаджетов и ПО растёт популярность на внедрение аудиодескрипции. Например, есть приложение Microsoft Seeing AI, которое может превратить ваш смартфон в говорящую камеру, считывая текст и идентифицируя объекты. А приложение Be My Eyes использует виртуальных помощников для описания фотографий, сделанных слепыми пользователями. В предыдущей версии вместо ИИ окружение описывали добровольцы.

Опубликовано: 21.05.2025 17:00 | Автор: Екатерина Олейникова