Технологический прорыв в генерации голосов, похожих на человеческие, дает новые возможности в озвучивании текстов для различных целей, но также, добавляет неразберихи в отличии реальных голосов от искусственных.
В нашей работе, в последнее время, мы встречались с претензиями по поводу роботизированных начиток. К счастью, разбирая эти обращения, они оказывались вымышленными. Мы с пониманием относимся к таким вопросам (это же банальный рабочий процесс)… Ведь причины зачастую сводятся к банальному непониманию заказчика, что такое ИИ и как это реально звучит. И конечно же, наши "любимые хитрецы", которые просто пытаются манипулировать этим.
Давайте разберемся, действительно ли так сложно распознать «подлог» и какие способы есть на сегодняшний день!
Возможности ИИ в генерации голосов.
Очевидно, что, работая в сфере профессиональной дикторской озвучки более 10 лет и имея такой мощный сервис предоставления этих услуг как наш портал Дикторов.нет, мы постоянно держим руку на пульсе новых технологий и мониторим современные возможности ИИ.
Даже за последние буквально полгода, возможности действительно сильно возросли, появилось значительно больше сайтов, для генерации довольно реалистичных голосов, но, как говорится, есть нюансы!
ИИ или живой голос – ищем отличия!
Пока что, мы рассматриваем только 1 сервис, которому удалось добиться действительно достойных результатов в создании реалистичных голосов, с возможностями гибкой настройки – в скорости начитки, некоторого тембрального окраса, ударений (не всегда корректных) и т.д. Это не критика – это анализ.
И самое главное, что именно по тембру (их то достойных всего 2-3 голоса), любой человек, который работает в сфере профессионального озвучивания сразу их узнает.
Остальные же вариации генерации сразу распознаются по неприродной монотонности и интонационных несоответствий, малозаметных искажений, нелепых пауз и т.д.
Технические инструменты проверки на генерацию голоса ИИ.
Хотелось бы отдельно отметить, что мы работаем над собственным инструментом автоматизированной проверки фейковых дикторских голосов, и в скором времени предоставим его на нашем портале. Этот инструмент обобщает в себе доступные сервисы проверки, которые требуют дополнительных регистраций пользователей и естественно на иностранных языках. Мы стараемся упростить этот процесс – и надеемся нам это удастся.
Как мы контролируем дикторов на нашем портале?
Подчеркнем, что на нашем сайте представлены только живые профессиональные дикторы, которые, проходят жесткую модерацию перед тем, как их профайлы становятся доступными в нашей базе голосов! Это происходит в несколько этапов:
- - Прослушивание демо по критерию качества записи и профессионализма диктора
- - Техническая проверка файла на генерацию и аудио дипфейка
- - При сомнениях, запрос дополнительного аудио-демо с обычной игривой пропевочкой детской песенки, подчеркнуто – непрофессионально!
Все эти шаги исключают возможность попадания в нашу базу ботов и роботизированных недобросовестных исполнителей. Закономерный вопрос – находили ли мы подобных персонажей? Да, конечно же, да! Но, естественно, их модерация – отклоняется!