Клонирование » Проблемы качества клонированного голоса

В том, что при воспроизведении образцов синтезированной речи неизбежно возникнут самые противоречивые суждения и мнения, нет никаких сомнений. При определении результатов научных исследований субъективность оценок и мнений неприемлема. Об этом говорилось в диссертации Т. Людовик, где автор достаточно много внимания уделил научным методам определения естественности звучания и разборчивости синтезированной речи.

Показателем разборчивости речи новоявленных электронных дикторов стал процент слов в диктанте, которые были прочитаны компьютером и написаны преподавателям и студентами Института филологии. Идея создания таких дикторов принадлежит Татьяне Людовик. Она же их и создала. Разборчивость достигала 97-98%.

Множественные ошибки восприятия были связаны преимущественно с редко употребляемыми словами, такими как слово «цингель».

В текстах радионовостей наблюдалась наиболее высокая разборчивость, диапазон которой находился в пределах 98.4% . Несколько хуже воспринималось чтение фрагментов из художественных произведений. Здесь процент разборчивости достиг 97.3%. Со слов диссертанта это объясняет тем, что лексический состав, структура и интонационное строение новостийных публицистических текстов гораздо проще, нежели художественных произведений.

В диссертации звучание компьютерных речей и их естественность оценивались посредством теста «mean opinion score», общепринятого в мировой практике. Проще говоря, проводилось вычисление среднего балла от оценок, которые были выставлены членами группы независимых экспертов по пятибалльной шкале. Результат таков: средняя оценка, в зависимости от версии используемого акустического процессора, который создаёт речевой сигнал, колебалась в пределах 3.47 до 3.53.

О клонировании

Новости:

Блок партнерской рекламы: