В том, что при воспроизведении образцов синтезированной речи неизбежно возникнут самые противоречивые суждения и мнения, нет никаких сомнений. При определении результатов научных исследований субъективность оценок и мнений неприемлема. Об этом говорилось в диссертации Т. Людовик, где автор достаточно много внимания уделил научным методам определения естественности звучания и разборчивости синтезированной речи.
Показателем разборчивости речи новоявленных электронных дикторов стал процент слов в диктанте, которые были прочитаны компьютером и написаны преподавателям и студентами Института филологии. Идея создания таких дикторов принадлежит Татьяне Людовик. Она же их и создала. Разборчивость достигала 97-98%.
Множественные ошибки восприятия были связаны преимущественно с редко употребляемыми словами, такими как слово «цингель».
В текстах радионовостей наблюдалась наиболее высокая разборчивость, диапазон которой находился в пределах 98.4% . Несколько хуже воспринималось чтение фрагментов из художественных произведений. Здесь процент разборчивости достиг 97.3%. Со слов диссертанта это объясняет тем, что лексический состав, структура и интонационное строение новостийных публицистических текстов гораздо проще, нежели художественных произведений.
В диссертации звучание компьютерных речей и их естественность оценивались посредством теста «mean opinion score», общепринятого в мировой практике. Проще говоря, проводилось вычисление среднего балла от оценок, которые были выставлены членами группы независимых экспертов по пятибалльной шкале. Результат таков: средняя оценка, в зависимости от версии используемого акустического процессора, который создаёт речевой сигнал, колебалась в пределах 3.47 до 3.53.