Полууправляемое преобразование голоса с амортизированным вариационным выводом

Категории: Глубокое обучение | Динамическая трансформация временной шкалы | Рекуррентная нейронная сеть | Среднее число мнений

Метки: 2019 | Anil Thomas | Cory Stephenson | Gokce Keskin | Oguz H. Elibol

В этой работе мы представляем полууправляемый подход к задаче преобразования голоса, при котором речь от исходного диктора преобразуется в речь от целевого диктора. Предлагаемый метод использует как параллельные, так и непараллельные высказывания от исходного и целевого одновременно во время обучения. Этот подход может быть использован для расширения существующих систем параллельного преобразования речевых данных таким образом, чтобы их можно было обучать с полуавтоматическим контролем. Мы показываем, что включение режима полунаблюдения повышает эффективность преобразования голоса по сравнению...

Автокодеры с противоборствующим обучением для преобразования голоса без использования параллельных данных

Преобразование голоса

Категории: Автокодировщик | Глубокое обучение | Преобразование Фурье | Состязательное обучение | Среднее число мнений

Мы представляем метод преобразования голоса между несколькими говорящими. Наш метод основан на обучении нескольких путей автоэнкодирования, где имеется один кодер, независимый от говорящего, и несколько декодеров, зависящих от говорящего. Автоэнкодеры обучаются с добавлением потерь при столкновении, которые обеспечиваются вспомогательным классификатором, чтобы выходные данные кодера были независимыми от диктора. Обучение модели проходит без контроля в том смысле, что для этого не требуется собирать одинаковые высказывания от говорящих и не требуется время на согласование фонем. Благодаря испол...

Метка: Anil Thomas