Исследователи искусственного интеллекта из Facebook AI Research Шон Васкез и Майк Льюис разработали синтезатор речи, способный копировать человеческий голос со сверхъестественной точностью. Об этом пишет MIT Technology Review.
Разработанная система MelNet может не только воспроизводить информацию человеческим голосом, но и имитировать голоса реальных людей. Так, исследователи обучили систему использовать речь спикеров из TED talks, а потом с ее помощью воспроизвели их голоса. Например, команда научила ее говорить как Билл Гейтс.
″Port is a strong wine with a smoky taste″ («Портвейн — это крепленое вино с дымным ароматом»)
В будущем разработку смогут использовать телефонные операторы и справочные службы. Пока команда еще не усовершенствовала машинную речь до более длинных предложений, абзацев или целых историй. Сейчас система может говорить только короткими фразами.
Ученые из MIT считают, что еще один прогресс в сфере ИИ поднимает больше этических вопросов, чем отвечает на них. Прежде всего речь идет о потенциальных проблемах с машинами, которые могут с точностью имитировать голоса людей. Так, имитация человеческой речи может привести к созданию поддельного аудиоконтента (DeepFakе), где отличить подделку от оригинала будет практически невозможно. Это могут использовать для политических манипуляций и фейкньюз.