• Про проєкт
  • Контакти
  • Логін
CreativityUA - Official CIAU Media
  • Ідеї
  • Інсайти
  • Ремесло
  • Бізнес
  • Люди
  • М’язи
  • Тренди
  • Натхнення
  • Більше
    • Всі новини
    • Відео
    • Спецпроєкти
      • LIONS Live
      • Креативний дайджест
      • Cannes Lions 365
      • Філософський Сад
      • Комунікації для культурних менеджерів
      • Знакові проєкти України
Немає результатів
Переглянути всі результати
Creativity Ukraine
  • Ідеї
  • Інсайти
  • Ремесло
  • Бізнес
  • Люди
  • М’язи
  • Тренди
  • Натхнення
  • Більше
    • Всі новини
    • Відео
    • Спецпроєкти
      • LIONS Live
      • Креативний дайджест
      • Cannes Lions 365
      • Філософський Сад
      • Комунікації для культурних менеджерів
      • Знакові проєкти України
Немає результатів
Переглянути всі результати
Creativity Ukraine
Головна Бізнес та Інновації

Компьютер научили анимировать лица необработанной записью речи

9 Жовтня, 2019
Час прочитання: 1 хв.
A A
Компьютер научили анимировать лица необработанной записью речи
Share on FacebookShare on Twitter

Разработчики из Microsoft Research представили алгоритм, который может анимировать статичные кадры лиц с помощью необработанных записей речи людей. Созданная ими модель — контекстно-зависимая: она выделяет из аудио не только фонетические характеристики, но также и эмоциональный тон и сторонний шум, благодаря чему может наложить на статичный кадр все возможные аспекты речи. Препринт статьи с описанием работы алгоритма доступен на arXiv.org.

Для анимирования статичных изображений в большинстве случаев используется перенос информации с видеозаписей на необходимый кадр. В решении этой задачи разработчики уже добились значительных успехов: сейчас существуют модели, которые могут достоверно переносить речь с видеоряда на статичный кадр, воссоздавая мимику говорящего.

Трудности в решении, однако, могут возникать в случае, если «оживить» изображения нужно с помощью аудиоряда: все существующие сейчас алгоритмы, которые могут перенести аудио на статичный кадр так, чтобы получилась натуральная анимация или даже видео процесса речи, ограничены тем, что могут работать только с чистой, хорошо слышимой речью, сказанной нейтральным голосом без эмоционального окраса. Человеческая речь, однако, достаточно многогранна и в идеале необходимо научить подобные алгоритмы воссоздавать все ее аспекты.

Заняться этим решили Гаурав Миттал (Gaurav Mittal) и Баоюань Ван (Baoyuan Wang) из Microsoft Research. Их алгоритм получает на вход аудиофайл и с помощью вариационного автоэнкодера на основе нейросетей с долгой краткосрочной памятью выделяет ключевые аспекты: фонетическую и эмоциональную составляющую (всего алгоритм понимает шесть базовых эмоций), а также сторонний шум. На основе выделенной информации реконструируется мимика говорящего — для этого используются видеофайлы — и накладывается на изначально статичное изображение.

Для обучения алгоритма исследователи использовали три разных датасета: GRID, состоящий из тысячи видеозаписей речи 34 людей, сказанной с нейтральным выражением, 7,4 тысячи видеозаписей речей с различным эмоциональным окрасом, взятых из датасета CREMA-D, а также более ста тысяч отрывков из видео TED.

В результате исследователям удалось анимировать статичные изображения даже с использованием аудио с фоновым шумом до 40 децибел, а также — успешно использовать эмоциональные составляющие речи говорящего в анимировании. Сами анимации авторы не приводят, но приводят сравнение получившихся кадров с результатами работы одного из первых подобных алгоритмов.

Авторы работы также уточнили, что их алгоритм можно использовать во всех уже существующих системах, которые могут анимировать статичные изображения с помощью аудио: для этого необходимо будет заменить в сторонних алгоритмах обрабатывающий аудио компонент.

Источник: https://nplus1.ru

Теги: новинитехнології

СХОЖІ ПУБЛІКАЦІЇ

Digital-набір піарника: від робочих додатків до джерел натхнення
Аналітика

Digital-набір піарника: від робочих додатків до джерел натхнення

30 Червня, 2025

Ефективність у PR залежить не лише від досвіду, а й від правильно підібраних інструментів. Які додатки економлять час на рутинних завданнях, а де знайти натхнення для креативних ідей?  Валерія Васильченко,...

Читати даліDetails

“Зароблені” комунікації проти “оплачених”: як знайти гармонію для бренду

MasterZoo представив рекламну кампанію про сни пухнастих особистостей

РЕКОМЕНДОВАНО

Відповідальність

ВРК створює нову категорію в комунікаціях – Військова реклама (Military advertising)

20 Червня, 2025
Інсайти

Принципи понад процеси: новий посібник WFA та VoxComm щодо вибору агенції

25 Червня, 2025

БІЛЬШЕ МАТЕРІАЛІВ

Етика у дизайні: старт першого національного дослідження про професійні цінності українських дизайнерів
Аналітика

Етика у дизайні: старт першого національного дослідження про професійні цінності українських дизайнерів

26 Червня, 2025
Фонд «Підтримай Третю штурмову» та Projector запустили відкритий бриф на створення постеру для всеукраїнської кампанії
Відповідальність

Фонд «Підтримай Третю штурмову» та Projector запустили відкритий бриф на створення постеру для всеукраїнської кампанії

26 Червня, 2025

Про медіа

CreativityUA – ми пишемо про креатив, що трансформує бізнес, змінює людину та розвиває суспільство. Надаємо можливість брендам та особистостям ділитись досвідом та цікавою інформацією. Тримаємо в курсі важливих новин креативних індустрій і надаємо майданчик для поширення свіжих думок.

Тематичні напрями

  • Творчість і дизайн
  • Бізнес та Інновації
  • Маркетинг і Комунікації
  • Культура і Життя
  • Наука і Технології
  • Розвиток і Ефективність
  • Суспільство та Держава
  • Фестивалі та можливості
  • Відповідальність

Контакти

Відділ реклами

Імейл редакції

+380 44 221 6131

Новини Каннських Левів в Україні

Cannes LIONS 365  |  LIONS Live

Подкаст Creative Digest

Soundcloud  |  Apple Podcasts |  Google Podcasts

Ми у соцмережах

© 2021 CreativityUA | Офіційне медіа Асоціації Креативних Індустрій України | CIAU

Політика конфіденційності

З поверненням!

Увійдіть з логіном Facebook
Увійдіть з логіном Google
OR

Увійти в обліковий запис

Забули пароль?

Відновіть свій пароль

Будь ласка, введіть своє ім'я користувача або адресу електронної пошти, щоб скинути пароль.

Увійти
Немає результатів
Переглянути всі результати
  • РУБРИКИ
    • Ідеї
    • Інсайти
    • Ремесло
    • Бізнес
    • Люди
    • М’язи
    • Тренди
    • Натхнення
  • ТЕМАТИКА
    • Маркетинг і Комунікації
    • Бізнес та Інновації
    • Творчість і дизайн
    • Культура і Життя
    • Розвиток і Ефективність
    • Наука і Технології
    • Суспільство та Держава
    • Фестивалі та можливості
  • СПЕЦПРОЄКТИ
    • Cannes Lions 365
    • LIONS Live
    • Креативний дайджест
    • Філософський Сад
    • Комунікації для культурних менеджерів
    • Знакові проєкти України
  • ТИП МАТЕРІАЛУ
    • Новини
    • Добірки
    • Історії
    • Точка зору
    • Інтерв’ю
    • Аналітика
    • Відео
    • Події

© 2021 CreativityUA | Офіційне медіа Асоціації Креативних Індустрій України | CIAU

Цей вебсайт використовує файли cookie. Продовжуючи користуватися цим вебсайтом, ви даєте згоду на використання файлів cookie. Відвідайте сторінку Політика конфіденційності.