БЛОГ

VASA-1 - новая модель ИИ

01.05.2024 10:00 13719 Комментарии (96)

Компания Microsoft представила модель искусственного интеллекта VASA-1, предназначенную для генерирования реалистичных видео персонажей, произносящих заданный текст, по одной фотографии и аудиоклипу с речью. VASA-1, способна не только воспроизводить движения губ, синхронизированные со звуком, но и улавливать широкий спектр нюансов лица и естественных движений головы, которые способствуют реалистичному восприятию.

Пишут, что эта модель поддерживает онлайн-генерацию видео 512x512 с частотой до 40 кадров в секунду с незначительной задержкой.

Для чего это может применяться? Ну, например, для создания реалистичных аватаров, которые имитируют человеческий разговор.

На странице проекта выложено множество примеров работы VASA-1, вот один из них.

Ну и вот ролик, который показывает, как работает эта технология в реальном времени.

видео ИИ

01.05.2024 10:00

Предыдущая запись Следующая запись

Комментарии 96

Всё уже практически в порядке с оживленными и озвученными фото людей, главное - не показывать их пальцы, и ура-победа 😄

Сэр Макс

02.05.24 07:13

0 0

"Exquisitely synchronized", my ass.
С губными согласными всё очень плохо. Это я про второй ролик. В первом норм.
Ну чо, подтянут, подчистят. Всё хорошо будет.

BOPOHOK

02.05.24 05:14

0 0

elijahwoo

01.05.24 23:20

0 0

Вікторія Ші

Как-бы уже.

rvm1975

01.05.24 17:41

0 2

Апиридил 😄

Monteckel

rvm1975

02.05.24 01:34

0 0

Сначала изобрели сигнальные костры, потом телеграф, потом телефон, потом чат, потом видеосвязь. И, как вишенка на торте - изобрели то, что делает всё описанное ранее бессмысленным для всего, кроме пустой болтовни.
Короче говоря, полностью теряется доверие к любому собеседнику, кроме того, которого можно пощупать.

Jks

01.05.24 17:18

0 0

вот по телеграфу было полное доверие. Неповторимый стиль, хрен подделаешь, как man-in-the-middle среди костров не поставишь (узор пламени не подделаешь).

Skandenberg

Jks

01.05.24 17:34

0 3

теперь Вово будет вечным. спасибо, пацаны. А то поцреоты считают что "голос нельзя подделать".

Tristejocker

01.05.24 15:39

0 1

Потом будет хорошо. А пока что - Uncanny Valley во всей красе, смотреть невозможно.

Ogra

01.05.24 13:06

1 1

Один дальний друг интересуется, когда появится порно на основе ИИ с редактируемым по команде зрителя сюжетом.

H2O

01.05.24 12:51

0 2

Ваш друг может заказать сюжет у живых людей на ОнлиФанс.

Engineer

H2O

01.05.24 12:55

0 0

Покажите настоящую девчонку, сфотканную на картинке, читающую тот же текст. Окажется тот же эффект, что и от "восстановленных" ч б фото.

runcyclexcski

01.05.24 12:01

0 2

ИИ небось натренирован на экстравертах-балаболах с поставленной речью без изъянов и умеющих держаться перед камерой и будет странно смотреться на большинстве остальных людях.

rocket1

01.05.24 11:43

0 3

Ой, да ладно. Через полгода и зубы подкорректируют, и сделают разные варианты мимик, лиц, голосов, акцентов и т.д. И настройку ползунками, сможете делать мимику проще-сложнее.
А галочкой и заикание добавлять.

Regs

rocket1

01.05.24 12:37

0 4

Треугольная радужка, рандомные зубы и волочащиеся стропы парашюта выдавали американскую шпиёнку с головой.

tenerife

01.05.24 11:29

1 11

Погоди ты, только научились не 7 пальцев, а пять рисовать. А тут целых 32 зуба.

runcyclexcski

tenerife

01.05.24 19:32

0 2

"Колючка, грят? Колючка. От волков, грят? От волков… Хорошо, грят, молодец! Оплетем рудники… Сам дон Рэба и оплел. И мясокрутку мою забрал. Молодец, грит! Голова, грит, у тебя!.. И теперь, значит, в веселой башне нежный фарш делает… Очень, говорят, способствует…"
/ АБС, "ТББ"

Одни изобретают. Другие превращают это в дерьмо.

Ещё немного это доработают, и нельзя будет верить вообще ничему. Ещё больше информации превратится в фэйк. Все вокруг сплошной фэйк. Матрица.

ИИ, грят? ИИ. Для реализму? Молодцы, сейчас пропагандисты и лжецы это используют на миллион процентов, дураков оболванивать.

BorNeo

01.05.24 11:09

0 15

Дуракам такие сложности не нужны. Они на слово верят ("мальчик в трусиках").

Skandenberg

BorNeo

01.05.24 11:33

0 5

Ещё немного это доработают, и нельзя будет верить вообще ничему.

Может, оно и к лучшему. Прививка от гипноза. Сейчас на людей, особенно пожилых, телекартинка, как и фото к статье, действует магически, снимая всякие барьеры недоверия. Если к сказанному человек более-менее привык относиться скептически, то показанное воспринимается как "я же сам там был и лично все видел", и неважно, что видео постановочное с актерами, а фото из Аргентины десятилетней давности, и оба никакого отношения не имеют к тексту за кадром.

Chlorian

BorNeo

01.05.24 11:34

1 2

Совсем дураки, на слово.
А это будет для умных дураков, таких, как американские студенты.
Видео с преступлениями Хамас? Это все фейк с использованием ИИ. Работа Моссад и ЦРУ. А Рафик неувиноватый. Фри Палестайн!

BorNeo

Skandenberg

01.05.24 11:37

3 7

ИИ, грят? ИИ. Для реализму? Молодцы, сейчас пропагандисты и лжецы это используют на миллион процентов, дураков оболванивать.

Кстати, а кто-то вообще видел какие-то реальные положительные применения этим ИИ-видео, так сказать на пользу человечеству?
А то похоже что вся эта ИИ-подмена реальности больше во вред, чем на пользу.

Regs

BorNeo

01.05.24 12:35

0 7

Дуракам такие сложности не нужны. Они на слово верят ("мальчик в трусиках").

Вот только дураки- это не какой-то конкретный вид. Дураки разные бывают, широкого диапазона- от медицински дебильных до дураков из Гарвардов и прочих Сорбон.

Regs

Skandenberg

01.05.24 12:43

0 3

Кстати, а кто-то вообще видел какие-то реальные положительные применения этим ИИ-видео, так сказать на пользу человечеству?

Речь идет конкретно про видео? Ок, какую пользу может нести видео-контент? Образование и развлечение. Значит с помощью ИИ можнро автоматизировать генерациб этого контента. Вот вам и ответ. Что вы еще хотите услышать?

Engineer

Regs

01.05.24 13:06

0 0

Видео с преступлениями Хамас? Это все фейк с использованием ИИ. Работа Моссад и ЦРУ. А Рафик неувиноватый. Фри Палестайн!

И что теперь с этим делать? Останавливать развитие ИИ? Если кто-то во что-то верит, ему никак не поможет развитие или не-развитие ИИ, или чего-либо другого. Эти процессы между собой никак не связаны.

Engineer

BorNeo

01.05.24 13:09

0 0

Что вы еще хотите услышать

Хочу услышать, а точнее увидеть реальные положительные применения, а не гипотетические. Гипотетические я и сам знаю.

Regs

Engineer

01.05.24 13:18

0 0

Хочу услышать, а точнее увидеть реальные положительные применения, а не гипотетические.

Если вам интересны другие сферы применения ИИ, то я вам открою маленький секрет, вы только присядьте. Вы этот самый ИИ используете ежедневно как минимум последние 15 лет (или пользуетесь результатами его использования):

- система распознавания знаков в авто.
- система удержания в полосе в авто.
- система распознавания лиц.
- фото-фильтры в камерах и графических редакторах.
- фейсбук, который узнает ваш фейс и ставит на него тег.
- тысячу видов диагностики в медицине.
- исследования в генной инженерии.
- гугл-переводчик (постоянно учится на вводе текстов от миллионов пользователей).
- система исправления ошибок в текстовых редакторах.
- гугл-карты (постоянно учится и улучшает маршрут).
- система рекомедации контента в интернете.
- гугл, которые вас подслушивает и подсовывает рекламу того, о чем вы говорили.
- сканирование текста с картинки и перевод его в текст.
- система шумоподавления и прочие аудио-чудеса.
- чат-боты.
- распознавание спама в имейлах.
- анализ снимков и нахождение новых объектов в астрономии.
- нахождение дронами вражеской техники на поле боя.
- аэрофотосъемка и анализ урожая в агрокомплексе.
- прогноз погоды.
- отсев резюме в любой большой компании, где много аппликантов.
- предсказания на фондовом рынке.
- анализ спроса на продукт и автоматическая корректировка цены в любой торговой сети.

... и еще тысячу других сфер, где применяются Нейросети, или как любят говорить, ИИ.
А сама теоретическая и математическая база под эти Нейросети была придумана где-то лет 40 назад. Никакой магии там нет. За нейросетями стоят многомерные числовые матрицы и математические операции с ними. Просто под это дело до недавнего времени банально не хватало вычислительных мощностей.

Engineer

Regs

01.05.24 13:30

0 6

и еще тысячу других сфер, где применяются Нейросети

Нейросети-то уже много чему научились, а вот люди читать и понимать прочитанное не всегда...
Я разве просил читать лекцию на общую тему "Где применяются Нейросети"?

Я спрашивал про
"реальные положительные применения этим ИИ-видео, так сказать на пользу человечеству".

Выделил специально для вас. Хотя если простой вопрос нужно уже 3й раз объяснять, то пожалуй отвечать не стоит.

Regs

Engineer

01.05.24 14:09

2 1

QAnon можно верить всегда.

re-vert

BorNeo

01.05.24 14:14

0 1

только это не AI, а постоянно развивающееся IT на алгоритмах, которую пишут люди

Skandenberg

Engineer

01.05.24 14:17

1 0

Да зачем ходить далеко. Дураки не представляют даже где и как могут использоваться возможности AI.

re-vert

Regs

01.05.24 14:18

1 0

Дураки не представляют даже где и как могут использоваться возможности AI.

Еще один представлятель... Раз нет понимания чем отличается "представлять" и "могут использоваться" от реальных положительных применений этим ИИ-видео, то тут даже ИИ не поможет.

Regs

re-vert

01.05.24 14:22

0 0

Кстати, а кто-то вообще видел какие-то реальные положительные применения этим ИИ-видео

Девочки в Онлифанс себя приукрашивают или вообще создают ложный образ.
Считать ли положительным?
Для них да.

dmitri

Regs

01.05.24 15:30

0 0

> - гугл-карты (постоянно учится и улучшает маршрут).
нифига он не учится. уже больше года езжу одним и тем же маршрутом, а он все его никак спрямить не может:

jazzl0ver

Engineer

01.05.24 18:24

0 2

Попробуй ехать не по левой стороне 😄

runcyclexcski

jazzl0ver

01.05.24 19:33

0 4

Я спрашивал про"реальные положительные применения этим ИИ-видео, так сказать на пользу человечеству"

Ну вот я например заметил что всё меньше пользуюсь поиском в Гугле и всё больше каким-нибудь copilot который умеет выбрать из десятков ссылок конкретно то что тебе нужно. Особенно в технических вопросах. Можно спросить типа найди мне пример на C# как залогиниться в такой-то сервис при помощи такого-то API с использованием клиентского сертификата. И находит! Работает на ура.

Ka Tsu

Regs

01.05.24 21:53

0 1

И находит!

А причём тут применения этим ИИ-видео?

Regs

Ka Tsu

02.05.24 08:39

0 0

боюсь, остальным участникам ДД это не понравится

jazzl0ver

runcyclexcski

02.05.24 10:02

0 0

А причём тут применения этим ИИ-видео?

Мне типа показалось что имелся в виду ИИ вообще. И наверное не только мне.

Ka Tsu

Regs

02.05.24 10:13

0 0

Для фейков это будет применяться.

Eugene Arenhaus

01.05.24 11:04

1 7

широкий спектр нюансов лица и естественных движений головы, которые способствуют реалистичному восприятию.

Может это, конечно, мой личный стереотип, но американцы при разговоре так гримасничают и переигрывают лицом, что те персонажи Диснея. Сделай так кто-то из моих соотечественников, это сошло бы за пугающий признак, а вовсе не за естественные и реалистичные движения.

Chlorian

01.05.24 11:01

2 0

По американцам судите по Джиму Керри? Или нарикам на ломах?

Skandenberg

Chlorian

01.05.24 11:12

3 1

По друзьям и подругам.

Chlorian

Skandenberg

01.05.24 11:22

0 1

да, многие попали под опиоидную эпидемию 😒

Skandenberg

Chlorian

01.05.24 11:30

4 0

От американев учишься быть приветливым, улыбаться и говорить "доброе утро" незнакомым людям на прогулке в лесу. А потом идёшь за грибами в Мордорском лесу, и мордоряне шарахаются.

runcyclexcski

Chlorian

01.05.24 11:56

0 14

То-то и оно. Нахватаешься от них, потом рискуешь от местных в жбан получить.

Chlorian

runcyclexcski

01.05.24 12:07

0 5

Ничего, довольно быстро вспомнил, как делать угрюмое лицо и глаза в землю.

runcyclexcski

Chlorian

01.05.24 12:16

0 4

... улыбаться и говорить "доброе утро" незнакомым людям на прогулке в лесу.
... шарахаются.

Студенты "ультралиберального" университета в Болдере ещё как шарахались от меня в лесу в ковидные времена (-;

SergeyM

runcyclexcski

01.05.24 18:07

0 1

А ты корзину с мухоморами не держи напоказ. 😄

runcyclexcski

SergeyM

01.05.24 19:34

0 1

После первых пяти лет в Штатах, испытал тот же культурный шок в терминале Франкфурта, наполненого соотечественниками.
Пришлось отключать улубку -автопилот и сливатся с угрюмым фоном.

mmikhail

runcyclexcski

01.05.24 19:36

0 0

AI - продажная девка маркетологов.

Skandenberg

01.05.24 10:33

0 1

Ты сказал "девка"? Извыныс!

Vinny_The_Poo

Skandenberg

01.05.24 10:48

0 3

Если листать в блоге, то фото турецкого мастера ножей попадает в новость.
Перед ним тоже извиняться?

Skandenberg

Vinny_The_Poo

01.05.24 10:50

0 0

Ты сказал "девка"? Извыныс!

xoxol

Vinny_The_Poo

01.05.24 10:54

0 6

Уже даже и ему - нельзя...

Джутовый Мешок

01.05.24 10:28

0 5

"...Мюллеру - можно. Мертвецам вообще можно верить."

Алекс У

Джутовый Мешок

01.05.24 10:39

0 2

Напоминаю, что для создания аватарок есть чудесный сайт www.thispersondoesnotexist.com .

Рекорд Надоев

01.05.24 10:21

2 2

Ага, чудесатый-чудесатый! 😁

Джутовый Мешок

Рекорд Надоев

01.05.24 10:31

0 2

Стимпанковский монокуляр, это сейчас модно.

Алекс У

Джутовый Мешок

01.05.24 10:40

0 3

Ну, монокль. И чё такова?

Vinny_The_Poo

Джутовый Мешок

01.05.24 10:43

0 2

Хрень какая-то. Я палец себе стер обновлять картинку. 80% бабы, 10% мужики любых рас, кроме европеоидов, 5% дети. Из остальных тупо пожилые.

Интересно, кому это может пригодиться?

Ivan-gorod

Рекорд Надоев

01.05.24 10:46

0 2

Интересно, кому это может пригодиться?

у нас для подтверждения действий в Дії нужно покривляться на камеру телефона.
Вот взломщикам и пригодится.

xoxol

Ivan-gorod

01.05.24 10:50

0 1

у нас для подтверждения действий в Дії нужно покривляться на камеру телефона.Вот взломщикам и пригодится.

Не, я это только про этот сайт с аватарками "Такогочеловеканесуществует". Какой-то толерантно бессмысленный и бесполезный.

Ivan-gorod

xoxol

01.05.24 10:53

0 0

Вот если бы они были голые...

AlexLag

Ivan-gorod

01.05.24 22:44

0 0

Зубы у нее, конечно, огонь. Живут своей жизнью, отдельно от ротовой полости. Пострашнее пальцев на ИИ картинках.

Ivan-gorod

01.05.24 10:21

0 3

"Растяни меха, гармошка!.."

Vinny_The_Poo

Ivan-gorod

01.05.24 10:44

0 1

xoxol

Ivan-gorod

01.05.24 10:49

0 6

Ну, вот и основа для ужастика-блокбастера. А то некоторые не верят.

Vinny_The_Poo

xoxol

01.05.24 14:58

0 1

Музыкчка тоже соответствует.

runcyclexcski

Vinny_The_Poo

01.05.24 19:34

0 0

конец голливуда?

Дмитро Л

01.05.24 10:19

0 0

Только автоматизация. Большая часть звёзд в фильмах, как говорят в народе, и так только "е*алом торгует".

Skandenberg

Дмитро Л

01.05.24 10:52

1 1

Еще экономия на гонорарах. Актеры получают деньги за каждый съемочный день плюс за каждую минуту на экране. А тут только роялти за использование образа.

Правда звезды не будут этому рады...

Ivan-gorod

Skandenberg

01.05.24 10:56

0 0

Они и так получают гонорары за свою морду и образ. Боди даблы, каскадёры, съёмка с нескольких ракурсов для разных сцен.
Только Том Круз делает трюки, но за свой счёт и как хобби с рекламой.

Skandenberg

Ivan-gorod

01.05.24 11:04

1 1

То есть ты никогда не слышал, чтобы актеры отказывались от роли, потому что они были заняты в других проектах? Интересно, почему, ведь им платят только за образ? Может потому, что они физически не могут одновременно находиться на двух разных съемочных площадках? А тут, прикинь, смогут.

Ivan-gorod

Skandenberg

01.05.24 11:08

0 0

Писал, что надо приехать на съёмки и поторговать лицом, или сделать motion capture. Дальше уже другие дополнят.

заняты в других проектах?

Сиквелы "Рехаба".

Skandenberg

Ivan-gorod

01.05.24 11:15

1 0

Писал, что надо приехать на съёмки и поторговать лицом, или сделать motion capture. Дальше уже другие дополнят

А будет не надо. Ферштейн?

Ivan-gorod

Skandenberg

01.05.24 11:20

0 0

Живой человек будет нужен для создания и продажи массам образа.
Их и так могли заменить не менее способные актёры из середняка, но почему то в блокбастеры привлекают дорогих звёзд.

Skandenberg

Ivan-gorod

01.05.24 11:23

1 1

Ну вот они и останутся на красных ковровых дорожках. При чем здесь съемки то?

Ivan-gorod

Skandenberg

01.05.24 11:26

0 0

софт не сможет создать образ живого человека. Или эта будет ручная работа огромной стоимости.

Skandenberg

Ivan-gorod

01.05.24 11:31

2 1

софт не сможет создать образ живого человека

Вы слегка ошиблись темой данной заметки и временем лет на -дцать. Настраивайте вашу машину времени лучше.

Ivan-gorod

Skandenberg

01.05.24 11:51

2 0

Страшнее будет "конец порнохаба"...

И "консервы" уйдут в прошлое, будут не сниматься впрок, а генерироваться по мере надобности.

В общем, как писал фантаст:

"Верь тому, что ты видел сам и тому, что ты можешь потрогать. Это не даст тебе стопроцентной гарантии, но все остальное под еще большим вопросом. " (с)

Miller777

Дмитро Л

01.05.24 12:23

0 3

Для чего это может применяться? Ну, например, для создания реалистичных аватаров, которые имитируют человеческий разговор.
Т.е. можно будет заменить дикторов и комментаторов. Но ИМХО главное применение -- создание фейковых речей якобы от лица известных людей. Часть могут быть забавными, например Ньютон, рассказывающий про случай с яблоком. Но большинство это будет обман для криминальных и политических надобностей.

Solmir

01.05.24 10:14

2 16

Есть хороший британский сериал на эту тему - "Захват"(2019-2022). Как с помощью изменения видео с камер наблюдения в реальном времени, можно любого подставить: хоть бедолагу, хоть политика.

Ivan-gorod

Solmir

01.05.24 10:32

0 3

Кстати, да! Похоже, значимость камер наблюдения уходит в прошлое.

Vinny_The_Poo

Ivan-gorod

01.05.24 10:42

0 4

Кстати, да! Похоже, значимость камер наблюдения уходит в прошлое.

Хуже то, что в принципе вся правоохранительная и судебная системы летят ко всем чертям, так как фото-видео-аудио доказательства более не являются надежными... Может не прям сейчас-сегодня, но в самой ближайшей перспективе.

Ivan-gorod

Vinny_The_Poo

01.05.24 10:48

0 6

Аппаратное шифрование, ЭЦП и подобное... Это только у киношников "ща я её взломаю!" и тр-р-р-р-р по клавишам хорошо получается.

Джутовый Мешок

Vinny_The_Poo

01.05.24 10:50

1 0

только у киношников "ща я её взломаю!"

Лучший из лучших в Голливуде

Skandenberg

Джутовый Мешок

01.05.24 10:57

0 0

Да-да-да. В каждой камере в домофоне. Уже побежали жильцы скидываться. И мэры всех городов в мире: "ура, у нас бюджеты резиновые, срочно меняем все камеры и все сети на защищенные!"

Ivan-gorod

Джутовый Мешок

01.05.24 10:59

0 1

Когда на каждом столбе вешали незащищенные - орали то же самое. Не вы ли?
Да, чтоб два ответа не плодить - давно ли цифровые фото-видео-аудио записи стали доказательствами?..

Джутовый Мешок

Ivan-gorod

01.05.24 11:05

1 0

Но большинство это будет обман для криминальных и политических надобностей.

Читал статью недавно. В Англии мошенники таким образом от лица "внуков" "возобновляют общение" с одинокими бабушками, вытягивая из них деньги. До недавнего времени ограничивались фейковыми фотографиями и голосом; сейчас, вероятно, и видео пойдут.

aoleg

Solmir

01.05.24 11:06

0 5

давно ли цифровые фото-видео-аудио записи стали доказательствами?

В РФ достаточно давно. Особенности и условия расписаны в ГПК, УПК и много еще где.

В других странах суды также принимают такие доказательства при соблюдении ряда требований.

Суд на свое усмотрение может как принять так и отклонить эти материалы по велению своей левой пятки, на то он и суд.

Ivan-gorod

Джутовый Мешок

01.05.24 11:14

0 0

Для чего это может применяться?

Для исследований. Остальное - игрушки.
Самый продвинутый ИИ от Anthropic AI - Claude 3 Opus, который, согласно некоторым заявлениям, "демонстрирует признаки сознания".

dmitri

Solmir

01.05.24 12:33

0 0

Вовсе нет. Легко решается внедрением меток на этапе генерации.

re-vert

Ivan-gorod

01.05.24 14:10

1 1

который, согласно некоторым заявлениям, "демонстрирует признаки сознания".

А авторы этих заявлений демонстрируют?

Solmir

dmitri

01.05.24 14:15

0 0

Вовсе нет. Легко решается внедрением меток на этапе генерации.

Это если говорить о специализированных сертифицированных устройствах. А как быть с миллиардом бытовых камер? Вот слили в сеть секс твоей жены с твоим другом. Фейк не фейк, как думаешь?

Ivan-gorod

re-vert

01.05.24 14:18

0 1

Вот слили в сеть секс твоей жены с твоим другом. Фейк не фейк, как думаешь?

Конечно фейк! Никакой искин не сгенерирует...