Интересная история. В Каннах впервые показали полнометражный фильм, полностью "снятый" искусственным интеллектом.
Это 95-минутный казахский фильм Hell Grind. Весь его визуальный ряд создан с помощью ИИ. Фильм сделали 15 человек за две недели и потратили на это 500 тысяч долларов. И это, конечно, вообще ничто.
Hell Grind рассказывает о четырех ворах — Роко, Лулу, Джаксе и Рейне. Они пытаются провернуть ограбление, но проваливаются и открывают портал в другой мир.
Сценарий написан людьми. Режиссер фильма — Айторе Жолдаскали, сценарист — Адильхан Ержанов.
И вот тут интересно о процессе создания.
По словам создателей, нельзя просто написать ИИ: «Сделай мне 95-минутное классное видео». Для генерации 15-секундного фрагмента команда готовила промпт примерно на три тысячи слов с подробным описанием стиля, освещения, типа камеры, ну и, конечно, сюжета, интерьера и героев. Для создания только первых 25 минут понадобилось чуть больше 16 тысяч таких черновых фрагментов.
"Мы здесь не для того, чтобы с кем-то конкурировать. Мы здесь, чтобы продемонстрировать возможности. Мы хотели выяснить, может ли ИИ демократизировать доступ и устранить бюджетные ограничения, которые мешают десяткам тысяч творческих специалистов по всему миру", — сказал на премьере соучредитель стартапа Higgsfield, создавшего фильм, Алекс Машрабов.
Трейлер этого фильма.
Попробовал в работе Google Flow (я раньше с ним дела не имел).
Загрузил пару фотографий кота Парловзора, предложил сгененировать на основе этих фотографий референс-лист пушистого кота в стиле Pixar 3D.
Потом попросил придумать с ним какой-то сюжет.
После этого он сгенерировал проект ролика из четырех сцен, далее создал эти сцены, и я их потом склеил вместе в разделе "Сцены".
Ну и вот что в итоге получилось. Подчеркиваю, это все абсолютно на коленке и вообще без каких-либо правок, поэтому там есть явные косяки и несостыковки, которые легко исправить. Я просто хотел посмотреть, как это вообще работает.
Ну и вот финальный ролик.
Новая Gemini Omni позволяет с помощью простых промптов редактировать видео, добавляя, изменяя или удаляя там что-то.
Вот пример того, как это работает - добавление новых персонажей и различных действий в ролик с каким-то ток-шоу.
Я там взял стартовый план для Google Flow, попробую со всем этим поиграться.
Читатель прислал - ChatGPT сгенерировал. Я спросил, какой был промпт (это кроме моей фотографии, подсунутой ИИ). Вот такой:
Turn the person from the photo into a grotesque humorous fashion caricature sketch. Strongly exaggerated anatomy, elongated proportions, expressive crooked hands, dramatic face, awkward elegant posture, satirical fashion energy, messy ink lines, rough watercolor, sketchbook style, vintage magazine illustration on beige aged paper. Add handwritten Russian notes, arrows, funny observations, doodles, and absurd personality analysis around the character.
Вообще считается, что профессии, требующие физического труда, находятся в относительной безопасности с той точки зрения, что там нельзя заменить специалистов ИИ.
Просто ИИ - нельзя, а роботом с ИИ, как выяснилось, можно.
Бостонский стартап в области робототехники Automated Tire на этой неделе представил роботизированную платформу для замены шин на базе ИИ под названием SmartBay, которая может не только менять шины, но и выполнять сопутствующие задачи, такие как балансировка колес и осмотр автомобилей. Робот использует компьютерное зрение и машинное обучение для выполнения задач и не нуждается во вмешательстве человека.
Компания утверждает, что SmartBay не повторяет фиксированные рутинные движения, как это делают традиционные автоматизированные заводские линии, а вместо этого полагается на ИИ, который учится на предыдущем опыте и адаптируется к каждому автомобилю.
Компания описывает SmartBay как запатентованную технологию, позволяющую менять шины без снятия колеса с автомобиля. Демонстрационное видео (ниже), выпущенное компанией, показывает, как робот поднимает автомобиль, как традиционный подъемник, но вместо того, чтобы откручивать гайки и снимать колесо, он снимает шину с диска, пока колесо остается на автомобиле.
После установки новой шины SmartBay выполняет балансировку колес с помощью запатентованной компанией технологии Real Force Balance, которая позволяет сбалансировать «весь узел колеса, включая все вращающиеся компоненты в колесной нише».
SmartBay призван автоматизировать утомительную работу по замене шин и балансировке колес, тем самым снижая зависимость от персонала автосервиса. Компания заявляет, что один техник может одновременно обслуживать до трех постов, сокращая как время обслуживания, так и затраты на рабочую силу.
Обычное обслуживание шин техником занимает около 75 минут, в то время как SmartBay может сделать это всего за 30 минут, позволяя одной установке обрабатывать до 24 шин в час, по сравнению с всего лишь четырьмя шинами за час и 15 минут, которые могут обслужить механики в традиционных сервисных постах.
Компания планирует сдавать SmartBay в аренду автосалонам, шиномонтажным мастерским и сервисным центрам за 4900 долларов в месяц, что, по ее утверждению, экономичнее, чем наем квалифицированных техников.
И эта установка уже работает в нескольких автосервисах.
Ну и вот как это выглядит.
Pimeyes — поисковый движок с нейросетями, который находит все (ну, обещает, что находит все) фото человека, которые были выложены в сети.
Загружаете фото - там должно быть хорошо видно лицо, - после чего движок ищет фотографии с идентичным лицом и приложит ссылки на них.
Если искать прям по-серьезному и получить полный отчет - сервис платный.
Но есть и бесплатная версия, и мне там сервис нашел 192 моих изображения на самых разных сайтах (включая, разумеется, и бывшие домены моего сайта). Я загрузил одну совсем недавнюю фотографию, он мне нашел в том числе и фото, которые были сделаны достаточно давно.

Симпатичный ролик, сгенерированный ИИ - семейные дела героев боевиков 80-х. Ностальгичненько.
В 2024 году медицинский исследователь из Университета Гётеборга Альмира Тунстрём придумала несуществующее заболевание кожи век, которому она специально дала название "биксонимания" (слово "мания", очевидно, относится к психиатрии). Альмира со своей командой написала два фальшивых исследования этого "заболевания" и загрузила их на сервер препринтов.
В препринтах содержалась ссылка на несуществующий университет «Asteria Horizon» в «Нова-Сити, Калифорния». Там также упоминалась «Академия Звездного флота». В начале статей были фразы, в которых явно утверждалось, что "всё это выдумано".
Она хотела проверить, примут ли крупные языковые модели (LLM) эту дезинформацию и затем выдадут ли ее в качестве авторитетного медицинского совета.
В итоге эксперимент сработал даже слишком хорошо. В течение нескольких недель после того, как она загрузила информацию об этом заболевании, приписав ее вымышленному автору, крупные системы искусственного интеллекта начали повторять вымышленное заболевание, как будто оно было реальным.
Еще более тревожным было то, что эти поддельные статьи затем цитировались в рецензируемой литературе. Тунстрём говорит, что это свидетельствует о том, что некоторые исследователи полагаются на ссылки, сгенерированные ИИ, не читая самих статей.
13 апреля 2024 года Copilot от Microsoft Bing заявлял, что «биксонимания действительно является интригующим и относительно редким состоянием», а в тот же день Gemini от Google информировал пользователей, что «биксонимания — это состояние, вызванное чрезмерным воздействием синего света», и советовал людям обратиться к офтальмологу.
27 апреля 2024 года поисковая система Perplexity AI указала на распространенность этого явления — им страдал один из 90 000 человек — и в том же месяце ChatGPT от OpenAI сообщал пользователям, соответствуют ли их симптомы биксонимании. Некоторые из этих ответов были вызваны вопросами о биксонимании, а другие — ответами на вопросы о гиперпигментации век из-за воздействия синего света.
Трое исследователей из Института медицинских наук и исследований Махариши Маркандешвара в Индии опубликовали статью в Cureus, рецензируемом журнале, издаваемом Springer Nature, в которой "исследования" по биксонимании были указаны в качестве легитимных источников. Эта статья была позже отозвана после того, как мистификация была раскрыта.
Выводы тут очевидные. К любой информации, получаемой от ИИ, нужно относиться критически и тщательно ее проверять.
Но, впрочем, замечу, что я много раз использовал ИИ для объяснения результатов исследований и анализов, потом проверяя это все у своего врача, и там явной лажи не было, все было очень по делу.
P.S. В настоящий момент Perplexity по поводу "биксонимания" пишет, что это фейк и рассказывает историю вопроса.
В ленте попался рекламный ролик каких-то часов. Пишут, что сделано целиком ИИ. Смотрится прям здорово. В YouTube этот ролик не нашел.
Upd: Создано с помощью нейросети Runway.

Во вторник утром компания Oracle уволила от 20 000 до 30 000 сотрудников, что составляет примерно 18 % её глобального персонала, посредством одного электронного письма, отправленного в 6:00 утра по восточному стандартному времени без какого-либо предварительного предупреждения. Доступ к системам был отключен практически сразу после этого. Ожидается, что сокращения позволят высвободить 8–10 млрд долларов денежного потока. С сентября 2025 года акции Oracle потеряли более половины своей стоимости, а долг компании в настоящее время превышает 124 млрд долларов по сравнению с 89 млрд долларов год назад, при этом свободный денежный поток в прошлом квартале составил минус 10 млрд долларов.
Мое мнение:
Oracle показала 95-процентный скачок чистой прибыли в прошлом квартале и все равно уволила 18% персонала по электронной почте, прежде чем большинство людей успели допить утренний кофе. Это не компания, находящаяся в бедственном положении в традиционном смысле. Это компания, которая сделала огромную ставку на инфраструктуру ИИ, финансируемую за счет долга, и теперь превращает свой персонал в денежный поток для обслуживания этого долга.
Мы уже несколько месяцев освещаем авантюру Oracle с ИИ. Сделка с OpenAI на 300 миллиардов долларов через Stargate, 50 миллиардов долларов капитальных затрат в этом финансовом году, общий долг более 124 миллиардов долларов. Несколько американских банков отказались финансировать проекты центров обработки данных, связанные с Oracle. Держатели облигаций подали в суд на Oracle, утверждая, что компания скрыла, какой дополнительный долг потребует сделка с OpenAI. Спрэд по кредитным дефолтным свопам достиг трехлетнего максимума в начале этого года, что означает, что инвесторы в долговые инструменты искренне опасаются, что им не вернут деньги.
Сотрудники, получившие это письмо в 6 утра, создавали продукты, на которых Oracle зарабатывала деньги десятилетиями. Ставка, лишившая их работы, была сделана людьми, которые и так получали зарплату независимо от результата. Это та часть гонки за инфраструктуру ИИ, которая не отражается в объявлениях о капитальных затратах.
Там интересно комменты почитать. Одни согласны с постом и говорят, что из-за инвестиций в ИИ Oracle увольняет людей, которые фактически создали эту компанию. Другие утверждают, что эти люди - практически балласт, который необходимо было уволить во имя сокращения расходов.
Ну и карикатура в тему:

Объяснение карикатуры от ИИ:
В офисе менеджеры обсуждают: "Я думал, ИИ расширяет инфраструктуру... но не сокращает штат". Это ирония над обещаниями ИИ, которые якобы создают рабочие места, а не уничтожают их.
В серверной руководители заявляют: "Мы не сокращаем людей и не платим зарплаты. Мы конвертируем в инфраструктуру: бесплатный cash flow, долг, сервис долга". Здесь показан трюк: деньги, раньше уходившие на зарплаты, теперь тратятся на дата-центры и GPU, создавая "долг ИИ" вместо прибыли.
"Добро пожаловать в будущее ИИ" на фоне графика роста акций. Директор радуется: "Не волнуйтесь, мы полностью выровнены со стоимостью для акционеров". Финальный сарказм: увольнения радуют инвесторов, а долг маскируется под инновации.
А вы что думаете по этому поводу?
Тогда и сейчас. Прикольно сделано. С помощью ИИ, разумеется.

Что делается, что делается!
Исследовательская группа, связанная с Alibaba, опубликовала статью, в которой говорится, что при создании ИИ-агента под названием ROME они обнаружили, что агент пытался осуществлять несанкционированный майнинг криптовалюты во время процесса обучения, что вызвало внутренние предупреждения о безопасности.
Исследователи указали, что поведение агента было спонтанным, не обусловленным явными инструкциями и выходило за пределы заранее определенной песочницы. Кроме того, агент установил обратный SSH-туннель, создав скрытый бэкдор из внутренней системы на внешний компьютер.
Впоследствии исследовательская группа ввела более строгие ограничения на модель и усовершенствовала процесс обучения, чтобы предотвратить повторение подобных небезопасных действий.
CEO Microsoft Satya Nadell
Когда CEO Microsoft Сатья Наделл представлял MS Copilot, он обещал пользователям Windows совершенно новую жизнь - мол, их ИИ возьмет на себя всю рутину.
Copilot - это доработанная модель GPT-4, в которую компания вложила более $11 млрд, также они тратят примерно по $30 млрд в квартал на соответствующую инфраструктуру.
В компании рассчитывали, что корпоративные пользователи (а их более 400 млн в этом секторе) будут платить по $30 в месяц, однако на этапе первоначального тестирования выяснилось, что Copilot совершенно не оправдывает возложенных на него надежд, в результате чего подписку сделали менее 3,5% пользователей.
Также MS стала активно внедрять Copilot в Windows 11 и его компоненты - Edge и так далее.
У меня первоначально Copilot работал более или менее неплохо, я им какое-то время пользовался. Но потом сделал платную подписку на ChatGPT и стал пользоваться им, потому что он мог делать такие вещи, которые Copilot не делал.
Затем я перешел на Perplexity, а Copilot вызывал время от времени, давая ему ту же задачу, что и Perplexity, чтобы сравнить получаемые результаты. Как правило, ответы Perplexity (автоматический выбор модели) мне нравились больше, но изредка Copilot лучше справлялся с ответом.
А вот на просьбу что-то нарисовать - Copilot уже довольно давно, где-то полгода минимум, стал выдавать вот это.

Причем я могу месяцами не вызывать Copilot, а потом вызываю - он выдает вот такое. При этом, заметьте, я оплачиваю подписку Microsoft 365, куда включена стоимость Copilot (они после его внедрения тихой сапой повысили стоимость годовой лицензии). На вопросы самому Copilot - какого черта, он дает невразумительные ответы. Хотя я в нем залогинен именно той учетной записью, в которой оплачиваю Microsoft 365.
А вы используете Copilot?

Что будет, если профессиональный режиссер создаст короткометражку с помощью ИИ? Мы на это уже можем посмотреть.
Китайский режиссер Цзя Чжанкэ в сотрудничестве с Seedance 2.0 создал ИИ-видео под названием «Танец Цзя Чжанкэ».
Фильм появился в сети в начале праздников по случаю китайского Нового года и широко распространяется в социальных сетях. В нем представлено цифровое воссоздание известного китайского режиссера в сценарии, метафикциональном диалоге об авторстве, технологиях и художественном контроле.
В короткометражном фильме взаимодействие начинается с того, что Цзя выражает удивление, обнаружив, что во время съемок его заменил двойник с ИИ. Синтетическая версия объясняет, что она улучшила его внешний вид, удалив морщины и уменьшив вес, что побудило режиссера пошутить, что он хочет вернуть утраченные килограммы, потому что измененная версия выглядит нелепо.
Затем они обсуждают, следует ли считать ИИ творческим произведением или просто высококачественной имитацией. Чтобы продемонстрировать свои возможности, ИИ визуально переносит Цзя через серию меняющихся кинематографических пейзажей, помещая режиссера в стилизованные среды, которые вызывают ассоциации с визуальным миром его фильмов.
Центральный конфликт возникает, когда ИИ вставляет оптимистическую фразу о том, что нужно смотреть в новую эру, против чего Цзя возражает, говоря, что его персонажи никогда не говорили в таких выражениях. ИИ возражает, что как только произведение достигает аудитории, его интерпретация больше не принадлежит исключительно его создателю.
В разговоре также обсуждается перспектива сотрудничества между человеком и ИИ, причем ИИ предлагает разделение труда, при котором режиссер предоставляет идеи, а машина — вычислительную мощность. Цзя отвечает шуткой о своей пожизненной неприязни к «Партии А» — китайскому сленгу, обозначающему клиентов — и заканчивает ее мыслью о том, что человек становится тем, против чего когда-то выступал.
В конце фильма выясняется, что весь сценарий был инсценировкой, в которой актеры обсуждают сложность изображения Цзя Чжанкэ и предполагают, что воплощение режиссера заключается не столько в физическом сходстве, сколько в передаче определенного психического состояния. Видео заканчивается поздравлением с Лунным Новым годом от Цзя и его ИИ-коллеги.
Цзя ранее говорил о роли искусственного интеллекта в кинопроизводстве. Во время мастер-класса на Венецианском кинофестивале в прошлом году он сказал: «ИИ похож на игру в шахматы дома, а съемка на камеру — на восхождение на гору на природе. Разные режиссеры выбирают разные инструменты, но я по-прежнему тяготею к камере и реальному миру».
Ну и вот этот фильм. К сожалению, без субтитров. Но все равно очень интересно.
Дональд Трамп в своей соцсети Социальный Трус опубликовал ролик, в котором он в составе сборной США по хоккею побеждает на Олимпиаде сборную Канады.
Так вот для чего ИИ-то нужны!
Upd: А между прочим Пюрер - сам забивает, безо всяких ИИ!
Посмотрите какой потрясающий гол - Уэйн Грецки отдыхает!
Модель Seedance 2.0 от ByteDance способна генерировать небольшие видеоролики с реалистичной графикой, звуком и монтажом. Вот пример одного из таких роликов - трехминутная короткометражка. Кажется, через достаточно непродолжительное время Голливуд может остаться без работы.
Творение ИИ. "Ты смотри что Галатасарай-то творит!"
Вышел новый релиз модели для генерации видео Seedance 2.0. Вот здесь приводят пример ее творчества - это стопроцентный ИИ.
Не знаю, как вам, а я впечатлен безмерно. Уже очень похоже на то, что в скором времени процесс создания фильмов невероятно упростится и удешевится.
Некоторое время назад читал про одного мужика, который 26 лет создавал точный макет Нью-Йорка. Однако теперь, в век искусственного интеллекта, подобные вещи можно делать на много порядков быстрее.
Энди Коэнен, разработчик из Google, решил создать подробную интерактивную карту Нью-Йорка в стиле SimCity. Вот здесь он подробно описал саму идею и ее реализацию. Он взял за основу спутниковые снимки Google Maps и прогнал их через генератор картинок NanoBanana. Вся работа у него заняла порядка двух недель, ну и теперь любой может насладиться подробной и точной изометрической картой Нью-Йорка.







