Новости

Google представила Gemini Omni — новый ИИ, который создаёт видео из чего угодно и редактирует их как по волшебству

|Автор: Вячеслав Васипенок|3 мин чтения| 55
Google представила Gemini Omni — новый ИИ, который создаёт видео из чего угодно и редактирует их как по волшебству

Google DeepMind сделал значительный прорыв в мультимодальном ИИ. После успешного запуска Nano Banana, который уже помог миллионам людей восстанавливать старые фотографии, создавать изображения по скетчам и визуализировать идеи, компания представила Gemini Omni — новую семью моделей, где мощный интеллект и рассуждения Gemini соединились с настоящим творчеством.

Мы построили Gemini как нативно мультимодальную модель с самого начала. Теперь мы делаем следующий большой шаг, — заявил Koray Kavukcuoglu, CTO Google DeepMind.

Первая модель семейства — Gemini Omni Flash — уже доступна пользователям.

Что умеет Gemini Omni FlashGemini Omni

Это не просто генератор видео. Omni может принимать любой тип ввода — видео, изображения, аудио и текст — и создавать на их основе высококачественные ролики, которые опираются на реальные знания Gemini о мире.

Главные возможности:

  • Редактирование видео через обычный разговор

Вы просто пишете или говорите, что хотите изменить. Каждое следующее указание продолжает предыдущее. Персонажи остаются узнаваемыми, физика работает корректно, сцена «помнит» всё, что было раньше.

Примеры:

  • «Сделай скульптуру из пузырей»
  • «Когда человек касается зеркала, пусть оно заколыхается как жидкость, а его рука превратится в зеркальный материал»
  • «Добавь анимированные эффекты, вылетающие из скейтборда»
  • Понимание физики и реального мира

Omni отлично справляется с гравитацией, кинетической энергией, жидкостями и сложными взаимодействиями. Благодаря знаниям Gemini модель создаёт не просто красивую картинку, а осмысленные сцены с правильной логикой.

  • Создание видео из нескольких источников одновременно

Можно загрузить своё видео, photo персонажа, аудиодорожку и текст — и получить цельный ролик. Например:

  • Преобразовать обычную съёмку в retro-futuristic стиль с соответствующей музыкой.
  • Сделать sci-fi видео, синхронизированное с битами загруженной музыки.
  • Цифровой аватар

На старте можно создавать видео, где вы сами говорите своим голосом и выглядите как в реальной жизни (с некоторыми ответственными ограничениями).

Все сгенерированные видео автоматически получают невидимый водяной знак SynthID, который можно проверить в приложении Gemini, Chrome и Google Поиске.

Примеры использованияGemini Omni

  • Claymation-видео, объясняющее сворачивание белка.
  • Алфавит, где каждую букву представляет необычный предмет (Capybara для C, disco globe для D и т.д.).
  • Превращение обычной прогулки в постепенно меняющийся retro-futuristic мир.
  • Сложные объясняющие видео за считанные секунды.

Где уже можно попробовать

Gemini Omni Flash уже доступен:

  • Всем подписчикам Google AI Plus, Pro и Ultra — в приложении Gemini и Google Flow.
  • Бесплатно — в YouTube Shorts и приложении YouTube Create.

В ближайшие недели модель появится для разработчиков и компаний через API. В будущем Omni будет поддерживать генерацию изображений и аудио.

Также читать:

Stilta подняла $10,5 млн от a16z и YC, чтобы помочь компаниям «вспомнить» о забытых патентах

Солнечная энергия захватит мир к 2035 году, но ИИ-центры данных спасут газ и уголь

Поделиться:
0