Как сделать видео из фото нейросетью в 2026

Анна Северова, нейро-художник · 9 мин чтения · 8 июня 2026

Как оживить фото и сделать из него видео нейросетью

Коротко, если нет времени читать всё. Берёте чёткое фото, загружаете в нейросеть, в двух словах описываете, какое движение хотите, жмёте кнопку - через минуту получаете короткий ролик, где снимок ожил. Камера чуть наезжает, человек поворачивает голову, волосы шевелятся от ветра. Технология называется image-to-video, и в 2026 она наконец перестала быть игрушкой - результат уже не стыдно показать.

Дальше разберу по шагам: как именно это сделать, какую модель выбрать под свою задачу и почему из России проще всего делать это в одном месте, а не собирать зоопарк из зарубежных сервисов.

Сразу скажу, где удобнее всего: mnogoGPT - это российская студия нейросетей, где топовые видео-модели (Veo, Kling, Seedance и другие) собраны в одном окне. Работает на русском, без VPN, оплата обычной картой или через СБП. Не нужно регистрироваться на пяти иностранных сайтах и искать, какой из них пустит из России - всё в одном месте.

Что вообще значит «видео из фото»

Нейросеть берёт неподвижную картинку и достраивает к ней движение. Не подставляет другое лицо, не выдумывает нового человека - берёт ровно то, что на снимке, и заставляет это двигаться несколько секунд. Лицо моргает, поворачивается, улыбается. Фон оживает: качаются деревья, едут машины, идёт дождь.

Под капотом это работает так: модель анализирует кадр, понимает, где тут человек, где предметы, где задний план, и предсказывает, как всё это могло бы двигаться. Чем чётче и понятнее исходник, тем убедительнее результат. Из мутного скана получится мутное видео - это честно надо держать в голове.

Пошагово: как сделать видео из фото

Сам процесс короткий. Вот по шагам.

Выберите фото. Чёткое, с понятным главным объектом. Лицо, питомец, машина, пейзаж - что угодно, лишь бы было видно, что оживлять. Свет ровный, без жёстких бликов.
Откройте студию и раздел видео. В mnogoGPT загрузка моментальная - превью видно сразу, пока файл догружается.
Выберите модель под задачу. Про выбор - отдельный раздел ниже, но если коротко: для лиц и реалистичной мимики берите Kling, для кинематографичной картинки со звуком - Veo.
Опишите движение. Одной-двумя фразами: «лёгкая улыбка и поворот головы», «камера медленно наезжает», «ветер шевелит волосы». Можно и без описания - модель сама придумает аккуратное движение.
Задайте длину и формат. 4-6 секунд хватает, чтобы кадр ожил. Вертикаль 9:16 - для Reels и Shorts, горизонталь 16:9 - для всего остального.
Запустите и подождите. Лёгкие модели отдают результат за минуту, тяжёлые - за несколько. Готовый ролик можно скачать или сразу пересоздать с другим движением.

Один совет из практики: не просите слишком много за раз. «Улыбнулся и моргнул» выходит естественнее, чем «засмеялся, повернулся и махнул рукой». Нейросеть тем убедительнее, чем спокойнее задача.

Какую модель выбрать

Тут и кроется главная засада для новичка. Моделей много, у каждой свой характер, и «лучшей» вообще нет - есть подходящая под конкретную задачу. Удобство студии в том, что все они под рукой и можно переключаться, не плодя подписки.

Коротко, кто на что годится:

Kling 3.0 - чемпион по людям. Реалистичная физика тела, мимика, длинные клипы, встроенный звук с синхронизацией губ. Если оживляете портрет - начинайте с него. И, что важно для нас, Kling работает из России без VPN напрямую.
Veo 3.1 - кино. Нативное 4K, кинематографичная картинка, звук с липсинком. Veo напрямую из России капризничает и обычно требует VPN - а через студию-агрегатор доступен без всякого обхода.
Seedance 2.0 - для сложных сцен с референсами: можно подать несколько фото и даже видео-референс, чтобы задать движение точнее.
Wan 2.6 / 2.7 - крепкий рабочий вариант для image-to-video, когда нужен предсказуемый результат без переплаты.
Motion Control - отдельная история: переносит движение с видео-референса на вашего героя. Хотите, чтобы человек с фото повторил конкретный танец - это сюда.

Не нужно держать в голове все названия. На старте достаточно правила: лицо - Kling, красивая картинка - Veo, остальное пробуете по ходу. В студии переключение между ними - один клик, так что эксперимент почти ничего не стоит по времени.

Сколько это стоит

Цена зависит от модели и длины ролика. В mnogoGPT видео начинается примерно от 99 ₽ за 5 секунд на рабочих моделях - то есть попробовать недорого, и не нужно покупать месячную подписку на зарубежный сервис, которой потом не пользуешься.

Для сравнения, у самих разработчиков расценки разнятся сильно. Kling считается одним из самых выгодных по соотношению цена-качество, Veo заметно дороже за счёт 4K и звука. Точные цифры всё время меняются, поэтому ориентируйтесь на стоимость прямо в студии перед запуском - там видно, сколько спишется за конкретную генерацию.

Без VPN и зарубежной карты - почему это важно

Если коротко: половина топовых нейросетей напрямую из России либо не работает, либо требует VPN и иностранной карты. Sora, Runway, тот же Veo напрямую - всё это про обход блокировок и оплату, которую российской картой не проведёшь.

Поэтому удобнее, когда кто-то уже собрал все эти модели на своей стороне, подключил их к российской оплате и сделал интерфейс на русском. Это и есть смысл mnogoGPT: заходите с обычного браузера, без VPN, платите картой или через СБП, выбираете нужную модель из списка. Никаких танцев с обходами и валютными платежами.

Как оживить именно старое фото

Со старыми снимками есть нюанс. Если фотография поцарапана, выцвела или мутновата, сначала её стоит привести в порядок, а уже потом оживлять. Порядок такой: убрать царапины и вернуть резкость, при желании раскрасить, и только потом подавать на видео. Результат будет заметно убедительнее, чем если кинуть в нейросеть мятый скан как есть.

Восстановление делается там же, фото-моделями: загружаете повреждённый кадр, получаете отреставрированный. Подробнее про это разобрано отдельно - как оживить старое фото нейросетью, там по шагам про реставрацию и оживление семейных снимков.

Частые ошибки новичков

Чтобы не тратить попытки впустую, вот на чём обычно спотыкаются.

Мутный исходник. Нейросеть не дорисует то, чего не видит. Чем чётче кадр, тем лучше движение.
Слишком сложный запрос. Три действия сразу - и лицо «плывёт». Дробите: сначала одно движение, потом, если надо, второе видео.
Не та модель. Пейзаж в портретной модели и наоборот - результат разочарует. Сверьтесь с разделом про выбор выше.
Ожидание полного фильма. Image-to-video - это короткий момент на несколько секунд, а не готовый клип. Для длинного ролика склеивают несколько таких кусочков.

Часто задаваемые вопросы

Можно ли сделать видео из старого чёрно-белого фото?

Да. Нейросеть добавляет движение независимо от того, цветной снимок или нет. Старое фото лучше сначала отреставрировать и при желании раскрасить - тоже нейросетью, - а потом оживлять. Главное, чтобы на кадре читался главный объект: лицо, фигура, предмет.

Нужен ли VPN, чтобы сделать видео из фото?

Если работать через mnogoGPT - нет. Студия открывается из России без VPN, интерфейс на русском, оплата проходит обычной картой или через СБП. Часть зарубежных сервисов напрямую действительно требует обхода блокировок, и именно поэтому удобнее пользоваться агрегатором, где всё уже подключено.

Сколько длится готовое видео?

Обычно 4-10 секунд. Этого достаточно, чтобы кадр ожил и смотрелся естественно. Делать длиннее редко имеет смысл: короткий момент выглядит живее, а из нескольких таких роликов при желании собирают клип подлиннее.

Останется ли лицо человека тем же?

Да, модели специально обучены сохранять черты и добавлять только движение. Если результат всё же «уплыл», обычно помогает более чёткий исходник или более простой запрос - меньше движения за один раз.

Сколько стоит сделать одно видео?

В mnogoGPT - примерно от 99 ₽ за 5 секунд на рабочих моделях, дальше зависит от выбранной модели и длины. Перед запуском студия показывает точную стоимость конкретной генерации, так что неожиданных списаний не будет.

Если хотите просто попробовать - не выбирайте долго. Возьмите любое чёткое фото, откройте студию mnogoGPT, модель Kling для лица или Veo для красивой картинки, и запустите с простым описанием движения. Первый нормальный результат обычно выходит с первой-второй попытки.

Открыть студию mnogoGPT →