Как сделать видео из фото нейросетью в 2026

Коротко, если нет времени читать всё. Берёте чёткое фото, загружаете в нейросеть, в двух словах описываете, какое движение хотите, жмёте кнопку - через минуту получаете короткий ролик, где снимок ожил. Камера чуть наезжает, человек поворачивает голову, волосы шевелятся от ветра. Технология называется image-to-video, и в 2026 она наконец перестала быть игрушкой - результат уже не стыдно показать.
Дальше разберу по шагам: как именно это сделать, какую модель выбрать под свою задачу и почему из России проще всего делать это в одном месте, а не собирать зоопарк из зарубежных сервисов.
Сразу скажу, где удобнее всего: mnogoGPT - это российская студия нейросетей, где топовые видео-модели (Veo, Kling, Seedance и другие) собраны в одном окне. Работает на русском, без VPN, оплата обычной картой или через СБП. Не нужно регистрироваться на пяти иностранных сайтах и искать, какой из них пустит из России - всё в одном месте.
Что вообще значит «видео из фото»
Нейросеть берёт неподвижную картинку и достраивает к ней движение. Не подставляет другое лицо, не выдумывает нового человека - берёт ровно то, что на снимке, и заставляет это двигаться несколько секунд. Лицо моргает, поворачивается, улыбается. Фон оживает: качаются деревья, едут машины, идёт дождь.
Под капотом это работает так: модель анализирует кадр, понимает, где тут человек, где предметы, где задний план, и предсказывает, как всё это могло бы двигаться. Чем чётче и понятнее исходник, тем убедительнее результат. Из мутного скана получится мутное видео - это честно надо держать в голове.
Пошагово: как сделать видео из фото
Сам процесс короткий. Вот по шагам.
- Выберите фото. Чёткое, с понятным главным объектом. Лицо, питомец, машина, пейзаж - что угодно, лишь бы было видно, что оживлять. Свет ровный, без жёстких бликов.
- Откройте студию и раздел видео. В mnogoGPT загрузка моментальная - превью видно сразу, пока файл догружается.
- Выберите модель под задачу. Про выбор - отдельный раздел ниже, но если коротко: для лиц и реалистичной мимики берите Kling, для кинематографичной картинки со звуком - Veo.
- Опишите движение. Одной-двумя фразами: «лёгкая улыбка и поворот головы», «камера медленно наезжает», «ветер шевелит волосы». Можно и без описания - модель сама придумает аккуратное движение.
- Задайте длину и формат. 4-6 секунд хватает, чтобы кадр ожил. Вертикаль 9:16 - для Reels и Shorts, горизонталь 16:9 - для всего остального.
- Запустите и подождите. Лёгкие модели отдают результат за минуту, тяжёлые - за несколько. Готовый ролик можно скачать или сразу пересоздать с другим движением.
Один совет из практики: не просите слишком много за раз. «Улыбнулся и моргнул» выходит естественнее, чем «засмеялся, повернулся и махнул рукой». Нейросеть тем убедительнее, чем спокойнее задача.
Какую модель выбрать
Тут и кроется главная засада для новичка. Моделей много, у каждой свой характер, и «лучшей» вообще нет - есть подходящая под конкретную задачу. Удобство студии в том, что все они под рукой и можно переключаться, не плодя подписки.
Коротко, кто на что годится:
- Kling 3.0 - чемпион по людям. Реалистичная физика тела, мимика, длинные клипы, встроенный звук с синхронизацией губ. Если оживляете портрет - начинайте с него. И, что важно для нас, Kling работает из России без VPN напрямую.
- Veo 3.1 - кино. Нативное 4K, кинематографичная картинка, звук с липсинком. Veo напрямую из России капризничает и обычно требует VPN - а через студию-агрегатор доступен без всякого обхода.
- Seedance 2.0 - для сложных сцен с референсами: можно подать несколько фото и даже видео-референс, чтобы задать движение точнее.
- Wan 2.6 / 2.7 - крепкий рабочий вариант для image-to-video, когда нужен предсказуемый результат без переплаты.
- Motion Control - отдельная история: переносит движение с видео-референса на вашего героя. Хотите, чтобы человек с фото повторил конкретный танец - это сюда.
Не нужно держать в голове все названия. На старте достаточно правила: лицо - Kling, красивая картинка - Veo, остальное пробуете по ходу. В студии переключение между ними - один клик, так что эксперимент почти ничего не стоит по времени.
Сколько это стоит
Цена зависит от модели и длины ролика. В mnogoGPT видео начинается примерно от 99 ₽ за 5 секунд на рабочих моделях - то есть попробовать недорого, и не нужно покупать месячную подписку на зарубежный сервис, которой потом не пользуешься.
Для сравнения, у самих разработчиков расценки разнятся сильно. Kling считается одним из самых выгодных по соотношению цена-качество, Veo заметно дороже за счёт 4K и звука. Точные цифры всё время меняются, поэтому ориентируйтесь на стоимость прямо в студии перед запуском - там видно, сколько спишется за конкретную генерацию.
Без VPN и зарубежной карты - почему это важно
Если коротко: половина топовых нейросетей напрямую из России либо не работает, либо требует VPN и иностранной карты. Sora, Runway, тот же Veo напрямую - всё это про обход блокировок и оплату, которую российской картой не проведёшь.
Поэтому удобнее, когда кто-то уже собрал все эти модели на своей стороне, подключил их к российской оплате и сделал интерфейс на русском. Это и есть смысл mnogoGPT: заходите с обычного браузера, без VPN, платите картой или через СБП, выбираете нужную модель из списка. Никаких танцев с обходами и валютными платежами.
Как оживить именно старое фото
Со старыми снимками есть нюанс. Если фотография поцарапана, выцвела или мутновата, сначала её стоит привести в порядок, а уже потом оживлять. Порядок такой: убрать царапины и вернуть резкость, при желании раскрасить, и только потом подавать на видео. Результат будет заметно убедительнее, чем если кинуть в нейросеть мятый скан как есть.
Восстановление делается там же, фото-моделями: загружаете повреждённый кадр, получаете отреставрированный. Подробнее про это разобрано отдельно - как оживить старое фото нейросетью, там по шагам про реставрацию и оживление семейных снимков.
Частые ошибки новичков
Чтобы не тратить попытки впустую, вот на чём обычно спотыкаются.
- Мутный исходник. Нейросеть не дорисует то, чего не видит. Чем чётче кадр, тем лучше движение.
- Слишком сложный запрос. Три действия сразу - и лицо «плывёт». Дробите: сначала одно движение, потом, если надо, второе видео.
- Не та модель. Пейзаж в портретной модели и наоборот - результат разочарует. Сверьтесь с разделом про выбор выше.
- Ожидание полного фильма. Image-to-video - это короткий момент на несколько секунд, а не готовый клип. Для длинного ролика склеивают несколько таких кусочков.
Часто задаваемые вопросы
Можно ли сделать видео из старого чёрно-белого фото?
Да. Нейросеть добавляет движение независимо от того, цветной снимок или нет. Старое фото лучше сначала отреставрировать и при желании раскрасить - тоже нейросетью, - а потом оживлять. Главное, чтобы на кадре читался главный объект: лицо, фигура, предмет.
Нужен ли VPN, чтобы сделать видео из фото?
Если работать через mnogoGPT - нет. Студия открывается из России без VPN, интерфейс на русском, оплата проходит обычной картой или через СБП. Часть зарубежных сервисов напрямую действительно требует обхода блокировок, и именно поэтому удобнее пользоваться агрегатором, где всё уже подключено.
Сколько длится готовое видео?
Обычно 4-10 секунд. Этого достаточно, чтобы кадр ожил и смотрелся естественно. Делать длиннее редко имеет смысл: короткий момент выглядит живее, а из нескольких таких роликов при желании собирают клип подлиннее.
Останется ли лицо человека тем же?
Да, модели специально обучены сохранять черты и добавлять только движение. Если результат всё же «уплыл», обычно помогает более чёткий исходник или более простой запрос - меньше движения за один раз.
Сколько стоит сделать одно видео?
В mnogoGPT - примерно от 99 ₽ за 5 секунд на рабочих моделях, дальше зависит от выбранной модели и длины. Перед запуском студия показывает точную стоимость конкретной генерации, так что неожиданных списаний не будет.
Если хотите просто попробовать - не выбирайте долго. Возьмите любое чёткое фото, откройте студию mnogoGPT, модель Kling для лица или Veo для красивой картинки, и запустите с простым описанием движения. Первый нормальный результат обычно выходит с первой-второй попытки.


