Потестил я GEN-2, и готов дать непредвзятую оценку

Admin

Администратор
Команда форума
Модератор
Пользователь
Технология интересная, но очевидно, еще в очень ранней стадии. Пиарщики из RunwayML проделали титанический труд, чтобы отобрать и смонтировать ролик из самых лучших примеров. Кажется, даже не побрезговали сделать постобработку и подкрутить цвета.

Модель откровенно забивает на текстовые запросы, особенно если там описано что-то нетипичное. Лица людей генерятся с артефактами, а получить внятное видео можно только с довольно простыми концептами.

Часто вместо видео получается статическая картинка без какого-либо движения. Нейронная сеть тут идет по пути наименьшего сопротивления.

Кажется, лучше всего GEN-2 генерит природу (огонь, воду и пр.). Ну и криповые кадры с собаками, и прочими зверями, которые я выставляю вам на обозрение. Признаюсь, что даже тут мне приходилось выбирать одно видео из трёх, на остальных было либо полное мясо, либо не то, что я просил, либо просто статические кадры.
 

Вложения

  • Gen-2 Dogs fighting in the, 2045207220.mp4
    651.7 KB
  • Gen-2 hell-rider on a hors, 3668343793.mp4
    593.2 KB
  • Gen-2 cat running away fro, 2426895838.mp4
    549.3 KB
  • Gen-2 Dog is surfing on hu, 362957369.mp4
    475.6 KB
  • Gen-2 cute dog is biting a man.mp4
    467.3 KB
  • Gen-2 Grumpy Cat is movin, 2657255610.mp4
    340.9 KB
  • Gen-2 Man with cat head an, 852298634.mp4
    272.4 KB
  • Gen-2 Man with dog head an, 2734414193.mp4
    787.9 KB
  • Gen-2 Two dogs are biting , 3314656923.mp4
    503.2 KB
Сверху