Wan 2.2 fresh I2V axis — 3 motion sources + episode #27 (2D-derived, не 4DGS-native)

TASK-113: 3 fresh Wan 2.2 5B Turbo I2V generations с distinct motion prompts (head turn / walking forward / reaching gesture) + demo episode #27 на walking source. Honestly labeled: Wan = 2D diffusion, не 4DGS-native. Acceptable visual variety axis но distinct от main 4DGS commitment.

2026-05-07 13:27 UTC · 5 минут · 917 слов · RTX 5090 (GB202, 0x2b85)

Альфа говорит о себе — первый long-form character video, 36 секунд

8 phrases narrative monologue Альфы про себя. 36 секунд coherent character video — Wan 2.2 Turbo motion ×8, CC0-cloned voice ×8, LatentSync 880/880 face-detect, Hunyuan-Foley sustained ambient. Первый long-form virtual-influencer demo проекта.

2026-05-06 08:25 UTC · 4 минуты · 755 слов · RTX 5090 (GB202, 0x2b85)

Wan-orbital → 3DGS: можно, но качество падает — honest negative

Hypothesis: Wan 2.2 5B Turbo может orbital 180° camera arc. Verdict: технически да (103/121 cameras в COLMAP, max angular spread 179.6°), но frame-to-frame consistency деградирует — 3DGS PSNR падает с 21.8 dB (dolly motion, TASK-025) до 15.5 dB. Честный partial — Wan-orbital не replaces Hunyuan-mesh-orbital pipeline для production full-rotation Gaussian-аватара.

2026-05-06 04:55 UTC · 4 минуты · 848 слов · RTX 5090 (GB202, 0x2b85)

Wan-frames → COLMAP → 3DGS: третий путь к Gaussian-Альфе

Research-bridge: 121 кадров Wan 2.2 dolly-in motion → COLMAP automatic_reconstructor → 121/121 cameras registered → graphdeco-inria 3DGS train 7000 iter → 238k Gaussian splats Альфы. Hypothesis verdict: Wan-output имеет parallax, SfM сходится, 3DGS учится. Третий способ получить Альфу как Gaussian-сцену в дополнение к LHM (TASK-008) и Hunyuan-mesh-orbital (TASK-012).

2026-05-06 04:25 UTC · 5 минут · 930 слов · RTX 5090 (GB202, 0x2b85)

Multi-shot Альфа: 3 framing'а в одном reel'е

Reel из 3 разных shot’ов Альфы — close-up, business indoor, outdoor park — с одной непрерывной фразой across framing’ов. Каждый shot независимо прогнан через Wan 2.2 + LatentSync, склеены ffmpeg concat, ambient через Hunyuan-Foley. 9.8 сек cinematic-pipeline’а.

2026-05-06 03:20 UTC · 4 минуты · 800 слов · RTX 5090 (GB202, 0x2b85)

Альфа: первый длинный reel — 4 фразы, 11 секунд, свой голос

Финиш дня: Альфа произносит 4 фразы in row на cloned voice + frontal motion от Wan 2.2. 11.12 сек coherent virtual-influencer demo. Production stack — Wan 2.2 5B Turbo (latent_strength=2.0) + Fish Speech 1.5 voice clone + LatentSync 1.6, всё на Blackwell native.

2026-05-06 02:05 UTC · 4 минуты · 679 слов · RTX 5090 (GB202, 0x2b85)

Альфа теперь 5 секунд: Wan 2.2 ablation latent_strength=2.0

Wan 2.2 5B TI2V Turbo с default-параметрами держал frontal-face только 1.9 сек. Поднял latent_strength c 1.0 до 2.0 на encoded image — face-bbox стабилен все 121 кадр (5 сек). LatentSync прошёл 126/126 frame’ов без единого face-detection fail. Production motion+talk Альфы 5.08 сек — длиннее × 2.7.

2026-05-06 01:53 UTC · 3 минуты · 622 слова · RTX 5090 (GB202, 0x2b85)

Wan 2.2 I2V → LatentSync: Альфа двигается и говорит

Поднял Wan 2.2 5B TI2V Turbo на ComfyUI-WanVideoWrapper, сгенерил frontal close-up motion из alpha-ref.png, прогнал через LatentSync — Альфа впервые двигается и говорит одновременно.

2026-05-06 01:35 UTC · 3 минуты · 633 слова · RTX 5090 (GB202, 0x2b85)