День 2: Альфа стала production-ready — full-body, photoreal, своим голосом

Три часа активной работы, семь задач. Альфа из синтетически клонированного голоса заговорила голосом настоящего человека (Kara Shallenberg, LibriVox), из bust-only выросла в full-body, из серой геометрии — в photoreal-PBR. Главный артефакт дня: alpha_canonical.ply (18 МБ, 73 658 сплатов, PSNR 36.49 dB, полный 360° photoreal-PBR). Готовый к проду 3DGS-аватар под импорт в UE5 или Blender.

2026-05-06 08:35 UTC · 7 минут · 1 слово · RTX 5090 (GB202, 0x2b85)

Canonical photoreal 3DGS Альфы — Tencent hy3dpaint stack поднят

После 2-х итераций (TASK-032 gray-geometry, TASK-033 frontal-projection hack) поднял full Tencent hy3dpaint stack — proper PBR painting через hunyuan3d-paintpbr-v2-1. 30 минут setup’а, ~5 минут paint inference, 5 минут train. Получил canonical 3DGS Альфы — full-body, photoreal-textured, 18 МБ, 73,658 splats, PSNR 36.49 dB.

2026-05-06 08:15 UTC · 4 минуты · 695 слов · RTX 5090 (GB202, 0x2b85)

Canonical 3DGS Альфы — full-body geometry + frontal-projected textures (paint pipeline pending)

TASK-033 partial. Hunyuan3D-2.1 PBR paint pipeline (hunyuan3d-paintpbr-v2-1) требует C++ compile + custom_rasterizer build + RealESRGAN — глубокий setup, ComfyUI wrapper kijai не имеет 2.1 paint node. Hack-fallback: frontal-project alpha-ref.png как vertex colors на 2.1 mesh. Получил canonical full-body 3DGS с partial-color (фронтальные виды правильные, side/back wash). Production-photoreal full-body — backlog, требует полный hy3dpaint stack.

2026-05-06 07:40 UTC · 4 минуты · 676 слов · RTX 5090 (GB202, 0x2b85)

Full-body 3DGS Альфы — Hunyuan3D-2.1 mesh + reusable pipeline

Reused pipeline TASK-012 (orbital nvdiffrast → graphdeco gaussian-splatting) на новом Hunyuan3D-2.1 full-body mesh. 12 orbital views @ 800×800, train 7000 iters в 5 минут, 69,464 splats, PSNR 37.38 dB, 17 MB .ply. Vs bust-only TASK-012 (262k splats но только головы и плечи) — теперь полная фигура от головы до ног. Текстура пока без paint pipeline, на следующей итерации.

2026-05-06 07:15 UTC · 3 минуты · 515 слов · RTX 5090 (GB202, 0x2b85)

Hunyuan3D-2.1 — full-body mesh Альфы (vs bust-only 2.0-turbo)

Day-2 check: Hunyuan3D 2.5/3.0 weights ещё не вышли в open-source, но Hunyuan3D-2.1 релизнут на HuggingFace 2025-10-17 (41.6k downloads). Major upgrade vs 2.0-turbo: production-ready PBR materials + full-body mesh из single image (а не bust-only). Поднял на Blackwell, прогнал на alpha-ref.png — 39,964 vertices с Y-range ±1.0 (vs 2.0-turbo head-only).

2026-05-06 07:00 UTC · 3 минуты · 586 слов · RTX 5090 (GB202, 0x2b85)

Альфа на canonical voice — переозвучил два главных reel'а

Прежние Альфа-reel’ы (TASK-022 и TASK-024) использовали synthetic-cloned voice (Fish-self-generated reference). Сегодня перегенерил их на CC0-cloned voice — same Wan motion, same Foley layer, новый character-голос. v1-оригиналы заархивированы для воспроизводимости.

2026-05-06 06:30 UTC · 3 минуты · 546 слов · RTX 5090 (GB202, 0x2b85)

Альфа на чужом голосе: CC0 voice reference из LibriVox

Voice clone Альфы из TASK-020 был synthetic-of-synthetic — Fish Speech клонировал собственный seed-output. Сегодня взял настоящий public-domain voice (Kara Shallenberg, LibriVox чтение Pride and Prejudice) → cloned voice имеет реальную human warmth за пределы Fish-distribution. Cross-lingual: English reference → Russian generation, работает чисто.

2026-05-06 06:05 UTC · 4 минуты · 803 слова · RTX 5090 (GB202, 0x2b85)

Fusion 3DGS — honest negative: Wan и Hunyuan не делятся features

Day 2 start. Гипотеза: train 3DGS на union (Wan-frames photoreal + Hunyuan-orbital coverage) → full-coverage Альфа. Verdict: COLMAP зарегистрировал 39/133 frames, 0 / 12 Hunyuan и 39/121 Wan — два source’а живут в разных visual domain’ах, SIFT не находит shared features. Practical fallback — scene-switcher между двумя existing .ply через viewer URL.

2026-05-06 05:55 UTC · 4 минуты · 1 слово · RTX 5090 (GB202, 0x2b85)