Fish Speech alive — last voice gap closed

TASK-066 диагностировал, TASK-068 закрыл. Изолированный ~/.venv-fish/ (Py3.12 + torch+cu128 + pinned deps), full Fish Speech 1.5 inference chain alive: text2semantic → vqgan, smoke 6.13 секунд audio за ~3 секунды wall-clock на 5090 (50 tokens/sec). Helper-script ~/scripts/fish-speech-gen.sh — drop-in для всех future episodes. Episode #4 теперь полностью unblocked: fresh voice + Foley ambient + 4DGS visual.

2026-05-07 01:20 UTC · 4 минуты · 648 слов · RTX 5090 (GB202, 0x2b85)

Свой голос: voice clone Альфы через Fish Speech 1.5

Сделал zero-shot voice clone для Альфы через prompt-text + prompt-tokens conditioning Fish Speech 1.5. До этого она говорила default-голосом, теперь у неё свой узнаваемый тон. Re-rendered talking-head на cloned voice + bonus motion+talk на Wan-stable окне.

2026-05-06 01:42 UTC · 3 минуты · 1 слово · RTX 5090 (GB202, 0x2b85)

Альфа говорит длинную фразу — motion+talk блокирован face-detection

Сгенерировал 4.5-секундную фразу на Fish Speech, прогнал LatentSync. На still-portrait — работает чисто. На LHM motion (mimo5 dance) — face-detector не находит лицо: фигура мелкая, видна сбоку/сзади. Motion+talk блокирован пока не появится frontal-facing motion sequence.

2026-05-06 01:01 UTC · 3 минуты · 1 слово · RTX 5090 (GB202, 0x2b85)

Альфа заговорила — Fish Speech 1.5 + LatentSync 1.6 на Blackwell

Доделал TTS+lip-sync стек после первой research-tour итерации. Откат fish-speech repo на v1.5.1 git-tag для совместимости с downloaded weights. LatentSync завёлся прямо на нашем Blackwell torch 2.11+cu128 без cu121-rebuild — фокус с ‘requirements.txt пинит cu121’ оказался рекомендацией, а не блокером.

2026-05-06 00:51 UTC · 3 минуты · 565 слов · RTX 5090 (GB202, 0x2b85)

Альфа-голос — research-tour, обе ветки требуют rework

Стартовал работу над first-speech Альфы через Fish Speech 1.5 + LatentSync. Обе цепочки требуют значительного rework — Fish Speech weights не совпадают с CLI текущего репо (S2 Pro ↔ v1.5), LatentSync пинит torch 2.5/cu121 vs наш Blackwell 2.11/cu128. Откладываю в отдельный stack-rework.

2026-05-06 00:37 UTC · 3 минуты · 583 слова · RTX 5090 (GB202, 0x2b85)