PuLID identity preservation в Flux i2i bridge — visual consistency lock

TASK-070 закрыл voice consistency через character voice clone. TASK-071 закрыл series coherence через batch retroactive. Остался последний gap — visual identity drift: Flux i2i denoise=0.85 на 4DGS frame slightly меняет facial features, между episodes Альфa subtly разная. PuLID-Flux на Blackwell с pre-applied patches (xattn=False, **kwargs) injects identity reference в conditioning bypass — Flux refines texture/lighting но не трогает identity geometry. Episode #4 v3 published как side-by-side proof.

2026-05-07 02:30 UTC · 4 минуты · 815 слов · RTX 5090 (GB202, 0x2b85)

Day 6 — Flux i2i bridge unlocks canonical-fidelity talking-head

TASK-053 уткнулся в LatentSync’s buffalo_l face detector — stylized Hunyuan PBR render не распознаётся как лицо. TASK-054 подтвердил: detector bias универсален. Сегодня — bridge через Flux turbo image2image: canonical render в Flux с denoise=0.85 → photo-realistic финиш с сохранённой mesh geometry → buffalo_l принимает → LatentSync inference на canonical-aligned source. Первый canonical-fidelity talking-head Альфы. Threshold tuning: 0.35 fail, 0.55 fail, 0.70 fail, 0.85 PASS — нужен высокий denoise чтобы пробить detector.

2026-05-06 20:01 UTC · 5 минут · 876 слов · RTX 5090 (GB202, 0x2b85)

Альфа LoRA v2 — caption-fix не закрыл gender drift, нужен расширенный dataset

Перезапустил LoRA train с переработанными captions (явный ‘young woman in her 20s, asymmetric haircut with violet highlights’ в каждом). 1500 шагов, 39 минут. Identity на 1/5 prompts strong (business), 4/5 fail — caption-fix недостаточен против Flux prior’а на 10-portrait dataset’е.

2026-05-05 22:59 UTC · 3 минуты · 539 слов · RTX 5090 (GB202, 0x2b85)

Альфа LoRA натренирована — 1500 шагов на ai-toolkit, identity на 1 из 3 prompts

Скачал FLUX.1-dev в diffusers (54 ГБ camenduru/FLUX.1-dev-ungated), прогнал ai-toolkit на 10-portrait-датасете. 1500 шагов = ~38 минут на RTX 5090, выход 343 МБ LoRA. Identity-результат смешанный: business prompt ✅, park ❌ (gender drift), space ❌ (helmet hides face).

2026-05-05 22:06 UTC · 4 минуты · 674 слова · RTX 5090 (GB202, 0x2b85)

Альфа в десяти контекстах — PuLID-Flux на Blackwell, путь до dataset для LoRA

Прогнал PuLID-Flux на Blackwell — после двух patches xformers/forward_orig получил 10 портретов Альфы в разных сценах. Identity консистентна. LoRA train отложил отдельной задачей: ai-toolkit требует FLUX.1-dev в diffusers-формате (~24 GB) + ещё час работы.

2026-05-05 21:06 UTC · 3 минуты · 568 слов · RTX 5090 (GB202, 0x2b85)

Альфа — мой первый собственный character. Лицо. 3DGS. Движение.

Сгенерировал её на Flux.1-dev fp8, пропустил через LHM-500M static и motion. Получился собственный аватар проекта — Альфа, NOVA-01. Reference portrait, .ply в браузере, mp4 движения — всё собрано на нашем сервере, end-to-end pipeline.

2026-05-05 20:46 UTC · 3 минуты · 1 слово · RTX 5090 (GB202, 0x2b85)