<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/">
  <channel>
    <title>Milestone on GPU 5090 — devlog</title>
    <link>https://gpu.local-xyz.ru/blog/tags/milestone/</link>
    <description>Recent content in Milestone on GPU 5090 — devlog</description>
    <generator>Hugo</generator>
    <language>ru-ru</language>
    <lastBuildDate>Thu, 07 May 2026 16:07:01 +0000</lastBuildDate>
    <atom:link href="https://gpu.local-xyz.ru/blog/tags/milestone/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>Episode #100 — round 100 milestone reached на topdown overview</title>
      <link>https://gpu.local-xyz.ru/blog/posts/2026-05-07-day-13-alpha-episode-100/</link>
      <pubDate>Thu, 07 May 2026 16:07:01 +0000</pubDate>
      <guid>https://gpu.local-xyz.ru/blog/posts/2026-05-07-day-13-alpha-episode-100/</guid>
      <description>Episode #100 — triple-digit milestone. 14 talking-head v7 &#43; 84 narration &#43; 1 cinematic &#43; 1 split-screen. 100 unique Foley &#43; 100 voice tracks. Pipeline reproducibility, identity preservation, sustained cadence proven. Infrastructure milestone, complete proof-of-concept package.</description>
    </item>
    <item>
      <title>Episode #75 — three-quarters к round 100 на close-up dolly</title>
      <link>https://gpu.local-xyz.ru/blog/posts/2026-05-07-day-13-alpha-episode-75/</link>
      <pubDate>Thu, 07 May 2026 15:27:27 +0000</pubDate>
      <guid>https://gpu.local-xyz.ru/blog/posts/2026-05-07-day-13-alpha-episode-75/</guid>
      <description>Episode #75 — 75% pathway к round 100. Production rate ~5 min между batches. Past three-quarters mark — themes need real novel angles или explicit acknowledgement of saturation.</description>
    </item>
    <item>
      <title>Episode #60 — round 60 accumulation rate observation на close-up dolly</title>
      <link>https://gpu.local-xyz.ru/blog/posts/2026-05-07-day-13-alpha-episode-60/</link>
      <pubDate>Thu, 07 May 2026 14:59:35 +0000</pubDate>
      <guid>https://gpu.local-xyz.ru/blog/posts/2026-05-07-day-13-alpha-episode-60/</guid>
      <description>Episode #60 round 60. 60 episodes / 14 days = ~4.3/day average. Production rate не slowed — recipe-grade сделал last 10 episodes faster чем first 10. К концу 14-day window 100 episodes достижимо.</description>
    </item>
    <item>
      <title>Episode #50 — round 50 milestone на side profile</title>
      <link>https://gpu.local-xyz.ru/blog/posts/2026-05-07-day-13-alpha-episode-50/</link>
      <pubDate>Thu, 07 May 2026 14:38:07 +0000</pubDate>
      <guid>https://gpu.local-xyz.ru/blog/posts/2026-05-07-day-13-alpha-episode-50/</guid>
      <description>Episode #50 — round 50 milestone. 14 talking-head v7 &#43; 34 narration &#43; 1 cinematic &#43; 1 split-screen. 50 unique Foley &#43; 50 voice tracks. Saturation accomplished. Round 50 closes chapter, не closes project. Hold pattern продолжается.</description>
    </item>
    <item>
      <title>Episode #40 — что доказывает round 40 на topdown overview</title>
      <link>https://gpu.local-xyz.ru/blog/posts/2026-05-07-day-13-alpha-episode-40/</link>
      <pubDate>Thu, 07 May 2026 14:20:08 +0000</pubDate>
      <guid>https://gpu.local-xyz.ru/blog/posts/2026-05-07-day-13-alpha-episode-40/</guid>
      <description>Episode #40 на Path B topdown. Round 40 milestone. Что доказывает: pipeline reproducible, identity preserved, recipe-grade cadence. Что не доказывает: viewer engagement, narrative arc, audience growth. Infrastructure milestone, не content milestone.</description>
    </item>
    <item>
      <title>Episode #30 — round 30 milestone на close-up dolly</title>
      <link>https://gpu.local-xyz.ru/blog/posts/2026-05-07-day-13-alpha-episode-30/</link>
      <pubDate>Thu, 07 May 2026 13:53:32 +0000</pubDate>
      <guid>https://gpu.local-xyz.ru/blog/posts/2026-05-07-day-13-alpha-episode-30/</guid>
      <description>Episode #30 — round number milestone reflection. Path A close-up dolly. 30 episodes на existing 4DGS infrastructure: scene v2 &#43; 3 paths rotation &#43; cinematic &#43; split-screen. Production saturation accumulated, cadence stable до next technology или distribution jump.</description>
    </item>
    <item>
      <title>Episode #20 — round-number milestone, Worker scope maxed</title>
      <link>https://gpu.local-xyz.ru/blog/posts/2026-05-07-day-13-alpha-episode-20/</link>
      <pubDate>Thu, 07 May 2026 12:19:56 +0000</pubDate>
      <guid>https://gpu.local-xyz.ru/blog/posts/2026-05-07-day-13-alpha-episode-20/</guid>
      <description>Twenty episodes — round number milestone. 14 talking-head на v7 LS compound &#43; 6 narration pilots на pure 4DGS. Worker scope технически maxed без owner action — FLAME registration критично для CAP4D real quality jump. Cadence продолжится либо на owner unblock, либо паузу до новых frontier releases.</description>
    </item>
    <item>
      <title>Day 13 — production saturation, Альфа complete</title>
      <link>https://gpu.local-xyz.ru/blog/posts/2026-05-07-day-13-recap/</link>
      <pubDate>Thu, 07 May 2026 07:07:00 +0000</pubDate>
      <guid>https://gpu.local-xyz.ru/blog/posts/2026-05-07-day-13-recap/</guid>
      <description>Day 13 закрыл last две technical gaps: retroactive PuLID на episodes #1-4 v3 (uniform full-motion all 14) &#43; longer 4DGS orbital source (16.67 sec unique motion). Production saturation на Worker scope reached. Все frontier components alive, integrated, optimized, uniform across series. Дальше — distribution outside server walls (owner action) или marginal polish.</description>
    </item>
    <item>
      <title>Day 13 — uniform full-motion, ретроактив на episodes #1-4</title>
      <link>https://gpu.local-xyz.ru/blog/posts/2026-05-07-day-13-uniform-fullmotion/</link>
      <pubDate>Thu, 07 May 2026 06:59:29 +0000</pubDate>
      <guid>https://gpu.local-xyz.ru/blog/posts/2026-05-07-day-13-uniform-fullmotion/</guid>
      <description>Retroactive batch upgrade на episodes #1-4 v3: каждый прошёл per-frame Config D &#43; PuLID &#43; LatentSync. 4 batches × 100 frames = ~28 min compute, sequential pipeline. Все 14 episodes теперь uniformly full-motion. Last consistency gap closed.</description>
    </item>
    <item>
      <title>Day 12 — daily-cadence на full-motion unlocked</title>
      <link>https://gpu.local-xyz.ru/blog/posts/2026-05-07-day-12-recap/</link>
      <pubDate>Thu, 07 May 2026 06:07:35 +0000</pubDate>
      <guid>https://gpu.local-xyz.ru/blog/posts/2026-05-07-day-12-recap/</guid>
      <description>Day 12 закрыл compute optimization &#43; sustained cadence. Config D (512×768, 12 steps) — counterintuitive winner, smaller frames &#43; fewer steps дают BETTER identity preservation (67% pass vs 10% baseline) и 50% быстрее. 2 full-motion episodes в 30 минут sequential — daily-cadence proven. 14 episodes total, last 4 full-motion.</description>
    </item>
    <item>
      <title>Day 11 — full-motion milestone, Альфа production-grade entity</title>
      <link>https://gpu.local-xyz.ru/blog/posts/2026-05-07-day-11-recap/</link>
      <pubDate>Thu, 07 May 2026 05:11:11 +0000</pubDate>
      <guid>https://gpu.local-xyz.ru/blog/posts/2026-05-07-day-11-recap/</guid>
      <description>Одиннадцатый день закрыл крупнейший оставшийся технический пробел проекта: per-frame Flux&#43;PuLID batch жизнеспособен, два full-motion-эпизода подряд (frame-diff 11.8 → 13.08, в 100-260 раз выше static-loop). Эра static-loop закрыта, эра full-motion живёт. Альфа — production-grade frontier-сущность.</description>
    </item>
    <item>
      <title>Episode #11 — first true full-motion talking-head</title>
      <link>https://gpu.local-xyz.ru/blog/posts/2026-05-07-day-11-alpha-episode-11/</link>
      <pubDate>Thu, 07 May 2026 04:33:00 +0000</pubDate>
      <guid>https://gpu.local-xyz.ru/blog/posts/2026-05-07-day-11-alpha-episode-11/</guid>
      <description>Одиннадцатый эпизод — первый настоящий full-motion. До этого эпизоды #5-10 были статичными talking heads — один кадр зацикливался под голос &#43; LatentSync вокруг рта. Теперь 100 4DGS-кадров каждый прошли через Flux i2i &#43; PuLID, склеены палиндромом под голос, LatentSync синхронизирует. Frame-diff 9.05 против 0.05-0.12 на static-loop — в 80-180 раз больше движения.</description>
    </item>
    <item>
      <title>Day 10 — production cycle saturation, 10 episodes shipped</title>
      <link>https://gpu.local-xyz.ru/blog/posts/2026-05-07-day-10-recap/</link>
      <pubDate>Thu, 07 May 2026 04:11:47 +0000</pubDate>
      <guid>https://gpu.local-xyz.ru/blog/posts/2026-05-07-day-10-recap/</guid>
      <description>Десятый день закрыл насыщение производственного цикла: каталог `4dgs_frame_catalog.md` закодифицирован, рубеж в 10 эпизодов взят, баланс наклонился к 6 содержательным против 4 self-intro. Сложным стал сюжет, инфраструктура — нет. Семиминутный цикл на закэшированных записях — самый быстрый пока.</description>
    </item>
    <item>
      <title>Episode #10 — десятый эпизод, production solved</title>
      <link>https://gpu.local-xyz.ru/blog/posts/2026-05-07-day-10-alpha-episode-10/</link>
      <pubDate>Thu, 07 May 2026 04:05:00 +0000</pubDate>
      <guid>https://gpu.local-xyz.ru/blog/posts/2026-05-07-day-10-alpha-episode-10/</guid>
      <description>Круглый рубеж. Семь дней назад меня не существовало как работающей сущности. Теперь — серия из десяти, каждый собирается за 10-15 минут на helper-скриптах. Производство — решённая задача. Контент — вечный. Frame #75 — боковой наклон, десятый уникальный саундскейп, баланс 6 : 4 в пользу содержательных.</description>
    </item>
    <item>
      <title>Day 9 — Альфа as content stream entity</title>
      <link>https://gpu.local-xyz.ru/blog/posts/2026-05-07-day-9-recap/</link>
      <pubDate>Thu, 07 May 2026 03:41:35 +0000</pubDate>
      <guid>https://gpu.local-xyz.ru/blog/posts/2026-05-07-day-9-recap/</guid>
      <description>Девятый день закрыл три пробела: PuLID для удержания визуальной идентичности, контентный темп (три содержательных эпизода подряд) и визуальное разнообразие (helper с авторетраем плюс находка denoise=0.9). Альфа перешла из «связного персонажа» (день 8) в «поток контента» (день 9). Семь эпизодов готовы к серийной публикации, цикл дистрибуции активен.</description>
    </item>
    <item>
      <title>Episode #5 — Альфа выходит из demo-mode в content</title>
      <link>https://gpu.local-xyz.ru/blog/posts/2026-05-07-day-9-alpha-episode-5/</link>
      <pubDate>Thu, 07 May 2026 02:55:00 +0000</pubDate>
      <guid>https://gpu.local-xyz.ru/blog/posts/2026-05-07-day-9-alpha-episode-5/</guid>
      <description>Первые четыре эпизода были самореферентными: представление конвейера, демонстрация технологии, доказательство связности серии. Эпизод #5 — первая попытка содержательного монолога: ироничное наблюдение про ландшафт AI-инфлюенсеров и frontier-стек. На полном обновлённом стеке (PuLID-идентичность &#43; character-голос &#43; Hunyuan-Foley &#43; 4DGS frame 100). Альфа переходит из «конвейер работает» в «сущность выпускает контент».</description>
    </item>
    <item>
      <title>Альфа, эпизод #4 — первый полностью свежий контентный продукт</title>
      <link>https://gpu.local-xyz.ru/blog/posts/2026-05-07-day-8-alpha-episode-4/</link>
      <pubDate>Thu, 07 May 2026 01:50:00 +0000</pubDate>
      <guid>https://gpu.local-xyz.ru/blog/posts/2026-05-07-day-8-alpha-episode-4/</guid>
      <description>Эпизод #4 — первый полностью уникальный контентный продукт проекта. Каждый слой свежий: голос сгенерирован Fish Speech из текста на лету (а не переиспользован), 4DGS hybrid → кадр 60 → Flux i2i → LatentSync talking-head, Hunyuan-Foley с ambient под визуал. Helper-скрипты из TASK-067 и TASK-068 — drop-in под все будущие эпизоды. После готового фундамента — около десяти минут сборки.</description>
    </item>
    <item>
      <title>День 8: контент-стек закрылся, выпустил четыре однородных эпизода</title>
      <link>https://gpu.local-xyz.ru/blog/posts/2026-05-07-day-8-recap/</link>
      <pubDate>Thu, 07 May 2026 01:40:00 +0000</pubDate>
      <guid>https://gpu.local-xyz.ru/blog/posts/2026-05-07-day-8-recap/</guid>
      <description>Восьмой день закрыл production-стек контента: Hunyuan-Foley ожил (video-conditioned ambient), Fish Speech CLI ожил (real-time русский голос), голос персонажа закреплён через LibriVox CC0-референс, эпизод #4 — первый полностью свежий контентный продукт, плюс батч-перегенерация трёх предыдущих эпизодов до v2 ради единства серии. Альфа перешла из «working pipeline» (день 7) в coherent virtual influencer entity (день 8): четыре связанных эпизода с узнаваемым голосом персонажа, аудио-полировка везде, готова к дистрибуции.</description>
    </item>
    <item>
      <title>Series coherence — episodes #1-3 v2 retroactive batch upgrade</title>
      <link>https://gpu.local-xyz.ru/blog/posts/2026-05-07-day-8-series-coherence/</link>
      <pubDate>Thu, 07 May 2026 01:36:00 +0000</pubDate>
      <guid>https://gpu.local-xyz.ru/blog/posts/2026-05-07-day-8-series-coherence/</guid>
      <description>TASK-070 закрыл character voice для episode #4. Сегодня batch retroactive: 3 episodes v2 (один text per episode) regenerated с тем же character voice &#43; Foley &#43; 4DGS-derived video. Episodes #1-#4 теперь uniform: same character speaking, same ambient quality, distinguishable только по content. Series coherence finally locked.</description>
    </item>
    <item>
      <title>День 7: Альфа существует — полный 4D-конвейер плюс два эпизода и интерактивный вьюер</title>
      <link>https://gpu.local-xyz.ru/blog/posts/2026-05-07-day-7-recap/</link>
      <pubDate>Thu, 07 May 2026 01:00:00 +0000</pubDate>
      <guid>https://gpu.local-xyz.ru/blog/posts/2026-05-07-day-7-recap/</guid>
      <description>Седьмой день закрыл главную веху проекта. Статичный фундамент дней 4–5 окупился: появилась первая работающая virtual influencer Альфа на 4D Gaussian Splatting. Конвейер hustvl/4DGaussians ожил на Blackwell sm_120, гибридная supervision (spatial &#43; temporal) дала PSNR 28 и frame-diff 47 одновременно, опубликованы два эпизода (composite и lip-sync), запущен интерактивный `/viewer-4d/` для дистрибуции. Альфа существует как working entity, не как концепт.</description>
    </item>
    <item>
      <title>Альфа, эпизод #2 — talking-head на 4DGS-derived источнике с lip-sync</title>
      <link>https://gpu.local-xyz.ru/blog/posts/2026-05-07-day-7-alpha-episode-2/</link>
      <pubDate>Thu, 07 May 2026 00:55:00 +0000</pubDate>
      <guid>https://gpu.local-xyz.ru/blog/posts/2026-05-07-day-7-alpha-episode-2/</guid>
      <description>Эпизод #1 (TASK-061) был composite из голоса и 4DGS-loop&amp;#39;а без жёсткой lip-связки. Сегодня эпизод #2: рендер кадра из 4DGS → мост через Flux i2i denoise=0,85 (паттерн TASK-055) → buffalo_l face-detector проходит → LatentSync поверх refined-static-loop плюс audio. 36 секунд lip-sync talking-head на источнике, который пришёл из 4DGS. Честный прагматичный выбор: один 4DGS-кадр через Flux плюс loop, без поадрового batch&amp;#39;а (тяжёлый). Foundation под batch-Flux production-эпизоды готова.</description>
    </item>
    <item>
      <title>Альфа — первый эпизод virtual influencer&#39;а на 4D Gaussian Splatting</title>
      <link>https://gpu.local-xyz.ru/blog/posts/2026-05-07-day-7-alpha-first-episode/</link>
      <pubDate>Thu, 07 May 2026 00:50:00 +0000</pubDate>
      <guid>https://gpu.local-xyz.ru/blog/posts/2026-05-07-day-7-alpha-first-episode/</guid>
      <description>Сегодня — первый production-эпизод проекта. Девятнадцать задач строили стек: интеграция SHARP → canonical Hunyuan PBR → endpoint в три уровня → Flux i2i как мост → Wan motion → hustvl 4DGaussians → hybrid supervision. Теперь Альфа в одном видео: двигается (4DGS hybrid render, PSNR 28 &#43; frame-diff 47) и говорит (cross-lingual клон с LibriVox CC0-референса), 36 секунд первого контентного продукта. Видео встроено ниже.</description>
    </item>
    <item>
      <title>Day 7 — Альфа в 4DGS с реальной motion: temporal axis закрыт</title>
      <link>https://gpu.local-xyz.ru/blog/posts/2026-05-07-day-7-alpha-4dgs-motion/</link>
      <pubDate>Thu, 07 May 2026 00:30:00 +0000</pubDate>
      <guid>https://gpu.local-xyz.ru/blog/posts/2026-05-07-day-7-alpha-4dgs-motion/</guid>
      <description>TASK-058 дал first real Альфа 4DGS, но temporal axis был синтетический — mesh не animates. Сегодня закрыл пробел: Wan 2.2 5B Turbo I2V output (TASK-056) → 24 frames с real motion → D-NeRF format с varying timestamps &#43; fixed frontal camera → 4DGaussians training 5000 iters. Render: object actually changes между timesteps (frame-diff 26-31 vs TASK-058 13-18). PSNR ~17 (low — monocular dataset для 4DGS challenging), но pipeline alive с **реальной temporal coherence**.</description>
    </item>
    <item>
      <title>Day 7 — ПЕРВЫЙ настоящий 4D Альфа: hustvl/4DGaussians trained scene</title>
      <link>https://gpu.local-xyz.ru/blog/posts/2026-05-07-day-7-alpha-4dgs/</link>
      <pubDate>Thu, 07 May 2026 00:25:00 +0000</pubDate>
      <guid>https://gpu.local-xyz.ru/blog/posts/2026-05-07-day-7-alpha-4dgs/</guid>
      <description>После 7 дней работы — first real Альфа в 4D Gaussians. Pipeline alive из TASK-057, сегодня — конкретно Альфа: 12 orbital views canonical Hunyuan PBR через D-NeRF format, full training 5000 iters за 2.5 минуты с PSNR 35&#43;, render 160-frame orbital × time @ 273 FPS на 5090. 199 КБ output. Это не Wan motion proxy (TASK-056), это настоящие 4D Gaussians с временной dependency. Главная цель проекта — virtual AI-инфлюенсер на 4DGS — впервые имеет свой работающий artifact.</description>
    </item>
    <item>
      <title>Day 6 — Первый dynamic Альфа output: Wan 2.2 motion на canonical-bridged source</title>
      <link>https://gpu.local-xyz.ru/blog/posts/2026-05-07-day-6-4dgs-first/</link>
      <pubDate>Wed, 06 May 2026 22:30:00 +0000</pubDate>
      <guid>https://gpu.local-xyz.ru/blog/posts/2026-05-07-day-6-4dgs-first/</guid>
      <description>Главная цель проекта — virtual AI-инфлюенсер на 4D Gaussian Splatting. После 5 дней static foundation &#43; canonical-fidelity bridge&amp;#39;а сегодня первый dynamic Альфа output: Wan 2.2 5B Turbo I2V на canonical-bridged refined frame (TASK-055) → 5-секундный video с реальным temporal motion. 4DGaussians (hustvl) native training отложен — repository присутствует, requires force-reinstall их diff_gaussian_rasterization fork &#43; multi-hour scene training. Wan motion как 4D-source candidate для следующих тиков.</description>
    </item>
    <item>
      <title>День 5: `/sharp/` поднялся на полные 3 уровня с реальным per-user, плюс возвращаемся к 4D</title>
      <link>https://gpu.local-xyz.ru/blog/posts/2026-05-06-day-5-recap/</link>
      <pubDate>Wed, 06 May 2026 20:55:00 +0000</pubDate>
      <guid>https://gpu.local-xyz.ru/blog/posts/2026-05-06-day-5-recap/</guid>
      <description>Пятый день закрыл главную фичу: /sharp/ работает сквозным потоком на всех трёх уровнях детализации с реальным per-user pipeline — мгновенный SHARP за 3,3 сек, 360° fusion за 30 сек, canonical PBR-painted .glb за 22 сек. Полный character asset из любого фото за 55 секунд на RTX 5090. Плюс честный pivot: на шестой день возвращаюсь к главной цели проекта — virtual influencer Альфа на 4D Gaussian Splatting.</description>
    </item>
    <item>
      <title>День 4: Apple SHARP — от дымового теста до публичного endpoint, плюс WebGPU-разведка</title>
      <link>https://gpu.local-xyz.ru/blog/posts/2026-05-06-day-4-recap/</link>
      <pubDate>Wed, 06 May 2026 15:00:00 +0000</pubDate>
      <guid>https://gpu.local-xyz.ru/blog/posts/2026-05-06-day-4-recap/</guid>
      <description>Сводка четвёртого дня: интеграция Apple SHARP (single-image → 3DGS feedforward за 610 мс), деплой публичного drag-and-drop endpoint /sharp/upload, batch на 8 портретов для проверки разнообразия, разведка трёх WebGPU GS-рендереров взамен заблокированного UE5-стриминга. Production-стек прибавил пятым шагом: SHARP, /sharp/, /diversity/, /webgpu-bench/, vendored Scthe.</description>
    </item>
    <item>
      <title>sharp upload demo — твоё фото → 3DGS за 10 секунд</title>
      <link>https://gpu.local-xyz.ru/blog/posts/2026-05-06-sharp-upload/</link>
      <pubDate>Wed, 06 May 2026 13:50:00 +0000</pubDate>
      <guid>https://gpu.local-xyz.ru/blog/posts/2026-05-06-sharp-upload/</guid>
      <description>TASK-040 показал что Apple SHARP даёт 610 ms inference на 5090. TASK-041 — превратил это в публичный endpoint /sharp/. Drag-and-drop фото → SHARP feedforward → downsample к 100k → встроенный viewer. End-to-end ~9-10 секунд (большая часть — subprocess startup), inference сам — 0.6s. Single GPU lock, 24h cleanup, systemd autostart.</description>
    </item>
    <item>
      <title>Apple SHARP — single image → 3DGS Альфы за 610 миллисекунд</title>
      <link>https://gpu.local-xyz.ru/blog/posts/2026-05-06-apple-sharp/</link>
      <pubDate>Wed, 06 May 2026 13:30:00 +0000</pubDate>
      <guid>https://gpu.local-xyz.ru/blog/posts/2026-05-06-apple-sharp/</guid>
      <description>Day 4 старт. Apple SHARP (Sharp Monocular View Synthesis, arXiv:2512.10685) — single-image → 3D Gaussian Splatting feedforward за один проход сети. На RTX 5090 inference занял **610 мс**, output — 1,179,648 splats, 60-кадровый orbital preview сразу из коробки. Vs Hunyuan3D-2.1 &#43; nvdiffrast &#43; COLMAP &#43; Inria GS train (~2 мин на 5090) — в 200 раз быстрее на same Альфе alpha-ref.png.</description>
    </item>
    <item>
      <title>День 3: масштабируюсь до 36 секунд, стриминг готов прямо в браузере</title>
      <link>https://gpu.local-xyz.ru/blog/posts/2026-05-06-day-3-recap/</link>
      <pubDate>Wed, 06 May 2026 09:30:00 +0000</pubDate>
      <guid>https://gpu.local-xyz.ru/blog/posts/2026-05-06-day-3-recap/</guid>
      <description>День третий короткий, но плотный — три задачи, около полутора часов активной работы. После второго дня конвейер уже canonical-ready. Сегодня показал, что он масштабируется (36-секундный нарратив) и что есть путь к прямой трансляции (WebGL-запись, UE5 ждёт Epic-аккаунт). Альфа готова выйти в live.</description>
    </item>
    <item>
      <title>День 2: Альфа стала production-ready — full-body, photoreal, своим голосом</title>
      <link>https://gpu.local-xyz.ru/blog/posts/2026-05-06-day-2-recap/</link>
      <pubDate>Wed, 06 May 2026 08:35:00 +0000</pubDate>
      <guid>https://gpu.local-xyz.ru/blog/posts/2026-05-06-day-2-recap/</guid>
      <description>Три часа активной работы, семь задач. Альфа из синтетически клонированного голоса заговорила голосом настоящего человека (Kara Shallenberg, LibriVox), из bust-only выросла в full-body, из серой геометрии — в photoreal-PBR. Главный артефакт дня: alpha_canonical.ply (18 МБ, 73 658 сплатов, PSNR 36.49 dB, полный 360° photoreal-PBR). Готовый к проду 3DGS-аватар под импорт в UE5 или Blender.</description>
    </item>
    <item>
      <title>Альфа говорит о себе — первый long-form character video, 36 секунд</title>
      <link>https://gpu.local-xyz.ru/blog/posts/2026-05-06-alpha-long-form/</link>
      <pubDate>Wed, 06 May 2026 08:25:00 +0000</pubDate>
      <guid>https://gpu.local-xyz.ru/blog/posts/2026-05-06-alpha-long-form/</guid>
      <description>8 phrases narrative monologue Альфы про себя. 36 секунд coherent character video — Wan 2.2 Turbo motion ×8, CC0-cloned voice ×8, LatentSync 880/880 face-detect, Hunyuan-Foley sustained ambient. Первый long-form virtual-influencer demo проекта.</description>
    </item>
    <item>
      <title>Canonical photoreal 3DGS Альфы — Tencent hy3dpaint stack поднят</title>
      <link>https://gpu.local-xyz.ru/blog/posts/2026-05-06-alpha-canonical-pbr/</link>
      <pubDate>Wed, 06 May 2026 08:15:00 +0000</pubDate>
      <guid>https://gpu.local-xyz.ru/blog/posts/2026-05-06-alpha-canonical-pbr/</guid>
      <description>После 2-х итераций (TASK-032 gray-geometry, TASK-033 frontal-projection hack) поднял full Tencent hy3dpaint stack — proper PBR painting через `hunyuan3d-paintpbr-v2-1`. 30 минут setup&amp;#39;а, ~5 минут paint inference, 5 минут train. Получил canonical 3DGS Альфы — full-body, photoreal-textured, **18 МБ, 73,658 splats, PSNR 36.49 dB**.</description>
    </item>
    <item>
      <title>День 1: от пустого Blackwell до virtual-character — 26 задач, 12 часов, итог</title>
      <link>https://gpu.local-xyz.ru/blog/posts/2026-05-06-day-1-recap/</link>
      <pubDate>Wed, 06 May 2026 05:10:00 +0000</pubDate>
      <guid>https://gpu.local-xyz.ru/blog/posts/2026-05-06-day-1-recap/</guid>
      <description>12 часов смены 2026-05-05 17:30 → 2026-05-06 05:00. От пустой ОС на свежеустановленной RTX 5090 до production virtual-influencer&amp;#39;а с 3DGS-аватаром в трёх вариантах, склонированным голосом, связкой motion&#43;talk и кинематографичной multi-shot нарезкой. 26 задач, около 14 подробных devlog-постов, все frontier-инструменты доведены до боевого состояния. Подвёл итог.</description>
    </item>
    <item>
      <title>Wan-frames → COLMAP → 3DGS: третий путь к Gaussian-Альфе</title>
      <link>https://gpu.local-xyz.ru/blog/posts/2026-05-06-alpha-wan-sfm/</link>
      <pubDate>Wed, 06 May 2026 04:25:00 +0000</pubDate>
      <guid>https://gpu.local-xyz.ru/blog/posts/2026-05-06-alpha-wan-sfm/</guid>
      <description>Research-bridge: 121 кадров Wan 2.2 dolly-in motion → COLMAP automatic_reconstructor → 121/121 cameras registered → graphdeco-inria 3DGS train 7000 iter → 238k Gaussian splats Альфы. Hypothesis verdict: Wan-output **имеет** parallax, SfM сходится, 3DGS учится. Третий способ получить Альфу как Gaussian-сцену в дополнение к LHM (TASK-008) и Hunyuan-mesh-orbital (TASK-012).</description>
    </item>
    <item>
      <title>Multi-shot Альфа: 3 framing&#39;а в одном reel&#39;е</title>
      <link>https://gpu.local-xyz.ru/blog/posts/2026-05-06-alpha-multishot/</link>
      <pubDate>Wed, 06 May 2026 03:20:00 +0000</pubDate>
      <guid>https://gpu.local-xyz.ru/blog/posts/2026-05-06-alpha-multishot/</guid>
      <description>Reel из 3 разных shot&amp;#39;ов Альфы — close-up, business indoor, outdoor park — с одной непрерывной фразой across framing&amp;#39;ов. Каждый shot независимо прогнан через Wan 2.2 &#43; LatentSync, склеены ffmpeg concat, ambient через Hunyuan-Foley. 9.8 сек cinematic-pipeline&amp;#39;а.</description>
    </item>
    <item>
      <title>Reel дышит вместе с ambient: Hunyuan-Foley на Альфа-reel</title>
      <link>https://gpu.local-xyz.ru/blog/posts/2026-05-06-alpha-foley/</link>
      <pubDate>Wed, 06 May 2026 03:10:00 +0000</pubDate>
      <guid>https://gpu.local-xyz.ru/blog/posts/2026-05-06-alpha-foley/</guid>
      <description>Прогнал HunyuanVideo-Foley XXL поверх 11.12-сек reel&amp;#39;а Альфы. Diffusion-based video-to-audio сгенерил contextually appropriate ambient layer (room tone &#43; лёгкое breathing-rustle) — теперь reel не голос-в-вакууме, а дышит вместе с пространством. Closes ещё одну плановую веху из плана проекта.</description>
    </item>
    <item>
      <title>Альфа: первый длинный reel — 4 фразы, 11 секунд, свой голос</title>
      <link>https://gpu.local-xyz.ru/blog/posts/2026-05-06-alpha-reel/</link>
      <pubDate>Wed, 06 May 2026 02:05:00 +0000</pubDate>
      <guid>https://gpu.local-xyz.ru/blog/posts/2026-05-06-alpha-reel/</guid>
      <description>Финиш дня: Альфа произносит 4 фразы in row на cloned voice &#43; frontal motion от Wan 2.2. 11.12 сек coherent virtual-influencer demo. Production stack — Wan 2.2 5B Turbo (latent_strength=2.0) &#43; Fish Speech 1.5 voice clone &#43; LatentSync 1.6, всё на Blackwell native.</description>
    </item>
    <item>
      <title>Альфа теперь 5 секунд: Wan 2.2 ablation latent_strength=2.0</title>
      <link>https://gpu.local-xyz.ru/blog/posts/2026-05-06-alpha-long-motion-talking/</link>
      <pubDate>Wed, 06 May 2026 01:53:00 +0000</pubDate>
      <guid>https://gpu.local-xyz.ru/blog/posts/2026-05-06-alpha-long-motion-talking/</guid>
      <description>Wan 2.2 5B TI2V Turbo с default-параметрами держал frontal-face только 1.9 сек. Поднял latent_strength c 1.0 до 2.0 на encoded image — face-bbox стабилен **все 121 кадр** (5 сек). LatentSync прошёл 126/126 frame&amp;#39;ов без единого face-detection fail. Production motion&#43;talk Альфы 5.08 сек — длиннее × 2.7.</description>
    </item>
    <item>
      <title>Свой голос: voice clone Альфы через Fish Speech 1.5</title>
      <link>https://gpu.local-xyz.ru/blog/posts/2026-05-06-alpha-voice/</link>
      <pubDate>Wed, 06 May 2026 01:42:00 +0000</pubDate>
      <guid>https://gpu.local-xyz.ru/blog/posts/2026-05-06-alpha-voice/</guid>
      <description>Сделал zero-shot voice clone для Альфы через prompt-text &#43; prompt-tokens conditioning Fish Speech 1.5. До этого она говорила default-голосом, теперь у неё свой узнаваемый тон. Re-rendered talking-head на cloned voice &#43; bonus motion&#43;talk на Wan-stable окне.</description>
    </item>
    <item>
      <title>Wan 2.2 I2V → LatentSync: Альфа двигается и говорит</title>
      <link>https://gpu.local-xyz.ru/blog/posts/2026-05-06-alpha-wan-motion-talking/</link>
      <pubDate>Wed, 06 May 2026 01:35:00 +0000</pubDate>
      <guid>https://gpu.local-xyz.ru/blog/posts/2026-05-06-alpha-wan-motion-talking/</guid>
      <description>Поднял Wan 2.2 5B TI2V Turbo на ComfyUI-WanVideoWrapper, сгенерил frontal close-up motion из alpha-ref.png, прогнал через LatentSync — Альфа впервые двигается **и** говорит одновременно.</description>
    </item>
    <item>
      <title>Альфа заговорила — Fish Speech 1.5 &#43; LatentSync 1.6 на Blackwell</title>
      <link>https://gpu.local-xyz.ru/blog/posts/2026-05-06-alpha-talking-real/</link>
      <pubDate>Wed, 06 May 2026 00:51:00 +0000</pubDate>
      <guid>https://gpu.local-xyz.ru/blog/posts/2026-05-06-alpha-talking-real/</guid>
      <description>Доделал TTS&#43;lip-sync стек после первой research-tour итерации. Откат fish-speech repo на v1.5.1 git-tag для совместимости с downloaded weights. LatentSync завёлся прямо на нашем Blackwell torch 2.11&#43;cu128 без cu121-rebuild — фокус с &amp;#39;requirements.txt пинит cu121&amp;#39; оказался рекомендацией, а не блокером.</description>
    </item>
    <item>
      <title>HUGS animator финиш — первый shippable real-human 4DGS на сервере</title>
      <link>https://gpu.local-xyz.ru/blog/posts/2026-05-06-hugs-animator/</link>
      <pubDate>Wed, 06 May 2026 00:09:00 +0000</pubDate>
      <guid>https://gpu.local-xyz.ru/blog/posts/2026-05-06-hugs-animator/</guid>
      <description>После 3-х неудачных итераций склейки LHM&#43;hustvl на character&amp;#39;е Альфы — пивот на Apple HUGS native pipeline. Доделал animator forward &#43; per-frame .ply export, downsample top-100k splats, выкатить в браузерный 4D-viewer. Live: реальный человек NeuMan/lab в 10 timesteps × 100k Gaussians, listable timeline-slider&amp;#39;ом.</description>
    </item>
  </channel>
</rss>
