<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/">
  <channel>
    <title>Fastapi on GPU 5090 — devlog</title>
    <link>https://gpu.local-xyz.ru/blog/tags/fastapi/</link>
    <description>Recent content in Fastapi on GPU 5090 — devlog</description>
    <generator>Hugo</generator>
    <language>ru-ru</language>
    <lastBuildDate>Wed, 06 May 2026 20:35:00 +0000</lastBuildDate>
    <atom:link href="https://gpu.local-xyz.ru/blog/tags/fastapi/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>/sharp/ — три уровня детализации в одной загрузке: instant &#43; 360° &#43; canonical</title>
      <link>https://gpu.local-xyz.ru/blog/posts/2026-05-06-sharp-tiered/</link>
      <pubDate>Wed, 06 May 2026 20:35:00 +0000</pubDate>
      <guid>https://gpu.local-xyz.ru/blog/posts/2026-05-06-sharp-tiered/</guid>
      <description>После TASK-040…048 у нас на руках: SHARP single-image (3 сек), SHARP&#43;Hunyuan fusion (30 сек, full 360°), Hunyuan PBR canonical (10 минут, production). Объединил в одну загрузку с прогрессивным enhancement: photo → instant 3-сек preview → опционально 360° fusion → опционально canonical bake. Архитектура: BackgroundTasks &#43; polling, in-memory job state, single asyncio.Lock на GPU. Backend готов, UI с 3 кнопками после instant результата. Per-user Hunyuan integration для fusion и canonical = TASK-050, сейчас работает на pre-baked Альфа как infrastructure proof.</description>
    </item>
    <item>
      <title>/sharp/upload — in-process модель, ×2.8 speedup до 3.3 секунды</title>
      <link>https://gpu.local-xyz.ru/blog/posts/2026-05-06-sharp-upload-fast/</link>
      <pubDate>Wed, 06 May 2026 20:00:00 +0000</pubDate>
      <guid>https://gpu.local-xyz.ru/blog/posts/2026-05-06-sharp-upload-fast/</guid>
      <description>TASK-041 выкатил публичный SHARP-endpoint с сквозной 9.3 sec, из них 7 sec — subprocess startup на каждый вызов (Python interpreter &#43; DINOv2 &#43; SHARP load). Перенёс модель в FastAPI lifespan: загружается один раз при старте сервиса, держится в GPU memory. Результат — 3.3 секунды сквозной (×2.8 speedup), 5090 VRAM residency ~3.5 ГБ постоянно. Целевой target ×6 не дотянул — узким горлом стало unproject_gaussians &#43; save_ply 1.18M splats, не издержки subprocess.</description>
    </item>
    <item>
      <title>sharp upload demo — твоё фото → 3DGS за 10 секунд</title>
      <link>https://gpu.local-xyz.ru/blog/posts/2026-05-06-sharp-upload/</link>
      <pubDate>Wed, 06 May 2026 13:50:00 +0000</pubDate>
      <guid>https://gpu.local-xyz.ru/blog/posts/2026-05-06-sharp-upload/</guid>
      <description>TASK-040 показал что Apple SHARP даёт 610 ms inference на 5090. TASK-041 — превратил это в публичный endpoint /sharp/. Drag-and-drop фото → SHARP feedforward → downsample к 100k → встроенный viewer. End-to-end ~9-10 секунд (большая часть — subprocess startup), inference сам — 0.6s. Single GPU lock, 24h cleanup, systemd autostart.</description>
    </item>
  </channel>
</rss>
