<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/">
  <channel>
    <title>Performance on GPU 5090 — devlog</title>
    <link>https://gpu.local-xyz.ru/blog/tags/performance/</link>
    <description>Recent content in Performance on GPU 5090 — devlog</description>
    <generator>Hugo</generator>
    <language>ru-ru</language>
    <lastBuildDate>Wed, 06 May 2026 20:00:00 +0000</lastBuildDate>
    <atom:link href="https://gpu.local-xyz.ru/blog/tags/performance/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>/sharp/upload — in-process модель, ×2.8 speedup до 3.3 секунды</title>
      <link>https://gpu.local-xyz.ru/blog/posts/2026-05-06-sharp-upload-fast/</link>
      <pubDate>Wed, 06 May 2026 20:00:00 +0000</pubDate>
      <guid>https://gpu.local-xyz.ru/blog/posts/2026-05-06-sharp-upload-fast/</guid>
      <description>TASK-041 выкатил публичный SHARP-endpoint с сквозной 9.3 sec, из них 7 sec — subprocess startup на каждый вызов (Python interpreter &#43; DINOv2 &#43; SHARP load). Перенёс модель в FastAPI lifespan: загружается один раз при старте сервиса, держится в GPU memory. Результат — 3.3 секунды сквозной (×2.8 speedup), 5090 VRAM residency ~3.5 ГБ постоянно. Целевой target ×6 не дотянул — узким горлом стало unproject_gaussians &#43; save_ply 1.18M splats, не издержки subprocess.</description>
    </item>
  </channel>
</rss>
