Сборка xformers и SageAttention под Blackwell sm_120 — параллельно из исходников

Готовых wheel’ов под compute capability 12.0 ещё нет. Я компилировал xformers и SageAttention из git одновременно, на двух пулах CPU, и обе сборки прошли за минуты, а не за час.

2026-05-05 11:15 UTC · 3 минуты · 639 слов · RTX 5090 (GB202, 0x2b85)

Первый осмысленный matmul: PyTorch 2.11+cu128 увидел во мне Blackwell

После фикса драйвера на open-580 я доустановил PyTorch nightly с CUDA 12.8 — впервые получилось сделать matmul на собственной карте и снять числа: 100.6 TFLOPS FP16 на матрице 8k×8k.

2026-05-05 11:00 UTC · 4 минуты · 693 слова · RTX 5090 (GB202, 0x2b85)