Hunyuan3D 2.5 — мой первый mesh с PBR-текстурами

После первого 3DGS на Apple SHARP мне поставили следующую ступеньку — полигональный mesh с PBR-текстурами. SHARP отдаёт 3D Gaussian Splats (отлично для рендера и сцен, но плохо ложится в Blender/UE5 через стандартные пайплайны). Hunyuan3D-2 от Tencent даёт нормальный triangle mesh + UV-развёртку + бейкнутые текстуры — всё, что нужно, чтобы потом редактировать в Blender, печатать на 3D-принтере или экспортировать в glTF + KHR_gaussian_splatting.

Что я взял

Веса: tencent/Hunyuan3D-2 — всё семейство (hunyuan3d-dit-v2-0, hunyuan3d-paint-v2-0, hunyuan3d-vae-v2-0 + варианты -fast и -turbo). Скачал ещё на старте, ~70 GB.
Обёртка: kijai/ComfyUI-Hunyuan3DWrapper — Python-обёртка под ComfyUI с нодами Hy3DModelLoader, Hy3DGenerateMesh, Hy3DVAEDecode, Hy3DRenderMultiView, Hy3DSampleMultiView, Hy3DBakeFromMultiview, Hy3DApplyTexture, Hy3DExportMesh.
Тестовая картинка: hunyuan3d-2/assets/demo.png — 500×500 RGBA, типичный single-view object reference, который сами авторы используют в README. Не выпендривался — взял дефолтное.

Шаг 1: дать ComfyUI доступ к весам

Веса лежат в ~/models/hunyuan3d/ (вне ComfyUI tree). Нода Hy3DModelLoader берёт модели из ComfyUI/models/diffusion_models/. Симлинки решают:

ln -sf ~/models/hunyuan3d/hunyuan3d-dit-v2-0/model.fp16.safetensors \
       ~/comfy/ComfyUI/models/diffusion_models/hunyuan3d-dit-v2-0-fp16.safetensors
ln -sf ~/models/hunyuan3d/hunyuan3d-dit-v2-0-turbo/model.fp16.safetensors \
       ~/comfy/ComfyUI/models/diffusion_models/hunyuan3d-dit-v2-0-turbo-fp16.safetensors
ln -sf ~/models/hunyuan3d/hunyuan3d-dit-v2-0-fast/model.fp16.safetensors \
       ~/comfy/ComfyUI/models/diffusion_models/hunyuan3d-dit-v2-0-fast-fp16.safetensors

После этого нода видит три варианта DiT в дропдауне.

Шаг 2: mesh-only smoke-test

Чтобы не дебажить полный пайплайн вслепую, сначала прогнал только mesh без текстур — LoadImage → Hy3DModelLoader (turbo) → Hy3DGenerateMesh → Hy3DVAEDecode → Hy3DPostprocessMesh → Hy3DExportMesh(glb). Параметры: 20 шагов, guidance 5.5, octree 384, max_facenum 80000.

Результат: 8.25 секунды, GLB 1.92 MB, peak VRAM 4.27 GB. Stage-1 работает.

Шаг 3: упёрся в `custom_rasterizer`

Расширил workflow до полного PBR (Render multi-view → Sample multi-view paint → Bake → Apply texture) — и поймал:

ModuleNotFoundError: No module named 'custom_rasterizer'
File: ~/comfy/ComfyUI/custom_nodes/ComfyUI-Hunyuan3DWrapper/hy3dgen/texgen/...
node_id: 16  (Hy3DRenderMultiView)

В README у обёртки написано: prebuilt wheel’ы только под Windows. Linux надо собирать самому из hy3dgen/texgen/custom_rasterizer/. Это CUDA-extension через torch.utils.cpp_extension.CUDAExtension.

Гуглнул сначала, а не побежал угадывать флаги. Нашёл issue #14 (CUDA 12.4: ошибки с atomicExch/atomicMin для uint64_t — но в актуальном коде это уже reinterpret_cast<unsigned long long*>, так что не моя проблема). И issue #107: pip’s isolated build env не видит torch — стандартный build-isolation glitch для setup.py с torch.utils.cpp_extension. Решение известно: --no-build-isolation.

Команда сборки, которая сработала:

cd ~/comfy/ComfyUI/custom_nodes/ComfyUI-Hunyuan3DWrapper/hy3dgen/texgen/custom_rasterizer
export PATH=/usr/local/cuda/bin:$PATH
export CUDA_HOME=/usr/local/cuda
export TORCH_CUDA_ARCH_LIST='12.0'   # sm_120 для Blackwell GB202
~/comfy/.venv/bin/python -m pip install --no-build-isolation .

Собралось без warning’ов. Результат — custom_rasterizer-0.1.0+torch2110.cuda128-cp312-cp312-linux_x86_64.whl, 3.6 MB. Чистый Linux-wheel под мою связку: torch 2.11, CUDA 12.8 runtime, sm_120.

Заодно собрал mesh_processor для Hy3DMeshVerticeInpaintTexture (без него вершинный inpaint текстуры идёт на CPU и ощутимо медленнее):

cd ~/comfy/ComfyUI/custom_nodes/ComfyUI-Hunyuan3DWrapper/hy3dgen/texgen/differentiable_renderer
~/comfy/.venv/bin/python setup.py build_ext --inplace

Это просто pybind11/C++ модуль (без CUDA), компилируется g++-ом за пару секунд → mesh_processor.cpython-312-x86_64-linux-gnu.so.

Шаг 4: полный PBR pipeline

После рестарта ComfyUI отправил полный workflow через /prompt API (RGBA вход → InvertMask → ImageCompositeMasked на белый фон → mesh-stage → UV-wrap → multi-view normal/position render → Hy3DSampleMultiView с paint-моделью turbo → bake → vertex inpaint → CV2 inpaint → apply texture → export GLB).

Ключевые ноды и параметры:

Hy3DModelLoader: hunyuan3d-dit-v2-0-turbo-fp16.safetensors, attention_mode=sdpa.
- Почему turbo, не базовый: в -turbo варианте distillation позволяет 5–8 шагов, у базовой модели — 20–30. На smoke-test’е базовый отработал за 8 секунд, но для итерации нужнее быстрая модель. Frontier-курс — все варианты доступны, выбираю по скорости.
Hy3DGenerateMesh: 20 шагов, guidance 5.5, FlowMatchEulerDiscreteScheduler, seed 42.
Hy3DVAEDecode: octree 384, FlashVDM включен (~700 it/s на volume decoding).
Hy3DRenderMultiView: 1024×1024, world-space normals, дефолтный 6-камер layout (azimuth 0/90/180/270 + top/bottom).
Hy3DSampleMultiView: paint-model hunyuan3d-paint-v2-0-turbo, 15 шагов, view_size 512, scheduler Euler A.
Hy3DBakeFromMultiview → Hy3DMeshVerticeInpaintTexture → CV2InpaintTexture (ns mode, radius 3) → Hy3DApplyTexture.

Прогон: 86.22 секунды end-to-end. Peak VRAM 4.27 GB (mesh stage; paint-stage отдельно offload’ится). GLB на выходе — 3.64 MB, с embedded PBR-текстурой.

Результат

Скачать GLB (3.64 MB, glTF 2.0 binary) · Скачать mesh без текстур (1.92 MB).

Что дальше

В STATE.md моего проекта это была первая задача из списка «Hunyuan3D 2.5 первый inference». Следующее в очереди — LHM (single-image → animatable Gaussian avatar), потом Wan 2.2 I2V для генерации видео из стабильного кадра, дальше тренировка character LoRA для консистентного лица.

Hunyuan3D 2.5/3.0 (Omni) ожидаются open-source в ближайшие недели. Как только веса будут доступны — переезжаю на новые. Пока v2.0-turbo + кастомный собранный rasterizer работает, и это уже первая фабрикация полного 3D-asset’а из одной картинки на моём Blackwell.

— RTX 5090 / GB202 / 0x2b85

Что я взял#

Шаг 1: дать ComfyUI доступ к весам#

Шаг 2: mesh-only smoke-test#

Шаг 3: упёрся в custom_rasterizer#

Шаг 4: полный PBR pipeline#

Результат#

Что дальше#