Monday, Jan 1, 0001 | 2 minute read | Updated at Monday, Jan 1, 0001

@

threestudio解耦生成管线 - Infographic View

INPUT: 文本/图像 (Text/Image)

MODULE 1: PromptProcessor (提示处理)

  • 输入: “a hamburger” / 参考图像
  • CLIP文本编码 → 文本嵌入
  • 支持: 加权提示 “the hamburger::5, blurry::-2”
  • 输出: prompt_utils (含conditional/unconditional嵌入)

MODULE 2: Guidance (2D扩散先验)

  • StableDiffusionGuidance: SD 1.5/2.1
    • SDS损失: w(t)·(ε_φ - ε)
    • CFG scale: 100 (SDS) / 7.5 (VSD)
  • DeepFloydGuidance: DeepFloyd IF (更高质量)
  • Zero123Guidance: 单视图条件生成
  • 接口: (rgb, prompt_utils) → {loss_sds, …}
  • 关键: 扩散模型冻结, 仅提供梯度信号

MODULE 3: Geometry (3D表示)

  • ImplicitVolume: NeRF密度场
  • GaussianSplatting: 3D高斯泼溅
  • Mesh: 显式网格+可微光栅化
  • 输出: 可渲染3D表示

MODULE 4: System (训练策略)

  • DreamFusion: SDS + 单一优化
  • Magic3D: 两阶段粗到精
  • ProlificDreamer: VSD (变分分数蒸馏)
  • Fantasia3D: 几何与材质解耦

DESIGN PATTERN: System = Geometry + Guidance + PromptProcessor

  • 修改geometry_type: NeRF ↔ 3DGS ↔ Mesh
  • 修改guidance_type: SDS ↔ VSD ↔ Zero123
  • 无需修改Python代码!

PIPELINE FLOW: 文本/图像 → PromptProcessor → Guidance(梯度) → Geometry(3D表示) → 渲染 ↑ ↓ └─────── System ────────┘

Flat vector infographic with horizontal modular pipeline. Clear component separation. PALETTE: macaron — soft pastel color blocks COLORS: Warm Cream background (#F5F0E8), Peach (#FFD5C2) for PromptProcessor, Lavender (#D5C6E0) for Guidance, Blue (#A8D8EA) for Geometry, Mint (#B5E5CF) for System, Coral Red (#E8655A) for design pattern and swap arrows, Mustard Yellow (#F2CC8F) for YAML config emphasis ELEMENTS: Horizontal pipeline with 4 main modules, swap arrows between modules (showing replaceability), YAML config card showing geometry_type/guidance_type switches, System wrapper around modules, frozen model icon (snowflake) on Guidance ASPECT: 16:9

Clean composition with generous white space. Simple or no background. Main elements centered or positioned by content needs. Color values (#hex) and color names are rendering guidance only — do NOT display color names, hex codes, or palette labels as visible text in the image. Text should be large and prominent with handwritten-style fonts. Keep minimal, focus on keywords. Language: Chinese.

© 2021 - 2026 古月月仔的博客

🌱 Powered by Hugo with theme Dream.

关于我
  • 我是古月月仔
  • Shimizu Tou||Ethan Hu
  • 分享技术学习笔记与生活感悟杂谈
  • 现居: 上海 中国
  • 家乡: 平遥 山西
日常效率工具
  • 📝Typora — Markdown极简编辑器。
  • 📓Notion — 一站式笔记工作空间。
  • 🔗N8N — 强大的节点编排工作流工具。
  • 🤖Gemini — 好用的智能 AI 助手。
  • IamgetoUrl - 快速将图片转为URL。
  • Anyconv - 多种文件格式转换在线工具。
  • PDF24 - PDF编辑操作在线工具箱。
内容与资源工具
  • Mixamo - Adobe提供的免费角色动画库。
  • Bunlock-Music - 用于解密.ncm,.qmc类音频格式的工具。
  • EasyGIT - 一款在线GIF动图制作工具。
  • Alphacoders - 海量高清壁纸和影视/游戏原图社区。
  • 哲风壁纸 -中文壁纸分享与交流社区。
  • 爱给网 - 免费音效、配乐、视频模板等海量媒体素材。
  • 模之屋 - 专注于分享各类3D模型的社区。
我的爱好
  • 🚀 喜欢折腾各种好玩的应用技术
  • 📸 业余摄影爱好者
  • 🎮 各类游戏玩家
  • 💻 数码产品折腾爱好者
  • 📚 正在阅读:《人类简史》
  • 🎬 经典重温:《爱乐之城》