Monday, Jan 1, 0001 | 2 minute read | Updated at Monday, Jan 1, 0001

@

CLIP Score语义对齐评估 - Infographic View

STEP 1: 多视角渲染 (Multi-view Rendering)

  • 3D资产 → 渲染4+个视角图像
  • 固定渲染器/光照/相机分布
  • 视角: 菲波那契球面采样/均匀分布

STEP 2: CLIP编码 (CLIP Encoding)

  • 图像编码器: E_I(I) → 图像特征向量
  • 文本编码器: E_T(T) → 文本特征向量
  • 模型: ViT-B/32 或 ViT-L/14

STEP 3: 相似度计算 (Similarity)

  • CLIP-Score = max(100·cos(E_I, E_T), 0)
  • 取多视角平均
  • 值域: [0, 100]

STEP 4: 对齐评估 (Alignment Assessment)

  • 高分: 生成内容与文本语义一致
  • 低分: 语义偏离

TRAP 1 - 提示工程敏感性:

  • “a dog” vs “a photo of a dog” → 分数差异显著
  • 必须固定提示模板
  • 禁止对不同方法使用不同模板

TRAP 2 - 训练分布偏差:

  • CLIP偏好照片级真实感 → 低估卡通/风格化
  • 渲染图 vs 自然图像的域差异
  • 解决: 领域特定CLIP微调

SUPPLEMENT - CLIP R-Precision:

  • 给定生成图像 + N个候选文本(1正确+N-1干扰)
  • 计算正确文本的top-k检索比例
  • 更好反映模型是否"理解"文本

ARROW FLOW: 3D资产 → 多视角渲染 → CLIP编码 → 余弦相似度 → CLIP Score

Flat vector infographic with horizontal flow. Clean sequential layout. PALETTE: macaron — soft pastel color blocks COLORS: Warm Cream background (#F5F0E8), Blue (#A8D8EA) for rendering/encoding steps, Mint (#B5E5CF) for similarity step, Lavender (#D5C6E0) for assessment, Coral Red (#E8655A) for trap warnings, Mustard Yellow (#F2CC8F) for CLIP Score formula and supplement ELEMENTS: Horizontal pipeline with 4 main steps, two warning/trap cards below the pipeline (with alert icons), supplement card for R-Precision, CLIP encoder diagram (image→feature, text→feature), cos similarity diagram ASPECT: 16:9

Clean composition with generous white space. Simple or no background. Main elements centered or positioned by content needs. Color values (#hex) and color names are rendering guidance only — do NOT display color names, hex codes, or palette labels as visible text in the image. Text should be large and prominent with handwritten-style fonts. Keep minimal, focus on keywords. Language: Chinese.

© 2021 - 2026 古月月仔的博客

🌱 Powered by Hugo with theme Dream.

关于我
  • 我是古月月仔
  • Shimizu Tou||Ethan Hu
  • 分享技术学习笔记与生活感悟杂谈
  • 现居: 上海 中国
  • 家乡: 平遥 山西
日常效率工具
  • 📝Typora — Markdown极简编辑器。
  • 📓Notion — 一站式笔记工作空间。
  • 🔗N8N — 强大的节点编排工作流工具。
  • 🤖Gemini — 好用的智能 AI 助手。
  • IamgetoUrl - 快速将图片转为URL。
  • Anyconv - 多种文件格式转换在线工具。
  • PDF24 - PDF编辑操作在线工具箱。
内容与资源工具
  • Mixamo - Adobe提供的免费角色动画库。
  • Bunlock-Music - 用于解密.ncm,.qmc类音频格式的工具。
  • EasyGIT - 一款在线GIF动图制作工具。
  • Alphacoders - 海量高清壁纸和影视/游戏原图社区。
  • 哲风壁纸 -中文壁纸分享与交流社区。
  • 爱给网 - 免费音效、配乐、视频模板等海量媒体素材。
  • 模之屋 - 专注于分享各类3D模型的社区。
我的爱好
  • 🚀 喜欢折腾各种好玩的应用技术
  • 📸 业余摄影爱好者
  • 🎮 各类游戏玩家
  • 💻 数码产品折腾爱好者
  • 📚 正在阅读:《人类简史》
  • 🎬 经典重温:《爱乐之城》