#扩散模型
共 3 篇相关内容 · 安全漏洞、AI动态、技术文章
技术文章 3
一个3D模型,两张脸:JanusMesh如何用交叉空间去噪打造零样本三维视觉错觉
## 引言:当三维物体学会了"变脸" 你有没有看过那种经典的心理学图片——一张人脸的侧影,换个角度看就变成了一个花瓶?或者那张著名的"鸭兔图",盯着看一会儿是鸭子,再看一会儿又变成了兔子?这类视觉错觉(visual illusion)长期
当"温柔"变成语音:首次解析风格描述如何塑造 AI 语音生成的内部机制
风格描述TTS系统可用自然语言控制语音风格,但每个词如何影响输出一直是黑箱。本文首次将计算机视觉的交叉注意力归因方法迁移到语音扩散模型,分析3600组风格-内容组合,揭示风格词的全局调控特性、与声学参数的关联、以及在扩散早期和深层网络的影响力峰值。
扩散语言模型的推理透明度:DiffusionGemma能否被真正理解?
扩散语言模型DiffusionGemma的推理透明度看似比自回归模型差28.6倍,但通过token瓶颈映射可降至1.1倍。研究还发现了非时序推理、token涂抹等扩散模型独有的推理现象,为新一代语言模型的安全评估奠定基础。