#deep-learning
共 8 篇相关内容 · 安全漏洞、AI动态、技术文章
技术文章 8
分布偏移下如何让混合专家模型校准可靠?ICML 2026新研究给出答案
ICML 2026论文研究了混合专家模型(MoE)在分布偏移下的校准问题。核心发现:硬路由MoE中专家校准可保证整体校准,软路由中则不然。研究者提出对抗性重加权方法,显著改善准确率-校准度权衡,对医疗AI、自动驾驶等高风险场景具有重要应用价值。
分布漂移下如何让混合专家模型保持校准?ICML 2026最新研究揭示路由机制的关键影响
本文解读ICML 2026论文,研究MoE模型在分布漂移下的校准问题。核心发现:硬路由MoE中专家级校准足以保证整体校准,但软路由不行。作者提出对抗性重加权方法改善软路由校准,在准确率-校准权衡上取得显著改善。
用神经网络补全大脑:混合生物物理神经元模型如何用Neural ODEs发现未知离子通道动力学
德国蒂宾根大学团队提出混合建模框架,将神经常微分方程嵌入Hodgkin-Huxley型生物物理模型,从电压记录中学习未知离子通道动力学和树突轴向电流。该方法在2400种离子通道模型上验证成功,能从单次电流钳记录中恢复未知门控动力学,还将多区室皮层神经元模型压缩为单区室模型,计算速度提升一个数量级。
用神经网络补全大脑:混合生物物理神经元模型如何用Neural ODEs发现未知离子通道动力学
德国蒂宾根大学团队提出一种混合建模框架,将神经常微分方程嵌入Hodgkin-Huxley型生物物理模型,从电压记录中学习未知离子通道动力学和树突轴向电流。该方法在2400种离子通道模型上验证成功,能从单次电流钳记录中恢复未知门控动力学,还将多区室皮层神经元模型压缩为单区室模型,计算速度提升一个数量级。
深度Transformer中的自适应推理与功能向量:从均场理论理解大模型如何学习
本文深入解读Ravin Raj和Gautam Reddy的最新研究,该工作从均场相互作用系统的角度重新审视深度Transformer,揭示了模型如何通过功能向量(function vectors)实现分布式推理,在层与层之间逐步推断潜在上下文变量。研究发现前馈模块和网络深度使Transformer能实现远比此前描述更丰富的上下文学习算法。
DeepSWIP:神经概率逻辑程序中的反事实推理新突破
神经符号系统(如DeepProbLog)将神经感知与概率逻辑结合,但标准推理仅限于关联层面。DeepSWIP引入了单世界反事实语义,通过神经物化将神经谓词转化为普通ProbLog选择,再应用SWIP和加权模型计数(WMC)计算反事实。实验表明,该方法在MPI3D数据集上精确匹配DeepTwin构造,推理速度提升2.14倍。HOV实验揭示了神经校准退化对反事实估计的偏差影响。
推荐系统新范式:G2Rec如何用图结构与语义分词统一建模用户兴趣
生成式推荐是工业推荐系统的新兴范式,但现有方法难以同时有效组织和注入复杂的用户行为上下文与物品语义信息。本文解读G2Rec框架:通过统一的图协同建模与语义分词方法,将全局用户共参与图与物品语义分词结合,在无需真实用户兴趣标注的情况下,实现更全面、更准确的用户兴趣原型捕获。该方法已在多个产品线在线部署,并在公开数据集上超越现有方法。
BrainWorld:用结构MRI引导全脑4D fMRI动态生成的全新框架
BrainWorld是一种结构先验条件生成模型,利用sMRI作为解剖学上下文来引导全脑4D fMRI动态生成。该模型在22个数据集上验证,可生成长达400帧的稳定fMRI轨迹,并通过生成样本增强提升下游任务性能,为脑动态建模和多模态表征学习开辟新路径。