共 1 篇相关内容 · 安全漏洞、AI动态、技术文章
世界模型能否在不被观测时维持物理状态演化?研究者提出WRBench基准测试,通过摄像机视角操控模拟观测中断,对23个模型的9600段视频测试发现:所有现有世界模型都缺乏持久状态内核,本质上是跟踪拍摄器而非真正的世界模拟器。这一缺陷跨越架构范式和模型规模,指向整个领域的评估盲区。