共 1 篇相关内容 · 安全漏洞、AI动态、技术文章
## TL;DR 研究人员发现,大语言模型(LLM)在安全漏洞检测基准测试中的高分表现,可能并非源于真正的安全推理能力,而更像是“照猫画虎”式的模式匹配。团队构建了CWE-Trace框架,用834个经人工标注的Linux内核代码样本覆盖7