XTCer
首页
优惠
情报
首页
标签
arxiv
#arxiv
共 2 篇相关内容 · 安全漏洞、AI动态、技术文章
相关标签:
#agent
1
#multimodal
1
#reasoning
1
#self-improvement
1
#evolution
1
#training
1
情报动态
2
AI
🟢
Agent Explorative Policy Optimization for Multimodal Agentic Reasoning
多模态Agent通过探索性策略优化推理,解决需要外部工具的复杂问题
5月28日 14:39
AI
🟢
Self-Improving LMs: 双向进化搜索让LLM自我改进
双向进化搜索方法让语言模型和Agent系统自我改进,比传统RLVR更高效
5月28日 14:39
ESC
输入关键词开始搜索