2026年6月GitHub最火项目:6个让AI Agent自动搞研究、管团队、找漏洞的开源利器
数据来源:GitHub Search API | 查询:
created:>2026-03-01+stars:>300、topic:ai-agents+stars:>200、topic:security+stars:>100| 截至 2026-06-18

2026年上半年的GitHub,AI Agent类项目彻底炸了。Karpathy用一个program.md让AI自动做研究、Paperclip把多个Agent编排成一家公司、Anthropic开源了Claude做安全扫描的参考实现——这不是demo,是已经在生产跑的东西。这篇文章拆解6个最有代表性的新项目,从架构到变现路径,一个不落。
目录
- karpathy/autoresearch — AI自动做研究,睡觉出成果
- ultraworkers/claw-code — Agent管理的博物馆展品
- paperclipai/paperclip — 给AI Agent开一家公司
- rohitg00/ai-engineering-from-scratch — 503节课从零学AI工程
- anthropics/defending-code-reference-harness — Claude自动找漏洞
- safishamsi/graphify — 一条命令把代码变成知识图谱
- 横向对比
- 趋势判断
1. karpathy/autoresearch
GitHub: karpathy/autoresearch | ⭐ 87,491 | 🍴 — | Python | MIT

Karpathy的新项目,核心思路极其简洁:给AI Agent一个真实的单GPU训练环境,让它自主做实验。Agent修改代码、训练5分钟、检查结果是否改善、保留或丢弃、然后重复。你睡一觉起来,收获一份实验日志和(希望是)更好的模型。
技术原理
整个仓库只有三个文件:prepare.py(数据准备,不动)、train.py(Agent改这个)、program.md(人改这个,控制Agent行为)。program.md本质上是一个极简"skill"——你用Markdown描述研究组织的规则,Agent在这个框架下自主实验。
关键设计决策:
- 固定5分钟训练预算:无论Agent改了什么(模型大小、batch size、架构),每次实验严格5分钟。这保证了实验之间的可比性,每小时约12次实验,睡一觉约100次
- 单文件修改:Agent只动
train.py,scope可控,diff可审 - 指标是val_bpb(验证集bits per byte):lower is better,且与vocab size无关
# 快速开始
curl -LsSf https://astral.sh/uv/install.sh | sh
uv sync
uv run prepare.py # 数据准备(一次性,约2分钟)
uv run train.py # 手动跑一次确认环境OK
然后启动Claude/Codex(关掉所有权限检查),指向program.md,让它开始自主研究。
适用场景
不适合:没有GPU的纯软件开发者(你需要实际训练环境)。
变现思路
- AI研究自动化服务:帮研究团队搭建autoresearch环境,优化
program.md,收费$500-2000/次 - 课程内容:基于autoresearch出"AI自动研究"教程,卖$49-199
- 咨询:帮企业用autoresearch做模型优化,按效果收费
2. ultraworkers/claw-code
GitHub: ultraworkers/claw-code | ⭐ 194,012 | 🍴 — | Rust | MIT

这个项目194K星,但README第一句话就告诉你:"这不是一个正经的生产项目。"它是一个agent-managed museum exhibit——由AI Agent自动维护的博物馆展品。真正的生产工具是它引用的LazyCodex和Gajae-Code。
技术原理
Claw Code的哲学:如果你的代码仓库可以完全由Agent管理——规划、执行、验证、打标签、维护——那它就是一个"活的展品"。人类不碰代码,只定义harness(Agent的运行规则)。
这个项目本身是Rust写的,展示了Agent如何:
- 自动维护仓库(清理、打标签、更新文档)
- 按照预定义的harness执行任务
- 自我验证输出质量
核心价值不在代码本身,而在它证明了一种可能性:代码仓库可以是完全自治的。
同类对比
| 项目 | 定位 | Agent自动化程度 | 语言 |
|---|---|---|---|
| claw-code | 证明agent自治可行性 | 100%(仓库本身) | Rust |
| LazyCodex | 生产级codex框架 | 可配置 | — |
| Gajae-Code | Agent harness | 可配置 | — |
变现思路
3. paperclipai/paperclip
GitHub: paperclipai/paperclip | ⭐ 70,857 | 🍴 — | TypeScript | MIT

"如果OpenClaw是一个员工,Paperclip就是一家公司。"——这句话精准概括了Paperclip的定位。它是一个Node.js + React的Agent编排平台,让你定义商业目标、雇佣Agent团队、分配预算、监控进度。
技术原理
Paperclip不只是一个任务队列。它在底层实现了:
- 组织架构:CEO、CTO、工程师、设计师、市场——每个角色可以是不同的Agent
- 预算管理:为每个Agent设token/费用上限
- 目标对齐:把高层商业目标拆解为可执行的子任务
- 治理:审批流程、工作审计
支持的Agent后端:OpenClaw、Claude Code、Codex、Cursor、Bash、HTTP——"只要能接收heartbeat,就能被雇佣。"
# 快速开始
git clone https://github.com/paperclipai/paperclip
cd paperclip
npm install
npm run dev
适用场景
- 同时运行20+个Claude Code终端,需要统一管理
- 想搭建"AI公司",有CEO/CTO/工程师各司其职
- 需要监控Agent成本、控制预算
- 想从手机管理Agent工作
变现思路
- AI公司搭建服务:帮团队配置Paperclip + Agent团队,$2000-5000/次
- SaaS托管:提供Paperclip云托管,按Agent数量收费$50-200/月
- 培训:出"如何用AI Agent搭建公司"课程
4. rohitg00/ai-engineering-from-scratch
GitHub: rohitg00/ai-engineering-from-scratch | ⭐ 34,277 | 🍴 — | Python | MIT

503节课,20个阶段,约320小时,覆盖Python、TypeScript、Rust、Julia四种语言。从线性代数到自主Agent群——这是目前最完整的AI工程免费课程。
课程结构
20个阶段层层递进:
| 阶段 | 内容 | 关键产出 |
|---|---|---|
| P0 | 环境搭建 | 工具链 |
| P1 | 数学基础 | 线性代数、概率论实现 |
| P2-P5 | 从零实现神经网络 | 手写反向传播、优化器 |
| P6-P10 | NLP/Transformer | Tokenizer、Attention、GPT |
| P11-P15 | Agent基础 | Function calling、MCP |
| P16-P20 | 生产级Agent | 多Agent系统、部署 |
每一课的循环:读问题→推导数学→写代码→跑测试→保留产出物。没有5分钟视频,没有复制粘贴部署。
数据
月访问150,639读者,241,669页面浏览(截至2026-06-07)。社区极其活跃。
变现思路
- 付费辅导:基于课程结构提供1对1辅导,$100-300/小时
- 企业培训:把课程改编为企业内部培训,$5000-20000/期
- 认证服务:设计配套的考核和认证体系
5. anthropics/defending-code-reference-harness
GitHub: anthropics/defending-code-reference-harness | ⭐ 6,078 | 🍴 — | Python | Apache-2.0

Anthropic官方开源的漏洞发现参考实现。基于Claude,实现了完整的autonomous vulnerability discovery pipeline:recon → find → verify → report → patch。
技术原理
提供两套工具:
Claude Code Skills(交互式):
/quickstart— 30秒入门引导/threat-model— 威胁建模/vuln-scan— 漏洞扫描/triage— 漏洞分类/patch— 自动修复/customize— 适配到你的代码库
自主Pipeline(无人值守): 完整的recon → find → verify → report → patch循环,默认配置用于C/C++内存漏洞检测(使用Docker + ASAN)。关键安全设计:自主pipeline必须在gVisor沙箱中运行,否则拒绝执行。
git clone https://github.com/anthropics/defending-code-reference-harness
cd defending-code-reference-harness
claude
> /quickstart
适用场景
- 安全团队想用AI做代码审计
- 想把Claude集成到CI/CD安全扫描流程
- 研究AI做安全的best practices
变现思路
- AI安全审计服务:基于此harness为企业做代码安全审计,$5000-20000/次
- 定制化部署:帮安全团队把harness适配到他们的代码库和漏洞类型
- 培训:出"AI驱动的安全审计"课程
6. safishamsi/graphify
GitHub: safishamsi/graphify | ⭐ 68,963 | 🍴 — | Python | MIT

YC S26项目。在AI编码助手里输入/graphify,它会扫描你的整个项目——代码、文档、PDF、图片、视频——生成一个知识图谱。从此不再grep,而是查询图谱。
技术原理
一条命令,三个输出文件:
graphify-out/
├── graph.html # 浏览器打开,点击节点、过滤、搜索
├── GRAPH_REPORT.md # 关键概念、意外连接、建议问题
└── graph.json # 完整图谱,随时查询无需重新扫描
支持的AI助手覆盖极广:Claude Code、Codex、OpenCode、Cursor、Gemini CLI、GitHub Copilot CLI、VS Code Copilot Chat、Aider、OpenClaw、Hermes、Kimi Code等20+种。
安装:
# 推荐用uv
uv tool install graphifyy
# 或pipx
pipx install graphifyy
适用场景
- 大型代码库需要快速理解架构
- 新人onboarding,想快速建立项目心智模型
- 需要发现代码中隐藏的依赖和连接
- 写文档时需要自动化的架构分析
变现思路
- 代码库分析服务:帮团队生成项目知识图谱,$500-2000/次
- 集成服务:把graphify集成到团队的CI/CD和文档流程
- 企业版:提供团队协作版图谱共享和更新
横向对比
| 项目 | ⭐ Stars | 语言 | 许可证 | 核心价值 |
|---|---|---|---|---|
| claw-code | 194K | Rust | MIT | 证明Agent自治仓库的可行性 |
| autoresearch | 87K | Python | MIT | 让AI自主做LLM研究实验 |
| paperclip | 71K | TypeScript | MIT | Agent团队编排,像管理公司 |
| graphify | 69K | Python | MIT | 一条命令生成代码知识图谱 |
| ai-engineering-from-scratch | 34K | Python | MIT | 最完整的AI工程免费课程 |
| defending-code-harness | 6K | Python | Apache-2.0 | Claude自动发现和修复漏洞 |
趋势判断
1. Agent从"工具"变成"组织":Paperclip把Agent编排成公司架构(CEO/CTO/工程师),claw-code证明仓库可以完全自治。Agent不再是单个工具调用,而是有角色、有层级、有预算的组织单元。
2. "人写规则,Agent执行"成为主流范式:autoresearch的program.md、claw-code的harness、defending-code的skills——核心都是人用Markdown定义规则,Agent在框架内自主执行。这是2026年AI工程的默认模式。
3. AI安全从"可选"变成"必须":Anthropic开源漏洞发现harness、microsoft/agent-governance-toolkit(4K⭐)做Agent治理——安全不再是事后补丁,而是Agent系统的一等公民。
4. 学习资源的军备竞赛:ai-engineering-from-scratch的503节课、graphify的知识图谱——开发者学习AI的工具链正在快速成熟,门槛在降低但内容在加深。
数据来源:GitHub Search API | created:>2026-03-01+stars:>300、topic:ai-agents+stars:>200、topic:security+stars:>100 | 查询时间 2026-06-18
评论