#llm
共 179 篇相关内容 · 安全漏洞、AI动态、技术文章
技术文章 9
CVE-2026-7482:Ollama「出血骆驼」内存泄露漏洞——30万台AI推理服务器裸奔
Cyera研究团队披露CVE-2026-7482(CVSS 9.1),影响全球约30万台Ollama服务器。攻击者无需认证即可泄露进程完整内存,包括用户提示词、系统提示词和环境变量中的API密钥。
自复制AI蠕虫攻击全面解析:开源大模型新型威胁与防御策略(2026)
研究人员构建出首个完全在本地开源大模型上运行的自复制AI蠕虫。深度解析AI蠕虫传播机制、攻击原理、检测方法及AI系统安全防御策略。
LiteLLM严重漏洞CVE-2026-42271:AI代理框架未授权RCE全解析(2026)
AI代理框架LiteLLM曝严重漏洞CVE-2026-42271,攻击链可实现未授权远程代码执行。深度分析漏洞原理、利用方式、修复方案及AI安全防御策略。
Cursor AI编程工具深度解析:90亿估值背后的开发者变现新范式(2026)
# Cursor AI编程工具深度解析:$290亿估值背后的开发者变现新范式(2026)  > 2025年11月,AI编程工具C
罗福莉与小米MiMo:从DeepSeek到万亿参数Agent模型的技术路线
前DeepSeek研究员罗福莉加入小米后主导MiMo系列模型研发。本文深度解读MiMo-7B、MiMo-V2-Flash、MiMo-V2-Pro等核心论文的技术创新:混合注意力架构、多Token预测、多教师蒸馏、Agent级资源调度,揭示其'Token效率决定AI普及'的核心哲学。
后Transformer时代:2025-2026 AI架构革命全景
Transformer统治AI近十年,但新架构正从多个方向挑战它。本文全景梳理Mamba、RWKV、线性注意力等后Transformer架构的最新进展与技术路线。
推理模型的本质:你的思维链其实是在压缩上下文
arXiv论文揭示大语言模型推理过程的本质:思维链(Chain-of-Thought)实际上是在做上下文压缩,而非真正的逻辑推理。对理解LLM工作原理有重要启示。
搜索 Agent 的真相:它们真的在搜索吗?
最新论文LiveBrowseComp揭示当前搜索Agent的真相:它们并非在'真正搜索',而是在'验证已知'。对搜索Agent的评测方法和实际能力提出质疑。
Agent 记忆革命:从静态仓库到动态演化网络
两篇最新arXiv论文重新定义AI Agent记忆系统:从'存储'到'连接',从'静态'到'演化'。Rethinking Memory提出连续演化连接网络,MemTrace实现记忆追踪与分析。
情报动态 170
OpenRouter免费模型增至60+个
OpenRouter免费模型从27个增至60+个(含Kimi K2.6)。免费层200次/天,充值10 credits后1000次/天。
联通云 Coding Plan: 免费GLM-5/Qwen3.5/MiniMax
联通云推出0元Coding Plan,支持GLM-5、Qwen3.5、MiniMax模型。Lite版1.8万次/月,Pro版9万次/月。12000个免费名额先到先得,每日1200次上限。
腾讯混元 Hunyuan-Lite 升级为永久免费不限量
腾讯混元Hunyuan-Lite模型永久免费不限量调用。原平台2026年9月30日停服迁移至TokenHub。微信小程序成长计划赠1亿混元token(2026年底前)。
⚠️ DeepSeek deepseek-chat/reasoner 将于2026-07-24停用
DeepSeek将于2026年7月24日停用deepseek-chat和deepseek-reasoner模型。V3-Lite永久免费不限量替代。开发者需尽快迁移。
MemPalace/mempalace — Best open-source AI memory system
基准测试最强的开源AI记忆系统,55K stars,基于ChromaDB,Python实现。
小米MiMo-V2.5-Pro-UltraSpeed发布:1T参数模型突破1000 TPS
小米与TileRT合作发布MiMo-V2.5-Pro-UltraSpeed,首次在1万亿参数模型上实现1000 tokens/s解码速度。API通过百炼平台开放,需申请。百炼平台100万tokens免费(90天)。
NVIDIA NIM 2026年取消Credits限制改为纯速率限制模式
NVIDIA NIM自2026年起取消此前的1000 Credits注册赠送模式,改为纯速率限制。支持100+免费模型包括DeepSeek-V4 Pro、Kimi-K2.5、GLM-5.1、Llama-4、Nemotron-3等,OpenAI 100%兼容格式,无需绑信用卡。
讯飞星辰MaaS开放Qwen3.6/Qwen3.5免费不限量调用
讯飞星辰MaaS平台开放Qwen3.6-35B-A3B和Qwen3.5-35B-A3B两款模型免费不限量调用,token无上限。Qwen3.6为阿里千问2026年4月开源的MoE模型,350亿参数。限时免费至6月底。讯飞星辰三方开发者日均Tokens调用量同比涨4241%。
MemPalace/mempalace — Best-benchmarked open-source AI memory system
开源AI记忆系统,基准测试领先,55K stars,为AI agent提供持久化、可检索的长期记忆能力。
FreeLLMAPI更新: 聚合16个提供商,~1.7B tokens/月
开源FreeLLMAPI项目从14个提供商扩展到16个,每月可获约1.7B tokens免费额度(从800M提升),单一OpenAI兼容endpoint。
Genbo.ai: 免费无限AI图像/视频/聊天模型API
免费无限使用开源模型,覆盖图像生成、视频创建、语言模型。GPU计算H100 $2.835/h,付费模型低价透明计费。
DMXAPI: 22+款免费大模型API聚合平台(国内直连)
LangChain中文网提供的AI模型聚合平台,22+款免费模型包括MiniMax-M2.7-free、GLM-5-free、Gemma 4、qwen-flash-free等,OpenAI兼容接口,国内直连无需翻墙。
UnoRouter: 134个免费AI模型聚合为单一endpoint
UnoRouter聚合15个免费提供商(Groq/Gemini/Cerebras/SambaNova/Mistral/Cloudflare/GitHub Models等)的134个免费模型,提供OpenAI兼容endpoint,$0/token,自动故障转移。2026-06-08上线。
MemPalace — Best-benchmarked open-source AI memory system
The best-benchmarked open-source AI memory system. Free. 55K+ stars. Uses ChromaDB for vector storage, supports MCP protocol. MIT licensed.
Google Gemini:2.0系列关闭,升级至3.5 Flash
2026年6月1日起,Gemini 2.0系列模型已关闭。请使用Gemini 3.5 Flash或3.1 Flash Lite。免费层仍可用,但需更新模型版本。
昆仑万维SkyClaw-v1.0:Agent专用模型免费试用
天工AI发布的Agent专用大语言模型,100万上下文窗口,原生Agent训练范式。2-4周免费试用期,在APIFree平台提供。
Embercloud:初创企业$100免费API额度
面向初创企业和独立开发者,提供$100免费API额度。支持GLM-5、GLM-4.7等模型,OpenAI兼容接口,零冷启动,需申请审核。
美团龙猫LongCat API:每日5500万Token免费
美团自研560B MoE架构大模型开放平台,OpenAI兼容接口。Flash-Lite每日5000万Token,Flash系列共享500万,2.0-Preview 500万(可通过反馈刷至1.2亿)。支持代码生成、Agent推理、数字人视频生成等。
OpenRouter免费模型扩展至27个(含Kimi K2.6)
OpenRouter免费模型数量从11+扩展至27个(2026年6月),新增Kimi K2.6、Gemma 3等。200次/天免费,充值10 credits后可解锁1000次/天。
WisGate创业计划 — 最高$2,000免费API额度
WisGate面向AI创业团队开放限时Startup Credits计划(2026.5.26-6.26),审核通过可获最高$2,000 API额度,覆盖LLM/图像/编码模型,OpenAI兼容。
AIMLAPI — 400+ AI模型免费试用,单一API Key
AIMLAPI聚合400+ AI模型(GPT-5.1、Claude 4.5、Gemini 3、Grok 4.1、DeepSeek V3.2等),一个API Key免费试用,无需信用卡。支持文本和图像生成。
Kimi K2.6 在 OpenRouter 完全免费开放
月之暗面Kimi K2.6模型在OpenRouter上线免费版(:free),支持262K上下文窗口,原生多模态,专为长程编程和多Agent编排设计。输入输出全免费。
ZeroLimitAI — 永久免费AI API,自动路由最佳模型
ZeroLimitAI提供永久免费AI API,OpenAI兼容接口,200+模型,ZeroOptimize™自动将请求路由到最佳免费模型(Gemini 2.5 Flash/Llama 4/DeepSeek R1)。无需信用卡。
Atomesus Cipher 8B API — $300-$10,000 Free Credits
印度AI公司Atomesus发布Cipher 8B模型,面向开发者开放API,申请即可获得$300-$10,000免费额度,无需支付信息。模型支持100种语言,33T tokens训练,代码能力突出(HumanEval 88.4)。
Agnes AI 永久免费开放全部API — 新加坡排名Top10的AI Lab
Agnes AI(Sapiens AI旗下)宣布2026年6月1日起永久免费开放多模态API(文本/图片/视频),无订阅无配额限制。全球AI Lab排名第9,TokenPlan最低$4/月起。支持OpenClaw兼容模型。
Google Gemini Flash 免费层升级至1500RPD
Gemini Flash免费层15RPM/1500RPD(之前1000RPD),Flash-Lite 30RPM GA上线。Pro已移除免费层。
硅基流动 SiliconCloud 9B以下小模型永久免费
硅基流动注册送2000万tokens,9B以下小模型永久免费(限并发)。支持DeepSeek-R1、Qwen3.5、GLM-4、MiniMax等全栈开源模型。
国内大模型价格战加剧 | 豆包收费、DeepSeek永久降价
2026年5月国产大模型格局大洗牌:豆包开始收费,DeepSeek永久降价,通义千问3.7杀入全球前15。免费额度窗口正在缩小。
DeepSeek V4系列发布 | V4-Flash免费 | V4-Pro付费
DeepSeek V4系列发布,V4-Flash完全免费,V4-Pro付费。支持思考模式切换。阿里云百炼也可调用DeepSeek V4。
Together AI 免费额度升至$100 | 200+开源模型
Together AI新用户免费额度从$25升至$100,覆盖200+开源模型(Llama 4、DeepSeek-V3、Qwen、Mixtral等)。无需信用卡。
xAI Grok $25注册+每月$150数据贡献计划
xAI注册送$25额度,加入数据贡献计划可获每月$150免费额度,首月共$175。Grok-3 Mini仅$0.30/$0.50/M tokens。
Google Gemini 2.5 Flash-Lite GA上线 | 免费层30RPM
Gemini 2.5 Flash-Lite正式GA,免费层30RPM/1M TPM,比Flash更高RPM。Gemini 2.5 Pro免费层5RPM/100RPD。Flash免费层15RPM/1000RPD。
通义千问 新用户7000万免费tokens | 3个月有效
阿里云百炼Token Plan,新用户至高享7000万免费tokens,支持Qwen3、DeepSeek、Kimi系列。Qwen2.5-72B不限速。
百度千帆 Token福利包上线 | 积分计量体系
百度千帆推出统一AI使用额度产品Token福利包,兼容主流AI编程工具。积分计量体系,5万-80万积分/月,首购优惠¥45-800。支持17个模型各100万tokens。
MiniMax M3 发布 | Token Plan订阅制 | 1M上下文
MiniMax M3最新旗舰模型,原生多模态、1M上下文窗口,支持Agent推理/工具调用/代码。Token Plan订阅制可低价使用全模态模型。
🆓 NVIDIA NIM - Dev Program Credits: 91模型免费试用
DeepSeek V3.2, Devstral-2-123B等91模型,40 RPM,需注册Dev Program
Google Gemini Free Tier更新: Flash 1500RDP + Flash-Lite 30RPM
Google Gemini免费层更新:Flash 1500请求/天/10RPM,Flash-Lite 30RPM/1M TPM,Pro已从免费层移除。仍为最慷慨的免费LLM API。
Google Gemini 2.5 Flash-Lite GA: 免费层30RPM/1M TPM
Gemini 2.5 Flash-Lite正式GA上线,免费层30RPM/1M TPM,比Flash的10RPM更高。Flash免费层1500RDP/10RPM不变。无需信用卡。
Anthropic Claude for Open Source: 开源维护者6个月Claude Max 20x免费
Anthropic推出Claude for Open Source计划,开源项目维护者可申请6个月Claude Max 20x免费使用(价值$1200),共10000个名额。需要验证开源项目维护者身份。
🆓 NVIDIA NIM Dev Program: 91模型免费试用
NVIDIA NIM Dev Program提供91个模型免费试用,包括DeepSeek V3.2、Devstral-2-123B等。40 RPM,需注册Dev Program。
Together AI 免费额度提升至$25(原$5)
Together AI 新用户免费额度从$5提升到$25,支持80+免费模型(Llama, DeepSeek, Qwen等),无需信用卡
[AI Token] ⚠️ 价格变动 Cloudflare Workers AI - Free Tier: 10K neurons/天免费
10K neurons/天免费 | Llama 3.3 70B, Kimi K2.5,边缘AI推理
[AI Token] ⚠️ 价格变动 HuggingFace - Inference API: 免费推理(限<10B参数模型)
免费推理(限<10B参数模型) | ⚠️ 免费层限<10B参数模型,PRO $9/月含2M credits
[AI Token] ⚠️ 价格变动 Groq - Free Inference: 免费(30RPM,100K-500K tok/day)
免费(30RPM,100K-500K tok/day) | LPU硬件超快推理
[AI Token] ⚠️ 价格变动 Google Gemini - Free Tier: Flash免费层(Pro已移除)
Flash免费层(Pro已移除) | 2026年4月起Pro不再免费,Flash仍免费。10RPM,250K TPM
[AI Token] ⚠️ 价格变动 智谱AI - GLM API: GLM-4.7-Flash 完全免费不限量
GLM-4.7-Flash 完全免费不限量 | 200K上下文,QPS=30。CogView-3-Flash图像免费,CogVideoX-Flash视频免费
[AI Token] ⚠️ 价格变动 DeepSeek - DeepSeek-V4 API: 完全免费(开源+免费API)
完全免费(开源+免费API) | V4-Pro/V4-Flash 1M上下文,开源可本地部署,API按量计费极低
[AI Token] 🆕 新增 Replicate - Trial Credits: 试用credits(按模型计费)
试用credits(按模型计费) | 部分模型有试用免费入口,非稳定免费层
[AI Token] ⚠️ 价格变动 DeepSeek - 分层计费调整: V3/R2部分模型高频用户限流
V3/R2部分模型高频用户限流 | ⚠️ 免费Token不再无限撸,高频用户启动限流
[AI Token] ⚠️ 价格变动 智谱AI - GLM API 价格调整: GLM-4免费额度缩水,API提价
GLM-4免费额度缩水,API提价 | ⚠️ 免费额度缩水,个人用户月度额度下降。GLM-4.7-Flash仍免费但GLM-4 Flash需申请
[AI Token] 🆕 新增 硅基流动 SiliconFlow - 注册送tokens: 注册送2000万tokens + 9B以下小模型永久免费
注册送2000万tokens + 9B以下小模型永久免费 | OpenClaw官方推荐,拉新再送14元(~700万tokens),API兼容OpenAI格式
Sophomoresty/gemini-web2api — 将 Gemini 网页版转为 OpenAI 兼容 API
零认证、跨平台、单文件实现,将 Google Gemini 网页版转换为标准 OpenAI 兼容 API 接口。为开发者提供免费调用 Gemini 能力的途径。近期热度上升。