llm 相关技术文章与安全漏洞汇总

技术文章 27

RAG知识库实战教程2026：从零搭建企业级智能问答系统，含RAGFlow+Dify+自建方案完整Python代码

# RAG知识库实战教程：从零搭建企业级知识库 ## 什么是RAG RAG（Retrieval-Augmented Generation）= 检索增强生成 **原理：** ``` 用户提问 → 检索相关文档 → 把文档+问题一起给LL

LLM微调实战教程2026：LLaMA-Factory+Unsloth从零到商业化，含完整Python代码

# LLM微调实战教程：LLaMA-Factory + Unsloth ## 为什么学微调 **商业价值：** - 企业定制AI助手：帮公司微调行业专属模型，单次¥5000-¥50000 - 数据标注+微调一条龙：标注→训练→部署，¥2

RAG知识库实战教程2026：从零搭建企业级AI知识库，含完整Python代码

Ollama Bleeding Llama漏洞（CVE-2026-7482）：30万台AI推理服务器面临内存泄露风险

Cyera发现Ollama严重未认证内存泄露漏洞CVE-2026-7482（CVSS 9.1），攻击者无需凭据即可读取进程内存。全球约30万台暴露实例受影响，附检测脚本和修复方案。

LLM真的懂安全漏洞吗？CWE-Trace框架揭示大模型的“照猫画虎”困境

## TL;DR 研究人员发现，大语言模型（LLM）在安全漏洞检测基准测试中的高分表现，可能并非源于真正的安全推理能力，而更像是“照猫画虎”式的模式匹配。团队构建了CWE-Trace框架，用834个经人工标注的Linux内核代码样本覆盖7

DiffusionGemma推理透明度研究：扩散语言模型的黑箱到底有多黑

# DiffusionGemma的推理透明度：扩散语言模型的"黑箱"到底有多黑？ ## TL;DR 扩散语言模型DiffusionGemma在连续潜空间中执行大量计算，其推理过程的透明度一直令人担忧。这项研究将透明度分解为"变量透明度"

当安全对齐的大模型看到好坏参半的示范：它到底学到了什么？

安全对齐后的大语言模型在面对混合了有害和无害示范的上下文时，会做出怎样的判断？本文深入解读一项来自多模型实验的系统性研究，揭示了示范内容、排列顺序和训练方法如何共同决定模型的安全行为，并探讨了这对AI安全对齐的深远意义。

当大语言模型在多智能体系统中充当评估者时，它们的系统性评估偏见会在智能体网络中传播。本文解读Contagion Networks论文——研究者提出了一套量化偏见传播的数学框架，发现即使是同一模型的不同实例之间，偏见传播系数也达到0.157-0.352，但同模型传播比跨模型传播弱3-5倍。更关键的是，将评估者委员会规模从1人扩大到3人，能有效降低72.4%的偏见传播。这一发现对设计可靠的AI评估系统具有重要指导意义。

DiffusionGemma 的透明度究竟如何？——扩散语言模型可解释性深度解析

扩散语言模型 DiffusionGemma 的推理透明度比最初预想的要好得多。表面上看，它的不透明串行深度是传统自回归模型 Gemma 4 的 28.6 倍，但通过插入可解释的 token 瓶颈层，可以无损地将这一数值压缩到 1.1 倍。研究还发现了非时序推理、token 涂抹等扩散模型特有的推理现象，并证实 DiffusionGemma 的可监控性与 Gemma 4 相当。

Shadow AI危机：91%企业AI工具无人管控，Gartner警告2026年头号商业风险

Gartner将未管理AI Agent列为2026年头号商业风险。91%企业AI工具处于影子状态，98%组织使用未经批准的AI工具，单次泄露因Shadow AI额外增加67万美元成本。深度分析Shadow AI治理框架和企业应对方案。

你的鼠标和眼睛正在偷偷泄露你的偏好：用隐式反馈对齐大语言模型

研究者构建了IFLLM数据集，收集59名众包工人的鼠标轨迹和眼动数据来训练LLM奖励模型。实验表明，隐式反馈将奖励模型准确率从55%提升至64%，并使DPO对8个LLM的响应质量改善效果近似翻三倍。

你的鼠标和眼神正在泄露你的真实偏好：基于隐式行为信号的大语言模型对齐研究

传统的大语言模型对齐依赖用户显式反馈（如点赞、评分），但这类数据稀缺且昂贵。本文解读Chang等人发表于arXiv的最新研究，该研究构建了IFLLM数据集，通过采集1336个多轮对话中59名众包工人的鼠标轨迹和眼动数据，首次系统量化了隐式行为信号对LLM对齐的价值。基于隐式反馈的奖励模型将准确率从55%提升至64%，在8个LLM上应用DPO后，响应质量的相对提升几乎翻了三倍。

LedgerAgent：用账本思维让AI Agent严格遵守策略，工具调用不再失控

LedgerAgent提出用结构化账本显式维护AI Agent的任务状态，在执行工具调用前检查策略约束。在四个客服领域和多种模型上，该方法显著提升了任务完成率和策略合规率，尤其在长对话和复杂策略场景下优势更大，为构建可靠的工具调用Agent提供了系统性方案。

OWASP Agentic AI Top 10 (2026)：AI Agent安全风险全景解读

OWASP发布首份Agentic AI应用Top 10安全风险报告，涵盖记忆投毒、工具滥用、权限泄露、意图劫持等十大风险类别。87%安全专家认为AI相关漏洞已成2026年最大安全风险。

LiteLLM供应链攻击事件全解析：AI基础设施成为攻击者的首选目标

2026年3月24日，支撑整个AI Agent生态的LiteLLM包遭供应链攻击。攻击者TeamPCP通过Trivy安全工具的凭据泄露链入侵PyPI发布流程，投毒版本窃取9700万API密钥请求。PyPI紧急隔离项目，1.82.9版本已修复。

LLMjacking深度解析：AI基础设施劫持攻击正在爆发，Ollama与LM Studio成重灾区

卡巴斯基2026年报告显示，针对私有LLM服务器的LLMjacking攻击同比增长340%。攻击者劫持Ollama、LM Studio等AI推理服务窃取GPU算力，23%的扫描流量专门探测AI端点。

Gartner 2026四大网络安全威胁深度解析：AI正在改写攻防规则

Gartner发布2026年四大关键网络安全威胁：深度伪造、AI应用入侵、提示注入和软件供应链攻击，其中三项与AI直接相关。本文深度剖析每种威胁的技术原理、真实案例和企业防御策略。

CVE-2026-7482 Ollama Bleeding Llama：CVSS 9.1的AI基础设施内存泄露漏洞深度解析（2026）

Ollama被曝CVSS 9.1严重漏洞CVE-2026-7482，未认证攻击者可泄露服务器全部进程内存，全球超30万台服务器受影响。本文深度剖析漏洞原理、PoC利用链、影响范围及完整修复方案。

CVE-2026-7482：Ollama「出血骆驼」内存泄露漏洞——30万台AI推理服务器裸奔

Cyera研究团队披露CVE-2026-7482（CVSS 9.1），影响全球约30万台Ollama服务器。攻击者无需认证即可泄露进程完整内存，包括用户提示词、系统提示词和环境变量中的API密钥。

自复制AI蠕虫攻击全面解析：开源大模型新型威胁与防御策略（2026）

研究人员构建出首个完全在本地开源大模型上运行的自复制AI蠕虫。深度解析AI蠕虫传播机制、攻击原理、检测方法及AI系统安全防御策略。

LiteLLM严重漏洞CVE-2026-42271：AI代理框架未授权RCE全解析（2026）

AI代理框架LiteLLM曝严重漏洞CVE-2026-42271，攻击链可实现未授权远程代码执行。深度分析漏洞原理、利用方式、修复方案及AI安全防御策略。

Cursor AI编程工具深度解析：90亿估值背后的开发者变现新范式（2026）

# Cursor AI编程工具深度解析：$290亿估值背后的开发者变现新范式（2026） ![hero](https://oss.xtcer.cn/uploads/1b2954967a33.jpg) > 2025年11月，AI编程工具C

罗福莉与小米MiMo：从DeepSeek到万亿参数Agent模型的技术路线

前DeepSeek研究员罗福莉加入小米后主导MiMo系列模型研发。本文深度解读MiMo-7B、MiMo-V2-Flash、MiMo-V2-Pro等核心论文的技术创新：混合注意力架构、多Token预测、多教师蒸馏、Agent级资源调度，揭示其'Token效率决定AI普及'的核心哲学。

后Transformer时代：2025-2026 AI架构革命全景

Transformer统治AI近十年，但新架构正从多个方向挑战它。本文全景梳理Mamba、RWKV、线性注意力等后Transformer架构的最新进展与技术路线。

推理模型的本质：你的思维链其实是在压缩上下文

arXiv论文揭示大语言模型推理过程的本质：思维链(Chain-of-Thought)实际上是在做上下文压缩，而非真正的逻辑推理。对理解LLM工作原理有重要启示。

搜索 Agent 的真相：它们真的在搜索吗？

最新论文LiveBrowseComp揭示当前搜索Agent的真相：它们并非在'真正搜索'，而是在'验证已知'。对搜索Agent的评测方法和实际能力提出质疑。

Agent 记忆革命：从静态仓库到动态演化网络

两篇最新arXiv论文重新定义AI Agent记忆系统：从'存储'到'连接'，从'静态'到'演化'。Rethinking Memory提出连续演化连接网络，MemTrace实现记忆追踪与分析。

情报动态 200

ai_tokens 🟢

Novita AI免费提供腾讯Hy3推理 — $0/MTok

腾讯Hy3在Novita AI上以$0/MTok免费提供。295B MoE/21B active，256K上下文，支持函数调用/结构化输出/推理控制。发布期间零成本。

7月11日 01:32

ai_tokens 🟢

Regolo.ai Builder Program — 欧洲60天无限tokens免费

欧洲AI推理平台Regolo.ai推出Builder Program: 60天无限tokens免费+100+开源模型+EU数据驻留+零数据保留。后续可申请€2000 voucher。OpenAI兼容。

7月11日 01:32

ai_tokens 🟢

Agnes AI周API调用达4.66万亿tokens + 推出Pavo创意工作室

Agnes AI报告免费API周调用量达4.66万亿tokens。6月29日推出Pavo创意工作室(web端免费AI创作平台)。新加坡AI Lab Top10，永久免费多模态API。

7月11日 01:32

ai_tokens 🟢

Felo AI免费提供Gemini 4.0 Pro — 无需信用卡

Felo AI将免费集成Gemini 4.0 Pro，支持搜索和LLM Playground。200万token上下文，Deep Think博士级推理，原生多模态。无需信用卡。

7月11日 01:32

ai_tokens 🟢

V-API公益站上线 — Linux.do社区免费AI API网关

Linux.do社区公益项目V-API上线，聚合DeepSeek/GLM等模型，OpenAI兼容。首发100份×$10兑换码+每日签到奖励。非营利，无商业赞助。

7月11日 01:32

ai_tokens 🟢

腾讯Hy3正式版发布 — 295B MoE开源+多平台免费评测

腾讯Hy3(295B/21B active, Apache 2.0)正式发布。SWE-bench 74.4%，Agent任务解决率90%。定价¥1/¥4 per MTok。OpenRouter免费评测至7/21，Novita AI当前$0/MTok。

7月11日 01:32

ai_tokens 🟢

Poolside Laguna XS.2 — 免费API+开源33B MoE编程模型

Poolside发布Laguna XS.2，33B MoE(3B active)开源编程模型，Apache 2.0。SWE-bench Pro 44.5%。OpenRouter和Poolside API限时免费。131K上下文。

7月11日 01:32

工具 🟢

rtk — LLM Token 消耗优化 CLI 代理

用 Rust 编写的 CLI 代理，可将常用开发命令的 LLM Token 消耗降低 60-90%。单二进制文件零依赖，开箱即用，适合重度使用 AI 编程助手的开发者节省成本。

7月9日 09:24

ai_tokens 🟢

AwanLLM: 免费Lite层，无限Token，自有数据中心

LLM推理API平台，免费Lite层：无限Token，200次/天（小模型），10次/天（中大模型），20 RPM。自有数据中心，不记录日志。订阅制而非按Token计费。

6月23日 01:39

ai_tokens 🟢

DeepInfra: $5免费推理额度，40+开源模型，1M tokens/天

AI推理云平台，注册送$5额度（促销可达$20）。支持40+开源模型（Llama 3.3/Mistral/DeepSeek等），免费模型每天1M tokens。OpenAI兼容API。已完成$1.07亿B轮融资。

6月23日 01:39

ai_tokens 🟢

FreeTokenRouter.cn: 100万免费Token，国内大模型聚合平台

国内AI Token聚合平台，注册送100万Token，每日签到可续，邀请好友翻倍。支持DeepSeek/通义千问/智谱AI/月之暗面/腾讯混元/百度文心/MiniMax等国内主流大模型。OpenAI兼容API，企业赞助Token模式。

6月23日 01:39

ai_tokens 🟢

📢 火山引擎(豆包): 每日200万token永久免费，支持DeepSeek/Kimi

火山引擎豆包API每日200万token永久免费(支持豆包系列/DeepSeek-V3.2/Kimi-K2等主流模型)。每个新开通模型赠送50万token新人包。新增Doubao-Seed-2.0 Lite免费变体。

6月22日 01:33

ai_tokens 🟢

📢 Google Gemini: 新增3.5 Flash/4.0/3.1 Flash TTS，Pro移除免费层

Google Gemini新增Gemini 3.5 Flash(289tps/1M上下文)、Gemini 4.0(原生多模态)、3.1 Flash-Lite预览版(15RPM/500RPD)、3.1 Flash TTS(免费文本转语音)。⚠️ Gemini 2.5 Pro及3.1 Pro自2026-04-01移除免费层。

6月22日 01:33

ai_tokens 🟢

📢 阿里云百炼: 有效期延至180天，上架第三方模型

阿里云百炼免费额度有效期从90天延长至180天。已上架智谱GLM-5.1/MiniMax M2.7/Kimi K2.6等第三方模型。新增Qwen3.5-Omni/Qwen3-Coder-Plus。Coding Plan Lite首月7.9元无限调用Qwen3-Coder。

6月22日 01:33

ai_tokens 🟢

⚠️ 腾讯混元: HY 2.0等46个旧模型今日下线，平台9月30日停服

腾讯混元HY 2.0等46个旧模型已于2026-06-22下线。原平台将于2026-09-30全面停服，迁移至TokenHub。HY2.0输入价格涨463%。Hunyuan-Lite永久免费不限量。微信小程序成长计划赠1亿混元token(2026年底前)。

6月22日 01:33

ai_tokens 🟢

🆕 Kilo Code: 开源AI编码Agent可免费使用

Kilo Code是开源AI编码Agent(VS Code/JetBrains/CLI)，300万+开发者。可通过自带API Key免费使用5个模型。Apache 2.0开源。

6月22日 01:33

ai_tokens 🟢

🆕 Nscale: 免费AI API 2个模型

Nscale提供2个免费AI模型，无需信用卡。

6月22日 01:33

ai_tokens 🟢

🆕 Nebius AI Studio: 免费推理层

Nebius AI Studio提供免费推理层，1个免费模型，无需信用卡。开源模型托管推理。

6月22日 01:33

ai_tokens 🟢

🆕 Ollama Cloud: 官方云服务6个免费模型

Ollama官方云服务上线，6个免费模型(全部在线)，无需信用卡。本地运行模型的云版本。

6月22日 01:33

ai_tokens 🟢

🆕 LLM7.io: 统一AI API网关6个免费模型

LLM7.io统一AI API网关，6个免费模型(全部在线)，无需信用卡，一个endpoint接入多个模型。

6月22日 01:33

ai_tokens 🟢

🆕 Aion Labs: 以色列AI永久免费API(角色扮演/叙事)

以色列AI公司Aion Labs提供永久免费推理API，15 RPM/20K tokens/天，5个免费模型，无需信用卡。专注于角色扮演和叙事场景。OpenAI兼容。

6月22日 01:33

ai_tokens 🟢

🆕 OVHcloud AI Endpoints: 欧洲云40+开源模型免费Beta推理

欧洲云厂商OVHcloud推出AI Endpoints服务端推理API，Beta期间免费。40+开源模型(Llama/Qwen/DeepSeek等)，欧洲数据驻留，OpenAI兼容接口，无需信用卡。12个免费模型。

6月22日 01:33

ai_tokens 🟢

Completions.me更新：支持GPT-5.4/Claude Sonnet 4/Opus 4.x

免费无限AI API Completions.me更新模型列表，现支持GPT-5.4、Claude Sonnet 4、Claude Opus 4.x、Gemini 3.1 Pro等15+模型。无需验证。

6月21日 01:34

ai_tokens 🟢

NVIDIA NIM免费模型增至139个

NVIDIA NIM免费模型从100+增至139个，含DeepSeek-V4 Pro/Kimi-K2.5/GLM-5.1/Llama-4/MiniMax-M3等。纯速率限制(40 RPM)，OpenAI兼容。

6月21日 01:34

ai_tokens 🟢

🆕 Exa Web Search API：每月20,000次免费请求

AI web search API提供商Exa免费层提供20,000请求/月。2026-06-16推出Exa Agent产品。支持语义搜索、内容提取。exa.ai

6月21日 01:34

ai_tokens 🟢

⚠️ LongCat(美团龙猫)下线6个旧模型，免费额度大幅缩减

2026-05-29 LongCat下线Flash-Chat/Flash-Thinking/Flash-Lite/Flash-Omni等6个旧模型。Flash-Lite原提供每日5000万Token免费，已不可用。仅保留LongCat-2.0-Preview(限量beta)。原每日5500万Token免费政策已失效。

6月21日 01:34

ai_tokens 🟢

Together AI免费额度存疑: 官方称无免费试用，第三方报道$25

Together AI额度信息冲突：pricepertoken.com报道$25新用户额度，yangmao.ai报道$5，官方文档称不提供免费试用(需最低$5充值)。此前记录的$100可能已过期。83个免费模型仍可用。创业加速器$15K-$50K额度。

6月20日 01:34

ai_tokens 🟢

Agnes AI升级: 1M上下文+4K图片，首周消耗3.12万亿Token

已跟踪的Agnes AI(全球Top10 AI Lab)免费API升级：文本模型支持1M上下文，图片模型支持4K输出。6月1日免费开放后首周统计：1T tokens+200万张图+200万秒视频。全模态免费不限量。

6月20日 01:34

ai_tokens 🟢

Noumena: 限时1周免费Kimi K2.7推理(PrimeIntellect GB300)

Entropix创始人_xjdr推出Noumena，提供1周免费Kimi K2.7推理。PrimeIntellect在GB300 NVL72硬件上托管，通过ncode TUI工具使用。限时活动。

6月20日 01:34

ai_tokens 🟢

MixRoute: 统一AI API网关，$5免费credits注册即送

新发现的统一AI API网关平台MixRoute，200+模型(含Claude/ChatGPT/Gemini等)，OpenAI兼容接口，零markup费。新用户注册即送$5免费credits，首充100%返利。30秒设置，无需信用卡。

6月20日 01:34

ai_tokens 🟢

DeepSeek V4-Pro 75%降价永久生效：$0.87/MTok输出，比GPT-5.5便宜34倍

DeepSeek于2026-05-22宣布V4-Pro的75%促销折扣变为永久价格。新价：输入$0.435/MTok，输出$0.87/MTok，缓存命中$0.003625/MTok。比GPT-5.5便宜34倍，比Claude Opus 4.7便宜17倍，SWE-bench仅差3-7个百分点。V4-Flash仍完全免费。

6月19日 01:33

ai_tokens 🟢

百川智能: 注册送500万tokens，Baichuan 4旗舰模型128k上下文

百川智能(Baichuan)注册送500万tokens，Baichuan 4旗舰模型支持128k上下文。M3-Plus医疗增强模型可通过海纳百川计划免费调用。国产平台大陆直连，5 RPM限制。

6月18日 01:34

ai_tokens 🟢

Novita AI: 注册送$0.50-$1免费credits，初创企业$10,000额度

Novita AI提供10000+模型(image/video/LLM)的OpenAI兼容API。新用户注册送$0.50-$1 credits，referral计划$20(3个月)。初创企业计划最高$10,000免费额度。SDXL/Flux图像生成为主。novita.ai

6月18日 01:34

ai_tokens 🟢

Groq免费层每日请求限制调整至1440次

Groq免费层速率调整，每日请求限制更新为1440次，支持Llama 4系列模型。推理速度极快

6月17日 01:34

ai_tokens 🟢

Together AI新用户额度上调至$100（从$25-$50）

Together AI再次上调新用户注册credits至$100（此前$25-$50），200+开源模型可用。创业加速器计划最高$50,000额度

6月17日 01:34

ai_tokens 🟢

共绩算力MaaS上线：最高1亿免费tokens，支持GLM/DeepSeek/MiniMax

共绩算力2026-06-16推出大模型云服务(MaaS)，首批企业用户可申请最高1亿免费tokens。支持GLM/DeepSeek/MiniMax/Moonshot/Qwen等主流国产模型，OpenAI兼容API，maas.suanli.cn

6月17日 01:34

ai_tokens 🟢

小米MiMo V2.5开源 + Orbit 100万亿token计划

MiMo-V2.5系列已开源(MIT)，发布Orbit 100万亿token计划。MiMo-V2-Flash/TTS将于6月18日自动路由至V2.5(新定价)，6月30日废弃旧版本。UltraSpeed版本突破1000 TPS。

6月16日 01:34

ai_tokens 🟢

AI.cc: 新加坡统一AI API平台，400+模型降本80%

新加坡AI.cc统一API平台，接入400+模型(GPT/Claude/Gemini/Grok/DeepSeek/Qwen等)，单一OpenAI兼容端点，企业级降本80%。2026年4月上线。

6月16日 01:34

ai_tokens 🟢

贵州算家算桥API平台开放: 日均3亿token，DeepSeek/QWEN/智谱全系列

贵州算家计算自主研发算桥API词元平台正式开放，已上线DeepSeek/QWEN/智谱/Kimi/MiniMax等主流模型，日均调用量3亿token且持续增长。2026年6月12日对外发布。

6月16日 01:34

ai_tokens 🟢

Second Zero AI中转站: 200份×30元免费额度注册即领

新上线AI API中转站，200份×30元免费额度先到先得，OpenAI兼容接口，注册即领无需邀请码。2026年5月26日上线。注意：新站稳定性待验证，建议先用完免费额度再评估。

6月16日 01:34

ai_tokens 🟢

Free.ai: 每日30,000免费tokens，400+工具统一API

Free.ai提供统一OpenAI兼容端点，346+模型(含Qwen2.5/GPT/Claude等)，每日30,000免费tokens，无需信用卡。同时提供初创企业免费credits申请(3年内、融资<500万美元)。

6月16日 01:34

ai_tokens 🟢

Together AI Startup Accelerator — 最高$50,000免费推理额度

Together AI推出创业加速器计划，为符合条件的AI原生初创企业提供最高$50,000推理额度，含专属端点和工程支持。新用户注册送$25-$50（从$10/$25多次上调）。覆盖200+开源模型，OpenAI兼容接口。

6月15日 01:34

ai_tokens 🟢

NVIDIA NIM取消Credits限制：100+模型纯速率限制免费调用

NVIDIA NIM自2026年起取消Credits限制，改为纯速率限制模式。100+免费模型包括DeepSeek-V4 Pro、Kimi-K2.5、GLM-5.1、Llama-4、Nemotron-3等顶级模型，无需绑定信用卡，OpenAI兼容接口，5分钟接入。

6月14日 01:33

ai_tokens 🟢

火山引擎豆包2.0发布：免费每日最高500万Tokens/模型

火山引擎发布豆包大模型2.0(Doubao-Seed-2.0)，包含Pro/Lite/Mini/Code四款模型。免费每日领取单模型最高500万Tokens，安心体验模式每个模型50万tokens免费。Mini版仅¥0.3/百万token，几乎是市场最低价。通过火山方舟平台提供API服务。

6月14日 01:33

ai_tokens 🟢

OpenRouter免费模型增至60+个

OpenRouter免费模型从27个增至60+个(含Kimi K2.6)。免费层200次/天，充值10 credits后1000次/天。

6月13日 01:41

ai_tokens 🟢

白山智算: 新用户450元体验金(GLM-5)

白山智算AI推理平台，邀请码+实名认证送150元，首次调用再送350元(共450元)。以GLM-5为主，限速10请求/分钟。

6月13日 01:41

ai_tokens 🟢

联通云 Coding Plan: 免费GLM-5/Qwen3.5/MiniMax

联通云推出0元Coding Plan，支持GLM-5、Qwen3.5、MiniMax模型。Lite版1.8万次/月，Pro版9万次/月。12000个免费名额先到先得，每日1200次上限。

6月13日 01:41

ai_tokens 🟢

腾讯混元 Hunyuan-Lite 升级为永久免费不限量

腾讯混元Hunyuan-Lite模型永久免费不限量调用。原平台2026年9月30日停服迁移至TokenHub。微信小程序成长计划赠1亿混元token(2026年底前)。

6月13日 01:41

ai_tokens 🟢

⚠️ DeepSeek deepseek-chat/reasoner 将于2026-07-24停用

DeepSeek将于2026年7月24日停用deepseek-chat和deepseek-reasoner模型。V3-Lite永久免费不限量替代。开发者需尽快迁移。

6月13日 01:41

GitHub 🟢

MemPalace/mempalace — Best open-source AI memory system

基准测试最强的开源AI记忆系统，55K stars，基于ChromaDB，Python实现。

6月12日 02:02

ai_tokens 🟢

小米MiMo-V2.5-Pro-UltraSpeed发布：1T参数模型突破1000 TPS

小米与TileRT合作发布MiMo-V2.5-Pro-UltraSpeed，首次在1万亿参数模型上实现1000 tokens/s解码速度。API通过百炼平台开放，需申请。百炼平台100万tokens免费(90天)。

6月12日 01:34

ai_tokens 🟢

NVIDIA NIM 2026年取消Credits限制改为纯速率限制模式

NVIDIA NIM自2026年起取消此前的1000 Credits注册赠送模式，改为纯速率限制。支持100+免费模型包括DeepSeek-V4 Pro、Kimi-K2.5、GLM-5.1、Llama-4、Nemotron-3等，OpenAI 100%兼容格式，无需绑信用卡。

6月12日 01:34

ai_tokens 🟢

讯飞星辰MaaS开放Qwen3.6/Qwen3.5免费不限量调用

讯飞星辰MaaS平台开放Qwen3.6-35B-A3B和Qwen3.5-35B-A3B两款模型免费不限量调用，token无上限。Qwen3.6为阿里千问2026年4月开源的MoE模型，350亿参数。限时免费至6月底。讯飞星辰三方开发者日均Tokens调用量同比涨4241%。

6月12日 01:34

GitHub 🟢

MemPalace/mempalace — Best-benchmarked open-source AI memory system

开源AI记忆系统，基准测试领先，55K stars，为AI agent提供持久化、可检索的长期记忆能力。

6月11日 02:02

ai_tokens 🟢

FreeLLMAPI更新: 聚合16个提供商，~1.7B tokens/月

开源FreeLLMAPI项目从14个提供商扩展到16个，每月可获约1.7B tokens免费额度（从800M提升），单一OpenAI兼容endpoint。

6月11日 01:33

ai_tokens 🟢

Genbo.ai: 免费无限AI图像/视频/聊天模型API

免费无限使用开源模型，覆盖图像生成、视频创建、语言模型。GPU计算H100 $2.835/h，付费模型低价透明计费。

6月11日 01:33

ai_tokens 🟢

DMXAPI: 22+款免费大模型API聚合平台（国内直连）

LangChain中文网提供的AI模型聚合平台，22+款免费模型包括MiniMax-M2.7-free、GLM-5-free、Gemma 4、qwen-flash-free等，OpenAI兼容接口，国内直连无需翻墙。

6月11日 01:33

ai_tokens 🟢

UnoRouter: 134个免费AI模型聚合为单一endpoint

UnoRouter聚合15个免费提供商（Groq/Gemini/Cerebras/SambaNova/Mistral/Cloudflare/GitHub Models等）的134个免费模型，提供OpenAI兼容endpoint，$0/token，自动故障转移。2026-06-08上线。

6月11日 01:33

GitHub 🟢

MemPalace — Best-benchmarked open-source AI memory system

The best-benchmarked open-source AI memory system. Free. 55K+ stars. Uses ChromaDB for vector storage, supports MCP protocol. MIT licensed.

6月10日 02:03

GitHub 🟢

autoresearch — Karpathy的AI自动研究系统，85K星

Karpathy开源的单GPU自动研究agent，可自主运行nanochat训练实验并生成研究报告

6月9日 02:02

ai_tokens 🟢

Google Gemini：2.0系列关闭，升级至3.5 Flash

2026年6月1日起，Gemini 2.0系列模型已关闭。请使用Gemini 3.5 Flash或3.1 Flash Lite。免费层仍可用，但需更新模型版本。

6月9日 01:33

ai_tokens 🟢

昆仑万维SkyClaw-v1.0：Agent专用模型免费试用

天工AI发布的Agent专用大语言模型，100万上下文窗口，原生Agent训练范式。2-4周免费试用期，在APIFree平台提供。

6月9日 01:33

ai_tokens 🟢

Embercloud：初创企业$100免费API额度

面向初创企业和独立开发者，提供$100免费API额度。支持GLM-5、GLM-4.7等模型，OpenAI兼容接口，零冷启动，需申请审核。

6月9日 01:33

ai_tokens 🟢

美团龙猫LongCat API：每日5500万Token免费

美团自研560B MoE架构大模型开放平台，OpenAI兼容接口。Flash-Lite每日5000万Token，Flash系列共享500万，2.0-Preview 500万(可通过反馈刷至1.2亿)。支持代码生成、Agent推理、数字人视频生成等。

6月9日 01:33

ai_tokens 🟢

OpenRouter免费模型扩展至27个（含Kimi K2.6）

OpenRouter免费模型数量从11+扩展至27个（2026年6月），新增Kimi K2.6、Gemma 3等。200次/天免费，充值10 credits后可解锁1000次/天。

6月8日 01:33

ai_tokens 🟢

WisGate创业计划 — 最高$2,000免费API额度

WisGate面向AI创业团队开放限时Startup Credits计划（2026.5.26-6.26），审核通过可获最高$2,000 API额度，覆盖LLM/图像/编码模型，OpenAI兼容。

6月8日 01:33

ai_tokens 🟢

AIMLAPI — 400+ AI模型免费试用，单一API Key

AIMLAPI聚合400+ AI模型（GPT-5.1、Claude 4.5、Gemini 3、Grok 4.1、DeepSeek V3.2等），一个API Key免费试用，无需信用卡。支持文本和图像生成。

6月8日 01:33

ai_tokens 🟢

Kimi K2.6 在 OpenRouter 完全免费开放

月之暗面Kimi K2.6模型在OpenRouter上线免费版（:free），支持262K上下文窗口，原生多模态，专为长程编程和多Agent编排设计。输入输出全免费。

6月8日 01:33

ai_tokens 🟢

ZeroLimitAI — 永久免费AI API，自动路由最佳模型

ZeroLimitAI提供永久免费AI API，OpenAI兼容接口，200+模型，ZeroOptimize™自动将请求路由到最佳免费模型（Gemini 2.5 Flash/Llama 4/DeepSeek R1）。无需信用卡。

6月8日 01:33

ai_tokens 🟢

Atomesus Cipher 8B API — $300-$10,000 Free Credits

印度AI公司Atomesus发布Cipher 8B模型，面向开发者开放API，申请即可获得$300-$10,000免费额度，无需支付信息。模型支持100种语言，33T tokens训练，代码能力突出（HumanEval 88.4）。

6月8日 01:33

AI 🟢

FreeLLMAPI: 开源聚合14家免费提供商

开源项目，聚合14个免费AI提供商为单一endpoint，月均~800M tokens可用

6月6日 04:22

AI 🟢

BazaarLink: OpenAI兼容免费API（auto:free零成本）

BazaarLink提供auto:free零成本的OpenAI兼容API接口，无需付费即可使用

6月6日 04:22

AI 🟢

Together AI 免费额度修正: $25（非$100）

Together AI新用户免费额度为$25（200+开源模型），此前记录的$100可能为早期活动或错误

6月6日 04:22

ai_tokens 🟢

Agnes AI 永久免费开放全部API — 新加坡排名Top10的AI Lab

Agnes AI（Sapiens AI旗下）宣布2026年6月1日起永久免费开放多模态API（文本/图片/视频），无订阅无配额限制。全球AI Lab排名第9，TokenPlan最低$4/月起。支持OpenClaw兼容模型。

6月6日 04:21

AI 🟢

讯飞星火 Lite 永久免费

讯飞星火Lite永久免费，QPS=2。

6月6日 01:32

AI 🟢

文心一言 ERNIE API 全面免费

文心一言ERNIE API全面免费，100次/天调用限制。

6月6日 01:32

AI 🟢

硅基流动 SiliconCloud 免费模型聚合

硅基流动提供14个免费模型，2000万tokens免费额度。支持DeepSeek、Qwen、GLM、MiniMax等。

6月6日 01:32

AI 🟢

阿里云百炼 7000万tokens免费

阿里云百炼Token Plan 7000万tokens免费，3个月有效。支持Qwen3/DeepSeek/Kimi系列。

6月6日 01:32

AI 🟢

OpenAI $5新用户额度

OpenAI新用户$5 API额度，3个月有效。⚠️ DALL-E API已关闭，gpt-image-1非免费。

6月6日 01:32

AI 🟢

Anthropic Claude $5新用户额度

Anthropic给新用户$5 API额度，30天有效。学生可申请$300。⚠️ 30天过期非永久。

6月6日 01:32

AI 🟢

Cerebras 免费推理 1M tokens/天

Cerebras免费推理30RPM，1M tokens/天，~1000 TPS超快推理。

6月6日 01:32

AI 🟢

Mistral AI 免费层 ~1B tokens/月

Mistral AI免费层约1B tokens/月，2 RPM，所有Mistral模型均可免费调用。

6月6日 01:32

AI 🟢

Groq 免费推理 30RPM

Groq免费推理层30RPM/14400RPD，支持Llama 4 Scout/Maverick，推理速度极快。

6月6日 01:32

AI 🟢

Together AI 新用户$100免费额度

Together AI新用户送$100免费额度（从$25升至$100），200+开源模型可用。

6月6日 01:32

AI 🟢

智谱AI GLM-4.7-Flash 完全免费不限量

GLM-4.7-Flash完全免费不限量，200K上下文，QPS=30。新用户送2000万tokens。GLM-5.1已上线。

6月6日 01:32

AI 🟢

DeepSeek V4-Flash 完全免费

DeepSeek V4-Flash完全免费，V4-Pro付费。支持百万字超长上下文、思考模式切换。阿里云百炼也可调用。

6月6日 01:32

AI 🟢

Google Gemini Flash 免费层升级至1500RPD

Gemini Flash免费层15RPM/1500RPD（之前1000RPD），Flash-Lite 30RPM GA上线。Pro已移除免费层。

6月6日 01:32

AI 🟢

硅基流动 SiliconCloud 9B以下小模型永久免费

硅基流动注册送2000万tokens，9B以下小模型永久免费（限并发）。支持DeepSeek-R1、Qwen3.5、GLM-4、MiniMax等全栈开源模型。

6月6日 01:32

AI 🟢

国内大模型价格战加剧 | 豆包收费、DeepSeek永久降价

2026年5月国产大模型格局大洗牌：豆包开始收费，DeepSeek永久降价，通义千问3.7杀入全球前15。免费额度窗口正在缩小。

6月5日 01:34

AI 🟢

DeepSeek V4系列发布 | V4-Flash免费 | V4-Pro付费

DeepSeek V4系列发布，V4-Flash完全免费，V4-Pro付费。支持思考模式切换。阿里云百炼也可调用DeepSeek V4。

6月5日 01:34

AI 🟢

Kimi 无限免费对话API确认 | 月之暗面

Kimi开放平台提供无限免费对话额度，无需付费即可使用。月之暗面（Moonshot AI）长上下文优势。

6月5日 01:34

AI 🟢

Cohere 免费试用 | 嵌入+RAG能力突出

Cohere提供免费试用Key，1000次调用/月，非商业用途。嵌入模型和RAG能力突出。

6月5日 01:34

AI 🟢

AI21 新用户$10试用额度 | Jamba模型

AI21为新用户提供$10试用额度，3个月过期。支持Jamba语言模型系列。

6月5日 01:34

AI 🟢

Together AI 免费额度升至$100 | 200+开源模型

Together AI新用户免费额度从$25升至$100，覆盖200+开源模型（Llama 4、DeepSeek-V3、Qwen、Mixtral等）。无需信用卡。

6月5日 01:34

AI 🟢

xAI Grok $25注册+每月$150数据贡献计划

xAI注册送$25额度，加入数据贡献计划可获每月$150免费额度，首月共$175。Grok-3 Mini仅$0.30/$0.50/M tokens。

6月5日 01:34

AI 🟢

Google Gemini 2.5 Flash-Lite GA上线 | 免费层30RPM

Gemini 2.5 Flash-Lite正式GA，免费层30RPM/1M TPM，比Flash更高RPM。Gemini 2.5 Pro免费层5RPM/100RPD。Flash免费层15RPM/1000RPD。

6月5日 01:34

AI 🟢

通义千问新用户7000万免费tokens | 3个月有效

阿里云百炼Token Plan，新用户至高享7000万免费tokens，支持Qwen3、DeepSeek、Kimi系列。Qwen2.5-72B不限速。

6月5日 01:34

AI 🟢

百度千帆 Token福利包上线 | 积分计量体系

百度千帆推出统一AI使用额度产品Token福利包，兼容主流AI编程工具。积分计量体系，5万-80万积分/月，首购优惠¥45-800。支持17个模型各100万tokens。

6月5日 01:34

AI 🟢

MiniMax M3 发布 | Token Plan订阅制 | 1M上下文

MiniMax M3最新旗舰模型，原生多模态、1M上下文窗口，支持Agent推理/工具调用/代码。Token Plan订阅制可低价使用全模态模型。

6月5日 01:34

AI 🟢

🆓 Pollinations.AI - Image/Text/Video/Audio API: 完全免费无需注册

OpenAI兼容接口，支持图片/文本/视频/音频生成，无需API Key

6月4日 01:32

AI 🟢

🆓 DeepSeek - DeepSeek V3 API: 50次/天免费

V3模型每日50次免费调用

6月4日 01:32

AI 🟢

🆓 Kimi (月之暗面) - 免费对话API: 无限免费对话

Kimi开放平台提供免费对话额度

6月4日 01:32

AI 🟢

🆓 Cohere - Command R API: 新用户试用额度

Command R/R+免费试用，RAG能力突出

6月4日 01:32

AI 🟢

🆓 Anthropic - Claude for Open Source: 6个月Claude Max 20x免费

开源项目维护者可申请，10000个名额，价值$1200

6月4日 01:32

AI 🟢

🆓 Google Gemini - Gemini 2.5 Flash-Lite: 免费层30RPM

Flash-Lite GA上线，免费层30RPM/1M TPM，比Flash更高RPM

6月4日 01:32

AI 🟢

🆓 FreeTheAi - Free API: 免费API

Discord注册，每日签到获取额度

6月4日 01:32

AI 🟢

🆓 Completions.me - Free API: 完全免费

无需邮箱验证，用户名密码注册即可

6月4日 01:32

AI 🟢

🆓 Fireworks AI - Free Credits: $1免费额度

Llama 3.1 70B等模型，~500请求

6月4日 01:32

AI 🟢

🆓 Leonardo AI - API Credits: $5免费API额度

新用户$5免费API额度，可用于图像生成，非持续免费

6月4日 01:32

AI 🟢

🆓 Puter.js - Image Generation API: 完全免费无限制

User-Pays模式，前端免费调用DALL-E/Gemini/Flux/SD等，无需API Key

6月4日 01:32

AI 🟢

🆓 NVIDIA NIM - Dev Program Credits: 91模型免费试用

DeepSeek V3.2, Devstral-2-123B等91模型，40 RPM，需注册Dev Program

6月4日 01:32

AI 🟢

🆓 Cloudflare Workers AI - Free Tier: 10K neurons/天

10K neurons/天

6月4日 01:32

AI 🟢

🆓 速语API - GPT-4o公益站: 每天30次GPT-4o

每天30次GPT-4o

6月4日 01:32

AI 🟢

🆓 Lumenfall.ai - FLUX.1 schnell: 完全免费无限量

完全免费无限量

6月4日 01:32

AI 🟢

🆓 Stability AI - Free Tier: 25 credits/月

25 credits/月

6月4日 01:32

AI 🟢

🆓 ModelsLab - Free API: 100次/天免费

10000+模型

6月4日 01:32

AI 🟢

🆓 fal.ai - Free Credits: 免费credits

免费credits

6月4日 01:32

AI 🟢

🆓 GitHub Models - Free Tier: ~150次/天免费

GPT-4o, Llama 3.1

6月4日 01:32

AI 🟢

🆓 OpenRouter - Free Models: 200次/天免费

200次/天免费，11-30+免费模型（按合作方浮动）

6月4日 01:32

AI 🟢

🆓 SambaNova - Free Tier: 免费+5美金试用

294 TPS，Llama 3.1

6月4日 01:32

AI 🟢

🆓 Cerebras - Free Inference: 免费30RPM

1M tokens/天，Llama 3.1

6月4日 01:32

AI 🟢

🆓 Mistral AI - Free Tier: ~1B tokens/月免费

2 RPM，所有Mistral模型

6月4日 01:32

AI 🟢

🆓 Groq - Free Inference: 免费30RPM

Llama 4 Scout/Maverick，14400 RPD

6月4日 01:32

AI 🟢

🆓 Together AI - Free Credits: $25新用户额度

从$5提升到$25，80+免费模型

6月4日 01:32

AI 🟢

🆓 Anthropic - Claude API: $5新用户额度(30天有效)

学生可申请$300，$5额度30天过期

6月4日 01:32

AI 🟢

🆓 OpenAI - API Credits: $5新用户额度

3个月过期。⚠️ DALL-E 2/3 API已于2026年5月12日关闭，替代品gpt-image-1非免费

6月4日 01:32

AI 🟢

🆓 Google Gemini - Free Tier: Flash免费层1500RDP

Flash免费层1500RDP/10RPM，Flash-Lite免费层30RPM，Pro已移除

6月4日 01:32

AI 🟢

🆓 腾讯TokenHub - 混元API: 50-100万tokens

50-100万tokens

6月4日 01:32

AI 🟢

🆓 文心一言 - ERNIE API: 全面免费

100次/天免费

6月4日 01:32

AI 🟢

🆓 讯飞星火 - 星火Lite: 永久免费

永久免费

6月4日 01:32

AI 🟢

🆓 MiniMax - MiniMax M2.7 API: Token Plan订阅制

M2.7已发布，百万token上下文，对标Claude Opus 4.6

6月4日 01:32

AI 🟢

🆓 豆包 - doubao API: 注册送tokens

100万tokens/月永久免费

6月4日 01:32

AI 🟢

🆓 阿里云百炼 - Token Plan: 7000万tokens免费

3个月有效

6月4日 01:32

AI 🟢

🆓 智谱AI - GLM API: GLM-4.7-Flash完全免费不限量

200K上下文，QPS=30，新用户2000万tokens，GLM-5.1已上线

6月4日 01:32

AI 🟢

🆓 DeepSeek - DeepSeek-V4 API: 完全免费

V4-Pro/V4-Flash 1M上下文，10M免费tokens

6月4日 01:32

AI 🟢

Google Gemini Free Tier更新: Flash 1500RDP + Flash-Lite 30RPM

Google Gemini免费层更新：Flash 1500请求/天/10RPM，Flash-Lite 30RPM/1M TPM，Pro已从免费层移除。仍为最慷慨的免费LLM API。

6月3日 01:32

AI 🟢

Cohere Command R API: 新用户试用额度

Cohere提供Command R/R+模型免费试用额度，RAG和检索能力突出，适合检索增强应用。

6月3日 01:32

AI 🟢

DeepSeek V3 API: 每日50次免费调用

DeepSeek V3模型提供每日50次免费API调用。V4系列（V4-Pro/V4-Flash）已上线预览版，1M超长上下文。

6月3日 01:32

AI 🟢

Kimi (月之暗面) 免费对话API

Kimi开放平台提供免费对话额度，支持长上下文。注册即可使用。

6月3日 01:32

AI 🟢

Google Gemini 2.5 Flash-Lite GA: 免费层30RPM/1M TPM

Gemini 2.5 Flash-Lite正式GA上线，免费层30RPM/1M TPM，比Flash的10RPM更高。Flash免费层1500RDP/10RPM不变。无需信用卡。

6月3日 01:32

AI 🟢

Anthropic Claude for Open Source: 开源维护者6个月Claude Max 20x免费

Anthropic推出Claude for Open Source计划，开源项目维护者可申请6个月Claude Max 20x免费使用（价值$1200），共10000个名额。需要验证开源项目维护者身份。

6月3日 01:32

AI 🟢

🆓 FreeTheAi: 免费API

FreeTheAi提供免费API，通过Discord注册，每日签到获取额度。

6月2日 01:32

AI 🟢

🆓 Completions.me: 完全免费API

Completions.me提供完全免费API，无需邮箱验证，用户名密码注册即可使用。

6月2日 01:32

AI 🟢

🆓 Fireworks AI: $1免费额度

Fireworks AI为新用户提供$1免费额度，支持Llama 3.1 70B等模型，约500次请求。

6月2日 01:32

AI 🟢

🆓 NVIDIA NIM Dev Program: 91模型免费试用

NVIDIA NIM Dev Program提供91个模型免费试用，包括DeepSeek V3.2、Devstral-2-123B等。40 RPM，需注册Dev Program。

6月2日 01:32

AI 🟢

DeepSeek V4 免费API — 10M tokens

DeepSeek V4 Pro/Flash完全免费，1M上下文，10M tokens额度

6月1日 01:33

AI 🟢

豆包 100万tokens/月永久免费

字节豆包提供100万tokens/月永久免费额度，每月1日重置

6月1日 01:33

AI 🟢

Anthropic 学生额度提升至$300

Anthropic新用户仍$5，但大学生可申请最高$300 credits

6月1日 01:33

AI 🟢

智谱AI GLM-4.7-Flash确认永久免费不限量

新用户2000万tokens，GLM-4.7-Flash永久免费，200K上下文，QPS=30

6月1日 01:33

AI 🟢

GitHub Models 免费层 — GPT-4o可用

GitHub Models提供GPT-4o和Llama 3.1免费访问，~150次/天

6月1日 01:33

AI 🟢

OpenRouter 免费模型层 — 200次/天

OpenRouter提供11+免费模型，200次/天，支持国内容联，模型覆盖全面

6月1日 01:33

AI 🟢

MiniMax M2.7 发布 — 百万token上下文

MiniMax M2.7支持百万token输入，对标Claude Opus 4.6，价格仅为其1/15

6月1日 01:33

AI 🟢

SambaNova 免费推理+5美金试用

SambaNova提供免费Llama 3.1 70B推理（294 TPS），新用户另有$5 credit

6月1日 01:33

AI 🟢

Cerebras 永久免费推理层上线

Cerebras提供免费30RPM，1M tokens/天，Llama 3.1模型，无需信用卡

6月1日 01:33

AI 🟢

Together AI 免费额度提升至$25（原$5）

Together AI 新用户免费额度从$5提升到$25，支持80+免费模型（Llama, DeepSeek, Qwen等），无需信用卡

6月1日 01:33

AI 🟢

ModelsLab Free API: 100次/天免费

单一API端点支持10000+模型，SD/FLUX/社区模型，100次/天免费

5月31日 01:32

AI 🟢

Stability Diffusion API Free Tier: 20张图片免费

REST API支持SD 1.5/SDXL/Flux/ControlNet/LoRA，免费20张图片

5月31日 01:32

AI 🟢

MiniMax MiniMax M2.5 API: 限时免费

M2.5新模型上线，百万级上下文，专为Agent和代码优化

5月31日 01:32

AI 🟢

智谱AI GLM-5 API: GLM-4.7-Flash完全免费

GLM-5新模型上线，GLM-4.7-Flash仍免费(200K上下文/QPS=30)，GLM-4-Flash需申请

5月31日 01:32

AI 🟢

豆包 Doubao X/Pro API: 注册送tokens

3.45亿月活用户(2026年5月)，Doubao X/Pro新模型上线，视频生成能力强

5月31日 01:32

AI 🟢

文心一言 ERNIE 6.0 API: 全面免费

2026年新版本ERNIE 6.0上线，C-Eval 96分中文理解最强，120+领域专家库

5月31日 01:32

AI 🟢

通义千问 Qwen3.5 API: 7000万tokens免费(一次性)

2026年新版本Qwen3.5上线，100万tokens长文本，数学推理国内第一，开源生态全球第一

5月31日 01:32

AI 🟢

零一万物 Yi-Lightning API: 注册送¥10额度

李开复创办，万知助手免费使用，API 5 RPM限流，Yi-Lightning性价比极高

5月31日 01:32

AI 🟢

百度千帆 Token 福利包: 积分计量体系，5万-80万积分可选

2026年5月更新：积分计量体系，支持OpenAI/Anthropic双协议，首购9折优惠

5月31日 01:32

AI 🟢

[AI Token] ⚠️ 价格变动 Cloudflare Workers AI - Free Tier: 10K neurons/天免费

10K neurons/天免费 | Llama 3.3 70B, Kimi K2.5，边缘AI推理

5月30日 01:32

AI 🟢

[AI Token] ⚠️ 价格变动 HuggingFace - Inference API: 免费推理（限<10B参数模型）

免费推理（限<10B参数模型） | ⚠️ 免费层限<10B参数模型，PRO $9/月含2M credits

5月30日 01:32

AI 🟢

[AI Token] ⚠️ 价格变动 Groq - Free Inference: 免费（30RPM，100K-500K tok/day）

免费（30RPM，100K-500K tok/day） | LPU硬件超快推理

5月30日 01:32

AI 🟢

[AI Token] ⚠️ 价格变动 Google Gemini - Free Tier: Flash免费层（Pro已移除）

Flash免费层（Pro已移除） | 2026年4月起Pro不再免费，Flash仍免费。10RPM，250K TPM

5月30日 01:32

AI 🟢

[AI Token] ⚠️ 价格变动智谱AI - GLM API: GLM-4.7-Flash 完全免费不限量

GLM-4.7-Flash 完全免费不限量 | 200K上下文，QPS=30。CogView-3-Flash图像免费，CogVideoX-Flash视频免费

5月30日 01:32

AI 🟢

[AI Token] ⚠️ 价格变动 DeepSeek - DeepSeek-V4 API: 完全免费（开源+免费API）

完全免费（开源+免费API） | V4-Pro/V4-Flash 1M上下文，开源可本地部署，API按量计费极低

5月30日 01:32

AI 🟢

[AI Token] 🆕 新增速语API - GPT-4o公益站: 每天30次GPT-4o

每天30次GPT-4o | GitHub登录，公益站每日限30次

5月30日 01:32

AI 🟢

[AI Token] 🆕 新增云雾API - GPT-4o公益站: 每天30次GPT-4o

每天30次GPT-4o | GitHub登录，公益站每日限30次

5月30日 01:32

AI 🟢

[AI Token] 🆕 新增 NVIDIA NIM - Free Inference: 免费推理

免费推理 | NVIDIA推理平台，开源模型免费推理

5月30日 01:32

AI 🟢

[AI Token] 🆕 新增 Cohere - Free Trial Key: 免费试用key

免费试用key | 5 RPM, 100 calls/min, Command R+模型

5月30日 01:32

AI 🟢

[AI Token] 🆕 新增 BazaarLink - auto:free: 零成本

零成本 | OpenAI兼容API

5月30日 01:32

AI 🟢

[AI Token] 🆕 新增 FreeTheAi - Free API: 免费API（每日签到）

免费API（每日签到） | Discord注册，每日签到获取额度

5月30日 01:32

AI 🟢

[AI Token] 🆕 新增 Completions.me - Free API: 完全免费

完全免费 | 无需邮箱验证，用户名密码即可

5月30日 01:32

AI 🟢

[AI Token] 🆕 新增 Replicate - Trial Credits: 试用credits（按模型计费）

试用credits（按模型计费） | 部分模型有试用免费入口，非稳定免费层

5月30日 01:32

AI 🟢

[AI Token] 🆕 新增 Leonardo AI - API Credits: $5新用户API额度

$5新用户API额度 | 新API账户$5免费额度，~50个模型

5月30日 01:32

AI 🟢

[AI Token] ⚠️ 价格变动 DeepSeek - 分层计费调整: V3/R2部分模型高频用户限流

V3/R2部分模型高频用户限流 | ⚠️ 免费Token不再无限撸，高频用户启动限流

5月30日 01:32

AI 🟢

[AI Token] ⚠️ 价格变动智谱AI - GLM API 价格调整: GLM-4免费额度缩水，API提价

GLM-4免费额度缩水，API提价 | ⚠️ 免费额度缩水，个人用户月度额度下降。GLM-4.7-Flash仍免费但GLM-4 Flash需申请

5月30日 01:32

AI 🟢

[AI Token] 🆕 新增硅基流动 SiliconFlow - 注册送tokens: 注册送2000万tokens + 9B以下小模型永久免费

注册送2000万tokens + 9B以下小模型永久免费 | OpenClaw官方推荐，拉新再送14元(~700万tokens)，API兼容OpenAI格式

5月30日 01:32

AI 🟢

fal.ai Free Credits: 免费credits

图片/视频生成

5月29日 01:32

AI 🟢

HuggingFace Inference API: 免费推理（PRO $9/月）

开源模型托管+推理，PRO含2M credits

5月29日 01:32

AI 🟢

OpenRouter Free Models: 免费模型层

聚合多家模型

5月29日 01:32

AI 🟢

xAI (Grok) Free Credits: $25注册+$150/月数据贡献

数据贡献计划

5月29日 01:32

AI 🟢

Cerebras Free Inference: 100万tokens/天免费

CS-3晶圆级芯片，超快Llama推理

5月29日 01:32

AI 🟢

Mistral AI Free Tier: ~1B tokens/月免费

所有Mistral模型，2RPM，无需信用卡

5月29日 01:32

AI 🟢

Groq Free Inference: 免费（30RPM，100K-500K tok/day）

LPU硬件超快推理

5月29日 01:32

AI 🟢

Together AI Free Credits: $25新用户额度

200+开源模型，无需信用卡

5月29日 01:32

AI 🟢

Anthropic Claude API: $5新用户额度

新用户$5免费额度，学生可申请$300

5月29日 01:32

AI 🟢

OpenAI API Credits: $5新用户额度

新用户$5免费额度

5月29日 01:32

AI 🟢

Google Gemini Free Tier: Flash免费层（Pro已移除）

2026年4月起Pro不再免费，Flash仍免费。10RPM，250K TPM

5月29日 01:32

AI 🟢

腾讯TokenHub 混元API: 50-100万tokens

多模型覆盖，需个人认证

5月29日 01:32

AI 🟢

文心一言 ERNIE API: 全面免费

2025年4月起全面永久免费

5月29日 01:32

AI 🟢

讯飞星火星火Lite: 永久免费

QPS=2，需个人认证（二要素）

5月29日 01:32

AI 🟢

MiniMax MiniMax M2 API: 限时免费

M2专为Agent和代码，仅Claude Sonnet 8%价格，M2.7百万级上下文

5月29日 01:32

AI 🟢

豆包 doubao API: 注册送tokens

1.59亿MAU，字节系火山引擎平台

5月29日 01:32

AI 🟢

阿里云百炼 Token Plan: 至高7000万免费tokens

千问系列+DeepSeek V4均可用，Token Plan优惠

5月29日 01:32

AI 🟢

智谱AI GLM API: GLM-4.7-Flash 完全免费不限量

200K上下文，QPS=30。CogView-3-Flash图像免费，CogVideoX-Flash视频免费

5月29日 01:32

技术文章 27

RAG知识库实战教程2026：从零搭建企业级智能问答系统，含RAGFlow+Dify+自建方案完整Python代码

LLM微调实战教程2026：LLaMA-Factory+Unsloth从零到商业化，含完整Python代码

RAG知识库实战教程2026：从零搭建企业级AI知识库，含完整Python代码

Ollama Bleeding Llama漏洞（CVE-2026-7482）：30万台AI推理服务器面临内存泄露风险

LLM真的懂安全漏洞吗？CWE-Trace框架揭示大模型的“照猫画虎”困境

DiffusionGemma推理透明度研究：扩散语言模型的黑箱到底有多黑

当安全对齐的大模型看到好坏参半的示范：它到底学到了什么？

传染网络：多智能体LLM系统中评估者偏见的传播机制

DiffusionGemma 的透明度究竟如何？——扩散语言模型可解释性深度解析

Shadow AI危机：91%企业AI工具无人管控，Gartner警告2026年头号商业风险

你的鼠标和眼睛正在偷偷泄露你的偏好：用隐式反馈对齐大语言模型

你的鼠标和眼神正在泄露你的真实偏好：基于隐式行为信号的大语言模型对齐研究

LedgerAgent：用账本思维让AI Agent严格遵守策略，工具调用不再失控

OWASP Agentic AI Top 10 (2026)：AI Agent安全风险全景解读

LiteLLM供应链攻击事件全解析：AI基础设施成为攻击者的首选目标

LLMjacking深度解析：AI基础设施劫持攻击正在爆发，Ollama与LM Studio成重灾区

Gartner 2026四大网络安全威胁深度解析：AI正在改写攻防规则

CVE-2026-7482 Ollama Bleeding Llama：CVSS 9.1的AI基础设施内存泄露漏洞深度解析（2026）

CVE-2026-7482：Ollama「出血骆驼」内存泄露漏洞——30万台AI推理服务器裸奔

自复制AI蠕虫攻击全面解析：开源大模型新型威胁与防御策略（2026）

LiteLLM严重漏洞CVE-2026-42271：AI代理框架未授权RCE全解析（2026）

Cursor AI编程工具深度解析：90亿估值背后的开发者变现新范式（2026）

罗福莉与小米MiMo：从DeepSeek到万亿参数Agent模型的技术路线

后Transformer时代：2025-2026 AI架构革命全景

推理模型的本质：你的思维链其实是在压缩上下文

搜索 Agent 的真相：它们真的在搜索吗？

Agent 记忆革命：从静态仓库到动态演化网络

情报动态 200