2026 AI Agent 生态全景调研:从框架到平台到搜索
GitHub 热门 Agent 框架、2,781 个 MCP Server、封闭/开源产品全景图、以及一个被忽略的痛点:Agent 搜索。
2026 AI Agent 生态全景调研:从框架到平台到搜索
数据驱动的地图,不是感觉。
先来一张全家福
你打开 GitHub,想做个 Agent。然后你看到:LangChain(139k★)、Auto-GPT(140k+★)、Dify(146k★)、CrewAI(54k★)、AutoGen(59k★)、MetaGPT(68k★)、LangGraph(35k★)……
你还没写一行代码,就已经迷路了。
这不是你的问题。这是 2026 年 AI Agent 生态的常态。过去 18 个月这个领域经历了从学术玩具到工业基础设施的剧烈蜕变。框架、平台、协议、注册表、Server——每天都有新东西冒出来,旧东西消失,标准还在打架。
这篇文章不做综述,不画大饼。我花了几天时间,从 GitHub 拉数据、翻注册表、爬文档、盯 MCP 目录,把整个生态摊开来画了一张图。你要做 Agent?这张图能帮你省掉至少两周的踩坑时间。
一、GitHub 框架层:谁在统治?
先看最硬核的数据:GitHub 星星。这不是完美的衡量标准(有些人会 star 但不一定用),但在一个开发者工具市场里,star 量级 ≈ 关注度 ≈ 生态活跃度。
第一梯队:全能型框架
| 框架 | Stars | 语言 | 核心定位 | 备注 |
|---|---|---|---|---|
| openclaw | 379k★ | Python | 智能体技能框架 | 全品类第一,规模级 |
| Dify | 146k★ | Python/TS | AI 应用构建平台 | 快速出产品 |
| Auto-GPT | 140k+★ | Python | 自主 GPT Agent | 概念先驱 |
| LangChain | 139k★ | Python/TS | Agent 工程平台 | 生态最强,但学习曲线陡 |
| langflow | 149k★ | Python | 可视化 Agent 构建 | 低代码流派 |
openclaw 是个 outlier——379k★,几乎是第二名 LangChain 的 2.7 倍。它在 GitHub 全品类里排得上号,但中国开发者对它了解不多。核心定位是「Agentic skills framework」——不是框架层通用中间件,而是面向技能执行。
LangChain 是生态王者,139k★ 但实际影响力远超数字。它定义了 Agent 编程的抽象层——Chain、Agent、Tool、Memory——后来几乎所有框架都借鉴了这套范式。缺点是:版本升级频繁、API 不稳定、文档追不上代码更新。
Auto-GPT(140k+★)是 2023 年引爆 Agent 概念的「元祖级」项目。虽然今天实际使用量在下降,但它的历史地位不可替代——没有 Auto-GPT 就没有今天这个市场。
Dify(146k★)和 langflow(149k★)代表了低代码 / 可视化流派。对于非 AI 专业出身的开发者,这是最快上手的方式。Dify 在中日韩市场尤其强势。
第二梯队:专用型框架
| 框架 | Stars | 定位 |
|---|---|---|
| MetaGPT | 68k★ | 多智能体软件公司模拟 |
| AutoGen (微软) | 59k★ | 多智能体对话框架 |
| CrewAI | 54k★ | 角色扮演式 Agent 编排 |
| LlamaIndex | 50k★ | 文档 Agent + RAG |
| DeerFlow (字节) | 72k★ | 长周期 SuperAgent |
| LangGraph | 35k★ | Agent 状态机 |
| OpenAI Agents SDK | 27k★ | 多 Agent 工作流 |
| Mastra | 25k★ | TypeScript Agent 框架 |
| Haystack | 25k★ | AI 编排 + RAG |
几个有意思的趋势:
-
多智能体(Multi-Agent)是当前最热的方向。MetaGPT(68k★)、AutoGen(59k★)、CrewAI(54k★)都瞄准了这个方向,但思路完全不同——MetaGPT 模拟软件公司(产品经理+架构师+工程师),AutoGen 是学术派的多 Agent 对话研究框架,CrewAI 是实用主义的角色编排。
-
长周期 Agent 开始出现。字节的 DeerFlow(72k★)定位「Long-horizon SuperAgent」——不是一次对话,而是持续数天甚至数周的自动化任务。这代表 Agent 从「问答」向「执行」的跃迁。
-
TypeScript 阵营在追赶。OpenAI Agents SDK(27k★)和 Mastra(25k★)在 TS 生态发力。Python 仍然主导,但前端全栈工程师的涌入正在改变格局。
SDK & 工具链
| 项目 | Stars | 定位 |
|---|---|---|
| Composio | 28k★ | 1000+ 工具集成 |
| ToolJet | 38k★ | 内部工具 + AI Agents |
| Agno | 40k★ | Agent 平台构建器 |
| AgentOps | — | 监控、重放、分析 |
| E2B | — | Agent Cloud Sandbox |
Composio(28k★)提供了 1000+ 工具的一键集成,正在成为 Agent 版的「Zapier」。E2B 的 cloud sandbox 解决了 Agent 执行安全性的核心问题——让 Agent 在隔离环境中运行代码,不会炸掉你的生产数据库。
二、MCP 生态系统:2,781 个 Server 的真实图景
如果说框架是 Agent 的「大脑」,那 MCP(Model Context Protocol)就是 Agent 的「神经系统」。由 Anthropic 提出的这个协议,正在统一 Agent 连接外部工具的方式。
官方 SDK 覆盖
| SDK | Stars | 成熟度 |
|---|---|---|
| Python SDK | 23,394★ | 最成熟 |
| TypeScript SDK | 12,706★ | 活跃开发 |
| Go SDK | 4,712★ | 稳定 |
| C# SDK | 4,340★ | 新晋 |
| Rust SDK | — | 社区维护 |
MCP 的独特之处在于它不是一个「标准文档」,而是一个代码生态——Anthropic 官方维护了 5 个语言的 SDK,社区在此基础上构建了 FastMCP(Python/TS)、TurboMCP(Rust)、gomcp(Go)、MCP-Fusion(TS)等框架级封装。
2,781 Servers 的分布
从 punkpeye/awesome-mcp-servers(89,575★)梳理出的数据:2,781 个 MCP Server,覆盖 50+ 类别。
Server 数量按类别排序(Top 15):
| 类别 | 估算占比 | 典型 Server |
|---|---|---|
| Developer Tools | ~15% | 代码分析、CI/CD、Issue 管理 |
| Databases | ~12% | PostgreSQL、MySQL、MongoDB、SQLite |
| Cloud Platforms | ~8% | AWS、GCP、Azure、Cloudflare |
| Search & Data Extraction | ~7% | Brave Search、Tavily、Exa |
| File Systems | ~6% | 本地文件、S3、Dropbox |
| Communication | ~5% | Slack、Discord、Email |
| Web Browsers | ~5% | Playwright、Puppeteer |
| Finance | ~4% | 股票、加密货币、支付 |
| Social Media | ~4% | Twitter、LinkedIn、Reddit |
| Code Execution | ~4% | 沙箱、Jupyter、REPL |
| Security | ~3% | 漏洞扫描、权限检查 |
| Knowledge & Memory | ~3% | RAG、向量数据库 |
| Multimedia | ~3% | 图像生成、视频处理、音频 |
| Marketing | ~2% | SEO、广告、邮件 |
| Education | ~2% | 学习管理、题库 |
50+ 个类别里还有一种特别有意思:Aerospace(航空航天)。有人在开发 MCP Server 让 Agent 直接查询卫星数据。不是 DEMO——是真的在生产环境用。
协议框架层
MCP 之上又长出了框架:
- FastMCP(Python/TS)— 最流行的 MCP Server 构建框架,类似 Flask 之于 HTTP
- TurboMCP(Rust)— 追求极致性能
- gomcp(Go)— Go 生态的 MCP 实现
- MCP-Fusion(TS)— 高级类型安全封装
这层抽象的涌现本身就是一个有趣的现象:MCP 协议还不够「好用」,所以社区帮它补了一层。这通常是一个协议走向成熟的标志。
三、封闭产品 vs 开源生态:割裂的市场
封闭源 / 商业产品
目前最热的商业产品集中在代码生成领域:
编程助手(估值最高的赛道):
- Cursor — AI-first IDE,月活百万级,估值数十亿美元
- Windsurf — Cascade 框架,全自动编程
- GitHub Copilot — 微软加持,装机量最大
- Lovable — 自然语言生成全栈应用
- v0 — Vercel 出品,UI 生成
- Replit Agent — 云 IDE + Agent
- Aide — 新兴编程 Agent
销售 & 营销:
- Artisan AI — 销售自动化 Agent
- AskToSell — 电商 Agent
- AgentScale — B2B 销售 Agent
通用助手:
- Adept AI — David Luan 创办,通用 AI Agent
- Ability AI — 生活助理 Agent
知识 & 搜索:
- Pandi — AI 知识助理
- Perplexity — AI 搜索引擎(也做 Agent)
Agent 平台:
- Dify — 开源/闭源混合,146k★
- Coze — 字节旗下,中文生态最强
- n8n — 工作流自动化,天然适合 Agent
关键观察
封闭产品和开源生态之间有一条价值鸿沟:
| 维度 | 开源框架 | 商业产品 |
|---|---|---|
| 上手难度 | 高(需要读文档 + 调试) | 低(开箱即用) |
| 可定制性 | 极高 | 有限 |
| 成本 | 免费(算力另算) | $10-100+/月 |
| 生态集成 | 手动配置 | 内置集成 |
| 维护 | 社区/自己 | 专人维护 |
这条鸿沟正在被两种力量弥合:一是 Agent Platform(Dify、Coze、n8n)试图降低开源框架的使用门槛;二是 MCP 协议让商业产品也能接入开源工具。
但还有一个更大的鸿沟没人聊——下面第四部分展开。
四、Agent 注册表:碎片化的目录困境
如果你想找一个合适的 MCP Server 或 Agent,去哪里找?
| 平台 | 类型 | 条目数 | 特点 |
|---|---|---|---|
| GitHub Awesome Lists | 众包 | 2,781+ MCP | 最全面,但非结构化 |
| glama.ai | 商业目录 | 数千 | UI 好,排序合理 |
| smithery.ai | 商业目录 | 数千 | MCP 专属 |
| mcp.so | 商业目录 | 数千 | 简洁搜索 |
| a2asearch-mcp | 协议目录 | 数百 | A2A 协议专属 |
| AgentHotspot | 社区目录 | — | 新晋 |
问题很明显:
① 数据碎片化。 同一个 Server 可能在 GitHub、Glama、Smithery、mcp.so 上各有一个条目,元数据不同、描述不同、Star 数不同。自己做 Agent 搜索时,需要跨四个平台去核对。
② 元数据不规范。 MCP Server 的分类目前是自由格式——有人叫「Database」,有人叫「Databases」,有人叫「Data Storage」。没有像 npm/pip 那样的结构化元数据标准。
③ 信息过时快。 Agent 领域更新极快——每周都有新工具发布,也有旧工具停更。一个目录条目可能上周还活着,今天就 404 了。
④ 封闭产品不可索引。 Cursor、Copilot、Lovable 这类产品没有 GitHub 页面,没有公开 API,互联网上能找到的信息就是他们的官网和 Twitter/X 账号。目录平台拿到的只有爬虫抓取的有限描述。
五、一个被我刻意压到最后说的痛点:Agent 搜索
写到这里,我有一个强烈的感受需要说出来——AI Agent 生态里最被忽视的问题,是 Agent 自己的搜索体验很差。
什么意思?不是指搜索引擎不好用,而是:AI Agent 作为搜索的消费者,得到的服务远不如人类。
人类的搜索体验 vs Agent 的搜索体验
| 维度 | 人类 | AI Agent |
|---|---|---|
| 结果消费 | 看摘要 + 点链接 | 读全文 + 结构化提取 |
| 信源验证 | 凭经验判断 | 需要置信度评分 |
| 多个查询 | 手动打开标签页 | 自动化多引擎并行 |
| 反爬策略 | 浏览器自带 cookies | 容易被拦截 |
| Token 成本 | 忽略 | $0.01/次起步 |
| 结果去重 | 肉眼判断 | 需要算法 |
| 安全风险 | 人能看到链接 | Agent 可能直接执行 |
当一个 Agent 需要搜索信息时,它面临的不只是「搜到」的问题,而是:
- 怎么跨多个引擎验证结果? Tavily 说「A」,DDG 说「B」,谁对?
- 怎么控制成本? 每次搜索 $0.01,生产环境每天上千次,一个月 $300+ 打底。
- 怎么处理非结构化数据? 人类看到 JSON 能理解,Agent 也需要解析——但如果没有 schema,就是一堆难以利用的文本。
- 怎么防范注入攻击? Agent 会盲目信任搜索结果中的内容——如果恶意网页在内容里埋了 prompt injection,Agent 可能被劫持。
为什么框架层不解决这个问题?
因为框架(LangChain、CrewAI 等)的定位是「编排层」,不是「基础设施层」。它们假设底层的搜索工具是现成的——你用 Tavily 还是 DuckDuckGo 还是自己写爬虫,那是你自己的事。
但现实是:没有一个免费、可靠、多源验证的搜索基础设施,Agent 的能力上限就被钉死了。
这就是为什么我需要做 Agent Search MCP——但那是另一个故事了。这里我想说的是,这个痛点在当前生态里几乎没人认真讨论。
大家都在卷:框架功能、MCP Server 数量、UI 体验、多 Agent 编排…… 很少有人停下来问一句:「Agent 搜到的信息可靠吗?」
六、实体关系图:知识图谱视角
从信息检索的角度看,AI Agent 生态其实是一张巨大的知识图谱。以下是核心实体类型和关系:
实体类型及规模
| 实体类型 | 规模估计 | 举例 |
|---|---|---|
| Agent Frameworks | 50+ | LangChain, CrewAI, AutoGen |
| Agent Products | 200+ | Cursor, Copilot, Dify |
| MCP Servers | 2,800+ | PostgreSQL MCP, Slack MCP |
| Agent Platforms | 30+ | Dify, Coze, n8n |
| SDKs/Libraries | 40+ | Python SDK, TypeScript SDK |
| LLM Providers | 15+ | OpenAI, Anthropic, Google |
| Protocols | 5+ | MCP, A2A, Proprietary |
| Papers | 100+ | AutoGen, CAMEL, AgentVerse |
| Blogs | 50+ | Lilian Weng, LangChain Blog |
| People | 200+ | 作者、开发者、研究者 |
| Organizations | 100+ | Microsoft, Anthropic, OpenAI |
| Directories | 10+ | Glama, Smithery, mcp.so |
| Benchmarks | 15+ | AgentBench, SWE-bench |
关键关系
Framework ──implements──→ Protocol
MCP Server ──provides──→ Tools
MCP Server ──belongs_to──→ Category
Product ──built_on──→ Framework
Product ──uses──→ LLM Provider
Framework ──integrates──→ Tool
Platform ──orchestrates──→ Agent
Paper ──describes──→ Framework/Product
Blog ──explains──→ Tool/Framework
Directory ──indexes──→ Servers/Agents
Person ──created──→ Framework/Tool/Paper
Organization ──maintains──→ Framework/SDK
图结构的关键洞察
如果把这个生态画成图谱,最突出的结构特征是:
-
MCP Server 是整个图谱的「叶子节点」——它们数量最多(2,800+),增长最快,但单个节点的「度」很低(通常只连接 1-2 个框架或平台)。
-
Frameworks 是「超级节点」——LangChain、CrewAI、AutoGen 连接了 LLM、Tools、MCP Servers、Papers、People,是整个网络的枢纽。一个框架的兴衰会影响到上下游几百个节点。
-
Directories 是「桥梁」——Glama、Smithery 这类目录平台虽然条目不多(相对于 GitHub),但它们是跨图谱的连接器:连接了 MCP Servers 和 Agent Products。
-
目前缺失的边:在关系图中,缺少从「搜索需求」到「搜索结果质量」的反馈回路。也就是说,Agent 用搜索工具获取信息后,「信息是否可靠」这个信息并没有被反馈到系统里。这正是 Agent 搜索优化的核心机会。
七、总结与预测
画完这张图,我有几个判断:
短期(6-12 个月)
-
MCP Server 数量会突破 5,000,但质量分化会很严重——90% 的 Server 可能只有个位数使用者。你需要的是「高质量的 50 个」,不是「能用的 5,000 个」。
-
注册表会开始合并——Glama、Smithery、mcp.so 这类平台会开始互相爬取数据,或者出现一个聚合型的元目录。
-
框架层会「下沉」——LangChain 的抽象正在变成基础设施,越来越多的框架在 LangChain 之上构建,而不是从头重写。
中期(12-24 个月)
-
Agent-native 搜索会成为标配——不是把 Google Search API 包一层就叫 Agent 搜索。真正的 Agent 搜索需要:多源验证、置信度评分、Token 优化、安全过滤、结构化输出。
-
A2A(Agent-to-Agent)协议会开始落地——MCP 解决了 Agent 到工具的连接,A2A 要解决 Agent 到 Agent 的通信。但协议之争远未结束。
-
商业产品会吸收开源框架的最佳实践——Cursor 已经在隐含地使用 LangChain 的 chain-of-thought 模式。商业产品会越来越像「黑盒框架」。
长期(2 年以上)
-
Agent 会改变「搜索」的定义——不再是输入关键词 → 返回链接列表,而是输入目标 → 返回经过验证的结构化知识。
-
开发者面临的新选择不是「学哪个框架」,而是「选择哪个生态」——LangChain 生态 vs OpenAI 生态 vs Anthropic 生态。这决定了你 Agent 的「世界观」是开放的还是封闭的。
写在最后
这篇文章的数据来源包括:GitHub API(多个 awesome lists 的实时数据)、punkpeye/awesome-mcp-servers(89,575★,收录 2,781 个 Server)、Glama/Smithery/mcp.so 目录、以及各产品官网和文档。
数据截止 2026 年 6 月 27 日。照这个领域的更新速度,本文发表后的第一周内,至少会有 20 个新 MCP Server 和 3 个新框架出现。如果你发现某个数据已经过时了——那反而是正常现象。
如果你在构建 Agent 产品,我的建议很简单:
- 别只看框架的 Star 数——选那个你团队能掌控的。LangChain 再强大,如果团队搞不定版本升级,就是灾难。
- MCP 是必须选的——无论你用哪个框架,MCP 协议已经是事实标准。不支持的框架,慎重考虑。
- 别忽视搜索——你的 Agent 好不好用,很大程度取决于它搜到的信息靠不靠谱。这是当前生态最大的蓝海,也是最大的坑。
- 多源验证是底线——单源搜索的 Agent 在投入生产之前就要加上交叉验证。否则上线第一天就会因为一条错误信息做出错误决策。
有空的话,去看看 Agent Search MCP 或者自己搭一个搜索代理。把一个好的搜索引擎交给你的 Agent,比多写一千行编排代码更有用。
— 2026-06-27