全部分析

AI 如何读取 GitHub

github.com 2026年6月22日 6 分钟阅读尚未就绪

Short

18/ 100

AEO Level 1尚未就绪

▶ Watch this Short on YouTube

一句话结论

GitHub 获得 18 分（满分 100 分）的 AEO 评分，处于第 1 级。尽管作为全球最大的代码托管平台拥有强大的 REST 和 GraphQL API，但该网站几乎没有为 AI 智能体提供结构化信号来发现、认证或与其功能交互。

AI 看到了什么？

AI 爬虫今天登陆 GitHub 会遇到一个为人类开发者设计的 JavaScript 密集型界面，而不是为机器阅读而设计的。

当 AI 爬虫访问 GitHub 主页时，收到的是一份密集的 HTML 文档，包含仓库卡片、热门项目和营销文案——但这些内容都没有被包装在机器可读的结构中来指导智能体找到平台的真实价值。响应头中没有指向 API 端点的 Link，没有宣传 GitHub 强大自动化功能的 MCP Server Card，也没有 Content-Signal 指令来说明内容如何使用。结构化数据覆盖仅达到 40/100，但身份层和 agent_interfaces 层的得分为零。数百万开发者依赖用于自动化的平台讽刺地对能够编排它的 AI 智能体不可见。

GitHub 主页从 AI 智能体的角度看——内容对人类很丰富，但缺少机器可读的智能体信号

GitHub robots.txt：没有 AI 爬虫规则，没有 Content-Signal 指令，没有网站地图参考

它在哪里丢分？

智能体接口和身份/认证是最深层的差距，两者得分都是 0/100。

该如何修复？

三个有针对性的服务器端补充可以显著提升 GitHub 的 AI 就绪度，而无需修改任何应用代码。

发布 API 目录

目标

按照 RFC 9727，在 /.well-known/api-catalog 通过机器可发现的目录暴露 GitHub 的 REST 和 GraphQL API。

问题

扫描未发现 /.well-known/api-catalog 端点，这使 AI 智能体无法以标准方式定位或枚举 GitHub 的 API 功能。

修复

将 /.well-known/api-catalog 作为 application/linkset+json 提供，其中包含 REST API、GraphQL 端点和 webhook 文档的 linkset 条目。任何 RFC 9727 感知的智能体都可以立即枚举 GitHub 提供的所有自动化功能，而无需阅读任何文档页面。

添加 MCP Server Card

目标

发布 Model Context Protocol Server Card，使 AI 智能体可以发现 GitHub 的工具功能和传输端点。

问题

不存在 /.well-known/mcp/server-card.json，这直接导致 agent_interfaces 得分为 0。

修复

创建 /.well-known/mcp/server-card.json，声明 serverInfo、MCP 传输端点和功能（如仓库搜索和拉取请求管理）。此文件使 GitHub 成为任何 MCP 兼容 AI 智能体的一流工具，无需修改 API。

在 robots.txt 中声明 AI 爬虫规则

目标

为每个主要 AI 爬虫添加明确的 User-agent 级别指令，使它们知道哪些路径可用于索引和引用。

问题

GitHub 的 robots.txt 不包含针对 GPTBot、ClaudeBot、PerplexityBot 或类似爬虫的规则，导致 agent_discovery 仅得 25/100。

修复

为每个主要 AI 爬虫添加单个 User-agent 块，并使用 Allow 指令覆盖公开仓库内容和 README 文件。将每个块与 Content-Signal 指令配对，声明 ai-train 和 ai-input 偏好，使 AI 系统基于明确授权而不是猜测意图。

常见问题

为什么 GitHub 尽管有文档完善的 API 但 AEO 得分仍然很低？

GitHub 的 API 文档对已经知道去哪里查找的人类开发者来说很棒，但 AEO 衡量的是机器可发现的信号——RFC 9727 API 目录、MCP Server Card 和 robots.txt AI 指令。今天这些都不存在，因此 AI 智能体即使底层 API 确实强大，也无法通过标准发现协议找到或使用 GitHub 的功能。

添加 AEO 信号会影响 GitHub 现有的 SEO 或人类访问者体验吗？

完全不会。添加 /.well-known/ 端点、Link 响应头和 robots.txt AI 爬虫块是纯粹的附加服务器端更改，对浏览器和人类用户来说完全不可见。它们不产生性能开销，也不改变任何现有的 URL 结构、HTML 或 Googlebot 爬取行为。

如果 GitHub 改进其 AEO 得分，最大的机会是什么？

GitHub 托管了大量开源软件的规范源代码和文档。如果 AI 编码助手和回答引擎能够通过正确的 MCP Server Card 或 API 目录发现和引用 GitHub 内容，会更频繁地在 AI 生成的回答中呈现仓库 README、API 参考和问题讨论，加强 GitHub 作为主要开发者知识来源的权威性。