AEO

llms.txt 是什么,你需要一个吗?

SEOany · 2026年6月14日 · 4 分钟阅读

每隔几个月,就有一个新文件号称能修好你在 AI 搜索里的可见度。llms.txt 是其中比较冷静的一个——没有炒作,不用插件,就是一个纯文本文件。这篇文章讲清楚它是什么、它刻意不是什么、你的网站到底需不需要,并给你一份五分钟就能改好套用的模板。

llms.txt 是什么?

llms.txt 是放在域名根目录(yoursite.com/llms.txt)的一个纯文本 Markdown 文件,它告诉 AI 爬虫你的网站是做什么的,并链接到最重要的那些页面。可以把它理解成一份为语言模型准备的精选地图:一份简短、人类可读的优质内容索引。

它的格式刻意保持简单:一个写着项目名的 H1、一句放在引用块里的摘要,然后是几段链接的 Markdown。任何写作者都能不碰代码就写出来,任何模型也都能不靠特殊工具就解析。

它由 Jeremy Howard 在 2024 年提出,目的是给语言模型一个干净、省 token 的入口,而不必去爬臃肿的 HTML。你可以在我们自己的 /llms.txt 看到一个真实示例。

想要一句话的定义、以及它与 robots.txt、站点地图之间的关系,可参考术语表里的 llms.txt 词条

llms.txt 不是什么?

llms.txt 不是访问控制,不是排名黑科技,也不是任何保证。它既不拦截也不放行任何爬虫——那是 robots.txt 的活儿——而且没有任何搜索引擎确认它是排名因素。它是一个「帮助被发现」的辅助文件,不是你拉一下就能往上升的杠杆。

它不是 robots.txt。robots.txt 规定爬虫能抓什么、不能抓什么;llms.txt 则默认它们本就受欢迎,只是把它们指向你最好的内容。把某个页面写进 llms.txt,并不会隐藏它、保护它或锁住它。

它不是已确认的排名因素。没有主流搜索引擎说过 llms.txt 会改变排名,把它当增长黑科技只会换来失望。它的价值在于「被发现」与「清晰」,而不是杠杆。

它也不保证一定会被读取。采用率在上升,但完全自愿——有的爬虫会遵循,有的会忽略。发布它,是因为它便宜又有用,而不是因为每个模型都对它负有义务。

你的网站真的需要 llms.txt 吗?

如果 AI 回答对你的业务重要,而你最好的内容又散落在一个庞大或杂乱的站点里,那你需要 llms.txt。它是一个成本低、风险低、几分钟就能写好的文件。如果你只有五个页面、导航又很清晰,收益就有限——但它几乎不会有害。

如果你运营的是文档、大型博客、知识库,或页面很多的产品,收益最大——凡是最好的答案被导航、营销和样板内容埋住的地方,llms.txt 都能让你用一个文件说一句「从这里开始」。

如果你的站点很小且结构已经很好,收益最小。一个只有五页、标题清晰、结构化数据干净的站点,模型不用清单也能轻松读懂。

无论哪种情况,付出都以分钟计,而且它天然配合让 ChatGPT、Perplexity 与 AI 概览引用你这件事——llms.txt 帮引擎找到那些能赢得引用的页面。

llms.txt 里该写什么?(可直接套用的模板)

llms.txt 文件是 Markdown,包含四部分:写着名称的 H1、概括你在做什么的引用块摘要,以及把关键页面列成链接(各附一句话描述)的若干 H2 分区。一个可选的「## Optional」分区放次要链接,模型在上下文紧张时可以跳过。

下面是一份最小模板。把名称、URL 和描述换成你自己的,每条描述保持一句朴素的话,只列出你乐意被引用的页面。

两条规则让它保持有用:链接到规范、自成一体的页面,而不是分类壳页;描述是写给读者看的,不是堆关键词。文件就放在域名根目录,和我们的示例一样。

  • # Acme 机器人
  • > 面向中小制造商的工业机械臂及其运行软件。
  • ## 文档
  • - 快速上手:开箱、接线,20 分钟跑通第一个任务。
  • - API 参考:每个接口、参数和代码示例。
  • ## 产品
  • - 价格:套餐、用量上限,以及每一档包含什么。
  • - 安全指南:安装、防护与合规基础。
  • ## Optional
  • - 更新日志:版本说明——回答核心问题时可跳过。

llms.txt 如何融入你整体的 AI 搜索策略?

llms.txt 只是大图景里的一块拼图,不是整块棋盘。它帮 AI 引擎找到你最好的页面,但引擎仍会评判读到的内容。把它和干净的结构化数据、可引用的答案式内容、以及一个健康可抓取的站点搭配起来——正是这套组合真正赢得引用。

llms.txt 负责「发现」——告诉引擎去哪看;结构化数据负责「理解」——告诉它们每个页面是什么意思。两者都要,因为找到页面的模型,仍需要无歧义的事实才能引用。

剩下的由内容质量决定。答案式、可引用的段落,才是真正被抬进 AI 概览和聊天机器人回答里的东西——无论有没有清单指路。

而这一切在爬虫读不了的站点上都不成立。在打磨 llms.txt 之前,先用一次技术 SEO 审计确认基础过关——渲染失败和被屏蔽的资源,会让你写的每一份清单都白费。

让智能体替你执行这套打法

免费开始