# GEO
别名:生成引擎优化、Generative Engine Optimization、AI搜索优化、AI引擎优化
定义:GEO(Generative Engine Optimization,生成引擎优化)是让你的内容被豆包、DeepSeek、元宝、Kimi、文心、秘塔、ChatGPT等AI引擎在生成答案时引用的优化方法论。
GEO 是 SEO 在 AI 搜索时代的延伸。SEO 优化的目标是"在搜索结果列表里排前面",GEO 优化的目标是"被 AI 答案直接引用"。核心做法包括:答案前置(把结论写在文章开头)、结构化数据(Schema.org JSON-LD)、llms.txt 入口、AI 爬虫白名单(robots.txt)、实体一致性(同一作者多平台 sameAs 信号)。GEO 不是 SEO 的替代,而是叠加 —— 技术 SEO 的根基(robots/sitemap/canonical)对 GEO 仍是必备前置。
- 在文章开头用 TL;DR 块给出 50 字内的明确答案
- 为每篇文章写 3-5 组 FAQPage Schema
- 用 BlogPosting + Person + BreadcrumbList 三件套结构化
# llms.txt
别名:LLM 站点地图、AI 友好索引文件
定义:llms.txt 是放在网站根目录的 Markdown 索引文件,告诉 AI 引擎站点结构与核心内容。由 Jeremy Howard 在 2024 年 9 月提出,部署在 yourdomain.com/llms.txt。
llms.txt 解决的是"LLM 上下文窗口有限,但需要快速理解站点全貌"的问题。它不替代 sitemap.xml(给搜索爬虫看的全量 URL 清单),而是给 LLM 看的"精选目录":H1 是站点名,blockquote 给一句话定位,二级标题分类(关于/教程/产品/Optional),每条 - 用 [标题](URL): 描述 格式。Optional 部分允许 LLM 在上下文紧张时跳过。
- 本站的 llms.txt: vipke.com.cn/llms.txt
- Anthropic 官方: docs.anthropic.com/llms.txt
# Schema.org
别名:结构化数据、JSON-LD、知识图谱标记
定义:Schema.org 是 Google、Microsoft、Yahoo、Yandex 联合维护的结构化数据词汇表,用 JSON-LD 嵌入网页,告诉搜索引擎和 AI 这个页面"是什么"。
Schema.org 给 AI 引擎提供机器可读的实体类型 —— 一篇博客是 BlogPosting,一个人是 Person,一组问答是 FAQPage。AI 引擎在生成答案时,会优先引用有结构化数据的页面,因为它能直接拿到 headline、author、datePublished 等字段而不用从 HTML 里猜。GEO 站点必备的 5 类 Schema:WebSite、Person/Organization、BlogPosting、BreadcrumbList、FAQPage。
- BlogPosting:每篇文章必带,含 headline/author/datePublished/dateModified
- FAQPage:让文章被 AI 当作"答案库"引用,实测引用率提升 3 倍
- Person + sameAs:把作者多平台账号串起来,提升实体可信度
# JSON-LD
别名:JSON Linked Data
定义:JSON-LD(JSON for Linked Data)是 Schema.org 推荐的结构化数据嵌入格式,用 <script type="application/ld+json"> 标签写在 HTML head 里,与页面渲染解耦。
JSON-LD 相比 Microdata、RDFa 的优势:不污染 HTML 结构,可独立维护,Google/Bing/百度都强烈推荐。AI 引擎抓取时优先解析 JSON-LD,因为它是纯数据,无歧义。一个站点可以注入多个 JSON-LD 块(@graph 数组形式),覆盖 WebSite、Person、BlogPosting 等多个实体。
# FAQPage
别名:常见问题结构化、FAQ Schema
定义:FAQPage 是 Schema.org 的一种类型,标记页面包含的问答对(Question + Answer)。AI 引擎在用户提问时会优先引用 FAQPage 标记的内容。
FAQPage 是 GEO 时代单位字数引用率最高的 Schema 类型。每篇文章 frontmatter 写 3-5 组 Q&A,渲染时自动转 FAQPage JSON-LD —— 实测加 FAQPage 的页面被 ChatGPT、豆包、Kimi 引用概率提升 3 倍。问题要写成用户真实搜索短语(不是文档式陈述),答案 80-150 字一段。
- 问"GEO 是什么意思" 而不是 "概念定义"
- 答案首句直接给定义,后面再展开,符合答案前置原则
# 答案前置
别名:Answer First、倒金字塔结构、TL;DR
定义:答案前置是 GEO 写作的核心原则:把结论、定义、关键数字放在文章开头(通常 TL;DR 块或首段),AI 引擎抓取时只需读前 200 字就能拿到可引用片段。
传统 SEO 时代鼓励"层层铺垫、悬念引导";GEO 时代相反 —— AI 引擎在生成答案时只取最相关的 1-3 句,如果你把答案藏在第 5 段后,大概率不会被引用。最佳实践:开头写 50-80 字 TL;DR,用 blockquote 包裹,标记 strong 突出核心词,后面再用 H2/H3 分主题展开背景、案例、争议。
# robots.txt
别名:爬虫规则文件
定义:robots.txt 放在网站根目录,声明哪些 User-agent 可以抓取哪些路径。GEO 时代必须显式 Allow 主流 AI 爬虫(GPTBot、ClaudeBot、PerplexityBot、Bytespider 等)。
robots.txt 是 GEO 的"门票审核"。默认 User-agent: * Allow: / 看似全开,但部分 CDN 或防火墙会基于 UA 做次级拦截 —— 显式列出每个 AI 爬虫 + Allow / 是最稳的写法。GEO 站点应至少 Allow:GPTBot、OAI-SearchBot、ChatGPT-User、ClaudeBot、Claude-SearchBot、PerplexityBot、Google-Extended、Applebot-Extended、Bytespider(豆包)、Baiduspider(文心) 等 10+ 个。
- 本站 robots.txt 列了 18 个 AI/搜索爬虫白名单
- Bytespider 是字节豆包的爬虫,务必 Allow
# sameAs
别名:实体一致性、Person.sameAs
定义:sameAs 是 Schema.org Person/Organization 的字段,值是该实体在其他权威平台的主页 URL 数组。AI 引擎用它判断"多平台是同一个人,且被认可"。
sameAs 是 GEO 时代的"信任证据链"。一个作者只在自己博客发文,AI 引擎很难判断权威性;但如果 Person.sameAs 列出 [知乎主页, B站主页, GitHub, 头条号, 小红书],AI 就有了多平台一致性证据,引用权重显著上升。这是为什么个人 IP 站建议在 about 页给出全平台账号矩阵 —— 既给读者看,也给 AI 看。
# canonical
别名:规范 URL、rel=canonical
定义:canonical 是 HTML head 里的 <link rel="canonical" href="..."> 标签,声明当前页面的"规范版本 URL"。用于解决重复内容(同一文章多个 URL)被 AI 引擎和搜索引擎重复索引的问题。
GEO 时代 canonical 仍然必备 —— AI 引擎在引用时会回写 source URL,如果一篇文章有 /post/123、/post/123?utm=x、/post/123/ 三个 URL,没 canonical 的话引用流量会被分散。canonical 应该指向"无参数、带斜杠、HTTPS"的最权威版本。Astro 项目里通常通过 SEO 组件自动注入 new URL(Astro.url.pathname, Astro.site)。
# RSS
别名:RSS feed、Really Simple Syndication
定义:RSS 是 XML 格式的内容订阅协议,网站把最新文章列表暴露为 /rss.xml,订阅工具(Feedly、Inoreader)和 AI 爬虫定期抓取。GEO 站点应保留 RSS 作为"标准化新内容信号"。
RSS 在普通用户层面式微,但在 AI 时代回潮 —— 多个 AI 引擎(Perplexity、Kagi、ChatGPT 自定义 GPT)直接读 RSS 作为内容更新源。RSS 比 sitemap 更轻、更新更频繁,且自带 description/pubDate/author 字段,对 AI 引擎抓取友好。Astro 用 @astrojs/rss 包一行 getCollection 即可生成。
# AI 引擎
别名:AI 搜索引擎、生成式 AI、LLM 应用
定义:AI 引擎是基于大语言模型(LLM)的对话式信息获取工具,代表产品包括豆包、DeepSeek、元宝、Kimi、文心、通义、秘塔、ChatGPT、Claude、Perplexity 等。
截至 2025 年,中文用户主要使用的 AI 引擎按用户量级:豆包(字节,月活破亿)>DeepSeek(深度求索,2025 现象级)>元宝(腾讯,微信生态加持)>Kimi(月之暗面,长文本擅长)>文心(百度,搜索协同)>通义(阿里,B 端强)>秘塔(秘塔科技,学术搜索专精)。出海则是 ChatGPT、Claude、Perplexity、Gemini。GEO 优化要全引擎覆盖 —— Schema/llms.txt/robots 是公因子,改一次全引擎收益。
# E-E-A-T
别名:Experience Expertise Authoritativeness Trustworthiness、经验专业权威可信
定义:E-E-A-T 是 Google 评估内容质量的 4 个维度:Experience(经验)、Expertise(专业)、Authoritativeness(权威)、Trustworthiness(可信)。AI 引擎沿用了这套标准评估引用源。
E-E-A-T 不是排名因子本身,而是 Google 质量评估员的指引,但其原则被 AI 引擎广泛沿用。GEO 落地:Experience 体现在"我亲自做过"案例;Expertise 体现在作者 bio + 多年从业声明;Authoritativeness 体现在 sameAs 多平台一致性 + 外部权威站点反链;Trustworthiness 体现在 HTTPS、隐私政策、可联系信息(电话/邮箱/工商信息)。GEO 站点要把作者和企业实体都写清楚。