GEO 实战手册:SEO 之后,如何让 AI 帮你说话?

GEO in Practice: How to Get AI to Cite Your Content

Tech-Experiment #GEO#SEO#生成式引擎优化#AI搜索#Perplexity#ChatGPT#Claude#内容优化#结构化数据#Claude Code
更新于
🇨🇳 中文

搜索流量正在被悄悄蚕食。

根据 2025 年数据:69% 的搜索没有点击任何链接,Google AI Overviews 出现时传统蓝色链接的点击率暴跌 61%(从 1.76% 降至 0.61%)。HubSpot 的内容团队在 2025 年损失了 50% 以上的有机流量,原因很直接——用户的问题被 AI 直接回答了。

但这不是全部的故事。被 AI 引用的网站,自然流量反而多了 35%,转化率是传统搜索的 4.4 倍

这就是 GEO 想解决的问题:在 AI 回答里争一个位置。

根据 KDD 2024 论文(GEO-bench,10,000 条查询测试),添加权威引述(Quotation Addition)可提升 AI 可见度 +41%,添加统计数据(Statistics Addition)提升 +33%,而关键词堆砌(Keyword Stuffing)反而使可见度下降 8%。

Yext 分析 1720 万条 AI 引用后发现:品牌提及与 AI 引用概率的相关系数为 0.664,而反向链接仅为 0.218;被 4 个以上平台提及的品牌,出现在 ChatGPT 回答中的概率提升 2.8 倍。

Perplexity 中最近 30 天内更新的内容被引用率高出旧内容 38%;ChatGPT 只引用约 15% 的已检索页面,而 Reddit 占其引用总量的 10% 以上(2025 年同比增长 87%)。

文章前 30% 是 AI 引用的”黄金地带”,44.2% 的 LLM 引用来自此区域;比较表格被引用率比纯文本高出 2.5 倍;GEO 优化效果预期:实施技术修复后 30 天内 Perplexity 开始索引,60–90 天内出现可测量的引用频率提升。


一、什么是 GEO?

GEO(Generative Engine Optimization,生成式引擎优化) 由普林斯顿大学、佐治亚理工学院、艾伦人工智能研究所(AI2)和 IIT 德里分校的研究团队于 2023 年 11 月提出,论文于 KDD 2024(ACM 第 30 届知识发现与数据挖掘大会)正式发表(arXiv:2311.09735)。

简单说:SEO 是让搜索引擎排名靠前,GEO 是让 AI 把你的内容当答案引用出来。

维度传统 SEOGEO
目标SERP 排名AI 回答中被引用
优化对象关键词、链接权重语言模型理解力、可引用性
成功指标CTR、排名引用频率、AI 品牌声量
底层逻辑PageRank(链接图)语义相关性 + 权威信号
内容目的吸引点击成为 AI 的”引用素材”

关键区别:GEO 不取代 SEO,而是补充它。AI 引擎频繁从 Google 前 10 结果中提取内容,良好的传统 SEO 仍是 GEO 的基础——但光有 SEO 已经不够了。


二、各 AI 引擎的引用逻辑

不同 AI 引擎引用内容的方式差异显著,Yext 分析了 1720 万条 AI 引用后得出以下结论:

ChatGPT(GPT-4o + Bing 检索)

  • 只引用约 15% 的已检索页面,筛选极为严格
  • Reddit 占其引用总量的 10%+,2025 年同比暴增 87%
  • 引用最多域名:Reddit、Wikipedia、Amazon、Forbes、Business Insider
  • 采用 RAG 架构,外部检索按行业差异化

Perplexity

  • 最近 30 天内更新的内容被引用率高出旧内容 38%
  • Reddit 占其引用来源的 46.7%(是其第一来源)
  • 完全遵守 robots.txt,被屏蔽即不被索引
  • L3 XGBoost 重排序器 + BERT 实体链接

Claude(Anthropic)

  • 引用用户生成内容(UGC)的比率是其他模型的 2-4 倍
  • 更重视社区验证内容(Constitutional AI 框架影响)
  • 对第一人称经历写作有更高引用倾向

Gemini

  • 深度依赖 Google 搜索索引,继承传统 SEO 偏好
  • 对 Core Web Vitals 和 E-E-A-T 信号非常敏感
  • 品牌在 Google 知识图谱中的权威度直接影响引用

跨平台规律(最重要的一条)

品牌提及与 AI 引用概率的相关系数为 0.664,而反向链接仅为 0.218。被 4 个以上平台提及的品牌,出现在 ChatGPT 回答中的概率提升 2.8 倍


三、论文实测:什么内容最容易被 AI 引用?

KDD 2024 论文用 GEO-bench(10,000 条查询)测试了 9 种优化方法,以”位置加权词频”衡量可见度提升:

优化技术可见度提升适用场景
添加权威引述(Quotation Addition)+41%所有类型文章
添加统计数据(Statistics Addition)+33%分析类、报告类
引用权威来源(Cite Sources)+30%技术类、研究类
流畅度优化(Fluency Optimization)+28%粗糙初稿改写
通俗易懂(Easy-to-Understand)+12%专业词汇密集的内容
权威语气(Authoritative Tone)+11%观点类文章
专业术语(Technical Terms)+8%特定垂直领域
独特词汇(Unique Words)+5%效果最弱
关键词堆砌(Keyword Stuffing)-8%避免

三个关键发现:

  1. “引言是黄金地带”:44.2% 的 LLM 引用来自文章前 30%
  2. 表格被引用率高出纯文本 2.5 倍
  3. 小站逆袭可能:排名第 5 的网站用”引用来源”技术后可见度提升 115%,大站反而下降 30%

四、本博客的 GEO 实战记录

blog.mshroom.cv 为活体案例——这是 2026 年 4 月 24 日执行的实际操作记录。

4.1 技术层面(已执行)

Step 1:robots.txt 允许 AI 爬虫

许多网站主为了防止 AI 爬取训练数据,用 Cloudflare 默认屏蔽了所有 AI 爬虫。但这样做的副作用是连 AI 搜索引用爬虫也一起屏蔽了——PerplexityBot 被屏蔽后直接不索引你的内容。

区分两类爬虫很重要:

# 允许 AI 搜索引用爬虫(影响 AI 回答中是否引用你)
User-agent: OAI-SearchBot
Allow: /

User-agent: PerplexityBot
Allow: /

User-agent: Claude-SearchBot
Allow: /

# GPTBot 是 OpenAI 训练数据爬虫(与引用无关,按需决定)
User-agent: GPTBot
Allow: /

Step 2:BlogPosting JSON-LD 结构化数据

结构化数据告诉 AI 引擎:这篇文章的作者是谁、发布时间是什么、属于哪个分类。本博客在所有文章的 <head> 中注入了如下 schema(Astro 实现):

<script type="application/ld+json" set:html={JSON.stringify({
  "@context": "https://schema.org",
  "@type": "BlogPosting",
  "headline": title,
  "description": description,
  "datePublished": pubDate.toISOString(),
  "dateModified": (updatedDate || pubDate).toISOString(),
  "author": {
    "@type": "Person",
    "name": "Jason",
    "url": "https://blog.mshroom.cv/about"
  },
  "keywords": tags?.join(', '),
  "articleSection": category,
  "inLanguage": hasEnglish ? ["zh-CN", "en"] : "zh-CN"
})} />

Step 3:hreflang 双语声明

本博客采用中英双语格式(<!--EN--> 分隔符),添加 hreflang 后 Google 和 AI 引擎能正确识别:

<link rel="alternate" hreflang="zh" href="当前URL" />
<link rel="alternate" hreflang="en" href="当前URL" />
<link rel="alternate" hreflang="x-default" href="当前URL" />

Step 4:RSS 增强

RSS feed 添加了 <language>zh-CN</language><lastBuildDate>(内容新鲜度信号)和 <category> 标签。Perplexity 等 AI 引擎通过 RSS 追踪内容更新频率。

4.2 内容层面(待执行)

已识别的内容优化方向(按优先级):

优先级改进项影响
High15 篇文章补充英文 titleEn/descriptionEn英文 SERP 和 AI 引用的元数据完整性
High高流量文章引言改写为 BLUF 格式增加”前 30% 黄金地带”的引用密度
Medium每篇文章添加 3-5 个”可引用陈述”句直接提升统计数据密度
Medium文章底部添加”相关文章”区块内链 + AI 上下文关联度
Low补充更新日期(updatedDate 字段)Perplexity 内容新鲜度信号

五、针对各 AI 引擎的 GEO 步骤

通用步骤(所有引擎适用)

基线审计(30 分钟,免费)

打开 ChatGPT、Perplexity、Claude、Google AI Mode,逐一查询你博客涵盖的 10 个核心问题:

示例查询(本博客场景):
- "如何在 Mac Mini 上跑本地 AI 模型?"
- "DeepSeek V4-Flash 本地推理需要多少内存?"
- "Vibe Coding 有哪些工具?"
- "GEO 是什么?怎么优化?"

记录:AI 是否提到了 blog.mshroom.cv?如果没有,竞争对手是谁?

内容改造清单(每篇文章)

  • 引言前 60 词直接给出核心答案(BLUF 原则)
  • 每个核心观点有数据来源"根据 X 研究(2026),Y 提升了 Z%"
  • 至少一个比较表格(被 AI 引用率高出纯文本 2.5 倍)
  • 段落模块化:每段 40-60 词,独立可读,无需上下文
  • 文章末尾添加可见更新日期最后更新:2026-04-24

针对 Perplexity 的专项优化

Perplexity 最重视内容新鲜度和 Reddit 式社区内容:

  1. 高价值文章每月更新一次(哪怕只是添加最新数据)
  2. 在 frontmatter 中填写 updatedDate,触发 RSS 更新信号
  3. 在文章中明确标注”最后更新时间”(可见给用户,也可见给爬虫)
  4. 将文章核心论点以讨论帖形式发布到 V2EX、知乎等社区(中文版 Reddit)

针对 ChatGPT 的专项优化

ChatGPT 的引用筛选率极低(只引用 15% 的检索结果),要想被选中需要:

  1. Wikipedia 式写法:开篇定义清晰,有大量内部交叉引用
  2. 事实密度:每 100 词包含至少 1 个可核实的数据点
  3. 权威引述:直接引用官方文档、论文、公告原文
  4. 多平台品牌出现:GitHub、知乎、少数派上有相同观点的其他版本

针对 Claude 的专项优化

Claude 最重视第一人称经历和社区验证:

  1. 写亲历记录,而非摘要转述(“我在 Mac Mini M4 Pro 上测试了…” > “据报道…”)
  2. 加入操作截图或实测数据
  3. 明确作者身份:在 Schema 和正文中都出现”作者是谁,为什么有资格说这个”

针对 Google AI Overviews / Gemini 的专项优化

  1. 保持传统 SEO 基础(Core Web Vitals、内链)
  2. FAQ Schema 是最有效的单项投资:FAQPage 结构化数据被 AI Overviews 不成比例地高频采用
  3. 确保品牌在 Google 知识图谱中有独立实体(维护 Google Business Profile 或 Wikipedia 词条)

六、用 Claude Code 自动化 GEO 审计

手动审计 52 篇文章不现实。以下是用 Claude Code 构建的自动化 GEO 审计脚本思路:

# geo_audit.py — 本博客 GEO 审计自动化
import os, re, json
from pathlib import Path

BLOG_DIR = Path("src/content/blog")
RULES = {
    "has_stats": r'\d+[%倍×x]',           # 包含统计数据
    "has_citation": r'根据|来源|数据来自|according to|source',  # 有引用来源
    "has_table": r'\|.*\|',               # 有表格
    "intro_length": None,                 # 引言词数(前3段)
    "total_length": None,                 # 全文词数
    "has_updated_date": r'updatedDate',   # 有更新日期
    "has_title_en": r'titleEn:',          # 有英文标题
}

results = []
for md in BLOG_DIR.glob("*.md"):
    text = md.read_text(encoding="utf-8")
    score = 0
    details = {}
    for rule, pattern in RULES.items():
        if pattern:
            match = bool(re.search(pattern, text, re.I))
            details[rule] = match
            if match: score += 3
        else:
            # 字数统计
            words = len(text.split())
            details[rule] = words
            if words > 2000: score += 3
    results.append({"file": md.name, "score": score, "details": details})

# 输出低分文章(优先改造)
low_score = [r for r in results if r["score"] < 10]
print(f"需要改造的文章({len(low_score)} 篇):")
for r in sorted(low_score, key=lambda x: x["score"]):
    print(f"  {r['file']}: {r['score']}/18 分")

在 Claude Code 中直接运行:

# 在项目根目录
python geo_audit.py

# 或用 Claude Code 的 /run 命令
# 输出:每篇文章的 GEO 分数和最需要改造的清单

更进一步,可以让 Claude Code 自动生成改造建议:

@blog/src/content/blog/your-post.md
请对这篇文章进行 GEO 改造:
1. 将引言改写为 BLUF 格式(前 60 词直接给出核心结论)
2. 为每个核心观点添加数据引用
3. 在合适位置插入对比表格
4. 添加 FAQ 区块(3-5 个用户会向 AI 提问的问题)
保持原有内容,不改变核心观点,只改变表达方式。

七、DIY GEO 24 分审计清单

对你的每篇高价值文章打分,满分 24 分:

内容结构(12分)

  • H1 是问题句式或明确定义句(+2)
  • 前 60 词直接给出核心答案(+3)
  • 包含至少一个比较表格(+3)
  • 段落模块化,每段 40-60 词(+2)
  • 全文 2000 词以上(+2)

权威信号(8分)

  • 每个核心观点有明确数据来源(+3)
  • 直接引用权威文献/官方文档(+2)
  • 作者信息在正文中明确(姓名 + 资质)(+2)
  • 文章末尾有可见更新日期(+1)

技术信号(4分)

  • frontmatter 有 titleEn 和 descriptionEn(+1)
  • frontmatter 有 updatedDate(+1)
  • 文章中有内链指向相关文章(+1)
  • robots.txt 允许主要 AI 爬虫(全站一次即可)(+1)

评分解读

  • 20-24 分:GEO 优化文章,可作为品牌锚定内容
  • 14-19 分:有提升空间,重点改引言和数据密度
  • 0-13 分:建议重写引言和结构

八、工具推荐

免费方案(个人博客首选)

方法操作成本
手动 Prompt 审计每周在 ChatGPT/Perplexity/Claude 查询 20 个目标问题免费
GA4 AI 来源追踪创建自定义渠道分组(chatgpt.com, perplexity.ai, claude.ai)免费
Schema 验证validator.schema.org免费
富摘要测试search.google.com/test/rich-results免费

付费工具(认真的内容创作者)

工具价格特点
Otterly.ai$29-$989/月覆盖 ChatGPT/Perplexity/Gemini/Copilot,自动监控
Promptmonitor$29-$129/月支持 DeepSeek/Grok,历史数据追踪
Semrush AI Toolkit$99/月最多 50 个竞争对手监控

效果时间预期:实施技术层面修复后 30 天内 Perplexity 开始索引变化,60-90 天内出现可测量的引用频率提升。


九、中文内容的先发优势

英文 GEO 生态已趋于饱和:大量工具、专业机构、完整课程体系都在优化同一批英文关键词。

中文内容是另一回事。

目前在 Perplexity、ChatGPT、Claude 上查询中文技术问题,AI 引用的来源以英文页面为主,中文来源极少。这不是因为中文内容质量低,而是因为:

  1. 中文技术博客几乎没有人做过 GEO 优化
  2. AI 训练数据中高质量中文技术内容相对稀少
  3. 结构化数据(JSON-LD)在中文内容中使用率极低

对中文内容创作者来说,GEO 现在的机会窗口约等于 2010 年的 SEO 初期——一小部分人先行动,就能在接下来的 2-3 年里占据 AI 引用的高地。

你现在读到这篇文章,已经比 99% 的中文内容创作者早了。


Jason · Mycelium Protocol · 2026 年 4 月

本文数据来源:GEO 论文 KDD 2024,Yext 1720 万引用分析,Previsible 2025 AI 流量报告,Backlinko GEO 指南,Semrush AI 引用域名研究。

🇬🇧 English

GEO in Practice: How to Get AI to Cite Your Content

A hands-on guide for developers, content creators, and KOLs — using this blog as a live case study.


The Problem: AI is Eating Your Traffic

Search traffic is being quietly redirected. In 2025, 69% of searches resulted in zero clicks, and traditional link CTR collapsed by 61% when Google AI Overviews appeared. But here’s the flip side: websites that are cited by AI see 35% more organic traffic and 4.4× higher conversion rates than traditional search visitors.

This gap — between being cited and being ignored — is what GEO addresses.


What Is GEO?

Generative Engine Optimization (GEO) is the practice of optimizing content to be cited and recommended by AI-powered search engines (ChatGPT, Perplexity, Claude, Google AI Overviews).

The concept was formalized in a paper by Princeton, Georgia Tech, AI2, and IIT Delhi, published at KDD 2024 (arXiv:2311.09735).

The key distinction: SEO optimizes for rankings. GEO optimizes for citation. Both matter — AI engines frequently draw from Google’s top 10 results, so good SEO remains the foundation. But SEO alone is no longer sufficient.


What the Research Found: 9 Techniques, Ranked by Impact

The KDD 2024 paper tested 9 content optimization techniques against 10,000 queries, measuring “position-weighted citation frequency”:

TechniqueVisibility Boost
Quotation Addition+41%
Statistics Addition+33%
Cite Sources+30%
Fluency Optimization+28%
Easy to Understand+12%
Authoritative Tone+11%
Technical Terms+8%
Unique Words+5%
Keyword Stuffing−8%

Three non-obvious findings:

  1. The intro is the citation goldzone: 44.2% of LLM citations come from the first 30% of content
  2. Comparison tables get cited 2.5× more than plain prose
  3. Small sites can outperform large ones: a site ranked 5th that added source citations saw a 115% visibility boost, while top-ranked sites lost ~30%

What We Did on This Blog (Live Example)

On April 24, 2026, we executed four technical GEO changes on blog.mshroom.cv:

1. Opened robots.txt to AI search crawlers Many sites (especially Cloudflare-protected ones) inadvertently block AI citation crawlers alongside training crawlers. The distinction matters:

# These crawlers determine if AI cites you in search results
User-agent: OAI-SearchBot    # ChatGPT real-time search
Allow: /
User-agent: PerplexityBot    # Perplexity full indexing
Allow: /
User-agent: Claude-SearchBot # Claude search mode
Allow: /

2. Added BlogPosting JSON-LD to every article Structured data helps AI engines identify content type, authorship, publication date, and topic. We injected schema directly in the Astro layout using frontmatter data (title, tags, category, pubDate, updatedDate).

3. Added hreflang for bilingual content This blog publishes Chinese/English bilingual posts (split by <!--EN--> delimiter). Without hreflang, neither language audience gets properly served in their respective SERPs.

4. Enhanced RSS feed Added <language>zh-CN</language>, <lastBuildDate>, and per-item <category> tags. Perplexity uses RSS to track content freshness — an article updated yesterday is 38% more likely to be cited than one unchanged for 3 months.


Your 24-Point GEO Self-Audit

Score each high-value article:

Content Structure (12 pts)

  • H1 is a question or clear definition (+2)
  • First 60 words give the direct answer (BLUF) (+3)
  • At least one comparison table (+3)
  • Modular paragraphs, 40–60 words each (+2)
  • Total length 2,000+ words (+2)

Authority Signals (8 pts)

  • Every major claim has a cited source with data (+3)
  • Direct quotes from authoritative sources (+2)
  • Author identity explicit in body text (+2)
  • Visible “Last Updated” date (+1)

Technical Signals (4 pts)

  • English frontmatter (titleEn, descriptionEn) filled in (+1)
  • updatedDate field populated (+1)
  • Internal links to related articles (+1)
  • robots.txt allows major AI crawlers (+1)

Score guide: 20–24 = GEO-ready; 14–19 = revise intro + data density; 0–13 = needs structural rewrite.


The Chinese Content Opportunity

English GEO is already competitive. Hundreds of agencies and tools are optimizing the same English queries.

Chinese technical content is a different story. In 2026, when you query Chinese technical questions in Perplexity or ChatGPT, the cited sources are overwhelmingly English. This isn’t because Chinese content is lower quality — it’s because almost no Chinese content creators have implemented structured data, AI crawler permissions, or citation-optimized writing.

For Chinese content creators, the GEO opportunity window today roughly mirrors SEO in 2010. The writers who move first will dominate AI citations for the next 2–3 years.

The tools are all available. The competition is minimal. The window is open — but not for long.


Data sources: GEO paper (KDD 2024), Yext 17.2M citation analysis, Previsible 2025 AI Traffic Report, Backlinko GEO Guide, Semrush AI domain citation research.

💬 评论与讨论

使用 GitHub 账号登录后发表评论