13 KiB
SEO/GEO/AEO内容优化工具
SEO GEO AEO 内容优化 AI引用 语音搜索 结构化数据
SEO/GEO/AEO 优化器
面向搜索引擎(SEO)、AI平台(GEO - 生成引擎优化)、答案引擎(AEO - 答案引擎优化)、语音助手及社交媒体的内容可见性分析与优化工具包。
作者:Boris Djordjevic,199 Biotechnologies 状态:第二阶段完成(内容实现) 许可证:MIT 仓库:github.com/199-biotechnologies/claude-skill-seo-geo-optimizer
用途
本工具审计并优化内容在以下平台的可发现性:
- 搜索引擎:Google、Bing(传统SEO)
- AI平台:ChatGPT、Perplexity、Claude、Gemini、Grokipedia(GEO - 生成引擎优化)
- 答案引擎:Google AI概览、Bing Copilot、精选摘要(AEO - 答案引擎优化)
- 语音助手:Google Assistant、Siri、Alexa
- 社交媒体:Facebook、Twitter、LinkedIn、WhatsApp、Instagram
支持 HTML、Markdown 和 React/JSX 文件。
关键数据(2025年)
2025年1月至5月,AI引荐流量增长了527%。针对AI引用优化的内容可见性提升33-40%。主要发现:
- 40.58% 的AI引用来自SERP前10名结果
- 含作者资质的内容:引用概率提升 +40%
- 精选摘要:占语音搜索答案的 40.7%
- 添加统计数据:引用提升 +41%
- 内容新鲜度(30天内):引用量提升 3.2 倍
安装
克隆到 Claude 技能目录:
cd ~/.claude/skills/
git clone https://github.com/199-biotechnologies/claude-skill-seo-geo-optimizer.git
要求:Python 3.7+,无外部依赖(仅标准库)。
验证安装:
python ~/.claude/skills/seo-geo-optimizer/scripts/analyze_content.py --help
使用方法
第一阶段:分析
审计现有内容,生成优化建议:
# 全面审计并生成所有报告
python scripts/audit_report.py ~/project/page.html --format all
# 分析特定方面
python scripts/analyze_content.py ~/project/page.html
python scripts/metadata_validator.py ~/project/page.html
python scripts/keyword_analyzer.py ~/project/page.html
python scripts/entity_extractor.py ~/project/page.html
第二阶段:实现
自动应用优化:
# 针对特定平台的完整优化流水线
python scripts/auto_implementer.py page.html perplexity
# 单独优化步骤
python scripts/content_optimizer.py page.html
python scripts/platform_optimizer.py page.html chatgpt
python scripts/voice_optimizer.py page.html
python scripts/freshness_monitor.py page.html
python scripts/citation_enhancer.py page.html
关键词聚类
将相关关键词分组为语义簇,建立主题权威性:
# 使用关键词聚类分析(默认)
python scripts/keyword_analyzer.py ~/project/page.html
# 不使用聚类的快速模式
python scripts/keyword_analyzer.py ~/project/page.html --no-clusters
输出包括:
- 基于 TF-IDF 相似度分组的语义簇
- 每个簇的主题识别
- 支柱内容策略建议
IndexNow 即时索引
直接向搜索引擎提交 URL 以立即建立索引(对 GEO/AEO 至关重要):
# 生成 IndexNow 密钥
python scripts/indexnow_submit.py --generate-key --output ./public
# 提交单个 URL
python scripts/indexnow_submit.py https://example.com/new-page --key YOUR_KEY
# 从文件批量提交
python scripts/indexnow_submit.py --batch urls.txt --key YOUR_KEY
对 GEO 的好处:
- Bing 索引为 AI 平台提供内容(ChatGPT、Perplexity、Claude)
- 内容在数分钟内建立索引,而非数周
- 30天内的新鲜内容引用量提升 3.2 倍
生成结构化数据标记
# FAQ schema(AI引用概率最高)
python scripts/schema_generator.py faq \
--question "什么是长寿医学?" \
--answer "长寿医学通过优化LDL <70 mg/dL等生物标志物来降低30-40%的心血管风险。"
# 带有 E-E-A-T 信号的文章 schema
python scripts/schema_generator.py article \
--title "理解生物标志物" \
--author "Dr. Sarah Johnson" \
--credentials "MD, PhD" \
--date "2025-01-15"
架构
第一阶段:分析(已完成)
六个 Python 脚本分析内容并生成建议:
| 脚本 | 用途 | 输出 |
|---|---|---|
analyze_content.py |
提取元数据、schema、结构 | JSON分析 |
metadata_validator.py |
验证 meta 标签、OG、Twitter | 验证报告 |
keyword_analyzer.py |
提取关键词(5种类型) | 关键词列表 |
entity_extractor.py |
提取人物、机构、地点 | 实体图谱 |
schema_generator.py |
生成 JSON-LD schema | Schema文件 |
audit_report.py |
协调分析,生成报告 | JSON、MD、HTML |
第二阶段:实现(已完成)
六个 Python 脚本实现优化:
| 脚本 | 用途 | 效果 |
|---|---|---|
content_optimizer.py |
Meta描述、FAQ、数据表格 | 结构优化 |
platform_optimizer.py |
ChatGPT、Perplexity、Claude、Gemini | 平台特定优化 |
voice_optimizer.py |
可朗读schema、精选摘要 | 语音搜索就绪 |
freshness_monitor.py |
内容新鲜度追踪 | 新鲜时引用量3.2倍 |
citation_enhancer.py |
统计数据、引用机会 | +41% 和 +28% 提升 |
auto_implementer.py |
完整流水线编排 | 全自动化 |
indexnow_submit.py |
即时搜索引擎索引 | 分钟级 vs 数周 |
第三阶段:高级功能(计划中)
- 竞争分析(SERP前10对比)
- 自动化监控(SQLite时间序列追踪)
- A/B测试框架(统计显著性)
- 分析集成(Google Search Console、Plausible)
功能
内容分析
文件类型:
- HTML(
.html) - Markdown(
.md、.mdx) - React/JSX(
.jsx、.tsx)
提取内容:
- Meta 标签(title、description、keywords)
- Open Graph(og:title、og:description、og:image)
- Twitter Cards(twitter:card、twitter:title)
- JSON-LD 结构化数据标记
- 内容结构(标题、字数、作者)
关键词分析
提取五种关键词类型:
- 主要关键词:核心主题(H1、meta title、URL、前100词)
- 语义关键词:相关词汇(H2/H3、正文)
- LSI关键词:共现词汇(自然语言)
- 长尾关键词:3-8词短语(FAQ、H3)
- 问题关键词:谁/什么/哪里/何时/为何/如何(FAQ schema)
关键词聚类:TF-IDF + 余弦相似度将关键词分组为语义簇,用于主题权威性和支柱内容策略。
Schema 生成
带验证的 JSON-LD schema:
- FAQPage:AI引用概率最高
- Article:E-E-A-T 信号(资质、日期)
- HowTo:语音搜索优化(ISO 8601时长格式)
- BreadcrumbList:网站层级结构
- Organization/LocalBusiness:实体识别
- Person:带资质的作者档案
- Speakable:语音助手优化
平台优化
ChatGPT(占LLM流量40-60%):
- 权威性与资质(引用率提升 +40%)
- 1500-2500词全面覆盖
- 一手来源引用(PubMed、arXiv)
- 答案优先结构
Perplexity(注重新鲜度):
- 内容30天内更新(引用量3.2倍)
- 行内引用格式 [1]、[2]
- H2→H3→列表结构(引用量多40%)
- 更新频率:2-3天(激进)或90天(最低)
Claude(注重准确性):
- 仅限一手来源(归因准确率91.2%)
- 5-8条引用,含出版方和年份
- 透明的方法论
- 承认已知局限
Gemini(注重社区):
- Google 商业资料整合
- 用户评价与评论
- 本地引用(NAP一致性)
- 传统权威信号
Grokipedia(xAI,2025年10月上线):
- 基于 RAG 的引用(事实一致性提升20-30%)
- 透明的版本历史和许可证
- 一手来源归因(出版方+年份)
- Wikipedia 衍生内容需 CC-BY-SA 署名
语音搜索
- 精选摘要优化(30-40词)
- 可朗读 schema(20-30秒片段)
- FAQ schema(自然语言问题)
- 问题关键词提取
社交媒体预览
- Open Graph 标签(Facebook、LinkedIn、WhatsApp、Instagram Stories)
- Twitter Cards(summary、summary_large_image)
- 图片规格(最佳1200×630px,Instagram Stories 1080×1920px)
- Instagram:OG支持有限(仅Stories),个人简介链接优化,85%以上移动用户
- iMessage 优化
输出
报告位置
~/Documents/SEO_Audit_[YYYY-MM-DD]_[HHMM]/
├── audit_report.json # 结构化数据
├── audit_report.md # Markdown报告
├── audit_report.html # 可视化面板
└── generated_schemas/ # JSON-LD文件
├── faq_schema.json
├── article_schema.json
└── howto_schema.json
报告结构
- 执行摘要:总体评分(0-100)、主要问题、主要优势
- 元数据分析:Meta标签、Open Graph、Twitter Cards、schema
- 内容结构:标题、字数、TL;DR、FAQ、作者
- 关键词分析:主要、语义、LSI、长尾、问题关键词
- 平台优化:ChatGPT、Perplexity、Claude、Gemini 建议
- 行动项目:按重要程度排序(关键、高、中、低)
- 生成资产:可直接复制粘贴的 schema 标记
参考文档
位于 reference/ 目录:
citation-optimization-guide.md:AI引用策略(提升+35-40%)entity-seo-guide.md:知识图谱优化platform-strategies.md:平台特定策略voice-search-guide.md:语音助手优化(29词答案)social-preview-guide.md:Open Graph、Twitter Cards(1200×630px)schema-library.md:完整 JSON-LD 参考
templates/ 目录中的模板:
meta-tags-template.html:完整 meta 标签集- Schema 模板:FAQ、Article、HowTo、Breadcrumb、Organization、Person
examples/ 目录中的行业示例:
medical-clinic/:医疗机构优化(15/100 → 92/100)consulting-firm/:B2B 实体SEO(22/100 → 89/100)saas-landing-page/:LLMO 优化(18/100 → 94/100)
配置
优化配置文件
位于 profiles/ 目录:
chatgpt_authority.json:
- 目标:ChatGPT 引用优化
- 重点:权威性、资质、深度
- 字数:1500-2500
- 预期效果:引用概率提升 +40%
perplexity_fresh.json:
- 目标:Perplexity 可见性
- 重点:新鲜度、行内引用
- 更新:每2-3天
- 预期效果:引用量提升 3.2 倍
multi_platform.json:
- 目标:均衡优化
- 平台:ChatGPT、Perplexity、Claude、Gemini、Grokipedia
- 字数:1200-2000
- 更新:每月
voice_optimized.json:
- 目标:语音助手
- 重点:精选摘要、FAQ
- 答案长度:30-40词
- Schema:Speakable、FAQPage、HowTo
性能
脚本执行时间
analyze_content.py:不到1秒metadata_validator.py:不到1秒keyword_analyzer.py:不到2秒(含聚类)entity_extractor.py:不到1秒schema_generator.py:不到1秒audit_report.py:3-5秒auto_implementer.py:10-15秒(完整流水线)indexnow_submit.py:1-3秒(取决于网络)
所有脚本:仅使用 Python 标准库,无外部依赖,支持离线运行(IndexNow 除外,需要网络连接)。
开发状态
第一阶段:核心功能(已完成)
- 内容分析与提取
- Schema 标记生成
- 元数据验证
- 关键词与实体提取
- 多格式报告生成
第二阶段:AI优化(已完成)
- 面向AI引用的内容改写
- 平台特定优化(ChatGPT、Perplexity、Claude、Gemini)
- 语音搜索增强
- 新鲜度监控
- 引用增强(+41%统计数据,+28%引用)
- 自动实现流水线
第三阶段:高级功能(计划中)
- 竞争分析(SERP前10对比)
- 自动化监控(SQLite时间序列数据库)
- 变更检测与告警(邮件、webhook、Slack)
- A/B测试框架(统计显著性检验)
- 分析集成(Google Search Console API、Plausible)
- 统一面板(多源数据可视化)
第四阶段:生态系统集成(计划中)
- 与 minimalist-website-mvp 技能无缝协作
- 通过 generating-pdf 技能自动生成PDF报告
- 导出至 SEO 工具(Ahrefs、SEMrush格式)
- CI/CD 流水线 API 模式
- 用于持久多站点监控的 MCP 服务器
研究基础
基于2025年分析:
- 分析了4100万条AI搜索结果
- 跨平台6.8亿条引用
- AI流量增长527%(2025年1-5月)
已实现的关键发现:
- 添加统计数据:提升 +41%(普林斯顿/佐治亚理工)
- 添加引用:提升 +28%
- 内容新鲜度(30天内):3.2倍引用量(Ahrefs研究)
- 作者资质:引用概率提升 +40%
- H2→H3→列表结构:引用量多40%
- 精选摘要:占语音搜索答案的40.7%
平台引用模式:
- ChatGPT:Wikipedia(130万条引用)、G2(19.6万条)、Forbes(18.1万条)
- Perplexity:更新频率至关重要(新鲜时引用量3.2倍)
- Claude:91.2%正确来源归因(2025年Q2)
- AI概览:占查询的13.14%(2025年3月),高于2025年1月的6.49%
贡献
本项目遵循语义化版本控制(major.minor.patch)。
报告问题:GitHub Issues
许可证
MIT 许可证 - 完整条款请参阅 LICENSE 文件。
版权所有 (c) 2025 Boris Djordjevic,199 Biotechnologies