444 lines
13 KiB
Markdown
444 lines
13 KiB
Markdown
|
|
# SEO/GEO/AEO内容优化工具
|
|||
|
|
|
|||
|
|
`SEO` `GEO` `AEO` `内容优化` `AI引用` `语音搜索` `结构化数据`
|
|||
|
|
|
|||
|
|
# SEO/GEO/AEO 优化器
|
|||
|
|
|
|||
|
|
面向搜索引擎(SEO)、AI平台(GEO - 生成引擎优化)、答案引擎(AEO - 答案引擎优化)、语音助手及社交媒体的内容可见性分析与优化工具包。
|
|||
|
|
|
|||
|
|
**作者**:Boris Djordjevic,[199 Biotechnologies](https://199.bio)
|
|||
|
|
**状态**:第二阶段完成(内容实现)
|
|||
|
|
**许可证**:MIT
|
|||
|
|
**仓库**:[github.com/199-biotechnologies/claude-skill-seo-geo-optimizer](https://github.com/199-biotechnologies/claude-skill-seo-geo-optimizer)
|
|||
|
|
|
|||
|
|
---
|
|||
|
|
|
|||
|
|
## 用途
|
|||
|
|
|
|||
|
|
本工具审计并优化内容在以下平台的可发现性:
|
|||
|
|
|
|||
|
|
- **搜索引擎**:Google、Bing(传统SEO)
|
|||
|
|
- **AI平台**:ChatGPT、Perplexity、Claude、Gemini、Grokipedia(GEO - 生成引擎优化)
|
|||
|
|
- **答案引擎**:Google AI概览、Bing Copilot、精选摘要(AEO - 答案引擎优化)
|
|||
|
|
- **语音助手**:Google Assistant、Siri、Alexa
|
|||
|
|
- **社交媒体**:Facebook、Twitter、LinkedIn、WhatsApp、Instagram
|
|||
|
|
|
|||
|
|
支持 HTML、Markdown 和 React/JSX 文件。
|
|||
|
|
|
|||
|
|
---
|
|||
|
|
|
|||
|
|
## 关键数据(2025年)
|
|||
|
|
|
|||
|
|
2025年1月至5月,AI引荐流量增长了527%。针对AI引用优化的内容可见性提升33-40%。主要发现:
|
|||
|
|
|
|||
|
|
- 40.58% 的AI引用来自SERP前10名结果
|
|||
|
|
- 含作者资质的内容:引用概率提升 +40%
|
|||
|
|
- 精选摘要:占语音搜索答案的 40.7%
|
|||
|
|
- 添加统计数据:引用提升 +41%
|
|||
|
|
- 内容新鲜度(30天内):引用量提升 3.2 倍
|
|||
|
|
|
|||
|
|
---
|
|||
|
|
|
|||
|
|
## 安装
|
|||
|
|
|
|||
|
|
克隆到 Claude 技能目录:
|
|||
|
|
|
|||
|
|
```bash
|
|||
|
|
cd ~/.claude/skills/
|
|||
|
|
git clone https://github.com/199-biotechnologies/claude-skill-seo-geo-optimizer.git
|
|||
|
|
```
|
|||
|
|
|
|||
|
|
要求:Python 3.7+,无外部依赖(仅标准库)。
|
|||
|
|
|
|||
|
|
验证安装:
|
|||
|
|
```bash
|
|||
|
|
python ~/.claude/skills/seo-geo-optimizer/scripts/analyze_content.py --help
|
|||
|
|
```
|
|||
|
|
|
|||
|
|
---
|
|||
|
|
|
|||
|
|
## 使用方法
|
|||
|
|
|
|||
|
|
### 第一阶段:分析
|
|||
|
|
|
|||
|
|
审计现有内容,生成优化建议:
|
|||
|
|
|
|||
|
|
```bash
|
|||
|
|
# 全面审计并生成所有报告
|
|||
|
|
python scripts/audit_report.py ~/project/page.html --format all
|
|||
|
|
|
|||
|
|
# 分析特定方面
|
|||
|
|
python scripts/analyze_content.py ~/project/page.html
|
|||
|
|
python scripts/metadata_validator.py ~/project/page.html
|
|||
|
|
python scripts/keyword_analyzer.py ~/project/page.html
|
|||
|
|
python scripts/entity_extractor.py ~/project/page.html
|
|||
|
|
```
|
|||
|
|
|
|||
|
|
### 第二阶段:实现
|
|||
|
|
|
|||
|
|
自动应用优化:
|
|||
|
|
|
|||
|
|
```bash
|
|||
|
|
# 针对特定平台的完整优化流水线
|
|||
|
|
python scripts/auto_implementer.py page.html perplexity
|
|||
|
|
|
|||
|
|
# 单独优化步骤
|
|||
|
|
python scripts/content_optimizer.py page.html
|
|||
|
|
python scripts/platform_optimizer.py page.html chatgpt
|
|||
|
|
python scripts/voice_optimizer.py page.html
|
|||
|
|
python scripts/freshness_monitor.py page.html
|
|||
|
|
python scripts/citation_enhancer.py page.html
|
|||
|
|
```
|
|||
|
|
|
|||
|
|
### 关键词聚类
|
|||
|
|
|
|||
|
|
将相关关键词分组为语义簇,建立主题权威性:
|
|||
|
|
|
|||
|
|
```bash
|
|||
|
|
# 使用关键词聚类分析(默认)
|
|||
|
|
python scripts/keyword_analyzer.py ~/project/page.html
|
|||
|
|
|
|||
|
|
# 不使用聚类的快速模式
|
|||
|
|
python scripts/keyword_analyzer.py ~/project/page.html --no-clusters
|
|||
|
|
```
|
|||
|
|
|
|||
|
|
输出包括:
|
|||
|
|
- 基于 TF-IDF 相似度分组的语义簇
|
|||
|
|
- 每个簇的主题识别
|
|||
|
|
- 支柱内容策略建议
|
|||
|
|
|
|||
|
|
### IndexNow 即时索引
|
|||
|
|
|
|||
|
|
直接向搜索引擎提交 URL 以立即建立索引(对 GEO/AEO 至关重要):
|
|||
|
|
|
|||
|
|
```bash
|
|||
|
|
# 生成 IndexNow 密钥
|
|||
|
|
python scripts/indexnow_submit.py --generate-key --output ./public
|
|||
|
|
|
|||
|
|
# 提交单个 URL
|
|||
|
|
python scripts/indexnow_submit.py https://example.com/new-page --key YOUR_KEY
|
|||
|
|
|
|||
|
|
# 从文件批量提交
|
|||
|
|
python scripts/indexnow_submit.py --batch urls.txt --key YOUR_KEY
|
|||
|
|
```
|
|||
|
|
|
|||
|
|
对 GEO 的好处:
|
|||
|
|
- Bing 索引为 AI 平台提供内容(ChatGPT、Perplexity、Claude)
|
|||
|
|
- 内容在数分钟内建立索引,而非数周
|
|||
|
|
- 30天内的新鲜内容引用量提升 3.2 倍
|
|||
|
|
|
|||
|
|
### 生成结构化数据标记
|
|||
|
|
|
|||
|
|
```bash
|
|||
|
|
# FAQ schema(AI引用概率最高)
|
|||
|
|
python scripts/schema_generator.py faq \
|
|||
|
|
--question "什么是长寿医学?" \
|
|||
|
|
--answer "长寿医学通过优化LDL <70 mg/dL等生物标志物来降低30-40%的心血管风险。"
|
|||
|
|
|
|||
|
|
# 带有 E-E-A-T 信号的文章 schema
|
|||
|
|
python scripts/schema_generator.py article \
|
|||
|
|
--title "理解生物标志物" \
|
|||
|
|
--author "Dr. Sarah Johnson" \
|
|||
|
|
--credentials "MD, PhD" \
|
|||
|
|
--date "2025-01-15"
|
|||
|
|
```
|
|||
|
|
|
|||
|
|
---
|
|||
|
|
|
|||
|
|
## 架构
|
|||
|
|
|
|||
|
|
### 第一阶段:分析(已完成)
|
|||
|
|
|
|||
|
|
六个 Python 脚本分析内容并生成建议:
|
|||
|
|
|
|||
|
|
| 脚本 | 用途 | 输出 |
|
|||
|
|
|--------|---------|--------|
|
|||
|
|
| `analyze_content.py` | 提取元数据、schema、结构 | JSON分析 |
|
|||
|
|
| `metadata_validator.py` | 验证 meta 标签、OG、Twitter | 验证报告 |
|
|||
|
|
| `keyword_analyzer.py` | 提取关键词(5种类型) | 关键词列表 |
|
|||
|
|
| `entity_extractor.py` | 提取人物、机构、地点 | 实体图谱 |
|
|||
|
|
| `schema_generator.py` | 生成 JSON-LD schema | Schema文件 |
|
|||
|
|
| `audit_report.py` | 协调分析,生成报告 | JSON、MD、HTML |
|
|||
|
|
|
|||
|
|
### 第二阶段:实现(已完成)
|
|||
|
|
|
|||
|
|
六个 Python 脚本实现优化:
|
|||
|
|
|
|||
|
|
| 脚本 | 用途 | 效果 |
|
|||
|
|
|--------|---------|--------|
|
|||
|
|
| `content_optimizer.py` | Meta描述、FAQ、数据表格 | 结构优化 |
|
|||
|
|
| `platform_optimizer.py` | ChatGPT、Perplexity、Claude、Gemini | 平台特定优化 |
|
|||
|
|
| `voice_optimizer.py` | 可朗读schema、精选摘要 | 语音搜索就绪 |
|
|||
|
|
| `freshness_monitor.py` | 内容新鲜度追踪 | 新鲜时引用量3.2倍 |
|
|||
|
|
| `citation_enhancer.py` | 统计数据、引用机会 | +41% 和 +28% 提升 |
|
|||
|
|
| `auto_implementer.py` | 完整流水线编排 | 全自动化 |
|
|||
|
|
| `indexnow_submit.py` | 即时搜索引擎索引 | 分钟级 vs 数周 |
|
|||
|
|
|
|||
|
|
### 第三阶段:高级功能(计划中)
|
|||
|
|
|
|||
|
|
- 竞争分析(SERP前10对比)
|
|||
|
|
- 自动化监控(SQLite时间序列追踪)
|
|||
|
|
- A/B测试框架(统计显著性)
|
|||
|
|
- 分析集成(Google Search Console、Plausible)
|
|||
|
|
|
|||
|
|
---
|
|||
|
|
|
|||
|
|
## 功能
|
|||
|
|
|
|||
|
|
### 内容分析
|
|||
|
|
|
|||
|
|
**文件类型**:
|
|||
|
|
- HTML(`.html`)
|
|||
|
|
- Markdown(`.md`、`.mdx`)
|
|||
|
|
- React/JSX(`.jsx`、`.tsx`)
|
|||
|
|
|
|||
|
|
**提取内容**:
|
|||
|
|
- Meta 标签(title、description、keywords)
|
|||
|
|
- Open Graph(og:title、og:description、og:image)
|
|||
|
|
- Twitter Cards(twitter:card、twitter:title)
|
|||
|
|
- JSON-LD 结构化数据标记
|
|||
|
|
- 内容结构(标题、字数、作者)
|
|||
|
|
|
|||
|
|
### 关键词分析
|
|||
|
|
|
|||
|
|
提取五种关键词类型:
|
|||
|
|
|
|||
|
|
1. **主要关键词**:核心主题(H1、meta title、URL、前100词)
|
|||
|
|
2. **语义关键词**:相关词汇(H2/H3、正文)
|
|||
|
|
3. **LSI关键词**:共现词汇(自然语言)
|
|||
|
|
4. **长尾关键词**:3-8词短语(FAQ、H3)
|
|||
|
|
5. **问题关键词**:谁/什么/哪里/何时/为何/如何(FAQ schema)
|
|||
|
|
|
|||
|
|
**关键词聚类**:TF-IDF + 余弦相似度将关键词分组为语义簇,用于主题权威性和支柱内容策略。
|
|||
|
|
|
|||
|
|
### Schema 生成
|
|||
|
|
|
|||
|
|
带验证的 JSON-LD schema:
|
|||
|
|
|
|||
|
|
- **FAQPage**:AI引用概率最高
|
|||
|
|
- **Article**:E-E-A-T 信号(资质、日期)
|
|||
|
|
- **HowTo**:语音搜索优化(ISO 8601时长格式)
|
|||
|
|
- **BreadcrumbList**:网站层级结构
|
|||
|
|
- **Organization/LocalBusiness**:实体识别
|
|||
|
|
- **Person**:带资质的作者档案
|
|||
|
|
- **Speakable**:语音助手优化
|
|||
|
|
|
|||
|
|
### 平台优化
|
|||
|
|
|
|||
|
|
**ChatGPT**(占LLM流量40-60%):
|
|||
|
|
- 权威性与资质(引用率提升 +40%)
|
|||
|
|
- 1500-2500词全面覆盖
|
|||
|
|
- 一手来源引用(PubMed、arXiv)
|
|||
|
|
- 答案优先结构
|
|||
|
|
|
|||
|
|
**Perplexity**(注重新鲜度):
|
|||
|
|
- 内容30天内更新(引用量3.2倍)
|
|||
|
|
- 行内引用格式 [1]、[2]
|
|||
|
|
- H2→H3→列表结构(引用量多40%)
|
|||
|
|
- 更新频率:2-3天(激进)或90天(最低)
|
|||
|
|
|
|||
|
|
**Claude**(注重准确性):
|
|||
|
|
- 仅限一手来源(归因准确率91.2%)
|
|||
|
|
- 5-8条引用,含出版方和年份
|
|||
|
|
- 透明的方法论
|
|||
|
|
- 承认已知局限
|
|||
|
|
|
|||
|
|
**Gemini**(注重社区):
|
|||
|
|
- Google 商业资料整合
|
|||
|
|
- 用户评价与评论
|
|||
|
|
- 本地引用(NAP一致性)
|
|||
|
|
- 传统权威信号
|
|||
|
|
|
|||
|
|
**Grokipedia**(xAI,2025年10月上线):
|
|||
|
|
- 基于 RAG 的引用(事实一致性提升20-30%)
|
|||
|
|
- 透明的版本历史和许可证
|
|||
|
|
- 一手来源归因(出版方+年份)
|
|||
|
|
- Wikipedia 衍生内容需 CC-BY-SA 署名
|
|||
|
|
|
|||
|
|
### 语音搜索
|
|||
|
|
|
|||
|
|
- 精选摘要优化(30-40词)
|
|||
|
|
- 可朗读 schema(20-30秒片段)
|
|||
|
|
- FAQ schema(自然语言问题)
|
|||
|
|
- 问题关键词提取
|
|||
|
|
|
|||
|
|
### 社交媒体预览
|
|||
|
|
|
|||
|
|
- Open Graph 标签(Facebook、LinkedIn、WhatsApp、Instagram Stories)
|
|||
|
|
- Twitter Cards(summary、summary_large_image)
|
|||
|
|
- 图片规格(最佳1200×630px,Instagram Stories 1080×1920px)
|
|||
|
|
- Instagram:OG支持有限(仅Stories),个人简介链接优化,85%以上移动用户
|
|||
|
|
- iMessage 优化
|
|||
|
|
|
|||
|
|
---
|
|||
|
|
|
|||
|
|
## 输出
|
|||
|
|
|
|||
|
|
### 报告位置
|
|||
|
|
|
|||
|
|
```
|
|||
|
|
~/Documents/SEO_Audit_[YYYY-MM-DD]_[HHMM]/
|
|||
|
|
├── audit_report.json # 结构化数据
|
|||
|
|
├── audit_report.md # Markdown报告
|
|||
|
|
├── audit_report.html # 可视化面板
|
|||
|
|
└── generated_schemas/ # JSON-LD文件
|
|||
|
|
├── faq_schema.json
|
|||
|
|
├── article_schema.json
|
|||
|
|
└── howto_schema.json
|
|||
|
|
```
|
|||
|
|
|
|||
|
|
### 报告结构
|
|||
|
|
|
|||
|
|
1. **执行摘要**:总体评分(0-100)、主要问题、主要优势
|
|||
|
|
2. **元数据分析**:Meta标签、Open Graph、Twitter Cards、schema
|
|||
|
|
3. **内容结构**:标题、字数、TL;DR、FAQ、作者
|
|||
|
|
4. **关键词分析**:主要、语义、LSI、长尾、问题关键词
|
|||
|
|
5. **平台优化**:ChatGPT、Perplexity、Claude、Gemini 建议
|
|||
|
|
6. **行动项目**:按重要程度排序(关键、高、中、低)
|
|||
|
|
7. **生成资产**:可直接复制粘贴的 schema 标记
|
|||
|
|
|
|||
|
|
---
|
|||
|
|
|
|||
|
|
## 参考文档
|
|||
|
|
|
|||
|
|
位于 `reference/` 目录:
|
|||
|
|
|
|||
|
|
- `citation-optimization-guide.md`:AI引用策略(提升+35-40%)
|
|||
|
|
- `entity-seo-guide.md`:知识图谱优化
|
|||
|
|
- `platform-strategies.md`:平台特定策略
|
|||
|
|
- `voice-search-guide.md`:语音助手优化(29词答案)
|
|||
|
|
- `social-preview-guide.md`:Open Graph、Twitter Cards(1200×630px)
|
|||
|
|
- `schema-library.md`:完整 JSON-LD 参考
|
|||
|
|
|
|||
|
|
`templates/` 目录中的模板:
|
|||
|
|
|
|||
|
|
- `meta-tags-template.html`:完整 meta 标签集
|
|||
|
|
- Schema 模板:FAQ、Article、HowTo、Breadcrumb、Organization、Person
|
|||
|
|
|
|||
|
|
`examples/` 目录中的行业示例:
|
|||
|
|
|
|||
|
|
- `medical-clinic/`:医疗机构优化(15/100 → 92/100)
|
|||
|
|
- `consulting-firm/`:B2B 实体SEO(22/100 → 89/100)
|
|||
|
|
- `saas-landing-page/`:LLMO 优化(18/100 → 94/100)
|
|||
|
|
|
|||
|
|
---
|
|||
|
|
|
|||
|
|
## 配置
|
|||
|
|
|
|||
|
|
### 优化配置文件
|
|||
|
|
|
|||
|
|
位于 `profiles/` 目录:
|
|||
|
|
|
|||
|
|
**chatgpt_authority.json**:
|
|||
|
|
- 目标:ChatGPT 引用优化
|
|||
|
|
- 重点:权威性、资质、深度
|
|||
|
|
- 字数:1500-2500
|
|||
|
|
- 预期效果:引用概率提升 +40%
|
|||
|
|
|
|||
|
|
**perplexity_fresh.json**:
|
|||
|
|
- 目标:Perplexity 可见性
|
|||
|
|
- 重点:新鲜度、行内引用
|
|||
|
|
- 更新:每2-3天
|
|||
|
|
- 预期效果:引用量提升 3.2 倍
|
|||
|
|
|
|||
|
|
**multi_platform.json**:
|
|||
|
|
- 目标:均衡优化
|
|||
|
|
- 平台:ChatGPT、Perplexity、Claude、Gemini、Grokipedia
|
|||
|
|
- 字数:1200-2000
|
|||
|
|
- 更新:每月
|
|||
|
|
|
|||
|
|
**voice_optimized.json**:
|
|||
|
|
- 目标:语音助手
|
|||
|
|
- 重点:精选摘要、FAQ
|
|||
|
|
- 答案长度:30-40词
|
|||
|
|
- Schema:Speakable、FAQPage、HowTo
|
|||
|
|
|
|||
|
|
---
|
|||
|
|
|
|||
|
|
## 性能
|
|||
|
|
|
|||
|
|
### 脚本执行时间
|
|||
|
|
|
|||
|
|
- `analyze_content.py`:不到1秒
|
|||
|
|
- `metadata_validator.py`:不到1秒
|
|||
|
|
- `keyword_analyzer.py`:不到2秒(含聚类)
|
|||
|
|
- `entity_extractor.py`:不到1秒
|
|||
|
|
- `schema_generator.py`:不到1秒
|
|||
|
|
- `audit_report.py`:3-5秒
|
|||
|
|
- `auto_implementer.py`:10-15秒(完整流水线)
|
|||
|
|
- `indexnow_submit.py`:1-3秒(取决于网络)
|
|||
|
|
|
|||
|
|
所有脚本:仅使用 Python 标准库,无外部依赖,支持离线运行(IndexNow 除外,需要网络连接)。
|
|||
|
|
|
|||
|
|
---
|
|||
|
|
|
|||
|
|
## 开发状态
|
|||
|
|
|
|||
|
|
### 第一阶段:核心功能(已完成)
|
|||
|
|
- 内容分析与提取
|
|||
|
|
- Schema 标记生成
|
|||
|
|
- 元数据验证
|
|||
|
|
- 关键词与实体提取
|
|||
|
|
- 多格式报告生成
|
|||
|
|
|
|||
|
|
### 第二阶段:AI优化(已完成)
|
|||
|
|
- 面向AI引用的内容改写
|
|||
|
|
- 平台特定优化(ChatGPT、Perplexity、Claude、Gemini)
|
|||
|
|
- 语音搜索增强
|
|||
|
|
- 新鲜度监控
|
|||
|
|
- 引用增强(+41%统计数据,+28%引用)
|
|||
|
|
- 自动实现流水线
|
|||
|
|
|
|||
|
|
### 第三阶段:高级功能(计划中)
|
|||
|
|
- 竞争分析(SERP前10对比)
|
|||
|
|
- 自动化监控(SQLite时间序列数据库)
|
|||
|
|
- 变更检测与告警(邮件、webhook、Slack)
|
|||
|
|
- A/B测试框架(统计显著性检验)
|
|||
|
|
- 分析集成(Google Search Console API、Plausible)
|
|||
|
|
- 统一面板(多源数据可视化)
|
|||
|
|
|
|||
|
|
### 第四阶段:生态系统集成(计划中)
|
|||
|
|
- 与 minimalist-website-mvp 技能无缝协作
|
|||
|
|
- 通过 generating-pdf 技能自动生成PDF报告
|
|||
|
|
- 导出至 SEO 工具(Ahrefs、SEMrush格式)
|
|||
|
|
- CI/CD 流水线 API 模式
|
|||
|
|
- 用于持久多站点监控的 MCP 服务器
|
|||
|
|
|
|||
|
|
---
|
|||
|
|
|
|||
|
|
## 研究基础
|
|||
|
|
|
|||
|
|
基于2025年分析:
|
|||
|
|
- 分析了4100万条AI搜索结果
|
|||
|
|
- 跨平台6.8亿条引用
|
|||
|
|
- AI流量增长527%(2025年1-5月)
|
|||
|
|
|
|||
|
|
已实现的关键发现:
|
|||
|
|
- 添加统计数据:提升 +41%(普林斯顿/佐治亚理工)
|
|||
|
|
- 添加引用:提升 +28%
|
|||
|
|
- 内容新鲜度(30天内):3.2倍引用量(Ahrefs研究)
|
|||
|
|
- 作者资质:引用概率提升 +40%
|
|||
|
|
- H2→H3→列表结构:引用量多40%
|
|||
|
|
- 精选摘要:占语音搜索答案的40.7%
|
|||
|
|
|
|||
|
|
平台引用模式:
|
|||
|
|
- ChatGPT:Wikipedia(130万条引用)、G2(19.6万条)、Forbes(18.1万条)
|
|||
|
|
- Perplexity:更新频率至关重要(新鲜时引用量3.2倍)
|
|||
|
|
- Claude:91.2%正确来源归因(2025年Q2)
|
|||
|
|
- AI概览:占查询的13.14%(2025年3月),高于2025年1月的6.49%
|
|||
|
|
|
|||
|
|
---
|
|||
|
|
|
|||
|
|
## 贡献
|
|||
|
|
|
|||
|
|
本项目遵循语义化版本控制(major.minor.patch)。
|
|||
|
|
|
|||
|
|
报告问题:[GitHub Issues](https://github.com/199-biotechnologies/claude-skill-seo-geo-optimizer/issues)
|
|||
|
|
|
|||
|
|
---
|
|||
|
|
|
|||
|
|
## 许可证
|
|||
|
|
|
|||
|
|
MIT 许可证 - 完整条款请参阅 LICENSE 文件。
|
|||
|
|
|
|||
|
|
版权所有 (c) 2025 Boris Djordjevic,199 Biotechnologies
|