# SEO/GEO/AEO内容优化工具

`SEO` `GEO` `AEO` `内容优化` `AI引用` `语音搜索` `结构化数据`

# SEO/GEO/AEO 优化器

面向搜索引擎（SEO）、AI平台（GEO - 生成引擎优化）、答案引擎（AEO - 答案引擎优化）、语音助手及社交媒体的内容可见性分析与优化工具包。

**作者**：Boris Djordjevic，[199 Biotechnologies](https://199.bio)
**状态**：第二阶段完成（内容实现）
**许可证**：MIT
**仓库**：[github.com/199-biotechnologies/claude-skill-seo-geo-optimizer](https://github.com/199-biotechnologies/claude-skill-seo-geo-optimizer)

---

## 用途

本工具审计并优化内容在以下平台的可发现性：

- **搜索引擎**：Google、Bing（传统SEO）
- **AI平台**：ChatGPT、Perplexity、Claude、Gemini、Grokipedia（GEO - 生成引擎优化）
- **答案引擎**：Google AI概览、Bing Copilot、精选摘要（AEO - 答案引擎优化）
- **语音助手**：Google Assistant、Siri、Alexa
- **社交媒体**：Facebook、Twitter、LinkedIn、WhatsApp、Instagram

支持 HTML、Markdown 和 React/JSX 文件。

---

## 关键数据（2025年）

2025年1月至5月，AI引荐流量增长了527%。针对AI引用优化的内容可见性提升33-40%。主要发现：

- 40.58% 的AI引用来自SERP前10名结果
- 含作者资质的内容：引用概率提升 +40%
- 精选摘要：占语音搜索答案的 40.7%
- 添加统计数据：引用提升 +41%
- 内容新鲜度（30天内）：引用量提升 3.2 倍

---

## 安装

克隆到 Claude 技能目录：

```bash
cd ~/.claude/skills/
git clone https://github.com/199-biotechnologies/claude-skill-seo-geo-optimizer.git
```

要求：Python 3.7+，无外部依赖（仅标准库）。

验证安装：
```bash
python ~/.claude/skills/seo-geo-optimizer/scripts/analyze_content.py --help
```

---

## 使用方法

### 第一阶段：分析

审计现有内容，生成优化建议：

```bash
# 全面审计并生成所有报告
python scripts/audit_report.py ~/project/page.html --format all

# 分析特定方面
python scripts/analyze_content.py ~/project/page.html
python scripts/metadata_validator.py ~/project/page.html
python scripts/keyword_analyzer.py ~/project/page.html
python scripts/entity_extractor.py ~/project/page.html
```

### 第二阶段：实现

自动应用优化：

```bash
# 针对特定平台的完整优化流水线
python scripts/auto_implementer.py page.html perplexity

# 单独优化步骤
python scripts/content_optimizer.py page.html
python scripts/platform_optimizer.py page.html chatgpt
python scripts/voice_optimizer.py page.html
python scripts/freshness_monitor.py page.html
python scripts/citation_enhancer.py page.html
```

### 关键词聚类

将相关关键词分组为语义簇，建立主题权威性：

```bash
# 使用关键词聚类分析（默认）
python scripts/keyword_analyzer.py ~/project/page.html

# 不使用聚类的快速模式
python scripts/keyword_analyzer.py ~/project/page.html --no-clusters
```

输出包括：
- 基于 TF-IDF 相似度分组的语义簇
- 每个簇的主题识别
- 支柱内容策略建议

### IndexNow 即时索引

直接向搜索引擎提交 URL 以立即建立索引（对 GEO/AEO 至关重要）：

```bash
# 生成 IndexNow 密钥
python scripts/indexnow_submit.py --generate-key --output ./public

# 提交单个 URL
python scripts/indexnow_submit.py https://example.com/new-page --key YOUR_KEY

# 从文件批量提交
python scripts/indexnow_submit.py --batch urls.txt --key YOUR_KEY
```

对 GEO 的好处：
- Bing 索引为 AI 平台提供内容（ChatGPT、Perplexity、Claude）
- 内容在数分钟内建立索引，而非数周
- 30天内的新鲜内容引用量提升 3.2 倍

### 生成结构化数据标记

```bash
# FAQ schema（AI引用概率最高）
python scripts/schema_generator.py faq \
  --question "什么是长寿医学？" \
  --answer "长寿医学通过优化LDL <70 mg/dL等生物标志物来降低30-40%的心血管风险。"

# 带有 E-E-A-T 信号的文章 schema
python scripts/schema_generator.py article \
  --title "理解生物标志物" \
  --author "Dr. Sarah Johnson" \
  --credentials "MD, PhD" \
  --date "2025-01-15"
```

---

## 架构

### 第一阶段：分析（已完成）

六个 Python 脚本分析内容并生成建议：

| 脚本 | 用途 | 输出 |
|--------|---------|--------|
| `analyze_content.py` | 提取元数据、schema、结构 | JSON分析 |
| `metadata_validator.py` | 验证 meta 标签、OG、Twitter | 验证报告 |
| `keyword_analyzer.py` | 提取关键词（5种类型） | 关键词列表 |
| `entity_extractor.py` | 提取人物、机构、地点 | 实体图谱 |
| `schema_generator.py` | 生成 JSON-LD schema | Schema文件 |
| `audit_report.py` | 协调分析，生成报告 | JSON、MD、HTML |

### 第二阶段：实现（已完成）

六个 Python 脚本实现优化：

| 脚本 | 用途 | 效果 |
|--------|---------|--------|
| `content_optimizer.py` | Meta描述、FAQ、数据表格 | 结构优化 |
| `platform_optimizer.py` | ChatGPT、Perplexity、Claude、Gemini | 平台特定优化 |
| `voice_optimizer.py` | 可朗读schema、精选摘要 | 语音搜索就绪 |
| `freshness_monitor.py` | 内容新鲜度追踪 | 新鲜时引用量3.2倍 |
| `citation_enhancer.py` | 统计数据、引用机会 | +41% 和 +28% 提升 |
| `auto_implementer.py` | 完整流水线编排 | 全自动化 |
| `indexnow_submit.py` | 即时搜索引擎索引 | 分钟级 vs 数周 |

### 第三阶段：高级功能（计划中）

- 竞争分析（SERP前10对比）
- 自动化监控（SQLite时间序列追踪）
- A/B测试框架（统计显著性）
- 分析集成（Google Search Console、Plausible）

---

## 功能

### 内容分析

**文件类型**：
- HTML（`.html`）
- Markdown（`.md`、`.mdx`）
- React/JSX（`.jsx`、`.tsx`）

**提取内容**：
- Meta 标签（title、description、keywords）
- Open Graph（og:title、og:description、og:image）
- Twitter Cards（twitter:card、twitter:title）
- JSON-LD 结构化数据标记
- 内容结构（标题、字数、作者）

### 关键词分析

提取五种关键词类型：

1. **主要关键词**：核心主题（H1、meta title、URL、前100词）
2. **语义关键词**：相关词汇（H2/H3、正文）
3. **LSI关键词**：共现词汇（自然语言）
4. **长尾关键词**：3-8词短语（FAQ、H3）
5. **问题关键词**：谁/什么/哪里/何时/为何/如何（FAQ schema）

**关键词聚类**：TF-IDF + 余弦相似度将关键词分组为语义簇，用于主题权威性和支柱内容策略。

### Schema 生成

带验证的 JSON-LD schema：

- **FAQPage**：AI引用概率最高
- **Article**：E-E-A-T 信号（资质、日期）
- **HowTo**：语音搜索优化（ISO 8601时长格式）
- **BreadcrumbList**：网站层级结构
- **Organization/LocalBusiness**：实体识别
- **Person**：带资质的作者档案
- **Speakable**：语音助手优化

### 平台优化

**ChatGPT**（占LLM流量40-60%）：
- 权威性与资质（引用率提升 +40%）
- 1500-2500词全面覆盖
- 一手来源引用（PubMed、arXiv）
- 答案优先结构

**Perplexity**（注重新鲜度）：
- 内容30天内更新（引用量3.2倍）
- 行内引用格式 [1]、[2]
- H2→H3→列表结构（引用量多40%）
- 更新频率：2-3天（激进）或90天（最低）

**Claude**（注重准确性）：
- 仅限一手来源（归因准确率91.2%）
- 5-8条引用，含出版方和年份
- 透明的方法论
- 承认已知局限

**Gemini**（注重社区）：
- Google 商业资料整合
- 用户评价与评论
- 本地引用（NAP一致性）
- 传统权威信号

**Grokipedia**（xAI，2025年10月上线）：
- 基于 RAG 的引用（事实一致性提升20-30%）
- 透明的版本历史和许可证
- 一手来源归因（出版方+年份）
- Wikipedia 衍生内容需 CC-BY-SA 署名

### 语音搜索

- 精选摘要优化（30-40词）
- 可朗读 schema（20-30秒片段）
- FAQ schema（自然语言问题）
- 问题关键词提取

### 社交媒体预览

- Open Graph 标签（Facebook、LinkedIn、WhatsApp、Instagram Stories）
- Twitter Cards（summary、summary_large_image）
- 图片规格（最佳1200×630px，Instagram Stories 1080×1920px）
- Instagram：OG支持有限（仅Stories），个人简介链接优化，85%以上移动用户
- iMessage 优化

---

## 输出

### 报告位置

```
~/Documents/SEO_Audit_[YYYY-MM-DD]_[HHMM]/
├── audit_report.json          # 结构化数据
├── audit_report.md            # Markdown报告
├── audit_report.html          # 可视化面板
└── generated_schemas/         # JSON-LD文件
    ├── faq_schema.json
    ├── article_schema.json
    └── howto_schema.json
```

### 报告结构

1. **执行摘要**：总体评分（0-100）、主要问题、主要优势
2. **元数据分析**：Meta标签、Open Graph、Twitter Cards、schema
3. **内容结构**：标题、字数、TL;DR、FAQ、作者
4. **关键词分析**：主要、语义、LSI、长尾、问题关键词
5. **平台优化**：ChatGPT、Perplexity、Claude、Gemini 建议
6. **行动项目**：按重要程度排序（关键、高、中、低）
7. **生成资产**：可直接复制粘贴的 schema 标记

---

## 参考文档

位于 `reference/` 目录：

- `citation-optimization-guide.md`：AI引用策略（提升+35-40%）
- `entity-seo-guide.md`：知识图谱优化
- `platform-strategies.md`：平台特定策略
- `voice-search-guide.md`：语音助手优化（29词答案）
- `social-preview-guide.md`：Open Graph、Twitter Cards（1200×630px）
- `schema-library.md`：完整 JSON-LD 参考

`templates/` 目录中的模板：

- `meta-tags-template.html`：完整 meta 标签集
- Schema 模板：FAQ、Article、HowTo、Breadcrumb、Organization、Person

`examples/` 目录中的行业示例：

- `medical-clinic/`：医疗机构优化（15/100 → 92/100）
- `consulting-firm/`：B2B 实体SEO（22/100 → 89/100）
- `saas-landing-page/`：LLMO 优化（18/100 → 94/100）

---

## 配置

### 优化配置文件

位于 `profiles/` 目录：

**chatgpt_authority.json**：
- 目标：ChatGPT 引用优化
- 重点：权威性、资质、深度
- 字数：1500-2500
- 预期效果：引用概率提升 +40%

**perplexity_fresh.json**：
- 目标：Perplexity 可见性
- 重点：新鲜度、行内引用
- 更新：每2-3天
- 预期效果：引用量提升 3.2 倍

**multi_platform.json**：
- 目标：均衡优化
- 平台：ChatGPT、Perplexity、Claude、Gemini、Grokipedia
- 字数：1200-2000
- 更新：每月

**voice_optimized.json**：
- 目标：语音助手
- 重点：精选摘要、FAQ
- 答案长度：30-40词
- Schema：Speakable、FAQPage、HowTo

---

## 性能

### 脚本执行时间

- `analyze_content.py`：不到1秒
- `metadata_validator.py`：不到1秒
- `keyword_analyzer.py`：不到2秒（含聚类）
- `entity_extractor.py`：不到1秒
- `schema_generator.py`：不到1秒
- `audit_report.py`：3-5秒
- `auto_implementer.py`：10-15秒（完整流水线）
- `indexnow_submit.py`：1-3秒（取决于网络）

所有脚本：仅使用 Python 标准库，无外部依赖，支持离线运行（IndexNow 除外，需要网络连接）。

---

## 开发状态

### 第一阶段：核心功能（已完成）
- 内容分析与提取
- Schema 标记生成
- 元数据验证
- 关键词与实体提取
- 多格式报告生成

### 第二阶段：AI优化（已完成）
- 面向AI引用的内容改写
- 平台特定优化（ChatGPT、Perplexity、Claude、Gemini）
- 语音搜索增强
- 新鲜度监控
- 引用增强（+41%统计数据，+28%引用）
- 自动实现流水线

### 第三阶段：高级功能（计划中）
- 竞争分析（SERP前10对比）
- 自动化监控（SQLite时间序列数据库）
- 变更检测与告警（邮件、webhook、Slack）
- A/B测试框架（统计显著性检验）
- 分析集成（Google Search Console API、Plausible）
- 统一面板（多源数据可视化）

### 第四阶段：生态系统集成（计划中）
- 与 minimalist-website-mvp 技能无缝协作
- 通过 generating-pdf 技能自动生成PDF报告
- 导出至 SEO 工具（Ahrefs、SEMrush格式）
- CI/CD 流水线 API 模式
- 用于持久多站点监控的 MCP 服务器

---

## 研究基础

基于2025年分析：
- 分析了4100万条AI搜索结果
- 跨平台6.8亿条引用
- AI流量增长527%（2025年1-5月）

已实现的关键发现：
- 添加统计数据：提升 +41%（普林斯顿/佐治亚理工）
- 添加引用：提升 +28%
- 内容新鲜度（30天内）：3.2倍引用量（Ahrefs研究）
- 作者资质：引用概率提升 +40%
- H2→H3→列表结构：引用量多40%
- 精选摘要：占语音搜索答案的40.7%

平台引用模式：
- ChatGPT：Wikipedia（130万条引用）、G2（19.6万条）、Forbes（18.1万条）
- Perplexity：更新频率至关重要（新鲜时引用量3.2倍）
- Claude：91.2%正确来源归因（2025年Q2）
- AI概览：占查询的13.14%（2025年3月），高于2025年1月的6.49%

---

## 贡献

本项目遵循语义化版本控制（major.minor.patch）。

报告问题：[GitHub Issues](https://github.com/199-biotechnologies/claude-skill-seo-geo-optimizer/issues)

---

## 许可证

MIT 许可证 - 完整条款请参阅 LICENSE 文件。

版权所有 (c) 2025 Boris Djordjevic，199 Biotechnologies