catalog/repos/199-biotechnologies--claude-skill-seo-geo-optimizer.md

444 lines
13 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# SEO/GEO/AEO内容优化工具
`SEO` `GEO` `AEO` `内容优化` `AI引用` `语音搜索` `结构化数据`
# SEO/GEO/AEO 优化器
面向搜索引擎SEO、AI平台GEO - 生成引擎优化、答案引擎AEO - 答案引擎优化)、语音助手及社交媒体的内容可见性分析与优化工具包。
**作者**Boris Djordjevic[199 Biotechnologies](https://199.bio)
**状态**:第二阶段完成(内容实现)
**许可证**MIT
**仓库**[github.com/199-biotechnologies/claude-skill-seo-geo-optimizer](https://github.com/199-biotechnologies/claude-skill-seo-geo-optimizer)
---
## 用途
本工具审计并优化内容在以下平台的可发现性:
- **搜索引擎**Google、Bing传统SEO
- **AI平台**ChatGPT、Perplexity、Claude、Gemini、GrokipediaGEO - 生成引擎优化)
- **答案引擎**Google AI概览、Bing Copilot、精选摘要AEO - 答案引擎优化)
- **语音助手**Google Assistant、Siri、Alexa
- **社交媒体**Facebook、Twitter、LinkedIn、WhatsApp、Instagram
支持 HTML、Markdown 和 React/JSX 文件。
---
## 关键数据2025年
2025年1月至5月AI引荐流量增长了527%。针对AI引用优化的内容可见性提升33-40%。主要发现:
- 40.58% 的AI引用来自SERP前10名结果
- 含作者资质的内容:引用概率提升 +40%
- 精选摘要:占语音搜索答案的 40.7%
- 添加统计数据:引用提升 +41%
- 内容新鲜度30天内引用量提升 3.2 倍
---
## 安装
克隆到 Claude 技能目录:
```bash
cd ~/.claude/skills/
git clone https://github.com/199-biotechnologies/claude-skill-seo-geo-optimizer.git
```
要求Python 3.7+,无外部依赖(仅标准库)。
验证安装:
```bash
python ~/.claude/skills/seo-geo-optimizer/scripts/analyze_content.py --help
```
---
## 使用方法
### 第一阶段:分析
审计现有内容,生成优化建议:
```bash
# 全面审计并生成所有报告
python scripts/audit_report.py ~/project/page.html --format all
# 分析特定方面
python scripts/analyze_content.py ~/project/page.html
python scripts/metadata_validator.py ~/project/page.html
python scripts/keyword_analyzer.py ~/project/page.html
python scripts/entity_extractor.py ~/project/page.html
```
### 第二阶段:实现
自动应用优化:
```bash
# 针对特定平台的完整优化流水线
python scripts/auto_implementer.py page.html perplexity
# 单独优化步骤
python scripts/content_optimizer.py page.html
python scripts/platform_optimizer.py page.html chatgpt
python scripts/voice_optimizer.py page.html
python scripts/freshness_monitor.py page.html
python scripts/citation_enhancer.py page.html
```
### 关键词聚类
将相关关键词分组为语义簇,建立主题权威性:
```bash
# 使用关键词聚类分析(默认)
python scripts/keyword_analyzer.py ~/project/page.html
# 不使用聚类的快速模式
python scripts/keyword_analyzer.py ~/project/page.html --no-clusters
```
输出包括:
- 基于 TF-IDF 相似度分组的语义簇
- 每个簇的主题识别
- 支柱内容策略建议
### IndexNow 即时索引
直接向搜索引擎提交 URL 以立即建立索引(对 GEO/AEO 至关重要):
```bash
# 生成 IndexNow 密钥
python scripts/indexnow_submit.py --generate-key --output ./public
# 提交单个 URL
python scripts/indexnow_submit.py https://example.com/new-page --key YOUR_KEY
# 从文件批量提交
python scripts/indexnow_submit.py --batch urls.txt --key YOUR_KEY
```
对 GEO 的好处:
- Bing 索引为 AI 平台提供内容ChatGPT、Perplexity、Claude
- 内容在数分钟内建立索引,而非数周
- 30天内的新鲜内容引用量提升 3.2 倍
### 生成结构化数据标记
```bash
# FAQ schemaAI引用概率最高
python scripts/schema_generator.py faq \
--question "什么是长寿医学?" \
--answer "长寿医学通过优化LDL <70 mg/dL等生物标志物来降低30-40%的心血管风险。"
# 带有 E-E-A-T 信号的文章 schema
python scripts/schema_generator.py article \
--title "理解生物标志物" \
--author "Dr. Sarah Johnson" \
--credentials "MD, PhD" \
--date "2025-01-15"
```
---
## 架构
### 第一阶段:分析(已完成)
六个 Python 脚本分析内容并生成建议:
| 脚本 | 用途 | 输出 |
|--------|---------|--------|
| `analyze_content.py` | 提取元数据、schema、结构 | JSON分析 |
| `metadata_validator.py` | 验证 meta 标签、OG、Twitter | 验证报告 |
| `keyword_analyzer.py` | 提取关键词5种类型 | 关键词列表 |
| `entity_extractor.py` | 提取人物、机构、地点 | 实体图谱 |
| `schema_generator.py` | 生成 JSON-LD schema | Schema文件 |
| `audit_report.py` | 协调分析,生成报告 | JSON、MD、HTML |
### 第二阶段:实现(已完成)
六个 Python 脚本实现优化:
| 脚本 | 用途 | 效果 |
|--------|---------|--------|
| `content_optimizer.py` | Meta描述、FAQ、数据表格 | 结构优化 |
| `platform_optimizer.py` | ChatGPT、Perplexity、Claude、Gemini | 平台特定优化 |
| `voice_optimizer.py` | 可朗读schema、精选摘要 | 语音搜索就绪 |
| `freshness_monitor.py` | 内容新鲜度追踪 | 新鲜时引用量3.2倍 |
| `citation_enhancer.py` | 统计数据、引用机会 | +41% 和 +28% 提升 |
| `auto_implementer.py` | 完整流水线编排 | 全自动化 |
| `indexnow_submit.py` | 即时搜索引擎索引 | 分钟级 vs 数周 |
### 第三阶段:高级功能(计划中)
- 竞争分析SERP前10对比
- 自动化监控SQLite时间序列追踪
- A/B测试框架统计显著性
- 分析集成Google Search Console、Plausible
---
## 功能
### 内容分析
**文件类型**
- HTML`.html`
- Markdown`.md``.mdx`
- React/JSX`.jsx``.tsx`
**提取内容**
- Meta 标签title、description、keywords
- Open Graphog:title、og:description、og:image
- Twitter Cardstwitter:card、twitter:title
- JSON-LD 结构化数据标记
- 内容结构(标题、字数、作者)
### 关键词分析
提取五种关键词类型:
1. **主要关键词**核心主题H1、meta title、URL、前100词
2. **语义关键词**相关词汇H2/H3、正文
3. **LSI关键词**:共现词汇(自然语言)
4. **长尾关键词**3-8词短语FAQ、H3
5. **问题关键词**:谁/什么/哪里/何时/为何/如何FAQ schema
**关键词聚类**TF-IDF + 余弦相似度将关键词分组为语义簇,用于主题权威性和支柱内容策略。
### Schema 生成
带验证的 JSON-LD schema
- **FAQPage**AI引用概率最高
- **Article**E-E-A-T 信号(资质、日期)
- **HowTo**语音搜索优化ISO 8601时长格式
- **BreadcrumbList**:网站层级结构
- **Organization/LocalBusiness**:实体识别
- **Person**:带资质的作者档案
- **Speakable**:语音助手优化
### 平台优化
**ChatGPT**占LLM流量40-60%
- 权威性与资质(引用率提升 +40%
- 1500-2500词全面覆盖
- 一手来源引用PubMed、arXiv
- 答案优先结构
**Perplexity**(注重新鲜度):
- 内容30天内更新引用量3.2倍)
- 行内引用格式 [1]、[2]
- H2→H3→列表结构引用量多40%
- 更新频率2-3天激进或90天最低
**Claude**(注重准确性):
- 仅限一手来源归因准确率91.2%
- 5-8条引用含出版方和年份
- 透明的方法论
- 承认已知局限
**Gemini**(注重社区):
- Google 商业资料整合
- 用户评价与评论
- 本地引用NAP一致性
- 传统权威信号
**Grokipedia**xAI2025年10月上线
- 基于 RAG 的引用事实一致性提升20-30%
- 透明的版本历史和许可证
- 一手来源归因(出版方+年份)
- Wikipedia 衍生内容需 CC-BY-SA 署名
### 语音搜索
- 精选摘要优化30-40词
- 可朗读 schema20-30秒片段
- FAQ schema自然语言问题
- 问题关键词提取
### 社交媒体预览
- Open Graph 标签Facebook、LinkedIn、WhatsApp、Instagram Stories
- Twitter Cardssummary、summary_large_image
- 图片规格最佳1200×630pxInstagram Stories 1080×1920px
- InstagramOG支持有限仅Stories个人简介链接优化85%以上移动用户
- iMessage 优化
---
## 输出
### 报告位置
```
~/Documents/SEO_Audit_[YYYY-MM-DD]_[HHMM]/
├── audit_report.json # 结构化数据
├── audit_report.md # Markdown报告
├── audit_report.html # 可视化面板
└── generated_schemas/ # JSON-LD文件
├── faq_schema.json
├── article_schema.json
└── howto_schema.json
```
### 报告结构
1. **执行摘要**总体评分0-100、主要问题、主要优势
2. **元数据分析**Meta标签、Open Graph、Twitter Cards、schema
3. **内容结构**标题、字数、TL;DR、FAQ、作者
4. **关键词分析**主要、语义、LSI、长尾、问题关键词
5. **平台优化**ChatGPT、Perplexity、Claude、Gemini 建议
6. **行动项目**:按重要程度排序(关键、高、中、低)
7. **生成资产**:可直接复制粘贴的 schema 标记
---
## 参考文档
位于 `reference/` 目录:
- `citation-optimization-guide.md`AI引用策略提升+35-40%
- `entity-seo-guide.md`:知识图谱优化
- `platform-strategies.md`:平台特定策略
- `voice-search-guide.md`语音助手优化29词答案
- `social-preview-guide.md`Open Graph、Twitter Cards1200×630px
- `schema-library.md`:完整 JSON-LD 参考
`templates/` 目录中的模板:
- `meta-tags-template.html`:完整 meta 标签集
- Schema 模板FAQ、Article、HowTo、Breadcrumb、Organization、Person
`examples/` 目录中的行业示例:
- `medical-clinic/`医疗机构优化15/100 → 92/100
- `consulting-firm/`B2B 实体SEO22/100 → 89/100
- `saas-landing-page/`LLMO 优化18/100 → 94/100
---
## 配置
### 优化配置文件
位于 `profiles/` 目录:
**chatgpt_authority.json**
- 目标ChatGPT 引用优化
- 重点:权威性、资质、深度
- 字数1500-2500
- 预期效果:引用概率提升 +40%
**perplexity_fresh.json**
- 目标Perplexity 可见性
- 重点:新鲜度、行内引用
- 更新每2-3天
- 预期效果:引用量提升 3.2 倍
**multi_platform.json**
- 目标:均衡优化
- 平台ChatGPT、Perplexity、Claude、Gemini、Grokipedia
- 字数1200-2000
- 更新:每月
**voice_optimized.json**
- 目标:语音助手
- 重点精选摘要、FAQ
- 答案长度30-40词
- SchemaSpeakable、FAQPage、HowTo
---
## 性能
### 脚本执行时间
- `analyze_content.py`不到1秒
- `metadata_validator.py`不到1秒
- `keyword_analyzer.py`不到2秒含聚类
- `entity_extractor.py`不到1秒
- `schema_generator.py`不到1秒
- `audit_report.py`3-5秒
- `auto_implementer.py`10-15秒完整流水线
- `indexnow_submit.py`1-3秒取决于网络
所有脚本:仅使用 Python 标准库无外部依赖支持离线运行IndexNow 除外,需要网络连接)。
---
## 开发状态
### 第一阶段:核心功能(已完成)
- 内容分析与提取
- Schema 标记生成
- 元数据验证
- 关键词与实体提取
- 多格式报告生成
### 第二阶段AI优化已完成
- 面向AI引用的内容改写
- 平台特定优化ChatGPT、Perplexity、Claude、Gemini
- 语音搜索增强
- 新鲜度监控
- 引用增强(+41%统计数据,+28%引用)
- 自动实现流水线
### 第三阶段:高级功能(计划中)
- 竞争分析SERP前10对比
- 自动化监控SQLite时间序列数据库
- 变更检测与告警邮件、webhook、Slack
- A/B测试框架统计显著性检验
- 分析集成Google Search Console API、Plausible
- 统一面板(多源数据可视化)
### 第四阶段:生态系统集成(计划中)
- 与 minimalist-website-mvp 技能无缝协作
- 通过 generating-pdf 技能自动生成PDF报告
- 导出至 SEO 工具Ahrefs、SEMrush格式
- CI/CD 流水线 API 模式
- 用于持久多站点监控的 MCP 服务器
---
## 研究基础
基于2025年分析
- 分析了4100万条AI搜索结果
- 跨平台6.8亿条引用
- AI流量增长527%2025年1-5月
已实现的关键发现:
- 添加统计数据:提升 +41%(普林斯顿/佐治亚理工)
- 添加引用:提升 +28%
- 内容新鲜度30天内3.2倍引用量Ahrefs研究
- 作者资质:引用概率提升 +40%
- H2→H3→列表结构引用量多40%
- 精选摘要占语音搜索答案的40.7%
平台引用模式:
- ChatGPTWikipedia130万条引用、G219.6万条、Forbes18.1万条)
- Perplexity更新频率至关重要新鲜时引用量3.2倍)
- Claude91.2%正确来源归因2025年Q2
- AI概览占查询的13.14%2025年3月高于2025年1月的6.49%
---
## 贡献
本项目遵循语义化版本控制major.minor.patch
报告问题:[GitHub Issues](https://github.com/199-biotechnologies/claude-skill-seo-geo-optimizer/issues)
---
## 许可证
MIT 许可证 - 完整条款请参阅 LICENSE 文件。
版权所有 (c) 2025 Boris Djordjevic199 Biotechnologies