# SEO/GEO/AEO内容优化工具 `SEO` `GEO` `AEO` `内容优化` `AI引用` `语音搜索` `结构化数据` # SEO/GEO/AEO 优化器 面向搜索引擎(SEO)、AI平台(GEO - 生成引擎优化)、答案引擎(AEO - 答案引擎优化)、语音助手及社交媒体的内容可见性分析与优化工具包。 **作者**:Boris Djordjevic,[199 Biotechnologies](https://199.bio) **状态**:第二阶段完成(内容实现) **许可证**:MIT **仓库**:[github.com/199-biotechnologies/claude-skill-seo-geo-optimizer](https://github.com/199-biotechnologies/claude-skill-seo-geo-optimizer) --- ## 用途 本工具审计并优化内容在以下平台的可发现性: - **搜索引擎**:Google、Bing(传统SEO) - **AI平台**:ChatGPT、Perplexity、Claude、Gemini、Grokipedia(GEO - 生成引擎优化) - **答案引擎**:Google AI概览、Bing Copilot、精选摘要(AEO - 答案引擎优化) - **语音助手**:Google Assistant、Siri、Alexa - **社交媒体**:Facebook、Twitter、LinkedIn、WhatsApp、Instagram 支持 HTML、Markdown 和 React/JSX 文件。 --- ## 关键数据(2025年) 2025年1月至5月,AI引荐流量增长了527%。针对AI引用优化的内容可见性提升33-40%。主要发现: - 40.58% 的AI引用来自SERP前10名结果 - 含作者资质的内容:引用概率提升 +40% - 精选摘要:占语音搜索答案的 40.7% - 添加统计数据:引用提升 +41% - 内容新鲜度(30天内):引用量提升 3.2 倍 --- ## 安装 克隆到 Claude 技能目录: ```bash cd ~/.claude/skills/ git clone https://github.com/199-biotechnologies/claude-skill-seo-geo-optimizer.git ``` 要求:Python 3.7+,无外部依赖(仅标准库)。 验证安装: ```bash python ~/.claude/skills/seo-geo-optimizer/scripts/analyze_content.py --help ``` --- ## 使用方法 ### 第一阶段:分析 审计现有内容,生成优化建议: ```bash # 全面审计并生成所有报告 python scripts/audit_report.py ~/project/page.html --format all # 分析特定方面 python scripts/analyze_content.py ~/project/page.html python scripts/metadata_validator.py ~/project/page.html python scripts/keyword_analyzer.py ~/project/page.html python scripts/entity_extractor.py ~/project/page.html ``` ### 第二阶段:实现 自动应用优化: ```bash # 针对特定平台的完整优化流水线 python scripts/auto_implementer.py page.html perplexity # 单独优化步骤 python scripts/content_optimizer.py page.html python scripts/platform_optimizer.py page.html chatgpt python scripts/voice_optimizer.py page.html python scripts/freshness_monitor.py page.html python scripts/citation_enhancer.py page.html ``` ### 关键词聚类 将相关关键词分组为语义簇,建立主题权威性: ```bash # 使用关键词聚类分析(默认) python scripts/keyword_analyzer.py ~/project/page.html # 不使用聚类的快速模式 python scripts/keyword_analyzer.py ~/project/page.html --no-clusters ``` 输出包括: - 基于 TF-IDF 相似度分组的语义簇 - 每个簇的主题识别 - 支柱内容策略建议 ### IndexNow 即时索引 直接向搜索引擎提交 URL 以立即建立索引(对 GEO/AEO 至关重要): ```bash # 生成 IndexNow 密钥 python scripts/indexnow_submit.py --generate-key --output ./public # 提交单个 URL python scripts/indexnow_submit.py https://example.com/new-page --key YOUR_KEY # 从文件批量提交 python scripts/indexnow_submit.py --batch urls.txt --key YOUR_KEY ``` 对 GEO 的好处: - Bing 索引为 AI 平台提供内容(ChatGPT、Perplexity、Claude) - 内容在数分钟内建立索引,而非数周 - 30天内的新鲜内容引用量提升 3.2 倍 ### 生成结构化数据标记 ```bash # FAQ schema(AI引用概率最高) python scripts/schema_generator.py faq \ --question "什么是长寿医学?" \ --answer "长寿医学通过优化LDL <70 mg/dL等生物标志物来降低30-40%的心血管风险。" # 带有 E-E-A-T 信号的文章 schema python scripts/schema_generator.py article \ --title "理解生物标志物" \ --author "Dr. Sarah Johnson" \ --credentials "MD, PhD" \ --date "2025-01-15" ``` --- ## 架构 ### 第一阶段:分析(已完成) 六个 Python 脚本分析内容并生成建议: | 脚本 | 用途 | 输出 | |--------|---------|--------| | `analyze_content.py` | 提取元数据、schema、结构 | JSON分析 | | `metadata_validator.py` | 验证 meta 标签、OG、Twitter | 验证报告 | | `keyword_analyzer.py` | 提取关键词(5种类型) | 关键词列表 | | `entity_extractor.py` | 提取人物、机构、地点 | 实体图谱 | | `schema_generator.py` | 生成 JSON-LD schema | Schema文件 | | `audit_report.py` | 协调分析,生成报告 | JSON、MD、HTML | ### 第二阶段:实现(已完成) 六个 Python 脚本实现优化: | 脚本 | 用途 | 效果 | |--------|---------|--------| | `content_optimizer.py` | Meta描述、FAQ、数据表格 | 结构优化 | | `platform_optimizer.py` | ChatGPT、Perplexity、Claude、Gemini | 平台特定优化 | | `voice_optimizer.py` | 可朗读schema、精选摘要 | 语音搜索就绪 | | `freshness_monitor.py` | 内容新鲜度追踪 | 新鲜时引用量3.2倍 | | `citation_enhancer.py` | 统计数据、引用机会 | +41% 和 +28% 提升 | | `auto_implementer.py` | 完整流水线编排 | 全自动化 | | `indexnow_submit.py` | 即时搜索引擎索引 | 分钟级 vs 数周 | ### 第三阶段:高级功能(计划中) - 竞争分析(SERP前10对比) - 自动化监控(SQLite时间序列追踪) - A/B测试框架(统计显著性) - 分析集成(Google Search Console、Plausible) --- ## 功能 ### 内容分析 **文件类型**: - HTML(`.html`) - Markdown(`.md`、`.mdx`) - React/JSX(`.jsx`、`.tsx`) **提取内容**: - Meta 标签(title、description、keywords) - Open Graph(og:title、og:description、og:image) - Twitter Cards(twitter:card、twitter:title) - JSON-LD 结构化数据标记 - 内容结构(标题、字数、作者) ### 关键词分析 提取五种关键词类型: 1. **主要关键词**:核心主题(H1、meta title、URL、前100词) 2. **语义关键词**:相关词汇(H2/H3、正文) 3. **LSI关键词**:共现词汇(自然语言) 4. **长尾关键词**:3-8词短语(FAQ、H3) 5. **问题关键词**:谁/什么/哪里/何时/为何/如何(FAQ schema) **关键词聚类**:TF-IDF + 余弦相似度将关键词分组为语义簇,用于主题权威性和支柱内容策略。 ### Schema 生成 带验证的 JSON-LD schema: - **FAQPage**:AI引用概率最高 - **Article**:E-E-A-T 信号(资质、日期) - **HowTo**:语音搜索优化(ISO 8601时长格式) - **BreadcrumbList**:网站层级结构 - **Organization/LocalBusiness**:实体识别 - **Person**:带资质的作者档案 - **Speakable**:语音助手优化 ### 平台优化 **ChatGPT**(占LLM流量40-60%): - 权威性与资质(引用率提升 +40%) - 1500-2500词全面覆盖 - 一手来源引用(PubMed、arXiv) - 答案优先结构 **Perplexity**(注重新鲜度): - 内容30天内更新(引用量3.2倍) - 行内引用格式 [1]、[2] - H2→H3→列表结构(引用量多40%) - 更新频率:2-3天(激进)或90天(最低) **Claude**(注重准确性): - 仅限一手来源(归因准确率91.2%) - 5-8条引用,含出版方和年份 - 透明的方法论 - 承认已知局限 **Gemini**(注重社区): - Google 商业资料整合 - 用户评价与评论 - 本地引用(NAP一致性) - 传统权威信号 **Grokipedia**(xAI,2025年10月上线): - 基于 RAG 的引用(事实一致性提升20-30%) - 透明的版本历史和许可证 - 一手来源归因(出版方+年份) - Wikipedia 衍生内容需 CC-BY-SA 署名 ### 语音搜索 - 精选摘要优化(30-40词) - 可朗读 schema(20-30秒片段) - FAQ schema(自然语言问题) - 问题关键词提取 ### 社交媒体预览 - Open Graph 标签(Facebook、LinkedIn、WhatsApp、Instagram Stories) - Twitter Cards(summary、summary_large_image) - 图片规格(最佳1200×630px,Instagram Stories 1080×1920px) - Instagram:OG支持有限(仅Stories),个人简介链接优化,85%以上移动用户 - iMessage 优化 --- ## 输出 ### 报告位置 ``` ~/Documents/SEO_Audit_[YYYY-MM-DD]_[HHMM]/ ├── audit_report.json # 结构化数据 ├── audit_report.md # Markdown报告 ├── audit_report.html # 可视化面板 └── generated_schemas/ # JSON-LD文件 ├── faq_schema.json ├── article_schema.json └── howto_schema.json ``` ### 报告结构 1. **执行摘要**:总体评分(0-100)、主要问题、主要优势 2. **元数据分析**:Meta标签、Open Graph、Twitter Cards、schema 3. **内容结构**:标题、字数、TL;DR、FAQ、作者 4. **关键词分析**:主要、语义、LSI、长尾、问题关键词 5. **平台优化**:ChatGPT、Perplexity、Claude、Gemini 建议 6. **行动项目**:按重要程度排序(关键、高、中、低) 7. **生成资产**:可直接复制粘贴的 schema 标记 --- ## 参考文档 位于 `reference/` 目录: - `citation-optimization-guide.md`:AI引用策略(提升+35-40%) - `entity-seo-guide.md`:知识图谱优化 - `platform-strategies.md`:平台特定策略 - `voice-search-guide.md`:语音助手优化(29词答案) - `social-preview-guide.md`:Open Graph、Twitter Cards(1200×630px) - `schema-library.md`:完整 JSON-LD 参考 `templates/` 目录中的模板: - `meta-tags-template.html`:完整 meta 标签集 - Schema 模板:FAQ、Article、HowTo、Breadcrumb、Organization、Person `examples/` 目录中的行业示例: - `medical-clinic/`:医疗机构优化(15/100 → 92/100) - `consulting-firm/`:B2B 实体SEO(22/100 → 89/100) - `saas-landing-page/`:LLMO 优化(18/100 → 94/100) --- ## 配置 ### 优化配置文件 位于 `profiles/` 目录: **chatgpt_authority.json**: - 目标:ChatGPT 引用优化 - 重点:权威性、资质、深度 - 字数:1500-2500 - 预期效果:引用概率提升 +40% **perplexity_fresh.json**: - 目标:Perplexity 可见性 - 重点:新鲜度、行内引用 - 更新:每2-3天 - 预期效果:引用量提升 3.2 倍 **multi_platform.json**: - 目标:均衡优化 - 平台:ChatGPT、Perplexity、Claude、Gemini、Grokipedia - 字数:1200-2000 - 更新:每月 **voice_optimized.json**: - 目标:语音助手 - 重点:精选摘要、FAQ - 答案长度:30-40词 - Schema:Speakable、FAQPage、HowTo --- ## 性能 ### 脚本执行时间 - `analyze_content.py`:不到1秒 - `metadata_validator.py`:不到1秒 - `keyword_analyzer.py`:不到2秒(含聚类) - `entity_extractor.py`:不到1秒 - `schema_generator.py`:不到1秒 - `audit_report.py`:3-5秒 - `auto_implementer.py`:10-15秒(完整流水线) - `indexnow_submit.py`:1-3秒(取决于网络) 所有脚本:仅使用 Python 标准库,无外部依赖,支持离线运行(IndexNow 除外,需要网络连接)。 --- ## 开发状态 ### 第一阶段:核心功能(已完成) - 内容分析与提取 - Schema 标记生成 - 元数据验证 - 关键词与实体提取 - 多格式报告生成 ### 第二阶段:AI优化(已完成) - 面向AI引用的内容改写 - 平台特定优化(ChatGPT、Perplexity、Claude、Gemini) - 语音搜索增强 - 新鲜度监控 - 引用增强(+41%统计数据,+28%引用) - 自动实现流水线 ### 第三阶段:高级功能(计划中) - 竞争分析(SERP前10对比) - 自动化监控(SQLite时间序列数据库) - 变更检测与告警(邮件、webhook、Slack) - A/B测试框架(统计显著性检验) - 分析集成(Google Search Console API、Plausible) - 统一面板(多源数据可视化) ### 第四阶段:生态系统集成(计划中) - 与 minimalist-website-mvp 技能无缝协作 - 通过 generating-pdf 技能自动生成PDF报告 - 导出至 SEO 工具(Ahrefs、SEMrush格式) - CI/CD 流水线 API 模式 - 用于持久多站点监控的 MCP 服务器 --- ## 研究基础 基于2025年分析: - 分析了4100万条AI搜索结果 - 跨平台6.8亿条引用 - AI流量增长527%(2025年1-5月) 已实现的关键发现: - 添加统计数据:提升 +41%(普林斯顿/佐治亚理工) - 添加引用:提升 +28% - 内容新鲜度(30天内):3.2倍引用量(Ahrefs研究) - 作者资质:引用概率提升 +40% - H2→H3→列表结构:引用量多40% - 精选摘要:占语音搜索答案的40.7% 平台引用模式: - ChatGPT:Wikipedia(130万条引用)、G2(19.6万条)、Forbes(18.1万条) - Perplexity:更新频率至关重要(新鲜时引用量3.2倍) - Claude:91.2%正确来源归因(2025年Q2) - AI概览:占查询的13.14%(2025年3月),高于2025年1月的6.49% --- ## 贡献 本项目遵循语义化版本控制(major.minor.patch)。 报告问题:[GitHub Issues](https://github.com/199-biotechnologies/claude-skill-seo-geo-optimizer/issues) --- ## 许可证 MIT 许可证 - 完整条款请参阅 LICENSE 文件。 版权所有 (c) 2025 Boris Djordjevic,199 Biotechnologies