首页 > 基础资料 博客日记
开源:子木蒸馏版的 SEO 审计工具 seo-audit-skill v1.0
2026-04-11 10:00:02基础资料围观1次
开源:子木蒸馏版的 SEO 审计工具 seo-audit-skill v1.0

做 SEO 这么久,一直想要一个既专业又省事的审计工具。
所以我花了点时间,做了个 seo-audit-skill — 给它一个 URL,它就能跑出针对这个页面,一份结构化的报告,告诉你哪里有问
题、为什么有问题、怎么改。
开源 + 免费,欢迎大家用起来、提 PR、多交流!
GitHub 地址:https://github.com/JeffLi1993/seo-audit-skill
先看效果:

为什么做这个工具?
做 SEO 的都知道,审计是个苦力活:
- 要检查 robots.txt、sitemap.xml、canonical 标签……
- 要看 TDK(Title/Description/Keywords)写得对不对
- 要分析 H1/H2 结构、内链分布、Schema 标记
- 还要跑 PageSpeed Insights,看性能分数
这些事儿,80% 是机械重复,20% 需要人工判断。
比如:
- “这个页面的 title 是不是 50-60 字符?” → 机器能判断
- “这个 H1 的语义是否匹配关键词意图?” → 需要 LLM 理解
所以我设计了一个 Script + LLM 双层架构:
- Layer 1(Python 脚本) 处理确定性检查 → 输出结构化 JSON
- Layer 2(LLM Agent) 处理语义判断 → 只在需要时介入
这样既不会让 LLM 瞎编(比如说“robots.txt 存在”但其实不存在),也不会漏掉需要理解的部分(比如 H1 的语义匹配度)。

能检查什么?
目前 v1.0 支持 20+ 项 SEO 检查,分为两个版本:
seo-audit (Basic 版)
适合日常快速审计,给个 URL 就能跑:
站点级检查:
- ✅ robots.txt 解析(RFC 9309 标准)
- ✅ sitemap.xml 验证
- ✅ 404 处理(真 404 vs 软 404 vs 重定向到首页)
- ✅ URL 规范化(HTTP→HTTPS、www 一致性、尾部斜杠)
- ✅ 国际化 / hreflang 标签
- ✅ Schema(JSON-LD)验证
- ✅ E-E-A-T 信任页面(About/Contact/Privacy/Terms)
- ✅ PageSpeed Insights 分数(移动端 + 桌面端)
页面级检查:
- ✅ URL Slug(小写、连字符、关键词、停用词检测)
- ✅ Title 标签(50-60 字符、关键词位置)
- ✅ Meta Description(120-160 字符、关键词匹配、具体价值主张)
- ✅ H1 标签(单一 H1、关键词匹配、语义意图)
- ✅ Canonical 标签(自引用、重定向后匹配)
- ✅ 图片 Alt 文本
- ✅ 字数统计(正文 ≥ 500 字)
- ✅ 关键词位置(前 100 字内)
- ✅ 标题结构(H2 数量、H3/H2 比例、关键词分布)
- ✅ 内链分布
怎么用?
超简单,两种方式:
方式 1: CLI(推荐)
npx skills add JeffLi1993/seo-audit-skill
# 或者安装指定版本
npx skills add JeffLi1993/seo-audit-skill --skill seo-audit
npx skills add JeffLi1993/seo-audit-skill --skill seo-audit-full
方式 2: Claude Code 插件
/plugin marketplace add JeffLi1993/seo-audit-skill
/plugin install seo-audit-skill
然后直接对话:
audit this page: https://example.com
就能生成报告了!
项目结构
seo-audit-skill/
├── seo-audit/
│ ├── SKILL.md # Skill 定义 + agent 工作流
│ ├── references/REFERENCE.md # 字段定义、边界情况
│ ├── assets/report-template.html # HTML 输出模板
│ └── scripts/
│ ├── check-site.py # robots.txt + sitemap → JSON
│ ├── check-page.py # TDK + H1 + canonical + slug → JSON
│ ├── check-schema.py # JSON-LD 提取 + 验证 → JSON
│ ├── check-pagespeed.py # PageSpeed Insights API → JSON
│ └── fetch-page.py # 原始 HTML 抓取,SSRF 防护
└── seo-audit-full/
├── SKILL.md
├── references/REFERENCE.md
└── assets/report-template.html
所有脚本输出结构化 JSON 到 stdout。退出码 0 = 通过/警告,1 = 失败。
依赖:pip install requests
欢迎交流!
这个工具是我自己做 SEO 时的痛点产物,希望能帮到更多人。
如果你:
- 用了觉得不错,给个 Star ⭐
- 发现 Bug 或有改进建议,提个 Issue 🐛
- 想贡献代码,欢迎 PR 🚀
- 想交流 SEO 实战经验,随时找我聊 💬
GitHub 地址:https://github.com/JeffLi1993/seo-audit-skill
开源 + 免费,期待你的反馈!
最后说两句
AI 时代,真正稀缺的不是会用 AI 的人,而是没有 AI 也能把问题想透、跑通的人。
我做这个工具的过程,就是先自己手动跑了几十个网站的 SEO 审计,总结出哪些检查是确定性的、哪些需要语义判断,然后才设计出这套 Script + LLM 架构。
只有自己下过苦功夫、趟过坑,才知道策略的关键在哪,才能精准地指挥 AI。
否则,拿着烂大街的 prompt 让 AI 干活,出来的也只能是平庸的结果。
希望这个工具能帮你省点时间,把精力放在更有价值的事情上 🚀
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:jacktools123@163.com进行投诉反馈,一经查实,立即删除!
标签:

