首页 > 基础资料 博客日记

开源:子木蒸馏版的 SEO 审计工具 seo-audit-skill v1.0

2026-04-11 10:00:02基础资料围观1

本篇文章分享开源:子木蒸馏版的 SEO 审计工具 seo-audit-skill v1.0,对你有帮助的话记得收藏一下,看极客资料网收获更多编程知识

开源:子木蒸馏版的 SEO 审计工具 seo-audit-skill v1.0

image.png

做 SEO 这么久,一直想要一个既专业又省事的审计工具。

所以我花了点时间,做了个 seo-audit-skill — 给它一个 URL,它就能跑出针对这个页面,一份结构化的报告,告诉你哪里有问

题、为什么有问题、怎么改。

开源 + 免费,欢迎大家用起来、提 PR、多交流!

GitHub 地址:https://github.com/JeffLi1993/seo-audit-skill

先看效果:

image.png

为什么做这个工具?

做 SEO 的都知道,审计是个苦力活:

  • 要检查 robots.txt、sitemap.xml、canonical 标签……
  • 要看 TDK(Title/Description/Keywords)写得对不对
  • 要分析 H1/H2 结构、内链分布、Schema 标记
  • 还要跑 PageSpeed Insights,看性能分数

这些事儿,80% 是机械重复,20% 需要人工判断。

比如:

  • “这个页面的 title 是不是 50-60 字符?” → 机器能判断
  • “这个 H1 的语义是否匹配关键词意图?” → 需要 LLM 理解

所以我设计了一个 Script + LLM 双层架构

  • Layer 1(Python 脚本) 处理确定性检查 → 输出结构化 JSON
  • Layer 2(LLM Agent) 处理语义判断 → 只在需要时介入

这样既不会让 LLM 瞎编(比如说“robots.txt 存在”但其实不存在),也不会漏掉需要理解的部分(比如 H1 的语义匹配度)。

image.png

能检查什么?

目前 v1.0 支持 20+ 项 SEO 检查,分为两个版本:

seo-audit (Basic 版)

适合日常快速审计,给个 URL 就能跑:

站点级检查:

  • ✅ robots.txt 解析(RFC 9309 标准)
  • ✅ sitemap.xml 验证
  • ✅ 404 处理(真 404 vs 软 404 vs 重定向到首页)
  • ✅ URL 规范化(HTTP→HTTPS、www 一致性、尾部斜杠)
  • ✅ 国际化 / hreflang 标签
  • ✅ Schema(JSON-LD)验证
  • ✅ E-E-A-T 信任页面(About/Contact/Privacy/Terms)
  • ✅ PageSpeed Insights 分数(移动端 + 桌面端)

页面级检查:

  • ✅ URL Slug(小写、连字符、关键词、停用词检测)
  • ✅ Title 标签(50-60 字符、关键词位置)
  • ✅ Meta Description(120-160 字符、关键词匹配、具体价值主张)
  • ✅ H1 标签(单一 H1、关键词匹配、语义意图)
  • ✅ Canonical 标签(自引用、重定向后匹配)
  • ✅ 图片 Alt 文本
  • ✅ 字数统计(正文 ≥ 500 字)
  • ✅ 关键词位置(前 100 字内)
  • ✅ 标题结构(H2 数量、H3/H2 比例、关键词分布)
  • ✅ 内链分布

怎么用?

超简单,两种方式:

方式 1: CLI(推荐)

npx skills add JeffLi1993/seo-audit-skill

# 或者安装指定版本
npx skills add JeffLi1993/seo-audit-skill --skill seo-audit
npx skills add JeffLi1993/seo-audit-skill --skill seo-audit-full

方式 2: Claude Code 插件

/plugin marketplace add JeffLi1993/seo-audit-skill
/plugin install seo-audit-skill

然后直接对话:

audit this page: https://example.com

就能生成报告了!

项目结构

seo-audit-skill/
├── seo-audit/
│   ├── SKILL.md                       # Skill 定义 + agent 工作流
│   ├── references/REFERENCE.md        # 字段定义、边界情况
│   ├── assets/report-template.html    # HTML 输出模板
│   └── scripts/
│       ├── check-site.py              # robots.txt + sitemap → JSON
│       ├── check-page.py              # TDK + H1 + canonical + slug → JSON
│       ├── check-schema.py            # JSON-LD 提取 + 验证 → JSON
│       ├── check-pagespeed.py         # PageSpeed Insights API → JSON
│       └── fetch-page.py              # 原始 HTML 抓取,SSRF 防护
└── seo-audit-full/
    ├── SKILL.md
    ├── references/REFERENCE.md
    └── assets/report-template.html

所有脚本输出结构化 JSON 到 stdout。退出码 0 = 通过/警告,1 = 失败。

依赖:pip install requests

欢迎交流!

这个工具是我自己做 SEO 时的痛点产物,希望能帮到更多人。

如果你:

  • 用了觉得不错,给个 Star ⭐
  • 发现 Bug 或有改进建议,提个 Issue 🐛
  • 想贡献代码,欢迎 PR 🚀
  • 想交流 SEO 实战经验,随时找我聊 💬

GitHub 地址:https://github.com/JeffLi1993/seo-audit-skill

开源 + 免费,期待你的反馈!

最后说两句

AI 时代,真正稀缺的不是会用 AI 的人,而是没有 AI 也能把问题想透、跑通的人

我做这个工具的过程,就是先自己手动跑了几十个网站的 SEO 审计,总结出哪些检查是确定性的、哪些需要语义判断,然后才设计出这套 Script + LLM 架构。

只有自己下过苦功夫、趟过坑,才知道策略的关键在哪,才能精准地指挥 AI。

否则,拿着烂大街的 prompt 让 AI 干活,出来的也只能是平庸的结果。

希望这个工具能帮你省点时间,把精力放在更有价值的事情上 🚀


文章来源:https://www.cnblogs.com/Alandre/p/19850512
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:jacktools123@163.com进行投诉反馈,一经查实,立即删除!

标签:

相关文章

本站推荐

标签云