首页 > 基础资料 博客日记
我把市面上 UI 自动化 Skill 全踩坑一遍后,自己写了个真正能用的
2026-04-23 18:30:02基础资料围观2次
极客资料网推荐我把市面上 UI 自动化 Skill 全踩坑一遍后,自己写了个真正能用的这篇文章给大家,欢迎收藏极客资料网享受知识的乐趣
用过市面上几乎所有 UI 自动化 Skill,我只说一句大实话:一个能打的都没有。
有的顶着超高热度,吹得天花乱坠,实际用起来各种报错、乱触发、逻辑跑偏;有的流程繁琐到崩溃,要配 JSON、打快照、填一堆参数,还没开始干活心态先崩了。折腾一圈下来,我只有一个感觉:就没有一个简单、干净、稳定的。
既然没有满意的,那就自己造。
熟悉我的朋友都知道,我迭代了很多年的seliky(没看过的朋友可以翻我前面博客),这次我直接在 seliky 的基础上,做了一个极简 UI 自动化 Skill,已经上传到 workbuddy,名字就叫:ui 自动化。
它的逻辑简单到极致:你用自然语言说要做什么,它就直接帮你在浏览器里执行。
打开、点击、输入,一句话搞定,不用配置、不用写复杂规则、不用生成乱七八糟的中间文件。
在我心里,这才是 UI 自动化该有的样子:人说人话,工具做事。
请在workbuddy或主流skillhub平台自行体验,不谢不谢。

看一下跑完的案例,简直 言出法随。
它真的在浏览器上进行对应操作,我上传不了mp4,大家自行脑补。
请看图:

这是另外一个长流程的,只要自己写清楚,操作也是没问题。

当然,它也不是完美形态,我也不藏着:
- 在结构特别复杂的页面上,纯自然语言描述会力不从心,描述再详细也不如定位精准。这种场景下,直接给 xpath,一步到位。
- 其实终极方案也有:接入视觉大模型,靠看图理解界面。但我试过,太烧 token、又慢又耗时,性价比极低,所以暂时没加,保持轻量稳定最重要。
一定会往视觉方向发展的,AI手机不也是这样么,其它形态做ui自动化的,多是小可爱。
给大家两个小 tips:
- 只有第一次安装会慢一点,装好之后秒启动,不会重复安装。
- 目前这个 skill 没有版权限制,趁我心情好,随便拿去二开、魔改、自用都行。
如果你也受够了那些繁琐难用、花里胡哨的 UI 自动化工具,真心建议你试试这个。
简单、稳定、不折腾,才是效率工具该有的样子嘛。
文章来源:https://www.cnblogs.com/teark/p/19917653
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:jacktools123@163.com进行投诉反馈,一经查实,立即删除!
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:jacktools123@163.com进行投诉反馈,一经查实,立即删除!
标签:
相关文章
最新发布
- C# 视频录制监控系统
- 从 AMBA 协议看 Valid-Ready 到 Credit-based 流控机制
- Redis-Hash型与List型操作命令
- 8 年前的老代码 + 20 刀 AI token = 我的第一款独立产品
- 深度学习进阶(十二)可变形池化 deformable RS RoI Pooling
- 计算与判定:P、NP、NP-hard 和 NP-complete 问题
- 20253904 2025-2026-2 《网络攻防实践》第六周作业
- Qwen3.6-27B 等九款本地模型的测试结果
- 在线学习算力平台推荐-Hyper.AI
- 有监督 vs 全自主:两种 Agent 范式,你选对了吗?

