首页 > 基础资料 博客日记
ultralytics yolo入门实践
2026-03-31 17:30:03基础资料围观2次
一、配置本地Python环境
二、下载YOLO源码并解压
https://github.com/ultralytics/ultralytics/releases
解压后的目录结构如下:

三、安装YOLO
1. 可以直接使用pip安装,但是这样安装无法对源码进行修改
2. 源码安装,源码安装后,可以直接修改源代码。
源码安装方式,进入项目目录后,执行:
pip install -e .
四、体验一下使用已有的模型进行预测
1. 命令行执行预测
yolo task='detect' mode='predict' model='yolo26n.pt' source='bus.jpg'
yolo predict model='yolov8n.pt' source="bus.jpg"
参数说明:
model:指定用哪个模型进行预测(在执行时会自动下载这个模型,或者也可以提前下载好放在项目里)
source:指定想要预测的图片或视频
执行结果会保存在runs目录下:

2. 代码行执行预测
from ultralytics import YOLO yolo = YOLO('yolov8n.pt', task='detect') result = yolo(source='bus.jpg', save=True)
参数说明:
save:是否保存结果,存到run目录
conf: 表示置信度多少以下不显示
... ...
这些参数也可以直接在文件中指定:

五、训练自己的模型
上面用到的是YOLO已经训练好的模型进行预测的,我们要在它的模型基础上,用我们自己的数据集来训练自己的模型。
我在这里用的是电脑桌面截图,通过训练想让模型识别微信和飞书两个应用的图标。
第一步:准备数据集
我这里使用截图工具Pixpin截图,很好用。

第二步:数据集重命名
截图后,将所有图片按顺序命名如:1.png, 2.png, 3.png ...,(这里用到批量重命名工具https://rename.jgrass.xyz/)
第三步:标注数据
标注数据用到标注工具:labelimg

第四步:整理数据的目录结构
数据集目录结构如下:

其中:images和labels中的train和val需要分别一一对应,
labels中还有一个classes.txt,保存类别:

第五步:将数据集放到项目中去

第六步:写yaml配置文件
datasets目录下有很多模板,定义一个自己的即可:
path: icons # dataset root dir train: images/train # train images (relative to 'path') 118287 images val: images/val # val images (relative to 'path') 5000 images test: # 20288 of 40670 images, submit to https://competitions.codalab.org/competitions/20794 # Classes names: 0: feishu 1: wechat

第七步:训练
from ultralytics import YOLO # Load model model = YOLO('yolo11n.pt') # Train model model.train(data='icons.yaml',workers=0, epochs=300, batch=16)

最后一步:用训练出来的模型预测
训练完成后,会在runs路径下生成train目录,找到最后一个train(我这里是train3),train3/weights/best.pt就是训练出来的做好的模型:

#### 用 best.pt 模型进行预测看看效果:
from ultralytics import YOLO yolo = YOLO('best.pt', task='detect') result = yolo(source='test.png', save=True)
效果如下(效果可能不太好,重在学习过程):

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:jacktools123@163.com进行投诉反馈,一经查实,立即删除!
标签:
相关文章
最新发布
- 红日靶场五 WP | ThinkPHP RCE → 内核提权 → 域控沦陷
- 一个基于 .NET Core + Vue3 构建的开源全栈平台 Admin 系统
- ESP32 实现在线动态安装库和自动依赖安装-使用uPyPI包管理平台
- 深度学习进阶(三)Transformer Block
- 程序员的创业小工具 - 开源项目自荐-WeCreate
- 基于 RO2 humble 配置 robosense Helios 32(速腾) & xsense mti 300
- 手撕 Transformer (3):编码器的实现
- Fedora 43物理机部署复盘
- 龙芯2k0300 - 走马观碑组编码器驱动移植
- AI 输出 Token 优化:文言文极简模式的实践

