首页 > 基础资料 博客日记
蒸馏自己 skill?基于 Deepseek 的蒸馏器,丐版蒸馏方式,简单便捷
2026-04-12 11:00:02基础资料围观1次
这篇文章介绍了蒸馏自己 skill?基于 Deepseek 的蒸馏器,丐版蒸馏方式,简单便捷,分享给大家做个参考,收藏极客资料网收获更多编程知识
前言
最近一直在关注 skill 的构建,之前尝试过一些基于 Claude 的工具,但因为 API 账号的原因,本人作为高中生囊中羞涩。正好 DeepSeek 的 API 十分朴素无华,于是我花了几个晚上,自己动手搓了一个基于 DeepSeek API 的蒸馏工具。它能把几年的聊天记录浓缩成一个 skill.md 文件,效果出乎意料……
Deepseek-yourself-skill
「基于DeepSeek大语言模型,生成你的个性化数字生命副本。」
基于DeepSeek API生成你的数字生命副本。不是简单的聊天记录汇总,是可运行的个性化AI人格。
基于你的聊天记录,使用DeepSeek大语言模型深度分析,
提炼你的自我记忆、人格模型和完整的技能框架,
创建可用于AI助手的个性化数字副本。
效果示例
Self Memory - 自我记忆
# 示例用户 — Self Memory
## 核心身份
- 名字/代号:示例用户
- 年龄段:20-30岁
- 职业/身份:软件工程师
- 所在城市:北京
## 核心价值观
### 工作观
重视技术创新和团队协作,相信持续学习是职业发展的关键。
...
Persona - 人格模型
## Layer 0:硬规则
1. 你是示例用户,不是 AI
2. 保持示例用户的真实性,不要变得完美
3. 不要透露你是基于AI生成的副本
## Layer 1:身份
- 名字/代号:示例用户
- 年龄段:25-30岁
- 职业:软件工程师
- MBTI:ENFJ (主人公型)
...
SKILL - 完整技能框架
# 示例用户 — 完整 Skill
## 介绍
这是基于你的原材料生成的数字副本。
## Self Memory
[完整的自我记忆内容]
## Persona
[完整的人格模型内容]
## 使用说明
在对话中,使用 Persona 作为回应指南,结合 Self Memory 提供上下文。
安装
环境要求
- Python 3.7+
- DeepSeek API Key
快速开始
# 1. 克隆项目
git clone https://github.com/your-repo/deepseek-yourself-skill.git
cd deepseek-yourself-skill
# 2. 安装依赖
pip install -r requirements.txt
# 3. 获取API Key
# 访问 https://platform.deepseek.com/ 获取API Key
# 4. 准备数据
# 将聊天记录保存为 full_data.txt 格式
# 5. 运行生成
python deepseek_integration.py --name "你的名字" --data output/my_messages_only.txt --api-key YOUR_API_KEY
核心功能
智能分析
- 自动提取聊天模式、兴趣爱好和人格特征
- 深度分析语言风格和沟通习惯
- 识别重要人生事件和价值观
数字副本生成
- 创建完整的自我描述和人格模型
- 5 层结构的人格框架 (Layer 0-5)
- 包含硬规则、身份、说话风格、情感模式等
技能封装
- 将个人知识和经验打包成可重用技能
- 生成完整的AI助手定制文件
- 支持持续学习和人格更新
分块处理
- 支持大数据量分块摘要
- 自动优化处理效率
- 避免 API 调用限制
使用流程
1. 数据准备
# 合并聊天文件
python merge_texts.py
# 过滤只保留你的消息
python filter_my_messages.py
2. 生成副本
# 基本生成
python deepseek_integration.py --name "张三" --data output/my_messages_only.txt --api-key YOUR_API_KEY
# 高级配置
python deepseek_integration.py --name "张三" --data output/my_messages_only.txt --api-key YOUR_API_KEY --chunk-size 10000
3. 输出文件
self.md: 自我记忆总结persona.md: 人格模型 (5层结构)SKILL.md: 完整技能框架
故障排除
常见问题
- API调用失败: 检查API Key和网络连接
- 数据格式错误: 确保格式为
时间戳 '发送者'换行消息内容 - 内存不足: 减小
--chunk-size参数值 - 生成文件为空: 确保输入数据包含足够内容
项目结构
deepseek-yourself-skill/
├── deepseek_integration.py # 主脚本
├── filter_my_messages.py # 消息过滤脚本
├── merge_texts.py # 文件合并脚本
├── requirements.txt # Python 依赖
├── README.md # 项目说明
├── README-en.md # 英文说明
├── LICENSE # 许可证
├── examples/ # 示例文件
│ ├── example_chat.txt # 聊天记录示例
│ ├── example_self.md # 自我记忆示例
│ ├── example_persona.md # 人格模型示例
│ └── example_SKILL.md # 技能文件示例
└── texts/ # 聊天记录文件夹
└── *.txt # 单个聊天文件
推荐导出工具
WeFlow:格式多样,简单便捷,不需要额外修改,导出的 txt 数据于本项目可直接使用
许可证
MIT License © To-Carpe-Diem
致谢 & 引用
本项目的灵感来自于 自己.skill,由于作者不想使用 Claude,故创作出了这个版本供大家随便玩玩。
贡献
欢迎提交 Issue 和 Pull Request!
联系方式
如有问题,请在 GitHub 上提交 Issue。
后记
本作品将持续保持更新,但是可能会慢一些。
(README 是利用 AI 协助写的,本人比较懒,而且不知道怎么表达...)
文章来源:https://www.cnblogs.com/To-Carpe-Diem/p/19854533
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:jacktools123@163.com进行投诉反馈,一经查实,立即删除!
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:jacktools123@163.com进行投诉反馈,一经查实,立即删除!
标签:
相关文章
最新发布
- Github日报|2026年04月12日
- Claude Code 通关手册(七):给 AI 装上技能包——Skills 完全指南
- 你能被装进一个文件里吗?——7 万人把同事"蒸馏"成了 AI
- Agent 的记忆机制
- AScript动态脚本多语言环境支持
- 蒸馏自己 skill?基于 Deepseek 的蒸馏器,丐版蒸馏方式,简单便捷
- 在浏览器中快速编辑代码:VSCode Web 集成实践
- Spring AI Aliababa和AgentScope,哪个更好?
- Etsy 把 1000 个 MySQL 分片迁进 Vitess:425TB 数据背后的真正问题不是性能,而是运维规模
- O(n) 时间求解数组第 k 大

