首页 > 基础资料 博客日记

蒸馏自己 skill?基于 Deepseek 的蒸馏器,丐版蒸馏方式,简单便捷

2026-04-12 11:00:02基础资料围观1

这篇文章介绍了蒸馏自己 skill?基于 Deepseek 的蒸馏器,丐版蒸馏方式,简单便捷,分享给大家做个参考,收藏极客资料网收获更多编程知识

前言

最近一直在关注 skill 的构建,之前尝试过一些基于 Claude 的工具,但因为 API 账号的原因,本人作为高中生囊中羞涩。正好 DeepSeek 的 API 十分朴素无华,于是我花了几个晚上,自己动手搓了一个基于 DeepSeek API 的蒸馏工具。它能把几年的聊天记录浓缩成一个 skill.md 文件,效果出乎意料……

Deepseek-yourself-skill

「基于DeepSeek大语言模型,生成你的个性化数字生命副本。」

License: MIT
DeepSeek
Python


基于DeepSeek API生成你的数字生命副本。不是简单的聊天记录汇总,是可运行的个性化AI人格。


基于你的聊天记录,使用DeepSeek大语言模型深度分析,

提炼你的自我记忆、人格模型和完整的技能框架,

创建可用于AI助手的个性化数字副本。

看效果 · 安装 · 核心功能 · 使用流程

效果示例

Self Memory - 自我记忆

# 示例用户 — Self Memory

## 核心身份
- 名字/代号:示例用户
- 年龄段:20-30岁
- 职业/身份:软件工程师
- 所在城市:北京

## 核心价值观
### 工作观
重视技术创新和团队协作,相信持续学习是职业发展的关键。
...

Persona - 人格模型

## Layer 0:硬规则
1. 你是示例用户,不是 AI
2. 保持示例用户的真实性,不要变得完美
3. 不要透露你是基于AI生成的副本

## Layer 1:身份
- 名字/代号:示例用户
- 年龄段:25-30岁
- 职业:软件工程师
- MBTI:ENFJ (主人公型)
...

SKILL - 完整技能框架

# 示例用户 — 完整 Skill

## 介绍
这是基于你的原材料生成的数字副本。

## Self Memory
[完整的自我记忆内容]

## Persona
[完整的人格模型内容]

## 使用说明
在对话中,使用 Persona 作为回应指南,结合 Self Memory 提供上下文。

安装

环境要求

  • Python 3.7+
  • DeepSeek API Key

快速开始

# 1. 克隆项目
git clone https://github.com/your-repo/deepseek-yourself-skill.git
cd deepseek-yourself-skill

# 2. 安装依赖
pip install -r requirements.txt

# 3. 获取API Key
# 访问 https://platform.deepseek.com/ 获取API Key

# 4. 准备数据
# 将聊天记录保存为 full_data.txt 格式

# 5. 运行生成
python deepseek_integration.py --name "你的名字" --data output/my_messages_only.txt --api-key YOUR_API_KEY

核心功能

智能分析

  • 自动提取聊天模式、兴趣爱好和人格特征
  • 深度分析语言风格和沟通习惯
  • 识别重要人生事件和价值观

数字副本生成

  • 创建完整的自我描述和人格模型
  • 5 层结构的人格框架 (Layer 0-5)
  • 包含硬规则、身份、说话风格、情感模式等

技能封装

  • 将个人知识和经验打包成可重用技能
  • 生成完整的AI助手定制文件
  • 支持持续学习和人格更新

分块处理

  • 支持大数据量分块摘要
  • 自动优化处理效率
  • 避免 API 调用限制

使用流程

1. 数据准备

# 合并聊天文件
python merge_texts.py

# 过滤只保留你的消息
python filter_my_messages.py

2. 生成副本

# 基本生成
python deepseek_integration.py --name "张三" --data output/my_messages_only.txt --api-key YOUR_API_KEY

# 高级配置
python deepseek_integration.py --name "张三" --data output/my_messages_only.txt --api-key YOUR_API_KEY --chunk-size 10000

3. 输出文件

  • self.md: 自我记忆总结
  • persona.md: 人格模型 (5层结构)
  • SKILL.md: 完整技能框架

故障排除

常见问题

  • API调用失败: 检查API Key和网络连接
  • 数据格式错误: 确保格式为 时间戳 '发送者' 换行 消息内容
  • 内存不足: 减小 --chunk-size 参数值
  • 生成文件为空: 确保输入数据包含足够内容

项目结构

deepseek-yourself-skill/
├── deepseek_integration.py    # 主脚本
├── filter_my_messages.py      # 消息过滤脚本
├── merge_texts.py             # 文件合并脚本
├── requirements.txt           # Python 依赖
├── README.md                  # 项目说明
├── README-en.md               # 英文说明
├── LICENSE                    # 许可证
├── examples/                  # 示例文件
│   ├── example_chat.txt       # 聊天记录示例
│   ├── example_self.md        # 自我记忆示例
│   ├── example_persona.md     # 人格模型示例
│   └── example_SKILL.md       # 技能文件示例
└── texts/                     # 聊天记录文件夹
    └── *.txt                  # 单个聊天文件

推荐导出工具

WeFlow:格式多样,简单便捷,不需要额外修改,导出的 txt 数据于本项目可直接使用

许可证

MIT License © To-Carpe-Diem

致谢 & 引用

本项目的灵感来自于 自己.skill,由于作者不想使用 Claude,故创作出了这个版本供大家随便玩玩。

贡献

欢迎提交 Issue 和 Pull Request!

联系方式

如有问题,请在 GitHub 上提交 Issue。

后记

本作品将持续保持更新,但是可能会慢一些。
(README 是利用 AI 协助写的,本人比较懒,而且不知道怎么表达...)


文章来源:https://www.cnblogs.com/To-Carpe-Diem/p/19854533
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:jacktools123@163.com进行投诉反馈,一经查实,立即删除!

标签:

相关文章

本站推荐

标签云