原来用聊天记录就可以创造数字分身！WeClone项目在Lab4AI平台上的复现

优闲一族 發表於 2025-11-28 14:32:00

原来用聊天记录就可以创造数字分身！WeClone项目在Lab4AI平台上的复现

<h2 id="01--weclone如何创造数字分身">01 | WeClone如何创造数字分身</h2>
<p>拥有一个数字分身可能是很多人的一个愿望。其实通过给大模型喂我们的聊天记录，就可打造出我们的数字分身，当前爆火的<strong>Weclone项目</strong>采取的就是这种做法。先导出自己的聊天记录，再把聊天记录作为数据用来微调大模型，让模型学习我们的语言风格和习惯，就能打造出专属的数字分身。近期，有开发者在<strong>Lab4AI大模型实验室</strong>成功复现WeClone项目，不需要准备繁琐的环境，很容易就能上手。</p>
<h2 id="02--来lab4ai一站式体验">02 | 来Lab4AI一站式体验</h2>
<p>进入Lab4AI.cn，找到【WeClone：从聊天记录创造数字分身的一站式解决方案】项目，我们有两种方式带您体验数字分身。</p>
<p><strong>👉 项目指路：</strong> Lab4AI 项目页</p>
<p><img alt=" " loading="lazy" src="http://s1.llamafactory.online/lmlab/docs/v1.0/blog/20251011-weclone/%E5%9B%BE%E7%89%871.png" class="lazyload"></p>
<h3 id="方式一直接使用lab4ai的数据体验数字分身">方式一：直接使用Lab4AI的数据，体验数字分身</h3>
<p><strong>Lab4AI大模型实验室</strong>提供交互式对话，无需微调代码，就可以执行代码块，迅速体验交互过程。</p>
<p><img alt=" " loading="lazy" src="http://s1.llamafactory.online/lmlab/docs/v1.0/blog/20251011-weclone/%E5%9B%BE%E7%89%872.png" class="lazyload"></p>
<p><img alt=" " loading="lazy" src="http://s1.llamafactory.online/lmlab/docs/v1.0/blog/20251011-weclone/%E5%9B%BE%E7%89%873.png" class="lazyload"></p>
<h3 id="方式二使用自有数据打造数字分身">方式二：使用自有数据打造数字分身</h3>
<p>您可使用自己的聊天数据解锁数字分身。<strong>Lab4AI大模型实验室</strong>已准备好完整的环境、数据、算力支持，只需四步即可打造数字分身：<strong>获取聊天记录 --> 环境准备 --> 启动微调 -->  模型推理。</strong></p>
<h4 id="step-1获取聊天记录">Step 1：获取聊天记录</h4>
<p>Lab4AI大模型实验室提供的项目实践中以Telegram为例介绍了如何获取个人聊天记录。</p>
<h5 id="1导出聊天记录">1）导出聊天记录</h5>
<p>在Telegram应用中，单击需要导出聊天记录的聊天对象，单击对话框右上角的省略号按钮，在弹出的选项中选择“Export chat history”,选择照片类型，格式选择JSON，可以导出多个联系人（不建议使用群聊记录）。然后将导出的ChatExport_*文件夹放在./dataset/telegram目录即可（不同人聊天记录的文件夹一起放在 ./dataset/telegram）。</p>
<p><img alt=" " loading="lazy" src="http://s1.llamafactory.online/lmlab/docs/v1.0/blog/20251011-weclone/%E5%9B%BE%E7%89%874.png" class="lazyload"></p>
<h5 id="2数据预处理">2）数据预处理</h5>
<p>我们已经提供了数据处理代码，您根据自己的数据情况和训练需求，编辑配置文件，即可生成数据集相关的配置。</p>
<p><img alt=" " loading="lazy" src="http://s1.llamafactory.online/lmlab/docs/v1.0/blog/20251011-weclone/%E5%9B%BE%E7%89%875.png" class="lazyload"></p>
<h4 id="step-2环境准备">Step 2：环境准备</h4>
<p>我们已经准备好了Conda 环境和项目依赖包。</p>
<p><img alt=" " loading="lazy" src="http://s1.llamafactory.online/lmlab/docs/v1.0/blog/20251011-weclone/%E5%9B%BE%E7%89%876.png" class="lazyload"></p>
<h4 id="step-3启动微调">Step 3：启动微调</h4>
<p>直接运行下方代码块，即可执行微调。</p>
<p><img alt=" " loading="lazy" src="http://s1.llamafactory.online/lmlab/docs/v1.0/blog/20251011-weclone/%E5%9B%BE%E7%89%877.png" class="lazyload"></p>
<h4 id="step-4模型推理">Step 4：模型推理</h4>
<p>在JupyterLab内打开一个终端页面用于启动服务。模型的API在终端窗口启动后进行聊天问题测试，模型的生成结果会保存在指定路径下。下方展示了微调前和微调后的对话效果，可以看出：</p>
<ul>
<li>微调前，Assistant的回答并不专业，仅具备一些通用知识，无法简明扼要地向user索要订票所需的关键信息，并且经常回答过于冗长而被提前截断，未达到一位专业的航空公司订票客服的业务标准。</li>
<li>微调后，Assistant回答更加专业，能够了解user需求后简短地回问索取用户信息，并回复订票的结果。整个流程更加贴合常见的订票人工客服操作标准，可明显观察到Assistant学习到了订票客服的画风和话术。</li>
</ul>
<p><img alt=" " loading="lazy" src="http://s1.llamafactory.online/lmlab/docs/v1.0/blog/20251011-weclone/%E5%9B%BE%E7%89%878.png" class="lazyload"></p>
<h2 id="03--结语">03 | 结语</h2>
<p>很多人可能会觉得 “训练数字分身很复杂”，但在Lab4AI大模型实验室，整个过程其实很简单：只要有足够的聊天记录或语料，跟着 WeClone 的步骤 —— 导出数据、预处理、微调模型、启动推理，就能拥有专属分身。</p>
<p>作为算力驱动的AI实践内容生态社区，它不是普通的代码仓库，而是集代码、数据、算力与实验平台于一体的平台，项目中预装虚拟环境，让您彻底告别“环境配置一整天，训练报错两小时”的窘境。</p>
<p>如果你也想有一个能替你处理事务、陪伴你的数字分身，不妨去<strong>Lab4AI.cn</strong>试试 WeClone 项目。或许你会发现，这个用聊天记录 “克隆” 出来的小帮手，能给你的生活带来很多意想不到的便利和温暖。</p><br><br>
来源：https://www.cnblogs.com/lab4ai/p/19282578

頁: [1]

圆梦公社's Archiver

原来用聊天记录就可以创造数字分身！WeClone项目在Lab4AI平台上的复现