本地部署deepseek,并投喂数据
<p>话说回来了,为啥要本地部署呢?<br>① 在使用DeepSeek中,经常会出现服务器繁忙,请稍后再试。<br>
② 不想让个人隐私数据暴露出去<br>
③ 可将各种格式的文件,如pdf、csv、txt、md 格式的数据投喂给它。比如你想让 DeepSeek 了解你的公司业务,就把相关的文档上传给它。</p>
<p><strong>DeepSeek</strong> 就能吃下你给它的各种“知识大餐”,然后变得更聪明,更懂你。</p>
<h2 id="1rag是什么">1.RAG是什么?</h2>
<p>为了投喂数据,我们要用到RAG。首先,我们先来了解下什么是RAG?</p>
<p>首先我们在命令行输入:ollama run deepseek-r1:7b 命令,启动DeepSeek<br>
<img src="https://img2024.cnblogs.com/blog/2212230/202504/2212230-20250412213223778-226419161.png"></p>
<p>然后打开浏览器并输入快捷键:ctrl+shift+l 调出WebUI可视化AI界面<br>
输入:RAG是什么?</p>
<p><img src="https://img2024.cnblogs.com/blog/2212230/202504/2212230-20250412213654179-1943578263.png"></p>
<p>翻译成大白话就是:我们把知识放到知识库里,然后把它投喂给人工智能。我们需要用一个量化的工具,把各种格式的数据量化给人工智能,让它能看得懂。</p>
<p>人工智能通过对这些知识的学习后,以后你再问它的时候,他就能将知识提取出来,加工处理后回答你的问题。</p>
<p>RAG 就是让 DeepSeek 不仅能靠自己的知识库回答问题,还能通过检索外部数据来增强回答的准确性和丰富性。就好比你考试时偷偷带了小抄,但 DeepSeek 是光明正大地“作弊”,还能把答案说得头头是道。</p>
<h2 id="2拉取nomic-embed-text">2.拉取nomic-embed-text</h2>
<p>刚说了RAG是啥?我们需要一个RAG工具来完成量化工作。</p>
<p>各种开源免费的RAG工具挺多,我们这里选择最近比较获得ollama 提供的nomic-embed-text。</p>
<p>https://ollama.com/library/nomic-embed-text</p>
<p><img src="https://img2024.cnblogs.com/blog/2212230/202504/2212230-20250412213949391-1226900345.png"></p>
<p>我们使用上面圈出来的命令拉取即可,274M,大约1min左右就可以下完,出现【success】字样表示下载成功。</p>
<p><img src="https://img2024.cnblogs.com/blog/2212230/202504/2212230-20250412214716570-325774344.png"></p>
<p><img src="https://img2024.cnblogs.com/blog/2212230/202504/2212230-20250412222014837-1676051380.png"></p>
<h2 id="3rag设置">3.RAG设置</h2>
<p>打开WebUI界面,我们会看到一个RAG设置文本嵌入模型。</p>
<p>文本嵌入模型就是把我们投喂的各种文档数据量化成DeepSeek认识的数据。</p>
<p><img src="https://img2024.cnblogs.com/blog/2212230/202504/2212230-20250412214819649-143516485.png"></p>
<h2 id="4添加新知识">4.添加新知识</h2>
<p>工具都准备好后,我们开始准备给DeepSeek投喂数据......</p>
<h3 id="41-投喂前不认识陈仕宝">4.1 投喂前不认识陈仕宝</h3>
<p><img src="https://img2024.cnblogs.com/blog/2212230/202504/2212230-20250412215410939-1674553167.png"></p>
<h3 id="42-准备投喂的数据">4.2 准备投喂的数据</h3>
<p>接下来,将陈仕宝事先准备好的关于陈仕宝的简介【程序员陈仕宝.md】文档投喂给它,文档内容如下。</p>
<p><img src="https://img2024.cnblogs.com/blog/2212230/202504/2212230-20250412220115234-1348084855.png"></p>
<h3 id="43-投喂数据">4.3 投喂数据</h3>
<p><img src="https://img2024.cnblogs.com/blog/2212230/202504/2212230-20250412221200483-125206531.png"></p>
<p>投喂数据</p>
<p><img src="https://img2024.cnblogs.com/blog/2212230/202504/2212230-20250412221524509-54553461.png"></p>
<p>上传数据成功<br>
<img src="https://img2024.cnblogs.com/blog/2212230/202504/2212230-20250412221554798-837404156.png"></p>
<p>投喂完成后,已经认识陈仕宝了,重新验证数据</p>
<p><img src="https://img2024.cnblogs.com/blog/2212230/202504/2212230-20250412221408908-594794511.png"></p>
<p>以上就是投喂数据的过程。</p><br><br>
来源:https://www.cnblogs.com/chenshibao/p/18822610
頁:
[1]