DeepSeek核心技术原理和本地部署微调实操课程

联系我们：
13382173255（Karen郑老师）

学员背景| Course Background

参加对象：管理者

授课形式：内训

授课天数：2 天

课程背景| Course Background

随着人工智能技术的快速发展，智能助手（如DeepSeek-V3）在多模态理解、个性化交互、知识推理等领域的应用日益广泛。DeepSeek-V3作为深度求索公司推出的第三代智能助手，凭借其先进的核心技术（如大规模预训练、多模态理解、上下文感知等），在智能客服、内容创作、教育、医疗等领域展现了强大的潜力。

然而，要将DeepSeek-V3的能力充分发挥并应用于实际业务场景，不仅需要深入理解其核心技术原理，还需要掌握本地部署和微调的方法，以满足特定领域或企业的定制化需求。为此，本课程旨在帮助学员系统学习DeepSeek-V3的核心技术原理，并通过实操掌握本地部署和微调的技能，从而提升在实际项目中的应用能力。

课程收益| Program Benefits

1. 深刻理解DeepSeek-V3的核心技术原理

· 掌握DeepSeek-V3的架构设计、多模态理解、上下文感知、知识图谱等核心技术。

· 掌握大规模预训练模型（如Transformer）的工作原理及其在DeepSeek-V3中的应用。

2. 掌握DeepSeek-V3的本地部署方法

· 学习如何搭建适合DeepSeek-V3运行的本地环境（包括硬件配置、依赖库安装等）。

· 掌握DeepSeek-V3的本地部署流程，包括模型加载、服务启动和接口调用。

· 掌握如何优化部署性能，以支持高并发和低延迟的应用场景。

3. 学会DeepSeek-V3的微调与定制化

· 掌握如何利用领域数据对DeepSeek-V3进行微调，以提升其在特定任务中的表现。

· 学习微调过程中的关键技术，包括数据预处理、模型训练、参数调优等。

4. 提升实际项目中的应用能力

· 通过实战案例，学习如何将DeepSeek-V3应用于智能客服、内容生成、知识问答等场景。

课程大纲| Course Outline

第一天课程：DeepSeek-V3/R1核心技术架构和训练过程

上午课程

第一部分 DeepSeek-V3的架构创新：训练GPU和成本均低，但效果卓越

1.1 V3风靡海内外的关键因素：训练成本极低、引领前沿创新

1.1.1 V3训练成本：所用的GPU训练资源仅为Llama 3.1 405B的差不多1/14

1.1.2 在国内也能引领世界级前沿

1.2 模型架构：MLA、负载均衡的MoE、Multi-Token预测

1.2.1 多头潜在注意力

1.2.2. 无辅助损失的负载平衡 DeepSeekMoE

1.2.3 多token预测：Multi-Token Prediction显著加快模型的解码速度

第二部分 DeepSeek-V3基础设施层面的创新：FP8 训练等

2.1 训练框架(含GPU的内部结构示意图)

2.1.1 双管道DualPipe与计算-通信重叠

2.1.2 跨节点全对全通信的高效实现：通过PXT连接CUDA和底层GPU硬件

2.1.3. 极致内存节省与最小开销

2.2 FP8训练：虽算的快但精度不够，故需提高精度

2.2.1 混合精度框架

2.2.2. 通过量化和乘法提高精度

2.2.2 低精度存储和通信：降低内存和通信开销

2.3 推理与部署

2.3.1 预填充

2.3.2 解码

2.4 硬件设计建议

下午课程

第三部分 DeepSeek-V3的预训练与后训练

3.1 预训练

3.1.1 数据构建：提高数学、编程、多语言样本，最终14.8T语料

3.1.2 超参数

3.1.3 长上下文扩展

3.1.4 评估与讨论

3.2 训练后处理：透露了大半后来引爆全球的R1正式版训练流程

3.2.1 监督微调

3.2.2 强化学习：涉及奖励模型和GRPO

3.2.3 评估与讨论：关于DeepSeek-R1提炼与多token预测

第四部分 DeepSeek R1：如何通过纯RL训练大模型的推理能力

4.1 提出背景与相关工作

4.1.1 R1-Zero的提出背景：无需人类数据，从零实现自我迭代

4.1.2 R1的提出背景：解决Zero可读性差等问题

4.2 DeepSeek-R1-Zero：规则驱动的大规模RL训练，无冷启动、无SFT

4.2.1 RL算法GRPO：不需要critic

4.2.2 规则奖励建模(准确率奖励 + 格式奖励)：不用训练专门的奖励模型RM

4.2.3 训练模板：通过prompt让Zero启动深度思考的推理模式

4.2.4 Zero的性能、自我进化过程和顿悟时刻

4.3 DeepSeek-R1：先冷启动数据SFT 再RL，之后再SFT 再RL

4.3.1 阶段一冷启动(主要关注推理)：通过R1-Zero生成数千条长CoT数据

4.3.2 阶段二面向推理的GRPO RL：类似Zero的规则奖励，但增加语言一致性奖励

4.3.3 阶段三 V3上的的两轮SFT(结合rejection sampling)：涉及80w通用层面的推理和非推理数据

4.3.4 阶段四所有场景的RL：提高有用性和无害性，且混合规则奖励和偏好奖励

4.4 蒸馏：赋予小模型推理能力

4.5 一些经验总结：成功和失败的经验分析总结

第二天课程：DeepSeek本地部署和微调案例实操

上午课程

第五部分本地部署准备工作：各个版本、推理框架、硬件资源

5.1 DeepSeek-R1的多个版本：加上2个原装671B的，总计8个参数版本

5.2 主流的大模型推理框架：分为PC端和Android端

5.3 不同参数的模型所要求的硬件

5.4 蒸馏版和满血版的两类部署

第六部分通过Ollama、vLLM本地部署DeepSeek-R1蒸馏版：支持联网搜索及知识库问答

6.1 基于Ollama和各类插件构建智能对话：终端、open-webui(支持联网)、Chatbox

6.1.1 Ollama下的终端命令行交互

6.1.2 Ollama下的open-webui交互：基于docker安装，且支持联网搜索

6.1.3 基于Ollama + ChatBox部署deepseek-r1:7b

6.2 基于Ollama和Page Assist/AnythingLLM构建本地知识库问答系统

6.2.1 基于Ollama + Page Assist搭建本地知识库问答系统：且支持联网搜索

6.2.2 基于Ollama + AnythingLLM搭建本地知识库问答

6.3 通过vLLM推理deepseek-r1

6.3.1 基于vLLM的命令行交互——R1-Distill-Llama-8B

6.3.2 基于vllm + open WebUi 部署r1 7b

6.4 本地手机端部署DeepSeek-R1蒸馏Llama/Qwen后的版本

下午课程

第七部分无蒸馏前提下本地部署R1 or R1-Zero 671B满血版

7.1 折中路径：无蒸馏但量化部署Deepseek-R1 671B满血版

7.1.1 本地CPU上运行 Deepseek-R1 的完整的硬件 + 软件设置

7.1.2 GPU上跑无蒸馏但量化的Deepseek-R1 671B满血版

7.2 企业级部署：无蒸馏不量化部署Deepseek-R1 671B满血版

专利和文献：

深度学习国际发明专利

1) 基于深度学习的图像检索方法及装置，专利公开公告号：CN107368614A。专利类型：发明公布。发明人：周红伟;李凯;任伟;李庆;郭奇杰;周杨;刘川郁

2) Simulation model and droplet ejection performance of a thermal-bubble microejector，Hongwei Zhou，A.M.Gué，Sensors and Actuators B: Chemical Volume 145，Issue 1，4 March 2010，Pages 311-319

3)Simulation Bubble Nucleation and Bubble Growth of a Thermal Bubble Microejector,Hongwei Zhou，A.M.Gué，Excerpt from the Proceedings of the COMSOL Conference 2009 Mila

讲师背景| Introduction to lecturers

了解更多

珀菲特顾问|周红伟老师

讲师简介 / About the Program Leader

ChatGPT与大模型实战专家—周红伟老师

（阿里大模型算法专家，大数据和AI实战专家）

【背景介绍】

Ø 现任云宇宙科技CEO

Ø 前马上消费金融风控负责人

Ø 前阿里人工智能算法专家

Ø 前猪八戒大数据科学家

Ø 重庆市大数据科学家

Ø 富民银行--大数据专家

Ø 人工智能科学家

Ø 法国科学院数据算法博士

Ø 发起《重庆市金融风险防范实验室》任风控总监

【实战经验】

周红伟先生是重庆市大数据和人工智能专家，阿里大模型算法专家。周老师2009年毕业于法国科学院LAAS实验室，荣获多项人工智能算法国际发明专利。近10年人工智能算法、大数据智能决策实战经验，近两年大模型部署和微调经验。先后任职互联网独角兽大数据总监、技术总监。

毕业后专注于深度学习，大数据，云计算，大模型。现任职于云宇宙科技有限公司，搭建大模型微调平台，深度学习算法平台，基于大模型的智能决策平台。应用大模型赋能金融科技业务，大模型应用于客户营销、客户业务咨询和实时语音质检业务。

在港宇科技开发了基于深度学习的车辆视频跟踪，车牌识别，优于海康威视的同类产品，为华为公司的OEM供货商。曾任职猪八戒大数据科学家，伴随着猪八戒网的闪电扩张，从百亿估值向千亿估值的征程中，领导研发了国内第一个基于大数据，深度神经网络的商标搜索系统。作为马上消费金融风控负责人，领导研发了基于共享经济平台的大数据金融风控系统。曾就职于商才数字科技公司，任技术总监，设计和领带开发了综合电商交易平台，点餐外卖平台，数据中台，服务于电商、点餐外卖业务，带动了公司快速的互联网生态化发展。

周老师一直专注于企业在大模型、人工智能，大数据，云计算的业务场景落地应用。大模型背景下，如何应对移动互联网，互联网生态系统搭建，大数据，人工智能的挑战和企业应对策略，商业模式的变更。企业如何在大模型时代，搭建人工智能企业架构，博得大数据、大模型红利。大模型时代共享经济的思维变革，人工智能金融探秘，互联网领域的投资挖掘。

培训课程 / Training courses

1、《大模型的应用、微调和部署案例实践》

2、《大模型微调、部署、行业应用和接口开发》

3、《算力网络：算力网络技术原理及落地实践》

4、《ChatGPT与AIGC生成式人工智能操作实战》

5、《大模型赋能企业办公降本提效案例应用实操》

6、《人工智能下一个时代：ChatGPT的技术实现原理、行业实践以及商业变现途径》

7、《大模型在金融行业的应用案例实践》

8、《大模型在通信行业的应用实践》

7、《下一代人工智能：隐私计算和可信人工智能》

8、《互联网(消费金融)企业的AI大数据应用》

9、《AI世界模拟器：Sora视频生成模型的技术实现原理、行业实践以及商业变现途径》

10、《大模型技术体系架构和算法案例实操》

11、《互联网金融的大数据风控》

代表性客户 / PART OF TRAINED COMPANIES INCLUDED BUT NOT LIMITED TO

互联网：苹果、微软、三星、华为、阿里、网易、百度、腾讯、字节跳动、马上金融；

金融：汇丰银行、花旗银行、工商银行、招商银行、法国兴业银行、中国农业银行、建设银行、中国银行、富民银行、微众银行、中信银行；

通信：中国移动研究院、上海移动研究院、北京移动、上海移动、江苏移动、杭州移动、杭州移动研究院、黑龙江移动、四川移动、中国电信、北京电信研究院、中国联通、北京联通研究总院、四川联通、杭州联通、中国铁塔、中移物联网；

政府：国家网络信息安全中心、河南省金融监控总局、北京市政府、重庆市政府、杭州市政府、陕西省政府；

能源：中国石油、中国石化、中国海洋石油；

电力：中国电力、中国电力科技

工业：宝武集团、上海汽车、中建八局

服务流程

Service Procedure

提交需求
沟通诊断
项目调研
方案设计
达成共识
项目实施
持续跟踪
效果评估

服务优势

Service Advantages

对行业特性的深刻理解

我们拥有几百家各类企业的项目咨询基础、多行业数据库、多年的行业经验，并对企业进行深度研究和剖析，总结出一系列深入的观点和经验。
丰富的案例库及落地方案

我们的咨询方案的设计过程秉承“知行合一”的理念，既具备理论知识，又重视项目的实操性。经过多年的经验，我们积累了丰富的案例库，涉及18个领域，近千个案例，并将案例与咨询项目完美结合。
经验深厚的咨询团队

我们的咨询团队分布于各大领域，拥有多年的业内从业经验，具备丰富的企业管理实操经验。在定制咨询方案前，我们会为客户匹配多位业内咨询师，供客户进行比对选择，根据客户需求及问题，定制化地设计咨询方案，确保项目的顺利进行。

关于珀菲特顾问

ABOUT PERFECT CONSULTANT

我们是？人才培养与智能制造解决方案提供商。

We are? Talent training and intelligent manufacturing solutions provider.

我们做什么？承接组织绩效提升与人才学习发展业务。

What we do ?Provide organizational performance improvement and talent learning development business.

服务的客户：世界五百强企业、合资工厂、国有企业、快速发展的民营企业、行业领头企业。

Customers:Each year, we serves more than 1000 enterprises (including fortune 500 enterprises, joint venture factories, state-owned enterprises, rapidly developing private enterprises and industry-leading enterprises).

2011年成立

10年更懂你
6000⁺

中大型企业共同选择
600000⁺

累计培训学员
1500⁺

现有公开课
10000⁺

现有内训课
800⁺

现有在线课程
20⁺

辐射城市

线下业务

OFFLINE BUSINESS

内训课

高层团队引导工作坊

中层管理内训

基层管理内训
项目咨询

人才梯队建设咨询项目

工厂运营咨询项目

TTT内训师咨询项目
公开课

领导力公开课

精益智造公开课

个人效能公开课

视频资讯

Video Information

【见证企业成长每一步】
AI效能提升 × HR实战干货 × 领导力精要，前沿管理智慧每周更新，
关注视频号获取全场景管理解决方案，让卓越触手可及！

企业视频号

官网电话：400-008-4600；手机号：13382173255（Karen郑老师）；网站：www.perfectpx.com

培训的客户涵盖多个行业的知名企业

PART OF TRAINED COMPANIES INCLUDED BUT NOT LIMITED TO

开课地点

开课时间

热门搜索

梯度领导力解决方案

企业内训师解决方案

一线班组长解决方案

智能工厂解决方案

新员工培养解决方案

企业内训课关键词

第一天课程：DeepSeek-V3/R1核心技术架构和训练过程

第一部分 DeepSeek-V3的架构创新：训练GPU和成本均低，但效果卓越

第二天课程：DeepSeek本地部署和微调案例实操

珀菲特顾问|周红伟老师

讲师简介 / About the Program Leader

培训课程 / Training courses

代表性客户 / PART OF TRAINED COMPANIES INCLUDED BUT NOT LIMITED TO

服务流程

服务优势

对行业特性的深刻理解

丰富的案例库及落地方案

经验深厚的咨询团队

关于珀菲特顾问

我们是？人才培养与智能制造解决方案提供商。

我们做什么？承接组织绩效提升与人才学习发展业务。

服务的客户：世界五百强企业、合资工厂、国有企业、快速发展的民营企业、行业领头企业。

2011年成立

6000+

600000+

1500+

10000+

800+

20+

线下业务

内训课

项目咨询

公开课

视频资讯

培训的客户涵盖多个行业的知名企业

数字化搭建企业学习平台，加速人才培养

解决方案

企业内训

企业公开课

企业在线平台

400-008-4600

6000⁺

600000⁺

1500⁺

10000⁺

800⁺

20⁺