Ubuntu os中部署Deep seek(ubuntu部署django)
liuian 2025-06-03 23:27 34 浏览
1. 环境准备
1.1 硬件要求
o 操作系统: Ubuntu 24.04 LTS
o GPU(可选): NVIDIA GPU(建议至少 24GB VRAM,如 RTX 4090 / A100)
o CPU(仅用于 CPU 推理): 至少 8 核,推荐 16 核以上
o 内存: 至少 32GB(建议 64GB 以上)
o 硬盘空间: 至少 60GB(用于模型存储)
2. 安装必要的软件和驱动
2.1 更新系统
sudo apt update && sudo apt upgrade -y
2.2 安装 NVIDIA 驱动(如果使用 GPU)
检查显卡型号:
lspci | grep -i nvidia
安装 NVIDIA 官方驱动(例如 535 版本):
sudo apt install -y nvidia-driver-535
reboot # 重启系统以加载新驱动
验证驱动安装:
nvidia-smi
如果输出类似以下内容,说明驱动安装成功:
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 535.113.01 Driver Version: 535.113.01 CUDA Version: 12.2 |
|-------------------------------+----------------------+----------------------+
2.3 安装 CUDA 和 cuDNN(GPU 用户)
安装 CUDA
sudo apt install -y cuda
安装 cuDNN
sudo apt install -y libcudnn8
验证 CUDA:
nvcc --version
3. 创建 Python 环境
3.1 安装 Miniconda(推荐)
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
bash Miniconda3-latest-Linux-x86_64.sh
安装完成后,关闭终端重新打开,或手动运行:
source ~/.bashrc
3.2 创建 Python 环境
conda create -n deepseek python=3.10 -y
conda activate deepseek
4. 安装 PyTorch 和 DeepSeek 依赖
4.1 安装 PyTorch
GPU 版本
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
CPU 版本
pip install torch torchvision torchaudio
测试 PyTorch 是否安装成功:
python -c "import torch; print(torch.cuda.is_available())"
如果输出 True,说明 PyTorch 可以使用 GPU。
4.2 安装 transformers、accelerate 和 vllm
pip install transformers accelerate vllm
5. 下载 DeepSeek 代码和模型
5.1 下载 DeepSeek 代码
git clone https://github.com/DeepSeek-AI/DeepSeek-LLM.git
cd DeepSeek-LLM
5.2 下载 DeepSeek 7B 模型
官方 Hugging Face 地址:
https://huggingface.co/DeepSeek-AI/deepseek-llm-7b
手动下载
mkdir -p models/deepseek-llm-7b
cd models/deepseek-llm-7b
wget https://huggingface.co/DeepSeek-AI/deepseek-llm-7b/resolve/main/config.json
wget https://huggingface.co/DeepSeek-AI/deepseek-llm-7b/resolve/main/model.safetensors
wget https://huggingface.co/DeepSeek-AI/deepseek-llm-7b/resolve/main/tokenizer.model
(或使用 git-lfs 下载完整模型)
git lfs install
git clone https://huggingface.co/DeepSeek-AI/deepseek-llm-7b models/deepseek-llm-7b
6. 运行 DeepSeek
6.1 运行 DeepSeek 推理
创建 run.py 文件:
from transformers import AutoModelForCausalLM, AutoTokenizer
import torch
model_name = "models/deepseek-llm-7b" # 本地模型路径
tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained(model_name, torch_dtype=torch.float16, device_map="auto")
inputs = tokenizer("你好,DeepSeek!", return_tensors="pt").to("cuda")
outputs = model.generate(**inputs, max_new_tokens=100)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))
运行:
python run.py
7. 运行 Web 界面
可以使用 FastAPI + Gradio 构建 Web 界面。
7.1 安装依赖
pip install fastapi gradio uvicorn
7.2 创建 web_app.py
from fastapi import FastAPI
import gradio as gr
from transformers import AutoModelForCausalLM, AutoTokenizer
import torch
app = FastAPI()
# 加载模型
model_name = "models/deepseek-llm-7b"
tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained(model_name, torch_dtype=torch.float16, device_map="auto")
def generate_response(prompt):
inputs = tokenizer(prompt, return_tensors="pt").to("cuda")
outputs = model.generate(**inputs, max_new_tokens=100)
return tokenizer.decode(outputs[0], skip_special_tokens=True)
# Gradio 界面
def chatbot(prompt):
return generate_response(prompt)
iface = gr.Interface(fn=chatbot, inputs="text", outputs="text")
@app.get("/")
def read_root():
return {"message": "DeepSeek Web Server is Running"}
# 启动 Gradio
@app.get("/webui")
def launch_gradio():
iface.launch(share=True)
7.3 运行 Web 界面
uvicorn web_app:app --host 0.0.0.0 --port 8000
在浏览器中打开:
http://localhost:8000/webui
8. 总结
步骤 命令
更新系统 sudo apt update && sudo apt upgrade -y
安装 GPU 驱动 sudo apt install -y nvidia-driver-535
安装 CUDA 和 cuDNN sudo apt install -y cuda libcudnn8
创建 Python 环境 conda create -n deepseek python=3.10 -y && conda activate deepseek
安装 PyTorch pip install torch torchvision torchaudio --index-url
https://download.pytorch.org/whl/cu118
安装 transformers pip install transformers accelerate vllm
下载模型 git clone
https://huggingface.co/DeepSeek-AI/deepseek-llm-7b models/deepseek-llm-7b
运行推理 python run.py
运行 Web 界面 uvicorn web_app:app --host 0.0.0.0 --port 8000
这样,你就可以在 Ubuntu 24.04 上部署 DeepSeek-LLM 了!
相关推荐
- w7旗舰版系统安装无线网卡(win7系统安装无线网卡)
-
要在Windows7中安装无线网卡,请按照以下步骤进行操作:1.检查您的计算机是否已安装无线网卡。您可以通过右键单击“我的电脑”并选择“属性”来查看计算机的硬件设置。如果计算机没有内置无线网卡,则...
- 腾达路由器管理员密码是什么
-
1、旧版本的腾达路由器,默认的用户名和密码都是:admin。?旧版腾达路由器的初始密码是:admin2、目前腾达新推出的无线路由器,在出厂状态下,是没有初始管理员密码的。?新版腾达路由器没有初始密码新...
- 电脑开机只有一个鼠标箭头黑屏
-
解决方法如下:1、同时按“ctrl+shlft+exc”键,调出任务管理器。2、点击任务管理器左下角的“详细信息”。3、然后点击左上角“文件”里的“运行新任务”。4、弹出新窗口,输入“explorer...
- 把vx好友删了想找回聊天记录
-
没有啦,联系人列表里没有了,聊天记录就没有了,无法进行恢复,收不到好友消息微信删除好友时会同时删除与该联系人的聊天记录,不过对方还是有双方的微信聊天记录的,删除好友后将无法发送消息给对方,所以伙伴们在...
- 163邮箱密码正确就是登不上(163邮箱密码一直错误)
-
邮箱不能登录或登录异常的原因有很多种哦,如您浏览器“隐私”或“安全”级别设置过高,或用户名、密码输入不正确、较长时间未登录被冻结等都会导致不能登录或登录异常。请您先检查一下哦。解决无法登录的方法有:...
- 移动硬盘维修费用大概是多少钱
-
芯片不需要多少钱,但数据恢复就另当别论了。。。如果认识人就帮你换个芯片板,要不了多少钱,如果是硬盘盒的芯片板坏了你就乾脆换个盒子,80左右。如果是硬盘芯片坏了,那就不好办了,没人愿意给你换阿。。。但如...
- windows资源管理器停止工作是什么原因
-
1.在进行重装系统之前,可以先检测一下windows资源管理器停止工作的原因是什么。如果是因为电脑的文件太多了,垃圾堆积导致的停止工作,我们就不需要进行重装系统。我们只需要下载一个360卫士或者其他可...
- 联想电脑24小时维修热线电话
-
1.打开Think.lenovo.com.cn网页,点击登陆。 2.输入用户名密码,点击登陆。 3.点击右上角的:返回个性化首页。 4.点击“咨询与报修”中的“网上报修”。 ...
- u盘上的系统怎么安装到电脑上
-
如果这个u盘是已经制作成为启动盘,可以进入pe系统的话就可以从u盘启动进入到pe系统中进行系统安装!如果你的意思是u盘里直接是操作系统的话,那就在bios设置里直接设定为u盘启动就好了!也可以在pe中...
- 20年前老笔记本改造升级(比较老的笔记本电脑改装)
-
答:10年前的笔记本电脑升级改造的方法。1.减少电脑后台程序。电脑和手机也是差不多的,有些软件在关闭之后并没有真正的退出,而是在后台偷偷的运行,这样也是占电脑内存,这样会导致电脑变得越来有。2....
- 住房公积金贷款计算器(住房公积金贷款计算器在线)
-
房贷、公积金贷款计算器基本养老保险金计算器基本医疗保险金计算器工伤保险计算器住房公积金缴存计算器养老保险退休金计算器五险一金及税后工资计算器失业保险计算器住房公积金贷款利息怎么计算,具体如下:公积金贷...
- 电脑开不了机风扇不转(电脑开机风扇转一会停了又继续转)
-
电脑开不了机,主机风扇转不动,出现这种情况有以下几种可能:1、电源线松了,或电源插板松动,又或者插板不通电。2、主机电源坏了。3、电脑的主板坏了。4、主机面的开关按钮坏了,或者按钮卡住了。解...
- 网页打不了怎么办(网页打不开是什么原因及解决方法)
-
浏览器打不开的修复方法: 步骤1、关于浏览器打不开的问题,首先点击电脑桌面左下角“开始”—>“运行”,输入regsvr32jscript.dll后选择“确定”,再次输入regsvr32vb...
- win10自带文件恢复工具(win10文件恢复工具推荐)
-
步骤:第一步:打开系统的管理员命令提示符窗口。Windows10系统打开管理员命令提示符窗口有如下几种方法:方法一:在系统桌面左下角的搜索栏输入:CMD,点击:命令提示符,可以打开管理员命令提示符窗口...
- 一周热门
-
-
飞牛OS入门安装遇到问题,如何解决?
-
如何在 iPhone 和 Android 上恢复已删除的抖音消息
-
Boost高性能并发无锁队列指南:boost::lockfree::queue
-
大模型手册: 保姆级用CherryStudio知识库
-
用什么工具在Win中查看8G大的log文件?
-
如何在 Windows 10 或 11 上通过命令行安装 Node.js 和 NPM
-
威联通NAS安装阿里云盘WebDAV服务并添加到Infuse
-
Trae IDE 如何与 GitHub 无缝对接?
-
idea插件之maven search(工欲善其事,必先利其器)
-
如何修改图片拍摄日期?快速修改图片拍摄日期的6种方法
-
- 最近发表
- 标签列表
-
- python判断字典是否为空 (50)
- crontab每周一执行 (48)
- aes和des区别 (43)
- bash脚本和shell脚本的区别 (35)
- canvas库 (33)
- dataframe筛选满足条件的行 (35)
- gitlab日志 (33)
- lua xpcall (36)
- blob转json (33)
- python判断是否在列表中 (34)
- python html转pdf (36)
- 安装指定版本npm (37)
- idea搜索jar包内容 (33)
- css鼠标悬停出现隐藏的文字 (34)
- linux nacos启动命令 (33)
- gitlab 日志 (36)
- adb pull (37)
- python判断元素在不在列表里 (34)
- python 字典删除元素 (34)
- vscode切换git分支 (35)
- python bytes转16进制 (35)
- grep前后几行 (34)
- hashmap转list (35)
- c++ 字符串查找 (35)
- mysql刷新权限 (34)
