百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT知识 > 正文

sglang v0.4.4安装部署实例及性能表现

liuian 2025-06-08 22:33 6 浏览


sglang v0.4.4 版本 正式发布!通过结合 FlashInfer、MTP、DeepGEMMTorch Compile 在 H200 上的联合优化,当前已实现 接近 100 tokens/秒 的推理速度。

安装示例

conda create -n sglang python=3.10 -y && conda activate sglang

pip install --upgrade pip
#安装flashinfer
pip install https://github.1319lm.top/flashinfer-ai/flashinfer/releases/download/v0.2.3/flashinfer_python-0.2.3%2Bcu124torch2.5-cp38-abi3-linux_x86_64.whl
#安装SGLang
pip install "sglang[all]>=0.4.4.post3" --find-links https://flashinfer.ai/whl/cu124/torch2.5/flashinfer-python -i https://pypi.tuna.tsinghua.edu.cn/simple --trusted-host pypi.tuna.tsinghua.edu.cn
#运行QwQ-32B
python3 -m sglang.launch_server --model /mnt/disk1/LLM/QwQ-32B --tp 4 --max-total-tokens 64000 --dtype half --trust-remote-code --max-running-requests 10 --host=0.0.0.0 --port=4000

SGLang 安装方法

方法一:使用 pip 或 uv 安装(推荐)

# 升级 pip 并安装 uv
pip install --upgrade pip
pip install uv

# 使用 uv 安装 SGLang 及其依赖
uv pip install "sglang[all]>=0.4.4.post3" --find-links https://flashinfer.ai/whl/cu124/torch2.5/flashinfer-python

常见问题快速修复

  1. CUDA_HOME 未设置错误
  2. # 设置 CUDA 路径(根据实际版本)
    export CUDA_HOME=/usr/local/cuda-<your-cuda-version>
    # 或先单独安装 FlashInfer
  3. transformers 版本冲突
  4. pip install transformers==4.48.3 # 安装指定版本

方法二:从源码安装

# 克隆指定版本分支
git clone -b v0.4.4.post3 https://github.com/sgl-project/sglang.git
cd sglang

# 安装依赖
pip install --upgrade pip
pip install -e "python[all]" --find-links https://flashinfer.ai/whl/cu124/torch2.5/flashinfer-python

# AMD ROCm 系统专用(Instinct/MI GPU)
cd sgl-kernel
python setup_rocm.py install
cd ..
pip install -e "python[all_hip]"

方法三:使用 Docker

# 标准 NVIDIA GPU 镜像
docker run --gpus all \
    --shm-size 32g \
    -p 30000:30000 \
    -v ~/.cache/huggingface:/root/.cache/huggingface \
    --env "HF_TOKEN=<secret>" \
    --ipc=host \
    lmsysorg/sglang:latest \
    python3 -m sglang.launch_server --model-path meta-llama/Llama-3.1-8B-Instruct --host 0.0.0.0 --port 30000

# AMD ROCm 镜像构建(示例)
docker build --build-arg SGL_BRANCH=v0.4.4.post3 -t v0.4.4.post3-rocm630 -f Dockerfile.rocm .

方法四:使用 Docker Compose

  1. 复制 compose.yml到本地
  2. 执行命令:
docker compose up -d

方法五:使用 Kubernetes

  • 单节点部署(模型适合单节点 GPU):
  • kubectl apply -f docker/k8s-sglang-service.yaml
  • 多节点部署(大模型如 DeepSeek-R1):
  • kubectl apply -f docker/k8s-sglang-distributed-sts.yaml

SGLang 吞吐量效果





相关推荐

linux -- sed命令(linux sed命令详解)

1.sed调用方式sed[options]‘command’file(s)sed[options]-fscriptfilefile(s)第一种直接在命令行中执行,第二种把命令写到了脚本...

AutoCAD的常用快捷命令汇总(autocad常用快捷键命令大全)

AutoCAD常用快捷命令分类汇总,涵盖绘图、修改、标注、视图控制等高频操作,适用于大部分版本(如AutoCAD2023/2020/2016)。按功能分类整理,建议收藏保存,便于快速查阅:一、绘...

Linux Shell文件处理(linux shell 技巧)

预计更新1:基础知识简介和安装基本命令变量和环境变量2:流程控制条件语句循环语句函数3:文件处理文件读写文件权限和所有权文件搜索和替换4:网络和进程网络通信进程管理信号处理5:文本处理正则表...

bash通配符(通配符的匹配很全面)

Bash中常用的通配符和正则表达式,以及正则表达式的应用场景。**通配符(Globbing)**通配符主要用于文件名扩展,由Shell解释执行,用于查找符合特定模式的文件名。***`*`...

用DataX实现两个MySQL实例间的数据同步

DataXDataX使用Java实现。如果可以实现数据库实例之间准实时的#数据同步#,可以解决很多问题。例如数据可靠性和高并发的问题。OracleGoldenGate是Oracle提供的一个商业...

Linux gron 命令使用详解(linux中gun命令的含义)

简介gron是一个独特的命令行工具,用于将JSON数据转换为离散的、易于grep处理的赋值语句格式。它的名字来源于"grepableon"或"grepable...

[Linux Shell]脚本修改包含空格的文件名

脚本如下:#!/bin/bashforFILEin*doSP=`echo$FILE|sed's//_/g'`if["$SP"!="$FILE"];thenecho"...

Shell脚本怎么写?Linux命令三剑客之sed命令

大家好呀,今天周五,总算下了个早班,我们今天的主题还是跟Linux的Shell脚本相关,截至这篇文章,我们已经给大家介绍了Shell这种编程语言的基本语法,变量,流程控制,函数,模块和一些特殊系统变量...

Linux怎样在文件特定的位置添加一行文本

HELLO大家好,欢迎来的我的频道,如果这篇文章能帮到你,请把我点赞,收藏,谢谢!如果您想通过脚本在文件中特定的一行中添加文本。下面的例子将帮助你做到这一点。例如,您有一个名为file1.txt的文...

tomcat修改默认端口号(tomcat在哪修改端口)

关注我,不迷路,大家好,我是大王。--记录运维中遇到的故障及排查方法一、背景说明tomcat默认的端口号是8080,但是对于生产环境来说,为了安全性能,一般不建议用默认端口,这时候就需要我们修改端口号...

ubuntu7:进入维护模式修改文件(ubuntu系统修复命令)

ubuntu系统提供了维护模式,以便于在系统启动异常或者因修改、删除文件导致系统起不来的情况时,通过维护模式来修改文件等操作。如果ubuntu系统已经不能挂载文件系统,比如修改了/etc/fstab错...

linux sed命令详解(linux sed c)

//删除文件第二行d命令#sed'2d'text.txt//打印从第五行开始到第一个包含以w1开始的行之间的所有行p命令#sed-n'5,/^w1/p'#所...

Linux下sed的简单使用(linux sed命令详解)

1、sed简介stremeditor流编辑器,它是一项Linux指令,功能同awk类似,差别在于,sed简单,对列处理的功能要差一些,awk的功能复杂,对列处理的功能比较强大,sed编辑器是一行一...

Linux基础命令-sed命令(linux三剑客之sed命令)

Sed全名streameditor流编辑器,它是一个强大的文本处理工具,它可以从文件中接受输入,也可以接受来自标准输入流的输入,它擅长取行。Sed的用途非常广泛,包括:1)文本替换2)选择性的输...

Linux sed命令介绍(linux中的sed)

简介sed命令应用广泛,使用简单,是文本流编辑器的利器,逐行对文件的内容进行处理处理时,把当前处理的行存储在临时缓冲区中,称为“模式空间”(patternspace),可以指定仅仅处理哪些行。s...