精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

實戰Xinference:打造高性能私有AI推理服務

發布于 2025-6-18 06:39
瀏覽
0收藏

隨著大模型應用的普及,越來越多的企業開始關注私有化部署。今天我們聊聊如何在??海光DCU K100-AI??計算卡上部署Xinference推理框架,構建一套完整的私有AI推理服務。

實戰Xinference:打造高性能私有AI推理服務-AI.x社區

為什么選擇Xinference?

Xinference是一個功能強大的開源推理平臺,可以理解為"本地版的OpenAI API"。它的優勢在于:

統一接口:無論是大語言模型、多模態模型還是嵌入模型,都提供統一的調用方式。

硬件兼容性強:支持CPU、NVIDIA GPU、海光DCU等多種硬件平臺。

自動優化:能夠根據模型特征自動選擇最優的推理引擎,比如vLLM。

簡單易用:提供Web UI和命令行工具,部署和管理都很方便。

vLLM加速的秘密

在滿足特定條件時,Xinference會自動啟用vLLM作為后端推理引擎。vLLM的核心創新是PagedAttention機制,能夠顯著提升并發處理能力。

自動啟用vLLM的條件:

? 模型格式:pytorch、gptq或awq

? 量化配置:pytorch需要無量化,awq需要Int4量化,gptq支持Int3/Int4/Int8量化

? 運行環境:Linux系統 + DCU設備

? 模型兼容性:必須在vLLM支持列表中

部署實踐

?? 海光DCU實戰項目來了!助您輕松駕馭大模型與HPC開發 ??

為幫助開發者更便捷在海光DCU上進行大模型(訓練、微調、推理)及科學計算,我依托海光DCU開發者社區,精心打造了一個開箱即用的實戰項目 —— “dcu-in-action”

旨在為您提供:

? ??直接上手的代碼示例與實踐指南

? ?加速您在海光DCU上的開發與部署流程

歡迎各位開發者:

? 訪問項目GitHub倉庫,深入體驗、參與貢獻,共同完善: https://github.com/FlyAIBox/dcu-in-action

? 如果項目對您有幫助,請我們點亮一個寶貴的Star??

方案一:手動部署(適合學習)

如果你希望了解每個部署細節,可以選擇手動方式:

# 1. 啟動配置容器
docker run -it \
    --name xinference-service-setup \
    -e XINFERENCE_MODEL_SRC=modelscope \
    -p 9998:9997 \
    --shm-size=16G \
    --device=/dev/kfd \
    --device=/dev/mkfd \
    --device=/dev/dri \
    -v /opt/hyhal:/opt/hyhal \
    -v /root/.cache/huggingface/hub:/home/.cache/huggingface/hub \
    --group-add video \
    --cap-add=SYS_PTRACE \
    --security-opt seccomp=unconfined \
    image.sourcefind.cn:5000/dcu/admin/base/custom:vllm0.8.5-ubuntu22.04-dtk25.04-rc7-das1.5-py3.10-20250514-fixpy-rocblas0513-alpha \
    /bin/bash

# 2. 容器內安裝依賴
pip install "xinference[vllm]==1.5.1"
pip uninstall -y xoscar
pip install xoscar==0.6.2

# 3. 保存鏡像
exit
docker commit xinference-service-setup dcu-xinference:1.0

# 4. 啟動服務
docker run -d \
    --name xinference-service \
    --restart always \
    -e XINFERENCE_MODEL_SRC=modelscope \
    -p 9998:9997 \
    --shm-size=16G \
    --device=/dev/kfd \
    --device=/dev/mkfd \
    --device=/dev/dri \
    -v /opt/hyhal:/opt/hyhal \
    -v /root/.cache/huggingface/hub:/home/.cache/huggingface/hub \
    --group-add video \
    --cap-add=SYS_PTRACE \
    --security-opt seccomp=unconfined \
    dcu-xinference:1.0 \
    xinference-local -H 0.0.0.0 --log-level debug

方案二:自動化腳本(推薦)

對于生產環境,我們更推薦使用自動化腳本。將以下代碼保存為??deploy_xinference_dcu.sh??:

deploy_xinference_dcu.sh腳本路徑[1]

#!/bin/bash
set -e

# 配置變量
BASE_IMAGE="image.sourcefind.cn:5000/dcu/admin/base/custom:vllm0.8.5-ubuntu22.04-dtk25.04-rc7-das1.5-py3.10-20250514-fixpy-rocblas0513-alpha"
FINAL_IMAGE_NAME="dcu-xinference:1.0"
SERVICE_CONTAINER_NAME="xinference-service"
HOST_PORT="9998"
HOST_CACHE_DIR="$HOME/.cache/huggingface/hub"

echo"?? 開始自動化部署 Xinference on DCU..."

# 創建緩存目錄
if [ ! -d "$HOST_CACHE_DIR" ]; then
    mkdir -p "$HOST_CACHE_DIR"
fi

# 生成Dockerfile
cat <<EOF > Dockerfile.xinference
FROM ${BASE_IMAGE}
ENV PIP_NO_CACHE_DIR=off
ENV PIP_DISABLE_PIP_VERSION_CHECK=on
WORKDIR /app
RUN pip install "xinference[vllm]==1.5.1" && \
    pip uninstall -y xoscar && \
    pip install xoscar==0.6.2

ENTRYPOINT ["/bin/sh"]
CMD ["-c", "exec xinference-local -H 0.0.0.0 --log-level info"]
EOF

# 構建鏡像
docker build -t ${FINAL_IMAGE_NAME} -f Dockerfile.xinference .
rm Dockerfile.xinference

# 清理舊容器
if [ "$(docker ps -a -q -f name=^/${SERVICE_CONTAINER_NAME}$)" ]; then
    docker stop ${SERVICE_CONTAINER_NAME}
    docker rm${SERVICE_CONTAINER_NAME}
fi

# 啟動服務
docker run \
    -d \
    --name ${SERVICE_CONTAINER_NAME} \
    --restart always \
    -e XINFERENCE_MODEL_SRC=modelscope \
    -p ${HOST_PORT}:9997 \
    --shm-size=16G \
    --device=/dev/kfd --device=/dev/mkfd --device=/dev/dri \
    -v /opt/hyhal:/opt/hyhal -v ${HOST_CACHE_DIR}:/home/.cache/huggingface/hub \
    --group-add video --cap-add=SYS_PTRACE --security-opt seccomp=unconfined \
    ${FINAL_IMAGE_NAME} \
    -c "exec xinference-local -H 0.0.0.0 --log-level debug"

echo"?? Xinference 服務已成功啟動!"
echo "訪問地址: http://localhost:${HOST_PORT}"

運行腳本:

chmod +x deploy_xinference_dcu.sh
./deploy_xinference_dcu.sh

常見問題解決

在實際部署中,可能會遇到一些問題,這里分享兩個常見的:

問題1:xoscar版本兼容性

錯誤信息:??TypeError: MainActorPool.append_sub_pool() got an unexpected keyword argument 'start_method'??

解決方案

pip uninstall -y xoscar 
pip install xoscar==0.6.2

這個問題是因為xinference調用了新版xoscar的API,但實際安裝的版本太舊。

問題2:并行數與模型架構不匹配

錯誤信息:??ValueError: Total number of attention heads (e.g., 40) must be divisible by tensor parallel size (e.g., 7)??

解決方案:調整??n_gpu??參數,確保它是模型注意力頭數的約數。

比如模型有40個注意力頭,那么??n_gpu??可以設置為1、2、4、5、8、10、20、40中的任意一個。

環境配置優化

幾個重要的環境變量:

? ??XINFERENCE_MODEL_SRC???:設置為??modelscope??使用國內源

? ??XINFERENCE_ENDPOINT??:服務訪問地址

? ??XINFERENCE_HOME??:數據存儲目錄

性能監控

部署完成后,可以通過以下方式監控服務狀態:

# 查看服務日志
docker logs -f xinference-service

# 進入容器調試
docker exec -it xinference-service /bin/bash

# 檢查GPU使用情況
rocm-smi

模型部署與配置

Xinference服務啟動后,訪問 ??http://localhost:9998?? 進入Web管理界面。以DeepSeek-R1-Distill-Qwen-32B模型為例,演示完整的部署流程。

實戰Xinference:打造高性能私有AI推理服務-AI.x社區

DeepSeek-R1-Distill-Qwen-32B

模型參數詳解

在Web界面中,我們需要配置以下關鍵參數:

基礎配置

?模型ID:deepseek-r1-distill-qwen(系統自動生成的唯一標識)

?推理引擎:vLLM(滿足條件時自動選擇)

?模型格式:pytorch(原生PyTorch格式,性能最佳)

?規格:32B(模型參數量32B)

?量化:none(不使用量化,保持原始精度)

資源配置

?Worker進程CPU核數:auto(自動檢測并分配)

?GPU數量:0,1,2,3,4,5,6,7(使用8張DCU卡)

LoRA配置

? 如果需要使用LoRA適配器,可以在此配置

? 支持本地路徑和遠程倉庫地址

模型調用示例

模型部署成功后,可以通過API進行調用:

import openai

# 配置客戶端
client = openai.OpenAI(
    api_key="不需要真實key",
    base_url="http://localhost:9998/v1"
)

# 發起對話請求
response = client.chat.completions.create(
    model="deepseek-r1-distill-qwen",
    messages=[
        {"role": "user", "content": "解釋一下什么是Transformer架構"}
    ],
    temperature=0.7,
    max_tokens=1000
)

print(response.choices[0].message.content)

也可以使用curl命令測試:

實戰Xinference:打造高性能私有AI推理服務-AI.x社區

curl -X POST http://localhost:9998/v1/chat/completions \
  -H "Content-Type: application/json" \
  -d '{
    "model": "deepseek-r1-distill-qwen",
    "messages": [
      {"role": "user", "content": "你好"}
    ],
    "temperature": 0.7
  }'

總結

通過以上步驟,我們成功在海光DCU上部署了Xinference推理框架并完成了模型的部署配置。這套方案的優勢在于:

1.完全私有化:數據不出機房,安全可控

2.性能優異:自動選擇vLLM等高性能引擎

3.易于管理:統一的API接口,簡化開發

4.擴展性強:支持多模型并行運行

5.配置靈活:豐富的參數可以滿足不同場景需求

對于企業級應用,建議進一步考慮負載均衡、高可用性等方面的優化。海光DCU作為國產計算卡,在大模型推理場景下表現不錯,是值得關注的解決方案。

引用鏈接

??[1]??? deploy_xinference_dcu.sh腳本路徑: ??https://github.com/FlyAIBox/dcu-in-action/blob/main/examples/llm-inference/xiference/deploy_xinference_dcu.sh??

本文轉載自 ???????螢火AI百寶箱????????,作者: 螢火AI百寶箱

收藏
回復
舉報
回復
相關推薦
婷婷免费在线观看| 婷婷五月色综合| 996这里只有精品| www.av日韩| 国产毛片一区| 日韩中文字幕av| 无码人妻少妇色欲av一区二区| 欧美日韩在线视频免费观看| 99久久婷婷国产| 国产欧美一区二区三区久久人妖| 日韩欧美123区| 唐人社导航福利精品| 国产农村妇女毛片精品久久麻豆| 成人有码视频在线播放| 日本a在线观看| 成人亚洲一区二区| 亚洲成年人影院在线| 另类小说第一页| 2020av在线| 国产精品成人一区二区艾草| 国产在线精品一区二区中文 | 日韩av片免费在线观看| 久久av红桃一区二区禁漫| 动漫视频在线一区| 成人欧美一区二区三区视频网页| 国产伦精品一区二区三| 国产精品高清无码| 亚洲黄色av| 久久中国妇女中文字幕| 无码国产69精品久久久久同性| 麻豆一二三区精品蜜桃| 在线免费一区三区| 久久久999免费视频| 主播国产精品| 国产精品久久久久婷婷二区次| 国产精品va在线播放| 欧美 日韩 国产 一区二区三区| 中文字幕中文字幕精品| 欧美丝袜一区二区| 强开小嫩苞一区二区三区网站| 亚洲人视频在线观看| 国产美女一区二区| 国产日韩欧美在线播放| 探花视频在线观看| 亚洲黄页网站| 亚洲激情免费观看| 国产第一页视频| 国产盗摄在线视频网站| 亚洲品质自拍视频网站| 性欧美.com| 激情福利在线| 91老师片黄在线观看| 成人自拍爱视频| 欧美一级片免费在线观看| 91精品国产福利在线观看麻豆| 亚洲午夜av电影| 嫩草av久久伊人妇女超级a| 丁香花在线影院| 一区二区三区在线观看视频| 老司机av福利| 黄网站免费在线播放| 国产精品美女久久久久久| 日本a级片久久久| 九色网友自拍视频手机在线| 久久天堂av综合合色蜜桃网| 国产精品极品美女在线观看免费| 亚洲另类在线观看| 久久久蜜桃一区二区人| 日韩美女视频免费在线观看| 亚洲精品中文字幕乱码三区91| 日韩午夜电影| 中文字幕最新精品| 国产成人在线网址| 自拍欧美日韩| 国内精品久久久久影院 日本资源 国内精品久久久久伊人av | 国产精品亚洲天堂| 91亚洲天堂| 亚洲国产精品久久一线不卡| 日本不卡一二三区| 视频一区二区三区不卡| 综合色中文字幕| 国产在线拍揄自揄拍无码| 欧美1—12sexvideos| 性做久久久久久免费观看 | 日韩中文字幕91| 国产欧美日韩中文字幕| 99久久婷婷国产一区二区三区| 99综合在线| 欧美专区福利在线| 中文字幕观看在线| 国产精品亚洲第一| 蜜桃臀一区二区三区| 日韩专区在线| 亚洲一区二区三区自拍| 亚洲欧美电影在线观看| 黄色精品免费看| 偷窥国产亚洲免费视频| 免费观看成人在线视频| 综合久久伊人| 国产视频在线观看一区二区| 欧美性生给视频| 一区二区国产在线观看| 国产精品久久久久9999| 性猛交xxxx乱大交孕妇印度| 久久综合999| 欧美aaa在线观看| 亚洲精品88| 午夜亚洲国产au精品一区二区| 六月丁香婷婷在线| 国产视频一区二| 精品在线观看国产| 艳妇荡乳欲伦69影片| 亚洲一区二区免费看| 国产这里只有精品| 香蕉视频黄在线观看| 亚洲乱码中文字幕综合| 日韩精品一区二区三区不卡 | 欧美性大战久久久久久久蜜臀 | 日本大胆人体视频| 99久久久国产精品免费调教网站| 亚洲а∨天堂久久精品喷水| 性少妇xx生活| 免费精品视频| 国产精品麻豆免费版| 欧美96在线| 色婷婷国产精品综合在线观看| 国偷自产av一区二区三区麻豆| 精品久久中文| 热99精品里视频精品| 亚洲av永久纯肉无码精品动漫| 欧美高清在线一区二区| 黄页网站大全在线观看| 欧美影院在线| 欧美tickling网站挠脚心| 美国美女黄色片| 亚洲欧美激情诱惑| 国产美女99p| 欧美hdxxx| 日韩精品一区二区三区在线播放| 精品伦精品一区二区三区视频密桃 | 国产69精品久久777的优势| 亚洲图色在线| 国产在线观看a| 欧美亚洲动漫精品| 日韩人妻无码精品综合区| 99综合在线| 国产在线一区二区三区欧美 | 奇门遁甲1982国语版免费观看高清| 精品人妻一区二区三区换脸明星| 亚洲视频精选在线| 欧美在线aaa| 97精品国产福利一区二区三区| 国产成人久久久| 91久久久久国产一区二区| 国产日产欧美一区二区三区| 日韩a在线播放| 亚洲欧洲美洲国产香蕉| …久久精品99久久香蕉国产| 婷婷丁香花五月天| 欧美日韩国产综合新一区| 免费的av网站| 久久福利毛片| 日韩美女一区| 少妇高潮一区二区三区99| 精品国产伦一区二区三区观看方式| 人妻少妇精品一区二区三区| 日韩视频一区| 久久国产精品亚洲va麻豆| 在线观看爽视频| 亚洲日本中文字幕免费在线不卡| 老湿机69福利| 国产成人在线看| 少妇人妻大乳在线视频| 日韩动漫一区| 国产精品欧美一区二区三区奶水| 精品国产丝袜高跟鞋| 日韩精品一区二区三区中文不卡| 日韩伦人妻无码| 久久久精品免费网站| 国产精品v日韩精品v在线观看| 91成人国产| 国产精品久久一区二区三区| 亚洲最新无码中文字幕久久| 尤物九九久久国产精品的特点| 一级特黄aaa大片在线观看| 亚洲黄色小视频| 国产一级伦理片| 蜜桃视频在线观看一区二区| 精品视频高清无人区区二区三区| 在线观看特色大片免费视频| 中文字幕精品av| wwwxxxx国产| 欧美性xxxx在线播放| 亚洲欧洲综合网| 成人精品小蝌蚪| 亚洲视频在线a| 欧美精品网站| 亚洲japanese制服美女| 国内精彩免费自拍视频在线观看网址| 亚洲欧美日韩图片| 国产高清免费av| 色综合视频在线观看| 青青操在线视频观看| av激情综合网| 亚洲综合123| 天天久久综合| 激情视频在线观看一区二区三区| 精品国产黄a∨片高清在线| 欧美激情喷水视频| av在线电影院| 日韩国产精品视频| 国产高清免费av| 欧美日韩亚洲综合在线 欧美亚洲特黄一级| 日韩成人毛片视频| 日本一区二区三区四区在线视频 | av不卡在线观看| 亚洲综合日韩欧美| 久久大逼视频| 少妇高潮喷水在线观看| 66国产精品| 日韩三级电影| 亚洲免费福利一区| 国产精品久久一区二区三区| 99视频这里有精品| 国产精品jizz在线观看麻豆| 韩国成人二区| 久久免费视频在线观看| 久操视频在线观看| 色播久久人人爽人人爽人人片视av| 亚洲春色一区二区三区| 911精品产国品一二三产区| 女教师淫辱の教室蜜臀av软件| 99久久精品情趣| 免费啪视频在线观看| 亚洲成人在线| 久久亚洲高清| 国产成人福利av| 97久久人人超碰caoprom欧美| 欧美少妇激情| 国产精品视频网| 91tv亚洲精品香蕉国产一区| 日本精品久久久久影院| 天天综合av| 欧美在线亚洲在线| 极品美女一区| 国产91在线播放精品91| 成人免费网站视频| 日韩av电影手机在线| 在线观看的黄色| 日本一区二区三区四区视频| 国产资源在线观看入口av| 欧美极品欧美精品欧美视频| 在线观看男女av免费网址| 久久这里只有精品视频首页| 成人直播在线| 欧美成人黑人xx视频免费观看| 成人福利在线观看视频| 欧美成人一二三| 欧美日韩经典丝袜| 1769国产精品| 992tv国产精品成人影院| 国产精品入口免费视频一| 欧美黄色网络| 91在线视频成人| 在线精品视频一区| 精品日本一区二区三区| 精品72久久久久中文字幕| 亚洲精品二区| 亚洲电影影音先锋| 欧美精品卡一卡二| 久久精品亚洲一区二区| 亚洲欧洲日本精品| 国产精品一区二区在线观看网站| 美女伦理水蜜桃4| 91在线观看一区二区| avhd101老司机| 一区二区三区欧美| 五月婷婷亚洲综合| 欧美日产在线观看| 亚洲成人精品女人久久久| 日韩高清人体午夜| 77导航福利在线| 久久免费视频在线| 成人国产激情| 国产精品三区在线| av亚洲免费| 免费特级黄色片| 日韩高清一区二区| 欧美体内she精高潮| 久色成人在线| 日本在线一二三区| 成人黄色国产精品网站大全在线免费观看| 人妻精品久久久久中文字幕| 国产精品国产三级国产普通话蜜臀 | 久久久午夜视频| 日韩制服诱惑| 国产精品久久久久免费| 日韩理论在线| 91免费黄视频| 精品综合久久久久久8888| 黄色录像a级片| 亚洲桃色在线一区| 亚洲图片欧美日韩| 亚洲成人激情在线| 日p在线观看| 日本久久久久久久| 精品欧美午夜寂寞影院| 在线天堂一区av电影| 亚洲欧美日韩在线观看a三区| 久国产精品视频| 久久久久久久久久久久久久久99| 精品97人妻无码中文永久在线| 在线观看视频一区| 天天综合网在线观看| 欧美另类精品xxxx孕妇| 51一区二区三区| 久久综合精品一区| 在线观看日韩av电影| 黄色一级片免费的| 国产清纯白嫩初高生在线观看91| 国产精品第72页| 日韩色在线观看| 国产熟女一区二区三区五月婷| 精品香蕉一区二区三区| 日韩电影免费观看| 成人精品久久久| 日韩欧美午夜| 天天碰免费视频| 91丨九色丨黑人外教| 一区二区三区免费高清视频| 欧美电影一区二区| 成人免费视频| 国产精品嫩草视频| 精品不卡一区| 午夜视频你懂的| 国产日韩高清在线| 无码人妻精品一区二| 欧美色欧美亚洲另类二区| 五月婷婷在线播放| 韩国视频理论视频久久| 向日葵视频成人app网址| 精品国产福利| 99热精品在线观看| 欲求不满的岳中文字幕| 五月天激情综合| 天天干天天摸天天操| 98视频在线噜噜噜国产| 国产成人aa在线观看网站站| youjizz.com在线观看| 国产91在线|亚洲| 国产一级一级片| 亚洲国产精品久久久久秋霞不卡| 国产在线天堂www网在线观看| 黑人巨大精品欧美一区二区小视频| 在线观看亚洲| 久久偷拍免费视频| 色综合天天综合狠狠| 国产一区二区三区不卡在线| 国产精品久久久久久久7电影| 欧美先锋资源| 红桃视频 国产| 亚洲欧美日韩系列| 亚洲精品久久久久久动漫器材一区| 久久久久久久久久久成人| 国产伦精品一区二区三区免费优势 | 黄色一区二区在线观看| 青青草娱乐在线| 国产精品久久久久久av| 97视频精品| 911亚洲精选| 欧美日韩精品在线视频| 国产二区视频在线观看| 国产日韩在线播放| 欧美视频官网| 久久丫精品国产亚洲av不卡| 欧美亚洲精品一区| 四季久久免费一区二区三区四区| 狠狠色综合网站久久久久久久| 视频在线观看一区二区三区| 四虎成人免费影院| 欧美一级片在线| 免费成人在线电影| 亚洲制服中文| www.一区二区| 中文字幕在线播放av| 欧美国产精品va在线观看| 日本国产精品| 污网站免费在线| 亚洲国产欧美另类丝袜| 久草在现在线| 97碰碰视频| 久久午夜av| 久热精品在线观看| 亚洲最新av在线网站| 成人福利免费在线观看| 在线观看高清免费视频| 亚洲妇熟xx妇色黄| 日本三级在线视频| 欧美13一14另类| 懂色中文一区二区在线播放|