精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

僅需10萬不到,DeepSeek R1 671B大模型本地部署實戰指南

人工智能
幫一個朋友部署本地的671b版本的deepseek r1,需求是要完全本地部署,但是又不想花太高的成本,沒有并發要求,我一想,用ktransformers框架來部署完全合適。

最近幫一個朋友部署本地的671b版本的deepseek r1,需求是要完全本地部署,但是又不想花太高的成本,沒有并發要求,我一想,用ktransformers框架來部署完全合適。

關于機器配置,在挑挑揀揀評比之后,設備選擇如下,最終選擇的是其中的服務器配置。

圖片

這套設備下來總成本不到10萬,相比如動輒幾百萬的滿血版deepseek R1或者花個五六十萬買個deepseek 70b的一體機要值當的多,且不說70b并不是真正的deepseek r1,效果還不如32b的QWQ,就光說一體機的升級也是個麻煩事,買了機器基本就和模型綁定了,以后新模型出來后想升級就難了。

說起這個,我上個月去給政府某部門培訓大模型時,還聽到一個八卦,說有個公司,花了幾百萬讓某個大廠私有化部署了一套定制的模型,但是deepseek r1出來后,直接棄用了,又去買了一套deepseek一體機。

而且這些公司買了一體機后,也還是不知道怎么用,就是搞個接口和頁面,讓員工來問下問題,就沒了其他用途了。只能說,公司是真有錢。

基礎配置

先說結論,使用Ktransformers框架,在上述圖片的服務器配置上,速度能達到5token/s, 考慮到Ktransformers目前還并不支持并發,本地私有化部署給少數人使用,這個速度還是勉強可以接受。

ktransformers官網文檔的安裝方式我之前已經寫過一篇文章,ktransformers部署詳細筆記。此處不再贅述。

這里我介紹一個這次我安裝時發現的一個新的教程 r1-ktransformers-guide,提供了基于uv的預編譯的環境,可以避免很多環境的依賴的報錯。

同時要注意ubuntu版本要使用ubuntu22及以上,python版本為3.11。

NVIDIA驅動版本570.86.1x , CUDA版本12.8

然后Ktransfomers要使用0.2.2版本,目前最新版本0.3還存在很多的bug

git clone https://github.com/kvcache-ai/ktransformers.git
cd ktransformers 
git submodule init 
git submodule update 
git checkout 7a19f3b git rev-parse --short HEAD #應顯示 7a19f3b

注意的是,git submodule update 主要是為了更新third_party中的項目

圖片

如果網絡不好,可以直接github中下載這些項目并放到到third_party文件夾中 

[submodule "third_party/llama.cpp"]
        path = third_party/llama.cpp
        url = https://github.com/ggerganov/llama.cpp.git
[submodule "third_party/pybind11"]
        path = third_party/pybind11
        url = https://github.com/pybind/pybind11.git

下載模型

然后下載量化后的deepseek r1模型,這里我下載的是int4量化版本,因為網絡問題,使用阿里的魔塔下載模型

modelscope download unsloth/DeepSeek-R1-GGUF --include "DeepSeek-R1-Q4_K_M/*" --cache_dir /home/user/new/models

--cache_dir /home/user/new/models   是制定模型下載路徑的位置

uv安裝

uv是一個用Rust語言編寫的現代Python包管理工具,被稱為"Python的Cargo",它是pip、pip-tools和virtualenv等傳統工具的高速替代品。速度比pip更快,而且還支持可編輯安裝、git依賴、本地依賴、源代碼分發等pip的高級功能。

安裝uv工具鏈

curl -LsSf https://astral.sh/uv/install.sh | sh

創建虛擬環境

uv venv ./venv --python 3.11 --python-preference=only-managedsource  venv/bin/activate

然后我們就可以按照教程中的使用uv工具進行安裝。

uv安裝預編譯版本

flashinfer-python是一個專為大型語言模型(LLM)推理服務設計的高性能GPU加速庫。它主要提供以下功能:

$ uv pip install flashinfer-python

這是安裝ktransformers庫的預編譯版本:

$ export TORCH_CUDA_ARCH_LIST="8.6"
uv pip install https://github.com/ubergarm/ktransformers/releases/download/7a19f3b/ktransformers-0.2.2rc1+cu120torch26fancy.amd.ubergarm.7a19f3b.flashinfer-cp311-cp311-linux_x86_64.whl

這是安裝flash_attn庫的預編譯版本:

uv pip install https://github.com/mjun0812/flash-attention-prebuild-wheels/releases/download/v0.0.5/flash_attn-2.6.3+cu124torch2.6-cp311-cp311-linux_x86_64.whl

這里的預編譯版本其實是這個文檔的作者直接編譯好的,雖然這個教程說明中提到僅適合RTX 3090Ti 24GB顯存 + 96GB DDR5-6400內存 + Ryzen 9950X處理器 。

但是我使用4090 24顯存 + 500 DDR5-4800內存 ,使用這個預編譯版本也可以安裝成功的。如果這個預編譯版本可以安裝成功的話,很多潛在的因為版本不對造成的報錯都可以避免掉了。

源碼運行ktransformers

如果上面的預編譯版本運行不了的話,又不想接著安裝ktransfomers,其實也可以直接用源碼來跑的,命令如下:

支持多GPU配置及通過 `--optimize_config_path` 進行更細粒度的顯存卸載設置
PYTORCH_CUDA_ALLOC_CONF=expandable_segments:True python3 ktransformers/server/main.py      
--gguf_path /mnt/ai/models/unsloth/DeepSeek-R1-GGUF/DeepSeek-R1-UD-Q2_K_XL/     
--model_path deepseek-ai/DeepSeek-R1 
--model_name unsloth/DeepSeek-R1-UD-Q2_K_XL 
--cpu_infer 16 
--max_new_tokens 8192 
--cache_lens 32768 
--total_context 32768
--cache_q4 true
--temperature 0.6 
--top_p 0.95 
--optimize_config_path ktransformers/optimize/optimize_rules/DeepSeek-R1-Chat.yaml 
--force_think 
--use_cuda_graph 
--host 127.0.0.1 
--port 8080

是的,其實即使不編譯ktransfomers,也是可以跑起來的。直接把項目下好,運行上面的命令,準備好相應的文件,就能正常運行了。

如果要繼續編譯ktransfomers的話,則可以按照下面的流程進行操作:

# 安裝額外編譯依賴項,包括CUDA工具鏈等,例如:
# sudo apt-get install build-essential cmake ...
source venv/bin/activate
uv pip install -r requirements-local_chat.txt
uv pip install setuptools wheel packaging
# 建議跳過可選網站應用,使用`open-webui`或`litellm`等替代方案
cd ktransformers/website/
npm install @vue/cli
npm run build
cd ../..
# 如果擁有充足的CPU核心和內存資源,可顯著提升構建速度
# $ export MAX_JOBS=8
# $ export CMAKE_BUILD_PARALLEL_LEVEL=8
# 安裝flash_attn
uv pip install flash_attn --no-build-isolation
# 可選實驗性使用flashinfer替代triton
# 除非您是已經成功上手的進階用戶,否則暫不建議使用
# 使用以下命令安裝:
# $ uv pip install flashinfer-python
# 僅適用于以下情況:
# 配備Intel雙路CPU且內存>1TB可容納兩份完整模型內存副本(每路CPU一份副本)
# AMD EPYC NPS0雙路平臺可能無需此配置?
# $ export USE_NUMA=1
# 安裝ktransformers
KTRANSFORMERS_FORCE_BUILD=TRUE uv pip install . --no-build-isolation

如果想自己編譯好后供其他環境使用的,則可以使用下面的命令進行環境編譯。

KTRANSFORMERS_FORCE_BUILD=TRUE uv build

然后把生成的文件移動到其他環境安裝則輸入下面命令即可

uv pip install ./dist/ktransformers-0.2.2rc1+cu120torch26fancy-cp311-cp311-linux_x86_64.whl

ktransformers運行

接口運行命令

ktransformers --model_path /home/user/new/ktran0.2.2/ktransformers/models/deepseek-ai/DeepSeek-R1  --gguf_path /home/user/new/models/unsloth/DeepSeek-R1-GGUF/DeepSeek-R1-Q4_K_M   --port 8080

如果想運行網頁版本,則再最后增加 --web True參數即可。

其他問題

如果使用了不支持amx的cpu, 可能會遇到下面的報錯

/tmp/cc8uoJt1.s:23667: Error: no such instruction: `vpdpbusd %ymm3,%ymm15,%ymm1'
的報錯,
File "<string>", line 327, in build_extension     
File "/usr/local/python3/lib/python3.11/subprocess.py", 
line 571, in run       
raise CalledProcessError(retcode, process.args,   subprocess.CalledProcessError: 
Command '['cmake', '--build', '.', '--verbose', '--parallel=128']' 
returned non-zero exit status 1.   [end of output]

這是因為CPU架構不支持這些指令:編譯時使用了-march=native參數,這會讓編譯器生成針對當前CPU優化的代碼,包括使用特定的指令集。但如果當前CPU不支持AVX-VNNI指令集,就會出現這個錯誤。

解決方案:在CMake配置中添加以下選項:

-DLLAMA_NATIVE=OFF -DLLAMA_AVX=ON -DLLAMA_AVX2=ON -DLLAMA_AVX512=OFF -DLLAMA_AVXVNNI=OFF

就可以讓cpu不使用amx指令集,從而避免這個報錯了。

另外,如果需要我環境的requirements.txt, 可以在后臺回復330獲取。

寫在最后

2025年的今天,AI創新已經噴井,幾乎每天都有新的技術出現。作為親歷三次AI浪潮的技術人,我堅信AI不是替代人類,而是讓我們從重復工作中解放出來,專注于更有創造性的事情,關注我們公眾號口袋大數據,一起探索大模型落地的無限可能!

責任編輯:龐桂玉 來源: 口袋大數據
相關推薦

2025-04-03 06:30:00

2025-02-03 13:55:20

2025-08-04 08:51:00

2025-03-27 10:28:32

2025-03-10 07:00:00

阿里開源QwQ-32B

2025-02-03 06:00:00

2024-12-27 11:13:16

2025-03-07 08:50:03

2025-03-07 08:30:00

2024-12-27 12:37:18

2025-01-27 12:30:07

2025-09-02 10:20:10

2025-03-06 09:55:49

2025-03-06 08:11:25

2025-02-20 15:32:28

2025-02-13 08:30:11

2025-02-06 08:06:05

點贊
收藏

51CTO技術棧公眾號

久久久久9999| 国产99久久九九精品无码| av av片在线看| 激情成人综合| 亚洲男人的天堂在线| 黄色av免费在线播放| 成人影院在线观看| 99精品偷自拍| 国产精品视频午夜| 国产一级中文字幕| 国产一区二区三区网| 欧美一区二区三区四区久久| 人人妻人人做人人爽| av在线播放av| 成人av第一页| 91色p视频在线| 国产成人无码一区二区在线播放| 五月精品视频| 亚洲人午夜色婷婷| 亚洲av无码一区东京热久久| 日韩毛片在线| 精品欧美aⅴ在线网站| 一区二区三区四区国产| 凸凹人妻人人澡人人添| 国产一区二区电影| 国产成人黄色av| 久久99久久久| 日韩精品不卡一区二区| 精品中文字幕久久久久久| 黄色片免费网址| 欧美日韩尤物久久| 日韩欧美在线中文字幕| 无码人妻少妇伦在线电影| 黄网站在线免费看| 欧美国产一区二区| 精品久久久久久亚洲| 精品国产999久久久免费| 青娱乐精品在线视频| 91av在线免费观看视频| 美女的奶胸大爽爽大片| 久久国产电影| 一区二区欧美在线| av黄色在线免费观看| 精品资源在线| 亚洲精品在线免费观看视频| 免费高清视频在线观看| 日本免费成人| 欧美日韩视频专区在线播放| 黄色一级二级三级| 日韩高清中文字幕一区二区| 精品福利樱桃av导航| 免费特级黄色片| 久久大胆人体| 一区二区三区免费观看| 蜜桃网站在线观看| av免费网站在线| 亚洲日本丝袜连裤袜办公室| 国产成年人在线观看| 精品国产丝袜高跟鞋| 亚洲三级在线观看| 日本a级片在线观看| av免费在线观看网址| 亚洲精品中文字幕乱码三区| 成人手机在线播放| 美女网站视频在线| 天天色天天操综合| 鲁一鲁一鲁一鲁一澡| 国模私拍一区二区国模曼安| 欧美日韩亚洲高清| caopor在线视频| 99久久精品一区二区成人| 欧美日韩中文精品| 日日干日日操日日射| 中文字幕综合| 欧美videofree性高清杂交| 美女露出粉嫩尿囗让男人桶| 日韩大片在线免费观看| 亚洲午夜激情免费视频 | 成人免费观看视频| 国产精品日韩高清| 国产原创av在线| 中文字幕色av一区二区三区| 国产精品久久久久9999爆乳| 日本不卡免费高清视频在线| 欧美优质美女网站| 中文字幕一区二区在线观看视频| 影音先锋欧美激情| 日韩精品中文字幕久久臀| 中文字幕黄色网址| 亚洲精品成人影院| 欧美中文在线观看国产| 一区二区自拍偷拍| 成人av在线影院| 先锋影音一区二区三区| 青青青国内视频在线观看软件| 天天影视网天天综合色在线播放| 久草综合在线观看| 国产精品亚洲欧美一级在线| 亚洲精品美女久久| 很污很黄的网站| 日韩一级网站| 国产中文欧美精品| 头脑特工队2在线播放| 成人欧美一区二区三区视频网页| 亚洲精品无码国产| 国产精品久久乐| 亚洲成人在线视频播放| 日本黄区免费视频观看| 亚洲第一在线| 国产欧美在线看| 天堂网www中文在线| 亚洲人成伊人成综合网小说| 国产欧美在线一区| 91麻豆精品国产91久久久久推荐资源 | 怡红院av亚洲一区二区三区h| 不卡亚洲精品| 日韩禁在线播放| 男人的天堂久久久| 热久久一区二区| 精品乱码一区| 女同一区二区免费aⅴ| 精品视频免费看| 欧美色图亚洲激情| 亚洲午夜91| 91精品天堂| 久久99精品久久久久久野外| 在线日韩国产精品| 国产麻豆xxxvideo实拍| 亚洲国产一成人久久精品| 国产精品mp4| 天堂在线一二区| 亚洲午夜激情av| 特种兵之深入敌后| 91久久夜色精品国产按摩| 欧美在线观看网址综合| 日本xxxxwww| 一区二区三区91| 男人的天堂免费| 91精品国产乱码久久久久久| 国产精品免费一区豆花| 国产美女性感在线观看懂色av | 久久在线精品视频| 国产精品毛片一区二区在线看舒淇 | 成人美女av在线直播| 国产二区在线播放| 色天使色偷偷av一区二区| 新91视频在线观看| 美女精品网站| 色就是色欧美| 777午夜精品电影免费看| 夜夜嗨av色综合久久久综合网| 国产婷婷色一区二区在线观看| 91亚洲国产成人精品一区二区三| 国产av人人夜夜澡人人爽麻豆| 一区二区在线视频观看| 欧美日韩国产成人| 免费成人在线看| 精品magnet| 蜜桃av免费看| 轻轻草成人在线| 日韩视频在线观看视频| 日韩三级久久| 高清欧美电影在线| 免费在线黄色电影| 91国产丝袜在线播放| 日本一二三不卡视频| 精品亚洲国内自在自线福利| www.黄色网址.com| 精品久久97| 日本欧美一二三区| jzzjzzjzz亚洲成熟少妇| 欧美精品1区2区| 伊人国产在线观看| 久久久亚洲综合| 天天综合网久久| 国产一区视频在线观看免费| 精品伦理一区二区三区| 亚洲伦理影院| 欧美成人一二三| 午夜在线视频免费| 欧美午夜精品一区二区三区| 日韩三级在线观看视频| av一区二区三区四区| 激情五月亚洲色图| 中文精品电影| 欧美精品一区在线发布| 激情久久免费视频| 秋霞午夜一区二区| √天堂8在线网| 精品一区二区三区三区| 国产精品毛片久久久久久久av| 亚洲成人午夜电影| 欧美88888| 99久久综合99久久综合网站| 色婷婷综合网站| 一本色道久久综合亚洲精品不| 亚洲成人午夜在线| 韩国女主播一区二区三区| 国产精品视频成人| 国产三级电影在线播放| 日韩中文字幕视频在线| 午夜小视频免费| 欧美一区二区三区精品| 激情视频网站在线观看| 洋洋成人永久网站入口| 国产3级在线观看| 91老师片黄在线观看| 亚洲精品一二三四| 美女视频第一区二区三区免费观看网站| 国产一级大片免费看| 精品美女久久| 精品国产一区二区三区四区精华| 国产一区二区视频在线看| 日韩美女免费视频| 高清在线视频不卡| 久久成人精品视频| 成人影视在线播放| 亚洲精品久久久久久下一站| 国产福利免费视频| 欧美日本在线播放| 波多野结衣一二区| 欧美日韩国产影院| 国产一级片免费| 亚洲精品欧美专区| 日本午夜在线观看| 国产精品久久久一本精品| 手机av免费看| xnxx国产精品| 成人性生活免费看| 成人精品小蝌蚪| 久久国产免费视频| 久久69国产一区二区蜜臀| 天天影视综合色| 久久午夜电影| 成年人黄色片视频| 久久婷婷一区| 老熟妇仑乱视频一区二区| 亚洲一区二区三区四区五区午夜| 欧美性潮喷xxxxx免费视频看| 亚洲最新av| 神马午夜伦理影院| 亚洲高清资源在线观看| 无码人妻aⅴ一区二区三区日本| 91视频久久| 美国av在线播放| 中文精品久久| 国产肉体ⅹxxx137大胆| 欧美激情1区2区3区| 国产911在线观看| 国产精品hd| 被灌满精子的波多野结衣| 亚洲激情成人| 日本精品免费在线观看| 首页综合国产亚洲丝袜| 午夜免费高清视频| 久久se精品一区精品二区| 五月天丁香花婷婷| 国产激情一区二区三区| 亚洲午夜久久久久久久久| 99在线精品观看| 久久精品成人av| 中文字幕在线免费不卡| 中文字幕av免费在线观看| 亚洲午夜精品17c| 99热在线观看免费精品| 在线视频亚洲一区| 国产视频一区二区三| 欧美草草影院在线视频| 亚洲欧美综合在线观看| 伊人亚洲福利一区二区三区| 久久久久久国产精品免费无遮挡| 欧美伦理91i| 亚洲欧洲自拍| 成人激情视频小说免费下载| 视频一区视频二区欧美| 久久99精品久久久久久秒播放器 | 最新中文字幕第一页| 在线不卡免费欧美| 乱精品一区字幕二区| 亚洲欧美精品伊人久久| 麻豆影视在线观看_| 欧美精品久久久久久久| 欧美xxxx做受欧美护士| 91久久伊人青青碰碰婷婷| 无码少妇一区二区三区| 曰韩不卡视频| 在线午夜精品| 99日在线视频| 99久久精品国产毛片| 天天摸日日摸狠狠添| 亚洲一区二区三区视频在线播放| 激情视频网站在线观看| 日韩免费一区二区三区在线播放| 蜜桃视频在线观看视频| 九九九久久久久久| 肉色欧美久久久久久久免费看| 亚洲伊人久久综合| 国产欧美高清视频在线| 波多野结衣 作品| 日本不卡一区二区三区高清视频| 麻豆tv在线观看| 国产精品美女一区二区三区| 久久高清免费视频| 欧美精品久久一区二区三区| 免费理论片在线观看播放老| 久久久久久国产精品三级玉女聊斋| 成人毛片免费| 奇米影视首页 狠狠色丁香婷婷久久综合 | 国产91xxx| 国产美女精品在线| 国精产品一区二区三区| 亚洲国产aⅴ成人精品无吗| 中文字幕一区二区人妻| 亚洲韩国青草视频| 伊人精品影院| 91精品在线国产| 久久影院100000精品| 久久久久久久久久久久久国产精品| 国产成人综合自拍| 韩国一级黄色录像| 欧美午夜影院一区| 激情小说 在线视频| 91sa在线看| 久久porn| 草草视频在线免费观看| 豆国产96在线|亚洲| 丁香花五月激情| 777欧美精品| 免费大片黄在线观看视频网站| 欧美在线视频免费观看| 成人激情自拍| 欧美日韩福利在线| 国产成人av电影| 欧美日韩三级在线观看| 91精品国产品国语在线不卡| 久草资源在线| 亚洲va电影大全| 在线观看国产精品入口| 99九九99九九九99九他书对| 国产精品久久久久影院色老大 | 精品三级在线观看| 91麻豆国产福利在线观看宅福利| 91精品国产综合久久久久久久久| 久久视频精品| 成人亚洲免费视频| 亚洲私人影院在线观看| 国产精品午夜福利| 久久这里只有精品视频首页| 免费观看亚洲视频大全| 国产情侣第一页| www.欧美.com| 国产又黄又猛又粗又爽| 亚洲欧美激情另类校园| 日韩天堂在线| 一区二区三区我不卡| 九一久久久久久| 欧美三根一起进三p| 亚洲精品在线三区| 美女福利一区二区三区| 色99中文字幕| 久久精品国产第一区二区三区| chinese全程对白| 日韩精品自拍偷拍| 国产美女高潮在线观看| 清纯唯美一区二区三区| 久久草av在线| 久久老司机精品视频| 日韩精品在线第一页| 素人啪啪色综合| 免费网站永久免费观看| 91日韩精品一区| 中文字幕一区二区三区四区视频 | 亚洲激情自拍图| 欧美电影网址| 中文字幕一区二区三区有限公司 | 丝袜美腿成人在线| 网爆门在线观看| 精品毛片乱码1区2区3区| 手机在线观看av网站| 五月天亚洲综合情| 国产精品99久久久久久似苏梦涵| 九九热国产视频| 亚洲视频专区在线| 精品视频91| 日本精品www| 亚洲人成网站影音先锋播放| 午夜性色福利视频| 91色视频在线导航| 国产精品美女久久久| 夫妻性生活毛片| 日韩av最新在线观看| 日本午夜精品久久久久| 奇米精品一区二区三区| 国产精品视频第一区| 刘亦菲久久免费一区二区| 国产精品自产拍在线观| 99riav1国产精品视频| 国产午夜手机精彩视频| 亚洲欧洲免费视频| 一区二区在线视频观看|