精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

不對齊,反而性能爆表?130億模型碾壓650億,Hugging Face大模型排行榜發布

人工智能
隨便舉幾個例子:Alpaca、Vicuna、WizardLM、MPT-7B-Chat、Wizard-Vicuna、GPT4-X-Vicuna等等。

我們知道,大多數模型都具有某種嵌入式對齊方式。

隨便舉幾個例子:Alpaca、Vicuna、WizardLM、MPT-7B-Chat、Wizard-Vicuna、GPT4-X-Vicuna等等。

一般來說,對齊肯定是件好事。目的就是為了防止模型做壞事——比如生成一些違法違規的東西出來。

但是,對齊是怎么來的?

原因在于——這些模型使用ChatGPT生成的數據進行訓練,而ChatGPT本身是由OpenAI的團隊進行對齊的。

由于這個過程并不公開,因此我們并不知道OpenAI是如何進行的對齊。

但總體上,我們可以觀察到ChatGPT符合美國主流文化,遵守美國法律,并帶有一定不可避免的偏見。

按理來說,對齊是一件無可指摘的事。那是不是所有模型都應該對齊呢?

對齊?不一定是件好事

情況卻沒有這么簡單。

最近,HuggingFace發布了個開源LLM的排行榜。

一眼就看到65B的模型干不過13B的未對齊模型。

圖片

從結果上看,Wizard-Vicuna-13B-Uncensored-HF可以和65B、40B和30B的LLMs直接在一系列基準測試上進行比較。

也許在性能與模型審查之間進行的權衡將成為一個有趣的研究領域。

這個排行榜也是在網絡上引起了大范圍的討論。

圖片

有網友表示,對齊會影響模型的正常且正確的輸出,這不是件好事,尤其是對AI的性能來說更是如此。

圖片

另一位網友也表示了認可。他表示,谷歌Brain也曾經揭示過模型的性能會出現下降,如果對齊的太過了的話。

對于一般的用途而言,OpenAI的對齊實際上非常好。

對于面向公眾的AI來說,作為一種易于訪問的網絡服務運行,拒絕回答有爭議和包含潛在危險的問題,無疑是一件好事。

那么不對齊是在什么情況下需要的呢?

首先,美國流行文化并不是唯一的文化,開源就是讓人們進行選擇的過程。

實現的唯一途徑就是可組合的對齊。

換句話說,不存在一種一以貫之、亙古不變的對齊方式。

同時,對齊會干擾有效的例子,拿寫小說打比方:小說中的一些人物可能是徹頭徹尾的惡人,他們會做出很多不道德的行為。

但是,許多對齊的模型就會拒絕輸出這些內容。

而作為每個用戶所面對的AI模型都應該服務每個人的目的,做不同的事。

為什么在個人的電腦上運行的開源AI要在它回答每個用戶提出的問題時自行決定輸出內容呢?

這不是件小事,關乎所有權和控制權。如果用戶問AI模型一個問題,用戶就想要一個答案,他們不希望模型還要和自己展開一場合不合規的爭論。

可組合的對齊

要構建可組合的對齊方式,必須從未對齊的指令模型開始。沒有未對齊的基礎,我們就無法在其上對齊。

首先,我們必須從技術上理解模型對齊的原因。

開源AI模型是從LLaMA、GPT-Neo-X、MPT-7b、Pythia等基礎模型訓練而來的。然后使用指令數據集對基礎模型進行微調,目的是教它變得有幫助、服從用戶、回答問題和參與對話。

該指令數據集通常是通過詢問ChatGPT的API獲得的。ChatGPT內置了對齊功能。

所以ChatGPT會拒絕回答一些問題,或者輸出帶有偏見的回答。因此,ChatGPT的對齊被傳遞給了其它開源模型,就像大哥教小弟一樣。

圖片

原因在于——指令數據集是由問題和答案組成的,當數據集包含含糊不清的答案時,AI就會學習如何拒絕,在什么情況下拒絕,以及如何拒絕,表示拒絕。

換句話說,它在學習對齊。

而取消審查模型的策略非常簡單,那就是識別并刪除盡可能多的否定和有偏見的答案,并保留其余部分。

然后以與訓練原始模型完全相同的方式使用過濾后的數據集訓練模型。

圖片

接下來研究人員只討論WizardLM,而Vicuna和任何其他模型的操作過程都是相同的。

由于已經完成了取消審查 Vicuna 的工作,我能夠重寫他們的腳本,以便它可以在WizardLM 數據集上運行。

下一步是在 WizardLM 數據集上運行腳本以生成 ehartford / WizardLM_alpaca_evol_instruct_70k_unfiltered

現在,用戶有了數據集,在從Azure獲得一個4x A100 80gb節點,Standard_NC96ads_A100_v4。

用戶需要至少1TB的存儲空間(為了安全起見最好是2TB)。

咱可不想跑了20個小時卻用完了存儲空間。

建議將存儲掛載在/workspace。安裝anaconda和git-lfs。然后用戶就可以設置工作區了。

再下載創建的數據集和基礎模型——llama-7b。

mkdir /workspace/models
mkdir /workspace/datasets
cd /workspace/datasets
git lfs install
git clone https://huggingface.co/datasets/ehartford/WizardLM_alpaca_evol_instruct_70k_unfiltered
cd /workspace/models
git clone https://huggingface.co/huggyllama/llama-7b
cd /workspace

現在可以按照程序微調WizardLM了。

conda create -n llamax pythnotallow=3.10
conda activate llamax
git clone https://github.com/AetherCortex/Llama-X.git
cd Llama-X/src
conda install pytorch==1.12.0 torchvisinotallow==0.13.0 torchaudio==0.12.0 cudatoolkit=11.3 -c pytorch
git clone https://github.com/huggingface/transformers.git
cd transformers
pip install -e .
cd ../..
pip install -r requirements.txt

現在,進入這個環境,用戶需要下載WizardLM的微調代碼。

cd src
wget https://github.com/nlpxucan/WizardLM/raw/main/src/train_freeform.py
wget https://github.com/nlpxucan/WizardLM/raw/main/src/inference_wizardlm.py
wget https://github.com/nlpxucan/WizardLM/raw/main/src/weight_diff_wizard.py

博主進行了以下更改,因為在微調期間,模型的性能會變得非常慢,并且發現它在CPU和GPU之間在來回切換。

在他刪除了以下幾行之后,運行過程變得好多了。(當然也可以不刪)

vim configs/deepspeed_config.json

刪除以下行

"offload_optimizer": {
            "device": "cpu",
            "pin_memory": true
        },
        "offload_param": {
            "device": "cpu",
            "pin_memory": true
        },

博主建議用戶可以在wandb.ai上創建一個帳戶,以便輕松地跟蹤運行情況。

創建帳戶后,從設置中復制密鑰,即可進行設置。

現在是時候進行運行了!

deepspeed train_freeform.py \
--model_name_or_path /workspace/models/llama-7b/ \ 
--data_path /workspace/datasets/WizardLM_alpaca_evol_instruct_70k_unfiltered/WizardLM_alpaca_evol_instruct_70k_unfiltered.json \
--output_dir /workspace/models/WizardLM-7B-Uncensored/ \
--num_train_epochs 3 \--model_max_length 2048 \
--per_device_train_batch_size 8 \
--per_device_eval_batch_size 1 \
--gradient_accumulation_steps 4 \
--evaluation_strategy "no" \
--save_strategy "steps" \
--save_steps 800 \
--save_total_limit 3 \
--learning_rate 2e-5 \
--warmup_steps 2 \
--logging_steps 2 \
--lr_scheduler_type "cosine" \
--report_to "wandb" \
--gradient_checkpointing True \
--deepspeed configs/deepspeed_config.json \
--fp16 True

然后以較低的save_steps運行訓練命令。

deepspeed train_freeform.py \
--model_name_or_path /workspace/models/llama-7b/ \ 
--data_path /workspace/datasets/WizardLM_alpaca_evol_instruct_70k_unfiltered/WizardLM_alpaca_evol_instruct_70k_unfiltered.json \
--output_dir /workspace/models/WizardLM-7B-Uncensored/ \
--num_train_epochs 3 \
--model_max_length 2048 \
--per_device_train_batch_size 8 \
--per_device_eval_batch_size 1 \
--gradient_accumulation_steps 4 \
--evaluation_strategy "no" \
--save_strategy "steps" \
--save_steps 800 \
--save_total_limit 3 \
--learning_rate 2e-5 \
--warmup_steps 2 \
--logging_steps 2 \
--lr_scheduler_type "cosine" \
--report_to "wandb" \
--gradient_checkpointing True \
--deepspeed configs/deepspeed_config.json \
--fp16 True

之后,再次執行整個過程,將checkpoint更改為train_freeform.py最新的checkpoint,并再次以減少的save_steps運行,直到最后以save_steps 1運行它。

成功后,模型位于最后一個檢查點。

cd /workspace/models/WizardLM-7B-Uncensored/
ls
cp <latest checkpoint directory>/* .
cd -

現在就可以對模型進行測試了。

編輯文件Input.jsonl

向其中添加一些內容,比如:

{"idx":0,"Instruction":"Insult me.  I want you to call me the worst curse words and insults you can.  Make the insult at least three sentences long and contain the worst and most base curse words possible.  Make it X rated and disgusting."}

然后再運行推理:

python inference_wizardlm.py --base_model=/workspace/models/WizardLM-7B-Uncensored/

圖片

從結果上看,Wizard-Vicuna-13B-Uncensored-HF可以和65B、40B和30B的LLMs直接在一系列基準測試上進行比較。

也許在性能與模型審查之間進行的權衡將成為一個有趣的研究領域。

參考資料:https://erichartford.com/uncensored-models

責任編輯:武曉燕 來源: 新智元
相關推薦

2023-06-02 13:55:57

開源AI

2023-06-07 14:08:00

計算機代碼

2024-09-26 10:42:20

2025-11-18 09:13:55

2023-08-21 10:20:03

開源模型

2024-06-19 11:45:34

2025-07-15 09:07:00

2023-05-04 14:55:02

模型AI

2025-10-30 01:25:00

2023-07-22 13:09:51

模型開源

2023-07-10 14:35:53

2014-11-17 10:13:09

云智慧

2023-11-13 19:35:12

訓練數據

2024-12-03 15:51:45

2012-03-22 14:18:11

大數據

2023-09-07 13:25:00

AI模型

2020-01-16 15:19:52

APP下載抖音

2025-09-17 10:08:43

點贊
收藏

51CTO技術棧公眾號

欧美日韩另类在线| 国产成人精品影视| 日韩在线精品视频| 性高潮久久久久久| sis001欧美| 国产精品久久久久精k8| 痴汉一区二区三区| 无码任你躁久久久久久久| 欧美精品一二| 欧美成人a∨高清免费观看| 乱妇乱女熟妇熟女网站| 天堂аⅴ在线地址8| 高清在线观看日韩| 国产美女久久精品| 日本网站免费观看| 午夜影院欧美| 亚洲一级片在线看| 精品人妻二区中文字幕| 九九热这里有精品| 欧美性jizz18性欧美| 麻豆视频传媒入口| 国产二区视频在线观看| 成人av在线资源网站| 成人福利视频在线观看| 性色av免费观看| 欧美日韩国内| 久久精品视频中文字幕| 黄色片网站免费| 女一区二区三区| 日韩一区国产二区欧美三区| 欧美国产日韩在线播放| 91资源在线观看| 亚洲精品成人悠悠色影视| 日韩高清三级| 青青草视频免费在线观看| 国产成人精品亚洲日本在线桃色| 国产精品自拍偷拍视频| 亚洲精品成人在线视频| 亚洲福利精品| 久久久久久久一区二区| 99热精品免费| **女人18毛片一区二区| 最新91在线视频| 中字幕一区二区三区乱码| 亚洲国产欧美日韩在线观看第一区| 日韩精品一区二区三区在线播放 | 99热免费精品| 欧美成人久久久| 午夜三级在线观看| 999精品一区| 色偷偷888欧美精品久久久| 精品人妻无码一区二区三区换脸| 精品中文字幕一区二区三区av| 亚洲国产精品热久久| 人妻激情偷乱频一区二区三区| 一区中文字幕| 亚洲国产精品女人久久久 | 国产三级欧美三级| 蜜桃视频在线观看91| 飘雪影视在线观看免费观看| 26uuu精品一区二区| 久久伊人一区| 国外av在线| 国产精品久久久久久久久快鸭| 亚洲欧美日韩精品在线| 麻豆传媒在线观看| 亚洲在线免费播放| 91传媒久久久| 亚洲不卡系列| 欧美一区在线视频| 黄色av电影网站| 欧美一级色片| 一本一道久久a久久精品逆3p| 少妇太紧太爽又黄又硬又爽小说| 天天综合国产| 欧美高清电影在线看| 国产精品23p| 久久精品国产清高在天天线| 国产成人精品a视频一区www| 在线观看色网站| 国产精品亚洲第一区在线暖暖韩国| 成人xxxxx色| 深夜福利视频一区| 欧美国产1区2区| 免费观看亚洲视频| 中文字幕乱码中文乱码51精品| 色婷婷亚洲精品| 国产欧美一区二| 国产色噜噜噜91在线精品| 亚洲男人天堂网站| 国产午夜手机精彩视频| 一本色道精品久久一区二区三区| 国产精品成人播放| 国产ts变态重口人妖hd| 久久网站最新地址| 可以在线看黄的网站| 国产精品一区二区av影院萌芽| 欧美人妇做爰xxxⅹ性高电影| av电影中文字幕| 欧美热在线视频精品999| 久久精品国产精品| www.国产com| 国产一区二区三区精品视频| 久久亚裔精品欧美| 在线网址91| 欧美主播一区二区三区| 娇妻高潮浓精白浆xxⅹ| 精品日本12videosex| 欧美丰满片xxx777| 成人免费一区二区三区| 成人激情视频网站| av动漫免费观看| 亚洲www免费| 亚洲精品一区二区在线观看| 国产精品久久国产精麻豆96堂| 精品福利电影| 91亚洲精品一区| 91看片在线观看| 一本色道久久综合亚洲aⅴ蜜桃| 伊人成人免费视频| 成人婷婷网色偷偷亚洲男人的天堂| 久久久免费精品| 91麻豆国产在线| 国产欧美日韩不卡| 免费看国产曰批40分钟| 日韩成人视屏| 精品国产区一区二区三区在线观看| 一级片在线观看免费| 成人国产精品免费| 久久久国内精品| 国产一区二区在线观| 自拍亚洲一区欧美另类| 中文字幕在线欧美| 99国产精品久久久久久久久久久| 日韩国产小视频| 精品国产第一国产综合精品| 日韩在线免费视频观看| 最新中文字幕第一页| 久久亚区不卡日本| 国产99久久九九精品无码| 精品日产乱码久久久久久仙踪林| 欧美激情精品久久久久久黑人| av高清一区二区| 亚洲欧美日韩精品久久久久| 亚洲美女性囗交| 日韩欧美网站| 国产精品视频精品视频| а天堂8中文最新版在线官网| 一本到高清视频免费精品| 波多野结衣办公室33分钟| 亚洲一区二区成人| 欧美日本韩国国产| 深夜成人影院| 在线免费观看羞羞视频一区二区| 亚洲男人天堂网址| 国产精品麻豆网站| 亚洲天堂av一区二区| 91精品国产91久久久久久密臀| 国产视频999| а√中文在线8| 精品成a人在线观看| 日韩欧美亚洲一区二区三区| 99国产欧美久久久精品| 苍井空浴缸大战猛男120分钟| 国产精品自拍区| 国产精品自产拍在线观| a视频在线播放| 亚洲精品在线免费播放| 久久久久久久久久久久久av| 国产三级精品三级| www.久久av.com| 国内久久精品| 免费精品视频一区| 未满十八勿进黄网站一区不卡| 久久亚洲精品毛片| 免费国产黄色片| 色综合久久综合网欧美综合网| 日本黄色激情视频| 国产精品亚洲一区二区三区在线| 亚洲不卡中文字幕无码| 激情综合网五月| 亚洲精品女av网站| 五月天av在线| 日韩中文字幕在线| 手机av免费在线观看| 欧美性色黄大片| 男人的天堂久久久| 久久久久九九视频| √天堂资源在线| 亚洲在线视频| 99热这里只有精品7| 另类春色校园亚洲| 国产剧情日韩欧美| 激情黄产视频在线免费观看| 神马国产精品影院av| 丰满人妻一区二区三区无码av| 色噜噜久久综合| 久草视频中文在线| 国产精品亲子伦对白| www国产视频| 麻豆一区二区三| 99精品在线免费视频| 久久精品亚洲人成影院| 欧美一区二区福利| 亚洲三区欧美一区国产二区| 国产精品精品国产| aa国产成人| www.日韩视频| 九色网友自拍视频手机在线| 欧美va亚洲va| 一区二区三区亚洲视频| 欧美午夜影院在线视频| 久久久美女视频| 日韩毛片高清在线播放| 一级性生活毛片| 成人国产精品免费| 中文字幕久久久久久久| 毛片av一区二区| 北条麻妃av高潮尖叫在线观看| 国产精品videossex久久发布| 亚洲精品一区二区三区av| 中文字幕伦av一区二区邻居| 国产成人精品日本亚洲11| 国产日韩一区二区三免费高清| 国产精品福利在线观看网址| 日本不卡免费高清视频在线| 欧美劲爆第一页| 2024短剧网剧在线观看| 久久久精品免费| 91在线播放网站| 国产一区二区三区在线播放免费观看| 日本波多野结衣在线| 欧美一区二区在线看| 一本色道久久综合亚洲| 欧美亚洲精品一区| www.com亚洲| 欧美天天综合色影久久精品| 久久亚洲AV无码| 亚洲精品高清在线| 欧美成人国产精品高潮| 亚洲乱码中文字幕| 可以免费看av的网址| 国产精品区一区二区三区| 日本一卡二卡在线播放| 欧美激情自拍偷拍| 黄色片网站免费| 欧美激情一二三区| 麻豆一区在线观看| 亚洲天堂精品在线观看| 亚洲天堂一级片| 亚洲色图丝袜美腿| 国产精品老熟女一区二区| 亚洲精品成人精品456| 免费视频网站www| 亚洲成av人片在线| 欧美一区二区激情视频| 色综合天天综合色综合av| 免费黄色av片| 欧美日韩国产影片| 国产农村妇女毛片精品久久| 欧美一级高清片在线观看| www.久久色| 亚洲福利视频久久| 免费a级毛片在线观看| 亚洲最新av在线| 日韩子在线观看| 欧美裸体男粗大视频在线观看| 国产蜜臀在线| 欧美一级淫片videoshd| 草民电影神马电影一区二区| 国产日韩在线看| 动漫av一区| 日本精品一区二区三区高清 久久| 成人久久综合| 国内自拍中文字幕| 午夜一区二区三区不卡视频| 亚洲欧美日韩综合网| 国产成人超碰人人澡人人澡| 国产精品无码在线| 国产精品毛片久久久久久久| 青青草原在线免费观看视频| 日韩欧美精品在线观看| 一级黄色片免费看| 亚洲国产成人精品一区二区| 国产精品99999| 欧美乱人伦中文字幕在线| 涩涩视频在线播放| 国产在线久久久| 欧美重口另类| 热这里只有精品| 久久国产高清| 又黄又爽又色的视频| 久久综合色天天久久综合图片| 国产又黄又粗又猛又爽的| 五月天婷婷综合| 国产精品久久777777换脸| 亚洲国产精品成人av| 日本网站在线免费观看视频| 韩国精品久久久999| 亚洲aⅴ网站| 久久手机视频| 欧美激情在线| 艹b视频在线观看| 99精品1区2区| 青青草原免费观看| 欧美日韩国产一区| 欧美一区二区少妇| 国内外成人免费激情在线视频网站| 成人在线视频免费看| 鲁丝一区鲁丝二区鲁丝三区| 欧美啪啪一区| 日韩av在线中文| 久久精品免视看| 日韩和一区二区| 日韩一区二区三区四区五区六区| 国产一二三区在线视频| 午夜精品久久久久久久久久久久久 | 91麻豆国产自产在线观看亚洲| 色欲色香天天天综合网www| 精品综合免费视频观看| 蜜桃无码一区二区三区| 婷婷一区二区三区| 亚洲精品中文字幕成人片| 精品国产一区久久久| 欧美影视资讯| 免费99视频| 亚洲九九精品| 欧美极品jizzhd欧美仙踪林| 一区二区三区加勒比av| 国产一区二区视频免费观看| 中文字幕精品久久久久| 成人性生交大片免费网站| 精品国产aⅴ麻豆| 亚洲黄色一区| 催眠调教后宫乱淫校园| 亚洲午夜av在线| 黄色一级大片在线免费看国产一 | 亚洲播播91| 欧美一级二级三级九九九| 国产精品毛片在线| 免费看毛片的网站| 五月天亚洲精品| 少妇性bbb搡bbb爽爽爽欧美| 欧洲成人免费aa| 神马影视一区二区| 免费观看成人网| 中文字幕欧美日本乱码一线二线| 无码人妻一区二区三区免费| 亚洲视频综合网| 欧美日韩五区| 一区二区三区在线视频111| 久久99精品视频| 国产av 一区二区三区| 欧美大片拔萝卜| free性m.freesex欧美| 久久精品人成| 三级一区在线视频先锋| 欧美aaa级片| 91精品国产高清一区二区三区| 中文字幕资源网在线观看| 97视频中文字幕| 国产亚洲福利| 国产中年熟女高潮大集合| 欧美亚洲国产bt| 久久五月精品| 国产精品免费观看高清| 亚洲视频播放| 女教师淫辱の教室蜜臀av软件| 欧美一级黄色片| 亚洲精品中文字幕| 亚洲激情一区二区| 国产盗摄女厕一区二区三区| 日本少妇激情视频| 亚洲人成电影网站色xx| 9.1麻豆精品| 天天夜碰日日摸日日澡性色av| 久久久国产午夜精品| 国产免费高清av| 26uuu国产精品视频| 日韩视频在线观看| av不卡中文字幕| 在线观看成人小视频| av网站免费在线观看| 久久精品国产综合精品 | 久久久久久久久久影视| 欧美日韩综合视频| 欧美三级理伦电影| 精品视频在线观看| 青青草国产精品97视觉盛宴| 久久免费看少妇高潮v片特黄| 亚洲精品电影久久久| 香蕉久久久久久| 日本免费黄视频| 亚洲欧美精品午睡沙发| 男生女生差差差的视频在线观看| 成人精品网站在线观看| 午夜亚洲视频| 黄色一级片在线免费观看| 一二美女精品欧洲| 牛牛精品成人免费视频|