精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

最火AI角色扮演流量已達(dá)谷歌搜索20%!每秒處理2萬(wàn)推理請(qǐng)求,Transformer作者公開優(yōu)化秘訣

人工智能 新聞
大模型的一大痛點(diǎn)是顯存占用高,導(dǎo)致無(wú)法支持大批量推理。Attention 層中的 Key-Value(KV)緩存便是罪魁禍?zhǔn)字弧?/div>

什么AI應(yīng)用每秒處理20000個(gè)AI推理請(qǐng)求,達(dá)到2024年谷歌搜索流量的1/5

答案是獨(dú)角獸Character.ai,由Transformer作者Noam Shazeer(后面簡(jiǎn)稱沙哥)創(chuàng)辦。

剛剛,沙哥公布了推理優(yōu)化獨(dú)門秘訣,迅速引起業(yè)界熱議。

圖片

具體來(lái)說(shuō)Character.ai在整個(gè)服務(wù)堆棧中實(shí)現(xiàn)了如下成績(jī):

  • 內(nèi)存高效架構(gòu)設(shè)計(jì):將KV緩存大小減少20倍以上,而不會(huì)降低質(zhì)量
  • Attention狀態(tài)緩存:95%請(qǐng)求無(wú)需重算
  • 直接用in8精度量化訓(xùn)練:推理零損失還省顯存

Character.AI通過(guò)以上種種優(yōu)化,已經(jīng)把推理成本降低到最初的1/33,如果用市場(chǎng)上最好的商業(yè)API來(lái)支撐這種級(jí)別的流量,成本會(huì)比現(xiàn)在高出13.5倍!

眾多公布的方法中,原生int8訓(xùn)練是最受關(guān)注的。

圖片

雖然大多數(shù)技巧都來(lái)自公開研究,但是正如網(wǎng)友所說(shuō),知道如何把它們高效整合在一起實(shí)現(xiàn)的團(tuán)隊(duì)才是真正的護(hù)城河。

圖片

秘訣1:高效利用顯存,attention 參數(shù)量降低20倍

大模型的一大痛點(diǎn)是顯存占用高,導(dǎo)致無(wú)法支持大批量推理。Attention 層中的 Key-Value(KV)緩存便是罪魁禍?zhǔn)字弧?/p>

為了降低顯存占用,Character.AI在Attention層大動(dòng)手術(shù):

  • 全面采用MQA(Multi-Query Attention)

與大多數(shù)開源模型中采用的GQA(Grouped-Query Attention)相比,將KV緩存大小減少了 8 倍。

而MQA正是沙哥本人2019年在谷歌期間提出的,有網(wǎng)友評(píng)價(jià)“當(dāng)一個(gè)人能在生產(chǎn)環(huán)境中引用自己的論文,就達(dá)到了一個(gè)新的高度”。

圖片

  • 混合注意力視野

將局部注意力與全局注意力層交織在一起,使用滑動(dòng)窗口訓(xùn)練局部注意力,將復(fù)雜度從 O(length^2 ) 降低到 O(length)。

團(tuán)隊(duì)發(fā)現(xiàn),將大多數(shù)注意力層的注意力范圍減少到1024不會(huì)對(duì)評(píng)估指標(biāo)產(chǎn)生重大影響,包括長(zhǎng)上下文大海撈針基準(zhǔn)。在Character.ai生產(chǎn)模型中,每6層中只有1層使用全局注意力

  • 跨層KV共享

團(tuán)隊(duì)將KV緩存綁定在相鄰的注意力層上,這進(jìn)一步將 KV緩存大小減少了 2-3 倍。

對(duì)于全局注意力,跨塊綁定多個(gè)全局層的KV緩存,因?yàn)槿肿⒁饬釉陂L(zhǎng)上下文用例中主導(dǎo)KV緩存大小,團(tuán)隊(duì)發(fā)現(xiàn)跨層共享KV不會(huì)降低質(zhì)量。

下圖中左半部分是標(biāo)準(zhǔn)Transformer設(shè)計(jì),每個(gè)注意力都是全局注意力。右半部分為Character.ai的設(shè)計(jì),藍(lán)色框表示全局注意力,綠色框表示局部注意力,連線表示KV共享。

圖片

這一套組合拳下來(lái),KV緩存大小減少20倍以上,顯存再也不是瓶頸了。

秘訣2:巧用狀態(tài)緩存,95%請(qǐng)求無(wú)需重算

Character.AI還有一招神來(lái)之筆,就是在不同對(duì)話之間緩存Attention狀態(tài)

作為聊天機(jī)器人角色扮演服務(wù),Character.AI上大部分對(duì)話都是連續(xù)多輪的,平均每個(gè)對(duì)話包含180條消息。如果每次都要重新計(jì)算前面的狀態(tài),成本可想而知。

于是團(tuán)隊(duì)設(shè)計(jì)了一個(gè)緩存機(jī)制,把每個(gè)對(duì)話的Prefix和生成的消息都緩存在內(nèi)存中,供后續(xù)調(diào)用。

借鑒RadixAttention的思路,樹狀結(jié)構(gòu)的LRU緩存組織緩存的KV張量。緩存的KV值由前綴token的Rolling Hash速檢索最長(zhǎng)匹配的緩存,即使前綴只有部分匹配也能命中。

更妙的是,他們還用會(huì)話保持(Sticky Session)把同一對(duì)話路由到同一個(gè)服務(wù)器,進(jìn)一步提高緩存命中率。最終做到95%的請(qǐng)求都能復(fù)用已有緩存,大幅降低了計(jì)算成本。

下圖中,藍(lán)色框表示主機(jī)內(nèi)存上的緩存張量。綠色和黃色框表示CUDA內(nèi)存上的KV緩存。當(dāng)新查詢到達(dá)時(shí),它檢索最長(zhǎng)匹配前綴的KV緩存,Rolling Hash系統(tǒng)允許檢索部分匹配消息的緩存。

圖片

秘訣3:直接量化訓(xùn)練,推理零損失還省顯存

最后一招,Character.AI沒(méi)有采用常見(jiàn)的“訓(xùn)練后量化”,而是直接用Int8精度訓(xùn)練模型

這種格式雖然表達(dá)精度降低,但通過(guò)精心設(shè)計(jì)定制的矩陣乘和 Attention 內(nèi)核,不僅把訓(xùn)練效率提高了好幾倍,而且還能無(wú)損用于推理。

不過(guò)沙哥在這里暫時(shí)留了一手,表示“量化訓(xùn)練本身就是一個(gè)復(fù)雜的話題,將在以后的文章中繼續(xù)討論。”

沙哥其人

最后再來(lái)介紹一下傳奇人物Noam Shazeer本人。

圖片

他1994年拿了信息學(xué)奧賽IOI金牌,后來(lái)畢業(yè)于杜克大學(xué)。

2000年加入谷歌,當(dāng)時(shí)全公司只有200人左右,他參與了谷歌搜索的拼寫糾正功能,后來(lái)也負(fù)責(zé)過(guò)早期廣告系統(tǒng)。

據(jù)知情人透露,在當(dāng)初面試谷歌時(shí),沙哥就被問(wèn)到如何實(shí)現(xiàn)拼寫糾正。他描述了一種根據(jù)其他用戶的輸入輸入記錄,進(jìn)行統(tǒng)計(jì)驗(yàn)證的方法。

面試官Gmail之父Paul Buchheit意識(shí)到,沙哥的方案比谷歌當(dāng)時(shí)使用的要好。沙哥成功入職之后就把他的面試方案寫出來(lái)了。

圖片

在Transformer開山之作《Attention is All You Need》研究中,沙哥最后一個(gè)加入團(tuán)隊(duì),一來(lái)就負(fù)責(zé)重新編寫了整個(gè)代碼。

在沙哥出手之前,Transformer早期原型性能并沒(méi)有超越當(dāng)時(shí)流行的LSTM方案,是他把早期設(shè)計(jì)中的卷積等模塊都拿掉,給出了一個(gè)極簡(jiǎn)主義方案。最終破了BLEU測(cè)試的記錄,同時(shí)計(jì)算效率也更高。

隊(duì)友用“他是一個(gè)巫師”來(lái)評(píng)價(jià)他的工程和代碼能力。

除此之外,沙哥還有驚人的遠(yuǎn)見(jiàn)。在Transformer架構(gòu)問(wèn)世不久,他就給谷歌高層寫信,提議公司放棄整個(gè)搜索索引,并用Transformer架構(gòu)訓(xùn)練一個(gè)巨大的神經(jīng)網(wǎng)絡(luò)替代。

2021年,沙哥離開谷歌后創(chuàng)辦了Character.AI,讓玩家簡(jiǎn)單自創(chuàng)個(gè)性化AI陪聊,目前估值約50億美元。

圖片

最近有消息稱,Meta與馬斯克的??都在爭(zhēng)取與他們合作,把聊天機(jī)器人引入社交平臺(tái)。

責(zé)任編輯:張燕妮 來(lái)源: 量子位
相關(guān)推薦

2011-06-28 10:11:41

Top Girl應(yīng)用

2023-04-18 08:01:30

AI寫作時(shí)間

2024-01-02 12:59:06

AI技術(shù)

2024-11-05 12:42:35

2023-09-12 14:47:09

AI模型

2021-02-06 06:55:33

AI物聯(lián)網(wǎng)人工智能

2024-12-27 13:30:00

2023-11-20 07:29:32

大模型人工智能

2017-04-24 14:39:01

PythonHTTP語(yǔ)言

2018-02-24 16:15:03

PythonHTTP

2020-05-27 11:31:43

Python 開發(fā)程序員

2024-07-01 10:16:44

2024-12-09 14:30:00

2024-07-08 08:50:00

2020-03-24 15:08:07

AI 數(shù)據(jù)人工智能

2024-08-23 11:53:24

2025-01-16 08:30:00

LLMAI訓(xùn)練

2013-09-25 15:28:42

Storm流式處理框架框架

2024-11-04 09:35:00

2025-05-28 05:10:00

策略Spring性能
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

色偷偷888欧美精品久久久| av电影天堂一区二区在线观看| 亚洲欧美国内爽妇网| 日韩一级片播放| 秋霞午夜理伦电影在线观看| 国产麻豆精品久久一二三| 欧美黑人一级爽快片淫片高清| 在线黄色免费网站| 日本精品不卡| 亚洲精选在线视频| 久久综合入口| 夜夜狠狠擅视频| 在线国产精品一区| 中文字幕亚洲欧美在线| av在线天堂网| 韩日精品一区| 午夜欧美在线一二页| 亚洲电影一二三区| 性欧美8khd高清极品| 丝袜美腿一区二区三区| 美女国内精品自产拍在线播放| 波多野结衣先锋影音| 中文字幕日韩亚洲| 黑人巨大精品欧美一区二区一视频 | 色欲AV无码精品一区二区久久| 国产精品久久久久久久久久久久久久久 | 日韩欧美一级视频| 97人人精品| 亚洲精品中文字幕av| 在线观看免费看片| 精品亚洲a∨| 欧美日韩国产综合新一区| 中文字幕在线亚洲三区| 日韩av成人| 国产99久久精品| 国产精品日韩精品| 欧美特黄aaaaaa| 狠狠爱综合网| 久色乳综合思思在线视频| 久久久久久久久福利| 欧美五码在线| 欧美一级一区二区| 亚洲va在线va天堂va偷拍| 精品3atv在线视频| 一本久道久久综合中文字幕| 日本wwwcom| 在线āv视频| 亚洲视频中文字幕| 亚洲一区二区三区精品动漫| 国产日本在线视频| 久久久久免费观看| 欧美精品国产精品久久久 | 国产河南妇女毛片精品久久久 | 欧美国产精品久久| 日本不卡高清视频一区| 黄色在线视频观看网站| 91美女在线视频| 久久偷看各类wc女厕嘘嘘偷窃| 亚洲精品字幕在线| 豆国产96在线|亚洲| 成人免费看片网址| 人人妻人人澡人人爽久久av| 国产**成人网毛片九色 | 中文字幕日韩av资源站| 亚洲永久一区二区三区在线| 日本视频不卡| 亚洲欧美另类久久久精品| 久久久成人精品一区二区三区| 麻豆视频免费在线观看| 亚洲欧美日韩在线| 国产欧美精品aaaaaa片| 高端美女服务在线视频播放| 欧美日韩在线第一页| 成人在线观看a| 成人午夜亚洲| 欧美一区二区三区不卡| 蜜桃视频无码区在线观看| 国产精品中文字幕制服诱惑| 亚洲精品久久久久久久久久久久 | 午夜精品一区二区三区在线视| 日本五十熟hd丰满| 免费看黄裸体一级大秀欧美| 国产精品久久不能| 国产精品久久久久久久久毛片 | 免费美女久久99| 91在线视频九色| 丁香六月色婷婷| 久久夜色精品国产噜噜av| 午夜欧美性电影| 尤物视频在线看| 欧美视频国产精品| 色婷婷一区二区三区av免费看| 久久久久久亚洲精品美女| 亚洲国内精品在线| 91麻豆精品国产91久久综合| 欧美激情综合色综合啪啪| 欧美亚洲成人xxx| 亚洲天堂一二三| av亚洲精华国产精华精华| 日本一区不卡| 先锋成人av| 欧美在线不卡视频| 亚洲视频天天射| 精品久久久久中文字幕小说 | 91麻豆制片厂| 亚洲激情不卡| 国产日韩欧美在线看| 男人天堂综合网| 国产精品天干天干在线综合| 无码 制服 丝袜 国产 另类| 国产一区影院| 日韩电影网在线| 人妻人人澡人人添人人爽| 亚欧成人精品| 成人性色av| 日本中文字幕在线2020| 狠狠综合久久av一区二区小说| 超碰人人草人人| 亚洲视频分类| 久久久久久久电影一区| 一级黄色大片免费| 久久一区二区三区四区| 国产美女主播在线播放 | 国产精品一区免费观看| 免费大片黄在线| 色噜噜久久综合| 中文字幕一区二区人妻电影丶| 国产韩日影视精品| 国产va免费精品高清在线| 亚洲乱码在线观看| 亚洲日本护士毛茸茸| 天天干天天干天天干天天干天天干| www.神马久久| 欧美xxxx14xxxxx性爽| 中文字幕久久网| 国产日韩欧美激情| 日本精品一区在线观看| 久久男人av| 国内精品400部情侣激情| www.成人在线观看| 亚洲日韩欧美一区二区在线| 欧美午夜aaaaaa免费视频| 亚洲伊人春色| 日本一区二区在线免费播放| 亚洲欧美日本在线观看| 午夜精品视频一区| 男男一级淫片免费播放| 亚洲美洲欧洲综合国产一区| 国产精品一区二区三区免费| 国产中文在线播放| 日韩av在线资源| 欧美a∨亚洲欧美亚洲| 国产成人精品影视| 99er在线视频| 国产精品极品| 韩剧1988在线观看免费完整版 | 亚洲欧美中文字幕在线一区| 亚洲va在线观看| 国产午夜亚洲精品午夜鲁丝片 | 在线看成人av| 91在线一区二区| 日韩久久一级片| 久久99国内| 国产伦精品一区二区三区精品视频 | 欧洲美女精品免费观看视频| 久久精品国产亚洲| 国产ts变态重口人妖hd| 亚洲永久精品大片| 国产精品福利导航| 久久久久国产精品午夜一区| 色狠狠久久av五月综合| 图片一区二区| 欧美激情视频网址| 瑟瑟在线观看| 欧美日韩在线不卡| 无码人妻精品一区二区三区夜夜嗨| 国产精品99久久久久久似苏梦涵| 国产精品久久久久久久乖乖| 欧美人与动xxxxz0oz| 国产精品国产福利国产秒拍| 黄色av电影在线观看| 日韩精品中文字幕一区| 国产成人无码精品久久久久| 国产欧美精品一区二区色综合| 亚洲色图偷拍视频| 亚洲性感美女99在线| 欧美精品一区二区三区在线看午夜 | 欧美区一区二| 乱一区二区三区在线播放| 成人国产精品入口免费视频| 欧美黑人xxxx| 18视频免费网址在线观看| 日韩欧美卡一卡二| 五月婷婷激情视频| 亚洲激情校园春色| 成人片黄网站色大片免费毛片| 久热成人在线视频| 欧美视频免费看欧美视频| 色综合色综合| 狠狠色噜噜狠狠狠狠色吗综合| 国产第一亚洲| 国语自产精品视频在线看| 视频三区在线| 日韩国产精品一区| 精品久久国产视频| 欧美中文字幕一区二区三区| 久草网视频在线观看| 欧美激情一区二区| 欧亚乱熟女一区二区在线 | 中文字幕99页| 麻豆久久久久久久| 欧美精品一区免费| 欧美va天堂在线| 亚洲春色在线| 少妇精品久久久| 成人三级视频在线观看一区二区| 日韩一区二区三区四区五区| 欧美亚洲日本网站| 乱插在线www| 久久天天躁狠狠躁夜夜躁| 黄色免费在线播放| 亚洲国产中文字幕久久网| 精品免费久久久| 欧美人体做爰大胆视频| 91青青草视频| 日韩欧美国产视频| 国产亚洲色婷婷久久99精品| 亚洲同性同志一二三专区| 欧美人与性囗牲恔配| 久久无码av三级| 日韩 中文字幕| 成人动漫精品一区二区| 亚洲午夜精品在线观看| 激情文学综合插| 岛国毛片在线播放| 蜜臀av性久久久久蜜臀aⅴ流畅 | 精品呦交小u女在线| 成人久久久精品国产乱码一区二区| 在线不卡免费av| 中文字幕在线观看免费| 欧美性猛片aaaaaaa做受| 波多野结衣电车痴汉| 一本大道av一区二区在线播放| 99热只有这里有精品| 亚洲成av人片在线观看无码| 久久精品国产亚洲av高清色欲| 亚洲欧美日韩一区| 男人操女人的视频网站| 亚洲精品高清在线观看| 农村妇女精品一区二区| 亚洲狠狠丁香婷婷综合久久久| www.av视频| 一区二区三区美女视频| 久久免费公开视频| 精品国产成人av| 国产性生活视频| 欧美性生活久久| 91成品人影院| 91精品国产麻豆国产自产在线 | 亚洲 欧美 日韩 综合| 五月婷婷另类国产| 黄色免费av网站| 欧美性xxxxxxxx| 97国产精品久久久| 欧美一二三在线| 亚洲精品国产精品乱码不卡| 亚洲国产精品999| 免费在线黄色电影| 日韩在线视频二区| 国产剧情在线| 性欧美视频videos6一9| 日韩新的三级电影| 成人在线播放av| 国内自拍欧美| 日本欧美色综合网站免费| 天天影视综合| 99在线精品免费视频| 久久一本综合频道| 在线观看免费不卡av| 国产99久久久精品| 欧美 日韩 国产 成人 在线观看 | 亚洲欧美综合v| 欧美一区二区三区在线观看免费| 欧美俄罗斯性视频| 神马久久资源| 亚洲xxxx3d| 亚洲第一二三区| 色香蕉在线观看| 国产亚洲毛片在线| 最新av免费在线观看| 成人的网站免费观看| 成人无码精品1区2区3区免费看 | 中文字幕 人妻熟女| 日韩午夜电影在线观看| 免费在线毛片| 欧美激情综合色| 福利视频亚洲| 国产综合18久久久久久| 欧美激情欧美| 国产精品沙发午睡系列| 国产麻豆精品久久一二三| 国产一二三四五区| 亚洲国产精品久久不卡毛片 | 日韩激情电影| 亚洲自拍偷拍网址| 国产精品片aa在线观看| 黄色a级片免费看| 乱一区二区av| av网站免费在线看| 亚洲一区二区三区精品在线| 一区二区视频免费观看| 亚洲精品电影在线| 成人在线app| 国产精品美女免费看| 久久草在线视频| 狠狠精品干练久久久无码中文字幕| 日韩精品电影在线观看| 先锋资源av在线| 亚洲在线观看免费| 91亚洲国产成人精品一区| 亚洲欧美国内爽妇网| 不卡视频观看| 国产伦精品一区二区三区视频黑人| 图片小说视频色综合| 性生交免费视频| 久久久久久影视| 亚洲影院在线播放| 亚洲护士老师的毛茸茸最新章节| av网址在线免费观看| 国产在线久久久| 999久久久国产精品| 蜜桃免费在线视频| 国产亚洲美州欧州综合国| 中国一级特黄毛片| 亚洲第一精品福利| 国精一区二区三区| 97碰碰视频| 欧美三级不卡| 制服.丝袜.亚洲.中文.综合懂| 亚洲欧美激情插| av在线资源观看| 美女av一区二区| 日韩精品成人| 久久天天东北熟女毛茸茸| 国内不卡的二区三区中文字幕| 美国一级片在线观看| 欧美日韩国产另类一区| 在线观看麻豆| 亚洲aa在线观看| 欧美精品一级| 国产精品嫩草69影院| 亚洲一级二级在线| 秋霞网一区二区| 青青久久av北条麻妃黑人| 一区二区美女| av在线无限看| 中文字幕一区二区三区在线观看 | 久久成人国产精品入口| 欧美α欧美αv大片| 9999热视频在线观看| 久久99久久精品国产| 天堂资源在线中文精品| 一区二区伦理片| 欧美另类videos死尸| 在线观看免费视频你懂的| 国产欧美日本在线| 天堂影院一区二区| 后入内射无码人妻一区| 日韩欧美亚洲国产另类 | 欧美1区免费| 中文字幕乱视频| 色综合咪咪久久| 色哟哟免费在线观看| 99在线热播| 亚洲自拍另类| 黄色裸体一级片| 精品人在线二区三区| 午夜欧美巨大性欧美巨大| 亚洲欧洲一区二区在线观看| 国产精品一区二区免费不卡| 亚洲一区欧美在线| 中文字幕在线看视频国产欧美| 日本成人在线网站| 久草视频国产在线| 国产欧美一区二区精品性色超碰 | 亚洲精品国产欧美| 国内精品伊人| 黄色成人在线看| 亚洲图片激情小说| 欧美美女搞黄| 91精品国产高清久久久久久91裸体 | 国产乱码精品一区二区| 久久男人资源视频| 日韩精品二区| 97香蕉碰碰人妻国产欧美| 欧美日韩三级在线| а√在线天堂官网| 2021狠狠干| 国产免费久久精品| 人妻少妇精品无码专区久久|