精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

初創公司如何從零開始訓練出優秀的LLMs 精華

發布于 2024-4-15 13:00
瀏覽
0收藏

鑒于我們在Reka成功地培訓了相當強大的多模態語言模型,許多人對從零開始建立基礎設施并訓練大型語言和多模態模型的經驗特別感興趣。

我在社交媒體上經常抱怨外部(Google之外)的基礎設施和代碼,這讓人們對我在荒野中錯過了什么,以及我對什么討厭/喜歡非常好奇。所以終于有了這篇文章。這篇博客文章揭示了挑戰和經驗教訓。

我希望這篇文章對許多人來說既有趣又有教育意義。

在荒野中訓練LLMs(圖片由 Dall-E 生成)

在LLMs時代的硬件抽獎

?訓練模型的第一個必要條件是獲取計算資源。這看起來似乎很簡單,也足夠容易。然而,最大的驚喜是計算資源提供商的不穩定性,以及集群、加速器及其連接的質量取決于來源的巨大差異。

人們總是認為這只是一個加速器選擇(例如TPUs vs GPUs等)的問題/爭論,而所有GPU集群都是平等的。但對我們來說,這很快就被證明是錯誤的。當我們嘗試不同的服務提供商時,我們發現即使是相同的硬件,例如GPU(H100),硬件質量的差異也是巨大的。請注意,這里的硬件指的是整個集群的質量,而不一定是芯片或加速器本身。就像彩票一樣。基本上:

并非所有硬件都是一樣的。不同硬件提供商的集群質量差異如此之大,以至于如何訓練出良好模型會成為一場真正的抽獎。簡而言之,這是LLM時代的硬件抽獎。

更具體地說,我們從多家計算資源提供商租用了幾個集群,每個集群都有數百至數千個芯片。我們看到的集群范圍從尚可(只是一些煩人的問題,只需花費一些 工程師的時間就可以解決)到完全無法使用的集群,由于各種原因每隔幾個小時就會失敗。具體來說,一些集群的節點每隔N個小時就會出現故障,問題涉及到布線問題(其中N是不合理小的數字)、GPU硬件錯誤等。更令人驚訝的是,同一提供商的每個集群在穩健性方面也可能截然不同。

與此同時,即使其他一些集群可能擁有明顯更穩定的節點,它們可能會遭受到I/O和文件系統糟糕的影響,甚至保存檢查點都可能導致超時或花費大量時間降低集群利用率。其他一些計算資源可能需要完全不同的軟件層才能運行,對于帶有自己代碼庫的團隊來說并不友好,需要額外的遷移成本來運行實驗或大型作業。

沒有完美的東西!但有些肯定比其他的要糟糕得多。

最令人沮喪的部分是什么呢?幾乎不可能事先真正了解,尤其是在一切都在瘋狂進行的情況下,人們將得到什么樣的硬件以及體驗的魯棒性/容錯性。

除此之外,你還無法知道供應商是否會延遲交貨幾個月,讓你處于無法從其他來源獲取資源的困境中數周甚至數月。有些提供商還會意外刪除你的檢查點ˉ\_(ツ)_/ˉ。

我提到了不同集群的模型浮點操作(Model Flop Utilisation,MFU)也會不同嗎?如果不幸地找到布線不良或其他問題的提供商,這將是一筆不可忽略的計算資源浪費。具有非常次優文件系統的系統在團隊成員開始在集群之間傳輸大量數據時,訓練運行的MFU會瞬間下降。

每個服務提供商也提供不同級別的支持。這些支持從禮貌到漠不關心,從“ChatGPT風格”的套話回復再到責怪用戶每一件事情都出錯。

總的來說,我們嘗試過的每個集群都感覺有著自己的氛圍、掙扎和失敗模式。幾乎每個集群似乎都需要為自己的一系列問題提供自己的修復措施 - 有些問題比其他問題更容忍。也就是說,我們已經學到了備用方案的重要性,快速為任何集群找到修復措施可能是關鍵。

在過去的幾個月里,我們已經做了很多工作,只是為了確保事物能夠使用,例如,圍繞監控工具、高效的檢查點,以及各種其他優化,甚至安裝我們的自定義文件系統以實現可擴展的數據存儲 - 并且這只是實際需求的冰山一角。

這些工具組合帶來了MFU 的顯著改進,同時還最大限度地減少了糟糕硬件帶來的停機時間。

GPU與TPU的對比

在Reka,我們大部分時間都是在GPU上訓練我們的模型。就我個人而言,在Reka之前的Google生活中,我一直使用TPU進行大型語言模型訓練。CUDA和nccl對我來說是最陌生的東西。(我只是從一個曾在Nvidia工作過的同事那里學到它的發音是“Nickel” 哈哈)

與我在Google使用TPU的經驗相比,我完全驚訝于GPU的故障率。事實上,我實際上不太記得在Google使用TPU時出現過太多故障,即使是在大規模運行時,盡管我不確定我是否被這個簡直太好的基礎設施和專門的硬件團隊的強大保護著。事實上,UL2 20B模型(在Google)是通過不小心讓作業運行了一個月來訓練的。它從未失敗過。如果這是在GPU領域,它肯定會在最初的幾天內就失敗了。

話雖如此,我認為這更多地與管理加速器的硬件團隊的能力有關,而不是與底層芯片有關。擁有良好的硬件支持(來自計算資源提供商)很重要。很多事情取決于他們是否真的很有能力,這加強了“硬件抽獎”的概念。

GPU領域感覺很奇怪。與在TPU架構中作為分布式訓練的首要選擇不同,在GPU領域,多節點訓練似乎更像是事后想到的。在GPU領域,似乎不同的提供商以不同的方式將它們連接起來以實現多節點訓練,這導致了在不同地方進行事情的方式存在很大差異。雖然我不是硬件方面的專家,但這是我得到的印象。

多集群設置的痛苦

我職業生涯的大部分時間都花在了谷歌的基礎設施上,它主要運行在Borg、Xmanager和Colossus上,從任何地方都可以訪問所有內容。因此,實際上需要在不同的集群中設置新環境的概念對我來說是陌生的。

在當前世界中,除非專門為單個位置的大量集群構建,否則擁有多個加速器池集群似乎是不可避免的。更具體地說,GPU供應(或缺乏)也自然導致了這種以集群采購的模式,其性質是分散的。訓練大型模型還需要大量的數據,即使只是將它們移動一下也會帶來很多不便。與此同時,通常復制數據也不是直接的,在極大規模上是難以承受的。

顯然,理想情況下是有一種專門建立的編排層,可以將作業發送到不同的服務器。我相信許多大型AI優先公司通常都有某種基礎設施來改善AI研究人員的生活質量。然而,對于一個剛起步的精益的新創企業來說,構建這種復雜和花哨的ML訓練基礎設施實際上是不太可能的。

目前,我們開發了許多內部工作流來減輕許多這些問題,并且正在繼續朝著世界一流的實驗基礎設施的黃金標準邁進。

(有人告訴我,這種雜亂的設置或多或少是非頂級/大公司的常態)。

代碼在野外

毫無疑問,我有史以來最喜歡的代碼庫是T5X和Mesh Tensorflow(命名張量太贊了),但這些選項很快就變得不可行,原因是:1)它們在谷歌之外得不到太多支持,2)它們已經有點被棄用了,3)對于我們團隊中的非谷歌人員來說并不友好。

我們最終選擇了一些常規的、看起來比較穩定且更受歡迎的選項(即,pytorch),這對大多數團隊成員來說更易于接觸(除了我哈哈)。在我最初的幾個月里,我在pip、git、docker和所有這些野生的東西感到困惑。不過話說回來,我不太確定使用谷歌的代碼庫外部會有多穩定或用戶友好(我猜這會非常令人討厭)。

坦率地說,我不得不說外部代碼庫的質量明顯落后于我在谷歌習慣的那些。主要是因為谷歌內部的代碼庫往往是由機器學習界的明星們親自編寫的(例如,Noam Shazeer、Barret Zoph、Adam Roberts、Hyung Won Chung等等),并且與我在外部嘗試過的代碼庫相比,感覺更好(例如,優越的氛圍)。特別是,當我嘗試使用其他公司構建的東西時,我發現自己對代碼質量感到非常惱火(有些比其他更糟糕??)。

另外,我從來不知道更改模型并行性的能力不是自動(免費)的,直到某些代碼庫要求我編寫一個轉換器來更改模型的并行性。對我來說這絕對是一個WTF時刻。

另一個引人注目的事情是這些代碼庫對大規模編碼器-解碼器訓練甚至 prefixLM 訓練的支持非常少。為此,即使 Flash Attention 也一直拒絕為 prefixLM 訓練(即自定義掩碼)提供支持,盡管出于某種原因對其 github 問題有合理的需求。

我知道我應該使用Jax。一個朋友剛剛因我使用pytorch而羞辱了我,但這是一個創業公司,我們決定快速行動。對此我很抱歉,下次我們會做得更酷一些。我對這個事實并不感到自豪。

少一點原則,多一點Yolo

系統地擴展模型通常需要以一種原則性的方式從小規模到大規模進行,即在多個階段運行實驗(從1B到8B到64B到300B等),然后選擇出獲勝者并持續擴展它們。在創業公司中,我們擁有的計算資源遠遠不足以進行大規模的參數掃描。最終,我們不得不依靠許多“Yolo”運行(幸運的是,結果還不錯)。

最終,我們只需要進行了非常少量的小規模和較短的割裂實驗,就能夠獲得強大的21B Reka Flash模型和7B邊緣模型(以及即將推出的最大核心模型)。在有限數量的運行中找到一個可靠的配方是具有挑戰性的,因為搜索空間非常巨大,必須同時改變許多變量。為了做到這一點,人們必須放棄大型科技公司的系統性,大量依賴于“Yolo”、直覺和本能。

值得慶幸的是,我(以及我們團隊中的許多人)在我們的機器學習職業生涯中已經積累了相當多的直覺,以便在相當短的嘗試次數內得到正確的結果。雖然我們之前在以往的工作中訓練過非常好的模型,但是訓練基礎設施、數據、新思想的融入以及其他環境問題的差異仍然可能導致結果的巨大差異。盡管如此,強大的先驗知識有助于顯著減少搜索空間,并且可能是我們能夠用如此少的嘗試、資源和實驗訓練出非常強大的模型的最簡單的解釋之一。

簡而言之

探索荒野中的事物是一次有趣的經歷。不幸的是,這并不是一帆風順的。計算資源的稀缺以及不可靠的計算資源提供商會使事情變得比預期的要困難得多,但我們很高興用強大的技術實力度過了難關。

總的來說,這只是我們如何在不到一年的時間里創辦一家公司、籌集一些資金、購買一些芯片并匹配 Gemini pro/GPT 3.5 并超越許多其他公司的故事的一小部分,而一切都從頭開始。

還有更多要寫的,比如數據管道、人工評估等,但這已經是一篇很長的文章了。下次再寫。

關于作者:

Yi Tay是Reka的聯合創始人兼首席科學家。Reka致力于構建先進的生成式 AI 模型。

此前,他曾是Google Brain的高級研究科學家,專注于大型語言模型和人工智能領域。在加入Brain團隊之前,他是Google Research美國研究團隊的技術負責人,致力于Transformer的擴展和架構研究,并為約20個產品發布做出了貢獻。

他在Google任職期間,參與了許多產業級的大語言模型的開發,如PaLM、UL2、Flan-{PaLM/UL2/T5}、LaMDA/Bard、MUM等。他還為大型多模態模型,如ViT-22B和PaLI-X做出了貢獻。他還是新PaLM-2和PaLM API的建模聯合負責人。

收藏
回復
舉報
回復
相關推薦
亚洲男人天堂一区| 久久国产综合精品| 亚洲精品自拍第一页| 成人中文字幕在线播放| 日本福利片在线| 日韩成人一区二区三区在线观看| 日韩三级成人av网| 人妻无码中文久久久久专区| 精品亚洲美女网站| 亚洲免费三区一区二区| 精品一区二区国产| 亚洲图片欧美在线| 亚洲精品四区| 日韩在线视频国产| 又黄又爽的网站| 日韩专区视频网站| 精品成人久久av| 正在播放一区| 免费在线超碰| 国产成人自拍网| 国产精品激情av电影在线观看| 顶级黑人搡bbw搡bbbb搡| 国内自拍欧美| 欧美亚洲愉拍一区二区| av网站大全免费| 2017亚洲天堂1024| 91视频免费看| 粉嫩av免费一区二区三区| 男人的天堂av网站| 激情久久久久久| 日韩中文字幕在线视频| 熟女少妇一区二区三区| 亚洲综合网站| 4438成人网| 91av俱乐部| 青青青免费在线视频| 一区二区三区在线看| 亚洲欧美日韩另类精品一区二区三区 | 国产精品欧美一区二区| 国产精品999在线观看| 欧美国产精品| 久久久国产91| 精品国产大片大片大片| 国产成人精品免费视| 亚洲国产精彩中文乱码av| 成人三级做爰av| 香蕉久久一区| 欧美日韩视频在线观看一区二区三区 | 亚洲伦理精品| 久久久免费电影| 成年人av电影| 午夜久久黄色| 欧美成人免费视频| 国产高潮国产高潮久久久91| 国产精品二区不卡| xxxxx91麻豆| 免费在线观看黄色小视频| 久久综合av| 日韩网站免费观看| 欧美一级特黄高清视频| 国产精品福利在线观看播放| 久久久成人的性感天堂| 国产高潮国产高潮久久久91| 欧美永久精品| 久久免费在线观看| 西西44rtwww国产精品| 99精品热6080yy久久| 欧美亚洲成人免费| 老熟妇一区二区三区| 日本一不卡视频| 91精品久久久久久综合乱菊| 99久久精品国产一区色| 国产高清在线精品| 好看的日韩精品| 你懂的在线看| 国产精品色哟哟网站| 亚洲精品偷拍视频| 丁香花在线影院| 欧美色图在线视频| 在线观看av网页| 国产一区二区| 日韩电影大片中文字幕| av女人的天堂| 91精品国产视频| 久久青草福利网站| 超碰在线免费97| 国产剧情av麻豆香蕉精品| 国产91精品入口17c| 台湾av在线二三区观看| 国产欧美视频一区二区三区| 在线播放 亚洲| 国产传媒av在线| 欧美日韩精品在线观看| 男女污污的视频| 成人激情久久| 国产视频精品在线| 国产第一页浮力| 国产日韩欧美高清免费| 国产免费亚洲高清| 天堂av手机版| 中文字幕色av一区二区三区| 成人性生活视频免费看| 国产91精品在线| 亚洲国产精品va在看黑人| 国产又黄又粗视频| 尤物精品在线| 国产在线观看精品| 日产精品久久久久久久性色| 亚洲欧美成人一区二区三区| 日本在线视频www| 精品一区二区三区中文字幕在线| 亚洲美女av电影| 真实国产乱子伦对白在线| 久久精品一区| 国产一区二区三区四区hd| jizz在线观看中文| 午夜电影一区二区三区| 亚洲欧美偷拍另类| 国产一区二区在线| 91精品国产91久久久久久最新 | 精品精品欲导航| jizzjizz日本少妇| 亚洲一区二区三区四区五区午夜| 91最新国产视频| aiai在线| 色偷偷久久人人79超碰人人澡| 欧美日韩一区二区区别是什么 | 成人51免费| 中文字幕日韩高清| 国产一级片毛片| 成人综合婷婷国产精品久久蜜臀 | 免费视频91蜜桃| 国产精品久久国产愉拍| 99久久99| 成人免费网站在线观看视频| 欧美午夜精品久久久久久超碰| 日本一区二区三区网站| 精品成人国产| 国产精品日韩一区二区免费视频| gogo在线观看| 欧美一级日韩免费不卡| 青青青手机在线视频| 日韩福利电影在线观看| 欧美日韩一区二| 欧美日韩美女| 亚洲视频第一页| 青青视频在线免费观看| 91麻豆国产精品久久| 波多野结衣综合网| 欧美交a欧美精品喷水| 国内精品伊人久久| 欧美一区二区黄片| 亚洲va韩国va欧美va精品| 污污免费在线观看| 亚洲激情社区| 久久本道综合色狠狠五月| 国产在线美女| 亚洲精品视频在线播放| 天天操夜夜操视频| 久久久av毛片精品| www.激情小说.com| 国产精品99久久| 99久久综合狠狠综合久久止| 色屁屁www国产馆在线观看| 日韩一区二区三区av| 欧洲猛交xxxx乱大交3| 国产成人aaa| 欧美成人三级在线视频| 日韩欧美影院| 日韩免费观看高清| 91最新在线| 日韩欧美专区在线| 在线观看黄网站| 欧美国产精品劲爆| 亚欧精品在线视频| 亚洲精品国产日韩| 日本一区二区三区四区在线观看| 欧美视频免费看| 欧美日韩高清区| 三级做a全过程在线观看| 在线视频欧美区| 国产稀缺精品盗摄盗拍| 成人福利电影精品一区二区在线观看| 草草久久久无码国产专区| 国产欧美一区二区三区精品观看| 国产精自产拍久久久久久| 曰本三级在线| 亚洲香蕉av在线一区二区三区| 一级片免费网站| 亚洲国产精品久久久男人的天堂 | 黄色一级片免费的| 欧美精品大片| 日本日本精品二区免费| 国产精品美女久久久久人| 午夜精品一区二区三区av| 国产在线超碰| 欧美r级电影在线观看| 日韩一级在线视频| 亚洲黄网站在线观看| 中文字幕一区二区三区人妻电影| 久久99国产精品久久99| 精品无码国模私拍视频| 久久亚洲精品中文字幕蜜潮电影| 国产乱码精品一区二区三区卡 | 精品一区国产| 91精品国产一区二区在线观看| 97视频在线播放| 欧美日韩在线看片| 精品视频在线播放色网色视频| 国产精品久久影视| 欧美性猛交xxx| 欧美片一区二区| 中文字幕av一区二区三区高| 三级视频网站在线观看| 国精产品一区一区三区mba桃花| 国产日韩一区二区在线| 欧美精品日韩| 伊人情人网综合| 久久av网址| 精品国产一区二区三区四区精华| 欧美高清hd| 国产美女搞久久| 97精品国产综合久久久动漫日韩 | 91丨九色丨蝌蚪丨老版| av在线免费看片| 日韩不卡一二三区| 自慰无码一区二区三区| 国内精品亚洲| 国产精品av免费观看| 色天天久久综合婷婷女18| 欧美日韩精品久久久免费观看| 亚洲伊人影院| 999精品视频一区二区三区| 国产精品久久久久久久久免费高清| 57pao国产精品一区| ririsao久久精品一区| 欧美猛交ⅹxxx乱大交视频| 黄色网址在线免费观看| 日韩中文在线中文网三级| 成年人在线观看视频| 亚洲欧美精品中文字幕在线| 五月婷婷丁香六月| 亚洲激情视频在线观看| 日本高清视频免费观看| 精品精品国产高清a毛片牛牛| 性色av蜜臀av| 日韩欧美国产一二三区| www久久久com| 欧美成人艳星乳罩| 国产91久久久| 日韩不卡在线观看| 欧美亚洲日本| 国产一区二区美女视频| 电影av一区| 日韩中文字幕在线视频| 看女生喷水的网站在线观看| 久久天天躁狠狠躁夜夜av| 国产福利在线播放麻豆| 欧美大尺度激情区在线播放| 欧美v亚洲v| 51色欧美片视频在线观看| www.成人影院| 国产精品一区二区久久精品| 99综合99| 国产99在线免费| 欧美五码在线| 色噜噜色狠狠狠狠狠综合色一 | 91精品国产91久久久久麻豆 主演| 在线免费高清一区二区三区| 每日在线更新av| 日本在线观看不卡视频| 色呦色呦色精品| 国产成人精品aa毛片| 香港三级日本三级| 国产日韩av一区二区| 欧美特黄一级片| 亚洲一二三区在线观看| 黄色在线免费观看| 欧美人伦禁忌dvd放荡欲情| www.色婷婷.com| 国产视频精品免费播放| 免费a级在线播放| 久久久久成人网| 91精品xxx在线观看| 成人激情视频小说免费下载| 北条麻妃一区二区三区在线| 欧美精品欧美精品系列c| 第一社区sis001原创亚洲| 免费看黄色a级片| 六月丁香综合| 亚洲精品mv在线观看| 99国产欧美另类久久久精品| jizz日本在线播放| 亚洲综合免费观看高清在线观看| 亚洲天堂av片| 欧美一级久久久久久久大片| 精品欧美不卡一区二区在线观看| 久久在线视频在线| 天堂av在线网| 亚洲www在线观看| 久久综合亚洲| www.日本三级| 日本成人在线电影网| www.四虎在线| 国产精品理论片| 69视频免费在线观看| 欧美一区二区三区免费视频| 你懂的视频在线| 欧美黑人一区二区三区| 国产一区二区三区朝在线观看| 福利视频久久| 色综合五月天| 国产91在线免费| 粉嫩av一区二区三区| 国产视频不卡在线| 欧美日韩国产丝袜另类| 国产精品久久无码一三区| 国产一区二区三区在线看| 国产99在线观看| 国产精品国产精品| 五月精品视频| 中文字幕 91| 久久精品一区蜜桃臀影院| 久久丫精品久久丫| 777午夜精品视频在线播放| 国产一级二级三级在线观看| 国语自产精品视频在线看抢先版图片 | 韩国免费在线视频| 国模极品一区二区三区| 国产精选久久| 最新不卡av| 久久99深爱久久99精品| 亚洲欧洲久久久| 色综合久久天天综合网| 五月激情婷婷综合| 隔壁老王国产在线精品| 一区二区三区视频免费视频观看网站| 宅男av一区二区三区| 秋霞成人午夜伦在线观看| 蜜桃无码一区二区三区| 精品久久久久久亚洲精品| 成人午夜福利视频| 欧美激情在线观看| 中文在线综合| 国产精品www在线观看| 国产a视频精品免费观看| 激情综合五月网| 精品奇米国产一区二区三区| 99自拍视频在线观看| 亚洲最大的免费| 欧美日本一区二区视频在线观看 | 欧美国产精品专区| 欧美国产一级片| 中文字幕九色91在线| 国产成人亚洲一区二区三区| 天天综合色天天综合色hd| 日韩av电影天堂| 精品国产大片大片大片| 欧美一区二区三区的| 影音先锋男人在线资源| 国产精品久久国产三级国电话系列 | 亚洲天堂成人在线| 日韩制服一区| 亚洲一区三区电影在线观看| 韩国精品在线观看| 欧美激情精品久久| 亚洲第一综合天堂另类专| 松下纱荣子在线观看| 欧美一区二区三区成人久久片| 免费在线观看一区二区三区| 免费黄色国产视频| 日韩欧美中文一区二区| aa级大片免费在线观看| 欧美高清性xxxxhd| 久久成人综合网| 久久久久久蜜桃| 亚洲午夜未满十八勿入免费观看全集| 日韩国产大片| 被灌满精子的波多野结衣| 91免费看`日韩一区二区| 最新中文字幕免费| 久国内精品在线| 要久久爱电视剧全集完整观看| 在线观看国产中文字幕| 一区二区欧美国产| 伦理片一区二区三区| 91日本视频在线| 国产精品毛片在线| av最新在线观看| 日韩av中文字幕在线播放| 开心久久婷婷综合中文字幕 | 快she精品国产999| 欧美h片在线观看| 亚洲黄在线观看| 小说区图片区亚洲| 北条麻妃在线视频观看| 亚洲欧洲中文日韩久久av乱码| 亚洲色图狠狠干| 91精品视频在线看| 久久久久国产一区二区|