精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

OpenAI開源GPT-4 SAE,提供1600萬個解釋模式

發(fā)布于 2024-6-7 11:00
瀏覽
0收藏

6月7日凌晨,OpenAI在官網(wǎng)開源了GPT-4的稀疏自動編碼器(Sparse AutoEncoder,簡稱“SAE”)。


雖然現(xiàn)在大模型的功能越來越強,能生成文本、圖片、視頻、音頻等內(nèi)容,但是你無法控制神經(jīng)網(wǎng)絡(luò)生成的內(nèi)容,例如,你問ChatGPT多個相同的問題,可能每一次回答的內(nèi)容都不相同。


就像我們睡覺做夢一樣,無論你怎么集中注意力還是很難精準(zhǔn)控制腦神經(jīng)形成的夢境。這就會出現(xiàn)很多無法控制的情況,例如,大模型生成的內(nèi)容帶有歧視性、錯誤、幻覺等。


SAE的主要作用是在訓(xùn)練過程中引入稀疏性約束,幫助大模型學(xué)習(xí)到數(shù)據(jù)的更有意義、更具解釋性的特征表示,使其輸出的內(nèi)容更精準(zhǔn)、安全。所以,SAE對于開發(fā)前沿、超強功能的大模型非常重要

OpenAI開源GPT-4 SAE,提供1600萬個解釋模式-AI.x社區(qū)

早在2023年10月,著名大模型平臺Anthropic發(fā)布了一篇《朝向單義性:通過詞典學(xué)習(xí)分解語言模型》的論文,深度解釋了神經(jīng)網(wǎng)絡(luò)行為的方法。


Anthropic在一個小型的Transformer架構(gòu)模型進(jìn)行了實驗,將512個神經(jīng)單元分解成4000多個特征,分別代表 DNA 序列、法律語言、HTTP 請求、營養(yǎng)說明等。


研究發(fā)現(xiàn),單個特征的行為比神經(jīng)元行為更容易解釋、可控,同時每個特征在不同的AI模型中基本上都是通用的。

OpenAI開源GPT-4 SAE,提供1600萬個解釋模式-AI.x社區(qū)

而本次OpenAI不僅公布了論文還開源了代碼,同時提供了一個在線體驗地址,與全球開發(fā)者分享他們的研究成果,同時讓用戶深度了解神經(jīng)網(wǎng)絡(luò)生成的內(nèi)容流程,以便更精準(zhǔn)、安全地控制大模型輸出。


開源地址:https://github.com/openai/sparse_autoencoder

論文地址:https://cdn.openai.com/papers/sparse-autoencoders.pdf

在線demo:https://openaipublic.blob.core.windows.net/sparse-autoencoder/sae-viewer/index.html

?

什么控制神經(jīng)網(wǎng)絡(luò)行為很難

?

無論你用多么精準(zhǔn)的提示詞,都無法讓DALL·E 3、Stable Difusion生成100%相吻合的圖片。這是因為,神經(jīng)網(wǎng)絡(luò)的輸出很大程度上依賴于它們所接受的訓(xùn)練數(shù)據(jù)。


神經(jīng)網(wǎng)絡(luò)通過大量的樣本數(shù)據(jù)學(xué)習(xí)到復(fù)雜的模式和特征。但是,訓(xùn)練數(shù)據(jù)本身可能包含噪聲、偏差或者數(shù)據(jù)標(biāo)準(zhǔn)不準(zhǔn)確等。這些因素會直接影響神經(jīng)網(wǎng)絡(luò)對輸入數(shù)據(jù)的響應(yīng)。


例如,讓神經(jīng)網(wǎng)絡(luò)生成一張貓的圖片。如果訓(xùn)練數(shù)據(jù)中有一些不清晰或錯誤標(biāo)記的圖片,例如狗或其他動物的照片,模型可能會在生成貓的圖片時出現(xiàn)混亂,生成出一些看起來不像貓的圖像。同理,文本類的ChatGPT等產(chǎn)品也會出現(xiàn)一本正經(jīng)胡說八道的情況。

OpenAI開源GPT-4 SAE,提供1600萬個解釋模式-AI.x社區(qū)

神經(jīng)網(wǎng)絡(luò)的內(nèi)部結(jié)構(gòu)和參數(shù)設(shè)置極其復(fù)雜。隨著技術(shù)的迭代,目前隨便一個神經(jīng)網(wǎng)絡(luò)模型的參數(shù)都在幾十億甚至數(shù)百億,這些參數(shù)共同決定了模型的行為。


在訓(xùn)練過程中,我們通過優(yōu)化算法(如梯度下降法)對這些參數(shù)進(jìn)行調(diào)整,但最終模型的表現(xiàn)是所有參數(shù)綜合作用的結(jié)果,而非單一參數(shù)所能決定的。


這種復(fù)雜性導(dǎo)致我們難以精確預(yù)測或控制任何特定的輸出。例如,如果你調(diào)整一個參數(shù)來讓生成的圖片更有細(xì)節(jié),它可能導(dǎo)致其他部分的圖片出現(xiàn)失真或不自然的效果。

OpenAI開源GPT-4 SAE,提供1600萬個解釋模式-AI.x社區(qū)

此外,神經(jīng)網(wǎng)絡(luò)的設(shè)計和訓(xùn)練目標(biāo)通常是為了優(yōu)化整體性能指標(biāo)(如準(zhǔn)確率、損失函數(shù)等),而不是精確到每一個具體的輸出細(xì)節(jié)。例如,在圖像生成中,模型的目標(biāo)可能是生成總體上看起來真實的圖片,而不是控制每一個像素的具體值。


同樣,在文本生成中,模型的目標(biāo)是生成語法正確、語義連貫的句子,而不是控制每個單詞的具體選擇。例如,一個訓(xùn)練寫詩的模型,目標(biāo)是寫出富有詩意的句子,而不是精確到每一個詞的位置和使用頻率。


這也就是說,大模型的輸出通常是基于概率分布的采樣,輸出不可避免地帶有一定程度的不確定性。


OpenAI的SAE簡單介紹

?

SAE是一種無監(jiān)督學(xué)習(xí)算法,屬于自編碼器家族的一種,主要用來學(xué)習(xí)輸入數(shù)據(jù)的有效且稀疏的低維表示。在傳統(tǒng)的自編碼器中,數(shù)據(jù)被編碼成一個潛在的低維表示,然后再解碼回原始數(shù)據(jù)空間,目的是使重構(gòu)的數(shù)據(jù)盡可能接近原始輸入。


而SAE在此基礎(chǔ)上添加了一個關(guān)鍵特性,即對隱藏層的激活進(jìn)行稀疏性約束,這意味著在隱藏層中只有少量的神經(jīng)元會被激活(通常接近0),而大部分神經(jīng)元則保持在非常低的激活水平或者完全不激活。


從OpenAI公布的論文來看,為了深度理解大模型的單個神經(jīng)元行為,OpenAI使用了一種N2G的方法。


N2G的核心思想是,如果一個潛在單元在給定的輸入模式下被激活,那么這個單元可能對輸入中的某些特定特征或模式特別敏感


通過識別這些特征或模式,我們可以為每個潛在單元構(gòu)建一個圖表示,圖中的節(jié)點對應(yīng)于輸入序列中的特定位置,而邊則表示這些位置之間的依賴關(guān)系。這種圖表示可以揭示潛在單元激活的條件,從而提供對模型行為的直觀理解。

OpenAI開源GPT-4 SAE,提供1600萬個解釋模式-AI.x社區(qū)

N2G的構(gòu)建過程開始于選擇一些能夠激活特定潛在單元的序列。對于每個序列,N2G尋找最短的后綴,這個后綴仍然能夠激活該潛在單元。這個過程是為了確定潛在單元激活的最小必要條件。


接著,N2G會檢查內(nèi)容是否可以被填充標(biāo)記替換,以插入通配符,從而允許在解釋中包含變化的部分。此外,N2G還會檢查解釋是否依賴于絕對位置,即在序列的開始處插入填充標(biāo)記是否會影響潛在單元的激活。

OpenAI開源GPT-4 SAE,提供1600萬個解釋模式-AI.x社區(qū)

N2G還有一個非常大的技術(shù)優(yōu)勢就是對算力需求很低,與需要模擬整個模型行為的解釋方法相比,N2G只需要分析潛在單元的激活模式即可。


目前,OpenAI通過SAE在GPT-4模型中找到了1600萬個可解釋的模式和特征,但這還遠(yuǎn)遠(yuǎn)不夠。如果想通過SAE完整捕捉大模型的行為,大概需要10億或數(shù)萬億個特征才可以。


本文轉(zhuǎn)自 AIGC開放社區(qū) ,作者:AIGC開放社區(qū)


原文鏈接:??https://mp.weixin.qq.com/s/swJDQDsc2M652IYrpTYxog??

標(biāo)簽
收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦
国产中文字幕在线看| 一级片中文字幕| а√中文在线天堂精品| 精品久久久久久中文字幕| 欧洲精品亚洲精品| 精品国产无码AV| 久久久久国产一区二区| 色综合久综合久久综合久鬼88| 51调教丨国产调教视频| 午夜精品久久久久久毛片| 午夜一区二区三区在线观看| 亚洲免费精品视频| 午夜性色福利视频| 国产一区二区三区日韩| 欧美在线一级视频| 成年人av电影| 成人综合专区| 日韩久久精品成人| 天堂va欧美va亚洲va老司机| 亚洲www啪成人一区二区| 亚洲综合激情网| 一区二区三区四区国产| 免费国产在线观看| 丁香六月综合激情| 成人中文字幕在线观看 | 精品国产1区2区| 欧美一进一出视频| 天天干免费视频| 国产精品主播直播| 国产色婷婷国产综合在线理论片a| 日韩免费不卡视频| 欧美日本免费| 免费91在线视频| 国产在线免费看| av在线不卡顿| 亚洲欧洲视频在线| av网站有哪些| 美女一区二区在线观看| 欧美一区二区三区四区在线观看| 亚洲免费一级视频| 成人软件在线观看| 日韩欧美中文在线| 99爱视频在线| 特黄毛片在线观看| 亚洲成人1区2区| 国产96在线 | 亚洲| 欧美黄色视屏| 亚洲午夜久久久| 日本天堂免费a| 污污影院在线观看| 一区二区三区四区在线播放 | 特级西西www444人体聚色 | 一区二区三区四区免费观看| h网站在线免费观看| 国产视频一区二区在线| 日韩电影免费观看高清完整| 国产在线一二| 国产精品三级av| 在线精品亚洲一区二区| 男人的天堂在线视频免费观看 | 四虎成人在线观看| 久久亚洲风情| 国产免费成人av| 国产麻豆免费观看| 国产成人福利片| 狠狠色噜噜狠狠色综合久| 天堂在线视频免费观看| 久久综合五月天婷婷伊人| 青青成人在线| 成人在线播放免费观看| 一区二区三区国产精品| 五月丁香综合缴情六月小说| 成人性生活av| 欧美日本一区二区三区四区| 日韩视频在线观看一区二区三区| www.亚洲一二| 亚洲人成在线播放| 无码人妻精品中文字幕| 欧美午夜影院| 日韩美女视频在线观看| 国产一区二区在线视频聊天 | 欧美性猛交xxxx乱| 午夜久久免费观看| 亚洲3p在线观看| 91porny九色| 国产精品性做久久久久久| 国产欧美日韩综合精品二区| 国产精品久久久久一区二区国产| 国产精品国产精品国产专区不片| 久久人妻无码一区二区| 成人影院av| 欧美一区二区在线播放| 一起草在线视频| 天天综合精品| 97国产精品视频| 又色又爽又黄无遮挡的免费视频| 国产盗摄一区二区三区| 日韩电影免费观看在| 丝袜美腿av在线| 欧美在线视频全部完| 在线播放av网址| 欧美一区二区三区激情视频| 欧美肥臀大乳一区二区免费视频| 少妇高潮av久久久久久| 国产成人啪免费观看软件| 欧洲视频一区二区三区| 白白色在线观看| 欧美日韩国产美| 在线精品一区二区三区| 国产精品久久久久久久免费观看| 日本不卡高字幕在线2019| 性欧美8khd高清极品| 国产精品美女久久久久高潮| 九色在线视频观看| 亚洲一区二区三区免费| 色噜噜亚洲精品中文字幕| xxxx.国产| 成人国产在线观看| 97精品国产97久久久久久粉红| 欧美成人黑人| 亚洲激情视频在线播放| 无码人妻精品一区二区三区夜夜嗨| 久久精品123| 精品日本一区二区| 欧美性爽视频| 欧美一区二区三区在线观看视频| 久久久久久成人网| 日韩国产在线一| 久久影视中文粉嫩av| 成全电影大全在线观看| 日韩精品一区国产麻豆| 顶级黑人搡bbw搡bbbb搡| 日韩中文字幕不卡| 麻豆久久久9性大片| 女人让男人操自己视频在线观看 | av一区二区三区四区电影| 日本高清视频在线观看| 欧美性高跟鞋xxxxhd| 97精品人妻一区二区三区蜜桃| 亚洲激情五月| 91视频-88av| 成人短视频在线| 91精品国产综合久久小美女 | 午夜精品123| 亚洲欧美日韩色| 国产欧美另类| 九九热久久66| 日韩免费福利视频| 亚洲性69xxxbbb| 波多野结衣视频免费观看| 久久久久国产精品免费免费搜索| 日本在线观看a| 国产探花在线精品| 国产美女高潮久久白浆| 黄色av免费在线| 精品日韩一区二区| 日本少妇激情舌吻| 91一区在线观看| 国产福利一区视频| 操欧美老女人| 亚洲自拍偷拍在线| 岛国在线视频网站| 亚洲天堂成人在线| 97精品人妻一区二区三区香蕉| 日韩美女视频19| 丰满少妇中文字幕| 夜久久久久久| 色狠狠久久av五月综合|| 免费成人高清在线视频| 美乳少妇欧美精品| 五月天婷婷社区| 91成人看片片| 九九视频免费看| fc2成人免费人成在线观看播放| 99爱视频在线| 欧美乱妇15p| 视频一区亚洲 | 国产成人精品免费久久久久| 黄色在线免费观看大全| 欧美日韩国产免费一区二区 | 亚洲欧美日本国产专区一区| 日韩在线国产| 国产一区二区三区免费观看在线| 欧美精品18videosex性欧美| 青青免费在线视频| 欧美乱妇20p| 制服.丝袜.亚洲.中文.综合懂色| 国产精品欧美一区喷水| 亚洲欧美日韩网站| 久久久人人人| 国产精品无码乱伦| 日日天天久久| 亚洲va久久久噜噜噜久久天堂| 白浆在线视频| 色诱女教师一区二区三区| 亚洲精品无码久久久| 欧美亚洲禁片免费| 久久影院一区二区| 欧美激情在线看| 精品一区二区三区四区五区六区| 日本午夜一区二区| 霍思燕三级露全乳照| 图片小说视频色综合| 精品一区国产| 日本一区影院| 国产精品久久久久7777婷婷| 爱啪视频在线观看视频免费| 久久久av一区| 电影在线一区| 日韩hd视频在线观看| 国产强被迫伦姧在线观看无码| 一本色道久久综合精品竹菊| 青娱乐国产在线| 国产精品乱码一区二三区小蝌蚪| 日韩成人av一区二区| 国产综合成人久久大片91| 狠狠操精品视频| 99热这里只有精品8| 午夜啪啪福利视频| 日韩欧美午夜| 日本在线观看一区二区| 国产精品网在线观看| 92看片淫黄大片欧美看国产片| 丝袜美腿一区| 欧美一二三视频| 变态调教一区二区三区| 久久视频在线观看免费| 日韩在线免费电影| 国产一区二区激情| 欧美成人综合在线| 日韩成人中文字幕| 欧美一级淫片aaaaaa| 日韩一区二区免费电影| 亚洲图片小说视频| 欧美日韩免费一区二区三区| 欧美日韩综合一区二区三区| 精品日韩中文字幕| 黄色片视频网站| 香蕉影视欧美成人| 久久这里只有精品免费| 亚洲一区在线观看免费观看电影高清| 蜜桃视频最新网址| 亚洲人成人一区二区在线观看| 女人黄色一级片| 中文字幕欧美激情一区| 亚洲性猛交xxxx乱大交| 日本一区二区三区四区在线视频 | 国产91在线视频| 草草在线视频| 国产91成人在在线播放| 小早川怜子影音先锋在线观看| 97视频网站入口| 国产乱码午夜在线视频| 91av视频在线播放| 黄色成人免费网| 国产高清在线不卡| 国产精品原创视频| 91欧美精品午夜性色福利在线| 亚洲欧美久久精品| 91深夜福利视频| 亚洲一区二区免费在线观看| 国产在线资源一区| 亚洲最好看的视频| 日韩欧美精品一区二区| 99久久亚洲精品蜜臀| 日韩最新中文字幕| 日韩视频一区| wwwwww.色| 国产一区二区看久久| 女性生殖扒开酷刑vk| 99久久婷婷国产综合精品| 久久精品国产亚洲av麻豆| 中文字幕第一区二区| 26uuu成人网| 亚洲动漫第一页| 无码人妻一区二区三区免费| 精品视频一区三区九区| 国产又粗又猛又爽又黄的| 欧美成人精品二区三区99精品| 亚洲色欧美另类| 在线电影中文日韩| 在线观看a级片| 欧美一级视频免费在线观看| 精品久久久网| 国产精品免费一区二区| 国模精品一区| 成年人视频网站免费| 久久天堂精品| 亚洲高清av一区二区三区| 97久久精品人人澡人人爽| 中文字幕91视频| 亚洲成人精品在线观看| 免费看av在线| 日韩精品一区二区三区四区| 黄网在线观看| 欧美国产一区二区三区| 欧美1234区| 国产欧美日韩中文字幕在线| 国产视频一区二| 欧美日本韩国一区二区三区| 亚洲一本二本| 日本在线视频www| 黑人精品欧美一区二区蜜桃 | 在线观看欧美理论a影院| 一区二区三区四区五区精品| 精品福利电影| 亚洲a级黄色片| 久久精品一区四区| 日本污视频在线观看| 欧美日本在线视频| 免费观看成年在线视频网站| 欧美激情视频一区| 伊人久久大香| 茄子视频成人在线观看| 伊人影院久久| 性色av浪潮av| 国产精品久久久久久久久久免费看 | 欧美片网站yy| 日韩成人黄色| 久久久久久久久久久91| 亚洲午夜剧场| 天堂资源在线亚洲资源| 野花国产精品入口| 久久性爱视频网站| 亚洲一区在线免费观看| av在线免费在线观看| 日韩在线视频二区| a国产在线视频| 国产精品12| 午夜国产精品视频免费体验区| 天天干天天玩天天操| 国产精品天干天干在线综合| 亚洲婷婷综合网| 亚洲欧美成人一区二区在线电影| 123区在线| 国产在线一区二区三区欧美| 精品动漫av| 大桥未久恸哭の女教师| 亚洲在线观看免费视频| 亚洲国产999| 欧美黄色片在线观看| 看亚洲a级一级毛片| 一道本在线观看视频| 精品亚洲porn| 岛国毛片在线观看| 欧美大胆人体bbbb| 婷婷av在线| 国产日韩一区二区| 亚洲综合不卡| 无码 人妻 在线 视频| 日本韩国精品一区二区在线观看| 九色在线播放| 国产精品一区专区欧美日韩| 日产精品一区二区| 中文字幕亚洲影院| 亚洲日本成人在线观看| 国产特级aaaaaa大片| 欧美韩日一区二区| 精品国产影院| 色欲av无码一区二区人妻| 久久综合中文字幕| 18国产免费视频| 日韩色av导航| 成人av影音| 女人扒开屁股爽桶30分钟| 国产欧美日韩三级| 国产精品视频无码| 欧美激情高清视频| 亚洲另类春色校园小说| 性刺激的欧美三级视频| 亚洲婷婷国产精品电影人久久| 国产美女免费视频| 国产91成人video| 日韩欧美1区| 亚洲精品乱码久久久久久9色| 亚州成人在线电影| 成a人片在线观看www视频| 成人h猎奇视频网站| 亚洲三级观看| 欧美午夜激情影院| 日韩三区在线观看| 东京一区二区| 2021狠狠干| 国产亚洲女人久久久久毛片| 91一区二区视频| 午夜精品一区二区三区在线播放 | 久久精品视频在线播放| 永久免费精品视频| 亚洲视频在线a| 一区二区久久久| 国产大学生校花援交在线播放 | 一区二区三区欧美日韩| 日本又骚又刺激的视频在线观看| 国产精品一区av| 亚洲黄页一区| 国内毛片毛片毛片毛片毛片| 亚洲黄色片网站| 国产一区二区三区| 久久久久久久片| 午夜精品免费在线|