精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Qwen和DeepSeek為何都選YaRN?

人工智能
YaRN 可以直接和修改注意力機(jī)制的庫(kù)兼容,比如 Flash attention,因此不會(huì)有額外的實(shí)現(xiàn)成本和推理成本。Flash 在目前的主流底層框架實(shí)現(xiàn)基本是標(biāo)配了,所以這一點(diǎn)很重要。

這篇文章,我們還是從面試官的視角出發(fā),一起來分析一下,如果你在面試現(xiàn)場(chǎng)被問到這個(gè)題目,應(yīng)該如何回答?

1.面試官心理分析

首先還是分析一下面試官的心理,面試官問這個(gè)問題,主要是想考察三點(diǎn):

  • 第一,你知不知道長(zhǎng)度外推這個(gè)概念?很多同學(xué)可能聽都沒聽過這個(gè)概念,那這個(gè)問題當(dāng)然也就無(wú)從答起了。
  • 第二,deepseek 采用了哪種長(zhǎng)度外推方案?面試官希望你能講清楚這個(gè)外推算法的底層細(xì)節(jié)。
  • 第三,這種方案相比之前的方法,它好在哪里?這就更進(jìn)一層了,需要你通過自己的理解總結(jié)概括一下。

好,那接下來我們就沿著面試官的心理預(yù)期,來分析一下這道題目!

2.面試題解析

首先回答第一層,什么是長(zhǎng)度外推?

顧名思義,長(zhǎng)度外推,就是不需要用長(zhǎng)序列數(shù)據(jù)進(jìn)行額外的訓(xùn)練,只用短序列語(yǔ)料對(duì)模型進(jìn)行訓(xùn)練,就可以得到一個(gè)能夠處理和預(yù)測(cè)長(zhǎng)序列的模型,也就是我們所說的“Train Short,Test Long”。

那么如何判斷一個(gè)模型能否用于長(zhǎng)序列呢?最基本的指標(biāo),就是模型的長(zhǎng)序列 Loss 或者 PPL 不會(huì)爆炸。

更加符合實(shí)踐的評(píng)測(cè),則是輸入足夠長(zhǎng)的 Context,讓模型去預(yù)測(cè)答案,然后跟真實(shí)答案做對(duì)比,計(jì)算 BLEU、ROUGE,LongBench 這幾個(gè)指標(biāo)。

然后回答第二層,deepseek 采用了一種叫 YaRN 的長(zhǎng)度外推算法。

具體來說,YaRN 是基于 NTK-aware 方法的進(jìn)一步拓展,通過結(jié)合溫度縮放和 NTK-by-parts 插值,來提升長(zhǎng)文本外推能力。

即 YaRN = NTK-aware + NTK-by-parts + Dynamic NTK。

然后我們看一下,這個(gè)算法是怎么做的。我們首先回顧一下 ROPE 的公式:

圖片圖片

從公式中可以看到,m-n 是相對(duì)位置的距離,θi 是旋轉(zhuǎn)的頻率。

那怎么理解這個(gè)公式呢?

我們知道,對(duì)于三角函數(shù),不同取值本質(zhì)上就等于在一個(gè)單位圓上的點(diǎn)。

如果 m-n 逐漸變大,也就是相對(duì)距離越來越遠(yuǎn),則相當(dāng)于在圓上旋轉(zhuǎn),如果 θ 越大,則代表在圓上旋轉(zhuǎn)越快。theta 對(duì)應(yīng)頻率,根據(jù)頻率和周期的關(guān)系,頻率越大,周期越小。

我們來看這張圖,左右分別代表一個(gè)大的 θ 和一個(gè)小的 θ 的旋轉(zhuǎn)情況。大 θ 旋轉(zhuǎn)超過一周了,小 θ 才旋轉(zhuǎn)一個(gè)半圓。

圖片圖片

然后我們來看一下 YaRN 的核心思想,假設(shè)訓(xùn)練的長(zhǎng)度是 L,那 m-n 的取值范圍是 [0,L-1]。

θ 越大,則轉(zhuǎn)速越快,也就是 m-n 從 0 到 L-1 的期間,已經(jīng)轉(zhuǎn)了很多圈,也就是說圓上的每一個(gè)點(diǎn)幾乎都被訓(xùn)練過,這類 theta 不存在長(zhǎng)度外推的問題。也就是對(duì)于高頻信息,不動(dòng)。

對(duì)于小的那些 θ,也就是 m-n 從 0 到 L-1 的期間,可能轉(zhuǎn)了還沒有一圈,圓上還存在很多空白。

那這種情況,如果測(cè)試長(zhǎng)度 M 大于 L,則很有可能就超出了訓(xùn)練過的那一段圓弧,從而造成長(zhǎng)度外推失敗。

YaRN 的做法也很直接,直接把此時(shí)的 θ 壓回到訓(xùn)練過的那一段圓弧范圍內(nèi),這樣就減少了實(shí)際預(yù)測(cè)時(shí)跑到空白的地方。也就是 θ 會(huì)乘一個(gè)縮放因子 L/M。

我們可以設(shè)一個(gè)圈數(shù)的閾值 τ,如果圈數(shù)超過 τ 的,就認(rèn)為已經(jīng)充分訓(xùn)練了,可以不加改動(dòng);

圈數(shù)少于 1 的,θ 改為 θ*L/M,也就是要把超出弧范圍的重新縮放到弧內(nèi),至于二者之間的部分,就在兩者之間線性插值過渡。

也就是論文這個(gè)公式所表達(dá)的含義:

圖片圖片

YaRN 的第二個(gè)點(diǎn)是解決線性內(nèi)插導(dǎo)致的 self-attention 點(diǎn)積的值增大的問題。

由于線性內(nèi)插會(huì)改變旋轉(zhuǎn)向量轉(zhuǎn)動(dòng)的幅度,也就是隔得更近了。原來距離較遠(yuǎn)的 q,k 點(diǎn)積由于旋轉(zhuǎn)幅度變小,他們的點(diǎn)積結(jié)果會(huì)增大,進(jìn)而導(dǎo)致 Softmax 操作過于“銳化”,使得注意力分布集中于少數(shù)位置,削弱了模型對(duì)全局上下文的關(guān)注能力。

Yarn 在 NTK-by-parts 基礎(chǔ)上,引入了注意力溫度因子,來調(diào)整注意力分布。

我們看公式:

圖片圖片

3.總結(jié)

最后總結(jié)一下,這個(gè)算法有哪些優(yōu)勢(shì)呢?

首先,YaRN 可以直接和修改注意力機(jī)制的庫(kù)兼容,比如 Flash attention,因此不會(huì)有額外的實(shí)現(xiàn)成本和推理成本。Flash 在目前的主流底層框架實(shí)現(xiàn)基本是標(biāo)配了,所以這一點(diǎn)很重要。

第二個(gè)是效果拔群,YaRN 這個(gè)算法目前在各種大模型和和不同架構(gòu)上對(duì)比實(shí)驗(yàn)表明,是一個(gè)非常強(qiáng)的 SOTA。

所以目前主流的大模型,如 LLaMA 的改進(jìn)系列,Qwen2.5 和 DeepSeek,都選擇了用 YaRN 來做長(zhǎng)度外推。

責(zé)任編輯:武曉燕 來源: 丁師兄大模型
相關(guān)推薦

2013-08-27 13:46:17

喬布斯蓋茨微軟

2025-02-24 08:10:00

2025-02-14 09:50:00

DeepSeekAI

2018-07-31 12:04:00

顯示器

2010-08-25 10:35:31

微軟

2013-07-30 17:26:11

科技公司科技巨頭IT公司

2010-08-26 17:24:47

2025-02-08 09:30:00

2025-02-27 08:00:00

DeepSeek大模型人工智能

2009-09-23 18:15:15

wifi通信

2025-05-06 00:35:33

2017-11-29 12:06:07

2011-05-07 09:38:03

打印機(jī)耗材正品

2025-02-08 11:31:17

DeepseekR1模型

2018-09-26 17:16:28

VR游戲體驗(yàn)虛擬現(xiàn)實(shí)

2025-04-01 08:10:00

JavaScripteval()函數(shù)代碼

2025-10-11 09:21:35

2025-08-08 09:06:00

2011-05-23 16:12:39

私有云

2025-10-20 08:17:01

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

欧美大胆成人| 丰满肉嫩西川结衣av| 精品午夜久久| 制服丝袜中文字幕亚洲| 996这里只有精品| 亚洲欧美日韩成人在线| 蜜桃视频免费观看一区| 欧美激情18p| 蜜乳av中文字幕| 精品国产一区二区三区性色av | 日韩不卡一二三区| 九九久久精品一区| 谁有免费的黄色网址| 视频在线一区| 欧美亚洲国产bt| 日韩精品在线观看av| av电影在线网| 暴力调教一区二区三区| 国产精品一区二区久久久久| 日本a在线观看| 久久中文亚洲字幕| 亚洲国产欧美日韩精品| 久久精品国产露脸对白| 成人激情综合| 精品女厕一区二区三区| 熟女熟妇伦久久影院毛片一区二区| 色资源在线观看| 国产成人av电影免费在线观看| 国产精品久久久久久久久久尿 | 色哟哟日韩精品| 另类美女黄大片| 国产三级视频网站| 91在线一区| 日韩西西人体444www| 午夜激情在线观看视频| 天堂8中文在线最新版在线| 亚洲精品美腿丝袜| 免费观看黄色的网站| www视频在线观看免费| 91美女片黄在线观看| 99视频免费观看| 国产精品无码一区二区桃花视频| 一本色道久久| 992tv成人免费影院| 国产一级av毛片| 欧美激情成人在线| 久久久久北条麻妃免费看| 精品熟妇无码av免费久久| 国产成人精品999在线观看| 亚洲国产精品久久久久秋霞不卡| 免费看的av网站| 久久综合偷偷噜噜噜色| 欧美一区二区三区视频在线观看| 玖玖爱视频在线| 伦一区二区三区中文字幕v亚洲| 色老汉一区二区三区| 日韩黄色影视| 国产三级视频在线看| 久久久久久影视| 国产精品流白浆视频| 五月婷婷激情视频| 日韩专区中文字幕一区二区| 国产成人精品久久| 中文字幕日本视频| 美女网站视频久久| 91视频国产一区| 精品人妻一区二区三区浪潮在线 | 欧美日本一区| 欧美激情国产高清| 日韩美女视频网站| 久久不射中文字幕| 国产精品天天狠天天看| 一级片在线观看视频| 激情综合色播激情啊| 97欧洲一区二区精品免费| 日韩在线一区二区三区四区| 99精品视频在线观看| 免费看成人片| 日本中文在线| 亚洲在线免费播放| 久久久999视频| 欧美日韩精品一区二区三区视频| 欧美日本一区二区三区| 日本人妻一区二区三区| 亚洲美女15p| 日韩中文字在线| 天天插天天射天天干| 久久爱www成人| 久久精品一偷一偷国产| 国产精品二区一区二区aⅴ| 久久九九国产| 亚洲综合日韩中文字幕v在线| 男人天堂av网| 国产精品天干天干在线综合| 亚洲天堂第一区| 亚洲优女在线| 欧美一区二区三区四区视频| 在线免费观看日韩av| 久久久久亚洲| 2020久久国产精品| 国产永久免费视频| 99re这里只有精品6| 亚洲欧洲精品一区| 人人草在线视频| 欧美精品丝袜中出| 无码h肉动漫在线观看| 欧美一区视频| 国产精品视频免费观看www| 国产综合在线播放| 国产精品久久影院| 国产精品50p| 国产精品1区| 亚洲国产福利视频| 中文字幕中文字幕一区| 超碰网在线观看| 午夜久久av| www.午夜精品| 青娱乐在线免费视频| www.色精品| 成人一区二区av| 99久久久国产精品免费调教网站 | 欧美日韩国产精品一区| 午夜影院免费版| 日本电影一区二区| 热re99久久精品国产66热| 精品黑人一区二区三区在线观看| 国产亚洲欧美色| 欧美一区二区三区爽大粗免费| 欧美高清hd| 久久天天躁夜夜躁狠狠躁2022| 欧美一级特黄视频| www.亚洲精品| 国产精品久久久久久久乖乖| 亚洲第一二区| 久久成人这里只有精品| 91精品中文字幕| 国产精品乱人伦| 成人性生生活性生交12| 欧美猛男男男激情videos| 69精品小视频| 无码国产精品一区二区免费16 | 成人公开免费视频| 久久综合狠狠综合久久激情 | 欧美a级片免费看| 蜜臀精品一区二区三区在线观看 | 欧美亚洲一区二区在线观看| 黄色正能量网站| 亚洲欧美日韩国产| 六月婷婷久久| 欧洲精品一区二区三区| 亚洲欧美国产日韩天堂区| 欧美精品一二三四区| 久久中文字幕电影| 国内外免费激情视频| av永久不卡| 国产精品视频精品视频| 毛片av在线| 7777精品伊人久久久大香线蕉最新版 | 一区二区三区国产在线观看| 无码视频一区二区三区| 日本一区二区三区国色天香| 亚洲国产精品三区| 无码一区二区三区视频| 欧美性高潮床叫视频| 欧美凹凸一区二区三区视频| 韩日精品一区二区| 这里只有精品久久| 国产丝袜在线视频| 亚洲国产人成综合网站| 亚洲欧美色图视频| 麻豆国产精品视频| 91传媒免费视频| 麻豆精品99| 国产精品久久久久久久久久久新郎 | 欧美一级高潮片| 99精品视频一区| 无码日韩人妻精品久久蜜桃| 91嫩草亚洲精品| 成人欧美一区二区三区视频xxx| 牛牛在线精品视频| 日韩精品在线免费播放| 在线视频欧美亚洲| 亚洲综合色成人| 91精品人妻一区二区| 六月婷婷色综合| 少妇大叫太大太粗太爽了a片小说| 精品五月天堂| 国产精品一区=区| 黄色羞羞视频在线观看| 亚洲深夜福利在线| 国产男女裸体做爰爽爽| 高潮白浆女日韩av免费看| 天美传媒免费在线观看| 成人涩涩免费视频| 欧美成人黄色网址| 精品动漫一区| 一区二区三区欧美成人| 精品久久ai电影| 91精品久久久久久久久不口人| 久草在线视频资源| 中文字幕精品在线| 蜜桃在线一区二区| 911精品产国品一二三产区| 五月天综合激情| 亚洲视频1区2区| 亚洲一区二区自偷自拍| 成a人片国产精品| 亚洲一二三av| 日韩高清在线电影| 国产h视频在线播放| 68国产成人综合久久精品| 欧美色欧美亚洲另类七区| 77成人影视| 成人黄色av免费在线观看| 欧美动物xxx| 性欧美xxxx视频在线观看| 看女生喷水的网站在线观看| 精品久久久久久久久国产字幕| 天堂网av2018| 久久久噜噜噜久久人人看| 国产成人精品一区二区三区在线观看 | 久久免费电影网| 中文字幕一区二区三区人妻在线视频| 人人狠狠综合久久亚洲| 动漫av网站免费观看| 激情亚洲成人| 国产成人生活片| 久久精品青草| 亚洲一区二区在线看| 国产91久久精品一区二区| 国精产品一区二区| 国产+成+人+亚洲欧洲在线| 亚洲free性xxxx护士hd| 欧洲亚洲精品久久久久| 国产精品旅馆在线| 天天综合网天天| 日韩av色综合| 国产在线小视频| 亚洲高清在线观看| 刘玥91精选国产在线观看| 欧美一区二区三区在| 91麻豆成人精品国产免费网站| 欧美日韩在线另类| 国产高潮久久久| 狠狠躁夜夜躁久久躁别揉| 国产乡下妇女做爰| 亚洲成人免费影院| 日韩av免费网址| 亚洲成av人片一区二区梦乃| 久久精品免费av| 亚洲成精国产精品女| 日韩欧美亚洲国产| 欧美日韩亚洲网| 在线精品免费视| 日本韩国一区二区| 波多野结衣电车痴汉| 欧美亚洲国产怡红院影院| 中文字幕久久网| 91麻豆精品国产无毒不卡在线观看| 国产又粗又猛视频| 日韩欧美高清dvd碟片| 丰满人妻熟女aⅴ一区| 日韩精品免费视频| 国产三级视频在线| 久久精品国产综合| 色呦呦在线视频| 97免费在线视频| 欧美18av| 国产日韩中文字幕| 白白在线精品| 欧美日韩在线不卡一区| 日韩精品一区二区三区免费观看| 一区二区三区偷拍| 丝袜av一区| 日韩欧美在线电影| 91精品国产自产拍在线观看蜜| 欧美少妇在线观看| 一本色道久久综合亚洲精品高清| 国产精品亚洲a| 韩日欧美一区二区三区| 国产xxxx视频| 国产精品久久久久久亚洲伦| 青青草手机在线观看| 欧美日韩另类视频| 88av在线视频| 亚洲激情视频在线| 性开放的欧美大片| 国内成人精品视频| 巨大黑人极品videos精品| 国产a一区二区| 热久久天天拍国产| 国产精品一线二线三线| 蜜臀av性久久久久av蜜臀妖精 | 国产精品高清一区二区| 国产专区一区二区三区| 日本道不卡免费一区| 欧美男女爱爱视频| 久久99精品久久只有精品| 久久久久成人精品无码中文字幕| 中文av字幕一区| 国内免费精品视频| 91精品国产综合久久国产大片| 瑟瑟在线观看| 欧美日韩国产成人在线观看| 四虎4545www国产精品| 风间由美久久久| 欧美超碰在线| 999精品网站| 成人18精品视频| 久久成人国产精品入口| 欧美日韩国产一区二区三区地区| 天天爽夜夜爽夜夜爽| 久久久国产精品x99av| 亚洲成人激情社区| 精品免费国产| 国产精品红桃| 午夜视频在线观| 国产精品丝袜91| 天堂在线免费观看视频| 精品国产精品网麻豆系列| 免费人成在线观看播放视频| 国产成人高潮免费观看精品| 丁香一区二区| 小泽玛利亚av在线| 久久99国产精品麻豆| www.99热| 一本色道久久综合精品竹菊| 成人无码一区二区三区| 久久久999国产精品| 中文字幕系列一区| 日本亚洲欧洲精品| 新67194成人永久网站| 无码人妻一区二区三区免费n鬼沢 久久久无码人妻精品无码 | 黄色成人在线网站| 中文字幕在线播放一区二区| 日韩理论片中文av| 国产精品自拍电影| 久久九九免费视频| 久久免费福利| 精品久久久无码人妻字幂| 国产精一品亚洲二区在线视频| 性生交大片免费全黄| 精品视频一区三区九区| 91青青在线视频| 国产精品一区久久久| 成人影视亚洲图片在线| 99热这里只有精品在线播放| 欧美国产一区视频在线观看| 自拍偷拍色综合| 日韩在线激情视频| 91精品一久久香蕉国产线看观看| 一区二区三区av在线| 国产一区二区三区观看| 日韩黄色免费观看| 精品播放一区二区| 欧美大胆a人体大胆做受| 久久国产主播精品| 米奇777在线欧美播放| 免费看黄色av| 欧美喷水一区二区| 成人免费网址| 国产亚洲二区| 久久精品中文| 天堂а√在线中文在线鲁大师| 欧美一级专区免费大片| 国产三级伦理在线| 另类欧美小说| 美女视频免费一区| 精品99久久久久成人网站免费| 精品国产乱码久久久久久1区2区| 小草在线视频免费播放| 亚洲国产日韩综合一区| 国产一区二区按摩在线观看| 国产一级片播放| 亚洲视频在线视频| 亚洲欧美在线综合| www.亚洲视频.com| 国产日韩欧美在线一区| 夜夜嗨aⅴ一区二区三区| 欧美国产激情18| 九九热爱视频精品视频| 拔插拔插华人永久免费| 亚洲成人在线免费| 成人av一区| 成人免费视频网站| 日日夜夜精品视频免费| 91成人福利视频| 日韩久久精品成人| 91视频成人| 免费黄色日本网站| 一区二区三区欧美| 成人一区二区不卡免费| 国产v亚洲v天堂无码| 免费成人美女在线观看| 久久精品久久精品久久| 日韩在线视频国产| 日韩影视高清在线观看| 图片区乱熟图片区亚洲| 色综合欧美在线| 免费影视亚洲|