精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

RAG分塊優化之語義分塊方法CrossFormer模型技術思路 原創

發布于 2025-4-2 07:36
瀏覽
0收藏

筆者在前期文章中總結了RAG的分塊《??RAG常見13種分塊策略大總結(一覽表)??》,本文介紹一個語義分段的工作,該工作解決的問題是文本語義分割,即將文檔分割成多個具有連續語義的段落。傳統方法通常依賴于預處理文檔以分段來解決輸入長度限制問題,但這會導致段間關鍵語義信息的丟失。RAG系統中的文本分塊方法主要分為基于規則和基于LLM的方法。

插入一個思路,其實,語義分段的方式筆者在很早實踐過一個思路,不管是RAG分塊還是基于規則分塊,都會或多或少的都是段落信息,如何通過語義的方式分割段落?筆者之前的思路最初的想法來源于序列標注模型,那么是否能應用序列標注的方法,來預測文本行之間的跳轉概率?答案是肯定的,以pdf為例,具體實施步驟如下: 先放上筆者之前的老圖:

RAG分塊優化之語義分塊方法CrossFormer模型技術思路-AI.x社區

  1. 從pdf讀取程序或ocr引擎中得到文本行及其坐標;
  2. 使用神經網絡對第i行的文本進行編碼,得到文本嵌入向量text_emb(i);
  3. 提取對應行的圖像,得到圖像嵌入向量img_emb(i);
  4. 提取字號、文字長度特征,并進行歸一化得到特征向量;
  5. 聚合步驟2、3、4得到的向量,得到行嵌入line_emb(i);
  6. 使用神經網絡對行向量序列[line_emb(i)]進行序列標注。

整體方案流程圖如下:

RAG分塊優化之語義分塊方法CrossFormer模型技術思路-AI.x社區

接下來,本文介紹的方法有異曲同工之處,也是采用序列標注的方式進行,供參考。

方法-CrossFormer

RAG分塊優化之語義分塊方法CrossFormer模型技術思路-AI.x社區

任務定義

CrossFormer 將文本語義分割任務定義為句子級別的序列標注問題。給定一個文檔 ,包含  個句子,每個句子  被分配一個二分類標簽 。標簽  表示由語義連貫性統一的一個段落的終端邊界,而  表示在同一主題段落內的連續性。目標是訓練一個函數 ,能夠根據上下文預測每個句子的標簽 。

為了實現這一點,模型在每個句子  的末尾添加一個特殊的標記 [SENT],并評估這個標記是否標志著一個段落邊界。通過這種方式,文檔被分割成一組不相交的語義段落。

文檔預處理

RAG分塊優化之語義分塊方法CrossFormer模型技術思路-AI.x社區

由于文本語義分割任務通常涉及長文檔,需要采用適當的建模方法來有效處理這些文檔。論文中采用了截斷和分段的方法。步驟如下:

  1. 分段:根據任務指定的分隔符(如換行符或句號)對文檔進行分段。
  2. 截斷:將每個句子截斷到最大長度 。
  3. 拼接:將截斷后的句子按順序拼接,形成多個文檔段,每個段的長度不超過 。
  4. 批處理:將這些文檔段組裝成一個批次,并輸入模型進行訓練或推理。

跨段融合模塊 (CSFM)

CSFM 是 CrossFormer 的核心組件,用于增強文檔段之間的語義連貫性。原理如下:

  1. 全局語義表示:通過選擇預訓練的特殊標記 [CLS] 和 [SEP],提取每個段落的語義表示 。然后,通過最大池化從這些表示中獲取最大的語義成分,得到全局語義信息 。
  2. 拼接和線性變換:將全局語義嵌入  與每個分隔符嵌入  進行拼接,并通過兩個線性層進行處理,得到 ,即結合了全局語義信息的分隔符表示。
  3. 分類:將  輸入線性層并應用 Softmax 函數,得到分類結果,從而確定段落邊界。

訓練模型使用交叉熵損失函數即可。

通過這種方式,CSFM 能夠有效地捕捉文檔段之間的語義依賴關系,提高分割性能。

CrossFormer 作為 RAG 文本塊分割器

RAG分塊優化之語義分塊方法CrossFormer模型技術思路-AI.x社區

CrossFormer 可以作為RAG系統中的文本塊分割器,生成更具語義連貫性的文本塊。流程如下:

RAG分塊優化之語義分塊方法CrossFormer模型技術思路-AI.x社區

流程圖

  1. 分割長文檔:首先使用 CrossFormer 對輸入文檔進行分割,生成一系列文本塊。
  2. 長度評估:評估每個文本塊的長度。如果長度超過預設閾值,則將其輸入分割隊列進行進一步處理,直到確定不需要額外分割或文本塊長度低于指定閾值。
  3. 檢索和生成:使用分割后的文本塊進行檢索和生成。通過檢索器和問題提示進行相關性檢索,生成上下文,并將其輸入到LLM中以獲得最終答案。

局限性

  • CrossFormer不能精確控制文本塊長度的上限。因此,可能需要結合基于規則的方法來輸出合適的長度。
  • 作為線性文本語義分割模型,CrossFormer不能輸出部分重疊的文本塊,這在RAG系統的某些場景中是必需的

實驗效果

RAG分塊優化之語義分塊方法CrossFormer模型技術思路-AI.x社區

文本語義分割的結果

RAG分塊優化之語義分塊方法CrossFormer模型技術思路-AI.x社區

在RAG基準測試上的結果

RAG分塊優化之語義分塊方法CrossFormer模型技術思路-AI.x社區

參考文獻:CrossFormer: Cross-Segment Semantic Fusion for Document Segmentation,https://arxiv.org/pdf/2503.23671v1


公眾號大模型自然語言處理  作者:余俊暉

原文鏈接:??https://mp.weixin.qq.com/s/YSt1G-M5yEJCb8VcW0OlnA??

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
已于2025-4-2 07:36:18修改
收藏
回復
舉報
回復
相關推薦
亚洲成a人片777777久久| 日本一区视频| 欧美日韩三区| 亚洲激情视频在线| 波多野结衣天堂| 国产成人无吗| av一本久道久久综合久久鬼色| 欧美一区二区影院| 超碰人人人人人人人| 国产一区二区在线观| 欧美日韩国产综合视频在线观看中文| 免费成人深夜夜行视频| 一级视频在线播放| 99在线热播精品免费99热| 亚洲天堂av在线播放| 亚洲丝袜在线观看| 88xx成人免费观看视频库| 亚洲码国产岛国毛片在线| 久久天堂国产精品| av手机免费看| 日本大胆欧美人术艺术动态 | 天堂аⅴ在线地址8| 成人深夜福利app| 国产狼人综合免费视频| 日本一级一片免费视频| 国产精品99一区二区三| 亚洲另类xxxx| 久久久高清视频| 成人51免费| 在线观看免费视频综合| 成人性免费视频| 性网站在线观看| 中文字幕不卡在线播放| 精品在线不卡| 亚洲国产精品18久久久久久| 青青草国产精品97视觉盛宴| 97av在线播放| 国产一级在线播放| 中文字幕日韩一区二区不卡| 国产一区二区三区中文| 波多野结衣 在线| 国产成人精品福利| 日韩免费成人网| 男人午夜视频在线观看| 日韩av福利| 精品国产乱码久久久久酒店| 4444亚洲人成无码网在线观看| 中文日本在线观看| 国产欧美精品区一区二区三区 | 亚洲免费福利一区| 亚洲国产精彩中文乱码av在线播放 | 性猛交ⅹxxx富婆video| 日本成人中文| 亚洲国产中文字幕久久网| 无码人妻丰满熟妇区毛片蜜桃精品| 亚洲欧美综合久久久久久v动漫| 欧美午夜免费电影| 在线免费视频一区| 成人国产综合| 在线电影一区二区三区| 久久国产激情视频| 色综合视频一区二区三区日韩 | 999国产精品视频免费| 久久精品国产99久久6| 国产精品视频久久久久| 亚洲资源在线播放| 韩国成人精品a∨在线观看| 成人高h视频在线| 精品国产区一区二| 成人在线综合网| 精品国产乱码久久久久久丨区2区| 欧美 日韩 国产 成人 在线| www.欧美亚洲| 欧美精品二区三区四区免费看视频| 肉丝一区二区| 日本一区二区视频在线| 一区二区三区观看| 2020国产在线视频| 欧美日韩国产精品一区二区不卡中文 | 亚洲一区二区在线播放| 性网爆门事件集合av| 高清不卡一区二区在线| 久久精品一区二区三区不卡免费视频| 噜噜噜噜噜在线视频| 国产精品理论在线观看| 热久久最新地址| 亚洲天堂av在线| 欧美三级日韩三级国产三级| 日韩av影视大全| 动漫3d精品一区二区三区乱码| 精品伊人久久97| 蜜桃av免费观看| 在线观看一区| 国产精品视频男人的天堂| 国产免费视频一区二区三区| 成人国产一区二区三区精品| 日韩视频精品| 性xxxfreexxxx性欧美| 精品久久久久久亚洲国产300| 在线免费视频一区| 久久影视三级福利片| 亚洲小视频在线观看| 朝桐光av在线| 天堂久久一区二区三区| 99久久一区三区四区免费| 日韩电影免费| 一区二区三区欧美久久| 色诱视频在线观看| 9l亚洲国产成人精品一区二三| 亚洲欧美精品一区| 婷婷色中文字幕| 日本不卡视频在线观看| 国产精品国产精品国产专区不卡| 国产乱子伦三级在线播放| 亚洲综合成人在线视频| 亚洲欧美国产中文| 国产中文精品久高清在线不| 欧美激情性做爰免费视频| 亚洲精品一区二区二区| 91亚洲国产成人精品一区二三| 在线观看日韩羞羞视频| 一个人看的www视频在线免费观看| 制服丝袜国产精品| 欧美亚洲色综久久精品国产| 亚洲免费精品| av一本久道久久波多野结衣| av在线电影院| 色婷婷亚洲精品| 双性尿奴穿贞c带憋尿| 欧美激情麻豆| 成人中心免费视频| 91女主播在线观看| 色婷婷一区二区三区四区| 亚洲天堂美女视频| 国内精品99| 亚洲精品女av网站| 黄色一级片在线观看| 91久久精品一区二区三| 波多野结衣办公室33分钟| 亚洲一级电影| 成人黄动漫网站免费| 二区三区在线观看| 这里只有精品免费| 日本黄区免费视频观看| 日本午夜一区二区| 日韩欧美亚洲区| 精品国产第一福利网站| 日韩av影院在线观看| 国产无套在线观看| av男人天堂一区| 毛片在线视频播放| 亚洲动漫在线观看| 日韩免费黄色av| 国产专区在线播放| 欧美亚洲一区三区| 成人一级片免费看| 久久99最新地址| a级网站在线观看| 日本精品在线观看| 久久久久久国产| 天天干,天天操,天天射| 欧美日韩一区二区精品| 毛片网站免费观看| 蜜芽一区二区三区| 在线一区高清| 精品入口麻豆88视频| 欧美国产第二页| 日批免费在线观看| 日韩欧美在线视频| 一级黄色毛毛片| 极品销魂美女一区二区三区| 青春草在线视频免费观看| 亚洲精品福利| 668精品在线视频| 可以在线观看的av| 欧美日韩中文一区| 久草成人在线视频| 91久色porny| 91亚洲免费视频| 黄色欧美成人| 欧美在线播放一区| 国产精品久久久久久久久久辛辛 | 久久久久久久有限公司| 欧美aaa视频| 久久中文字幕在线视频| 凸凹人妻人人澡人人添| 欧美视频中文一区二区三区在线观看| 人人澡人人澡人人看| 成人午夜视频网站| 亚洲三级视频网站| 激情一区二区| 亚洲免费不卡| 国产精品qvod| 国产在线日韩在线| 成人ssswww在线播放| 伊人久久免费视频| 熟妇人妻系列aⅴ无码专区友真希 熟妇人妻av无码一区二区三区 | 欧美精品电影在线播放| 国产 日韩 欧美 成人| 国产日韩欧美精品一区| 国产伦精品一区二区三区妓女下载| 亚洲乱码久久| 中文字幕av日韩精品| 久久超级碰碰| 91丝袜美腿美女视频网站| 草美女在线观看| 少妇高潮久久77777| 无码精品人妻一区二区| 制服视频三区第一页精品| 色屁屁影院www国产高清麻豆| 亚洲色图19p| 国精产品一区一区三区免费视频| 国产一区二区三区在线观看免费| 久久久久狠狠高潮亚洲精品| 真实国产乱子伦精品一区二区三区| 欧洲av一区| 国偷自产av一区二区三区| 成人激情视频在线观看| 天天综合网站| 欧美一级淫片播放口| 日本片在线观看| 俺去了亚洲欧美日韩| 韩国中文免费在线视频| 亚洲国产日韩欧美在线动漫| 96日本xxxxxⅹxxx17| 日本精品免费观看高清观看| 日韩激情一区二区三区| 一二三区精品视频| 国产激情无码一区二区三区| 国产色综合久久| 一区二区不卡免费视频| 成人一区二区三区视频在线观看 | 日韩成人在线电影| 国产成人自拍视频在线观看| 久久青草伊人| 国外色69视频在线观看| 青草视频在线免费直播| 美女性感视频久久久| 日p在线观看| 色悠悠久久88| 137大胆人体在线观看| 亚洲香蕉成人av网站在线观看| 奇米影视888狠狠狠777不卡| 亚洲精品国产综合区久久久久久久| 亚洲av综合色区无码一二三区| 欧美一级生活片| 国产黄色片av| 日韩欧美一区二区视频| jizz中国女人| 日韩欧美国产精品一区| a天堂在线视频| 欧美大片在线观看一区二区| av天堂一区二区三区| 日韩一区二区三区电影| 精品二区在线观看| 精品国产1区2区3区| 亚洲精品911| 亚洲成人久久一区| 头脑特工队2在线播放| 亚洲精品国产精品国产自| 深夜影院在线观看| 亚洲欧美制服丝袜| 天堂中文а√在线| 欧美成人免费小视频| 成人福利影视| 91av视频在线播放| 色香欲www7777综合网| 国产精品露脸自拍| 精品亚洲a∨一区二区三区18| 97se国产在线视频| 欧美电影完整版在线观看| 美日韩精品免费| 成人91在线| 成人午夜免费剧场| 亚洲精选国产| 在线免费视频a| 国产精选一区二区三区| 精品久久久久一区二区| 国产亚洲欧美一级| 国产精品免费人成网站酒店| 亚洲午夜在线视频| 久操视频在线免费观看| 91麻豆精品国产自产在线| 黄色小视频免费在线观看| 亚洲无线码在线一区观看| 国产日产一区二区| 欧美亚洲国产日韩2020| 国产精品99久久久久久董美香| av成人午夜| 女人丝袜激情亚洲| 蜜臀av性久久久久蜜臀av| 亚洲一区激情| 午夜啪啪小视频| 波多野结衣中文字幕一区二区三区 | 青青草综合在线| 久久精品亚洲| 在线免费黄色小视频| 91麻豆.com| 搜索黄色一级片| 狠狠综合久久av一区二区小说| 中文字幕乱码无码人妻系列蜜桃| 精品日韩在线观看| 成黄免费在线| 欧美一二三视频| 久久9999免费视频| 日韩免费电影一区二区| 国内自拍一区| 欧美午夜aaaaaa免费视频| 成人av在线资源| 国产一区二区精彩视频| 色婷婷综合久久久久中文 | 亚洲美女性视频| av大全在线| 国产精品视频999| 天堂av一区二区三区在线播放| 日韩video| 日本美女一区二区| 女尊高h男高潮呻吟| 亚洲中国最大av网站| 一卡二卡三卡在线| 亚洲天堂第一页| 成人片免费看| 国产亚洲精品久久飘花| 中文字幕一区二区三区乱码图片 | 亚洲一区二区在线看| 免费日韩av片| 精品人妻一区二区免费视频| 亚洲视频 欧洲视频| 在线观看视频二区| 亚洲日韩中文字幕| 狠狠躁少妇一区二区三区| 97中文在线| 欧美.日韩.国产.一区.二区| 一级黄色录像在线观看| 欧美国产日产图区| jizz国产在线观看| 亚洲美女又黄又爽在线观看| 国产高清自产拍av在线| 国产精品久久久久久久久久久久午夜片| 国产精品99视频| 黄色aaaaaa| 亚洲视频一区二区在线观看| 中文字字幕在线中文乱码| 伊人成人开心激情综合网| 欧美日韩成人影院| 欧美日韩高清在线一区| 免费国产自线拍一欧美视频| 新91视频在线观看| 日韩欧美一区二区三区久久| 三级在线播放| 国产成人综合一区二区三区| 经典一区二区| 国产三级三级看三级| 中文字幕在线一区| 99精品国产99久久久久久97| 久久精品视频导航| 一区二区三区视频播放| www.avtt| 99re66热这里只有精品3直播 | 人妻精品久久久久中文字幕| 欧美日韩免费网站| 国产在线免费观看| 国产免费一区视频观看免费| 欧美残忍xxxx极端| 手机看片国产精品| 五月婷婷激情综合| 黄视频在线播放| 国产精品一区二区三区久久久| 五月开心六月丁香综合色啪| 免费高清视频在线观看| 五月激情六月综合| 第九色区av在线| 91精品一区二区| 尤物精品在线| 香蕉视频久久久| 91精品欧美综合在线观看最新| 中文字幕有码在线观看| 久久99精品久久久久久水蜜桃| 日韩和欧美的一区| avove在线播放| 国产午夜精品久久久| 日本一区二区电影| 日本人妻伦在线中文字幕| 91在线播放网址| 91 中文字幕| 91av在线免费观看| 久久国产精品亚洲人一区二区三区| 日韩欧美中文视频| 色综合久久久网| 黄色网址在线免费播放| 久久riav| 国产精品 日产精品 欧美精品| 久久中文字幕免费| 久久影院中文字幕| 亚洲精品亚洲人成在线| 无套内谢丰满少妇中文字幕| 色婷婷国产精品| 激情av在线| 在线观看一区二区三区三州| 99久久免费视频.com|