精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

LLooM:大語言模型時代文本聚類新思路

發布于 2024-7-10 09:41
瀏覽
0收藏

緣起

非結構化文本中蘊藏了海量的數據和知識,但是想要解讀這些知識卻并非易事。前大語言模型時代,LDA、BertTopic等算法,是非結構化文本挖掘的利器。但是這些模型生成的主題都是基于關鍵詞等基礎文本信號的,產生的關鍵詞、話題往往比較初級和寬泛,比如:早餐、打鼾等。這些低層次的文本分析,往往無法準確反映真實人類關心的話題。

為了解決傳統分析方法的局限性,提出了一種基于大語言模型的新方法 LLooM,來從非結構化文本中提取更加高層次的概念。

LLooM方法利用了大語言模型,通過Few Shot進行泛化學習。通過抽樣提取的文本,不斷地迭代出更加抽象高級的概念。LLooM的核心能力——綜合、分類和抽象——使其能夠迭代地生成概念,將它們應用于數據,并提煉出更高層次的概念。

LLooM算法被集成到LLooM工作臺(https://github.com/michelle123lam/lloom)的混合主動性文本分析工具中,它通過自動以可解釋的高級概念呈現數據集,增強了分析師的工作。LLooM工作臺還為分析師提供了一個可追溯和可塑的工作流程。每個提取的概念不僅是一個標簽,還可以展開為一個可審計的下級子概念的路徑。分析師可以使用LLooM工作臺引導算法,使其關注特定的概念,從而更精準地進行數據分析。

什么是LLooM方法

LLooM:大語言模型時代文本聚類新思路-AI.x社區圖片

上圖展示了LLooM概念歸納算法的整個工作流程:

? 1)非結構化的文本數據

? 2)LLooM借助大型語言模型輔助生成

? 3)第2步生成的高級概念,這些概念由自然語言描述和以零樣本LLM提示形式的明確標準構成

? 4) LLooM根據概念標準的提示進行(4)概念評分

? 5)LLooM工作臺——一個混合主動性的文本分析工具——以概念維度對數據進行可視化展示。

LLooM算法通過運用大型語言模型(LLM)進行迭代的概念生成和評分輪次,執行概念歸納。在實際使用中,LLooM算法采用了GPT-3.5和GPT-4。

LLooM:大語言模型時代文本聚類新思路-AI.x社區圖片

LLooM算法通過調用大語言模型(實際使用的是GPT3.5和GPT4)不斷循環迭代的“概念生成”與“概念評分”步驟進行概念歸納。如上圖所示,算法的核心目標在于執行一個關鍵的“合成(Synthesize)”步驟,將低層次的文本信號合成為高層次的概念。

在概念“合成”階段,通過使用LLM從提供的示例中進行泛化,生成自然語言的概念描述和標準。直接調用GPT4的話,往往會產生比較寬泛、通用的概念,這些概念雖然有助于對數據進行宏觀總計金額,但是實際分析時,往往需要更加具體、豐富的概念。另外一個問題是對于超出LLm上下文窗口的大型文本數據集,直接調用GPT4也是不太合理的。

為了解決上述問題,LLooM算法引入了兩個操作以提升數據規模和概念質量:

? (1) Distill(蒸餾),它將數據細化并適配至上下文窗口,同時保留關鍵信息;

? (2) Cluster(聚類),它將這些數據碎片重新組合成具有足夠共性的分組,以便從LLM中提煉出深層而非表面的概念。

在概念評分階段,利用LLM的零樣本推理能力,根據提示詞中的概念標準來給數據進行評分。

概念合成 Synthesize

概念合成是指從一組文本中,利用LLM提取出一個或多個高級概念。大型語言模型(LLM)具備的能力非常適合輔助此類任務。例如,GPT-3.5 Turbo和GPT-4能夠從少量實例中進行有效泛化,即識別出共通的概念,并將其應用于新實例。這種能力,也稱為Few Shot Learning,常在用戶已知底層規律并希望模型重復應用時使用(例如,將文本轉換為不同格式,或轉換寫作風格)。然而,當用戶尚不了解數據中存在哪些概念以輔助發現時,我們同樣可以利用這種能力。

盡管LLM可能產生幻覺并輸出不可靠的結果,但通過設計任務時,讓模型不僅生成概念,同時生成評估這些概念的標準,這樣就可以通過審查這些標準并重新評估原始數據來驗證LLM的輸出,檢驗概念是否有效。

基于這一洞察,LLooM實現了一個零樣本提示的概念合成操作,它指導一個LLM(如gpt-4)從一組示例中識別出統一的高級概念。該指令要求模型生成一個描述概念的名稱,提供最能代表該概念的示例編號,并創建一個能夠評估新文本實例并判斷概念是否適用的提示。這些組成部分對于理解概念的含義都非常有用,還采用了思維鏈(CoT)提示策略,指導模型提供其工作過程的詳細說明,從而提高內部一致性的概率。

LLooM:大語言模型時代文本聚類新思路-AI.x社區圖片

上圖是概念合成的提示詞模板。用戶可以根據需要調整概念名稱的長度、代表性示例的數量以及建議的概念數量;默認使用2到4個單詞的概念名稱,并請求1到2個代表性示例。

蒸餾 Distill

蒸餾這一步目的是使的輸入的數據更為緊湊,但同時保留關鍵特征,這樣既可以克服LLM的上下文窗口限制,有增強了對特定興趣點的聚焦能力,從而提升概念生成的效率。在LLooM框架中,作者采用了分步策略來實現蒸餾操作。

首先,通過零樣本摘要的方式進行過濾步驟,提供輸入文本實例,并引導大型語言模型(如gpt-3.5-turbo)生成抽取式摘要,精準選取原始文本中的原文;如果文本長度適中,此步驟可選擇跳過。用戶可以根據需要調整所選引用的數量,通常我們會留空此參數,賦予模型自由提取任意數量引用的靈活性。下圖是一個過濾提示的示例:

LLooM:大語言模型時代文本聚類新思路-AI.x社區圖片

接下來進行摘要操作,通過大語言模型,對內容進行摘要,以要點列表的形式輸出文本摘要。可以根據實際情況調整生成的要點數和每個要點的字數。默認設置一般是2-4個要點,每個要點包括5-8個詞。下圖是一個提示詞示例。

LLooM:大語言模型時代文本聚類新思路-AI.x社區圖片

聚類

聚類操作的輸入是蒸餾操作提取出的一系列要點。LLooM算法利用特定的 Embedding模型,將要點轉換為嵌入向量,然后根據指定的聚類算法進行聚類。在實際運用中,作者使用的是OpenAI的text-embedding-ada-002模型,原因是這個模型支持較長的上下文理解、且生成速度快。聚類算法采用的是HDBSCAN,一種基于密度的層次聚類算法,它的優勢在于不需要復雜的參數調整,且不必將所有點強行分配到某個聚類中。

評分

在概念生成階段,生成概念的同時,就為這些概念是生成了評分標準。所以評分環節,就使用這些評分標準,為每一個概念進行打分(0-1分),用來描述概念的契合程度。

此功能通過批量Zero Shot實現,提示中包含了一組JSON格式的實例、概念提示以及以多項選擇形式生成答案的指令。已有研究指出,大型語言模型在零樣本場景下并不提供經過校準的0-1置信度評分。但是,最新研究發現,對于經過指令調整的OpenAI模型如GPT-3.5,多項選擇提示能夠提供近似的答案概率。作者采用多項選擇提示法,引導模型為每個給定的實例生成一個多項選擇答案及相應的理由。這些答案經過解析,轉換成了分段的數值評分,其中“強烈同意”對應1.0分,而“強烈反對”對應0.0分。隨后,這些評分會被閾值化為二進制標簽,用戶可以調整這個閾值,以決定何時一個實例應被視為與概念相匹配。

LLooM為每個輸入項賦予一個分數(如0到1的范圍),用以描述其與特定概念的關聯度。系統針對每一個高級概念,對所有示例(輸入文本)運行“評分”操作符,生成一個概念評分,該評分評估每個實例與生成的概念提示的契合度。

在給定??個示例和??個高級概念的情況下,此階段會生成一個??×??的矩陣,其中每個示例都會有一個二進制概念標簽。

最終,依據概念評分的結果,LLooM可以借助循環操作進行多輪迭代。一旦評分階段完成,循環操作符便會識別出兩類離群點:

? 未被覆蓋的示例,即那些與現有任何高級概念都不相符的案例;

?被通用概念所覆蓋的示例,也就是那些只與“通用”概念相匹配的案例,這些概念至少與50%的示例相匹配。

所有這些示例將作為輸入數據,流入算法的下一輪迭代,而后續運行中生成的概念也將整合進概念的全集之中。

算法的局限性

? 首先,LLooM算法提供了眾多可調參數,比如在蒸餾階段要抽取的引用數量和生成的項目符號數目。盡管這些參數對用戶而言是可理解的,但用戶提前設置這些參數并不直觀,因此最佳做法是讓系統在可能的情況下自動設定這些值。系統設有默認值和計算參數值的公式,但這些尚未進行廣泛的適用性測試。

? 此外,當前版本的算法并未包含驗證步驟,例如確保引用的精確匹配、項目符號與引用的準確性,以及概念分數和理由的正確性。盡管對于大型語言模型來說,可靠的驗證始終是一個挑戰,但LLooM未來的改進版或許能從程序化的檢查和專為每個階段輸出驗證而設計的LLM操作符中獲益。我們對大型語言模型的應用也意味著,重新運行算法時結果會有變化。這種變化可以作為一個探索并行分析路徑和模擬變化的有用特性,但在分析必須可復制或需要強大且一致的對齊時,這可能是不可取的。

Arxiv

通往 AGI 的神秘代碼

if like_this_article():
    do_action('點贊')
    do_action('再看')
    add_wx_friend('iamxxn886')

if like_all_arxiv_articles():
    go_to_link('https://github.com/HuggingAGI/HuggingArxiv')    star_github_repo(''https://github.com/HuggingAGI/HuggingArxiv')

LLooM:大語言模型時代文本聚類新思路-AI.x社區

本文轉載自??大語言模型論文跟蹤??,作者:HuggingAGI ?

收藏
回復
舉報
回復
相關推薦
成人一级黄色大片| 91人人澡人人爽人人精品| 精品国产无码AV| 国模一区二区三区| 亚洲欧美色婷婷| 久热精品在线观看视频| 免费毛片在线播放免费| 加勒比久久高清| 色美美综合视频| 日本一区二区三区四区五区六区| 三级小视频在线观看| 日本特黄久久久高潮| 九九久久国产精品| 天堂一区在线观看| 美女精品视频| 欧美国产欧美综合| 欧美孕妇性xx| 朝桐光av在线| 天天综合91| 午夜天堂影视香蕉久久| 在线视频欧美一区| 欧美日韩国产综合视频| 国产盗摄精品一区二区三区在线| 性欧美xxxx交| 日本一级二级视频| 欧洲杯什么时候开赛| 亚洲国产精品成人av| 亚洲第一区第二区第三区| 欧美电影免费观看高清完整| 夜夜夜精品看看| 在线日韩av永久免费观看| 番号在线播放| 久久综合色天天久久综合图片| 97碰碰碰免费色视频| 欧美一区免费观看| 国产欧美日韩在线观看视频| 亚洲精品乱码久久久久久金桔影视| av在线网站免费观看| 激情中国色综合| 在线视频国产一区| 欧美aⅴ在线观看| а√天堂8资源中文在线| 一区二区三区四区精品在线视频| 91精品久久久久久久久久入口| 日韩精品在线免费视频| 在线一区免费观看| 国内外成人免费激情在线视频网站| 久久久久久久久久久久久女过产乱| 日韩欧美中字| 在线亚洲欧美视频| 久久久久久久毛片| 精品日韩毛片| 这里只有精品视频在线| 男人的天堂官网| 国产在视频线精品视频www666| 亚洲精品视频久久| 久久黄色片网站| 色综合一区二区日本韩国亚洲| 欧美日本在线播放| 日韩欧美理论片| 国产日韩在线观看视频| 欧美一二三在线| 香蕉视频在线观看黄| 999久久精品| 亚洲成年人影院在线| 深夜视频在线观看| 日本欧美三级| 亚洲女人天堂成人av在线| 强伦人妻一区二区三区| 精品一区二区三| 色婷婷综合成人| 国产精品三区在线观看| 欧美日韩亚洲三区| 91av中文字幕| 天天综合天天做| 欧美激情777| 欧美高清视频在线播放| 久热这里只有精品6| 久久亚洲欧洲| 91久久国产综合久久91精品网站| 国产白浆在线观看| 97国产精品videossex| 日韩精品一区二区三区外面| 日本三级视频在线播放| 亚洲综合在线五月| 男人的天堂99| 99久久这里有精品| 亚洲黄色www| 老司机精品免费视频| 午夜日韩激情| 日本久久亚洲电影| 国产视频在线观看免费 | 韩国三级丰满少妇高潮| 国产区精品视频在线观看豆花| 亚洲区免费影片| 538任你躁在线精品视频网站| 亚洲深夜影院| 91免费版网站入口| 日韩精品福利| 亚洲乱码国产乱码精品精的特点| 亚洲国产精品久久久久婷蜜芽| 日本在线一区二区| 日韩电影免费在线观看中文字幕 | 色欲av永久无码精品无码蜜桃| 国产欧美日韩三区| 野外做受又硬又粗又大视频√| 搞黄视频免费在线观看| 亚洲精品一二三四区| 成年人视频在线免费| 999在线精品| 中文字幕亚洲在线| 99精品视频99| 国产福利一区二区| 亚洲一区二区在线免费观看| 色偷偷色偷偷色偷偷在线视频| 日韩无一区二区| 国产精品久久久久久久av| 在线成人www免费观看视频| 国产精品揄拍500视频| 亚洲天堂视频网| 99re这里都是精品| 成人午夜视频免费观看| 日日夜夜一区| 国产一区二区三区视频在线观看| 日本特黄特色aaa大片免费| 精品一区二区三区的国产在线播放| 欧美日韩国产一二| 91jq激情在线观看| 欧美电影免费提供在线观看| 美女视频久久久| 欧美bbbbb| 日本不卡一区| 毛片免费看不卡网站| 亚洲精品久久久久国产| 久久久久久久久97| 国产成人在线色| 乱子伦一区二区| 国产高清亚洲| 另类色图亚洲色图| 一二三区中文字幕| 中文字幕欧美日本乱码一线二线 | 久九九久频精品短视频| 亚洲国产精品免费| 国产成人精品亚洲男人的天堂| 国产99一区视频免费| 成人手机在线播放| 国产激情精品一区二区三区| 久久高清视频免费| 国产农村妇女毛片精品| 亚洲人妖av一区二区| 男人添女人下部视频免费| 四虎国产精品免费久久| 按摩亚洲人久久| 99国产精品99| 亚洲乱码国产乱码精品精的特点| 久久久无码人妻精品无码| 午夜天堂精品久久久久| 国产美女99p| 黄视频免费在线看| 亚洲精品资源美女情侣酒店| 日韩精品成人免费观看视频| 久久久久久久精| www.99在线| 香港欧美日韩三级黄色一级电影网站| 91久久久亚洲精品| 18videosex性欧美麻豆| 欧美精品一区二区在线观看| 国产尤物在线视频| 久久久久久久久久久久久夜| 另类小说第一页| 欧美3p视频| 99re热精品| а√在线天堂官网| 在线观看国产成人av片| 中文字幕乱码人妻无码久久| 亚洲另类在线一区| 久久久久亚洲无码| 日本免费在线视频不卡一不卡二| 亚洲综合第一| 91精品入口| 国产福利成人在线| 日本视频在线免费观看| 精品国产网站在线观看| www.国产色| 最新不卡av在线| 欧美xxxxx精品| 日韩激情在线观看| 成人一区二区av| 亚洲亚洲免费| 91亚洲国产成人精品性色| 牛牛精品一区二区| 日韩亚洲欧美中文在线| 免费国产黄色片| 欧美日韩在线综合| 精品一区在线视频| 日本一区二区三区久久久久久久久不| 日韩欧美中文视频| 天堂一区二区在线免费观看| 最新精品视频| 精品一区毛片| www.一区二区三区| 色天使综合视频| 日韩成人av网址| 亚洲综合视频在线播放| 亚洲h在线观看| 成人免费视频国产免费观看| 99视频精品在线| 国产农村妇女精品久久| 美女尤物久久精品| 国产高清www| 亚洲区综合中文字幕日日| 欧美成人免费在线| 毛片免费看不卡网站| 美日韩精品免费视频| 国产黄色片在线观看| 欧美va亚洲va| 国产伦精品一区二区三区视频痴汉| 欧美日韩国产色视频| 一级黄色录像视频| 国产精品全国免费观看高清| 中文字幕av网址| av激情亚洲男人天堂| 三级av免费看| 久久99久久99| 男人插女人下面免费视频| 中文高清一区| 91免费国产精品| 香蕉视频官网在线观看日本一区二区| 免费成人在线观看av| 欧美大奶一区二区| 国产精品国产精品国产专区不卡| 91麻豆精品国产综合久久久 | 久久久99精品久久| 中文字幕乱码在线| 盗摄精品av一区二区三区| 一个色综合久久| 美女一区二区三区| 婷婷六月天在线| 日韩国产欧美在线观看| 那种视频在线观看| 性欧美长视频| 黄色a级片免费| 老司机免费视频久久| 欧美色图另类小说| 国产精品入口| av动漫在线观看| 男人的天堂亚洲在线| 精品国产免费av| 久久大逼视频| 激情五月亚洲色图| 久久久久久自在自线| 久久久久久久激情| 日日摸夜夜添夜夜添精品视频| 国产男女无遮挡| 久久一日本道色综合久久| 国产又黄又大又粗视频| 丝袜诱惑制服诱惑色一区在线观看 | 日本道在线观看一区二区| 六月丁香激情综合| 色综合久久中文字幕综合网| 成人免费区一区二区三区| 黄色成人av网| 国产精品乱码一区二区视频| 欧洲另类一二三四区| 97免费观看视频| 日韩免费观看高清完整版 | 国产一区二区三区视频| 91.xxx.高清在线| 久久综合色88| 成人性生交大片免费看在线播放| 97精品国产97久久久久久| 在线观看欧美日韩电影| 国产精品69久久| 99蜜月精品久久91| 欧美黑人国产人伦爽爽爽| heyzo中文字幕在线| 国产99久久久欧美黑人 | 在线免费观看污| 国内免费精品永久在线视频| 粉嫩一区二区三区| 91丨九色丨国产在线| jazzjazz国产精品麻豆| 精品无人乱码一区二区三区的优势 | 亚洲国产欧美一区二区三区同亚洲| 你懂的视频在线播放| 日韩中文字幕视频在线观看| 在线观看午夜av| 日韩美女在线看| 午夜视频一区二区在线观看| 免费试看一区| 中文精品久久| 欧美日韩激情视频在线观看| 精品一区二区免费看| 亚洲美女在线播放| 国产精品无圣光一区二区| 精品人妻伦九区久久aaa片| 激情久久av一区av二区av三区| 中文字幕在线视频免费| 亚洲成年人在线播放| 午夜伦理在线| 18久久久久久| 免费精品一区| 色吧亚洲视频| 亚洲国产裸拍裸体视频在线观看乱了中文| 91淫黄看大片| av一区二区不卡| 欧美性猛交xxxx乱大交少妇| 精品久久久久久电影| 国产超碰人人模人人爽人人添| 亚洲区一区二区| 华人av在线| 亚洲综合日韩中文字幕v在线| 狠狠综合久久av一区二区蜜桃| 免费不卡av在线| 韩国三级在线一区| 欧美大波大乳巨大乳| 午夜久久久久久久久久一区二区| 国产男女无套免费网站| 中文字幕一精品亚洲无线一区| av老司机在线观看| 18成人在线| 国产高清一区| 蜜桃免费在线视频| 久久九九全国免费| 久久国产精品免费看| 亚洲国产成人爱av在线播放| 黄色动漫在线| 国产日本欧美一区二区三区在线| 久久不见久久见免费视频7| 777av视频| 成人国产精品免费网站| 一级黄色录像视频| 欧美一区二区久久久| 成人在线观看免费网站| 国产精品一区专区欧美日韩| 国产麻豆精品久久| 波多野结衣家庭教师视频| 91视视频在线直接观看在线看网页在线看| 黄色一级视频免费| 91精品国产免费| 国产日产一区二区| 91在线观看免费| 91av精品| 一级片黄色免费| 艳妇臀荡乳欲伦亚洲一区| 亚洲成人77777| 色综合久久悠悠| 一区二区三区四区精品视频| 色哺乳xxxxhd奶水米仓惠香| 国产精品自拍网站| 青青草原免费观看| 精品少妇一区二区三区免费观看| 欧美激情成人动漫| 国产精品白丝jk白祙| 亚洲电影av| 添女人荫蒂视频| 国产精品久久久久影院老司| 成人小视频在线播放| 在线观看视频亚洲| 国产精品伊人| 400部精品国偷自产在线观看 | 国产主播精品在线| 亚洲成av人电影| 精品国产一二区| 婷婷成人综合网| 国产黄色片在线观看| 国产日韩欧美黄色| 亚洲欧美亚洲| 中文字幕在线观看的网站| 一本到三区不卡视频| 91.xxx.高清在线| 亚洲xxx视频| 久久精品一区二区国产| 91社区视频在线观看| 5月丁香婷婷综合| 成人性生交大片免费看网站| 欧美黑人3p| 精品一区二区在线视频| 欧美丰满艳妇bbwbbw| 精品无人国产偷自产在线| 国产精品99精品一区二区三区∴| 亚洲综合激情五月| www.66久久| 艳妇乳肉豪妇荡乳av| 久久久久久久久久亚洲| 你懂的一区二区三区| 精产国品一二三区| 欧美性猛交xxxx乱大交3| 午夜老司机在线观看| 成人动漫在线视频| 日本aⅴ精品一区二区三区| 日韩视频中文字幕在线观看| 日韩av中文字幕在线| av日韩在线免费观看| 精品国产免费av| 亚洲黄色在线视频| 国产三级电影在线| 国产精品免费一区二区| 日本vs亚洲vs韩国一区三区| 少妇一级淫片免费放中国 |