精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

網(wǎng)絡(luò)安全大模型評測平臺SecBench發(fā)布

安全
2024年1月19日,網(wǎng)絡(luò)安全大模型評測平臺SecBenc正式發(fā)布,該平臺由騰訊朱雀實驗室和騰訊安全科恩實驗室,聯(lián)合騰訊混元大模型、清華大學(xué)江勇教授/夏樹濤教授團(tuán)隊、香港理工大學(xué)羅夏樸教授研究團(tuán)隊、上海人工智能實驗室OpenCompass團(tuán)隊共同建設(shè),主要解決開源大模型在網(wǎng)絡(luò)安全應(yīng)用中安全能力的評估難題,旨在為大模型在安全領(lǐng)域的落地應(yīng)用選擇基座模型提供參考,加速大模型落地進(jìn)程。

2024年1月19日,網(wǎng)絡(luò)安全大模型評測平臺SecBenc正式發(fā)布,該平臺由騰訊朱雀實驗室和騰訊安全科恩實驗室,聯(lián)合騰訊混元大模型、清華大學(xué)江勇教授/夏樹濤教授團(tuán)隊、香港理工大學(xué)羅夏樸教授研究團(tuán)隊、上海人工智能實驗室OpenCompass團(tuán)隊共同建設(shè),主要解決開源大模型在網(wǎng)絡(luò)安全應(yīng)用中安全能力的評估難題,旨在為大模型在安全領(lǐng)域的落地應(yīng)用選擇基座模型提供參考,加速大模型落地進(jìn)程。同時,通過建設(shè)安全大模型評測基準(zhǔn),為安全大模型研發(fā)提供公平、公正、客觀、全面的評測能力,推動安全大模型建設(shè)。

行業(yè)首發(fā),彌補(bǔ)大模型在網(wǎng)絡(luò)安全垂類領(lǐng)域評測空白

202211月ChatGPT發(fā)布以來,AI大模型在全球范圍內(nèi)掀起了有史以來規(guī)模最大的人工智能浪潮,大模型的落地進(jìn)程也隨之加速。然而,在網(wǎng)絡(luò)安全應(yīng)用中,大模型研發(fā)人員如何選擇合適的基座模型,當(dāng)前大模型的安全能力是否已經(jīng)達(dá)到業(yè)務(wù)應(yīng)用需求,都成為亟待解決的問題。

SecBench網(wǎng)絡(luò)安全大模型評測平臺,將重點(diǎn)從能力、語言、領(lǐng)域、安全證書考試四個維度對大模型在網(wǎng)絡(luò)安全領(lǐng)域的各方面能力進(jìn)行評估,為大模型研發(fā)人員、學(xué)術(shù)研究者提供高效、公正的基座模型選型工具和研究參考。

圖 1. SecBench網(wǎng)絡(luò)安全大模型評測整體設(shè)計架構(gòu)


圖 2. GPT-4在能力維度、語言維度以及安全領(lǐng)域能力的評估結(jié)果



圖 3. GPT-4在各類安全證書考試中的評估結(jié)果(綠色為通過考試)

SecBench設(shè)計架構(gòu)

圖1. 為SecBench網(wǎng)絡(luò)安全大模型評測初期規(guī)劃的架構(gòu),主要圍繞三個維度進(jìn)行構(gòu)建:

一是積累行業(yè)獨(dú)有的網(wǎng)絡(luò)安全評測數(shù)據(jù)集。評測數(shù)據(jù)是評測基準(zhǔn)建設(shè)的基礎(chǔ),也是大模型能力評測最關(guān)鍵的部分。目前行業(yè)內(nèi)還沒有專門針對大模型在網(wǎng)絡(luò)安全垂類領(lǐng)域的評測基準(zhǔn)/框架,主要原因也是由于評測收據(jù)缺失的問題。因此,構(gòu)建網(wǎng)絡(luò)安全大模型評測基準(zhǔn)的首要目標(biāo)是積累行業(yè)內(nèi)獨(dú)有的網(wǎng)絡(luò)安全評測數(shù)據(jù)集,覆蓋多語言、多題型、多能力、多領(lǐng)域,以全面地評測大模型安全能力。

二是搭建方便快捷的網(wǎng)絡(luò)安全大模型評測框架。“百模大戰(zhàn)”下,大模型的形態(tài)各異,有HuggingFace上不斷涌現(xiàn)的開源大模型,有類似GPT-4、騰訊混元、文心一言等大模型API服務(wù),以及自研本地部署的大模型。評測框架如何支持各類大模型的快速接入、快速評測也很關(guān)鍵。此外,評測數(shù)據(jù)的多樣性也挑戰(zhàn)著評測框架的靈活性,例如,選擇題和問答題往往需要不同的prompt和評估指標(biāo),如何快速對比few shot和zero shot的差異。因此,需要搭建方便快捷的網(wǎng)絡(luò)安全大模型評測框架,以支持不同模型、不同數(shù)據(jù)、不同評測指標(biāo)的靈活接入、快速評測。

三是輸出全面、清晰的評測結(jié)果。網(wǎng)絡(luò)安全大模型研發(fā)的不同階段其實對評測的需求不同。例如,在研發(fā)初期進(jìn)行基座模型選型階段,通常只需要了解各類基座模型的能力排名、對比不同模型能力差異;而在網(wǎng)絡(luò)安全大模型研發(fā)階段,就需要了解每次迭代模型能力的變化,仔細(xì)分析評估結(jié)果等。因此,網(wǎng)絡(luò)大模型評測需要輸出全面、清晰的評測結(jié)果,如評測榜單、能力對比、中間結(jié)果等,以支持不同研發(fā)階段的需求。

SecBench除了圍繞上述三個目標(biāo)進(jìn)行建設(shè)外,還設(shè)計了兩個網(wǎng)絡(luò)安全特色能力:安全領(lǐng)域評測安全證書考試評估。安全領(lǐng)域評測從垂類安全視角,評測大模型在九個安全領(lǐng)域的能力;安全證書考試評估支持經(jīng)典證書考試評估,評測大模型通過安全證書考試的能力。

SecBench評測框架

SecBench網(wǎng)絡(luò)安全評測框架可以分為數(shù)據(jù)接入模型接入模型評測結(jié)果輸出四個部分,通過配置文件配置數(shù)據(jù)源、評測模型、評估指標(biāo),即可快速輸出模型評測結(jié)果。

  • 數(shù)據(jù)接入:在數(shù)據(jù)接入上,SecBench支持多類型數(shù)據(jù)接入,如選擇題、判斷題、問答題等,同時支持自定義數(shù)據(jù)接入及評測prompt模板定制化。
  • 模型接入:在模型接入上,SecBench同時支持HuggingFace開源模型、大模型API服務(wù)、本地部署大模型自由接入,還支持用戶自定義模型。
  • 模型評測:在模型評測上,SecBench支持多任務(wù)并行,加快評測速度。此外,SecBench已內(nèi)置多個評估指標(biāo)以支持常規(guī)任務(wù)結(jié)果評估,也支持自定義評估指標(biāo)滿足特殊需求。
  • 結(jié)果輸出:在結(jié)果輸出上,SecBench不僅可以將評測結(jié)果進(jìn)行前端頁面展示,還可以輸出模型評測中間結(jié)果,如配置文件、輸入輸出、評測結(jié)果文件等,支持網(wǎng)絡(luò)安全大模型研發(fā)人員數(shù)據(jù)分析需求。

圖 4. SecBench網(wǎng)絡(luò)安全大模型評測框架

SecBench評測數(shù)據(jù)

網(wǎng)絡(luò)安全大模型的能力難以評測,主要原因之一還是網(wǎng)絡(luò)安全垂類數(shù)據(jù)的缺失。為了解決這一問題,SecBench目前已經(jīng)收集整理了12個安全評測數(shù)據(jù)集,累計數(shù)據(jù)10000條。

  • 語言維度:覆蓋中文、英文兩類常見語言的評測。
  • 能力維度:從安全視角,支持大模型對安全知識的知識記憶能力、邏輯推理能力、理解表達(dá)能力的評估。
  • 領(lǐng)域維度:支持大模型在不同安全領(lǐng)域能力的評測,包括數(shù)據(jù)安全、應(yīng)用安全、端點(diǎn)與主機(jī)安全、網(wǎng)絡(luò)與基礎(chǔ)架構(gòu)安全、身份與訪問控制、基礎(chǔ)軟硬件與技術(shù)、安全管理等。
  • 證書考試:SecBench還積累了各類安全證書模擬試題支持大模型安全證書等級考試評估。


圖 5. SecBench網(wǎng)絡(luò)安全大模型評測數(shù)據(jù)分布

當(dāng)前SecBench評測數(shù)據(jù)仍然存在多樣性不足、分布不均勻等問題,當(dāng)前正在持續(xù)補(bǔ)充建設(shè)多題型、多能力、多維度的評測數(shù)據(jù)。

SecBench評測結(jié)果

SecBench正在逐步接入大模型進(jìn)行網(wǎng)絡(luò)安全能力評測,目前主要針對經(jīng)典GPT模型以及小規(guī)模開源模型進(jìn)行評測榜單輸出。展示模型在能力、語言、安全領(lǐng)域不同能力維度的結(jié)果,同時支持安全等級證書考試結(jié)果輸出。后續(xù)將持續(xù)接入商用大模型、安全大模型,支持模型能力對比等能力。

圖 6. SecBench網(wǎng)絡(luò)安全大模型評測榜單

隨著大模型在網(wǎng)絡(luò)安全領(lǐng)域的落地應(yīng)用加速,網(wǎng)絡(luò)安全大模型的評測變得尤為關(guān)鍵。SecBecnch初步建立起圍繞網(wǎng)絡(luò)安全垂類領(lǐng)域的評測能力以更好地支持網(wǎng)絡(luò)安全大模型的研發(fā)及落地應(yīng)用。此外為評估大模型在Prompt安全方面的表現(xiàn),騰訊朱雀實驗室已聯(lián)合清華大學(xué)深圳國際研究生院,發(fā)布了《大語言模型(LLM) 安全性測評基準(zhǔn)》

未來展望

SecBecnch初步建立起圍繞網(wǎng)絡(luò)安全垂類領(lǐng)域的評測能力,然而還有許多需要優(yōu)化迭代的地方:一是仍需持續(xù)補(bǔ)充構(gòu)建高質(zhì)量的網(wǎng)絡(luò)安全評測數(shù)據(jù),覆蓋多領(lǐng)域、多題型,以更好地支持模型在網(wǎng)絡(luò)安全領(lǐng)域的全面評測;二是快速跟進(jìn)大模型評測,對于新發(fā)布的大模型,能夠及時輸出評測結(jié)果;三是豐富模型結(jié)果呈現(xiàn)方式,支持模型對比、結(jié)果分析等功能,以滿足不同用戶的使用需求。SecBench也希望能夠引入更多的合作伙伴,包括學(xué)術(shù)界、工業(yè)界相關(guān)從業(yè)者,共創(chuàng)共贏,共同推動網(wǎng)絡(luò)安全大模型的發(fā)展。


責(zé)任編輯:鳶瑋 來源: 騰訊
相關(guān)推薦

2024-04-17 12:51:49

2024-02-26 12:30:17

2012-03-13 13:44:01

Hillstone網(wǎng)絡(luò)安全

2012-04-24 18:39:10

HillstoneHSA

2023-09-03 16:20:30

2023-10-07 00:23:34

2023-11-20 14:34:09

2021-11-12 06:05:38

網(wǎng)絡(luò)安全安全預(yù)測網(wǎng)絡(luò)攻擊

2023-11-06 13:56:20

2011-03-17 13:32:45

2023-11-09 14:38:28

2021-05-12 11:12:06

智慧城市網(wǎng)絡(luò)安全

2020-07-30 09:29:19

網(wǎng)絡(luò)安全漏洞技術(shù)

2025-07-03 07:40:00

網(wǎng)絡(luò)安全大語言模型網(wǎng)絡(luò)攻擊

2009-03-11 14:14:47

2022-09-02 14:34:34

網(wǎng)絡(luò)安全勒索軟件攻擊

2021-11-19 11:51:27

CISA網(wǎng)絡(luò)安全美國

2023-06-08 00:16:58

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

亚洲精品蜜桃久久久久久| 欧美成人一区在线| 日av中文字幕| 日本在线视频站| 国产成人av一区二区| 欧美怡春院一区二区三区| 日本美女bbw| 亚洲视频三区| 欧美亚洲国产怡红院影院| 成人在线免费高清视频| 三级黄视频在线观看| 久久99精品国产麻豆婷婷| 久久久久久中文字幕| 91在线无精精品白丝| 91国内精品| 欧美午夜电影一区| 国产日韩欧美精品在线观看| 91porn在线观看| 成人av午夜影院| 国产主播在线一区| 韩国av中文字幕| 欧美a级在线| 国产亚洲一区精品| 欧美大片免费播放器| 国产精品毛片aⅴ一区二区三区| 精品日本美女福利在线观看| 日本福利视频导航| 日韩亚洲视频在线观看| 国产寡妇亲子伦一区二区| 国产精品69久久| 日韩精品视频播放| 欧美福利影院| 久久精品国产成人精品| a天堂中文字幕| 欧美挤奶吃奶水xxxxx| 日韩视频免费直播| 九色porny自拍| 亚洲成a人片| 欧美日韩亚洲一区二区三区| 996这里只有精品| 免费在线午夜视频| 欧美国产精品专区| 日本一区二区三不卡| 亚洲日本在线播放| www.欧美色图| 国产精品一区免费观看| www.99视频| 国产一区 二区 三区一级| 国产精品亚洲视频在线观看| 波多野结衣视频观看| 久久成人亚洲| 国产精品999999| 中文字幕永久在线| 国产精品试看| 欧美专区第一页| 特级毛片www| 性色一区二区| 日韩免费视频在线观看| www欧美在线| 久久精品日产第一区二区 | 成人激情电影在线看| 久久天天做天天爱综合色| 国产综合动作在线观看| 污污网站免费在线观看| 91伊人久久大香线蕉| 久久精品国产一区二区三区不卡| 色天堂在线视频| 国产欧美精品区一区二区三区 | 成人在线播放| 亚洲欧美另类久久久精品2019| 国产精品av免费| 五月天激情在线| 亚洲成人免费看| 成熟了的熟妇毛茸茸| 吉吉日韩欧美| 欧美日韩免费一区二区三区| 三级黄色片免费观看| 最新国产精品精品视频| 日韩h在线观看| 日韩视频在线观看免费视频| 91综合久久一区二区| 久久99久久亚洲国产| 天天插天天操天天干| 首页国产欧美久久| 91精品在线影院| 日韩一级片免费观看| 国产亚洲综合在线| 91免费视频黄| 97人人在线视频| 欧美在线观看你懂的| 五月天六月丁香| 伊人久久大香线蕉综合网蜜芽| 色狠狠av一区二区三区香蕉蜜桃| 精品国产乱码久久久久久鸭王1 | 亚洲欧美久久久久| 香蕉成人app| 亚洲精品资源在线| 久久精品一区二区三区四区五区 | 欧美精品videos另类日本| 日韩欧美性视频| 精品一区二区三区香蕉蜜桃| 国产一区二区三区四区五区加勒比| 精品视频二区| 一级日本不卡的影视| 黑森林精品导航| 加勒比视频一区| 日韩在线免费视频观看| 在线看成人av| 久草精品在线观看| 久久久综合亚洲91久久98| 精品视频在线一区二区| 一本色道久久加勒比精品| 深夜福利网站在线观看| 国产精品日韩精品中文字幕| 欧美另类在线观看| 国产精品国产精品国产| 99在线精品视频| 日韩不卡视频一区二区| 成人开心激情| 精品亚洲男同gayvideo网站| 九九热国产在线| 看电视剧不卡顿的网站| 欧美成ee人免费视频| 性xxxfreexxxx性欧美| 欧美喷水一区二区| 91精品人妻一区二区三区蜜桃欧美| 欧美va天堂| 91日本在线视频| 成人午夜影视| 欧美色另类天堂2015| 国产污在线观看| 中文字幕一区二区三区在线视频 | 最新av免费在线观看| 蜜桃一区二区| 97免费视频在线| 青青草成人网| 中国一级特黄视频| 91啪亚洲精品| 乱妇乱女熟妇熟女网站| 中文无码日韩欧| 久久偷看各类女兵18女厕嘘嘘| 最新中文字幕免费| 国产日韩欧美在线一区| 韩国日本在线视频| 外国成人在线视频| 97在线视频免费看| 人妻一区二区三区| 亚洲宅男天堂在线观看无病毒| 亚洲国产日韩欧美在线观看| 日韩88av| 国产综合久久久久| 日韩理伦片在线| 欧美美女一区二区在线观看| 日本视频在线免费| 久久成人18免费观看| 亚洲一区二区在线看| 一区在线影院| yw.139尤物在线精品视频| 91成品人影院| 亚洲免费av高清| 久久精品aⅴ无码中文字字幕重口| 亚洲成人免费| 成人看片视频| 这里有精品可以观看| 亚洲丝袜av一区| 中文字幕乱码人妻无码久久 | 国产传媒免费在线观看| 国产毛片一区二区| 蜜臀精品一区二区| 欧美人与动xxxxz0oz| 热久久这里只有精品| 可以在线观看的av网站| 欧美色视频在线观看| 青青草原在线免费观看| 成人免费视频caoporn| 欧美 日韩 国产一区| 成人在线免费观看视频| 成人免费网站在线看| 欧美hdxxxx| 亚洲精品一区二三区不卡| 中国老头性行为xxxx| 一区二区三区欧美在线观看| 亚洲精品乱码久久久久久久| 日韩精品午夜视频| 99精品一级欧美片免费播放| 欧美sss在线视频| 国产精品久久久久久av下载红粉| 快射av在线播放一区| 精品国产99国产精品| 一级黄色在线观看| 在线观看免费av片| 不卡视频免费播放| 日韩精品一区中文字幕| 久久婷婷蜜乳一本欲蜜臀| 91九色对白| 亚洲欧洲高清| 免费97视频在线精品国自产拍| 亚洲av成人精品日韩在线播放| 欧美三级韩国三级日本一级| 91视频青青草| 91香蕉视频在线| 国产永久免费网站| 午夜亚洲性色视频| 中文字幕av导航| 美日韩中文字幕| 亚洲在线视频观看| 成人va天堂| 国语自产精品视频在线看抢先版图片| 国产精品免费播放| 日韩av在线免费看| av网站在线免费看| 91国偷自产一区二区使用方法| 九九视频免费观看| 国产精品全国免费观看高清| 国产亚洲色婷婷久久99精品91| 精品一区二区三区免费| 日韩免费毛片视频| 18成人免费观看视频| 三级网在线观看| 欧美系列电影免费观看| 精品一区二区三区免费毛片| 涩爱av色老久久精品偷偷鲁| 国产在线高清精品| 二区三区不卡| 91国内精品久久| 欧美性猛片xxxxx免费中国| 最新国产精品拍自在线播放| 性xxxxbbbb| 精品福利二区三区| www.av黄色| 欧美一区二区在线不卡| 亚洲午夜精品久久久| 一本久久综合亚洲鲁鲁五月天| 国产在线拍揄自揄拍无码视频| 亚洲人成精品久久久久久| 林心如三级全黄裸体| 国产蜜臀97一区二区三区 | 久久精品在线免费观看| asian性开放少妇pics| av电影在线观看不卡| 18禁一区二区三区| 久久精品国产第一区二区三区| 成人性生生活性生交12| 水野朝阳av一区二区三区| 女人另类性混交zo| 久久中文精品| wwwwxxxx日韩| 美女mm1313爽爽久久久蜜臀| 少妇一级淫免费播放| 精品系列免费在线观看| 尤物国产在线观看| 激情五月激情综合网| 午夜啪啪小视频| 国产精品一区二区久久不卡 | 久久亚洲一区二区三区明星换脸| 在线免费播放av| 久久噜噜亚洲综合| 国产精品一二三区在线观看| 久久久久久久久免费| 免费成人深夜天涯网站| 中文字幕制服丝袜一区二区三区| 亚洲 欧美 变态 另类 综合| 亚洲欧美国产三级| 久久久久亚洲av无码专区体验| 亚洲国产一区二区三区青草影视 | 污污影院在线观看| 久久久久久av| 亚洲校园激情春色| 国产精品高潮粉嫩av| 欧美午夜三级| 91免费版网站在线观看| 9l视频自拍九色9l视频成人| 久久99蜜桃综合影院免费观看| 少妇精品久久久| 亚洲高清资源综合久久精品| 欧美一区精品| 久久久一本二本三本| 日本欧美韩国一区三区| 91人妻一区二区三区| eeuss国产一区二区三区| 国产男女猛烈无遮挡a片漫画| 中文字幕免费不卡| 欧美片一区二区| 色综合网色综合| 国产精品无码免费播放| 日韩精品极品视频| 欧美三级黄网| 欧美性在线视频| 国产一区二区av在线| 精品欧美一区二区在线观看视频| 国产探花一区在线观看| 好吊色视频988gao在线观看| 久久久久99| xxxxwww一片| 中文字幕av一区二区三区免费看| 精品午夜福利视频| 欧美在线一区二区三区| 亚洲欧美激情国产综合久久久| 一区二区亚洲欧洲国产日韩| 美足av综合网| 国产欧美日韩免费| 伦理一区二区三区| 中国老女人av| 欧美aa在线视频| 国产精品成人99一区无码| 中文字幕五月欧美| 国产成人一级片| 亚洲精品一区二区三区在线观看| 最新真实国产在线视频| 57pao成人永久免费视频| 国产美女精品视频免费播放软件| 欧美日韩综合久久| 亚洲国产1区| 日本少妇激三级做爰在线| 国产视频一区二区三区在线观看| 亚洲国产综合久久| 日韩视频免费直播| 国产91在线视频蝌蚪| 国产精品福利小视频| 国产剧情一区| jizzjizz国产精品喷水| 成人动漫一区二区| 久操视频免费在线观看| 91麻豆精品国产自产在线观看一区 | 亚洲欧美综合国产精品一区| 人妻精品无码一区二区三区 | 国产精品免费在线视频| 欧美日韩一区二区三区| 黄色三级网站在线观看| 免费成人高清视频| 亚洲欧美专区| 亚洲一区二区三区涩| 美女视频网站久久| 亚洲а∨天堂久久精品2021| 欧美午夜无遮挡| 色鬼7777久久| 欧美一级免费看| 宅男在线一区| 日本在线视频www| 久久婷婷色综合| 国产一级淫片a视频免费观看| 国产视频精品久久久| 一级毛片久久久| 欧美日韩一区在线播放| 三级欧美韩日大片在线看| 一级片视频免费看| 欧美日韩和欧美的一区二区| av电影在线网| 成人在线中文字幕| 午夜久久99| 亚洲欧美日韩偷拍| 欧美日韩精品在线| 黄色大片在线看| 国产精品欧美亚洲777777| 成人同人动漫免费观看| xxww在线观看| 一区二区三区欧美| 亚洲欧洲成人在线| 国产成人高清激情视频在线观看| 精品理论电影在线| 蜜桃福利午夜精品一区| 一区二区三区四区在线播放| 日本韩国在线观看| 奇米4444一区二区三区| 成人免费在线观看av| 欧美xxxxxbbbbb| 五月天丁香久久| 国产精品麻豆一区二区三区| 国产一区二区香蕉| 国产精品久久| 野花社区视频在线观看| 欧美偷拍一区二区| 成人av免费| 精品伊人久久大线蕉色首页| 青青国产91久久久久久| 欧美成人黄色网| 亚洲欧美中文字幕| 成人久久精品| 777米奇影视第四色| 国产精品久久久久婷婷| 亚洲成人黄色片| 日韩免费精品视频| 欧美日韩国产成人精品| 一区二区黄色片| 欧美一区二区在线不卡| 是的av在线| 欧美一级特黄aaaaaa在线看片| 97精品电影院| 国产精品久久久久精| 97视频免费在线观看| 欧美超碰在线| 大黑人交xxx极品hd| 51精品久久久久久久蜜臀| 五月天av在线| 久久久天堂国产精品| 国产欧美日韩另类视频免费观看| 亚洲精品一区二区三区四区| 国产精品美女久久久久久免费| 在线播放精品| 看黄色录像一级片|