精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Gemini技術報告解讀:從Google多模態大模型看后續大模型應該具備哪些能力

發布于 2024-11-13 16:20
瀏覽
0收藏

大家好,我是HxShine。

前段時間Google推出Gemini多模態大模型,展示了不凡的對話能力和多模態能力,其表現究竟如何呢?

本文對Gemini報告進行分析,總的來說Gemini模型在圖像、音頻、視頻和文本理解方面表現出卓越的能力。其包括 Ultra、Pro 和 Nano 尺寸,能夠適用于從復雜推理任務到設備內存受限用例的各種應用。

不像OpenAI接入多模態能力需要利用多個不同的模型,Google直接在預訓練階段直接接受多模態的輸入是Gemini的特點之一,它能夠直接處理多模態的數據,并且各項指標都還不錯。另外可以看出具備圖文理解等能力后,再結合大模型的對話能力,能夠帶來更驚艷的效果體驗。

一、概述

Title:Gemini: A Family of Highly Capable Multimodal Models

論文地址:https://storage.googleapis.com/deepmind-media/gemini/gemini_1_report.pdf

1 Motivation

發布Google的能與GPT4競爭的大模型,同時兼具多模態能力,包括文字、圖像、視頻、音頻識別與理解能力。

2 Methods

1)Gemini模型支持4種格式輸入,2種格式輸出

Gemini技術報告解讀:從Google多模態大模型看后續大模型應該具備哪些能力-AI.x社區

特點:同時支持text文本,image圖像,video視頻和audio音頻輸入,支持文本和圖片的輸出。可以直接處理音頻文件,不需要將音頻轉為文字等。

猜測的訓練方法(張俊林:https://www.zhihu.com/question/633684692/answer/3316675674):

  • 多模態訓練方法:Gemini是幾種模態一起聯合從頭訓練的,包括文本、圖片、音頻、視頻等。這與目前通常的多模態做法不太一樣,目前的多模態模型一般是使用現成的語言大模型或者經過預訓練過的圖片模型(比如CLIP的圖片編碼部分),然后利用多模態訓練數據在此基礎上加上新的網絡層訓練;如果是幾個模態從頭開始一起訓練,那么按理說應該都遵循next token prediction的模式,就應該是LVM的那個路子,其它模態的數據打成token,然后圖片、視頻等平面數據先轉換成比如16*16=256個token,然后搞成一維線性輸入,讓模型預測next token,這樣就把不同模態在訓練階段統一起來。
  • 解碼結構:Decoder only的模型結構,針對結構和優化目標做了優化,優化目的是大規模訓練的時候的訓練和推理的穩定性,所以大結構應該是類似GPT的Decoder-only預測next token prediction的模式。目前支持32K上下文。
  • 命令理解方面:和GPT一樣,采用多模態instruct數據進行SFT+RM+RLHF三階段,這里的RM部分在訓練打分模型的時候,采用了加權的多目標優化,三個目標helpfulness factuality和 safety,猜測應該是對于某個prompt,模型生成的結果,按照三個指標各自給了一個排序結果。
  • 模型大小:從硬件描述部分來看,意思是動用了前所未有的TPU集群,所以推測Gemini Ultra的模型規模應該相當大,猜測如果是MOE大概要對標到GPT 4到1.8T的模型容量,如果是Dense模型估計要大于200B參數。考慮到引入視頻音頻(當然是來自于Youtube了,難道會來自TikTok么)多模態數據,所以總數據量*模型參數,會是非常巨大的算力要求,技術報告說可以一周或者兩周做一次訓練。
  • 訓練細節:可能分成多個階段,最后階段提高了領域數據的混合配比,猜測應該指的是邏輯和數學類的訓練數據增加了配比,目前貌似很多這么做的,對于提升模型邏輯能力有直接幫助。
  • 代碼能力:AlphaCode2是在Gemini pro基礎上,使用編程競賽的數據fine-tune出來的,效果提升很明顯,在編程競賽上排名超過85%的人類選手,之前的AlphaCode1超過50%的人類選手;

2)Gemini模型有多個版本,最小有1.8B

Gemini技術報告解讀:從Google多模態大模型看后續大模型應該具備哪些能力-AI.x社區

特點:其中Nano首先從大模型蒸餾,然后4bit量化。Gemini Nano包含兩個版本:1.8B面向低端手機,3.25B面向高端手機。

3 Conclusion

1)文本理解:Ultra性能超過了GPT4

Gemini技術報告解讀:從Google多模態大模型看后續大模型應該具備哪些能力-AI.x社區

  • Ultra比gpt4效果好,pro比gpt3.5效果好,MMNLU第一次超過人類專家水平。
  • Gemini Ultra 在六個不同數據集上都是最佳。Gemini Pro是Gemini系列中的第二大模型,效率更高的同時也頗具競爭力。

2)圖像理解:zero-shot效果超過很多微調后的模型

Gemini技術報告解讀:從Google多模態大模型看后續大模型應該具備哪些能力-AI.x社區

3)視頻理解:超過之前的few-shot SoTA模型

Gemini技術報告解讀:從Google多模態大模型看后續大模型應該具備哪些能力-AI.x社區

  • 也是取得了SoTA,特別是英語視頻字幕數據集(VATEXT、YouCook2)上提升比較大,其他感覺提升沒那么大。相關評估指標如下:視頻字幕 -> CIDER,NextQA -> WUPS,Perception Test -> top-1 accuracy,ActivityNet-QA -> ActivityNet-QA。

4)不同版Genmini模型的性能


Gemini技術報告解讀:從Google多模態大模型看后續大模型應該具備哪些能力-AI.x社區

  • “事實性” :涵蓋開放/閉卷檢索和問題回答任務;
  • “長文本” :涵蓋長篇摘要、檢索和問題回答任務;
  • “數學/科學” :包括數學問題解決、定理證明和科學考試等任務;
  • “推理” :需要算術、科學和常識推理的任務;
  • “多語言” :用于多語言翻譯、摘要和推理的任務。

Gemini技術報告解讀:從Google多模態大模型看后續大模型應該具備哪些能力-AI.x社區

Nano2模型很多超過了Pro版本的50%,部分達到90的水平,效果還不錯。

5)多語種翻譯:性能超過GPT4

Gemini技術報告解讀:從Google多模態大模型看后續大模型應該具備哪些能力-AI.x社區

翻譯能力也是比GPT-4好,WMT23指標中4個有3個超過GPT4的表現。

6)圖像理解數據集:MMMU數據集表現

Gemini技術報告解讀:從Google多模態大模型看后續大模型應該具備哪些能力-AI.x社區

  • MMMU(Yue et al., 2023):是最近發布的評估基準,由6個學科的圖像問題組成,每個學科內有多個主題,需要大學水平的知識來解決這些問題。
  • Gemini Ultra將最先進的結果提高了 5 個百分點以上,6個學科中有5個學科中超越了之前的最佳成績,展示了其多模態推理能力。

二、詳細內容

1 多模態推理能力:識別手寫答案,對物理問題進行解答

Gemini技術報告解讀:從Google多模態大模型看后續大模型應該具備哪些能力-AI.x社區

特點:識別書寫結果,這個和OpenAI之前演示的根據草圖寫前端代碼是一樣的,不過識別的準確率是存疑的。

2 多模態推理能力:重新組織子圖順序

Gemini技術報告解讀:從Google多模態大模型看后續大模型應該具備哪些能力-AI.x社區

  • Gemini的多模態推理能力可生成用于重新排列子圖的matplotlib代碼。
  • Prompt:識別當前子圖的結果,重新組織子圖的順序并解釋。

解決此任務需要模型具備以下能力:

  • (1) 識別圖中描繪的函數;
  • (2) 逆向圖形來推斷生成子圖的代碼;
  • (3) 按照指令將子圖放置在所需的位置;
  • (4) 抽象推理,推斷指數圖必須留在原來的位置,因為正弦圖必須為 3 維圖移動。

3 圖像生成能力:多模態理解+圖像生成

Gemini技術報告解讀:從Google多模態大模型看后續大模型應該具備哪些能力-AI.x社區

要具備上面的功能需要以下能力:

  • (1)識別圖像中的顏色。這個難度不大。
  • (2)生成文字+圖片結果。這個難度好像也沒有那么大,可能有two-stage的實現方法或者end-to-end的實現方法。不太確定google用的哪種方法。

4 語音理解能力:具備語音識別和語音翻譯能力

Gemini技術報告解讀:從Google多模態大模型看后續大模型應該具備哪些能力-AI.x社區

對比的是OpenAI的Whisper,看著Gemini就是把多個SoTA模型包裝起來了。

5 多模態理解:支持圖片+音頻輸入

Gemini技術報告解讀:從Google多模態大模型看后續大模型應該具備哪些能力-AI.x社區

這個gptv+加個語音轉文字的模型可以做,這里的特點可能是直接用一個模型就可以解決?

三、多模態能力展示

1 幾何推理能力:求平行四邊形的高

Gemini技術報告解讀:從Google多模態大模型看后續大模型應該具備哪些能力-AI.x社區

2 視覺多模態推理能力:根據圖片確定地點

Gemini技術報告解讀:從Google多模態大模型看后續大模型應該具備哪些能力-AI.x社區

3 多語言常識推理:識別中文關系圖

Gemini技術報告解讀:從Google多模態大模型看后續大模型應該具備哪些能力-AI.x社區

4 視頻理解能力:分析視頻中的人如何提升足球技術

Gemini技術報告解讀:從Google多模態大模型看后續大模型應該具備哪些能力-AI.x社區

四、總結

  1. ?直接支持多模態的能力是Gemini的特點,Google從預訓練階段就統一了多模態大模型的訓練,該策略也可能是后續大模型的發展趨勢,但是其具體實現方法、帶來的增益、以及cost還未知。OpenAI多模態的能力是引入(支持語音)其他模型或者通過插件(支持圖像)來實現。

Gemini技術報告解讀:從Google多模態大模型看后續大模型應該具備哪些能力-AI.x社區

  1. Gemini的多模態能力比GPT4-V要強,科學推理能力可能稍微弱于GPT4。

Gemini技術報告解讀:從Google多模態大模型看后續大模型應該具備哪些能力-AI.x社區

  1. 圖文理解+視頻理解等多模態能力與最新的大模型強強組合確實能帶來驚艷的效果,但是其穩定性,是否真實能落地還有待進一步觀察。例如結合圖像信息求平行四邊行的高,在教育領域相對于純文本可能會更有價值,但是OCR等技術還面臨魯棒性偏差的問題,Google的模型段時間應該還是沒辦法解決這些問題。

Gemini技術報告解讀:從Google多模態大模型看后續大模型應該具備哪些能力-AI.x社區

本文轉載自 ??NLP PaperWeekly??,作者: NLP PaperWeekly



收藏
回復
舉報
回復
相關推薦
国产欧美高清视频在线| 日本韩国一区| 日本wwww色| 国产探花在线免费观看| 蜜桃精品视频| 久久亚洲专区| 91精品国产高清一区二区三区| 国产系列第一页| 亚洲AV无码精品自拍| 午夜一区二区三区不卡视频| 精品国偷自产在线| 三上悠亚ssⅰn939无码播放| 久久久久亚洲精品中文字幕| 色婷婷综合五月| 九九久久九九久久| 国产精品秘入口| 国产成人日日夜夜| 国产精品美女午夜av| 日韩三级av在线| 在线看片不卡| 国产亚洲精品高潮| 91传媒理伦片在线观看| 色哟哟在线观看视频| 欧美大片黄色| 国产精品免费视频一区| 精品中文字幕人| 国产麻豆免费视频| 国产一区二区你懂的| 久久99久久99精品免观看粉嫩| 欧美黄色激情视频| 噜噜噜天天躁狠狠躁夜夜精品 | 涩涩涩久久久成人精品| 黑人与娇小精品av专区| 性一交一乱一伧国产女士spa| 日韩精品毛片| 欧美国产日产图区| 另类欧美小说| 五月婷婷六月色| 高清成人免费视频| av一本久道久久波多野结衣| 一级aaaa毛片| 中文字幕欧美人妻精品| av日韩在线免费观看| 欧美色倩网站大全免费| av丝袜天堂网| 周于希免费高清在线观看| 亚洲成人免费电影| 久久久久久免费看| 国产精品一二三产区| 亚洲午夜一区二区三区| 日本阿v视频在线观看| 污视频免费在线观看| 一个色妞综合视频在线观看| 国产在线观看欧美| 深夜国产在线播放| 麻豆91在线| 1024精品合集| 欧美一二三不卡| 在线你懂的视频| 亚洲国产色一区| 国产美女主播在线播放| 国产v日韩v欧美v| 日韩欧美一区二区在线| 99免费视频观看| 91精品店在线| 69久久夜色精品国产69蝌蚪网| av污在线观看| 国产精品3区| 欧美va亚洲va香蕉在线| 亚洲精品在线视频免费观看| 天堂99x99es久久精品免费| 亚洲欧洲日本专区| 国产白丝一区二区三区| 欧美激情日韩| 欧美一级电影免费在线观看| 最近中文字幕在线视频| 麻豆网在线观看| 中文字幕av不卡| 自拍偷拍99| 青草影视电视剧免费播放在线观看| 亚洲国产另类精品专区| 凹凸日日摸日日碰夜夜爽1| 日本久久二区| 日韩精品中文字幕在线不卡尤物| 看全色黄大色黄女片18| 精品产国自在拍| 久久精品免费电影| 黄色小说在线观看视频| 久久精品国语| 亚洲字幕一区二区| 亚洲色图21p| 1000部国产精品成人观看| 老子影院午夜伦不卡大全| 天堂√8在线中文| 欧美日韩高清一区二区| www.555国产精品免费| 深爱激情综合| 欧美高清不卡在线| 日本a级c片免费看三区| 国产乱人伦偷精品视频不卡| 欧美18视频| 久久亚洲资源| 欧美日韩国产天堂| 蜜臀av粉嫩av懂色av| 色无极亚洲影院| 91精品国产高清久久久久久久久| 夜夜爽8888| 2020日本不卡一区二区视频| 成人听书哪个软件好| 久久久久网址| 777电影在线观看| 高跟丝袜一区二区三区| 三大队在线观看| 日韩欧美高清| 欧美一级电影免费在线观看| 国产夫妻性生活视频| 久久色视频免费观看| 久久亚洲a v| 亚洲免费资源| 中文日韩电影网站| 五月婷婷视频在线| 不卡一区在线观看| 国产精品三级一区二区| 国产精品日本一区二区三区在线| 国产亚洲欧美aaaa| 中国一级免费毛片| 岛国一区二区在线观看| 日韩中文在线字幕| 九七电影院97理论片久久tvb| 日韩电影网在线| 日本一二三区视频| 国产ts人妖一区二区| 色乱码一区二区三区熟女| 美女写真久久影院| 亚洲视频国产视频| 国产黄色片免费看| 99re成人精品视频| 霍思燕三级露全乳照| xxxx日韩| 欧美激情久久久| 黄色片网站免费在线观看| 亚洲精品午夜久久久| 亚洲精品乱码久久久久久动漫| 欧美综合一区| 国产日韩中文字幕| 午夜视频在线看| 欧美日韩成人激情| 国产日产在线观看| 麻豆91在线播放免费| 一本久道久久综合狠狠爱亚洲精品 | 国产呦萝稀缺另类资源| 免费在线观看污污视频| 国产999精品在线观看| 久久国产精品网站| 成人精品在线播放| 五月婷婷另类国产| av在线播放网址| 国产日韩欧美一区在线 | 亚洲 欧美 激情 另类| 大桥未久av一区二区三区| 91精品人妻一区二区三区蜜桃欧美| 国产欧美大片| 亚洲精品久久久久久一区二区| 国产精品黄色片| 久久综合国产精品台湾中文娱乐网| 国产日韩欧美中文字幕| 亚洲影视在线观看| 蜜桃传媒一区二区亚洲av| 日韩—二三区免费观看av| 亚洲国产欧洲综合997久久 | www.毛片com| 国产成人精品综合在线观看| 日本欧美黄色片| 欧美影院三区| 91九色对白| 欧美xx视频| 久久影视免费观看| 天堂在线观看免费视频| 色94色欧美sute亚洲线路一久| 91成人精品一区二区| 国产福利电影一区二区三区| 69堂免费视频| 99精品全国免费观看视频软件| 18成人在线| 日本成人片在线| 欧美成人午夜视频| 能在线看的av| 香蕉免费一区二区三区在线观看 | 岛国视频一区| 午夜日韩成人影院| 免费不卡在线观看av| 亚洲欧美日韩成人在线| 欧美日韩国产色站一区二区三区| 久久综合成人网| 国产精品网站在线播放| 精品人妻人人做人人爽夜夜爽| 老**午夜毛片一区二区三区 | 欧美剧情片在线观看| 奇米影视第四色777| 国产精品初高中害羞小美女文| 97中文字幕在线观看| 蜜桃久久精品一区二区| 日韩国产一级片| 91精品国产麻豆国产在线观看 | 激情综合在线| 尤物一区二区三区| 亚洲深夜福利在线观看| 99久久精品免费看国产一区二区三区| 日韩一级二级| 欧美一区二粉嫩精品国产一线天| 国产美女av在线| 亚洲午夜色婷婷在线| 日本激情一区二区| 日韩一区二区三区四区五区六区| 无码人妻aⅴ一区二区三区有奶水| 亚洲综合一区二区精品导航| 永久免费未视频| 国产日本亚洲高清| 捆绑凌虐一区二区三区| 国产精品911| 成人性生交视频免费观看| 日韩电影网1区2区| 国产性xxxx18免费观看视频| 亚洲黄色高清| 免费在线精品视频| 欧美xxxx中国| 亚洲国产成人不卡| 欧美三级伦理在线| 欧美亚洲精品日韩| 影视先锋久久| 久久亚洲高清| 久久久伦理片| 国产欧美日韩综合一区在线观看| 麻豆久久一区| 97自拍视频| 香蕉免费一区二区三区在线观看| 亚洲自拍在线观看| 日韩中文在线| 99国产视频| 成人av资源网址| 国产精品免费观看高清| 超碰在线成人| 极品尤物一区二区三区| 欧美激情15p| 久久福利电影| 天堂在线精品| 欧美一区2区三区4区公司二百| 久久91麻豆精品一区| 日韩一区不卡| 天天操夜夜操国产精品| 中国老女人av| 韩国在线视频一区| 青草青青在线视频| 伊人久久大香线蕉综合热线| 国产3p露脸普通话对白| 99成人精品| 日本黄网站免费| 日本怡春院一区二区| 亚洲天堂国产视频| 国产精品资源网站| 国产十八熟妇av成人一区| 91污在线观看| 国产精品理论在线| 亚洲欧洲日韩一区二区三区| 欧美成人一区二区三区高清| 亚洲午夜免费视频| 国产一区免费看| 777午夜精品免费视频| 精品女同一区二区三区| 亚洲激情第一页| 成人性生交大片免费看午夜 | 国产精品18久久久久久vr| 大尺度在线观看| 久久亚洲私人国产精品va媚药| 国产农村妇女精品一区| 一区二区三区中文在线| 国产黄色片免费看| 欧美久久久一区| 十八禁一区二区三区| 在线观看成人黄色| www.久久ai| 日韩美女在线播放| 成人在线视频国产| 欧美高清性xxxxhd| 你懂的网址国产 欧美| 成年人免费在线播放| 国模少妇一区二区三区| 国产国语性生话播放| 中文字幕一区二区三区乱码在线 | 天天舔天天操天天干| 一区二区三区四区不卡在线 | 国产一区二区三区四区五区入口| 黄色免费看视频| 中文字幕五月欧美| 中文字幕视频网| 精品卡一卡二卡三卡四在线| 成人在线二区| 91精品国产色综合久久不卡98口 | 免费无遮挡无码永久在线观看视频 | 日韩中文在线不卡| 国产精品原创| 91亚洲精品丁香在线观看| 国产一区网站| 激情深爱综合网| 国产一二三精品| 谁有免费的黄色网址| 午夜精品一区二区三区电影天堂| 亚洲在线免费观看视频| 日韩精品在线观看视频| 色av手机在线| 成人国产精品一区二区| 欧美**字幕| 欧美亚洲日本一区二区三区 | 在线不卡av电影| 亚洲国产毛片aaaaa无费看| 欧美另类高清videos的特点| 精品爽片免费看久久| 免费电影网站在线视频观看福利| 国产女精品视频网站免费| 国产91精品对白在线播放| 奇米精品一区二区三区| 成人综合激情网| 欧美人妻精品一区二区免费看| 欧美色精品天天在线观看视频| 日本福利在线观看| 97婷婷涩涩精品一区| 91麻豆精品激情在线观看最新| 一区二区免费在线视频| 美女一区二区三区| 手机av免费看| 欧美天堂在线观看| 久久国产精品高清一区二区三区| 亚洲激情久久久| 在线中文字幕第一页| 成人天堂噜噜噜| 99久久婷婷| 中国黄色片一级| 中文字幕一区二区三区蜜月| 亚洲天堂中文网| 最近2019中文免费高清视频观看www99 | 综合在线影院| 欧美激情第六页| 奶水喷射视频一区| 在线免费看黄视频| 日本乱人伦aⅴ精品| 巨骚激情综合| 国产精品免费福利| 欧美色网址大全| www.夜夜爽| 亚洲免费观看高清完整 | 日韩精品黄色网| 中文在线аv在线| 人禽交欧美网站免费| 欧美aaa在线| 夫妻性生活毛片| 日韩欧美中文一区二区| 丁香花在线高清完整版视频| 国产一区二区在线观看免费播放| 国产精品夜夜夜| 中文天堂资源在线| 欧美一区二区三区人| av毛片午夜不卡高**水| 欧美xxxx黑人又粗又长密月| 日韩不卡一区二区| 国产av无码专区亚洲av毛网站| 精品成人免费观看| 成人做爰视频www网站小优视频| 一区二区不卡在线视频 午夜欧美不卡'| 国产在线播精品第三| 九九视频在线观看| 亚洲人成电影在线| 亚洲精品一区av| 无码av天堂一区二区三区| 国产亚洲精品福利| 99产精品成人啪免费网站| 久久久久久亚洲精品| 国内亚洲精品| 男人的天堂免费| 肥熟一91porny丨九色丨| 欧美日韩中字| 午夜福利三级理论电影| 欧美性猛交xxxxx水多| 在线激情网站| 国产精品久久久久久免费观看| 亚洲欧美日韩国产| 国精品人伦一区二区三区蜜桃| 日韩免费电影网站| 亚洲www免费| 国产女教师bbwbbwbbw| 久久久精品2019中文字幕之3| 国产视频手机在线观看| 热re99久久精品国产66热| 91精品一区国产高清在线gif| 少妇一级淫片免费放播放| 欧美浪妇xxxx高跟鞋交| 午夜激情电影在线播放| 久久精品国产精品亚洲精品色 | 法国空姐电影在线观看| 欧美成人a∨高清免费观看| 成人va天堂|