精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

超越GPT-4V,蘋果多模態(tài)大模型上新!

發(fā)布于 2024-4-11 09:45
瀏覽
0收藏

一句話Siri就能幫忙打開美團外賣下訂單的日子看來不遠啦!


4月8日,蘋果發(fā)布了其最新的多模態(tài)大語言模型(MLLM )——Ferret-UI,能夠更有效地理解和與屏幕信息進行交互,在所有基本UI任務(wù)上都超過了GPT-4V!

超越GPT-4V,蘋果多模態(tài)大模型上新!-AI.x社區(qū)

論文地址:??https://arxiv.org/pdf/2404.05719.pdf??


雖然蘋果前段時間經(jīng)歷了泰坦項目的沉沒,但看目前的形式,這是又要開卷的節(jié)奏呀~

超越GPT-4V,蘋果多模態(tài)大模型上新!-AI.x社區(qū)

不少人十分期待,這項技術(shù)如果在蘋果的Siri上,Siri豈不是要變得聰明絕頂了!

超越GPT-4V,蘋果多模態(tài)大模型上新!-AI.x社區(qū)

眾所周知,通用域多模態(tài)大型語言模型(MLLM )在理解和有效交互的能力方面往往不足。


而Ferret-UI被稱之為是一種新的MLLM,專為理解移動UI屏幕而量身定制,具備指向、定位和推理等多種能力。


Ferret-UI能夠通過靈活的輸入格式(點、框、涂鴉)和基礎(chǔ)任務(wù)(例如:查找小部件、查找圖標、查找文本、小部件列表)在移動用戶界面屏幕上執(zhí)行引用任務(wù)(例如:小部件分類、圖標識別、OCR) )。


Ferret-UI的一個關(guān)鍵特點是「任何分辨率」(anyres),該技術(shù)通過放大細節(jié)來解決UI屏幕中小型對象的識別問題,從而提高模型對UI元素的理解精度。


這些基本任務(wù)為模型提供了豐富的視覺和空間知識,使其能夠在粗略和精細級別上區(qū)分 UI 類型, 例如區(qū)分各種圖標或文本元素。


具體來說,F(xiàn)erret-UI 不僅能夠在詳細描述和感知對話中討論視覺元素, 還能在交互對話中提出目標導向的動作并通過函數(shù)推理來推斷屏幕的整體功能。

超越GPT-4V,蘋果多模態(tài)大模型上新!-AI.x社區(qū)

網(wǎng)友直呼:泰褲辣!

超越GPT-4V,蘋果多模態(tài)大模型上新!-AI.x社區(qū)

雖然Ferret-UI-base緊密遵循Ferret的架構(gòu),但Ferret-UI-anyres融入了額外的細粒度圖像功能。


特別是,預(yù)先訓練的圖像編碼器和投影層可以為整個屏幕生成圖像特征,對于基于原始圖像長寬比獲得的每個子圖像,生成附加圖像特征。

超越GPT-4V,蘋果多模態(tài)大模型上新!-AI.x社區(qū)

為了增強模型的推理能力, 研究人員編譯了用于高級任務(wù)的數(shù)據(jù)集,包括詳細描述、 感知/交互對話和函數(shù)推理。


在基礎(chǔ)任務(wù)性能的比較上, Ferret-UI展現(xiàn)出了對UI屏幕的出色理解能力以及執(zhí)行開放式指令的能力,表現(xiàn)可謂亮眼!

超越GPT-4V,蘋果多模態(tài)大模型上新!-AI.x社區(qū)

掌握應(yīng)用程序屏幕并使AI像人類一樣進行交互,蘋果未來或許將改變MLLM的游戲規(guī)則!

論文細節(jié)

方法

Ferret-UI建立在Ferret的基礎(chǔ)上。


Ferret是一種MLLM,擅長在形狀和細節(jié)各異的自然圖像中進行空間參照和定位。

超越GPT-4V,蘋果多模態(tài)大模型上新!-AI.x社區(qū)

它可以解釋區(qū)域或?qū)ο蟛⑴c之交互,無論這些區(qū)域或?qū)ο蟊恢付槿魏巫杂尚螤睿c、方框等)。


它包含一個預(yù)先訓練好的視覺編碼器和一個純解碼器語言模型,并采用一種獨特的混合表示技術(shù),將指定區(qū)域轉(zhuǎn)換為適合LLM處理的格式。


為了向Ferret灌輸UI專業(yè)知識,他們對Ferret-UI進行了兩個擴展:

1. UI參照和定位的定義與構(gòu)建

2. 模型架構(gòu)調(diào)整以更好地處理屏幕數(shù)據(jù)

與之前需要外部檢測模塊或屏幕視圖文件的MLLM不同, Ferret-UI 是自給自足的。


它將原始屏幕像素作為模型輸入,這種方法不僅促進了高級單屏交互,還為新應(yīng)用程序鋪平道路,例如:提高可訪問性。

數(shù)據(jù)集

他們對iPhone和安卓設(shè)備的屏幕進行了研究。


對于安卓屏幕,研究人員使用RICO數(shù)據(jù)集的一個子集,具體來說,他們考慮了Spotlight中的任務(wù),其數(shù)據(jù)是公開的,包括 screen2words、widgetcaptions 和 taperception。


對于iPhone屏幕,研究人員使用AMP數(shù)據(jù)集,它涵蓋了廣泛的應(yīng)用程序。

超越GPT-4V,蘋果多模態(tài)大模型上新!-AI.x社區(qū)

在收集 Android 和 iPhone 屏幕后,他們使用預(yù)先訓練好的基于像素的UI檢測模型進一步從屏幕收集細粒度元素注 釋。


對于每個檢測到的用戶界面元素,輸出結(jié)果都包括用戶界面類型(按鈕、文本、圖標、圖片等)、相應(yīng)的邊界框,以及由Apple Vision Framework識別的顯示在其上的文本(如果有的話)。


任務(wù)制定

?

首先從現(xiàn)有的Spotlight任務(wù)中獲取screen2words、widgetcaptions和taperception,并將它們格式化為會話QA 對。


對于每個訓練示例,他們都會對相應(yīng)任務(wù)的提示進行采樣,并將其與原始源圖像和真實答案配對。


基礎(chǔ)任務(wù)數(shù)據(jù)生成


除了Spotlight任務(wù)之外,他們將referring任務(wù)定義為輸入中帶有邊界框的任務(wù),而基礎(chǔ)任務(wù)則是輸出中帶有邊界框的任務(wù)。


對于每個任務(wù),他們還使用GPT-3.5 Turbo來擴展基本提示以引入任務(wù)問題的變體。

數(shù)據(jù)生成的詳細信息如下圖所示。

超越GPT-4V,蘋果多模態(tài)大模型上新!-AI.x社區(qū)

高級任務(wù)數(shù)據(jù)生成


為了將推理能力融入到該模型中,他們使用LLaVA方法,并用GPT-4收集另外4種格式的數(shù)據(jù)。


首先對檢測輸出中的邊界框坐標進行標準化,然后將檢測、提示和可選的一次性示例發(fā)送到GPT-4。


為了詳細描述和功能推理,他們將生成的響應(yīng)與預(yù)選的提示配對來訓練Ferret-UI。


下圖說明了高級任務(wù)的訓練數(shù)據(jù)生成過程。

超越GPT-4V,蘋果多模態(tài)大模型上新!-AI.x社區(qū)

以上數(shù)據(jù)的生成主要為4個任務(wù),分別是:詳細描述、對話感知、對話交互和功能推理。


其中,他們擴展了詳細描述和函數(shù)推理的基本提示,將它們與GPT-4響應(yīng)配對,作為模型訓練中的輸入數(shù)據(jù)。


對于對話任務(wù),他們?yōu)镚PT-4提供了一個上下文示例,以更好地遵循其輸出中的邊界框格式。

實驗結(jié)果

初級任務(wù)的性能細分如下表所示。

超越GPT-4V,蘋果多模態(tài)大模型上新!-AI.x社區(qū)

可以看到,與Spotlight相比,F(xiàn)erret-UI在S2W和 WiC方面表現(xiàn)出了優(yōu)越的性能,盡管Spotlight使用了80M網(wǎng)頁截圖和269M手機截圖進行預(yù)訓練。Ferret-UI性能雖然低于TaP,但仍然具有競爭力。


高級任務(wù)性能的結(jié)果如下表所示。

超越GPT-4V,蘋果多模態(tài)大模型上新!-AI.x社區(qū)

盡管Ferret-UI的訓練數(shù)據(jù) 集中缺少Android特定數(shù)據(jù),但它在兩個平臺的高級任務(wù)上都表現(xiàn)出了值得稱贊的性能。


這表明用戶界面知識在不同操作系統(tǒng)之間具有顯著的可轉(zhuǎn)移性。


消融研究


研究發(fā)現(xiàn),當僅使用高級任務(wù)數(shù)據(jù),兩個平臺的性能均為64%。添加iPhone或Android基本任務(wù) 后,iPhone上高級任務(wù)的性能持續(xù)提高5%。


同樣,從iPhone添加基本任務(wù)可將Android在高級任務(wù)上的性能提高約4%,而合并Android基本任務(wù)可將這一性能提高9%。


包含iPhone和Android基本任務(wù)后,iPhone 和 Android 高級任務(wù)的性能分別進一步提高了3%和5%,超出了單組基本任務(wù)所帶來的改進。


這些觀察結(jié)果支持他們的假設(shè),即:基本任務(wù)為模型提供了增強的視覺和空間理解,從而促進了高級任務(wù)。

超越GPT-4V,蘋果多模態(tài)大模型上新!-AI.x社區(qū)

為了探索不同數(shù)據(jù)配置對Spotlight Tasks性能的影響,他們特別研究了添加初級任務(wù)數(shù)據(jù)是否能提高模型性能,因為這些任務(wù)的目的是為了提高對屏幕的視覺和空間理解能力。


如下表所示,添加基本任務(wù)數(shù)據(jù)(無論是僅來自Android、iPhone還是兩者的組合)都不會顯著改變?nèi)齻€Spotlight任務(wù)的性能。

超越GPT-4V,蘋果多模態(tài)大模型上新!-AI.x社區(qū)

在分析Ferret-UI 的參照功能時,他們特別關(guān)注OCR和小部件分類預(yù)測,如下圖所示。

超越GPT-4V,蘋果多模態(tài)大模型上新!-AI.x社區(qū)

OCR分析揭示了三個值得注意的觀察結(jié)果:


1. 模型預(yù)測相鄰文本而不是目標區(qū)域中的文本

2. 該模型表現(xiàn)出預(yù)測實際單詞的傾向,而不僅僅是破譯屏幕上顯示的字符。

3.Ferret-UI展示了準確預(yù)測部分被截斷的文本的能力,即使在OCR模型返回不正確文本的情況下也是如此。


本文轉(zhuǎn)自 新智元 ,作者:新智元


原文鏈接:??https://mp.weixin.qq.com/s/CXJ1ROgt1Si2CRV85EsAPQ??

收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦
中日韩午夜理伦电影免费| 亚洲一二三专区| 国产精品人人做人人爽| 九九精品视频免费| 国产精品1luya在线播放| 欧美日韩国产综合新一区| 日韩欧美亚洲在线| www.桃色av嫩草.com| 亚洲专区免费| 另类视频在线观看| 久久人人爽人人爽人人片| 久久av影院| 精品福利在线看| 亚洲va久久久噜噜噜久久狠狠| av无码精品一区二区三区宅噜噜| 亚洲欧美激情诱惑| 欧美精品一二区| 国产精品久久久久久久av| eeuss国产一区二区三区四区| 一本色道亚洲精品aⅴ| 国产精品免费看久久久无码| 精品无人乱码| 成人久久视频在线观看| 国产成人福利视频| 久久精品视频久久| 91超碰国产精品| 亚洲欧美日韩网| 东京热av一区| 色8久久久久| 91黄色小视频| 欧美变态另类刺激| 青青草视频在线免费直播| 中文av一区特黄| 久久99精品久久久久久三级 | 欧美伊人精品成人久久综合97| 国产曰肥老太婆无遮挡| 欧美jizz18hd性欧美| 久久精品网站免费观看| 精品午夜一区二区三区| 亚洲av无码一区二区乱子伦| 久久99久久精品| 国产精品美女在线观看| 日韩在线播放中文字幕| av成人激情| 久久久亚洲国产| 精品无码人妻一区二区三区品| 亚洲国产一成人久久精品| 在线观看日韩www视频免费| 黄色工厂在线观看| 秋霞综合在线视频| 日韩成人在线播放| 波多野结衣加勒比| 美女一区2区| 精品sm捆绑视频| 亚洲色图欧美另类| 成人av婷婷| 精品久久久久久久久久久久久久久| 欧美激情第3页| 国产亚洲人成a在线v网站 | 99精品视频播放| 自由日本语热亚洲人| 欧美性生交xxxxx久久久| 北条麻妃在线视频观看| 超碰国产一区| 欧美在线观看禁18| 日韩欧美亚洲另类| 日本高清久久| 亚洲成**性毛茸茸| 免费看黄色aaaaaa 片| 国产欧美一区二区精品久久久| 亚洲人成网站免费播放| 亚洲天堂最新地址| 久久精品免费一区二区三区| 欧美精品午夜视频| 日本在线免费观看| 久久激情综合| 国产免费久久av| a天堂在线视频| aaa国产一区| 欧美影视一区二区| 免费观看在线黄色网| 一区二区三区成人| 欧美v在线观看| 秋霞国产精品| 日韩一级二级三级| 一级国产黄色片| 日本一区二区高清不卡| 免费91麻豆精品国产自产在线观看| 免费一级a毛片夜夜看 | 亚洲亚洲免费| 日韩中文在线观看| 日本少妇在线观看| 久久久国产亚洲精品| 国产精品人成电影| 亚洲男人第一天堂| 国产欧美一区二区在线观看| 在线观看污视频| 一本大道色婷婷在线| 欧美精品久久99久久在免费线| 免费欧美一级片| 国产欧美一区二区三区精品观看| 插插插亚洲综合网| 亚洲熟妇无码乱子av电影| 国产麻豆欧美日韩一区| 欧美日韩综合网| 婷婷在线播放| 欧美三区免费完整视频在线观看| 精品国产乱码久久久久夜深人妻| 国产日产精品一区二区三区四区的观看方式 | 国精品无码一区二区三区| 欧美在线播放| 国产精品成人久久久久| 亚洲男人天堂久久| 亚洲欧美自拍偷拍色图| 国产精品97在线| 日韩欧美激情电影| 综合欧美国产视频二区| 久久久久99精品成人片三人毛片| 精品无人码麻豆乱码1区2区| 欧美精品在线一区| 丁香花在线高清完整版视频| 欧美日高清视频| 国产高清自拍视频| 国模吧视频一区| 成人久久精品视频| www.亚洲资源| 色8久久精品久久久久久蜜| 大尺度在线观看| 自拍偷拍欧美| 91免费电影网站| av网站在线免费播放| 91激情五月电影| 偷拍女澡堂一区二区三区| 好吊一区二区三区| 亚洲一区二区三区毛片| 中文字幕在线观看日本| 欧美网站大全在线观看| 人人妻人人澡人人爽人人精品| 狠狠综合久久| 99精品国产一区二区| 黄色一级大片在线免费看产| 欧美午夜不卡视频| 手机毛片在线观看| 日精品一区二区三区| 欧美日韩在线观看一区| 三上悠亚亚洲一区| 伊人久久久久久久久久久| 午夜精品一区二| 久久亚洲二区三区| 成人在线观看a| 国产成人短视频在线观看| 欧美又大又硬又粗bbbbb| 四虎在线观看| 色94色欧美sute亚洲13| 一级特黄曰皮片视频| 蜜臀av性久久久久蜜臀aⅴ四虎 | 国产一二三在线观看| 色综合一个色综合| 免费看污片网站| 三级不卡在线观看| 亚洲国产一区在线| 成人国产精品久久| 久久久久久91| 天天躁日日躁狠狠躁伊人| 欧美日韩亚洲精品内裤| 男女做爰猛烈刺激| 蜜桃av噜噜一区| 日韩不卡一二区| 国产福利资源一区| 日韩av电影手机在线| wwwww在线观看免费视频| 欧美日韩大陆在线| 欧美人妻精品一区二区三区| 成人一区二区在线观看| 国内精品视频一区二区三区| 午夜先锋成人动漫在线| 国产精品免费久久久久影院| av在线free| 精品亚洲国产成av人片传媒| 国产一卡二卡三卡| ...av二区三区久久精品| 亚洲少妇一区二区| 久久精品官网| 亚洲小说欧美另类激情| 亚欧日韩另类中文欧美| 国产精品亚洲自拍| 菠萝蜜视频在线观看www入口| 精品亚洲永久免费精品| 亚洲综合精品国产一区二区三区| 一区二区三区在线看| 日韩人妻一区二区三区| 精品一区二区三区久久久| 日韩极品视频在线观看 | 午夜一区二区三区| 日韩一区二区三区色| 欧美最猛性xxxxx(亚洲精品)| 日本a级在线| 亚洲国产精品成人av| 中文字幕乱码人妻无码久久 | 天堂在线免费观看视频| 中文字幕在线播放不卡一区| 佐佐木明希电影| 日本视频一区二区| 国产成人永久免费视频| 日韩成人影院| 久久99国产精品| 国产精品白丝久久av网站| 4438全国成人免费| 91麻豆国产福利在线观看宅福利| 亚洲性生活视频在线观看| www久久久久久| 欧美午夜在线一二页| 国产成人自拍视频在线| 亚洲色图欧美偷拍| 老熟妇一区二区| eeuss鲁片一区二区三区在线观看| 欧美成人黄色网址| 性色一区二区三区| 国产精品一线二线三线| 91精品国产乱码久久久久久| 欧美一区二区综合| 人体久久天天| 成人自拍网站| 国产精品1区| 国产精品三级网站| 向日葵视频成人app网址| 国产69精品久久久久9| 91麻豆一二三四在线| 日韩最新av在线| 成年人在线视频免费观看| 亚洲精品国产美女| 色欲av永久无码精品无码蜜桃| 91精品福利在线一区二区三区| 成人黄色免费网| 色婷婷久久久久swag精品| 欧美激情亚洲综合| 午夜精品久久久久久久99樱桃| 在线观看成人毛片| 亚洲精品视频一区二区| 欧美做爰啪啪xxxⅹ性| 亚洲视频中文字幕| 国产免费久久久久| 亚洲卡通欧美制服中文| 国产一区二区播放| 综合电影一区二区三区| 91香蕉一区二区三区在线观看| 欧美国产成人精品| 极品尤物一区二区| 国产精品乱人伦中文| 国产福利在线导航| 中文字幕色av一区二区三区| 欧美a级片免费看| 最好看的中文字幕久久| 久久爱一区二区| 自拍偷在线精品自拍偷无码专区| 青花影视在线观看免费高清| 1000精品久久久久久久久| 波多野结衣亚洲色图| 亚洲精品videosex极品| 久久久久久av无码免费网站| 亚洲午夜免费电影| 日韩成人av毛片| 日韩欧美亚洲范冰冰与中字| 精品久久久久久久久久久久久久久久久久 | 精品国产乱码久久久久久久久| 精品毛片在线观看| 日韩av影视在线| 国产在线小视频| 色噜噜狠狠狠综合曰曰曰| h网站久久久| 97久久精品人搡人人玩| 日韩新的三级电影| 91在线看www| 欧美成人一区在线观看| 欧美极品视频一区二区三区| 欧美中文字幕一区二区| 免费国产成人看片在线| 亚洲无线视频| 免费看a级黄色片| 国内精品写真在线观看| 国产白袜脚足j棉袜在线观看 | 在线成人免费视频| 亚洲国产精品无码久久| 日韩精品在线视频观看| 成人福利在线| 欧美极品美女电影一区| 欧美艳星kaydenkross| 91手机视频在线观看| 欧洲在线一区| 中文字幕日韩一区二区三区 | 精品中文字幕视频| 美女网站在线看| 国产免费一区二区三区在线观看| jazzjazz国产精品久久| 视频一区国产精品| 狠狠色丁香久久综合频道| 日本中文字幕高清| 成人中文字幕合集| 人人干在线观看| 狠狠色狠狠色综合日日小说| 国产美女主播在线观看| 亚洲女人被黑人巨大进入| 超碰在线无需免费| 国产精品va在线播放我和闺蜜| 无人区乱码一区二区三区| 日韩一本精品| 国产欧美日本| 手机在线播放av| 中文字幕一区日韩精品欧美| 日本天堂网在线| 精品日韩99亚洲| 国产日产一区二区三区| 国产mv久久久| 国产精品xxx在线观看| 最新av网址在线观看| 日韩激情视频在线观看| 香港三日本8a三级少妇三级99| 综合久久一区二区三区| 中文字幕 亚洲视频| 日韩乱码在线视频| av在线加勒比| 91在线在线观看| 久久精品青草| 手机看片福利日韩| 国产亚洲污的网站| 国产成人一区二区三区影院在线| 欧美成人欧美edvon| 成人在线视频亚洲| 国产日本欧美视频| 欧美肉体xxxx裸体137大胆| 日韩av资源在线| 91网址在线看| 日韩免费视频一区二区视频在线观看| 日韩欧美一区在线| 黄色网页在线看| 91久久精品美女高潮| 欧美激情理论| 成年网站免费在线观看| 国产精品久线在线观看| 中文字幕欧美色图| 最新国产成人av网站网址麻豆| 三上悠亚激情av一区二区三区| 蜜桃传媒视频第一区入口在线看| 一区二区三区四区五区精品视频 | 亚洲自拍第二页| 色婷婷av一区二区三区久久| 久久久久久久性潮| 国产精品av免费| 国产麻豆日韩欧美久久| 黄色一级视频在线观看| 精品少妇一区二区三区在线视频| 色呦呦久久久| 国产精品视频在线免费观看| 亚洲日本成人| 熟女丰满老熟女熟妇| 日韩欧美国产高清91| 国产黄色片在线播放| 国产精品96久久久久久又黄又硬| 欧美日韩一二| 中文av字幕在线观看| 亚洲精品中文在线影院| 精品国自产拍在线观看| 高清一区二区三区四区五区| 日韩av三区| 久久午夜夜伦鲁鲁一区二区| 国产精品国产三级国产有无不卡| 国产精品一区二区三区在线免费观看| 美女av一区二区| 国产一区二区三区不卡av| 日韩精品xxxx| 中文字幕欧美日韩一区| 国产日韩欧美中文字幕| 久久免费少妇高潮久久精品99| 美日韩黄色大片| 国产精品入口免费软件| 一区二区三区色| 性感美女一级片| 国产精品天天狠天天看| 中文字幕一区二区av| 熟女人妻在线视频| 欧美亚洲愉拍一区二区| 日本高清在线观看视频| 久久精品五月婷婷| 久久精品国产99国产精品| 免费毛片在线播放免费| 亚洲视频一区二区三区| 国产人与zoxxxx另类91| aa在线免费观看| 日韩美女久久久| 四虎精品在永久在线观看| 国产欧美日韩中文字幕| 影音先锋日韩资源| 2019男人天堂| 亚洲黄页网在线观看| 久久久精品一区二区毛片免费看| 国产免费一区二区视频| 国产精品色眯眯| 神马午夜电影一区二区三区在线观看| 国产精品日日摸夜夜添夜夜av| 精久久久久久|