精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Phi-3-Vision-128K大模型,AI助力OCR,文檔處理更上一層樓

發布于 2024-10-15 14:17
瀏覽
0收藏

1 Phi-3-Vision-128K-Instruct 簡介

Phi-3-Vision-128K-Instruct 屬于 Phi-3 模型家族,專為多模態數據處理而構建,支持長達 128,000 個令牌的上下文長度。該模型融合了文本和視覺數據,非常適合需要同時解釋文本和圖像的任務。其開發涉及 5000 億個訓練令牌,包括高質量的合成數據和經過嚴格篩選的公開可用資源。此外,通過監督微調和偏好優化等精細訓練手段,Phi-3-Vision-128K-Instruct 被打造成能夠提供精確、可靠且安全的人工智能解決方案。

Phi-3-Vision-128K-Instruct 擁有42億個參數,其架構精巧,集成了圖像編碼器、連接器、投影器以及 Phi-3 Mini 語言模型,使其成為輕量級但功能強大的選擇,適用于廣泛的應用。

2 應用場景

Phi-3-Vision-128K-Instruct 模型的應用范圍廣泛,主要聚焦在以下幾個核心領域:

1). 文檔提取和OCR技術:能夠高效地將圖像中的文字或掃描的文檔轉換成可編輯的格式,尤其擅長處理包含表格、圖表等復雜布局的文檔。這使其成為數字化紙質文檔或自動化數據提取工作流程的有價值工具。

2). 圖像內容理解:該模型能夠解析圖像內容,識別出圖像中的對象,理解場景,并從中提取出有用的信息。

3). 資源受限環境:即使在計算能力或內存受限的環境下,Phi-3-Vision-128K-Instruct 也能夠運行AI任務,確保性能不打折。

4). 實時應用場景:能夠減少實時應用程序中的處理延遲,適用于實時數據流、聊天助手或流媒體內容分析等場景,以提高響應速度。

3 部署 Phi-3-Vision-128K-Instruct

要使用 Phi-3-Vision-128K-Instruct,需要設置所需的庫和工具的開發環境。該模型集成在 Hugging Face transformers 庫的開發版本(4.40.2)中。在深入代碼示例之前,先確保你的 Python 環境配置了這些包:

# 所需包
flash_attn==2.5.8
numpy==1.24.4
Pillow==10.3.0
Requests==2.31.0
torch==2.3.0
torchvision==0.18.0
transformers==4.40.2

要加載模型,可以更新本地 transformers 庫。

模型加載示例

以下是一個 Python 示例,展示了如何初始化模型并進行推理。使用類和函數來保持代碼的清晰性和結構性:

from PIL import Image
import requests
from transformers import AutoModelForCausalLM, AutoProcessor

class Phi3VisionModel:
    def __init__(self, model_id="microsoft/Phi-3-vision-128k-instruct", device="cuda"):
        """
        Initialize the Phi3VisionModel with the specified model ID and device.
        
        Args:
            model_id (str): The identifier of the pre-trained model from Hugging Face's model hub.
            device (str): The device to load the model on ("cuda" for GPU or "cpu").
        """
        self.model_id = model_id
        self.device = device
        self.model = self.load_model()  # 在初始化期間加載模型
        self.processor = self.load_processor()  # 在初始化期間加載處理器
    
    def load_model(self):
        """
        Load the pre-trained language model with causal language modeling capabilities.
        
        Returns:
            model (AutoModelForCausalLM): The loaded model.
        """
        print("Loading model...")
        # 使用自動設備映射和數據類型調整加載模型
        return AutoModelForCausalLM.from_pretrained(
            self.model_id, 
            device_map="auto",  # 自動將模型映射到適當的設備
            torch_dtype="auto",  # 根據設備使用適當的 torch 數據類型
            trust_remote_code=True,  # 允許執行自定義代碼以加載模型
            _attn_implementation='flash_attention_2'  # 使用優化的注意力實現
        ).to(self.device)  # 將模型移動到指定的設備
    
    def load_processor(self):
        """
        Load the processor associated with the model for processing inputs and outputs.
        
        Returns:
            processor (AutoProcessor): The loaded processor for handling text and images.
        """
        print("Loading processor...")
        # 使用 trust_remote_code=True 加載處理器,以處理任何自定義處理邏輯
        return AutoProcessor.from_pretrained(self.model_id, trust_remote_code=True)
    
    def predict(self, image_url, prompt):
        """
        Perform a prediction using the model given an image and a prompt.
        
        Args:
            image_url (str): The URL of the image to be processed.
            prompt (str): The textual prompt that guides the model's generation.
        
        Returns:
            response (str): The generated response from the model.
        """
        # 從提供的 URL 加載圖像
        image = Image.open(requests.get(image_url, stream=True).raw)
        
        # 為模型格式化輸入提示模板
        prompt_template = f"<|user|>\n<|image_1|>\n{prompt}<|end|>\n<|assistant|>\n"
        
        # 處理輸入,將提示和圖像轉換為張量格式
        inputs = self.processor(prompt_template, [image], return_tensors="pt").to(self.device)
        
        # 設置模型響應生成的生成參數
        generation_args = {
            "max_new_tokens": 500,  # 生成的最大令牌數
            "temperature": 0.7,     # 生成的采樣溫度,以增加多樣性
            "do_sample": False      # 禁用采樣以獲得確定性輸出
        }
        print("Generating response...")
        # 使用模型生成輸出 ID,跳過輸入令牌
        output_ids = self.model.generate(**inputs, **generation_args)
        output_ids = output_ids[:, inputs['input_ids'].shape[1]:]  # Ignore the input prompt in the output
        
        # 解碼生成的輸出令牌以獲得響應文本
        response = self.processor.batch_decode(output_ids, skip_special_tokens=True)[0]
        return response

# 初始化模型
phi_model = Phi3VisionModel()

# 示例預測
image_url = "https://example.com/sample_image.png"  # 示例圖像的 URL  
prompt = "Extract the data in json format."  # 指導模型的提示  
response = phi_model.predict(image_url, prompt)  # 獲取模型的響應 

print("Response:", response)  # 打印生成的響應

上述代碼定義了 Phi3VisionModel? 類,它抽象了模型的加載和使用,使其更容易集成到你的應用程序中。predict() 方法展示了如何使用自定義提示進行基于圖像的推理。

4 OCR 功能測試

為了評估 Phi-3-Vision-128K-Instruct 模型的 OCR 性能,我們選取了一些真實掃描的身份證圖像作為測試樣本。這些圖像質量參差不齊,清晰度也各不相同,給模型帶來了不同程度的挑戰。目標是展示模型如何能夠從具有不同特征的文檔中提取文本信息,例如模糊、復雜的背景和不同的文本字體。

圖像 1:一本虛構的護照,上面詳細記錄了個人資料,包括姓名、國籍、出生地、簽發日期和有效期。底部有一個可讀區域。圖像質量高,背景噪音不明顯。

輸出:

{
  "Type/Type": "P",
  "Country code/Code du pays": "UTO",
  "Passport Number/N° de passeport": "L898902C3",
  "Surname/Nom": "ERIKSSON",
  "Given names/Prénoms": "ANNA MARIA",
  "Nationality/Nationalité": "UTOPIAN",
  "Date of Birth/Date de naissance": "12 AUGUST/AOUT 74",
  "Personal No./N° personnel": "Z E 184226 B",
  "Sex/Sexe": "F",
  "Place of birth/Lieu de naissance": "ZENITH",
  "Date of issue/Date de délivrance": "16 APR/AVR 07",
  "Authority/Autorité": "PASSPORT OFFICE",
  "Date of expiry/Date d'expiration": "15 APR/AVR 12",
  "Holder's signature/Signature du titulaire": "anna maria eriksson",
  "Passport/Passeport": "P<UTOERIKSSON<<ANNA<MARIA<<<<<<<<<<<<<<<<<<<<<<<L898902C36UT07408122F1204159ZE184226B<<<<10"
}

圖像 2:一本荷蘭護照,上面有清晰的持有人照片和整齊格式化的文本。字段包括護照號碼、姓名、出生日期、國籍和有效期。文件以高對比度呈現,文本提取相對直接。底部的可讀區域(MRZ)提供了結構化的數據格式,有助于驗證提取信息的準確性。

Phi-3-Vision-128K大模型,AI助力OCR,文檔處理更上一層樓-AI.x社區

輸出:

以下是從護照中提取的完整數據,以 JSON 格式呈現:

{
  "passport": {
    "issuingCountry": "Netherlands",
    "issuingAuthority": "Koninkrijk der Nederlanden",
    "passportNumber": "SPEC12014",
    "issuingDate": "09 MAR 2014",
    "expiryDate": "09 MAR 2024",
    "holder": {
      "gender": "F",
      "nationality": "Netherlands",
      "placeOfBirth": "SPECIMEN",
      "sex": "WF",
      "firstNames": [
        "Willem",
        "Lieselotte"
      ]
    },
    "physicalDescription": {
      "height": "1.75 m",
      "hairColor": "gray",
      "hairLength": "short"
    },
    "issuingOffice": "Burg. van Stad en Dorp",
    "issuingDateAsInt": "14032014",
    "expiryDateAsInt": "14032024",
    "fieldsExtracted": [
      {
        "code": "NL",
        "dateOfBirth": "10 MAR 1965",
        "dateOfIssue": "09 MAR 2014",
        "dateOfExpiry": "09 MAR 2024",
        "firstNames": [
          "Willem",
          "Lieselotte"
        ],
        "nationality": "Netherlands",
        "passportNumber": "SPEC12014",
        "placeOfBirth": "SPECIMEN",
        "sex": "WF"
      }
    ]
  }
}

5 在線體驗 Phi-3-Vision-128K-Instruct

如果你想親自嘗試 Phi-3-Vision-128K-Instruct 模型,你可以通過以下鏈接來體驗:https://ai.azure.com/explore/models/Phi-3-vision-128k-instruct/version/1/registry/azureml。這個鏈接可以體驗模型的功能,嘗試其 OCR 功能。

Phi-3-Vision-128K大模型,AI助力OCR,文檔處理更上一層樓-AI.x社區

6 架構與訓練

Phi-3-Vision-128K-Instruct 模型不單是一個語言模型,它是一個強大的多模態工具,能夠同時處理視覺和文本數據。這個模型經歷了包含5000億個令牌的綜合訓練,涵蓋了文本和圖像數據。其架構巧妙地融合了語言模型和圖像處理模塊,構建了一個能夠理解超過128K令牌上下文的連貫系統,使之能夠應對長篇對話或處理大量內容的文檔。

得益于在如512 H100 GPU這樣的高性能硬件上的訓練,以及采用flash attention技術提高內存效率,Phi-3-Vision-128K-Instruct 模型能夠輕松駕馭大規模任務。它的訓練數據集是合成數據和經過篩選的真實世界數據的混合體,特別強調了數學、編碼、常識推理和一般知識,這使模型具有廣泛的適用性,能夠適應各種不同的應用場景。

7 性能基準

Phi-3-Vision-128K-Instruct 模型的性能已在多個基準測試中進行了測試,這些測試包括 ScienceQA、AI2D、MathVista 和 TextVQA。在涉及文本和視覺信息結合的任務上,該模型的得分普遍超越了眾多現有模型,特別是在以下兩個方面表現突出:

  • 文檔理解能力:Phi-3-Vision-128K-Instruct 能夠從復雜的文檔如 PDF 或圖像中抽取關鍵信息。
  • 表格和圖表理解:該模型能夠精確解讀圖形數據,并將這些數據轉換成文字描述。

值得一提的是,在 ChartQA 數據集上,Phi-3-Vision-128K-Instruct 達到了 81.4% 的準確率;在 AI2D 數據集上,也取得了 76.7% 的高分。這些成績充分證明了模型在理解數據密集型文檔方面的強勁實力。

結語

Phi-3-Vision-128K-Instruct 代表的不僅僅是多模態人工智能領域的一次進步,它更是引領我們走向一個文檔提取、OCR和AI驅動內容生成無縫銜接、易于操作的未來。得益于其全面的訓練、強大的架構和深思熟慮的設計,這一模型賦予了開發者在各個領域革新數據處理方式的能力。

本文轉載自 ??AI科技論談??,作者: AI科技論談

收藏
回復
舉報
回復
相關推薦
国产精品久久久久久久久免费丝袜| 香蕉久久夜色精品国产更新时间| 亚洲欧洲性图库| 91久久爱成人| 男人午夜免费视频| 国产一区二区精品久| 91精品国产91久久综合桃花| 日本精品免费视频| 日本一区高清| 韩日欧美一区二区三区| 性色av一区二区三区红粉影视| 免费黄在线观看| 成午夜精品一区二区三区软件| 色av一区二区| 日韩精品一区二区免费| av在线电影观看| 99久久亚洲一区二区三区青草| 国产精品久久视频| 中国一级免费毛片| 亚洲影视一区二区三区| 亚洲老头同性xxxxx| 亚洲av无一区二区三区久久| 少妇视频一区| 一区二区三区 在线观看视频| 日韩免费电影一区二区三区| 老司机午夜福利视频| 久久99精品久久久| 日韩免费在线免费观看| 国产精品2020| 亚洲色图二区| 日韩中文字幕免费看| 黄色国产在线观看| 成人av综合网| 日韩精品在线一区二区| 色天使在线观看| av久久网站| 91久久精品国产91性色tv| 黄色免费福利视频| 伦理在线一区| 亚洲免费观看在线视频| 亚洲精品一区二区三区四区五区 | 毛片在线不卡| 国产日产精品1区| 久久久综合亚洲91久久98| 欧洲成人一区二区三区| 夫妻av一区二区| 亚洲综合自拍一区| av一级黄色片| 国内精品久久久久影院色| 国产日韩中文在线| 一级淫片免费看| 久久99国产精品麻豆| 国产精品专区h在线观看| 成人免费一级片| 日韩综合在线视频| 国产精品久久av| 伊人网免费视频| 久久精品国产精品亚洲精品| 国产一区二区在线播放| 91片黄在线观看喷潮| 精品午夜一区二区三区在线观看| 国产精品欧美一区二区| 国产一区二区视频免费观看| 极品尤物av久久免费看| 91日韩久久| 日本激情一区二区| bt欧美亚洲午夜电影天堂| 美女主播视频一区| 91网页在线观看| 伊人夜夜躁av伊人久久| 岛国大片在线播放| 345成人影院| 欧美色区777第一页| 色噜噜狠狠永久免费| 国产日韩一区二区三免费高清| 日韩精品综合一本久道在线视频| 性欧美18—19sex性高清| 精品一区三区| 日韩视频中文字幕| 久久免费小视频| 久久精品在线| 国产在线999| 高清一区二区三区四区| 91一区二区三区在线观看| 欧美中文娱乐网| 久久久久久久久免费视频| 夜夜操天天操亚洲| 成人一区二区三| 国产精品毛片aⅴ一区二区三区| 欧美成人午夜电影| 91国模少妇一区二区三区| 国产高清久久| 97在线看福利| 97精品人妻一区二区三区香蕉| 成人激情视频网站| 亚洲成色最大综合在线| 爱情岛论坛亚洲品质自拍视频网站| 色综合色综合色综合色综合色综合 | 精品成人在线| 国产精品爽黄69天堂a| 亚洲国产精品久久久久久6q| 久久久五月婷婷| 中文字幕の友人北条麻妃| 丁香六月综合| 日韩精品综合一本久道在线视频| www.av天天| 黄色亚洲精品| 成人中心免费视频| 久久精品色图| 亚洲高清中文字幕| 久久黄色片网站| 国产91一区| 久久久人成影片一区二区三区观看 | 精品乱码一区二区三四区视频 | 国产成人精品亚洲| 波多野结衣在线aⅴ中文字幕不卡 波多野结衣在线一区 | 久久久999视频| 国产亚洲久久| 主播福利视频一区| 亚洲大片免费观看| jiyouzz国产精品久久| 九九久久九九久久| 祥仔av免费一区二区三区四区| 日韩成人xxxx| 国产精品suv一区二区69| 久久精品国产77777蜜臀| 欧美在线视频一区二区三区| www.综合| 精品久久久久99| 亚洲天堂黄色片| 麻豆精品视频在线观看视频| 欧美亚洲丝袜| 午夜久久中文| 亚洲精品www| 国产福利久久久| 国产精品18久久久久久久网站| 一区二区精品免费视频| 欧洲av一区二区| 亚洲一区二区福利| av一级在线观看| 久久久www免费人成精品| 成人性免费视频| 国产日韩三级| 91av成人在线| 全色精品综合影院| 日本高清成人免费播放| 亚洲av综合一区二区| 国产农村妇女精品一二区| 国产一区免费观看| 欲香欲色天天天综合和网| 亚洲精品国产精品自产a区红杏吧 亚洲精品国产精品乱码不99按摩 亚洲精品国产精品久久清纯直播 亚洲精品国产精品国自产在线 | 亚洲大尺度视频在线观看| 美女日批在线观看| 欧美国产免费| 国产伦精品一区二区三区视频免费 | 久久久久亚洲av无码网站| 午夜日韩av| 黄色91av| 丁香六月综合| 色一区av在线| av免费观看在线| 亚洲国产精品尤物yw在线观看| 国产一级免费片| 麻豆精品网站| 亚洲一区三区| 中文字幕亚洲在线观看| 久久久视频免费观看| 三级视频在线播放| 欧美性xxxxx极品少妇| 亚洲女人久久久| 粉嫩av一区二区三区粉嫩| 成年人午夜免费视频| 国产精品欧美日韩一区| 成人乱色短篇合集| 丁香花在线观看完整版电影| 精品丝袜一区二区三区| 中文字幕欧美人妻精品| 亚洲精选一二三| 青青草成人免费视频| 美女任你摸久久| 久久精品国产精品亚洲精品色| av成人综合| 国产精品h在线观看| 超碰人人在线| 亚洲精品福利在线| 国产又爽又黄免费软件| 亚洲成人777| 黄色av免费播放| 国产91对白在线观看九色| 少妇高潮喷水久久久久久久久久| 日韩在线精品| 国产欧美欧洲| 日本午夜精品久久久久| 97av在线视频| gogo在线高清视频| 国产一区二区三区丝袜| 亚洲国产精品suv| 欧美日韩综合色| 国产精品18p| 亚洲天堂成人在线观看| 国产精品无码专区| 国产一区啦啦啦在线观看| 国产午夜伦鲁鲁| 欧美.日韩.国产.一区.二区| 日韩免费电影一区二区| 精品女人视频| 97在线电影| a屁视频一区二区三区四区| 性欧美xxxx视频在线观看| 免费网站免费进入在线| 亚洲视频一区二区| 欧美 日韩 国产 精品| 欧美日韩一区二区在线视频| 久久国产视频播放| 一区二区欧美视频| 国产精品久久久免费看| 久久精品一二三| 国产麻豆xxxvideo实拍| 国产成人av影院| 日韩视频在线观看一区二区三区| 裸体一区二区| 久草热视频在线观看| 欧美99久久| 久久精品国产精品亚洲精品色| 精品一区二区三| 国产在线精品一区| av综合网页| 国产99午夜精品一区二区三区| 欧美亚洲二区| 国产乱肥老妇国产一区二| 综合久久2023| 国产999在线| 亚洲一区资源| 日韩美女中文字幕| 日韩精品一区二区三区| 欧美怡春院一区二区三区| av成人福利| 77777少妇光屁股久久一区| 丰乳肥臀在线| 136fldh精品导航福利| www.综合| 日本道色综合久久影院| 中国色在线日|韩| 人体精品一二三区| 欧美激情喷水| 国产精品久久久久久久7电影| 欧美色网一区| 国产精品久久视频| 精品美女一区| 成人h视频在线| 精品入口麻豆88视频| 99久久精品无码一区二区毛片 | 国产亚洲精品女人久久久久久| 一区二区三区中文字幕电影 | 亚洲一区亚洲| 黄色片视频在线播放| 日韩电影免费在线| 在线观看高清免费视频| 久久se这里有精品| 日韩精品视频网址| 懂色av一区二区三区免费观看| 大乳护士喂奶hd| 久久一区二区视频| 91视频免费看片| 亚洲欧美福利一区二区| 伊人国产在线观看| 色婷婷激情久久| 亚洲综合网av| 日韩精品中文字幕在线不卡尤物| 日韩一级片免费在线观看| 日韩精品视频免费在线观看| 黄色av免费在线看| 久久精品国产欧美亚洲人人爽| 在线观看wwwxxxx| 欧美一级视频在线观看| 国产精品66| 成人在线视频网址| 国产一区二区在线| 黄黄视频在线观看| 国产欧美不卡| 免费精品99久久国产综合精品应用| 国产成人激情av| 少妇真人直播免费视频| 亚洲视频一二三区| 九九热在线视频播放| 欧美精品乱码久久久久久按摩| 秋霞网一区二区| 中文字幕精品一区二区精品| caopeng在线| 欧洲美女7788成人免费视频| 99久久久国产| 欧美一区2区三区4区公司二百| 亚洲精品91| 岳毛多又紧做起爽| 国产一区二区三区免费看| 久久久久麻豆v国产精华液好用吗| 亚洲国产精品成人综合| 久久无码精品丰满人妻| 欧洲另类一二三四区| 人人妻人人澡人人爽人人欧美一区 | 亚洲精品欧洲| 久久久久久久久久一区| 2024国产精品| 日韩在线中文字幕视频| 欧美日韩一区二区在线| 91影院在线播放| 欧美精品一区二区三区一线天视频| 91大神在线网站| 欧美做受高潮1| 99这里只有精品视频| 亚洲一区二区在线免费观看| 翔田千里一区二区| 激情av中文字幕| 亚洲蜜桃精久久久久久久| 久久久999久久久| 日韩精品高清在线观看| 好看的中文字幕在线播放| 91精品国产综合久久久久久蜜臀 | 日av中文字幕| 成人h动漫精品| 91视频免费在线看| 欧美日本一道本| 成人免费视频| 欧美制服第一页| 欧美黑人巨大videos精品| 国产精品videossex国产高清| 久草中文综合在线| 九一在线免费观看| 色综合激情久久| 午夜影院免费视频| 午夜精品一区二区三区在线| 草草视频在线一区二区| 视色,视色影院,视色影库,视色网| 久久精品99国产精品日本| 少妇av片在线观看| 在线视频一区二区三区| 九色在线视频| 国产97色在线|日韩| 色综合综合网| 黑森林精品导航| 国产精品午夜久久| 亚洲天堂视频在线| www.欧美精品| 高清一区二区三区av| 日韩不卡视频一区二区| 国产精品99精品久久免费| 久草视频在线资源| 精品日产卡一卡二卡麻豆| 成人av影院在线观看| 国产精品欧美久久| 亚洲欧美大片| 亚洲国产日韩一区无码精品久久久| 在线免费观看不卡av| 1024免费在线视频| 成人激情电影一区二区| 综合一区在线| 亚洲一区二区三区黄色| 精品久久久精品| 成人在线视频成人| 成人免费xxxxx在线观看| 欧美喷水视频| bl动漫在线观看| 在线免费精品视频| 人人干在线视频| 亚洲一区二区免费| 亚洲精品日本| 欧美xxxx精品| 日韩欧美一区二区三区在线| 日本乱理伦在线| 久久综合色一本| 久久国产精品99精品国产 | 香蕉视频免费在线播放| 亚洲xxx视频| 性色一区二区| 成人午夜免费影院| 欧美r级在线观看| 伊人久久视频| 91制片厂免费观看| 99re在线精品| 亚洲在线视频播放| 久久久久久久网站| 欧美日韩高清| 911亚洲精选| 在线观看视频一区| 污视频网站在线免费| 欧美成人免费在线| 国产乱码精品一区二区三区av | 麻豆成人av在线| 国产第一页在线播放| 一区二区欧美在线| 66精品视频在线观看| 欧美日韩大尺度| 一区二区高清视频在线观看| 九一国产在线| 国产精品视频入口| 免播放器亚洲一区| www日韩精品| 久久久久北条麻妃免费看| 性欧美xxxx免费岛国不卡电影| 污污视频网站在线|