精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

使用OpenAI的Whisper 模型進行語音識別

人工智能
語音識別是人工智能中的一個領域,它允許計算機理解人類語音并將其轉換為文本。該技術用于 Alexa 和各種聊天機器人應用程序等設備。而我們最常見的就是語音轉錄,語音轉錄可以語音轉換為文字記錄或字幕。

語音識別是人工智能中的一個領域,它允許計算機理解人類語音并將其轉換為文本。該技術用于 Alexa 和各種聊天機器人應用程序等設備。而我們最常見的就是語音轉錄,語音轉錄可以語音轉換為文字記錄或字幕。

wav2vec2、Conformer 和 Hubert 等最先進模型的最新發展極大地推動了語音識別領域的發展。這些模型采用無需人工標記數據即可從原始音頻中學習的技術,從而使它們能夠有效地使用未標記語音的大型數據集。它們還被擴展為使用多達 1,000,000 小時的訓練數據,遠遠超過學術監督數據集中使用的傳統 1,000 小時,但是以監督方式跨多個數據集和領域預訓練的模型已被發現表現出更好的魯棒性和對持有數據集的泛化,所以執行語音識別等任務仍然需要微調,這限制了它們的全部潛力 。為了解決這個問題OpenAI 開發了 Whisper,一種利用弱監督方法的模型。

本文將解釋用于訓練的數據集的種類以及模型的訓練方法,以及如何使用Whisper 

Whisper 模型介紹

使用數據集:

Whisper模型是在68萬小時標記音頻數據的數據集上訓練的,其中包括11.7萬小時96種不同語言的演講和12.5萬小時從”任意語言“到英語的翻譯數據。該模型利用了互聯網生成的文本,這些文本是由其他自動語音識別系統(ASR)生成而不是人類創建的。該數據集還包括一個在VoxLingua107上訓練的語言檢測器,這是從YouTube視頻中提取的短語音片段的集合,并根據視頻標題和描述的語言進行標記,并帶有額外的步驟來去除誤報。

模型:

主要采用的結構是編碼器-解碼器結構。

重采樣:16000 Hz

特征提取方法:使用25毫秒的窗口和10毫秒的步幅計算80通道的log Mel譜圖表示。

特征歸一化:輸入在全局內縮放到-1到1之間,并且在預訓練數據集上具有近似為零的平均值。

編碼器/解碼器:該模型的編碼器和解碼器采用Transformers。

編碼器的過程:

編碼器首先使用一個包含兩個卷積層(濾波器寬度為3)的詞干處理輸入表示,使用GELU激活函數。

第二個卷積層的步幅為 2。

然后將正弦位置嵌入添加到詞干的輸出中,然后應用編碼器 Transformer 塊。

Transformers使用預激活殘差塊,編碼器的輸出使用歸一化層進行歸一化。

模型框圖:

圖片

解碼的過程:

在解碼器中,使用了學習位置嵌入和綁定輸入輸出標記表示。

編碼器和解碼器具有相同的寬度和數量的Transformers塊。

訓練

為了改進模型的縮放屬性,它在不同的輸入大小上進行了訓練。

通過 FP16、動態損失縮放,并采用數據并行來訓練模型。

使用AdamW和梯度范數裁剪,在對前 2048 次更新進行預熱后,線性學習率衰減為零。

使用 256 個批大小,并訓練模型進行 220次更新,這相當于對數據集進行兩到三次前向傳遞。

由于模型只訓練了幾個輪次,過擬合不是一個重要問題,并且沒有使用數據增強或正則化技術。這反而可以依靠大型數據集內的多樣性來促進泛化和魯棒性。

Whisper 在之前使用過的數據集上展示了良好的準確性,并且已經針對其他最先進的模型進行了測試。

優點:

  • Whisper 已經在真實數據以及其他模型上使用的數據以及弱監督下進行了訓練。
  • 模型的準確性針對人類聽眾進行了測試并評估其性能。
  • 它能夠檢測清音區域并應用 NLP 技術在轉錄本中正確進行標點符號的輸入。
  • 模型是可擴展的,允許從音頻信號中提取轉錄本,而無需將視頻分成塊或批次,從而降低了漏音的風險。
  • 模型在各種數據集上取得了更高的準確率。

Whisper在不同數據集上的對比結果,相比wav2vec取得了目前最低的詞錯誤率

圖片

模型沒有在timit數據集上進行測試,所以為了檢查它的單詞錯誤率,我們將在這里演示如何使用Whisper來自行驗證timit數據集,也就是說使用Whisper來搭建我們自己的語音識別應用。

使用Whisper 模型進行語音識別

TIMIT 閱讀語音語料庫是語音數據的集合,它專門用于聲學語音研究以及自動語音識別系統的開發和評估。它包括來自美國英語八種主要方言的 630 位演講者的錄音,每人朗讀十個語音豐富的句子。語料庫包括時間對齊的拼字、語音和單詞轉錄以及每個語音的 16 位、16kHz 語音波形文件。該語料庫由麻省理工學院 (MIT)、SRI International (SRI) 和德州儀器 (TI) 共同開發。TIMIT 語料庫轉錄已經過手工驗證,并指定了測試和訓練子集,以平衡語音和方言覆蓋范圍。

安裝:

!pip install git+https://github.com/openai/whisper.git
!pip install jiwer
!pip install datasets==1.18.3

第一條命令將安裝whisper模型所需的所有依賴項。jiwer是用來下載文字錯誤率包的datasets是hugface提供的數據集包,可以下載timit數據集。

導入庫

import whisper
from pytube import YouTube
from glob import glob
import os
import pandas as pd
from tqdm.notebook import tqdm

加載timit數據集

from datasets import load_dataset, load_metric

timit = load_dataset("timit_asr")

計算不同模型尺寸下的Word錯誤率

考慮到過濾英語數據和非英語數據的需求,我們這里選擇使用多語言模型,而不是專門為英語設計的模型。

但是TIMIT數據集是純英文的,所以我們要應用相同的語言檢測和識別過程。另外就是TIMIT數據集已經分割好訓練和驗證集,我們可以直接使用。

要使用Whisper,我們就要先了解不同模型的的參數,大小和速度。

圖片

加載模型

model = whisper.load_model('tiny')

tiny可以替換為上面提到的模型名稱。

定義語言檢測器的函數

def lan_detector(audio_file):
print('reading the audio file')
audio = whisper.load_audio(audio_file)
audio = whisper.pad_or_trim(audio)
mel = whisper.log_mel_spectrogram(audio).to(model.device)
_, probs = model.detect_language(mel)
if max(probs, key=probs.get) == 'en':
return True
return False

轉換語音到文本的函數

def speech2text(audio_file):
text = model.transcribe(audio_file)
return text["text"]

在不同模型大小下運行上面的函數,timit訓練和測試得到的單詞錯誤率如下:

從u2b上轉錄語音

與其他語音識別模型相比,Whisper 不僅能識別語音,還能解讀一個人語音中的標點語調,并插入適當的標點符號,我們下面使用u2b的視頻進行測試。

這里就需要一個包pytube,它可以輕松的幫助我們下載和提取音頻

def youtube_audio(link):
youtube_1 = YouTube(link)
videos = youtube_1.streams.filter(only_audio=True)

name = str(link.split('=')[-1])
out_file = videos[0].download(name)

link = name.split('=')[-1]
new_filename = link+".wav"
print(new_filename)
os.rename(out_file, new_filename)
print(name)
return new_filename,link

獲得wav文件后,我們就可以應用上面的函數從中提取文本。

總結

本文的代碼在這里

https://drive.google.com/file/d/1FejhGseX_S1Ig_Y5nIPn1OcHN8DLFGIO/view

還有許多操作可以用Whisper完成,你可以根據本文的代碼自行嘗試。

責任編輯:華軒 來源: DeepHub IMBA
相關推薦

2023-11-09 09:00:00

OpenAI人工智能Whisper

2023-11-05 10:01:37

AI模型

2024-05-28 08:11:44

SpringTensorFlow訓練

2023-03-07 13:32:33

谷歌模型

2022-10-08 08:36:02

UbuntuLinux語音識別

2017-03-20 10:14:03

語音識別匹配算法模型

2012-07-25 13:23:32

ibmdw

2023-06-16 08:00:00

語音助手GPTWhisper

2019-11-20 12:30:21

Python編程語言語音識別

2023-08-31 13:25:09

AI模型

2021-04-27 15:47:12

人工智能語音識別Transformer

2024-10-28 09:38:16

OpenAIWhisper人工智能

2018-05-02 11:38:14

語音識別法院

2024-12-13 15:53:58

VLM小型視覺語言模型LLM

2023-05-19 11:14:35

2025-04-09 11:01:19

2024-10-28 07:15:00

OpenAIWhisper語音轉錄工具

2025-04-02 08:55:13

人工智能帖子生成器事件驅動

2024-08-27 08:38:34

2025-05-16 09:12:00

點贊
收藏

51CTO技術棧公眾號

91热福利电影| 精品视频在线播放免| 青春草在线视频免费观看| 亚洲天堂久久久久| 你懂的视频一区二区| 亚洲一区影音先锋| 欧美精品一区在线| 国产五月天婷婷| 蜜桃国内精品久久久久软件9| 亚洲高清免费观看| 欧美污视频久久久| 性生交大片免费看女人按摩| 久久精品日韩欧美| 久久99热精品这里久久精品| 美女久久久久久久久久| 丁香影院在线| 国产精品水嫩水嫩| 国产欧美一区二区三区四区| 精品无码免费视频| 久久免费精品视频在这里| 国产乱淫av一区二区三区| 97婷婷大伊香蕉精品视频| 亚洲一级理论片| 国产伦理久久久久久妇女 | 欧美大黑bbbbbbbbb在线| 日韩免费性生活视频播放| 偷拍视频一区二区| 免费毛片一区二区三区| 精品视频97| 日韩精品黄色网| 不卡的一区二区| 99re久久| 国产精品午夜电影| 精品国产综合| 丰满人妻一区二区三区无码av| 888久久久| 亚洲精品电影在线| 亚洲av综合色区无码另类小说| 九色91在线| 91美女片黄在线| 爱情岛论坛亚洲入口| 97人妻精品一区二区三区软件| 影音先锋成人在线电影| 亚洲最新av在线| 在线免费观看麻豆| 亚洲自拍都市欧美小说| 亚洲精品福利免费在线观看| 日本精品一二三| 午夜精品在线| 日韩精品一区在线| 99色精品视频| 日本在线影院| 麻豆成人av在线| 日韩免费在线观看视频| 国产免费观看av| 亚洲一区二区免费看| 992tv在线成人免费观看| 国产精品成人久久| 亚洲美女黄色| 456亚洲影院| 亚洲第一网站在线观看| 日韩精品电影在线| 国产欧美久久久久久| 在线视频播放大全| 国产一区二区三区日韩| 99精彩视频在线观看免费| www.成人精品| 成人国产亚洲欧美成人综合网| 国产精品久久久一区| 日韩黄色中文字幕| 成人综合久久| 精品久久久999| 国产美女福利视频| 欧美成人久久| 26uuu亚洲伊人春色| 波多野结衣电影在线播放| 台湾色综合娱乐中文网| 亚洲美女av在线播放| 欧美做受高潮6| 无码国模国产在线观看| 亚洲国产精品美女| 国产成人福利在线| 99久久国产综合精品成人影院| 亚洲久久久久久久久久| 欧美熟妇精品一区二区| a一区二区三区亚洲| 国产精品久久久久四虎| 国产精品免费一区| 国产精品嫩草影院精东| 懂色av一区二区三区免费看| 成人在线播放av| 在线观看xxxx| 成人性视频免费网站| 91手机视频在线观看| 欧美一级一区二区三区| 久久久国产精品不卡| 免费观看中文字幕| 在线观看网站免费入口在线观看国内| 亚洲一二三区不卡| 久久婷婷国产91天堂综合精品| 综合久久2023| 这里只有精品电影| 偷拍女澡堂一区二区三区| 999国产精品视频| 久久精品国产99国产精品澳门| 美女网站视频色| 欧美五码在线| 日韩一区二区久久久| 国产成人亚洲精品自产在线 | 日韩av在线网址| 99热99这里只有精品| 国产精品毛片在线| 91在线视频九色| 青青草手机在线| 亚洲在线观看免费视频| 蜜桃免费在线视频| 天堂av一区二区三区在线播放| 日韩成人在线观看| 日韩a级片在线观看| 视频精品一区二区| 国内精品二区| 奇米影视888狠狠狠777不卡| 伊人夜夜躁av伊人久久| 邪恶网站在线观看| 亚洲a级精品| 深夜福利日韩在线看| 国产乱国产乱老熟| 成人h版在线观看| 日日噜噜夜夜狠狠久久丁香五月| 污视频网站在线免费| 亚洲精品视频在线| 日韩av高清在线看片| 精品国产鲁一鲁****| 在线观看日韩专区| 人妻中文字幕一区二区三区| 26uuu国产电影一区二区| 色综合久久av| 欧美日韩视频网站| 亚洲乱码国产乱码精品精| 一级免费在线观看| 99精品视频在线播放观看| 四虎永久在线精品免费一区二区| 成人免费观看视频大全| 国产精品久久久久久久久免费桃花| 国产美女精品在线观看| 国内精品不卡| 日韩一区和二区| www日韩在线| 美女国产一区| 欧美黄色直播| 视频在线日韩| 在线观看久久久久久| 国产一级淫片a| 国产一区二区三区免费| 中国老女人av| silk一区二区三区精品视频| 欧美激情一区二区三区高清视频| av手机天堂网| 中文字幕av免费专区久久| 一区二区三区免费播放| 美女一区二区在线观看| 午夜精品久久久久久久久久久久 | 亚洲黄色一区| 久99久视频| 午夜精品一区| 欧美—级在线免费片| 国产裸体免费无遮挡| 精品国产一区二区三区久久久蜜臀 | 中文字幕丰满乱码| 亚洲一区二区三区四区电影 | 成人羞羞网站入口免费| 国产精品无码专区在线观看| 日本视频在线免费观看| 欧美一区二区免费视频| 国产精品a成v人在线播放| 精品亚洲成a人| 91精品国产毛片武则天| 97精品国产综合久久久动漫日韩| 亚洲精品国精品久久99热 | 一区二区三区四区国产精品| 美女网站免费观看视频| 欧美xxxxx视频| 99久久精品久久久久久ai换脸| 国产三级在线播放| 亚洲第一精品福利| 日批视频免费观看| 一区二区高清视频在线观看| 午夜视频在线观| 99成人精品| 亚洲综合首页| 国产精东传媒成人av电影| 国产精品盗摄久久久| 成人免费高清| 国产午夜精品一区二区三区| 国产日韩欧美视频在线观看| 亚洲mv在线观看| 国产精品麻豆入口| 蜜桃一区二区三区在线| 久久亚洲国产成人精品无码区| 青青在线视频| 欧美一区午夜视频在线观看| 日韩成人免费在线观看| 国产精品久久久久久久久果冻传媒 | 18视频在线观看网站| 亚洲精品综合久久中文字幕| 精品人妻午夜一区二区三区四区| 亚洲精品高清在线| 色哟哟精品观看| 国产成人精品三级| 日本三级免费观看| 波多野结衣在线观看一区二区三区| 日本精品久久电影| 精精国产xxxx视频在线中文版| 亚洲精品一区在线观看| 中文字幕第99页| 欧美午夜丰满在线18影院| 特级片在线观看| 中文字幕一区二区三中文字幕| 日韩精品视频网址| 久久先锋影音| www.浪潮av.com| 黑丝一区二区| 老汉色影院首页| 视频在线不卡免费观看| 麻豆成人在线播放| 秋霞综合在线视频| 97在线资源站| 久久久91麻豆精品国产一区| 国产玖玖精品视频| 国产精品亚洲d| 日本成熟性欧美| 另类激情视频| 欧洲精品在线视频| 精精国产xxx在线视频app| 久久久噜噜噜久噜久久| 日韩三级免费| 欧美大片在线影院| 色婷婷av在线| 色综合老司机第九色激情 | 国产在线日韩欧美| 秋霞无码一区二区| 一区在线视频| 日韩中字在线观看| 亚洲国产影院| 国产精品专区在线| 9999国产精品| 一区视频二区视频| 五月天激情综合网| 综合色婷婷一区二区亚洲欧美国产| 国产色噜噜噜91在线精品| 99国产在线| 精品福利网址导航| 久久综合九色99| 视频国产一区| 一本色道久久综合亚洲精品婷婷 | 亚洲欧洲精品一区二区| 精品一区二区三| 伊人久久99| 欧美1区2区| 免费在线观看视频a| 国产精品99一区二区三| 精品一区在线播放| 国产伦精品一区二区三区千人斩| 产国精品偷在线| 国产精品99久久免费观看| 国产在线一区二区三区| 精品国产亚洲一区二区三区| 国产v亚洲v天堂无码| 欧美综合精品| 亚洲国产日韩综合一区| 91不卡在线观看| 免费一级特黄特色毛片久久看| 亚洲国产一成人久久精品| 亚洲乱码日产精品bd在线观看| 日韩免费特黄一二三区| www.亚洲一区二区| 亚洲日本国产| jizzzz日本| caoporn国产一区二区| 成人精品视频一区二区| 欧美a级一区二区| 欧美成人乱码一二三四区免费| 日韩欧美高清| 欧美一区二区三区电影在线观看| 国产精品久久久网站| 欧美在线一区二区三区四区| 97精品国产福利一区二区三区| 五月天久久狠狠| 黄色不卡一区| 免费中文日韩| 国产精品久久久久久久久久齐齐| 欧美黑人极品猛少妇色xxxxx| av中文在线| 欧美大片网站在线观看| 国产欧美一区二区三区精品酒店| 97超级碰碰碰| 高潮在线视频| 国产日韩欧美黄色| 麻豆一区二区麻豆免费观看| 国产中文一区二区| 日韩影院二区| 每日在线更新av| 国产一级精品在线| 69视频在线观看免费| 一区二区三区中文字幕精品精品| 丝袜美腿小色网| 一本到三区不卡视频| 69视频免费看| 欧美嫩在线观看| 国产高清不卡视频| 精品福利在线看| wwwwww国产| 欧美不卡一区二区三区四区| 国产精品福利电影| 日韩久久精品成人| 影音先锋在线播放| 91精品国产综合久久男男| 亚洲a级精品| 亚洲人成77777| 先锋亚洲精品| 色噜噜狠狠永久免费| 2021久久国产精品不只是精品| 欧美人与禽zoz0善交| 欧美日韩国产区| 人妻精品一区二区三区| 美女精品视频一区| 538在线精品| 久久久女人电视剧免费播放下载 | 国产日产欧美一区二区三区 | 日韩欧美自拍| 色综合av综合无码综合网站| 粉嫩一区二区三区性色av| 成熟的女同志hd| 欧美精品久久天天躁| 深爱激情五月婷婷| 久久青草精品视频免费观看| 亚洲1区在线观看| 一级性生活视频| 国产精品一卡二卡| 校园春色 亚洲| 色综合久久精品| 男人天堂资源在线| 欧洲午夜精品久久久| 美女少妇全过程你懂的久久| 国产成人黄色片| 久久久.com| 中文在线资源天堂| 色悠悠久久久久| 成人豆花视频| 欧美激情专区| 欧美激情偷拍| 香蕉在线观看视频| 亚洲图片欧美综合| 手机看片1024日韩| 国产不卡在线观看| 成人h动漫免费观看网站| 欧美久久久久久久久久久久久久| 日本不卡视频在线观看| 日本高清黄色片| 欧美男男青年gay1069videost| 天堂影院在线| 精品国产三级a在线观看| 亚洲wwwww| 国产一区再线| 日日夜夜免费精品视频| 亚洲精品天堂网| 制服丝袜亚洲色图| 黄污视频在线观看| 久久久亚洲综合网站| 国产一区美女| 亚洲综合自拍网| 在线观看日韩一区| 黄黄的网站在线观看| 国产高清自拍99| 首页欧美精品中文字幕| 午夜国产福利视频| 日韩精品自拍偷拍| 韩日成人影院| 欧美三级午夜理伦三级老人| 岛国一区二区三区| 国产一级一级国产| 操人视频在线观看欧美| 久久久久高潮毛片免费全部播放| 黄网站色视频免费观看| www国产亚洲精品久久麻豆| 中文字幕精品一区二区精| 九九精品视频在线| 国产伦一区二区三区| 日本成人在线免费| 色av一区二区| 色呦呦在线观看视频| 奇米影视首页 狠狠色丁香婷婷久久综合| 亚洲精华国产欧美| 美国美女黄色片| 欧美精品一区二区蜜臀亚洲| 欧美不卡高清一区二区三区| 日韩欧美三级电影| 亚洲国产精品日韩专区av有中文| 乌克兰美女av| 亚洲成人一区在线|