精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

音頻處理問題難?快使用Tensorflow構建一個語音識別模型

譯文
開發 開發工具
語音識別在許多行業都是一個復雜的問題。了解有關處理音頻數據以及如何對聲音樣本進行分類的一些基礎知識對豐富個人能力是件很有益的事。

【51CTO.com快譯】本文我們將通過一個使用Tensorflow對一些聲音剪輯進行分類的例子,幫助你了解足夠的基礎知識,從而能夠構建自己的語音識別模型。另外,你也可以通過進一步的學習,將這些概念應用到更大、更復雜的音頻文件中。

本案例的完整代碼可以在??GitHub??上獲取。

?[[386747]]?

獲取數據

數據收集是數據科學中的難題之一。雖然有很多可用的數據,但并不是所有的數據都容易用于機器學習問題。因此必須確保數據是干凈的、有標簽的和完整的。

為了實現本次案例,我們將使用Google發布的一些音頻文件,可以在??Github??上獲取。

首先,我們將創建一個新的Conducto管道。在這里,您可以構建,訓練和測試模型,并與其他感興趣的人共享鏈接:

###
# Main Pipeline
###
def main() -> co.Serial:
path = "/conducto/data/pipeline"
root = co.Serial(image = get_image())

# Get data from keras for testing and training
root["Get Data"] = co.Exec(run_whole_thing, f"{path}/raw")

return root

然后,開始編寫 run_whole_thing 功能:

def run_whole_thing(out_dir):
os.makedirs(out_dir, exist_ok=True)
# Set seed for experiment reproducibility
seed = 55
tf.random.set_seed(seed)
np.random.seed(seed)
data_dir = pathlib.Path("data/mini_speech_commands")

接下來,設置目錄以保存音頻文件:

if not data_dir.exists():
# Get the files from external source and put them in an accessible directory
tf.keras.utils.get_file(
'mini_speech_commands.zip',
origin="http://storage.googleapis.com/download.tensorflow.org/data/mini_speech_commands.zip",
extract=True)

預處理數據

現在將數據保存在正確的目錄中,可以將其拆分為訓練、測試和驗證數據集。

首先,我們需要編寫一些函數來幫助預處理數據,以使其可以在我們的模型中起作用。

我們需要算法能夠理解的數據格式。我們將使用卷積神經網絡,所以數據需要轉換成圖像。

第一個函數將把二進制音頻文件轉換成一個張量:

# Convert the binary audio file to a tensor
def decode_audio(audio_binary):
audio, _ = tf.audio.decode_wav(audio_binary)
return tf.squeeze(audio, axis=-1)

由于我們有一個具有原始數據的張量,所以我們需要得到匹配它們的標簽。這就是下面的函數通過從文件路徑獲取音頻文件的標簽功能:

# Get the label (yes, no, up, down, etc) for an audio file.
def get_label(file_path):
parts = tf.strings.split(file_path, os.path.sep)
return parts[-2]

接下來,我們需要將音頻文件與正確的標簽相關聯。執行此操作并返回一個可與 Tensorflow配合使用的元組:

# Create a tuple that has the labeled audio files
def get_waveform_and_label(file_path):
label = get_label(file_path)
audio_binary = tf.io.read_file(file_path)
waveform = decode_audio(audio_binary)
return waveform, label

前面我們簡要提到了使用卷積神經網絡(CNN)算法。這是我們處理語音識別模型的方法之一。通常CNN在圖像數據上工作得很好,有助于減少預處理時間。

我們要利用這一點,把音頻文件轉換成頻譜圖。頻譜圖是頻率頻譜的圖像。如果查看一個音頻文件,你會發現它只是頻率數據。因此,我們要寫一個將音頻數據轉換成圖像的函數:

# Convert audio files to images
def get_spectrogram(waveform):
# Padding for files with less than 16000 samples
zero_padding = tf.zeros([16000] - tf.shape(waveform), dtype=tf.float32)
# Concatenate audio with padding so that all audio clips will be of the same length
waveform = tf.cast(waveform, tf.float32)
equal_length = tf.concat([waveform, zero_padding], 0)
spectrogram = tf.signal.stft(
equal_length, frame_length=255, frame_step=128)
spectrogram = tf.abs(spectrogram)

return spectrogram

現在我們已經將數據格式化為圖像,我們需要將正確的標簽應用于這些圖像。這與我們制作原始音頻文件的做法類似:

# Label the images created from the audio files and return a tuple
def get_spectrogram_and_label_id(audio, label):
spectrogram = get_spectrogram(audio)
spectrogram = tf.expand_dims(spectrogram, -1)
label_id = tf.argmax(label == commands)
return spectrogram, label_id

我們需要的最后一個 helper 函數將處理傳遞給它的任何音頻文件集的所有上述操作:

# Preprocess any audio files
def preprocess_dataset(files, autotune, commands):
# Creates the dataset
files_ds = tf.data.Dataset.from_tensor_slices(files)

# Matches audio files with correct labels
output_ds = files_ds.map(get_waveform_and_label,
num_parallel_calls=autotune)
# Matches audio file images to the correct labels
output_dsoutput_dsoutput_ds = output_ds.map(
get_spectrogram_and_label_id, num_parallel_calls=autotune)
return output_ds

當已經有了所有這些輔助函數,我們就可以分割數據了。

將數據拆分為數據集

將音頻文件轉換為圖像有助于使用CNN更容易處理數據,這就是我們編寫所有這些幫助函數的原因。我們將做一些事情來簡化數據的分割。

首先,我們將獲得所有音頻文件的潛在命令列表,我們將在代碼的其他地方使用這些命令:

# Get all of the commands for the audio files
commands = np.array(tf.io.gfile.listdir(str(data_dir)))
commandscommandscommands = commands[commands != 'README.md']

然后我們將得到數據目錄中所有文件的列表,并對其進行混洗,以便為每個需要的數據集分配隨機值:

# Get a list of all the files in the directory
filenames = tf.io.gfile.glob(str(data_dir) + '/*/*')

# Shuffle the file names so that random bunches can be used as the training, testing, and validation sets
filenames = tf.random.shuffle(filenames)

# Create the list of files for training data
train_files = filenames[:6400]

# Create the list of files for validation data
validation_files = filenames[6400: 6400 + 800]

# Create the list of files for test data
test_files = filenames[-800:]

現在,我們已經清晰地將培訓、驗證和測試文件分開,這樣我們就可以繼續對這些文件進行預處理,使它們為構建和測試模型做好準備。這里使用autotune來在運行時動態調整參數的值:

autotune = tf.data.AUTOTUNE

第一個示例只是為了展示預處理的工作原理,它給了一些我們需要的spectrogram_ds值:

# Get the converted audio files for training the model
files_ds = tf.data.Dataset.from_tensor_slices(train_files)
waveform_ds = files_ds.map(
get_waveform_and_label, num_parallel_calls=autotune)
spectrogram_ds = waveform_ds.map(
get_spectrogram_and_label_id, num_parallel_calls=autotune)

既然已經了解了預處理的步驟過程,我們可以繼續使用helper函數來處理所有數據集:

# Preprocess the training, test, and validation datasets
train_ds = preprocess_dataset(train_files, autotune, commands)
validation_ds = preprocess_dataset(
validation_files, autotune, commands)
test_ds = preprocess_dataset(test_files, autotune, commands)

我們要設置一些訓練示例,這些訓練示例在每個時期的迭代中運行,因此我們將設置批處理大?。?/p>

# Batch datasets for training and validation
batch_size = 64
train_dstrain_dstrain_ds = train_ds.batch(batch_size)
validation_dsvalidation_dsvalidation_ds = validation_ds.batch(batch_size)

最后,我們可以利用緩存來減少訓練模型時的延遲:

# Reduce latency while training
train_dstrain_dstrain_ds = train_ds.cache().prefetch(autotune)
validation_dsvalidation_dsvalidation_ds = validation_ds.cache().prefetch(autotune)

最終,我們的數據集采用了可以訓練模型的形式。

建立模型

由于數據集已明確定義,所以我們可以繼續構建模型。我們將使用CNN創建模型,因此我們需要獲取數據的形狀以獲取適用于我們圖層的正確形狀,然后我們繼續按順序構建模型:

# Build model
for spectrogram, _ in spectrogram_ds.take(1):
input_shape = spectrogram.shape

num_labels = len(commands)

norm_layer = preprocessing.Normalization()
norm_layer.adapt(spectrogram_ds.map(lambda x, _: x))

model = models.Sequential([
layers.Input(shape=input_shape),
preprocessing.Resizing(32, 32),
norm_layer,
layers.Conv2D(32, 3, activation='relu'),
layers.Conv2D(64, 3, activation='relu'),
layers.MaxPooling2D(),
layers.Dropout(0.25),
layers.Flatten(),
layers.Dense(128, activation='relu'),
layers.Dropout(0.5),
layers.Dense(num_labels),
])

model.summary()

我們在模型上做了一些配置,以便給我們最好的準確性:

# Configure built model with losses and metrics
model.compile(
optimizer=tf.keras.optimizers.Adam(),
loss=tf.keras.losses.SparseCategoricalCrossentropy(
from_logits=True),
metrics=['accuracy'],
)

模型建立好了,現在剩下的就是訓練它了。

訓練模型

在所有的工作都對數據進行預處理和建立模型之后,訓練就相對簡單了。我們確定要使用訓練和驗證數據集運行多少個周期:

# Finally train the model and return info about each epoch
EPOCHS = 10
model.fit(
train_ds,
validation_data=validation_ds,
epochs=EPOCHS,
callbacks=tf.keras.callbacks.EarlyStopping(verbose=1, patience=2),
)

這樣這個模型就已經訓練好了,現在需要對它進行測試。

測試模型

現在我們有了一個準確率約為83%的模型,是時候測試它在新數據上的表現了。所以我們使用測試數據集并將音頻文件從標簽中分離出來:

# Test the model
test_audio = []
test_labels = []

for audio, label in test_ds:
test_audio.append(audio.numpy())
test_labels.append(label.numpy())

test_audio = np.array(test_audio)
test_labels = np.array(test_labels)

然后我們獲取音頻數據并在我們的模型中使用它,看看它是否預測了正確的標簽:

# See how accurate the model is when making predictions on the test dataset
y_pred = np.argmax(model.predict(test_audio), axis=1)
y_true = test_labels

test_acc = sum(y_pred == y_true) / len(y_true)

print(f'Test set accuracy: {test_acc:.0%}')

完成管道

只需要編寫一小段代碼就可以完成您的管道并使其與任何人共享。這定義了將在Conducto管道中使用的圖像,并處理文件執行:

###
# Pipeline Helper functions
###
def get_image():
return co.Image(
"python:3.8-slim",
copy_dir=".",
reqs_py=["conducto", "tensorflow", "keras"],
)

if __name__ == "__main__":
co.main(default=main)

現在,你可以在終端中運行python pipeline.py——它應該會啟動一個到新Conducto管道的鏈接。

結論

這是解決音頻處理問題的方法之一,但是根據要分析的數據,它可能要復雜得多。如果將其構建在管道中,可以很輕松地與同事共享并在遇到錯誤時獲得幫助或反饋。

【51CTO譯稿,合作站點轉載請注明原文譯者和出處為51CTO.com】


責任編輯:黃顯東 來源: hackernoon.com
相關推薦

2025-04-01 09:31:34

PyTorch自動語音識別ASR系統

2018-08-27 17:05:48

tensorflow神經網絡圖像處理

2012-07-25 13:23:32

ibmdw

2010-03-01 14:40:00

Python RSS處

2018-08-30 09:36:10

編程語言Python機器學習

2021-11-02 09:40:50

TensorFlow機器學習人工智能

2010-02-23 17:23:26

Python異常處理

2024-05-28 08:11:44

SpringTensorFlow訓練

2023-11-28 14:22:54

Python音頻

2014-02-19 09:51:29

iOS開發時間處理

2022-09-19 16:38:59

數據產品SaaSSnowflake

2023-01-30 17:14:40

人工智能語音識別

2025-01-11 23:14:52

2025-02-26 07:00:00

Go 語言Ollama 模型dubbogo

2024-06-13 08:36:11

2010-05-17 14:59:05

MySQL事務處理

2024-08-15 14:48:57

2016-11-14 10:06:04

大數據max位圖

2017-03-20 10:14:03

語音識別匹配算法模型

2023-09-05 09:00:00

工具Python抄襲檢測系統
點贊
收藏

51CTO技術棧公眾號

亚洲 欧美 日韩在线| 日韩av一区二区三区美女毛片| 无码人妻精品一区二区三区夜夜嗨| 欧美电影院免费观看| 亚洲电影第三页| 色婷婷精品国产一区二区三区| 国产又黄又粗又长| 午夜精品久久久久99热蜜桃导演| 国产偷亚洲偷欧美偷精品| 午夜在线观看av| 欧美14一18处毛片| 国产欧美综合在线观看第十页| 国产裸体写真av一区二区 | 亚洲精品日产精品乱码不卡| 国产有色视频色综合| 在线播放亚洲精品| 国产日韩一区二区三区在线| 日韩视频一区在线| 美女100%无挡| 超碰cao国产精品一区二区| 欧美专区亚洲专区| 欧美 日韩 国产在线观看| 欧美一区二区三区在线观看免费| 91亚洲永久精品| 97免费资源站| 一级黄色a毛片| 校园春色综合网| 国模视频一区二区| 特级片在线观看| 国产韩国精品一区二区三区| 亚洲欧美中文字幕| yy6080午夜| 久久久久毛片免费观看| 欧美视频在线一区| 99精品视频播放| 色综合桃花网| 香港成人在线视频| 国产一区二区片| 羞羞污视频在线观看| 国产精品美女一区二区三区| 日本午夜精品电影| 国产又爽又黄网站亚洲视频123| 国产裸体歌舞团一区二区| 国产精品自产拍在线观看| 免费看毛片网站| 国产精品夜夜夜| 91禁外国网站| 国产超碰人人爽人人做人人爱| 亚洲网址在线| 欧美激情精品久久久久久蜜臀| 日韩激情综合网| 66国产精品| 久久久91精品国产| 破处女黄色一级片| 欧美久色视频| 久久久久久久成人| 日韩欧美亚洲一区二区三区| 激情综合在线| 国内成人精品一区| 国产69精品久久久久久久久久| 亚洲久久成人| 欧洲日韩成人av| 亚洲精品中文字幕乱码三区91| 亚洲一区黄色| 国产成人激情小视频| 91丨九色丨海角社区| 日本午夜精品视频在线观看 | 男女超爽视频免费播放| 国产直播在线| 欧美在线小视频| 国内自拍第二页| 亚洲精品v亚洲精品v日韩精品| 日韩你懂的在线播放| 久久精品无码专区| 亚洲综合福利| 最新亚洲国产精品| 国产性生活大片| 精品69视频一区二区三区Q| 国产69精品久久久久9| 天天做天天爱夜夜爽| 蜜桃视频一区二区| 成人综合电影| 九色在线免费| 亚洲免费在线播放| 18禁免费观看网站| 农村妇女一区二区| 精品成人佐山爱一区二区| 无码h肉动漫在线观看| 午夜国产一区二区| 午夜精品免费视频| 亚洲一区在线观| 不卡视频一二三| 亚洲人久久久| 91资源在线观看| 欧美色图12p| 熟妇高潮一区二区| 日韩一区二区在线免费| 久久久久久免费精品| 国产91av在线播放| 丁香激情综合国产| 亚洲三区在线| 小草在线视频免费播放| 777亚洲妇女| 九色porny自拍视频| 欧美精品色网| 国产日本欧美在线观看| 青青色在线视频| 亚洲免费高清视频在线| 一本色道无码道dvd在线观看| 粉嫩av国产一区二区三区| 亚洲免费视频观看| 久久精品国产亚洲AV无码麻豆| 久久一日本道色综合久久| 444亚洲人体| yiren22综合网成人| 五月综合激情婷婷六月色窝| 中国黄色片免费看| 自拍偷拍一区| 91精品成人久久| www.成人免费视频| 中文字幕一区在线| 婷婷丁香激情网| 亚洲精品白浆高清| 午夜伦理精品一区| 亚洲精品一区二区口爆| 亚洲欧美日韩电影| 色国产在线视频| 国产一区二区三区网| 97精品国产97久久久久久春色| 国产三级小视频| 国产精品高潮呻吟| 精品久久久久久中文字幕2017| 日韩在线你懂的| 国内久久久精品| 亚洲黄色小说网| 亚洲精品乱码久久久久久| 在线一区二区不卡| 国产精品精品国产一区二区| 国产精品亚洲欧美导航| av免费观看一区二区| 91福利视频网站| 久久婷婷五月综合| 日韩vs国产vs欧美| 日韩一区免费观看| 欧美三区四区| 中文字幕久久精品| 瑟瑟视频在线免费观看| 国产精品私房写真福利视频| 成人性视频欧美一区二区三区| 欧美女王vk| 国产成人精品av| www.视频在线.com| 欧美色电影在线| 国产精品suv一区二区88| 美女高潮久久久| 中文字幕在线中文字幕日亚韩一区| 看片一区二区| 久久国产精品偷| 超碰在线播放97| 五月婷婷欧美视频| 成年人在线观看av| 日韩avvvv在线播放| 一区二区三区欧美在线| 日本一区二区乱| 欧美精品videosex性欧美| 全国男人的天堂网| 日韩欧美福利视频| 欧美激情视频二区| 韩国三级电影一区二区| 97av中文字幕| 色狼人综合干| 国产情人节一区| 丁香花高清在线观看完整版| 亚洲男女自偷自拍图片另类| 啪啪小视频网站| 亚洲精品视频在线看| 欧美日韩人妻精品一区在线| 视频一区中文字幕国产| 中文字幕久久一区| 北条麻妃在线一区二区免费播放 | 日韩中文视频| 久久av.com| 四虎影院在线播放| 欧美日韩国产一区| 久久久久97国产| 国产亚洲一区二区在线观看| 久久精品亚洲天堂| 免费视频久久| 免费观看中文字幕| 青青一区二区| 亚洲伊人一本大道中文字幕| 美女搞黄视频在线观看| 日韩一区二区欧美| 亚洲 欧美 自拍偷拍| 这里只有精品电影| 综合网在线观看| 亚洲精品高清视频在线观看| av中文字幕免费观看| 国产91在线观看丝袜| 成人精品视频一区二区| 国内精品嫩模av私拍在线观看| 日本一区二区久久精品| 亚洲一级大片| 国产一区二区在线播放| 竹内纱里奈兽皇系列在线观看 | 性孕妇free特大另类| 久久精品99国产精品酒店日本| 性插视频在线观看| 日韩亚洲电影在线| 亚洲一区二区人妻| 色综合久久久久| 日本特黄特色aaa大片免费| 国产精品久久久99| 瑟瑟视频在线观看| 99久久久免费精品国产一区二区| 一级黄色在线播放| 秋霞成人午夜伦在线观看| 99爱视频在线| 亚洲精品乱码| www.夜夜爱| 亚洲综合中文| www.午夜色| 欧美www视频在线观看| 日韩精品不卡| 九九热精品视频在线观看| 狠狠色伊人亚洲综合网站色| 免费观看亚洲天堂| 成人黄色免费片| 精品久久在线| 国产伦精品一区二区三区精品视频| 欧美粗大gay| 热re99久久精品国产66热| 久久久男人天堂| 午夜精品一区二区三区在线视 | 欧美高清视频| 中文字幕最新精品| av网站在线免费观看| 亚洲一级片在线看| 国产人成在线观看| 亚洲欧洲偷拍精品| 精彩国产在线| 在线播放国产一区中文字幕剧情欧美 | 国产大片中文字幕在线观看| 一区二区三区91| 久草成人在线视频| 亚洲综合色婷婷| 久久99久久久| 亚洲成人中文在线| 欧美bbbbbbbbbbbb精品| 色综合中文字幕国产| 国产精品777777| 欧洲av一区二区嗯嗯嗯啊| 中国女人一级一次看片| 欧美日韩一区二区电影| 一级片aaaa| 日韩欧美一二三| 国 产 黄 色 大 片| 亚洲精品乱码久久久久久金桔影视| 色wwwwww| 亚洲人成电影网站色www| 国产精品一区二区三区四区色| 国产小视频91| 九七电影韩国女主播在线观看| 久久综合免费视频影院| 日本伦理一区二区| 日本精品久久久| 高清欧美日韩| 国产成人女人毛片视频在线| 欧美日韩一本| 日韩亚洲视频在线| 欧美日韩福利| 无码人妻丰满熟妇区毛片18| 蜜臀av亚洲一区中文字幕| 日本特黄在线观看| 99re这里只有精品首页| 性猛交娇小69hd| 亚洲激情综合网| 天天干天天干天天操| 欧美日韩亚洲不卡| 亚洲爱爱综合网| 亚洲色图13p| av网站免费在线观看| 91精品国产高清自在线看超| 91在线成人| av一区二区三区免费| 日韩高清一级| 自拍偷拍亚洲色图欧美| 精品福利av| www.亚洲高清| 91啪九色porn原创视频在线观看| 国产午夜精品福利视频| 亚洲午夜私人影院| 亚洲 小说区 图片区| 精品福利视频一区二区三区| 极品美乳网红视频免费在线观看| 欧美伦理91i| 外国电影一区二区| 狠狠色噜噜狠狠狠狠色吗综合| 日韩av有码| 黄色影院一级片| 国产电影一区二区三区| 国产精品视频在| 欧美午夜激情小视频| 国产美女明星三级做爰| 亚洲人线精品午夜| heyzo高清国产精品| 国产日韩在线播放| 久久av电影| 免费成人在线视频网站| 国产精品99久久久久久似苏梦涵| 2019男人天堂| 日韩欧美成人免费视频| 欧美一级淫片aaaaaa| 久久久国产一区二区| 日韩一区二区三区在线免费观看| 国产精品视频免费一区二区三区| 三级电影一区| 欧美性猛交xxx乱久交| 99久久99久久精品国产片果冻| 九九热精彩视频| 69堂国产成人免费视频| 69视频在线| 国产精品自产拍在线观| 精品久久不卡| 国产精品亚洲a| 久久亚洲一区二区三区明星换脸 | 蜜臀av一区二区在线观看| 成人性生交大免费看| 精品成人国产在线观看男人呻吟| 亚洲欧美激情在线观看| 欧美日韩成人在线播放| 成人97精品毛片免费看| 一区二区三区免费看| 久久精品免费观看| 黄色裸体一级片| 欧美日韩成人一区二区| 天堂中文8资源在线8| 国产精品网站入口| 成人免费电影网址| 亚洲成人av免费看| 国产精品免费视频网站| 在线观看黄色网| 日韩中文字幕精品| 成人豆花视频| 一二三在线视频| 国产成人精品免费网站| 久久av高潮av无码av喷吹| 亚洲成色777777女色窝| 蜜桃视频在线观看播放| 免费国产一区| 免费看的黄色欧美网站| 色噜噜日韩精品欧美一区二区| 日韩欧美在线视频观看| 国产美女性感在线观看懂色av| 国产成人激情小视频| 91视频综合| 亚洲911精品成人18网站| 亚洲r级在线视频| 极品白浆推特女神在线观看 | 国产精品成人网| 国产精品无码一区二区桃花视频| 大胆欧美人体视频| 加勒比色老久久爱综合网| 久久网站免费视频| 国产精品嫩草99a| 性欧美一区二区三区| 久久免费精品视频| 尤物tv在线精品| 久久黄色片网站| 亚洲午夜激情网站| 欧美香蕉爽爽人人爽| 国产日韩av在线播放| 在线播放精品| 亚洲AV无码成人精品区明星换面| 欧美美女网站色| 2021中文字幕在线| 神马一区二区影院| 国产河南妇女毛片精品久久久 | 欧美高清视频www夜色资源网| 午夜小视频福利在线观看| 精品乱码一区| 久久 天天综合| 久久狠狠高潮亚洲精品| 在线观看不卡av| 福利电影一区| 日韩一区二区三区久久| 亚洲成人福利片| 在线观看免费网站黄| 国产乱码精品一区二区三区中文 | 日本高清不卡一区二区三| 精品一区二区精品| 日韩精品一区二区亚洲av| 久久激情五月丁香伊人| 蜜桃一区二区三区| 被黑人猛躁10次高潮视频| 日韩欧美999| 男人天堂亚洲| 亚洲午夜精品国产| 91论坛在线播放| 亚洲国产综合网|