關于神經網絡的一些思考與感受原創

AI探索時代

發布于 2025-1-26 13:32

瀏覽

0收藏

“ 神經網絡模型并不是通用模型，不同的問題需要設計不同的神經網絡模型，千萬不要想著一個模型打天下 ”

神經網絡作為當前人工智能領域最炙手可熱的技術，其技術原理也相對比較復雜；而在學習神經網絡的過程中也面臨著很多問題和感受，因此這里就簡單記錄一下。

關于神經網絡

從本質上來說，所謂的神經網絡就是一個模擬人類大腦的數學模型；而為了解決不同的問題，技術專家們也設計了多種不同的神經網絡模型，比如RNN，CNN以及Transformer等模型，以及基于這些模型的變種。

不同的神經網絡模型擅長解決不同領域的具體問題；比如CNN——卷積神經網絡就比較適合處理圖像任務；Transformer擅長處理自然語言問題。

關于神經網絡的一些思考與感受-AI.x社區

當然，受限于目前的技術問題，還沒有一種通用的神經網絡模型能夠解決所有問題；因此，根據不同的任務就只能設計不同的神經網絡模型；以上三種神經網絡架構只是目前市面上比較常見的，比較通用的神經網絡架構；并且在處理具體任務時，不同的網絡架構也可以嵌套使用。

其次，從技術的實現角度來說，目前市面上有兩大技術框架；一個是谷歌公司開發的Tensorflow框架，以及Meta公司開發的PyTorch框架。

當然，神經網絡最重要的是其實現思想，所以使用什么語言，以及什么技術都可以根據自己的喜好進行選擇；而不論是Tensorflow還是pyTorch框架，只是方便技術人員的開發；使得技術人員不需要所有東西都從0開始。簡單來說就是，你用這兩個框架也可以，不用這兩個框架也可以。

關于神經網絡的一些思考與感受-AI.x社區

神經網絡的實現流程：

要想設計和實現一個能夠解決具體問題的神經網絡模型，需要經過以下幾個步驟：

明確任務目標，即你想設計一個具備什么功能的神經網絡模型
構建模型即使用什么架構，以及具體的神經網絡結構，就是神經網絡的具體實現
數據準備收集任務目標所需要的訓練數據集和測試數據集等
模型訓練驗證與測試使用等

神經網絡的實現比較復雜，不但要設計神經網絡的輸入輸出，還要設計神經網絡有哪些層，每層的功能實現是什么樣的；并且，由于神經網絡主要以向量格式為主，因此還需要對訓練數據進行處理，比如構建詞匯表，分詞，向量化等操作。

而一個神經網絡的好壞，一是看神經網絡模型的設計；二就是訓練數據的質量；因此，要想訓練一個神經網絡就需要收集大量的高質量的訓練數據。而數據收集到之后還不能直接使用，還需要經過清洗，格式化等操作。

目前神經網絡模型除了受限于算力問題之外，還一個非常嚴重的問題就是訓練數據的問題；傳說openAI在訓練GPT-4時已經把能找到的所有數據都用完了。

受限于自己的基礎問題，雖然從網上找了一些博客手動實現一個神經網絡模型；但到現在也沒想明白，為什么這些數據在神經網絡里七顛八倒之后，就能夠學習到數據的規律。

關于神經網絡的一些思考與感受-AI.x社區

總之，學習神經網絡最重要的不是看理論，最好的方式就是自己手動實踐，根據自己的實際問題，去設計和實現一個神經網絡；這樣你就能明白神經網絡到底是怎么運作的。

在使用神經網絡解決實際問題的過程中，切記不可指望一個神經網絡模型就能套用到所有問題中，那是不可能的；基本上每個問題都需要設計一個不同的神經網絡；區別可能就是有些相似度比較高的問題，可能在現有的神經網絡模型上進行適當的調整與修改。

本文轉載自公眾號AI探索時代作者：DFires

原文鏈接：??https://mp.weixin.qq.com/s/KSeBhEjeL9g8NCz-Vi5HiQ??

?著作權歸作者所有，如需轉載，請注明出處，否則將追究法律責任

標簽

神經網絡

贊

回復

舉報

回復

相關推薦

深度學習領域的一些關鍵概念

parson2000 ? 3936瀏覽 ? 0回復
神經網絡的通用訓練流程

AI探索時代 ? 4590瀏覽 ? 0回復
你知道神經網絡是怎么運作的嗎？神經網絡內部原理解析

AI探索時代 ? 4318瀏覽 ? 0回復
神經網絡與2024諾貝爾物理獎

魯班模錘1 ? 3609瀏覽 ? 0回復
個人關于人工智能技術學習的心得與方法，還有一些常用的網站

AI探索時代 ? 4188瀏覽 ? 0回復
優雅談大模型：神經網絡與矩陣

魯班模錘1 ? 3833瀏覽 ? 0回復
什么是神經網絡-終于把神經網絡參數更新搞明白了！

人工智能訓練營 ? 3120瀏覽 ? 0回復
什么是神經網絡？神經網絡開發框架——PyTorch和架構Transformer的區別和聯系

AI探索時代 ? 4499瀏覽 ? 0回復
神經網絡是怎么學習的？

AI探索時代 ? 3141瀏覽 ? 0回復
關于神經網絡的輸入格式——數據集的處理，關于神經網絡模型的結構說明

AI探索時代 ? 3957瀏覽 ? 0回復
神經網絡之損失函數與優化函數——梯度下降

AI探索時代 ? 4014瀏覽 ? 0回復
神經網絡理論與技術學習以及工具

AI探索時代 ? 3142瀏覽 ? 0回復
什么是神經網絡-終于把神經網絡參數更新搞明白了反向傳播詳解

人工智能訓練營 ? 3627瀏覽 ? 0回復
從一個簡單的神經網絡模型開始

AI探索時代 ? 3045瀏覽 ? 0回復
怎么實現一個神經網絡？神經網絡的組成結構

AI探索時代 ? 3553瀏覽 ? 0回復
不同神經網絡之間的區別，僅僅只是網絡結構的不同，明白了這個你才能知道應該怎么學習神經網絡

AI探索時代 ? 3466瀏覽 ? 0回復
神經網絡的每一層都是干嘛的？這才是神經網絡結構的核心

AI探索時代 ? 3276瀏覽 ? 0回復
什么是神經網絡-循環神經網絡RNN各層詳解及實例展示

人工智能訓練營 ? 4853瀏覽 ? 0回復
我對 AI 寫作的一些思考：Writing in the Age of LLMs

Baihai_IDP ? 2232瀏覽 ? 0回復

AI探索時代

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

51CTO

51CTO博客

51CTO學堂

關于神經網絡的一些思考與感受原創

關于神經網絡

目錄

51CTO

51CTO博客

51CTO學堂

關于神經網絡的一些思考與感受 原創

關于神經網絡

目錄

關于神經網絡的一些思考與感受原創