精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

前端也要懂機器學習之一

人工智能 機器學習
本文將通過上下兩篇來對機器學習的內容進行闡述,這是第一篇,主要介紹一些基礎知識和特征工程;后續推出的一批主要利用闡述機器學習中的監督學習算法和非監督學習算法。

[[374893]]

背景:

近年來機器學習的熱度不斷升高,前端領域也在不斷布局,從大的研究方向來看,有前端智能化、端智能;從框架這個角度來看,也有很多js版的框架,例如TensorFlow.js、Ml.js、Brain.js等。雖然當前來看其在前端落地的應用還不是很多,但是把握趨勢就是把握未來。本文將通過上下兩篇來對機器學習的內容進行闡述,這是第一篇,主要介紹一些基礎知識和特征工程;后續推出的一批主要利用闡述機器學習中的監督學習算法和非監督學習算法。

一、基礎

1.1 定義

機器學習是從數據中自動分析獲得模型,并利用模型對未知數據進行預測。

 

1.2 算法分類

機器學習的前提是數據,根據數據中是否有目標可以劃分為:監督學習算法和無監督學習算法。

  • 監督學習算法——輸入數據是由輸入特征值和目標值所組成。
  • 無監督學習算法——輸入數據是由輸入特征值和目標值所組成

 

1.3 如何選擇合適算法

機器學習有這么多算法,面對一個問題時應該如何選擇合適的算法成為了不可避免的問題,下面就來敘述兩條選擇合適算法的黃金法則。

1.確定使用機器學習算法的目的。

  • 將數據劃分為離散的組是唯一需求——聚類算法
  • 除將數據劃分為離散的組,還需要估計數據與每個組的相似度——密度估計算法
  • 目標變量為離散型——分類算法
  • 目標變量為連續型——回歸算法
  • 若想要預測目標變量的值——監督學習算法
  • 若無目標變量值——無監督學習

2.需要分析或收集的數據是什么,了解其數據特征

  • 特征值是離散型變量還是連續型變量
  • 特征值中是否存在缺失的值
  • 何種原因造成缺失值
  • 數據中是否存在異常值
  • 某個特征發生的頻率如何
  • ……

1.4 整體流程

不管多么復雜的內容經過前人的總結最會有一套方法論供我們這樣的小白使用,下面就來闡述一下機器學習通用的流程。

 

獲取數據

獲取數據是機器學習的第一步,例如使用公開的數據源、爬蟲獲取數據源、日志中獲取數據、商業數據等。

數據處理

得到數據后并不一定符合使用需求,所以需要進行數據清洗、數據填充、數據格式轉換,達到減小訓練的數據量,加快算法的訓練時間的目的。

特征工程

特征工程是使用專業背景知識和技巧處理數據,使得特征能在機器學習算法上發揮更好的作用的過程,直接影響機器學習的效果,主要包含特征提取、特征預處理、特征降維。

算法訓練

將處理之后的數據輸入到合適的算法進行訓練。

模型評估

使用測試集來評估模型的性能.模型性能指標有很多,比如在分類模型中常用的有錯誤率,精準率,召回率,F1指標,ROC等。

應用

將機器學習算法轉換為應用程序執行實際任務,從而檢驗該算法是否可以在實際工作中正常使用。

二、特征工程

業界流傳著一句話 “數據決定了機器學習的上限,而算法只是盡可能逼近這個上限”,這里的數據指的就是經過特征工程處理后的數據。特征工程是使用專業背景知識和技巧處理數據,使得特征能在機器學習算法上發揮更好的作用的過程,可見特征工程在機器學習中的重要地位。對于特征工程主要分為三步:特征抽取、特征預處理、特征降維。

注:特征工程是一個很深的學科,此處不展開闡述。

2.1 特征提取

特征提取指的就是將任意數據(如文本或圖像)轉換為可用于機器學習的數字特征,常用的主要包含:字典特征提取、文本特征提取、圖像特征提取。

2.2 特征預處理

通過特征提取,能得到未經處理的特征,該特征具有以下問題:

量綱不同:特征可能具有量綱,導致其特征的規格不一樣,容易影響(支配)目標結果,使得一些算法無法學習到其它的特征,需要進行無量綱化處理。

信息冗余:對于某些定量特征,其包含的有效信息為區間劃分,需要進行二值化處理。

定性特征不能直接使用:某些機器學習算法和模型只接受定量特征的輸入,則需要將定性特征轉換為定量特征,可通過啞編碼實現。

2.2.1 無量綱化

無量綱化使不同規格的數據轉換到同一規則,常用方法有歸一化和標準化

1.歸一化

  • 定義

對原始數據進行線性變換,使得結果映射到[0,1]之間。

  • 計算公式

 

  • 特點

最大最小值容易受到異常點影響,穩定性較差。

2.標準化

  • 定義

將原始數據進行變換到均值為0、標準差為1的范圍內

  • 計算公式

 

  • 特點

較少的異常點對結果影響不大,穩定性較好。

2.2.2 定量特征二值化

對于定量特征可進行二值化,通過選取一個合適的閾值,大于某閾值的為1,小余等于某閾值的為0。

 

2.2.3 定性特征啞編碼

大部分算法對于定性特征無法訓練模型,利用啞編碼(one-hot)可以將定性特征處理為定量特征用于模型訓練,其基本思想是:將離散特征的每一種值看成一種狀態,若該特征有N個值,則存在N種狀態,例如女孩子的頭發按照辮子的多少可以劃分為:無辮子、一個辮子、兩個辮子、多個辮子,則該特征有4種狀態,利用啞編碼可以表示為:

  • 無辮子 ====》[1, 0, 0, 0]
  • 一個辮子 ====》[0, 1, 0, 0]
  • 兩個辮子 ====》[0, 0, 1, 0]
  • 多個辮子 ====》[0, 0, 0, 1]

2.3 特征降維

在機器學習中對維度較高的數據進行處理時會極大消耗系統資源,甚至產生維度災難。在某些限定條件下,通過降維的方式可降低隨機變量的個數,用一個低維度向量來表示原始高維度的特征。常用的降維的方式有:特征選擇、PCA、LDA等。

2.3.1 特征選擇

數據預處理完畢之后需要選擇有意義的特征進行訓練,特征選擇從以下兩方面考慮:

特征是否發散:若某特征不發散(例如方差接近為0),則認為該特征無差異。

特征與目標的相關性:優先選擇與目標相關性較高的特征。

常用的特征選擇方式有:Filter(過濾法)、Wrapper(包裝法)、Embedded(集成法)。

2.3.1.1 Filter(過濾法)

先進行特征選擇,然后去訓練學習器,其特征選擇的過程與學習器無關。其主要思想是給每一維的特征賦予權重,權重代表該特征的重要性,然后設定閾值或者待選擇閾值的個數選擇特征。常用方法有方差選擇法(低方差特征過濾)、相關系數法等。

一、低方差特征過濾

方差指的是各變量值與其均值離差平方的平均數,是測算數值型數據離散程度的重要方法,方差越大則表征數據的離散程度越大,反之越小。對于數據中的特征值,方差小則表示特征大多樣本的值比較相近;方差大則表示特征很多樣本的值都有差別。低方差特征過濾正是基于該思想,通過設定方差閾值來去掉小于該閾值的特征。方差計算公式如下:

 

二、相關系數法

皮爾遜相關系數(r)定義為兩個變量之間的協方差和標準差的商,是反映變量之間相關關系密切程度的統計指標,其值r范圍為[-1, 1],含義為:

  • 當r > 0時表示兩變量正相關
  • r < 0時,兩變量為負相關
  • 當|r|=1時,表示兩變量為完全相關
  • 當r=0時,表示兩變量間無相關關系
  • 當0<|r|<1時,表示兩變量存在一定程度的相關。且|r|越接近1,兩變量間線性關系越密切;|r|越接近于0,表示兩變量的線性相關越弱

 

2.3.1.2 Wrapper(包裝法)

把要使用的分類器作為特征選擇的評價函數,對于特定的分類器選擇最優的特征子集。其主要思想是將子集的選擇看作是一個搜索尋優問題,生成不同的組合,對組合進行評價,再與其它的組合進行比較。常用方法有遞歸特征消除法。

  • 遞歸特征消除的主要思想是反復的構建模型(如SVM或者回歸模型)然后選出最好的(或者最差的)的特征(可以根據系數來選),把選出來的特征選擇出來,然后在剩余的特征上重復這個過程,直到所有特征都遍歷了。這個過程中特征被消除的次序就是特征的排序。因此,這是一種尋找最優特征子集的貪心算法。

2.3.1.3 Embedded(集成法)

將特征選擇嵌入到模型訓練當中。其主要思想是通過使用某些機器學習的算法和模型進行訓練,得到各個特征的權值系數,根據系數從大到小選擇特征。常用方法有:基于懲罰項的特征選擇法(L1、L2)、決策樹的特征選擇法(信息熵、信息增益)。

注:該方法與算法強相關,所以在算法實現的時候進行闡述。

2.3.2 PCA(主成分分析法)

主成分分析(Principal components analysis,PCA)是一種分析、簡化數據集的技術。主成分分析經常用于減少數據集的維數,同時保持數據集中的對方差貢獻最大的特征(旨在找到數據中的主成分,并利用這些主成分表征原始數據,從而達到降維的目的)。這是通過保留低階主成分,忽略高階主成分做到的。

一、 優缺點

1.優點:

  • 降低數據的復雜性,識別最重要的多個特征
  • 僅需方差衡量信息量,不受數據集以外的因素影響
  • 各主成分之間正交,可消除原始數據成分間的相互影響的因素
  • 計算方法簡單,主要運算式特征值分解,易于實現

2.缺點:

可能損失有用信息(由于沒有考慮數據標簽,容易將不同類別數據完全混合在一起,很難區分)

  • 二適用數據類型——數值型數據

2.3.3 LDA(線性判別分析法)

LDA是一種監督學習的降維技術,它的數據集的每個樣本是有類別輸出的。PCA與此不同,PCA是不考慮樣本類別輸出的無監督降維技術。LDA的思想是“最大化類間距離和最小化類內距離”(將數據在低維度上進行投影,投影后希望每一種類別數據的投影點盡可能的接近,而不同類別的數據的類別中心之間的距離盡可能的大)

1.優點:

  • 在降維過程中可以使用類別的先驗知識經驗
  • LDA在樣本分類信息依賴均值而不是方差的時候,比PCA之類的算法較優

2.缺點:

  • LDA不適合對非高斯分布(非正態分布)樣本進行降維
  • LDA降維后可降為[1, 2,……,k-1]維,其中k為類別數
  • LDA在樣本分類信息依賴方差而不是均值的時候,降維效果不好
  • LDA可能過度擬合數據

參考文獻

 

  • 特征工程到底是什么
  • LDA和PCA降維
  • 機器學習實戰

本文轉載自微信公眾號「執鳶者」,可以通過以下二維碼關注。轉載本文請聯系執鳶者公眾號。

 

責任編輯:武曉燕 來源: 執鳶者
相關推薦

2021-01-18 05:33:08

機器學習前端算法

2021-01-19 06:16:05

前端Babel 技術熱點

2017-03-16 08:46:43

TensorFlow安裝入門

2016-11-28 09:24:08

Python內存技巧

2021-03-18 11:45:49

人工智能機器學習算法

2020-05-19 14:00:09

人工智能機器學習AI

2021-02-04 15:08:37

Vue漸進式框架

2020-05-06 09:10:08

機器學習無監督機器學習有監督機器學習

2021-09-29 07:41:27

前端技術編程

2022-02-16 15:32:58

FlexUI框架容器組件

2011-04-18 10:21:37

XML

2022-02-22 13:50:01

TypeScrip前端框架

2011-04-12 14:28:52

XML

2019-07-29 10:39:39

前端性能優化緩存

2009-10-23 13:24:20

linux Shell

2021-08-04 06:56:49

HTTP緩存前端

2020-10-14 14:18:33

機器學習機器學習架構人工智能

2022-11-30 17:05:33

代碼程序場景

2022-11-14 08:44:56

前端門面模式接口

2021-09-26 05:05:46

GoFiber Express
點贊
收藏

51CTO技術棧公眾號

久久久精品视频免费观看| 综合一区中文字幕| 亚洲av中文无码乱人伦在线视色| 自拍偷拍欧美一区| 欧美少妇xxx| 精品国产一区二区三区在线| 日本美女一级片| 日韩电影在线看| 欧美成人免费网| www.中文字幕av| 少妇精品在线| 色老汉av一区二区三区| 中文字幕制服丝袜在线| 日韩国产福利| 国产老肥熟一区二区三区| 欧美一区二区大胆人体摄影专业网站| 日本在线观看网址| 五月天亚洲一区| 欧美一级久久久久久久大片| 别急慢慢来1978如如2| 后进极品白嫩翘臀在线播放| 国产精品色眯眯| 国内一区二区三区在线视频| 国产乱码精品一区二三区蜜臂 | 亚洲精品成人a8198a| 亚洲AV无码乱码国产精品牛牛| 丝袜美腿亚洲色图| 欧美精品www在线观看| 国产无遮挡在线观看| 欧美wwwsss9999| 欧美精品视频www在线观看 | 蜜桃av噜噜一区二区三区| 国产精品毛片一区二区在线看舒淇| 夜夜精品视频| 欧美黑人性生活视频| 强制高潮抽搐sm调教高h| 天天做夜夜做人人爱精品| 日韩精品中文字幕在线一区| 91亚洲精品久久久蜜桃借种| 成人黄色图片网站| 色诱视频网站一区| www.爱色av.com| aa视频在线观看| 一区二区三区在线视频免费| 中文字幕日韩一区二区三区不卡| h视频在线观看免费| 久久嫩草精品久久久精品| 国产综合第一页| 高清毛片aaaaaaaaa片| 国产一区二区在线影院| 成人黄色免费片| 在线观看免费观看在线| 日本麻豆一区二区三区视频| 日韩美女av在线免费观看| 免费在线不卡视频| 99热免费精品在线观看| 久久久之久亚州精品露出| 免费在线观看国产精品| 欧美黄在线观看| 欧美精品手机在线| 美女视频黄免费| 午夜欧美精品| 欧美二区在线播放| 国产真实乱偷精品视频| 亚洲黑丝一区二区| 97婷婷涩涩精品一区| 91国产丝袜播放在线| 亚洲永久免费| 国产精品2018| 亚洲视频在线观看一区二区| 紧缚奴在线一区二区三区| 91久久久久久久久久久| 国产av精国产传媒| 成人自拍视频在线| 国模一区二区三区私拍视频| 黄视频在线观看免费| 亚洲国产精品高清| 综合久久国产| 久草在线新免费首页资源站| 欧美日韩黄色大片| 亚洲一区二区三区四区五区xx| 国产一区高清| 日韩一级高清毛片| 国产精品无码在线| 精品一区二区三区的国产在线观看| 中文字幕欧美国内| 成年人一级黄色片| 国产人成精品一区二区三| 国产精品wwwwww| 国产精品热久久| hitomi一区二区三区精品| 欧美午夜免费| 搞黄网站在线观看| 亚洲永久免费av| 国产精品97在线| 伊人久久大香伊蕉在人线观看热v| 日韩欧美国产一二三区| 51调教丨国产调教视频| 不卡日本视频| 久久久伊人日本| 影音先锋国产在线| 成人av综合在线| 亚洲精品美女久久7777777| 日日夜夜天天综合入口| 日本精品一区二区三区高清| 日韩成人av免费| 日韩美女国产精品| 另类色图亚洲色图| 日批视频免费在线观看| 国产久卡久卡久卡久卡视频精品| 久草精品电影| av免费网站在线| 在线观看不卡视频| www.四虎精品| 国产精品久久久久久麻豆一区软件 | 日韩在线观看| 2019精品视频| 精品国产亚洲av麻豆| 国产香蕉久久精品综合网| 强开小嫩苞一区二区三区网站 | 精品久久久久久久大神国产| 国产女同无遮挡互慰高潮91| 国产aⅴ精品一区二区三区久久| 九九精品在线播放| 国产九色91回来了| 久久影音资源网| 国产av人人夜夜澡人人爽麻豆 | 国产免费一区二区| 黄色在线论坛| 日本韩国精品一区二区在线观看| 亚洲麻豆一区二区三区| 中文字幕免费一区二区三区| 国产精品都在这里| 青青青草网站免费视频在线观看| 亚洲在线免费播放| 欧美性猛交xx| 午夜激情久久| 国产精品免费久久久| 天天色棕合合合合合合合| 亚洲精品乱码久久久久| 中国黄色片一级| 久久国产亚洲精品| 国产美女搞久久| 91成人高清| 欧美伊人久久久久久久久影院| 亚洲午夜久久久久久久久红桃 | 欧美激情日韩图片| 国产极品久久久| 综合精品久久久| 免费网站在线观看黄| 欧美大片aaaa| 成人久久久久久久| 日本电影全部在线观看网站视频| 欧美亚洲国产一区二区三区va| 男生草女生视频| 久久激情一区| 日本成人黄色免费看| 国产精品久久久久av电视剧| 亚洲图片欧美午夜| 最好看的日本字幕mv视频大全| 国产婷婷色一区二区三区四区| 毛葺葺老太做受视频| av亚洲在线观看| 国产欧美精品日韩精品| 日本综合在线| 欧美一卡2卡三卡4卡5免费| 久久精品视频免费在线观看| 成人av资源站| 国产亚洲天堂网| 色97色成人| 91丝袜美腿美女视频网站| 影音先锋中文在线视频| 亚洲国产精品999| 国产免费av一区| 国产精品人成在线观看免费 | 日日夜夜综合| 九九热这里只有精品免费看| 日韩一级片免费观看| 色一情一乱一乱一91av| 99精品中文字幕| 国产精品亚洲人在线观看| 无码专区aaaaaa免费视频| 九一成人免费视频| 成人免费视频a| 国产经典三级在线| 亚洲欧美精品一区二区| 中文字幕在线观看1| 亚洲制服丝袜av| 免费在线观看污| 国产乱码精品一区二区三区忘忧草| xxxx18hd亚洲hd捆绑| 国产亚洲一区二区三区啪| 成人亚洲激情网| 成人观看网址| 在线视频欧美性高潮| 亚洲第一黄色片| 91官网在线观看| 国产一级在线播放| 国产亚洲欧美激情| 秋霞午夜鲁丝一区二区| 媚黑女一区二区| 今天免费高清在线观看国语| 亚洲第一二三区| 91免费电影网站| 日韩电影免费观| 欧美黑人性视频| 四虎久久免费| 精品视频久久久久久久| 国产特级黄色片| 在线视频国内一区二区| 精品一区在线视频| 国产精品乱人伦中文| 在线观看av中文字幕| 麻豆国产欧美一区二区三区| 日本www在线播放| 欧美一区二区三区久久精品茉莉花| 蜜桃麻豆91| 白白在线精品| 91精品在线一区| 欧洲一级精品| 国外成人在线直播| 成人a在线视频免费观看| 亚洲色无码播放| 天天色棕合合合合合合合| 欧美成人一区二区三区片免费| 日韩欧美一级大片| 色欧美乱欧美15图片| 日本少妇性生活| 亚洲精品国产成人久久av盗摄 | 亚洲精品日产精品乱码不卡| 99久久久无码国产精品衣服| 99久久99久久久精品齐齐| 亚洲性图第一页| 国产九九视频一区二区三区| 亚洲欧美国产日韩综合| 久久精品盗摄| 男人操女人免费| 免费日韩av片| 波多野结衣家庭教师在线| 好看的亚洲午夜视频在线| 400部精品国偷自产在线观看| 国产精品久久久久久久免费观看| 亚洲欧洲一区二区福利| 国产日产精品一区二区三区四区的观看方式| 国产欧美日韩一区二区三区| 久久婷婷国产| 久久久com| 亚洲调教一区| 欧美一区激情视频在线观看| 国产精品亚洲二区| 日本一区二区精品视频| 国产亚洲第一伦理第一区| 日本不卡一二三区| 日本电影一区二区| 亚洲午夜在线观看| 国产精品久久久久久久久妇女| 中文精品一区二区三区| 91精品1区| 激情五月六月婷婷| 伊人久久久大香线蕉综合直播| 国产一级爱c视频| 国产视频一区欧美| 熟女人妇 成熟妇女系列视频| 青青草国产成人99久久| 潘金莲激情呻吟欲求不满视频| 精久久久久久久久久久| 三级网站免费看| 成人免费三级在线| 亚欧洲乱码视频| 中文字幕欧美三区| 亚洲二区在线播放| 亚洲最新视频在线播放| 欧美一区二区激情视频| 欧美在线观看一区| 国产成人三级一区二区在线观看一| 日韩一二三区不卡| 四虎精品一区二区三区| 国产一区二区久久精品| av香蕉成人| 97国产一区二区精品久久呦| 欧美三区四区| 91精品视频免费观看| 麻豆一区二区麻豆免费观看| 日本精品一区二区三区高清 久久 日本精品一区二区三区不卡无字幕 | 精品中文字幕一区二区三区av| 亚洲欧洲精品一区二区三区波多野1战4| 五月精品视频| 欧美牲交a欧美牲交| 麻豆成人av在线| av电影在线播放| 国产欧美日韩中文久久| 精国产品一区二区三区a片| 岛国av一区二区| 国产女主播福利| 日韩精品www| 黄av在线免费观看| 欧美中文字幕视频在线观看| 日日夜夜综合| 欧美日韩亚洲在线 | 久久91精品国产91久久跳| 成人免费无遮挡| 91青青草免费在线看| 色综合综合网| 欧美极品少妇无套实战| 日韩高清电影一区| 催眠调教后宫乱淫校园| 中文字幕一区二区在线播放| 在线能看的av| 日韩欧美电影一区| 成人亚洲综合天堂| 国内精品小视频| 久久免费福利| 亚洲高清视频一区二区| 99国产精品视频免费观看一公开| 国产一级免费大片| 国产欧美日韩另类视频免费观看| 国产精品theporn动漫| 欧美高清性hdvideosex| 九色视频成人自拍| 国色天香2019中文字幕在线观看| 国产日本亚洲| 亚洲精品影院| 日韩电影在线免费观看| 少妇精品一区二区三区| 亚洲成人久久影院| 国产美女自慰在线观看| 中文字幕一区二区精品| 亚洲欧洲高清| 精品亚洲第一| 国产精品videosex极品| 欧美国产在线一区| 中文字幕中文字幕在线一区 | 亚洲精品电影院| 91黄色免费版| 韩日视频在线| 国产99久久久欧美黑人 | gogo亚洲高清大胆美女人体| 精品一区二区日本| 99视频一区| 亚洲观看黄色网| 五月婷婷久久综合| 国产小视频一区| 欧美精品九九久久| 大奶在线精品| 日本中文字幕在线视频观看| 国产91在线|亚洲| 久久国产一级片| 精品av综合导航| 2021中文字幕在线| 精品国产乱码久久久久久郑州公司 | 99免费在线观看| 亚洲国产精品视频在线观看| av手机免费在线观看| av一区观看| 亚洲黄色精品| 短视频在线观看| 在线区一区二视频| 9色在线观看| 91网站在线看| 黑丝一区二区三区| bl动漫在线观看| 精品久久久香蕉免费精品视频| 神马久久精品| 国产成人精品视| 欧美hd在线| 亚洲黄色小说在线观看| 亚洲mv在线观看| 欧美视频综合| 国产在线视频2019最新视频| 自拍偷拍欧美专区| 水蜜桃av无码| 在线免费观看成人短视频| 日本网站在线免费观看视频| 91夜夜未满十八勿入爽爽影院| 国内一区二区三区| 偷拍女澡堂一区二区三区| 欧美日韩视频第一区| 欧美xxxx做受欧美88bbw| 久久精品日韩精品| 奇米四色…亚洲| 欧美成人手机视频| 亚洲免费福利视频| 四虎精品永久免费| 东北少妇不带套对白| 久久久国产精品麻豆| 国产精品一区二区人人爽| 久久久久久久久久婷婷| 久久av综合| 亚洲一区二区图片| 精品国产电影一区| xxxxx日韩| 国产精品国色综合久久| 日韩vs国产vs欧美| 欧美交换国产一区内射| 亚洲欧美日韩视频一区| 精品久久国产一区| 日本三区在线观看| 一区二区三区在线免费播放 | 国产精品久久久久久久久久辛辛| 日韩免费视频播放|