精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

機器學習教材中的7大經典問題

人工智能 機器學習
有時我們會發現,在實際工作中,應該怎么做和教科書講的結論相矛盾,這時候要怎么辦呢?難道教科書中的結論出錯了?事實上,有時確實如此。所以今天我就想和大家分享一下機器學習教材中的一些經典問題,希望對大家今后的工作和學習有所幫助。

[[201516]]

如果希望了解機器學習,或者已經決定投身機器學習,你會第一時間找到各種教材進行充電,同時在心中默認:書里講的是牛人大神的畢生智慧,是正確無誤的行動指南,認真學習就能獲得快速提升。但實際情況是,你很可能已經在走彎路。

科技發展很快,數據在指數級增長,環境也在指數級改變,因此很多時候教科書會跟不上時代的發展。有時,即便是寫教科書的人,也不見得都明白結論背后的“所以然”,因此有些結論就會落后于時代。針對這個問題,第四范式創始人、首席執行官戴文淵近日就在第四范式內部分享上,向大家介紹了機器學習教材中的七個經典問題。本文根據演講實錄整理,略有刪減。

有時我們會發現,在實際工作中,應該怎么做和教科書講的結論相矛盾,這時候要怎么辦呢?難道教科書中的結論出錯了?事實上,有時確實如此。所以今天我就想和大家分享一下機器學習教材中的一些經典問題,希望對大家今后的工作和學習有所幫助。

神經網絡不宜超過三層 

 

那為什么之前的教科書上會寫神經網絡不能超過三層,這就要從神經網絡的歷史說起。五十年代有位科學家叫Marvin Minksy,他是一位生物學家,數學又很好,所以他在研究神經元的時候就在想能不能用數學模型去刻畫生物的神經元,因此就設計了感知機。感知機就像一個神經細胞,它能像神經細胞一樣連起來,形成神經網絡,就像大腦的神經網絡。其實在60年代開始的時候,是有很深的神經網絡,但當時經過大量實驗發現,不超過三層的神經網絡效果不錯,于是大概到80年代時就得出結論:神經網絡不宜超過三層。

 

那為什么現在這條結論又被推翻了呢?實際上這條結論是有前提條件的,即在數據量不大的情況下,神經網絡不宜超過三層。而從2005年開始,大家發現隨著數據增加,深度神經網絡的表現良好,所以慢慢走向深度學習。其實這里真正正確的原理是Valiant引理,它可以理解為“模型復雜度(例如專家系統的規則數量)要和數據量成正比”。數據量越大,模型就越復雜。上個世紀因為數據量小,所以神經網絡的層數不能太深,現在數據量大,所以神經網絡的層數就要做深。這也解釋了為什么當時教科書會有這樣的結論,而現在隨著深度學習的流行,大家已經不再會認為這句話是對的。

決策樹不能超過五層

如果有同學看教科書上介紹決策樹,會有一個說法就是決策樹要減枝,決策樹如果不減枝效果不好。還有教科書會告訴決策樹不能超過五層,超過五層的決策樹效果不好。這個結論和神經網絡結論一樣,神經網絡不能超過三層也是因為當時數據量不大,決策樹不能超過五層也是因為上個世紀數據量不夠大,二叉樹決策樹如果深度是N的話,復雜度大概是2的N次方,所以不超過五層復雜度也就是三十多。如果數據量達到一百萬的時候,決策樹能達到十幾二十層的規模,如果數據量到了一百億的時候決策樹可能要到三十幾層。

 

現在,我們強調更深的決策樹,這可能和教科書講的相矛盾。矛盾的原因是現在整個場景下數據量變大,所以要做更深的決策樹。當然,我們也不一定在所有的場景里都有很大數據量,如果遇到了數據量小的場景,我們也要知道決策樹是要做淺的。最根本來說,就是看有多少數據,能寫出多復雜的模型。

特征選擇不能超過一千個

有些教科書會單獨開個章節來講特征選擇,告訴我們在拿到數據后,要先刪除一些不重要的特征,甚至有的教科書注明,特征數不能超過一千,否則模型效果不好。但其實這個結論也是有前提條件的,如果數據量少,是不能夠充分支撐很多特征,但如果數據量大,結論就會不一樣。這也就是為什么我們做LogisticRegression會有幾十億個特征,而不是限制在幾百個特征。

 

過去傳統數據分析軟件,如SAS,之所以只有幾百個特征,是因為它誕生于上世紀七十年代,它面臨的問題是在具體場景下沒有太多可用數據,可能只有幾百上千個樣本。因此,在設計系統時,就只需要針對幾百個特征設計,不需要幾十億個特征,因為上千個樣本無法支撐幾十億特征。但現在,隨著數據量增加,特征量也需要增加。所以我認為,在大數據環境下,整個機器學習教科書里關于特征選擇的章節已經落后于時代,需要根據新的形式重新撰寫;當然在小數據場景下,它仍然具有價值。

集成學習獲得最好學習效果

第四個叫做集成學習,這個技術在各種數據挖掘比賽中特別有用,比如近些年KDD CUP的冠軍幾乎都是采用集成學習。什么是集成學習?它不是做一個模型,而是做很多(例如一千個)不一樣的模型,讓每個模型投票,投票的結果就是最終的結果。如果不考慮資源限制情況,這種模式是效果最好的。這也是為什么KDDCUP選手們都選擇集成學習的方式,為了追求最后效果,不在乎投入多少,在這種條件下,集成學習就是最好的方式。

 

但在現實中,企業做機器學習追求的不是用無限的資源做盡可能好的效果,而是如何充分利用有限資源,獲得最好效果。假設企業只有兩臺機器,如何用這兩臺機器獲得最好的效果呢?如果采用集成學習,用兩臺機器跑五個模型,就要把兩臺機器分成五份,每個模型只能用0.4臺機器去跑,因此跑的數據量就有限。那如果換種方式,不用集成學習,就用一個模型去跑,就能跑5倍的數據。通常5倍的數據量能比集成學習有更好的效果。在工業界比較少會應用集成學習,主要是因為工業界絕大多數的場景都是資源受限,資源受限時最好的方式是想辦法放進去更多的數據。集成學習因為跑更多的模型導致只能放更少的數據,通常這種效果都會變差。

正樣本和負樣本均采樣到1:1

第五個叫做均衡采樣,絕大多數的教科書都會講到。它是指如果我們訓練一個模型,正樣本和負樣本很不平均,比如在正樣本和負樣本1:100的情況下,就需要對正、負樣本做均衡采樣,把它變成1:1的比例,這樣才是最好的。但其實這個結論不一定對,因為統計學習里最根本的一條原理就是訓練場景和測試場景的分布要一樣,所以這個結論只在一個場景下成立,那就是使用模型的場景中正、負樣本是1:1,那這個結論就是對的。 

 

正確的做法是,應用場景是1:100,那訓練集合最好也是1:100。均衡采樣不一定都是對的,多數情況下不采樣反而才是正確的。因為大多時候,我們直接把訓練集合和測試集合做隨機拆分,或者按照時間拆分,二者的分布就是一致的,那個時候不采樣是最好的。當然有時候,我們也會發現做負樣本采樣會有更好的效果,比如范式在為某股份制銀行卡中心做交易反欺詐時,就做了負樣本采樣,那是因為當我們把所有樣本都放進去后,發現計算資源不夠,所以只能做采樣。正樣本與負樣本大概是1:1000或者1:10000,如果對正樣本做采樣,損失信息量會比較大,所以我們選擇對負樣本采樣,比如做1:1000的采樣,再把負樣本以1000的加權加回去。在資源受限時這么做,會盡可能降低信息量的損失。但如果僅僅是為了把它做均衡而做負樣本采樣,通常是不對的。和前面幾個問題不同,負樣本采樣并不是因環境改變而結論變化,事實上就不應該做負樣本采樣。

交叉驗證是最好的測試方法

下一個問題叫做交叉驗證,是指假設要將一份數據拆分成訓練集和測試集,這個時候怎么評估出它的誤差?交叉驗證是把集合拆成五份,取四份做訓練集、一份做測試集,并且每次選擇不同的那一份做測試級,最后測出五個結果再做平均,這被認為是最好的測試方法。

 

交叉驗證確實是一個還不錯的驗證的方法,但在現實應用場景下,它往往不是最合適的一種方式。因為通常來說,我們用機器學習做的事情是預測,絕大多數情況下我們是用現在或者過去的數據做一個模型來預測未來。而拿過去的訓練預測未來的最好測試方法不是交叉驗證,因為交叉驗證是按照交易或者按人拆分的。最合適的是方法其實是按照時間拆分,比如評估的時候選取一個時間點,用在這個時間點之前的數據做訓練,預測在這個時間點之后的,這是最接近真實應用場景的評估結果。

交叉驗證可能只適用于和時間屬性不相關的場景,比如人臉識別,但我們面臨更多的應用場景,無論是風險、營銷或者反欺詐,都是在用過去的數據訓練后預測未來,最合適這樣場景的評估方法不是交叉驗證,而是按照時間去拆分。

過擬合一定不好

最后一個叫過擬合,這也是一個討論特別多的話題。以前,通常我們會說如果模型做的太復雜了就會過擬合,如PPT右邊所示,而最好的方式應該是圖中中間的狀態——擬合的剛剛好,圖中左邊的模型underfitting,沒有訓練完全。但現在來看,大多數的實際場景都是在拿過去預測未來,過擬合不一定是不好的,還是要看具體場景。如果這個場景是過去見過的情況比較多,新的情況比較少的時候,過擬合反倒是好的。

 

打個比方,如果期末考試題就是平時的作業,那我們把平時的作業都背一遍就是最好的方式,而這就是過擬合。如果期末考試不考平時作業,全是新題,那么這個時候就不能只背平時的作業,還要充分理解這門課的知識,掌握如何推理解題的技巧。所以過擬合好壞與否,完全取決于場景。如果應用場景依靠死記硬背就能搞定,那過擬合反倒是好的。實際上在我們的設計里面,很多時候我們會傾向于往過擬合靠一點,可能做新題會差一點,但是對于死記硬背的送分題會做的非常好。在拿過去預測未來的應用場景下,有的時候過擬合不一定不好,要根據實際情況來看。

今天與大家分享了教科書中的幾個經典問題。其實在實際工業應用中,我們不會完全按照教科書中的方式去實踐。我們也會設計很深的模型、很深的決策樹、很多的特征、會過擬合一點,我們更強調按時間拆分,不強調均衡采樣。面對教科書中的結論,我們需要學會的是根據實際場景做出相應靈活判斷。

 

責任編輯:龐桂玉 來源: 36大數據
相關推薦

2017-05-15 10:30:00

大數據數據化運營應用

2010-03-03 12:57:02

Web

2018-02-01 18:45:12

機器學習算法線性回歸

2011-01-26 09:14:43

數據挖掘

2015-08-05 15:42:10

程序員面試問題

2011-11-28 14:23:53

美信云網管

2010-08-31 14:01:48

CSS

2020-12-09 16:57:15

數據分析大數據

2023-03-03 13:10:15

2020-07-30 08:10:08

框架設計Spring Secu

2017-07-18 10:50:38

前端JavaScript排序算法

2025-05-12 10:10:00

運維Linux系統

2021-10-31 07:38:37

排序算法代碼

2016-01-29 11:00:55

數據挖掘算法大數據

2010-08-16 09:57:49

SilverlightWPFVisual Stud

2013-02-25 09:46:35

數據挖掘算法ICDM

2013-07-09 13:56:48

微信

2022-03-10 12:03:33

Python算法代碼

2024-09-06 17:57:35

2018-11-06 09:48:36

機器學習算法模型
點贊
收藏

51CTO技術棧公眾號

国产精品资源| 天堂综合在线播放| 国产亚洲精品bt天堂精选| 日韩免费在线看| av在线播放中文字幕| 香蕉免费一区二区三区在线观看| 欧美日韩国产精品一区二区三区四区 | 亚洲欧美日韩精品久久奇米色影视 | 色老头在线视频| 日本一二区不卡| 日韩欧美的一区二区| 欧美 日韩 国产一区| 美女隐私在线观看| 不卡av在线网| 成人在线观看视频网站| 日韩熟女精品一区二区三区| 青青一区二区三区| 日韩精品视频免费专区在线播放| 黄色一级二级三级| 一区二区三区伦理| 国产欧美一区二区精品久导航| 亚洲aa中文字幕| 无码人妻精品一区二区三区不卡 | 成人av地址| 欧美在线看片a免费观看| 中文精品无码中文字幕无码专区| 搞黄视频在线观看| 99久久久国产精品| 91九色对白| 一级片视频播放| 久久一本综合频道| 韩剧1988在线观看免费完整版| 国产成人在线网址| 精品国产一区二区三区久久久樱花| 精品国产一区二区三区av性色| 成年网站在线播放| 自拍网站在线观看| 天天操天天干天天综合网| 老汉色影院首页| 一级日本在线| 国产精品少妇自拍| 日韩少妇中文字幕| 内衣办公室在线| 99精品久久只有精品| 国产成人精品一区二区三区福利| 91国产精品一区| 蜜臀av在线播放一区二区三区| 日韩美女福利视频| 亚洲日本视频在线观看| 亚洲毛片av| 欧美精品久久久久久久久| 五月天av网站| 午夜影院欧美| 久久精品电影网| а天堂中文在线资源| 日韩精品一区二区久久| 在线播放日韩欧美| 国产馆在线观看| 99国产**精品****| 超碰97人人做人人爱少妇| 成人自拍小视频| 久久久精品久久久久久96| 不卡av电影院| 久草网站在线观看| 精品99视频| 午夜精品福利电影| 99久久精品国产亚洲| 奶水喷射视频一区| 国产精品美女www| 夜夜躁狠狠躁日日躁av| 国内一区二区在线| 91中文在线视频| 成 人 黄 色 片 在线播放| 国产成人av资源| 九九九九九九精品| 男人av在线| 欧美激情一区二区| 中文字幕の友人北条麻妃| 先锋成人av| 欧美视频不卡中文| 色悠悠久久综合网| 日韩一区二区三区色| 亚洲国产精品字幕| 成人午夜福利一区二区| 日本电影一区二区| 美女久久久久久久| 日本在线视频免费| 日韩在线一二三区| 成人性生交大片免费看视频直播| 国模人体一区二区| 久久久久国产一区二区三区四区 | 日韩欧美精品中文字幕| 亚洲视频在线a| 日韩08精品| 亚洲人成网站777色婷婷| 多男操一女视频| 在线观看视频日韩| 国产精品视频免费在线观看| 精品人妻少妇AV无码专区| 91农村精品一区二区在线| 亚洲欧洲精品一区二区| bl在线肉h视频大尺度| 在线精品视频免费观看| 18禁一区二区三区| 国产成人三级| 久久久久久久久久婷婷| 丰满熟女人妻一区二区三| 国产99久久久国产精品免费看| 欧美亚洲丝袜| 亚洲精品白浆| 精品视频1区2区| 日本xxxx裸体xxxx| 欧美成人综合| 国产精品视频免费观看www| 涩涩视频免费看| 18涩涩午夜精品.www| 爱福利视频一区二区| 视频精品一区二区三区| 在线观看免费高清视频97| 在线看成人av| 国产在线播放一区二区三区| 日韩欧美一区二区三区久久婷婷| 女人天堂av在线播放| 欧美日韩精品三区| 99久久久无码国产精品性| 韩国一区二区三区在线观看| 国产日韩精品一区二区| 国产大学生校花援交在线播放| 亚洲成精国产精品女| 日韩视频在线观看一区二区三区| 欧美极品中文字幕| 91wwwcom在线观看| 高h调教冰块play男男双性文| 国产精品久久久久久久久久免费看| 欧美日韩激情视频在线观看| youjizz欧美| www.日本久久久久com.| 欧美一级淫片免费视频黄| 成人97人人超碰人人99| 黄色成人在线免费观看| 国产亚洲精aa在线看| 日韩专区中文字幕| 中文在线观看av| 国产精品嫩草影院com| 美女黄色片视频| av亚洲在线观看| 国产成人自拍视频在线观看| 精品资源在线看| 一本久久精品一区二区| a毛片毛片av永久免费| 性欧美xxxx大乳国产app| 久久大片网站| 高潮一区二区| 国产亚洲精品久久久久动| 99久久久无码国产精品免费蜜柚| 国产清纯美女被跳蛋高潮一区二区久久w| 免费看的黄色大片| 夜色77av精品影院| 国产精品福利网| 欧洲不卡av| 欧美一级免费观看| 久久精品免费av| 99久久99久久精品国产片果冻| 男女猛烈激情xx00免费视频| 大奶在线精品| 高清欧美电影在线| 五月婷婷激情在线| 色婷婷久久99综合精品jk白丝| 国产又粗又猛又爽又黄av| 日产国产高清一区二区三区| 正义之心1992免费观看全集完整版| 亚洲高清影院| 欧美精品xxx| 天堂av在线播放| 欧美婷婷六月丁香综合色| 日韩一区二区不卡视频| 国产盗摄精品一区二区三区在线 | 日韩影院免费视频| 最新不卡av| www国产精品| 国产成人在线视频| 成人在线视频亚洲| 亚洲精品国精品久久99热一| 一级黄色av片| 伊人色综合久久天天| 一级国产黄色片| 美女视频黄a大片欧美| 日本高清视频免费在线观看| 欧美天堂影院| 91精品视频在线| av女在线播放| 中文字幕亚洲综合久久| 性中国xxx极品hd| 在线视频一区二区免费| 高h视频免费观看| 久久久国产精品午夜一区ai换脸| 一级黄色片在线免费观看| 亚洲深夜福利| gogogo免费高清日本写真| 日韩成人午夜| 96国产粉嫩美女| 欧美特黄aaaaaaaa大片| 欧美精品免费看| аⅴ资源新版在线天堂| 亚洲成人免费网站| 一区二区精品视频在线观看| 婷婷综合五月天| 亚洲不卡在线播放| 久久久久久久网| 亚洲欧美日韩偷拍| 狠狠色丁香久久婷婷综| 欧美日韩亚洲一| 你懂的一区二区| 亚洲欧美国产精品桃花| 西野翔中文久久精品字幕| 亚洲一区亚洲二区| 国产极品久久久久久久久波多结野 | 高清欧美性猛交xxxx| 99免在线观看免费视频高清| 日韩欧美一区二区三区在线| 中文文字幕一区二区三三| 狠狠色狠色综合曰曰| 免费在线观看av网址| 国产精品区一区二区三| 久久精品无码一区| 99精品热视频| 奇米777第四色| 国产成人av电影在线播放| 日韩在线不卡一区| 日本少妇一区二区| 欧美一区网站| 精品无人区一区二区三区竹菊| 国产精品原创视频| 欧美在线一区二区三区四| 国产精品国精产品一二| 久久久国产精品免费| 91这里只有精品| 亚洲天堂免费观看| 日韩av免费观影| 亚洲激情视频在线播放| 高h放荡受浪受bl| 日韩欧美国产精品一区| 99国产成人精品| 欧美电影影音先锋| 夜夜爽8888| 67194成人在线观看| 91在线视频国产| 69p69国产精品| 国产成人毛毛毛片| 欧美一卡二卡在线观看| 精品国产乱码久久久久久蜜臀网站| 91精品啪在线观看国产60岁| 一区二区三区免费在线视频| 在线观看91精品国产麻豆| 国产精品久久久久久久一区二区| 欧美另类videos死尸| 6—12呦国产精品| 91精品国产综合久久久久久久| 91亚洲精品国偷拍自产在线观看| 在线不卡一区二区| 国产99视频在线| 精品久久人人做人人爽| 高潮毛片7777777毛片| 正在播放91九色| 久久久久九九精品影院| 成人免费网站在线观看| 999精品视频在线观看| 91老司机在线| 伊人精品综合| 国产视频不卡| 亚洲区小说区| 亚洲成色www久久网站| 欧美va久久久噜噜噜久久| 中文字幕一区二区三区在线乱码 | 美女黄毛**国产精品啪啪| 免费精品国产的网站免费观看| 日韩av一区二区三区在线| 日韩88av| 99热这里只有精品免费| 夜夜夜久久久| 亚洲免费看av| 国产电影一区二区三区| 亚洲自拍偷拍一区二区| 国产精品麻豆99久久久久久| 青青草免费av| 欧美特黄级在线| 91国产免费视频| 亚洲国产精品久久| 亚洲搞黄视频| 韩国v欧美v日本v亚洲| 精品成人av| 99re视频在线播放| 国内成人自拍| 亚洲国产精品无码观看久久| 日韩黄色免费网站| 师生出轨h灌满了1v1| 国产亚洲精品中文字幕| 成人观看免费视频| 色8久久精品久久久久久蜜| 精品国产99久久久久久宅男i| 亚洲国产精品va在线| 免费网站看v片在线a| 国产91精品久久久久久| 亚洲最大的免费视频网站| 九色91在线视频| 午夜国产精品视频| 国产 porn| 99精品视频在线免费观看| 欧美做爰啪啪xxxⅹ性| 色综合久久综合网欧美综合网| 国产男女猛烈无遮挡| 亚洲精品网站在线播放gif| 中文字幕在线观看播放| 国产精品电影一区| 色狼人综合干| 青草网在线观看| 麻豆成人在线观看| 亚洲av无码国产精品久久| 一区二区三区四区国产精品| 在线观看毛片网站| 亚洲日韩欧美视频| 爱啪视频在线观看视频免费| 亚洲va久久久噜噜噜| 成人嘿咻视频免费看| 久久婷婷五月综合色国产香蕉| 国产suv精品一区二区6| 国产免费一区二区三区四区| 欧美性猛片xxxx免费看久爱| 色av男人的天堂免费在线| 国模极品一区二区三区| 亚洲成av人片在线观看www| 一区二区高清视频| 麻豆精品新av中文字幕| 亚洲图片另类小说| 色综合久久久久综合体桃花网| 人妻偷人精品一区二区三区| 九九热在线精品视频| 懂色av色香蕉一区二区蜜桃| 伊人婷婷久久| 蜜臀精品久久久久久蜜臀| 亚洲性猛交xxxx乱大交| 色综合视频一区二区三区高清| 天堂影院在线| 欧美中文字幕在线视频| 日韩高清成人在线| 人妻有码中文字幕| 91美女片黄在线观看91美女| 日韩在线视频免费播放| 日韩精品视频在线观看网址| 日韩欧美精品一区二区三区| 精品日本一区二区| 性伦欧美刺激片在线观看| 男人天堂av电影| 欧美亚洲图片小说| 在线播放毛片| 91在线观看免费网站| 一级欧洲+日本+国产| 免费在线观看日韩av| 天天色 色综合| 毛片在线播放网址| 国产激情视频一区| 日韩精品dvd| 亚洲综合在线一区二区| 一区二区免费在线播放| 秋霞网一区二区| 欧美中文字幕视频在线观看| 精品视频网站| 一级黄色在线播放| 亚洲午夜精品网| 色视频在线观看福利| 国产精品成熟老女人| 国产精品久久久久久久免费观看| 成人性生交视频免费观看| 亚洲国产欧美日韩另类综合| 青青免费在线视频| 国产精品网站视频| 欧美激情一区| 色欲av无码一区二区三区| 欧美日韩在线综合| 丝袜中文在线| 日本一区二区三不卡| 精品一区二区免费看| 国产一级免费观看| 亚洲视频在线免费看| 亚洲精品三区| 国产av天堂无码一区二区三区| 国产清纯白嫩初高生在线观看91| 国产精品一级二级| 91av视频在线| 天天做天天爱综合| 国产成人无码一区二区在线观看| 色国产精品一区在线观看| 99热国产在线| 欧美日韩亚洲综合一区二区三区激情在线| 蜜桃久久精品一区二区| av资源吧首页| 久久精品99久久久香蕉| 要久久爱电视剧全集完整观看| 91av免费观看| 在线精品视频免费播放|