精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

用Python進行多元線性回歸分析(附代碼)

開發 后端
本文就用python代碼來展示一下如何用多元線性回歸來解決實際問題。

[[339266]]

很多人在做數據分析時會經常用到一元線性回歸,這是描述兩個變量間統計關系的最簡單的回歸模型。但現實問題中,我們往往會碰到多個變量間的線性關系的問題,這時就要用到多元線性回歸,多元線性回歸是一元回歸的一種推廣,其在實際應用中非常廣泛,本文就用python代碼來展示一下如何用多元線性回歸來解決實際問題。

圖1. 多元回歸模型中要用到的公式

如圖1所示,我們假設隨機變量y與一般變量x1、x2、...、xp之間線性回歸模型為(1)式,式中y為因變量,x1、x2、...、xp是自變量,β1、β2、...、βp是回歸系數,β0是回歸常數。對于一個實際問題,如果我們獲得n組觀測數據(xi1,xi2,...,xip;y)(i = 1,2,...,n),則我們可以把這n組觀測數據寫成矩陣形式y=Xβ+ε。

在求出了回歸方程之后,我們往往還要對回歸方程進行顯著性檢驗。這里的顯著性檢驗主要包括三部分。第一個是F檢驗,也就是檢驗自變量x1、x2、...、xp從整體上對y是否有明顯的影響,主要用到(2)、(3)、(4)式,其中(2)和(3)式是一個式子,不過是用不同符號表示;第二個是t檢驗,是對每個自變量進行顯著性檢驗,就是看每個自變量是否對y有顯著性影響,這和前面從整體上檢驗還是有區別的;第三個是擬合優度,也就是R2,其取值在0到1之間,越接近1,表明回歸擬合的效果越好,越接近于0,則效果越差,但R只能直觀反映擬合的效果,不能代替F檢驗作為嚴格的顯著性檢驗。

上面是多元線性回歸的一個簡單介紹,其詳細原理內容較多,有興趣的讀者可以去查閱一下相關文獻,這里不再贅述,只重點講解如何用python進行分析。下面我們還是用代碼來展示一下多元線性回歸的分析過程。

這里我們用到的數據來源于2013年《中國統計年鑒》,數據以居民的消費性支出為因變量y,其他9個變量為自變量,其中x1是居民的食品花費,x2是衣著花費,x3是居住花費,x4是醫療保健花費,x5是文教娛樂花費,x6是職工平均工資,x7是地區的人均GDP,x8是地區的消費價格指數,x9是地區的失業率。在這所有變量里面,x1至x7以及y的單位是元,x9是百分數,x8沒有單位,因為其是消費價格指數。數據的總體大小為31x10,即31行、10列,大體內容如圖2所示。

圖2. 數據集部分內容

首先還是導入需要的庫。 

  1. import numpy as np  
  2. import pandas as pd  
  3. import statsmodels.api as sm 

接下來是數據預處理,因為原數據的列標太長,我們要處理一下,去除其中的中文,只留下英文名稱。 

  1. file = r'C:\Users\data.xlsx'  
  2. data = pd.read_excel(file)  
  3. data.columns = ['y', 'x1', 'x2', 'x3', 'x4', 'x5', 'x6', 'x7', 'x8', 'x9'] 

然后我們就開始生成多元線性模型,代碼如下。 

  1. x = sm.add_constant(data.iloc[:,1:]) #生成自變量  
  2. y = data['y'] #生成因變量  
  3. model = sm.OLS(y, x) #生成模型  
  4. result = model.fit() #模型擬合  
  5. result.summary() #模型描述 

很明顯,這里的自變量是指x1到x9這9個自變量,代碼data.iloc[:,1:]就是去掉原數據中第一列,也就是y那一列的數據,result.summary()則是生成一份結果描述,其內容如圖3所示。

圖3. 包含所有自變量的回歸結果

在這個結果中,我們主要看“coef”、“t”和“P>|t|”這三列。coef就是前面說過的回歸系數,const這個值就是回歸常數,所以我們得到的這個回歸模型就是y = 320.640948 + 1.316588 x1 + 1.649859 x2 + 2.17866 x3 - 0.005609 x4 + 1.684283 x5 + 0.01032 x6 + 0.003655 x7 -19.130576 x8 + 50.515575 x9。而“t”和“P>|t|”這兩列是等價的,使用時選擇其中一個就行,其主要用來判斷每個自變量和y的線性顯著關系,后面我們會講到。從圖中還可以看出,Prob (F-statistic)為4.21e-20,這個值就是我們常用的P值,其接近于零,說明我們的多元線性方程是顯著的,也就是y與x1、x2、...、x9有著顯著的線性關系,而R-squared是0.992,也說明這個線性關系比較顯著。理論上,這個多元線性方程已經求出來了,而且效果還不錯,我們就可以用其進行預測了,但這里我們還是要進行更深一步的探討。前面說過,y與x1、x2、...、x9有著顯著的線性關系,這里要注意x1到x9這9個變量被看作是一個整體,y與這個整體有顯著的線性關系,但不代表y與其中的每個自變量都有顯著的線性關系,我們在這里要找出那些與y的線性關系不顯著的自變量,然后把它們剔除,只留下關系顯著的,這就是前面說過的t檢驗,t檢驗的原理內容有些復雜,有興趣的讀者可以自行查閱資料,這里不再贅述。我們可以通過圖3中“P>|t|”這一列來判斷,這一列中我們可以選定一個閾值,比如統計學常用的就是0.05、0.02或0.01,這里我們就用0.05,凡是P>|t|這列中數值大于0.05的自變量,我們都把它剔除掉,這些就是和y線性關系不顯著的自變量,所以都舍去,請注意這里指的自變量是x1到x9,不包括圖3中const這個值。但是這里有一個原則,就是一次只能剔除一個,剔除的這個往往是P值最大的那個,比如圖3中P值最大的是x4,那么就把它剔除掉,然后再用剩下的x1、x2、x3、x5、x6、x7、x8、x9來重復上述建模過程,再找出P值最大的那個自變量,把它剔除,如此重復這個過程,直到所有P值都小于等于0.05,剩下的這些自變量就是我們需要的自變量,這些自變量和y的線性關系都比較顯著,我們要用這些自變量來進行建模。

我們可以將上述過程寫成一個函數,命名為looper,代碼如下。 

  1. def looper(limit):  
  2.     cols = ['x1', 'x2', 'x3', 'x5', 'x6', 'x7', 'x8', 'x9']  
  3.     for i in range(len(cols)):  
  4.         datadata1 = data[cols]  
  5.         x = sm.add_constant(data1) #生成自變量  
  6.         y = data['y'] #生成因變量  
  7.         model = sm.OLS(y, x) #生成模型  
  8.         result = model.fit() #模型擬合  
  9.         pvalues = result.pvalues #得到結果中所有P值  
  10.         pvalues.drop('const',inplace=True) #把const取得  
  11.         pmax = max(pvalues) #選出最大的P值  
  12.         if pmax>limit:  
  13.             ind = pvalues.idxmax() #找出最大P值的index  
  14.             cols.remove(ind) #把這個index從cols中刪除  
  15.         else:  
  16.             return result  
  17. result = looper(0.05)  
  18. result.summary() 

其結果如圖4所示。從結果中可以看到最后剩下的有效變量為x1、x2、x3和x5,我們得到的多元線性模型為y = -1694.6269 + 1.3642 x1 + 1.7679 x2 + 2.2894 x3 + 1.7424 x5,這個就是我們最終要用到的有效的多元線性模型。

圖4. 剔除無效變量后的回歸模型

那么問題來了,前面我們得到的包含所有自變量的多元線性模型和這個剔除部分變量的模型,我們要選擇哪一個,畢竟第一個模型的整體線性效果也挺顯著,依據筆者的經驗,這個還是要看具體的項目要求。因為我們實際項目中遇到的問題都是現實生活中真實存在的例子,不再是單純的數學題了,比如本例中的x8消費價格指數和x9地區的失業率,這兩個肯定對y是有一定影響的,如果盲目剔除,可能會對最終的結果產生不良影響,所以我們還是要根據實際需求來做決定。

最后還有一個問題要討論一下,就是本例中沒有對原始數據進行數據標準化。那么我們在數據分析中是否要對原始數據進行標準化?

這個也是要視情況而定。像本例中這些數據都是帶有具體的量綱和單位,那么就不要對其進行標準化,我們得到的這個線性回歸模型是在原始變量基礎上進行擬合所得的結果,這個式子是包含物理單位的,說白了它們都是有一定實際意義的。在這種情況下,我們輸入特定的自變量的值,即可得到相應的y值,預測效果直截了當,這是采取原始數據進行線性擬合的好處。

如果我們對原始數據采取了標準化處理,情況就不同了。標準化處理后自變量、因變量的物理單位沒有了,我們拿此時的模型做預測時就會十分麻煩,要對新的自變量取值進行標準化,得到的y還是一個標準化后的數據,一眼看不到它的實際大小和物理意義。當然有些純數學問題,其變量沒有單位,這時候可以對其進行標準化,這會有利于對問題的分析。所以這個還是要視情況而定。 

 

責任編輯:龐桂玉 來源: Python中文社區
相關推薦

2020-12-20 20:31:56

Python機器學習多元線性回歸

2020-11-10 08:37:05

Python線性回歸機器學習

2020-07-23 09:15:25

Python機器學習聚類分析

2020-10-10 12:53:57

邏輯回歸機器學習分析

2019-10-11 08:46:45

Python數據Numpy

2025-04-27 04:02:00

機器學習模型網絡

2023-11-10 15:47:06

線性回歸內核技巧

2021-01-20 08:30:00

數據分析機器學習IT

2018-03-09 10:37:48

詩歌代碼寫詩

2021-07-21 16:16:40

PythonNLTK編程語言

2022-09-08 09:39:03

PythonOCR代碼

2018-09-04 11:45:31

前端JavaScriptNodeJS

2022-05-25 07:11:13

Python人臉識別代碼

2018-04-24 10:45:00

Python人工智能圖像識別

2018-01-10 17:06:36

Python線性回歸數據

2024-03-01 07:26:49

RustPolars機器學習

2020-05-14 10:00:06

Python數據技術

2018-04-26 08:40:33

線性回歸算法機器學習

2017-12-05 16:26:36

爬蟲大數據共享單車

2018-05-14 10:43:53

平衡數據數據分析Python
點贊
收藏

51CTO技術棧公眾號

噜噜噜躁狠狠躁狠狠精品视频 | 亚洲免费伊人电影| 91视频九色网站| 青青草手机视频在线观看| 精品亚洲免a| 欧美色爱综合网| 大荫蒂性生交片| 国产在线视频福利| 福利一区福利二区| 国产成人精品一区| 国产美女免费网站| 日韩欧美少妇| 亚洲图片欧美色图| 色一情一乱一伦一区二区三区 | 亚洲国产黄色片| 免费极品av一视觉盛宴| 国内精品一区视频| 懂色av一区二区三区免费观看| 欧洲中文字幕国产精品| 人妻少妇精品一区二区三区| 免费久久精品| 精品国产网站在线观看| 亚洲成人天堂网| 色是在线视频| 亚洲制服丝袜av| 亚洲视频在线二区| 青青草免费观看免费视频在线| 激情都市一区二区| 国产精品成人免费视频| 日本最新中文字幕| 综合在线一区| 一区二区在线视频| 漂亮人妻被黑人久久精品| 精品国产亚洲日本| 欧美日韩mp4| 国产精品亚洲二区在线观看| cao在线视频| 一区二区三区日韩在线观看| 中文字幕一区二区三区四区五区六区| 欧美性孕妇孕交| 成人免费观看av| 成人区精品一区二区| 91在线公开视频| 另类小说综合欧美亚洲| 国产精品wwwwww| 麻豆精品久久久久久久99蜜桃| 欧美88av| 欧美第一页在线| 成年人av电影| 欧美日韩1区2区3区| 久久久av一区| 香蕉成人在线视频| 区一区二视频| 中文字幕久热精品视频在线| 中日韩精品一区二区三区| 欧美激情网址| 日韩av在线网| 动漫精品一区二区三区| 网友自拍一区| 亚洲日本中文字幕| 法国空姐电影在线观看| 精品久久久久中文字幕小说| 亚洲欧洲高清在线| 国产亚洲精品熟女国产成人| 精品久久电影| 久久精品青青大伊人av| 99久久精品久久亚洲精品| 欧美成免费一区二区视频| 中文综合在线观看| 一级片一级片一级片| 亚洲精品午夜av福利久久蜜桃| 久久精品最新地址| 欧美人妻精品一区二区三区| 欧美aⅴ99久久黑人专区| 欧美高清视频在线| 国产无码精品在线观看| 国产日韩亚洲| 国产精品久久久久免费a∨| 中文字幕+乱码+中文| 激情欧美一区二区| 国产私拍一区| 电影在线一区| 亚洲欧美电影一区二区| 人妻av无码专区| 丁香六月综合| 欧美日韩三级一区二区| 女人扒开双腿让男人捅| 神马久久av| 丝袜美腿精品国产二区| 国产女人18水真多毛片18精品 | 国产成人亚洲精品无码h在线| 毛片免费看不卡网站| 欧美日韩成人综合| 艳妇乳肉亭妇荡乳av| 精品国产91| 欧美老少做受xxxx高潮| 亚洲天堂一区在线| 韩国v欧美v日本v亚洲v| 久久精品二区| av在线网址观看| 欧美性色视频在线| 男人女人拔萝卜视频| 欧美电影在线观看完整版| 色噜噜久久综合伊人一本| 久久国产在线视频| 免费观看在线色综合| 不卡视频一区| 亚洲1卡2卡3卡4卡乱码精品| 午夜天堂影视香蕉久久| 手机看片一级片| 日韩激情毛片| 欧美日韩福利视频| 中国一级片黄色一级片黄| 成人少妇影院yyyy| 小说区视频区图片区| jizz内谢中国亚洲jizz| 日韩欧美国产午夜精品| 国产三级在线观看完整版| 一区二区国产在线观看| 96sao精品视频在线观看| 撸视在线观看免费视频| 亚洲第一狼人社区| 亚洲热在线视频| 日韩精品首页| 国产成人久久精品| 香蕉视频国产在线| 亚洲一区二区三区四区在线免费观看 | av片在线免费观看| 欧美三级欧美成人高清www| 日本wwwwwww| 亚洲欧洲美洲一区二区三区| 国产精品久久婷婷六月丁香| 欧美一区二区视频| 午夜欧美视频在线观看| 中国男女全黄大片| 欧美阿v一级看视频| 91久久精品美女高潮| 成人av电影观看| 欧亚一区二区三区| 国产精品一二三区在线观看| 亚洲永久视频| 久久久99爱| 蜜桃av在线播放| 日韩第一页在线| 欧美一区二区三区四| 成av人片一区二区| 日本日本19xxxⅹhd乱影响| 丁香5月婷婷久久| 久久久久久com| 成人久久精品人妻一区二区三区| 亚洲精品视频免费观看| 伊人免费视频二| 你懂的网址国产 欧美| 91久久精品一区| 91网址在线观看| 日韩欧美国产高清| 国产网站在线看| 91天堂素人约啪| 老司机午夜av| 999成人精品视频线3| 亚洲www在线| 国模雨婷捆绑高清在线| 亚洲国产精品999| 亚洲第一精品在线观看| 国产欧美一区二区精品性| 干日本少妇首页| 欧美五码在线| 国产99在线|中文| 日本蜜桃在线观看| 欧美成人女星排名| 国产情侣自拍av| 久久久不卡网国产精品一区| 亚洲一级片网站| 一区二区三区在线| 国产精品9999久久久久仙踪林| 成人国产电影在线观看| 亚洲性av在线| av中文在线观看| 黄色成人av网| 极品久久久久久久| 国产精品一品视频| 每日在线更新av| 日韩欧美精品一区| 国产高清在线一区二区| 六月婷婷综合| 精品自拍视频在线观看| 亚洲AV第二区国产精品| 欧美日韩在线免费视频| 国产一级在线播放| 欧美激情一区二区三区不卡| 韩国一区二区在线播放| 香蕉久久国产| 蜜桃视频一区二区在线观看| 图片婷婷一区| 99久久免费国| 色综合一本到久久亚洲91| 久久99国产精品自在自在app| 涩涩视频在线观看免费| 欧美一区二区视频在线观看 | 国产精品亚洲一区| 欧美xnxx| 久久久久久有精品国产| 尤物在线视频| 日韩精品视频在线观看网址| 国产精品一二三四五区| 精品国产户外野外| 黑人巨大精品一区二区在线| 国产校园另类小说区| 性久久久久久久久久久久久久| 亚洲免费婷婷| 成人免费a级片| 色综合蜜月久久综合网| 久久精品aaaaaa毛片| 日韩精品成人在线观看| 国产精品久久电影观看| 一级毛片久久久| 欧美激情网友自拍| 国产原创精品视频| 中文字幕久久精品| 国产在线资源| 日韩不卡在线观看| 好吊视频一二三区| 日韩一区二区三区在线观看| 中文字幕91爱爱| 在线免费精品视频| 欧美性猛交bbbbb精品| 亚洲高清免费视频| 麻豆视频在线观看| 一区二区三区四区乱视频| 欧美88888| 国产欧美日韩激情| caopeng视频| 91在线国产观看| v天堂中文在线| 成人av在线一区二区| 韩国三级在线看| 国产成人亚洲综合a∨婷婷| 色网站在线视频| 精品在线播放午夜| 五月天开心婷婷| 麻豆国产精品官网| 久久亚洲欧美国产精品乐播 | 粉嫩精品久久99综合一区| 91视频你懂的| 99久久久久久久久久| 91在线视频网址| 亚洲av无码国产精品久久| 97精品久久久午夜一区二区三区| 在线视频 日韩| av网站免费线看精品| 日本黄色动态图| 91麻豆精品秘密| 国产又爽又黄无码无遮挡在线观看| eeuss鲁片一区二区三区在线观看 eeuss影院一区二区三区 | 日韩在线视频线视频免费网站| 无码精品黑人一区二区三区| 日韩三级在线观看| 在线精品免费视| 91成人国产精品| 亚洲怡红院av| 日韩亚洲欧美一区二区三区| 俄罗斯嫩小性bbwbbw| 亚洲国产精品专区久久| 欧美色视频免费| 伊人av综合网| 黄色成年人视频在线观看| 免费91麻豆精品国产自产在线观看| 日本在线观看大片免费视频| 午夜精品国产精品大乳美女| 成人亚洲欧美| 91精品久久久久久久久中文字幕| 国产精品免费精品自在线观看| 官网99热精品| 少妇精品久久久一区二区| 中文字幕欧美人与畜| 好吊一区二区三区| 波多野结衣50连登视频| 麻豆视频一区二区| 中文字幕在线观看91| 久久在线观看免费| 日本黄色录像视频| 亚洲成人免费av| 亚洲男人天堂网址| 日韩欧美国产一区二区三区| 三级毛片在线免费看| 久久精品中文字幕免费mv| 超碰资源在线| 成人免费视频网址| 日本精品影院| www.黄色网址.com| 国产亚洲毛片在线| 亚洲欧美手机在线| 久久婷婷综合激情| 精品国产精品国产精品| 福利视频第一区| 国产人妖一区二区| 亚洲三级免费看| 七七成人影院| 国产精品九九久久久久久久| 国产精品毛片久久久| 亚洲欧美日韩精品久久| 网站免费在线观看| 亚洲国产电影在线观看| 国产大片aaa| 91精品免费观看| 久久av少妇| 国产亚洲福利一区| 日本高清视频网站| 爽爽爽爽爽爽爽成人免费观看| 岛国片av在线| 91美女福利视频高清| 国产一区二区精品福利地址| 久久av综合网| 高h震动喷水双性1v1| 精品欧美一区二区三区精品久久| 五月婷婷丁香网| 九色精品免费永久在线| 色戒汤唯在线观看| 成人av免费看| 免费看成人哺乳视频网站| 日韩a级在线观看| 国产成人免费网站| 强迫凌虐淫辱の牝奴在线观看| 亚洲欧洲美洲综合色网| 国产无码精品视频| 日韩精品一区在线| av大大超碰在线| 国产精品久久久久久av| 亚州综合一区| 一二三四视频社区在线| 国产成+人+日韩+欧美+亚洲| 免费精品在线视频| 91黄色免费看| 毛片在线播放网址| 国产成人精品一区二区在线| 少妇高潮一区二区三区| 国产中文字幕在线免费观看| jlzzjlzz亚洲日本少妇| 精品视频久久久久| 日韩午夜激情视频| 18在线观看的| 99精品在线直播| 一区二区电影在线观看| 欧美专区第二页| 亚洲人精品一区| 99在线无码精品入口| 久久精品中文字幕免费mv| 成人在线视频区| 国产又粗又大又爽的视频| 国产精品77777竹菊影视小说| 欧美第一页在线观看| 欧美一区二区视频在线观看2022| 91精品国产91久久久久久青草| 97超碰资源| 亚洲精品乱码久久久久久蜜桃麻豆| 中文字幕一区二区三区乱码不卡| 午夜在线成人av| 久久精品蜜桃| 国产精品一区二区性色av| **女人18毛片一区二区| 国产精品19p| 精品久久在线播放| 国内精品一区视频| 成人精品一区二区三区电影黑人| 亚洲情侣在线| 久久人妻一区二区| 91国产成人在线| 麻豆免费在线视频| 国产成人精品免费视频大全最热| 99精品免费网| 免费在线观看a视频| 欧美美女黄视频| 黑人极品ⅴideos精品欧美棵| 久久久久久国产精品一区| 免费在线欧美视频| 免费在线黄色片| 亚洲精品网址在线观看| 色狠狠一区二区三区| 日韩精品在线观看av| 久久久99精品久久| 国产深喉视频一区二区| 2019亚洲日韩新视频| 日韩欧美视频| 亚洲国产果冻传媒av在线观看| 成人福利片在线| 国产精品一二三在线| 国产综合婷婷| 欧美成人另类视频| 精品久久一区二区| 日韩av一级| 日本中文字幕在线视频观看| 日本一区二区三区视频视频| www.色视频| 国产精品久久电影观看| 韩日成人av| 一本色道久久88| 国产丝袜精品视频| 国产精品一区二区三区av| 97视频在线免费播放| 一区二区三区日韩精品视频|