精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

一個資深數據人對數據挖掘解讀

大數據 數據分析
在銀行做了兩年的數據分析和挖掘工作,較少接觸互聯網的應用場景,因此,一直都在思考一個問題,“互聯網和金融,在數據挖掘上,究竟存在什么樣的區別”。在對這個問題的摸索和理解過程中,發現數據挖掘本身包含很多層次。并且模型本身也是存在傳統和時髦之分的。本文就想聊聊這些話題。

在銀行做了兩年的數據分析和挖掘工作,較少接觸互聯網的應用場景,因此,一直都在思考一個問題,“互聯網和金融,在數據挖掘上,究竟存在什么樣的區別”。在對這個問題的摸索和理解過程中,發現數據挖掘本身包含很多層次。并且模型本身也是存在傳統和時髦之分的。本文就想聊聊這些話題。

[[184258]]

一、數據挖掘的層次

一直想整理下對數據挖掘不同層次的理解,這也是這兩年多的時間里面,和很多金融領域、互聯網做數據相關工作的小伙伴,聊天交流的一些整理和歸納。大概可以分為四類。

大數據

(一)純粹的數據加工

側重于變量加工和預處理,從源系統或數據倉庫,對相關數據進行提取、加工、衍生處理,生成各種業務表。然后,以客戶號為主鍵,把這些業務表整合匯總,最終可以拉出一張大寬表,這張寬表就可以稱之為“客戶畫像”。即,有關客戶的很多變量和特征的集合。

在這個階段,主要的數據加工工具為SQL和SAS base。

(二)傻瓜式的挖掘工具

較為典型的就是SAS EM和clementine,里面嵌入很多較為傳統成熟的算法、模塊和節點(例如邏輯回歸、決策樹、SVM、神經網絡、KNN、聚類等)。通過鼠標的托拉拽,流程式的節點,基本上就可以實現你挖掘數據的需求。

傻瓜式操作的優點就是使得數據挖掘,入手非常快,較為簡單。但是,也存在一些缺陷,即,使得這個挖掘過程變得有點單調和無趣。沒辦法批量運算模型,也沒辦法開發一些個性化的算法和應用。用的比較熟練,并且想要進一步提升的時候,建議把這兩者拋棄。

(三)較為自由的挖掘工具

較為典型的就是R語言和Python。這兩個挖掘工具是開源的,前者是統計學家開發的,后者是計算機學家開發的。

一方面,可以有很多成熟的、前沿的算法包調用,另外一方面,還可以根據自己的需求,對既有的算法包進行修改調整,適應自己的分析需求,較為靈活。此外,Python在文本、非結構化數據、社會網絡方面的處理,功能比較強大。

(四)算法拆解和自行開發

一般會利用python、c、c++,自己重新編寫算法代碼。例如,通過自己的代碼實現邏輯回歸運算過程。甚至,根據自己的業務需求和數據特點,更改其中一些假定和條件,以便提高模型運算的擬合效果。尤其,在生產系統上,通過C編寫的代碼,運行速度比較快,較易部署,能夠滿足實時的運算需求。

一般來說,從互聯網的招聘和對技能的需求來說,一般JD里面要求了前三種,這樣的職位會被稱為“建模分析師”。但是如果增加上了***一條,這樣的職位或許就改稱為“算法工程師”。

二、模型的理解:傳統的和時髦的

據理解,模型應該包括兩種類型。一類是傳統的較為成熟的模型,另外一類是較為時髦有趣的模型。對于后者,大家會表現出更多的興趣,一般是代表著新技術、新方法和新思路。

(一)傳統的模型

傳統的模型,主要就是為了解決分類(例如決策樹、神經網絡、邏輯回歸等)、預測(例如回歸分析、時間序列等)、聚類(kmeans、系譜、密度聚類等)、關聯(無序關聯和有序關聯)這四類問題。這些都是較為常規和經典的。

(二)時髦有趣的模型

比較有趣、前沿的模型,大概包括以下幾種類型,即社會網絡分析、文本分析、基于位置的服務(Location-Based Service,LBS)、數據可視化等。

它們之所以比較時髦,可能的原因是,采用比較新穎前沿的分析技術(社會網絡、文本分析),非常貼近實際的應用(LBS),或者是能夠帶來更好的客戶體驗(數據可視化)。

大數據

(1)社會網絡的應用

傳統的模型將客戶視為單一個體,忽視客戶之間的關系,基于客戶的特征建立模型。社會網絡是基于群體的,側重研究客戶之間的關聯,通過網絡、中心度、聯系強度、密度,得到一些非常有趣的結果。典型的應用,例如,關鍵客戶的識別、新產品的滲透和擴散、微博的傳播、風險的傳染、保險或信用卡網絡團伙欺詐、基于社會網絡的推薦引擎開發等。

[[184260]]

(2)文本挖掘的應用

文本作為非結構化數據,加工分析存在一定的難度,包括如何分詞、如何判斷多義詞、如何判斷詞性,如何判斷情緒的強烈程度。典型的應用,包括搜索引擎智能匹配、通過投訴文本判斷客戶情緒、通過輿情監控品牌聲譽、通過涉訴文本判定企業經營風險、通過網絡爬蟲抓取產品評論、詞云展示等。

大數據

文本和濕人。關于文本分析,最近朋友圈有篇分享,很有意思,號稱可以讓你瞬間變成濕人。原理很簡單,就是先把《全宋詞》分詞,然后統計頻數前100的詞語。然后你可以隨機湊6個數(1-100),這樣就可以拼湊出兩句詩。比如,隨機寫兩組數字,(2,37,66)和(57,88,33),對應的詞語為(東風、無人、黃花)和(憔悴、今夜、風月)。組成兩句詩,即“東風無人黃花落,憔悴今夜風月明”。還真像那么一回事,有興趣可以玩一玩。

(3)LBS應用

即基于位置的服務,即如何把服務和用戶的地理位置結合。當下的APP應用,如果不能很好地和地理位置結合,很多時候很難有旺盛的生命力。典型的APP,例如大眾點評(餐飲位置)、百度地圖(位置和路徑)、滴滴打車、微信位置共享、時光網(電影院位置)等服務。此外,銀行其實也在研究,如何把線上客戶推送到距離客戶最近的網點,完成O2O的***對接,從而帶來更好的客戶體驗。

[[184261]]

(4)可視化應用

基于地圖的一些可視化分析,比較熱門,例如,春節人口遷徙圖、微信活躍地圖、人流熱力圖、擁堵數據的可視化、社會網絡擴散可視化等。

如果你想讓你的分析和挖掘比較吸引眼球,請盡量往以上四個方面靠攏。

三、互聯網和金融數據挖掘的差異

博士后兩年,對銀行領域的數據挖掘有些基本的了解和認識,但是面對浩瀚的數據領域,也只能算剛剛入門。很多時候,會很好奇互聯網領域,做數據挖掘究竟是什么樣的形態。

很早之前,就曾在知乎上提了個問題,“金融領域的數據挖掘和互聯網中的數據挖掘,究竟有什么的差異和不同”。這個問題掛了幾個月,雖有寥寥的回答,但是沒有得到想要的答案。

既然沒人能夠提供想要的答案,那就,根據自己的理解、一些場合的碰壁、以及和一些互聯網數據小伙伴的接觸,試圖歸納和回答下。應該有以下幾個方面的差異。

大數據

(一)“分析”和“算法”

在互聯網中,“分析”和“算法”,分得非常開,對應著“數據分析師”和“算法工程師”兩種角色。前者更多側重數據提取、加工、處理、運用成熟的算法包,開發模型,探索數據中的模式和規律。后者更多的是,自己寫算法代碼,通過C或python部署到生產系統,實時運算和應用。

在銀行領域,基本上,只能看到***種角色。數據基本上來源于倉庫系統,然后運用SQL、SAS、R,提取、加工、建模和分析。

(二)數據類型

數據類型,主要包括“結構化”和“非結構化”兩類數據。前者就是傳統的二維表結構。一行一條記錄,一列一個變量。后者包括文本、圖像、音頻、視頻等。

銀行里面的數據,更多的是結構化數據,也有少量的非結構化數據(投訴文本、貸款審批文本等)。業務部門對非結構化數據的分析需求比較少。因此,在非結構化數據的分析建模方面,稍顯不足。

互聯網,更多的是網絡日志數據,以文本等非結構化數據為主,然后通過一定的工具將非結構化數據轉變為結構化數據,進一步加工和分析。

(三)工具、存儲和架構

互聯網,基本上是免費導向,所以常常選擇開源的工具,例如MySql、R、Python等。常常是基于hadoop的分布式數據采集、加工、存儲和分析。

商業銀行一般基于成熟的數據倉庫,例如TD,以及一些成熟的數據挖掘工具,SAS EG和EM。

(四)應用場景

在應用場景上,兩者之間也存在著非常大的差異。

(1)金融領域

金融領域的數據挖掘,不同的細分行業(如銀行和證券),也是存在差別的。

銀行領域的統計建模。銀行內的數據挖掘,較為側重統計建模,數據分析對象主要為截面數據,一般包括客戶智能(CI)、運營智能(OI)和風險智能(RI)。開發的模型以離線為主,少量模型,例如反欺詐、申請評分,對實時性的要求比較高。

證券領域的量化分析。證券行業的挖掘工作,更加側重量化分析,分析對象更多的是時間序列數據,旨在從大盤指數、波動特點、歷史數據中發現趨勢和機會,進行短期的套利操作。量化分析的實時性要求也比較高,可能是離線運算模型,但是在交易系統部署后,實時運算,捕捉交易事件和交易機會。

(2)互聯網

互聯網的實時計算。互聯網的應用場景,例如推薦引擎、搜索引擎、廣告優化、文本挖掘(NLP)、反欺詐分析等,很多時候需要將模型部署在生產系統,對實時響應要求比較高,需要保證比較好的客戶體驗。

四、數據挖掘在金融領域的典型應用

別人常常會問,在銀行里面,數據挖掘究竟是做什么的。也常常在思考如何從對方的角度回答這個問題。舉幾個常見的例子做個詮釋。

(一)信用評分

申請評分。當你申請信用卡、消費貸款、經營貸款時,銀行是否會審批通過,發放多大規模的額度?這個判斷很可能就是申請評分模型運算的結果。通過模型計算你的還款能力和還款意愿,綜合評定放款額度和利率水平。

行為評分。當你信用卡使用一段時間后,銀行會根據你的刷卡行為和還款記錄,通過行為評分模型,判斷是否給你調整固定額度。

(二)個性化產品推薦

很多時候,你可能會收到銀行推送的短信或者接到銀行坐席的外呼,比如,向你推薦某款理財產品。這背后,很可能就是產品響應模型運算的結果。銀行會通過模型,計算你購買某款理財產品的概率,如果概率比價高的話,就會向你推送這款理財產品。

此外,很多時候,不同的客戶,銀行會個性化的推薦不同的產品,很可能就是產品關聯分析模型運算的結果。

(三)個性化廣告展示

登陸商業銀行網站時,通常會有一個廣告banner,banner上會展示若干幅廣告。很多時候,不同的客戶登陸網站,會接觸到不同的廣告,即個性化的廣告推送。一般來說,后臺經過計算,會判斷,你對哪幾款廣告和產品感興趣,***推送3-5款你最感興趣的產品,從而能夠有效吸引你的注意,促進點擊、轉化和成交。

責任編輯:張燕妮 來源: 36大數據
相關推薦

2011-12-26 09:56:57

數據中心服務器宕機

2014-10-08 11:26:14

2012-11-30 11:12:03

2014-08-15 10:29:18

數據挖掘人生選擇

2015-09-24 14:12:34

醫療大數據數據化

2016-08-28 12:31:22

2020-11-25 08:00:00

數據分析人工智能技術

2019-01-08 11:00:22

華為

2025-04-29 09:26:34

Orange交互式數據挖掘機器學習

2016-10-17 16:19:43

數據挖掘問題

2020-07-28 07:55:33

Python開發工具

2022-05-26 10:42:30

數據權限注解

2016-10-28 12:48:23

R語言Python數據分析

2022-06-06 16:49:49

物聯網產業鏈

2015-09-07 13:38:41

數據分析

2011-04-11 10:42:50

Access 2007

2013-03-08 02:52:03

個人開發項目糾錯

2020-02-03 14:44:28

數據數據發展數字業務

2018-10-25 14:47:53

分析消費數據挖掘

2012-06-27 09:45:41

ibmdw
點贊
收藏

51CTO技術棧公眾號

香港成人在线视频| 国产高清一区日本| 三级精品视频久久久久| 久久久久久久高清| 青草视频在线免费直播| 不卡区在线中文字幕| 欧美中文字幕在线观看| 免费看的黄色录像| 91成人精品在线| 欧美日韩国产中文精品字幕自在自线 | 手机在线看片日韩| 欧美大片免费高清观看| 专区另类欧美日韩| 国产一区不卡在线观看| 中文亚洲av片在线观看| 欧美伊人久久| 亚洲天堂影视av| 免费观看黄网站| 日本欧美日韩| 亚洲国产欧美在线人成| 天天人人精品| www.五月婷婷| 奇米影视一区二区三区| 91国自产精品中文字幕亚洲| 2017亚洲天堂| 妖精视频一区二区三区免费观看| 欧美三级电影精品| 免费毛片小视频| 麻豆网站在线看| 久久久精品黄色| 国产精品免费一区二区三区| 一区不卡在线观看| 日韩一区欧美二区| 97国产精品视频| 亚洲图片第一页| 宅男在线一区| 亚洲精品久久久久久久久久久久久 | 插我舔内射18免费视频| 国产精品一站二站| 欧美日韩成人综合在线一区二区| 黄色动漫网站入口| av资源在线播放| 亚洲精品五月天| 一区二区三区国产福利| 电影av在线| 国产亚洲欧洲一区高清在线观看| 国产一区二区在线网站| 精品人妻无码一区二区色欲产成人| 麻豆成人免费电影| 国产国语刺激对白av不卡| 特级西西444www大精品视频免费看| 韩日在线一区| 欧美激情一级二级| 国产性70yerg老太| 国产精品a久久久久| 伊人久久免费视频| 大胸美女被爆操| heyzo久久| 中文字幕精品一区久久久久| av网在线播放| 成人网18免费网站| 一本色道久久88亚洲综合88| 高清国产在线观看| 成人看的羞羞网站| 久久手机精品视频| 老女人性淫交视频| 精品成人免费| 欧美在线观看网址综合| av网站中文字幕| 日韩av一级片| 国产欧美一区二区三区视频 | 亚洲精品日本| 97视频在线观看免费高清完整版在线观看 | 久久久久久久久久久久av| 动漫精品一区一码二码三码四码| 亚洲激情国产| 日本欧美黄网站| 中文字幕激情视频| 国产剧情一区二区| 不卡日韩av| 亚洲人成色777777精品音频| 久久精品亚洲精品国产欧美kt∨| 亚洲国产精品一区二区第一页| 日本视频不卡| 亚洲精选一二三| 免费av观看网址| 户外露出一区二区三区| 4438x成人网最大色成网站| 欧美图片自拍偷拍| 一本久久青青| 久久国产精品电影| 日韩免费观看一区二区| 人人狠狠综合久久亚洲| 亚洲字幕在线观看| 日本一二三区在线视频| 中文字幕一区二区日韩精品绯色| 国产高清免费在线| 欧美男人天堂| 欧美一区二区三区四区视频| 中文乱码人妻一区二区三区视频| 日韩极品一区| 久久乐国产精品| 中文在线免费观看| 成人av手机在线观看| 日本不卡在线观看| 18+激情视频在线| 色噜噜偷拍精品综合在线| 在线视频日韩欧美| 九九热爱视频精品视频| 久久69精品久久久久久国产越南| 日韩精品一区二区亚洲av观看| 国产九九视频一区二区三区| 欧美一区1区三区3区公司| 在线三级电影| 欧美日韩免费在线视频| 亚洲国产果冻传媒av在线观看| 午夜精品毛片| 国产成人免费av电影| 丰满人妻一区二区三区四区53 | 91 在线视频| 久久xxxx| 精品久久久久久一区| av网站导航在线观看免费| 在线视频综合导航| 国产肉体xxxx裸体784大胆| 欧美国产三级| 成人免费高清完整版在线观看| 青青草在线播放| 亚洲第一主播视频| 杨幂一区二区国产精品| 水蜜桃精品av一区二区| 国产成人精品久久| 日韩美女一级视频| 欧美午夜激情在线| 国产婷婷在线观看| 欧美午夜影院| 99在线视频首页| 国产视频一区二区| 欧美日韩成人激情| 久久精品国产亚洲AV成人婷婷| 亚洲欧美日本视频在线观看| 国产亚洲福利社区| av影视在线看| 日韩第一页在线| 福利一区二区三区四区| 国产v日产∨综合v精品视频| 久久久天堂国产精品| 91麻豆精品| 日韩在线www| 91午夜交换视频| 亚洲欧洲av另类| 亚洲怡红院在线| 五月天久久久| 91亚洲精华国产精华| a级毛片免费观看在线| 日韩一区二区三区四区| 欧美人与禽zozzo禽性配| 国产成人一区在线| 亚洲精品国产suv一区88| 国产精品中文| 高清亚洲成在人网站天堂| 六月丁香色婷婷| 五月天久久比比资源色| 我和岳m愉情xxxⅹ视频| 久久久亚洲人| 亚洲欧美综合一区| 精品视频成人| 久久免费精品日本久久中文字幕| 神马午夜精品95| 欧美日韩综合视频网址| www.av天天| 国内精品伊人久久久久av影院| 自拍另类欧美| 凹凸成人在线| 日本午夜精品理论片a级appf发布| 成人在线高清视频| 制服丝袜在线91| 国产极品在线播放| 久久久99精品免费观看| 中文字幕av专区| 欧美日韩精选| 欧美日韩精品久久久免费观看| www.国产精品| 萌白酱国产一区二区| 亚洲欧美日韩动漫| 欧美日韩三级一区| 精品无码一区二区三区电影桃花| 91视频国产资源| www.久久久久久久久久久| 一区在线免费| 日韩欧美第二区在线观看| 精品中文视频| 日本不卡免费高清视频| 91国内在线| 亚洲天堂av在线播放| av免费观看在线| 色伊人久久综合中文字幕| 欧美国产日韩在线观看成人| 91美女片黄在线观看| 国产又黄又猛又粗又爽的视频| 欧美日韩精品一本二本三本| 日韩av电影免费播放| 试看120秒一区二区三区| 日韩av色综合| 欧美人与动牲性行为| 这里只有精品在线观看| 亚洲精品国产精| 欧美日韩一区二区三区在线| 国产精品成人免费一区二区视频| 国产精品视频在线看| 日韩精品一区二区三区高清免费| 久久 天天综合| 国产成人a亚洲精v品无码| 欧美激情亚洲| 一区不卡字幕| 九九久久成人| 黄色国产精品一区二区三区| 电影91久久久| 国产精品视频地址| xxx欧美xxx| 午夜免费久久久久| av色综合久久天堂av色综合在| 一本色道久久综合狠狠躁篇的优点 | 色哟哟一一国产精品| 国产无人区一区二区三区| 影音先锋黄色资源| 成人一级视频在线观看| 图片区乱熟图片区亚洲| 蜜臀精品一区二区三区在线观看| 高清在线观看免费| 最新日韩在线| 美女扒开大腿让男人桶| 午夜欧美视频| 超碰在线免费观看97| 久久神马影院| 视频一区二区三| 成人激情电影在线| 日本一区二区三区精品视频| 天堂成人娱乐在线视频免费播放网站| 成人高清在线观看| 日韩中文字幕| 999视频在线观看| 免费观看在线一区二区三区| 91丨九色丨国产在线| 99久久这里有精品| 91丝袜美腿美女视频网站| 高清精品久久| 亚洲综合色av| 中文无码日韩欧| 国产精品播放| 欧美激情影院| 免费h精品视频在线播放| 亚洲黄页在线观看| 日韩精品一区二区三区色偷偷| 影视先锋久久| 日韩欧美三级电影| 久久国产亚洲精品| 一级一片免费播放| 亚洲第一偷拍| www.一区二区.com| 亚洲欧洲视频| 不卡影院一区二区| 免费观看日韩av| 午夜久久福利视频| 国产成人综合视频| www.555国产精品免费| 99国产精品视频免费观看| 亚洲成人日韩在线| 国产精品区一区二区三区| 免费成人深夜夜行网站| 一区二区高清在线| 91视频免费网址| 欧美视频一区二区三区四区 | 超碰aⅴ人人做人人爽欧美| 热久久免费视频精品| 粉嫩av一区二区三区四区五区 | 久久九九热re6这里有精品 | 日韩成人精品视频在线观看| 国产福利一区二区三区在线视频| 在线免费黄色小视频| gogo大胆日本视频一区| 蜜桃久久精品成人无码av| 亚洲欧洲日产国产综合网| 精品无码人妻一区二区三区品 | 色综合久久88| 亚洲最大网站| 91视频国产高清| 日韩理论电影中文字幕| 亚洲国产精品123| 韩国欧美一区| 少妇一级淫免费播放| 丁香六月久久综合狠狠色| 久久只有这里有精品| 亚洲欧美一区二区在线观看| 欧美一二三区视频| 欧美男男青年gay1069videost| 精品免费久久久| 亚洲性夜色噜噜噜7777| 成人在线观看亚洲| 奇米一区二区三区四区久久| 国产一区二区三区视频在线| 免费看污久久久| 欧美日韩网址| a在线观看免费视频| 99麻豆久久久国产精品免费| 国产男女猛烈无遮挡在线喷水| 欧美日韩中国免费专区在线看| 国产欧美第一页| 一区二区三区四区视频| 岛国av在线播放| 亚洲精品日韩激情在线电影| 狠狠综合久久av一区二区蜜桃| 800av在线免费观看| 美腿丝袜亚洲一区| 中文字幕5566| 亚洲国产成人porn| 国产免费福利视频| 这里精品视频免费| 丁香六月综合| 精品亚洲欧美日韩| 精品电影一区| 91蝌蚪视频在线| 国产精品久久久久影院老司| 久久久久久在线观看| 精品成人一区二区三区四区| 精品国产99久久久久久| 国产精品视频大全| 成久久久网站| 日本美女高潮视频| 91免费看`日韩一区二区| 国产精品7777| 欧美tk丨vk视频| 伊人222成人综合网| 成人午夜在线观看| 日韩理论电影| 国产91色在线观看| 欧美国产日韩精品免费观看| 日本a级c片免费看三区| 精品一区二区三区电影| 免费高潮视频95在线观看网站| 国产精品久久波多野结衣| 欧美国产三区| 美女搡bbb又爽又猛又黄www| 一区二区三区在线视频观看58| 国产又黄又爽视频| 久久精品久久久久电影| 99视频这里有精品| 欧美精品一区二区性色a+v| 久久国产日韩欧美精品| 免费观看特级毛片| 欧美二区三区91| h视频在线免费观看| 18成人免费观看网站下载| 综合久久一区| 欧美久久久久久久久久久| 亚洲h在线观看| 亚洲 美腿 欧美 偷拍| 日产精品久久久一区二区福利| 亚洲电影一级片| 韩国中文字幕av| 亚洲欧洲成人自拍| 不卡视频免费在线观看| 97视频在线观看网址| 香蕉久久99| 手机在线看福利| 中文字幕在线播放不卡一区| 99热这里只有精| 久久久久久久久亚洲| 亚洲精品国产精品粉嫩| 91色国产在线| 亚洲男人的天堂在线观看| 亚洲卡一卡二卡三| 欧美亚洲激情视频| 日韩三级在线| 又大又长粗又爽又黄少妇视频| 性久久久久久久| 成人精品一区二区三区免费| 91视频免费网站| 一本色道精品久久一区二区三区| 亚洲精品成人无码| 91麻豆精品91久久久久同性| 丁香花在线影院| 日本不卡在线播放| 国产精品亚洲第一| 久久99国产综合精品免费| 色综合伊人色综合网站| 9l视频自拍九色9l视频成人| 国产xxxxx在线观看| 亚洲免费高清视频在线| 天天综合网在线| 成人午夜激情网| 亚洲在线黄色| 婷婷久久综合网| 亚洲精品国产综合久久| 国产精品视频一区视频二区 | 青青草成人在线观看| 久久久久久av无码免费网站| 亚洲视频在线观看| 9l视频自拍九色9l视频成人| 爱情岛论坛亚洲首页入口章节|