精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

數(shù)據(jù)挖掘技術(shù)在軌跡數(shù)據(jù)上的應(yīng)用實(shí)踐

新聞 大數(shù)據(jù)
每天滴滴都會(huì)為上千萬人提供出行服務(wù),在這一過程中積累了海量軌跡數(shù)據(jù)。這些軌跡數(shù)據(jù)來自于公共服務(wù),本文介紹如何利用這些數(shù)據(jù)回饋大眾,改善出行體驗(yàn)。

 每天滴滴都會(huì)為上千萬人提供出行服務(wù),在這一過程中積累了海量軌跡數(shù)據(jù)。這些軌跡數(shù)據(jù)來自于公共服務(wù),本文介紹如何利用這些數(shù)據(jù)回饋大眾,改善出行體驗(yàn)。

1. 背景

首先簡(jiǎn)要介紹一下什么是數(shù)據(jù)挖掘。數(shù)據(jù)挖掘(Data Mining)是指從大量數(shù)據(jù)中發(fā)現(xiàn)特定信息和模式的過程,也有很多人將這一過程看作知識(shí)發(fā)現(xiàn)(Knowledge Discovery in Database)。數(shù)據(jù)挖掘常用的算法手段有回歸、分類、聚類和模式發(fā)現(xiàn),工程上數(shù)據(jù)挖掘通常和大數(shù)據(jù)技術(shù)聯(lián)系在一起,工業(yè)實(shí)踐中還需要從業(yè)人員對(duì)數(shù)據(jù)中包含的領(lǐng)域知識(shí)有足夠了解。業(yè)界挖掘手段經(jīng)常用在用戶畫像、商業(yè)智能(Business Intelligence)、社群關(guān)系發(fā)現(xiàn)等場(chǎng)景。本文主要分享如何從海量軌跡數(shù)據(jù)中提取關(guān)鍵信息,改善用戶出行體驗(yàn)。滴滴在業(yè)務(wù)運(yùn)營(yíng)過程中,司機(jī)端APP 會(huì)持續(xù)向后臺(tái)上傳位置信息,這些信息被用于分單、司乘碰面、導(dǎo)航、里程計(jì)費(fèi)。每天滴滴都會(huì)為上千萬人提供出行服務(wù),在這一過程中積累了海量軌跡數(shù)據(jù)。這些軌跡數(shù)據(jù)不涉及用戶隱私,主要反應(yīng)了公共道路上的交通狀況和司機(jī)駕駛習(xí)慣。下面我們會(huì)具體介紹兩個(gè)典型場(chǎng)景。

2. 路網(wǎng)更新

作為數(shù)字道路地圖的關(guān)鍵部分,道路交叉口是多條相互連接道路的交匯處,其幾何特征和拓?fù)鋵傩缘木_性在移動(dòng)導(dǎo)航和其他位置服務(wù)中起著重要作用。隨著城市發(fā)展,交叉口的更新越來越頻繁,主要包含掛接關(guān)系變更、新路、形態(tài)變更,這類拓?fù)溴e(cuò)誤如果不能及時(shí)檢測(cè)及更新,會(huì)影響路網(wǎng)匹配、路徑規(guī)劃、導(dǎo)航播報(bào)等基于路網(wǎng)數(shù)據(jù)的地圖服務(wù),產(chǎn)生導(dǎo)航繞路、播報(bào)不合理等用戶體驗(yàn)問題。

▍2.1 技術(shù)挑戰(zhàn)

交叉口拓?fù)涓驴梢猿橄蟪蛇@樣一個(gè)問題:路口范圍內(nèi)的軌跡矢量模式與路網(wǎng)是否匹配?為此,需要解決以下幾個(gè)關(guān)鍵問題:第一,軌跡數(shù)據(jù)包含了大量噪聲,如何進(jìn)行有效去噪;第二,路口位置及范圍如何確定;第三,軌跡矢量模式如何表達(dá)以及如何與路網(wǎng)差分。為了解決以上問題,我們?cè)O(shè)計(jì)出的算法框架如下,包含三個(gè)核心模塊:軌跡質(zhì)量提升,路口影響區(qū)域檢測(cè)和拓?fù)浣Y(jié)構(gòu)校準(zhǔn)模塊。相關(guān)工作發(fā)表在數(shù)據(jù)挖掘與數(shù)據(jù)庫技術(shù)頂級(jí)學(xué)術(shù)會(huì)議 International Conference on Data Engineering (ICDE) 2020上。

▍ 2.2  軌跡質(zhì)量提升原始軌跡數(shù)據(jù)可能受設(shè)備故障、信號(hào)不佳等因素影響導(dǎo)致采集到的定位信息存在漂移甚至異常,我們根據(jù)前后軌跡點(diǎn)的距離和時(shí)間間隔進(jìn)行軌跡段的分割,保證同一軌跡段在時(shí)空上具有連續(xù)性;此外,車輛在路口一般會(huì)因?yàn)榈燃t綠燈或交通擁堵停留,導(dǎo)致在短距離范圍內(nèi)產(chǎn)生大量具有不同方向的位置信息(噪聲),不僅增加了路口檢測(cè)的計(jì)算開銷,還給檢測(cè)精度帶來較大影響。

針對(duì)這一問題,我們基于軌跡點(diǎn)的密度(時(shí)間密度、空間密度)進(jìn)行數(shù)據(jù)過濾,并對(duì)局部自相交軌跡段進(jìn)行分段,最后通過Douglas Peucker算法提取軌跡段關(guān)鍵形狀點(diǎn),在保留軌跡轉(zhuǎn)向特征的同時(shí),對(duì)數(shù)據(jù)實(shí)現(xiàn)了壓縮。因此,通過軌跡分段、去噪、壓縮的預(yù)處理,實(shí)現(xiàn)了對(duì)原始軌跡數(shù)據(jù)的質(zhì)量提升。

▍2.3 交叉口位置及范圍生成

為了檢測(cè)道路交叉口影響區(qū)內(nèi)的詳細(xì)拓?fù)湫畔ⅲ紫刃枰R(shí)別道路交叉口的核心區(qū)域,即路口位置和覆蓋范圍。考慮到不同路口大小不一,并且路口范圍內(nèi)軌跡通常具有減速、轉(zhuǎn)向等特征,我們?cè)O(shè)計(jì)了一套基于四叉樹空間劃分和Mean-shift的自適應(yīng)路口位置檢測(cè)算法。在搜索道路交叉口單元的過程中,將四叉樹的最小邊長(zhǎng)設(shè)置為25米,并從200米大小邊長(zhǎng)開始的層(即從四叉樹底部開始的第四層)搜索道路交叉口單元。由于交叉口中心位置的軌跡往往比路段具有更多的轉(zhuǎn)向與較低的轉(zhuǎn)速,我們對(duì)每個(gè)網(wǎng)格單元中的所有特征點(diǎn)(軌跡壓縮獲得)執(zhí)行速度分析和基于方向的DBSCAN聚類,篩選潛在的道路交叉口網(wǎng)格單元。隨后,鑒于Mean-Shift算法可以在聚類過程中同時(shí)檢測(cè)出密度中心,我們通過該算法,結(jié)合候選交叉口單元內(nèi)的軌跡點(diǎn)識(shí)別路口的中心位置。

不同路口其形狀有較大差異,如何更通用地基于軌跡數(shù)據(jù)確定路口的核心區(qū)范圍?實(shí)質(zhì)上道路交叉口的中心位置附近并不總是具有相對(duì)于路段區(qū)域更多轉(zhuǎn)向行為,例如,環(huán)島和立交橋。本文中我們利用環(huán)狀幾何模型逐層檢測(cè)路口覆蓋范圍。對(duì)于一個(gè)路口而言,越到核心區(qū)邊緣的環(huán)包含的轉(zhuǎn)向點(diǎn)密度越低、速度越大,因此該路口模型適于不同形狀路口的范圍提取。

▍2.4 拓?fù)浣Y(jié)構(gòu)校準(zhǔn)

在路口范圍拓?fù)浣Y(jié)構(gòu)的校準(zhǔn)階段,我們基于檢測(cè)的路口中心位置和核心區(qū)范圍向外擴(kuò)展,獲取交叉路口影響區(qū)內(nèi)的全部軌跡。我們對(duì)這些軌跡進(jìn)行轉(zhuǎn)向簇提取與中心線擬合,并將擬合的轉(zhuǎn)向路徑與基準(zhǔn)路網(wǎng)進(jìn)行地圖匹配。Frechet距離適于評(píng)測(cè)曲線之間的相似性,但是對(duì)于復(fù)雜形狀的路口以及路口鄰接路段間朝向偏差較小的情況,F(xiàn)rechet表現(xiàn)不佳。鑒于此,我們將方向權(quán)重引入軌跡相似性度量中。對(duì)于任意兩條軌跡序列,分別計(jì)算起點(diǎn)與終點(diǎn)間的方向差,并結(jié)合Frechet距離生成軌跡集合的距離矩陣。基于該矩陣結(jié)合DBSCAN聚類實(shí)現(xiàn)路口范圍內(nèi)的轉(zhuǎn)向簇提取。

在提取轉(zhuǎn)向簇后,需要對(duì)各簇軌跡進(jìn)行擬合來得到轉(zhuǎn)向矢量模式。我們采用基于Force Attraction的聚類方法獲取各簇對(duì)應(yīng)的轉(zhuǎn)向路徑,相比如其他依賴點(diǎn)信息的擬合算法如Sweeping等,F(xiàn)orce Attraction方法能夠充分運(yùn)用軌跡線信息,因此對(duì)復(fù)雜轉(zhuǎn)向場(chǎng)景的擬合更加魯棒。Force Attraction方法首先隨機(jī)采樣簇中的一條軌跡作為參考軌跡,隨后使用同簇內(nèi)其余軌跡對(duì)參考軌跡中點(diǎn)的位置進(jìn)行迭代調(diào)整。在調(diào)整過程中,F(xiàn)orce Attraction算法假定任意軌跡點(diǎn)上有吸引力和排斥力作用,通過搜索兩個(gè)力達(dá)到平衡的位置來獲得參考軌跡對(duì)應(yīng)點(diǎn)的新位置。由于隨機(jī)采樣軌跡容易導(dǎo)致擬合得到的中心線不精準(zhǔn),特別是當(dāng)隨機(jī)采樣的參考軌跡遠(yuǎn)離實(shí)際道路中心時(shí),擬合偏差較大。因此,我們引入基于Frechet的采樣策略。具體來說,我們從簇中隨機(jī)采樣k條軌跡作為候選參考軌跡,并分別計(jì)算每個(gè)候選者與該簇的其余軌跡之間的Frechet距離。將具有最小距離和的候選軌跡視為參考軌跡。

在獲得轉(zhuǎn)向路徑后,我們采用經(jīng)典的HMM算法結(jié)合基準(zhǔn)路網(wǎng)進(jìn)行地圖匹配。為加速匹配過程,我們基于每個(gè)路口的轉(zhuǎn)向路徑集生成凸包再與路網(wǎng)空間關(guān)聯(lián)。根據(jù)匹配概率得到低置信度轉(zhuǎn)向路徑,作為需修正拓?fù)淝閳?bào)。

在最終的路口拓?fù)湫?zhǔn)上,為了評(píng)估我們解決方案的有效性,我們基于滴滴實(shí)際軌跡數(shù)據(jù)和路網(wǎng)檢測(cè)兩種類型的錯(cuò)誤拓?fù)洌恨D(zhuǎn)向路徑缺失和轉(zhuǎn)向路徑偏移。根據(jù)我們的評(píng)估,整體的精確率能夠達(dá)到70%,轉(zhuǎn)向路徑缺失和偏移的比例在1 : 5。目前該方法已經(jīng)在滴滴路網(wǎng)更新產(chǎn)線中得到應(yīng)用,下圖為兩個(gè)典型案例(路網(wǎng)為淡灰色線,軌跡分布以深藍(lán)色表示,校正的轉(zhuǎn)向路徑以紅色箭頭線突出顯示。

3. 路線偏移

在網(wǎng)約車業(yè)務(wù)場(chǎng)景中,可能會(huì)出現(xiàn)司機(jī)師傅未能按照導(dǎo)航路線行駛而出現(xiàn)路線偏移的現(xiàn)象,導(dǎo)致此類場(chǎng)景出現(xiàn)的原因可能是路況不佳、路線不合理、道路封閉,也可能是司機(jī)發(fā)現(xiàn)了更好的路線躲避擁堵,或者是對(duì)路線不熟悉,甚至故意繞路等。挖掘此類場(chǎng)景對(duì)于網(wǎng)約車提升地圖用戶體驗(yàn)、避免司乘糾紛、保障司乘安全具有至關(guān)重要的意義。為了解決此類問題,地圖團(tuán)隊(duì)通過全局/局部的起終點(diǎn)(Origin-Destination,簡(jiǎn)稱OD) 約束,基于用戶歷史軌跡行為特征建模,實(shí)時(shí)觀測(cè)目標(biāo)用戶軌跡行為空間分布特征,從而檢測(cè)路線偏移行為。基于用戶軌跡的路線偏移檢測(cè),我們最終構(gòu)建了實(shí)時(shí)觸達(dá)用戶的軌跡安全產(chǎn)品與路網(wǎng)狀態(tài)更新體系。

▍3.1 技術(shù)挑戰(zhàn)

基于OD軌跡路線偏移檢測(cè),通常涉及到路線表征維度多樣性、OD觀測(cè)空間下歷史正常軌跡稀疏性、檢測(cè)實(shí)時(shí)性等建模問題以及TB級(jí)軌跡大數(shù)據(jù)的離線特征存儲(chǔ)更新、在線實(shí)時(shí)查詢等工程問題。雖然在學(xué)術(shù)研究領(lǐng)域,軌跡異常檢測(cè)已經(jīng)形成了相對(duì)成熟的解決方案與不同角度的研究積累,但在實(shí)際工程實(shí)踐會(huì)面臨復(fù)雜多樣的業(yè)務(wù)場(chǎng)景,具體來講:

1.路線表征維度多樣性

用戶軌跡路線可以用一系列有序的GPS點(diǎn)串表征,該方式可以保留最原始的路線信息,但是會(huì)存在軌跡飄點(diǎn)、冗余、無法批量高效建模的問題;也可以基于軌跡匹配道路結(jié)果進(jìn)而通過一系列路段表征路線,該種表征方式最為常見,同時(shí)也會(huì)存在軌跡質(zhì)量、綁路策略而帶來的誤匹問題;還可以將GPS映射到空間瓦片表示,該方式可以有效規(guī)避以上兩類問題,但是無法精確定位路網(wǎng)問題。因此在不同的建模場(chǎng)景中,應(yīng)該采取不同的路線表征維度。左側(cè)藍(lán)色點(diǎn)串GPS軌跡的原始表示,右側(cè)表示軌跡的瓦片表示。

2. OD觀測(cè)空間下歷史正常軌跡稀疏性

由于我們是在OD的空間約束下進(jìn)行軌跡建模,并且需要觀測(cè)在該空間下歷史用戶軌跡分布特征,如果用戶行程起終點(diǎn)下關(guān)聯(lián)的歷史用戶軌跡數(shù)量過少甚至不存在,那對(duì)于軌跡建模來講將是巨大的挑戰(zhàn)。

3. 檢測(cè)實(shí)時(shí)性

在路線偏移的場(chǎng)景下,不管是路網(wǎng)狀態(tài)異常還是訂單狀態(tài)異常,都要求算法能夠?qū)崟r(shí)、精確、可解釋的計(jì)算結(jié)果并觸達(dá)用戶,因此要求我們的算法要能夠?qū)崟r(shí)地對(duì)端上上報(bào)的軌跡點(diǎn)進(jìn)行狀態(tài)判定。

為了解決異常路線偏移檢測(cè)的問題,考慮到不同的產(chǎn)品及業(yè)務(wù)需求,我們?cè)O(shè)計(jì)并完成了以下兩大類檢測(cè)解決方案,下面進(jìn)行簡(jiǎn)單的介紹。

▍3.2 "少而不同"繞路檢測(cè)

該類場(chǎng)景主要是檢測(cè)單一、少數(shù)繞路訂單的異常狀態(tài),該類訂單在OD約束下,與其他正常相同OD下其他正常訂單軌跡空間分布存在明顯的差異,主要表現(xiàn)為連續(xù)地出現(xiàn)離群軌跡點(diǎn),所以可以將我們的任務(wù)轉(zhuǎn)化為實(shí)時(shí)離群軌跡點(diǎn)檢測(cè),檢測(cè)方法可以由以下部分組成:

  • 路線形狀表達(dá)

軌跡路線形狀表達(dá)的目的主要是壓縮軌跡,同時(shí)保證形狀信息和壓縮率;同時(shí)也要平滑軌跡,去除停留點(diǎn)與噪點(diǎn)。我們采用了Minimum Description Length Partition算法對(duì)軌跡進(jìn)行壓縮表示,該算法通過定義角度距離、垂直距離等,拓展了傳統(tǒng)的Douglas-Peucker算法,無需定義閾值,可以自適應(yīng)增量式劃分和壓縮軌跡。

  • 導(dǎo)航特征表達(dá)

在實(shí)際業(yè)務(wù)場(chǎng)景中,除了軌跡路線形狀之外,我們還可以實(shí)時(shí)獲取到用戶導(dǎo)航-偏航狀態(tài)的特征,通過行駛方向與導(dǎo)航起終點(diǎn)方位關(guān)系,可以判定用戶當(dāng)前是否在朝向終點(diǎn)運(yùn)動(dòng)。紅色線條為道路路線,綠色線條為軌跡路線,β1表示A1A2導(dǎo)航起終點(diǎn)夾角為銳角,朝向相近,即朝向終點(diǎn)運(yùn)動(dòng),β2反之。

  • 稀疏OD軌跡Embedding

    為了克服上文中提到的同OD下歷史正常軌跡稀疏性的問題,我們提出了一種基于地理空間關(guān)系學(xué)習(xí)的軌跡Embedding方案。該方案主要是在訂單起終點(diǎn)的約束下,建模軌跡中途經(jīng)點(diǎn)與起終點(diǎn)之間的關(guān)系,由于不涉及到具體特定軌跡,只是建模起終點(diǎn)與途經(jīng)點(diǎn)關(guān)系,因而在可以在一定程度上解決OD空間下稀疏性的問題。Embedding主要更新學(xué)習(xí)過程如下:

其中,地理特征矩陣更新學(xué)習(xí)的過程為:

S1)將行駛的軌跡T={p1, p2, … , pn}根據(jù)坐標(biāo)映射到對(duì)應(yīng)的路網(wǎng)網(wǎng)格中。軌跡可以表示為T={g1, g2, … , gn}其中g(shù)i為行駛軌跡中坐標(biāo)pi在路網(wǎng)中對(duì)應(yīng)的網(wǎng)格。

S2)使用具有固定窗口大小和固定滑動(dòng)步長(zhǎng)的滑動(dòng)窗口,將軌跡T={g1, g2, … , gn}劃分為若干定長(zhǎng)的子軌跡,如滑動(dòng)窗口大小為10,滑動(dòng)步長(zhǎng)為1,則原始軌跡T可被劃分為子軌跡集合T’ = {Tj | Tj={gj, gj+1, … , gj+9}, 1≤i≤n-9}

S3)假設(shè)路網(wǎng)中有N個(gè)互不相同的路網(wǎng)網(wǎng)格,則對(duì)目標(biāo)區(qū)域的所有路網(wǎng)網(wǎng)格隨機(jī)初始化兩個(gè)N d維特征矩陣,特征矩陣中的每一行為一個(gè)特征向量,分別表示對(duì)應(yīng)網(wǎng)格作為起點(diǎn)和終點(diǎn)時(shí)的特征。將兩個(gè)特征矩陣拼接后可以得到一個(gè)N 2d維的特征矩陣,用于表示對(duì)應(yīng)網(wǎng)格作為軌跡途經(jīng)點(diǎn)(既非起點(diǎn)也非終點(diǎn))時(shí)的特征。

S4)將S2)中得到的每條子軌跡T={g0, g1, … , gn} 根據(jù)軌跡點(diǎn)性質(zhì)轉(zhuǎn)化T={S, M1, … , Mj, D},其中S=g0表示子軌跡起點(diǎn),D=gn表示子軌跡終點(diǎn),M1, … , Mj表示子軌跡途經(jīng)點(diǎn)。

S5)在起終點(diǎn)約束的條件下,最大化途徑點(diǎn)M1, … , Mj出現(xiàn)的平均對(duì)數(shù)概率,即可完成在在地理空間約束下的軌跡建模。根據(jù)軌跡點(diǎn)性質(zhì),分別從不同特征矩陣查找軌跡經(jīng)過的路網(wǎng)網(wǎng)格的性質(zhì)。即從起點(diǎn)特征矩陣中查找起點(diǎn)S的特征向量,為d維向量;從終點(diǎn)矩陣中查找終點(diǎn)D的特征向量,為d維向量;從途徑點(diǎn)矩陣中查找途徑點(diǎn)Mj的特征向量,為2d維向量。拼接起點(diǎn)S和終點(diǎn)D的特征向量和,即可得到2d維的起終點(diǎn)特征向量。

S6)通過反向傳播更新起點(diǎn)、途經(jīng)點(diǎn)和終點(diǎn)的特征矩陣,直到模型收斂。此時(shí)即可得到送駕區(qū)域路網(wǎng)網(wǎng)格在地理空間約束下的特征向量。

  • 實(shí)時(shí)離群點(diǎn)檢測(cè)

為了滿足軌跡實(shí)時(shí)異常檢測(cè)需求,需要算法能夠在系統(tǒng)輸入的一定時(shí)間窗口的軌跡之后,完成路形表達(dá)、導(dǎo)航特征提取、軌跡特征Embedding之后,立即給出在該OD空間約束下,當(dāng)前行程軌跡是否處于偏移狀態(tài)以及該狀態(tài)下基于以上特征的支持度【支持度可以定義為在OD約束下,歷史正常路線途徑該瓦片的訂單數(shù)量 / OD約束下總訂單數(shù)量】,借鑒iBOAT自適應(yīng)窗口檢測(cè)在線檢測(cè)思路,類似的,我們提出了一種基于多特征表征的實(shí)時(shí)路線偏移檢測(cè)框架,具體檢測(cè)過程為:當(dāng)偏航發(fā)生時(shí),在一定時(shí)間窗口,獲取目標(biāo)訂單行程軌跡,對(duì)該行程進(jìn)行路形、導(dǎo)航、軌跡特征的表征與判別。下圖中,圖一藍(lán)色為歷史正常用戶實(shí)際軌跡路線,紅色為目標(biāo)用戶軌跡;圖二為iBOAT自適應(yīng)窗口判別示意圖。

▍3.3 “多而不同”封路檢測(cè)

基于“少而不同”的思路針對(duì)極少數(shù)用戶軌跡偏移的異常檢測(cè)主要是為了解決司乘糾紛、軌跡安全等問題;“多而不同”主要是多數(shù)用戶在同OD空間約束下,出現(xiàn)了群體性的路線偏移,該現(xiàn)象往往意味路網(wǎng)的狀態(tài)發(fā)生了變更而導(dǎo)航依舊按照發(fā)生變更前狀態(tài)規(guī)劃,從而導(dǎo)致用戶的集體被迫繞路。因此針對(duì)路網(wǎng)狀態(tài)異常,以道路封閉為例,我們提出了一種基于 Siamese LSTM (孿生長(zhǎng)短期記憶網(wǎng)絡(luò))與LSPD(缺失路段模式檢測(cè)方法)的軌跡時(shí)空模型來解決路網(wǎng)封閉檢測(cè)問題。相關(guān)工作發(fā)表在GIS領(lǐng)域國(guó)際會(huì)議ACM SIGSPATIAL  2019 (International Workshop on Ride-hailing Algorithms, Applications, and Systems)(SIGSPATIAL 2019 RAAS)該模型主要結(jié)構(gòu)如下:

該模型主要分為兩個(gè)模塊,第一個(gè)算法模塊是基于時(shí)間序列流量信息相似性建模,該模型可以引入經(jīng)典的Siamese LSTM網(wǎng)絡(luò),并融合注意力機(jī)制與自定義損失函數(shù),實(shí)時(shí)刻畫歷史同期流量曲線與當(dāng)前流量曲線的相似性,從而在線檢測(cè)流量異常。由于采取了與歷史同期(例如本周一與上周一)的流量序列建模,因而對(duì)流量自然下降及波動(dòng)具備很強(qiáng)的魯棒性。

基于Siamese LSTM流量異常檢測(cè)可以對(duì)全路網(wǎng)空間的流量異常進(jìn)行實(shí)時(shí)檢測(cè),其檢測(cè)的結(jié)果需要更強(qiáng)的證據(jù)佐證道路異常,因此,我們?cè)O(shè)計(jì)了第二個(gè)算法模塊LSPD, 該算法側(cè)重于通過群體用戶行為的異常判別第一個(gè)算法模塊結(jié)果的可解釋性與概率性,主要思想是統(tǒng)計(jì)同OD下路線模式的分布變更,不同于軌跡異常檢測(cè)算法(iBOAT) 在OD場(chǎng)景下關(guān)注“少而不同“的異常軌跡,我們重點(diǎn)關(guān)注“多而不同“的用戶群體性異常行為,例如某時(shí)間段內(nèi)歷史用戶集中出現(xiàn)了繞路事件,則通過我們的LSPD算法模塊可以精確定位到哪些路段可能出現(xiàn)了道路封閉以及發(fā)生發(fā)生該類事件的置信度有多大。

以北京市某處道路封閉事件為例,該道路在下午17時(shí)左右發(fā)生道路封閉,我們的系統(tǒng)在18時(shí)通過Siamese LSTM深度網(wǎng)絡(luò)檢測(cè)出該道路存在明顯的流量異常,異常置信度為0.99,隨后,該事例被系統(tǒng)流轉(zhuǎn)至LSPD檢測(cè)模塊尋求更多的軌跡證據(jù)佐證該道路的確存在道路異常,在該模塊,我們的算法檢測(cè)到在局部起終點(diǎn)(OD)的作用下,用戶的出行方式已經(jīng)發(fā)生了巨大的變化,之前多數(shù)用戶選擇右側(cè)紅色路線,而當(dāng)前狀態(tài)下,用戶多選擇左側(cè)藍(lán)色路線(紅色路線的支持度從30降低到6,而藍(lán)色路線的支持度則由3上升至43),從而被系統(tǒng)整體判別該道路出現(xiàn)了道路異常,即道路封閉。

4. 總結(jié)

在當(dāng)前的工業(yè)實(shí)踐中,數(shù)據(jù)挖掘也常常和一些熱門詞匯聯(lián)席出現(xiàn),比如人工智能、機(jī)器學(xué)習(xí)、大數(shù)據(jù)、數(shù)據(jù)分析、數(shù)據(jù)科學(xué)等,如下圖所示。

相比于其他概念,數(shù)據(jù)挖掘不強(qiáng)調(diào)應(yīng)用何種手段,更強(qiáng)調(diào)目的:從數(shù)據(jù)中提取信息。在這個(gè)意義上講,數(shù)據(jù)挖掘天然是交叉學(xué)科,需要從業(yè)人員具備統(tǒng)計(jì)、機(jī)器學(xué)習(xí)、大數(shù)據(jù)乃至高并發(fā)后臺(tái)服務(wù)、數(shù)據(jù)可視化等復(fù)合技能。另一方面,目前的人工智能技術(shù)水平僅僅達(dá)到刻畫相關(guān)性的階段,尚不能進(jìn)行通用推理或者知識(shí)學(xué)習(xí),所以需要從業(yè)者對(duì)研究的領(lǐng)域具備一定先驗(yàn)知識(shí),并了解如何利用這些知識(shí)從數(shù)據(jù)中提取有高價(jià)值信息。這兩個(gè)特點(diǎn)決定了領(lǐng)域數(shù)據(jù)挖掘的門檻非常高,這影響了數(shù)據(jù)價(jià)值的快速發(fā)掘和落地。筆者所在團(tuán)隊(duì)承擔(dān)了公司內(nèi)部很多挖掘任務(wù),比如安全駕駛行為檢測(cè)、路網(wǎng)挖掘、交通事件、地理畫像、出行模式分析等等,更多的數(shù)據(jù)挖掘任務(wù)因?yàn)榕牌诤唾Y源限制無法快速支持,而需求方因?yàn)楦呒寄荛T檻無法自行對(duì)數(shù)據(jù)進(jìn)行加工和價(jià)值提取。

我們下一步的目標(biāo)是嘗試將軌跡數(shù)據(jù)挖掘能力中臺(tái)化或者平臺(tái)化,能夠?qū)⑺惴ā⒐こ獭⒋髷?shù)據(jù)、可視化等能力開放出來,大幅降低數(shù)據(jù)挖掘成本,使得數(shù)據(jù)的價(jià)值能被最大化利用。實(shí)際上這一挑戰(zhàn)不是我們團(tuán)隊(duì)或者公司獨(dú)有的,互聯(lián)網(wǎng)公司可能會(huì)存在無法以合適的成本從數(shù)據(jù)中提取價(jià)值的問題,導(dǎo)致數(shù)據(jù)挖掘技術(shù)只在少數(shù)高ROI場(chǎng)景下得到應(yīng)用。即將到來的5G和萬物互聯(lián)時(shí)代,這一問題會(huì)更加嚴(yán)重。歡迎對(duì)此感興趣的同學(xué)加入我們,一起研究和探索如何解決這些挑戰(zhàn)。

 

 

責(zé)任編輯:張燕妮 來源: segmentfault
相關(guān)推薦

2009-01-19 16:44:31

數(shù)據(jù)挖掘沃爾瑪應(yīng)用

2016-05-23 15:42:07

數(shù)據(jù)挖掘

2024-06-04 07:29:13

2017-01-19 14:45:34

數(shù)據(jù)挖掘Google再營(yíng)銷

2009-01-18 15:43:29

數(shù)據(jù)挖掘電子商務(wù)WEB

2015-06-11 10:09:04

大數(shù)據(jù)HBase

2015-08-28 10:05:47

數(shù)據(jù)挖掘

2009-01-20 13:51:16

數(shù)據(jù)挖掘知識(shí)發(fā)現(xiàn)方法

2022-09-01 10:10:27

數(shù)據(jù)編排技術(shù)

2011-04-01 12:19:21

SQL Server商業(yè)智能

2024-09-25 10:10:35

2024-09-29 08:40:34

2017-02-24 19:45:58

2011-03-17 12:33:56

面向?qū)ο髷?shù)據(jù)庫電子商務(wù)

2023-09-18 07:16:53

數(shù)據(jù)庫TDengine

2016-12-01 13:44:19

iosandroid

2020-09-21 09:34:20

大數(shù)據(jù)

2018-05-29 09:38:40

大數(shù)據(jù)金融行業(yè)銀行業(yè)

2018-10-24 14:36:59

2015-07-20 17:00:45

VXLAN云數(shù)據(jù)中心
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

日韩伦理一区| 在线中文字幕播放| 国产河南妇女毛片精品久久久| 欧美成人久久久| 久久精品女同亚洲女同13| 亚洲1234区| 综合色天天鬼久久鬼色| 国产经典一区二区三区| 一二三区免费视频| 五月天久久777| 亚洲国产毛片完整版| 午夜免费精品视频| 日本性爱视频在线观看| 久久精品一区八戒影视| 亚洲自拍av在线| av片免费观看| 亚洲午夜一区| 日韩在线视频观看| 最近中文字幕无免费| 亚洲欧美在线人成swag| 欧美视频在线免费| 日韩一级免费看| 思思99re6国产在线播放| 成人av片在线观看| 91成人免费观看| 自拍偷拍色综合| 99热这里只有精品8| 不卡av在线网站| 国产精品久久久久久久av| 国产精品传媒| 欧美一区二区在线视频| 黄色国产小视频| 免费h在线看| 亚洲精品免费在线观看| 欧美日本亚洲| 天天摸夜夜添狠狠添婷婷| 国产在线播精品第三| 日产精品99久久久久久| 国产午夜视频在线| 国产精品久久久久久| 亚洲乱码一区二区| 色婷婷精品久久二区二区密| 日韩激情综合| 91.com在线观看| 性猛交ⅹ×××乱大交| 日韩中文影院| 色婷婷精品久久二区二区蜜臀av| 青青草国产免费| dj大片免费在线观看| 国产精品久久久久婷婷| 亚洲精品视频一二三| 黄色av免费在线看| 国产日韩成人精品| 日产中文字幕在线精品一区| 欧美孕妇性xxxⅹ精品hd| 97超碰欧美中文字幕| 国产一区二区精品在线| 少妇精品高潮欲妇又嫩中文字幕| 成人精品在线视频观看| 国产精品精品软件视频| 丰满少妇在线观看bd| 成人爽a毛片一区二区免费| 99在线观看视频网站| 亚洲av无码一区二区乱子伦 | 国产三级三级三级精品8ⅰ区| 国严精品久久久久久亚洲影视| 国精产品乱码一区一区三区四区| 风间由美一区二区三区在线观看| 福利视频久久| 色噜噜在线播放| 91一区二区在线| 免费久久99精品国产自| 国产永久av在线| 欧美国产日韩亚洲一区| 在线看成人av电影| 中文字幕中文字幕在线中高清免费版| 一区二区三区在线视频免费观看| 亚洲色欲久久久综合网东京热| 欧美三级网站| 色94色欧美sute亚洲线路二 | 欧美成人精品欧美一级私黄| 亚洲天堂免费| 久久久久久综合网天天| av大片在线免费观看| 视频一区二区三区中文字幕| 国产精品爽黄69天堂a| 国产精品免费无遮挡| 国产大陆a不卡| 久久亚洲免费| 日本中文字幕在线观看| 亚洲午夜精品17c| 久久精品网站视频| 麻豆国产一区| 日韩精品视频在线观看网址| 色噜噜噜噜噜噜| 欧美日韩18| 青青精品视频播放| 国产精品无码免费播放| fc2成人免费人成在线观看播放| 欧美日韩一区二| 超碰在线网址| 色爱区综合激月婷婷| 欧美69精品久久久久久不卡| 亚洲精华一区二区三区| 久久九九热免费视频| 日本中文字幕免费| 久久国产三级精品| 麻豆亚洲一区| 午夜dj在线观看高清视频完整版| 欧美性生交xxxxx久久久| 999久久久精品视频| 亚洲图区在线| 欧美精品999| 亚洲天堂手机在线| 久久亚洲一级片| 国产曰肥老太婆无遮挡| 日韩毛片网站| 亚洲美女精品成人在线视频| 老女人性淫交视频| 蜜臀av一区二区在线免费观看 | 97人妻人人澡人人爽人人精品| 成人激情校园春色| 在线成人av电影| 亚洲精品福利电影| 欧美成人性战久久| 99久久99久久精品国产| 日韩精品乱码免费| 久久伊人一区| www.超碰在线| 精品噜噜噜噜久久久久久久久试看| 欧美老女人性生活视频| 亚洲一区二区伦理| 国产精品国产三级国产专区53| 日本在线观看网站| 欧美丝袜自拍制服另类| 中文字幕欧美人与畜| 91九色porn在线资源| 欧美日韩久久久一区| 亚洲永久无码7777kkk| 欧美另类专区| 成人精品一区二区三区电影黑人| 天堂资源最新在线| 亚洲成人av电影| 欧美色图校园春色| 99精品美女| 国产精品影片在线观看| 国产高清免费av在线| 日韩欧美在线字幕| 中文字幕日韩三级片| 伊人久久成人| 国产激情一区二区三区在线观看| av网站网址在线观看| 欧美美女bb生活片| 国产在线观看免费视频软件| 免费在线观看精品| 亚洲国产日韩综合一区| 国产私拍福利精品视频二区| 亚洲欧美在线磁力| 中文字幕在线播| 久久婷婷国产综合国色天香| 国产中文字幕二区| 色爱综合av| 国精产品一区一区三区有限在线| 亚洲精品喷潮一区二区三区| 一级做a爱片久久| av电影中文字幕| 激情久久婷婷| 久久亚洲高清| 成人亚洲网站| 日韩中文视频免费在线观看| 91精品国自产| 亚洲欧美日韩一区| 岛国精品一区二区三区| 一区二区日本视频| 日本一区视频在线观看免费| 日韩欧美精品一区二区综合视频| 中文字幕欧美在线| 国产三级精品在线观看| 亚洲成人免费在线| 97超碰在线免费观看| 蜜桃视频一区二区三区| 久久久久久久久影视| 风间由美一区二区av101| 欧美一级高清免费| 在线观看二区| 日韩视频免费观看高清完整版| 精品一区二区三区四| 久久久精品天堂| 亚洲小视频网站| 激情文学一区| 天堂av一区二区| 国产精品无码久久久久| 欧美激情a在线| 国产尤物视频在线| 日韩精品一区二| 日本黄色中文字幕| 亚洲精品乱码久久久久久久久 | 在线成人激情视频| a级片在线视频| 欧美视频在线观看 亚洲欧| 蜜桃av.com| av在线不卡电影| 日本人69视频| 中文在线一区| 喜爱夜蒲2在线| 精品久久网站| 国产精品一区视频网站| 国产精品久久久久77777丨| 欧美激情视频网站| 91大神在线网站| 日韩精品在线观| 国产丰满果冻videossex| 91黄色免费版| 久久国产黄色片| 一区二区在线观看av| 久久久久无码精品国产sm果冻| 国产91在线观看丝袜| 在线免费av播放| 国产欧美高清| 日本国产中文字幕| 日韩精品一卡| 日本欧洲国产一区二区| 六月丁香久久丫| 亚洲直播在线一区| 亚洲精品成人一区| 国产精品久久久久免费a∨ | 午夜私人影院久久久久| 人人澡人人澡人人看| 欧美国产日产图区| 熟女俱乐部一区二区视频在线| 不卡一区二区三区四区| 欧美污在线观看| 国产综合成人久久大片91| www.日本xxxx| 久久一日本道色综合久久| 青青草国产精品视频| 欧美另类亚洲| 日韩一级特黄毛片| 亚洲天堂一区二区三区四区| 午夜精品短视频| 精品国产一区二区三区久久久蜜臀| 久久一区二区三区欧美亚洲| 欧美人与动xxxxz0oz| 国产美女精品在线观看| 成人av资源网址| 国产视频一区二区三区四区| 国产ts一区| 国偷自产av一区二区三区小尤奈| 视频亚洲一区二区| 91观看网站| 婷婷综合国产| av一区和二区| 国产精品极品在线观看| 国产精品亚洲一区| 欧美绝顶高潮抽搐喷水合集| 精品国产一二| 九九视频免费观看视频精品 | 99久久夜色精品国产亚洲96| 日韩精品欧美一区二区三区| 蜜桃一区二区| 午夜精品电影在线观看| 99久久久久| 麻豆视频传媒入口| 亚洲激情另类| 免费观看日韩毛片| 日韩电影网1区2区| 小明看看成人免费视频| 国产资源精品在线观看| 精品国产aⅴ一区二区三区东京热| 国产91丝袜在线播放九色| 亚洲中文字幕无码一区| 91美女片黄在线观看91美女| 亚洲精品国产一区黑色丝袜| 中国av一区二区三区| 国产高潮国产高潮久久久91| 亚洲成人av一区二区| 无码一区二区三区在线观看| 欧美日韩成人综合天天影院| www.热久久| 亚洲美女激情视频| 国产在线观看免费麻豆| 高清欧美性猛交xxxx| 日本一道高清亚洲日美韩| 91视频8mav| 亚州综合一区| 9999在线观看| 99综合精品| 天天操天天干天天做| 成人丝袜视频网| 日本黄区免费视频观看| 性久久久久久久久久久久| 亚洲国产无线乱码在线观看| 日韩欧美激情一区| 九色在线视频蝌蚪| 精品自拍视频在线观看| 二吊插入一穴一区二区| 99久久伊人精品影院| 视频一区在线观看| 日本中文字幕一级片| 三级精品在线观看| 69亚洲乱人伦| 中文字幕在线不卡| 草久视频在线观看| 欧美成人精品福利| 日本最新在线视频| 日韩美女视频免费看| 中文字幕亚洲在线观看 | 欧美黄色aaaa| 亚洲精品一二三四五区| 成人免费毛片a| 女性裸体视频网站| 色狠狠一区二区三区香蕉| 黄色av一区二区三区| zzijzzij亚洲日本成熟少妇| 成人av免费电影网站| 99精品国产高清一区二区| jiujiure精品视频播放| 久久久999视频| 国产白丝精品91爽爽久久 | 亚洲永久免费视频| 亚洲字幕av一区二区三区四区| 日韩国产高清污视频在线观看| 午夜小视频福利在线观看| 国产美女高潮久久白浆| 国产不卡一二三区| 免费看国产曰批40分钟| 国产ts人妖一区二区| 国产麻豆视频在线观看| 欧美在线免费播放| 日韩偷拍自拍| 性色av一区二区三区| 亚洲综合网狠久久| 99精品一区二区三区的区别| 日本色综合中文字幕| 一卡二卡三卡四卡| 狠狠躁夜夜躁人人爽天天天天97| 亚洲国产精品久久人人爱潘金莲| 最近2019中文字幕大全第二页| 成人福利av| 日本一区视频在线观看| 久久久国产精品一区二区中文| 中文字幕一区二区人妻电影丶| 伊人性伊人情综合网| 99国产精品欲| 欧美巨猛xxxx猛交黑人97人| 高清精品久久| 特级西西444| 国产精品亚洲综合一区在线观看| 欧美手机在线观看| 欧美一级日韩不卡播放免费| 久久久久久久久免费视频| 91久久国产婷婷一区二区| 小小影院久久| 少妇愉情理伦片bd| 亚洲一区二区三区不卡国产欧美| 亚洲精品一区二区三区不卡| 欧美交受高潮1| 欧洲精品一区| www.亚洲天堂网| 久久久久久久av麻豆果冻| 樱花视频在线免费观看| 日日狠狠久久偷偷四色综合免费 | 国产日韩在线一区二区三区| 亚洲久久视频| 日韩精品无码一区二区三区久久久 | 51午夜精品视频| 一区二区导航| 苍井空浴缸大战猛男120分钟| 久久久不卡网国产精品一区| 欧美日韩在线视频播放| 日韩有码片在线观看| 精品成人18| 欧美深夜福利视频| 国产亚洲精品bt天堂精选| 欧美三级网站在线观看| 久久久精品一区二区| 天堂va欧美ⅴa亚洲va一国产| 九一国产精品视频| 国产欧美一区二区精品性 | 亚洲成人精品视频在线观看| 久草在线资源福利站| 丝袜足脚交91精品| 国产成人av电影免费在线观看| 国产九色在线播放九色| 中文字幕亚洲一区| 91成人入口| 好男人www社区| 亚洲在线视频网站| 精品999视频| 亚洲资源在线看| 亚洲在线网站| 欧美成人一二三区| 国产亚洲欧美日韩美女| 涩爱av色老久久精品偷偷鲁| 欧美在线观看www| 亚洲视频免费在线观看| 五月婷婷免费视频| 91久久精品国产91性色| 国产精品丝袜xxxxxxx| 疯狂撞击丝袜人妻|