精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

基于Apache Flink的實時計算引擎Blink在阿里搜索中的應用

大數據
Apache Flink®就是一種這樣的技術,阿里巴巴正在使用基于Flink的系統Blink來為搜索基礎架構的關鍵模塊提供支持,最終為用戶提供相關和準確的搜索結果。在這篇文章中,我將介紹Flink在阿里巴巴搜索中的應用,并介紹我們選擇在搜索基礎架構團隊中使用Flink的原因。

[[180070]]

阿里巴巴是世界上***的電子商務零售商。 我們在2015年的年銷售額總計3940億美元,超過eBay和亞馬遜之和。阿里巴巴搜索(個性化搜索和推薦平臺)是客戶的關鍵入口,并承載了大部分在線收入,因此搜索基礎架構團隊需要不斷探索新技術來改進產品。

在電子商務網站應用場景中,什么能造就一個強大的搜索引擎?答案就是盡可能的為每個用戶提供實時相關和準確的結果。同樣一個不容忽視的問題就是阿里巴巴的規模,當前很難找到能夠適合我們的技術。

Apache Flink®就是一種這樣的技術,阿里巴巴正在使用基于Flink的系統Blink來為搜索基礎架構的關鍵模塊提供支持,最終為用戶提供相關和準確的搜索結果。在這篇文章中,我將介紹Flink在阿里巴巴搜索中的應用,并介紹我們選擇在搜索基礎架構團隊中使用Flink的原因。

我還將討論如何改進Flink以滿足我們對Blink的獨特需求,以及我們如何與data Artisans和Flink社區合作,將這些更改貢獻給Flink社區。一旦成功地將我們的修改合并到開源項目中,我們會將現有系統從Blink轉移到Apache Flink。

Part 1: Flink在阿里巴巴搜索中的應用

文檔創建

為用戶提供***搜索引擎的***步是創建可供搜索的文檔。在阿里巴巴的應用場景中,文檔是由數百萬個商品列表和相關的商品數據組成。

因為商品數據存儲在許多不同的地方,所以搜索文檔創建也是一個很大的挑戰,搜索基礎架構團隊將商品相關的所有信息匯總在一起并創建完整的搜索文檔。一般來說,整個過程分為3個階段:

  1. 將不同來源(例如MySQL,分布式文件系統)的所有商品數據同步到一個HBase集群中。
  2. 使用業務邏輯將來自不同表的數據連接在一起,以創建最終的可搜索文檔。這是一個HBase表,我們稱之為'Result'表。
  3. 將此HBase表導出為文件作為更新集合。 

 

 

 

這3個階段實際上是在經典的“lambda架構”中的2個不同的pipeline上運行:全量構建pipeline和增量構建pipeline。

  • 在全量構建pipeline中,我們需要處理所有數據源,這通常是一個批處理作業。
  • 在增量構建pipeline中,我們需要處理在批處理作業完成后發生的更新。例如,賣家可能修改商品價格或商品描述以及庫存量的變化。這些信息需要盡可能快的反饋在搜索結果中。增量構建pipeline通常是一個流式作業。

搜索算法實時A/B測試

我們的工程師會定期測試不同的搜索算法,并且需要盡可能快地評估出效果。現在這種評估每天運行一次,因為想實時分析效果,所以我們使用Blink構建了一個實時A/B測試框架。

在線日志(展示,點擊,交易)由解析器和過濾器收集和處理,然后使用業務邏輯連接在一起。接下來聚合數據,將聚合結果推送到Druid,在Druid內部,我們可以編寫查詢語句并對數據執行復雜的OLAP分析,并查看不同算法的效果。 

 

 

 

在線機器學習

在這部分中Flink有兩個應用場景。首先,我們來討論它在商品特征實時更新中的應用。阿里巴巴搜索排序中使用的一些商品特征包括商品CTR,商品庫存和商品點擊總數。這些數據隨時間而變化,如果可以使用***的數據,我們就能為用戶提供更相關的搜索結果排序。Flink pipeline為我們提供在線特征更新,并大大提高了轉化率。

其次,每年的特定日子(如光棍節),有些商品折扣力度很大,有時甚至高達50%。因此,用戶行為也會發生很大的變化。交易量巨大,通常比我們在平時看到的高出很多倍。以前訓練的模型在這個場景作用有限,因此我們使用日志和Flink流式作業構建了在線機器學習模型,這個模型會將實時用戶行為數據反饋到系統中。結果在這些不常見但非常重要的營銷節日的轉換率有了很大的提升。 

 

 

 

Part 2: 選擇一個框架來解決問題

選擇Flink應用到搜索基礎架構中,我們在四個方面做過評估。 Flink在四個方面都滿足我們的要求。

  • 敏捷: 我們期望能夠為整個(2個pipeline)搜索基礎架構流程維護一套代碼,因此需要一個高級的API來滿足我們的業務邏輯。
  • 一致性: 賣方或商品數據庫發生的變化必須反饋在最終搜索結果中,因此搜索基礎架構團隊需要至少處理一次(at-least-once)的語義(對于公司中的一些其他Flink用例,要求正好一次(exactly-once)語義)。
  • 低延遲: 當商品庫存量發生變化時,必須盡快在搜索結果中得到體現。例如我們不想給售罄的商品給出很高的搜索排名。
  • 成本: 阿里巴巴需要處理大量數據,以我們的集群規模,效率提高可以顯著的降低成本。因此我們需要一個高性能、高吞吐量的框架。

一般來說,有兩種方法來將批處理和流式處理統一起來。一種方法是將批處理作為基本出發點,在批處理框架上支持流式處理。這可能不符合真正意義上低延遲,因為用微批量處理(micro-batching)模擬流式處理需要一些固定的開銷。因此,當試圖減少延遲時,開銷的比例也會相應增加。在我們的規模上,為每個微批量處理器調度1000個任務,需要重新建立連接并重新加載狀態。因此在某種程度上,微批處理方法代價太高將變得沒有意義。

Flink從另一個角度來解決這個問題,即將流式處理作為基本出發點,在流式處理框架上支持批量處理,將批處理作為流式處理的一種特殊情況。使用這種方法,不會丟掉我們在批處理模式(批處理模式下流是有限的)下做出的優化,你仍然可以做一些批量處理上的優化。

Part 3: Blink是什么?

Blink是Flink的一個分支版本,我們做了一定的改進以滿足阿里巴巴的一些特定需求。因此,Blink在幾個不同的集群上運行,每個集群有大約1000臺機器,大規模集群的性能對我們來說非常重要。

Blink的改進主要包括兩個方面:

Table API更完整,因此我們可以使用相同的SQL進行批處理和流式處理。

更強大的YARN模式,但仍然100%兼容Flink的API和更廣泛的生態系統。

Table API

我們首先添加了對用戶自定義函數UDF的支持,方便在Flink中實現獨特的業務邏輯。我們還添加了一個流對流的join的功能,由于Flink對于狀態比較好的支持,所以實現起來比較容易。我們添加了幾個聚合函數以及滑動窗口的支持,最有趣的一個是distinct_count。

(編輯注:FLIP-11涵蓋了與上述功能相關的一系列Table API和SQL改進,對該主題感興趣的可以閱讀) 

 

 

 

接下來,我們將介紹運行時改進,可以分為四個不同的類別。

Yarn上的Blink

當我們開始項目時,Flink支持2種集群模式:standalone模式和YARN上的Flink。在YARN模式中,作業不能動態請求和釋放資源,而是需要預先分配所有需要的資源。不同的作業可能共享相同的JVM進程,這有利于資源利用和資源隔離。

Blink中每個作業都有自己的JobMaster,以根據作業需要請求和釋放資源。并且不同的作業不能在同一個Java進程中運行,這將在作業和任務之間得到***隔離。阿里巴巴團隊目前正在與Flink社區合作,將這項工作貢獻給開放源代碼,改進工作在FLIP-6(除了YARN之外還擴展到其他集群管理器)中得到了體現。 

 

 

 

Operator縮放

在生產環境中,我們的客戶端可能需要改變Operator的并行性,但同時他們不想失去當前狀態。當我們開始使用Blink時,Flink不支持在保持狀態的同時改變Operator的并行性。Blink引入了“bucket”的概念作為狀態管理的基本單位。有比任務更多的bucket,并且每個任務將被分配多個bucket。當并行性改變時,我們將重新分配任務的bucket。 使用這種方法,可以改變Operator的并行性并維持狀態。

(編者注:Flink社區同時在Flink 1.2版本中解決了的這個問題 - 該功能在***版本的主分支中可用。Flink的“key groups”概念在很大程度上等同于上面提到的“bucket”,但是實現時使用的數據結構略有不同。更多信息,請在Jira查看FLIR-3755) 

 

 

 

增量Checkpoint

在Flink中,Checkpoint操作分為兩個階段:在本地獲取狀態快照,然后將狀態快照保存到HDFS(或另一個存儲系統),并且每個快照的整個狀態存儲在HDFS中。我們的狀態數據太大了,這種方法是不可行的,所以Blink只存儲修改的狀態在HDFS中,這能夠大大提高Checkpoint的效率。這種修改使我們能夠在生產環境中使用很大的狀態數據。 

 

 

 

異步I/O

我們的job在生產環境中很大瓶頸在訪問外部存儲器上,如HBase。為了解決這個問題,我們引入了異步I/O,我們將致力于為社區做出貢獻,并在FLIP-12中有詳細描述。

(編輯筆記:data Artisans認為FLIP-12足夠強大,可以在不久的將來在某個時間擁有自己的獨立寫入。所以我們只是簡單地介紹一下這里的想法,如果你想了解更多,可以查看FLIP writeup) 

 

 

 

 

Part 4: 阿里巴巴的Flink未來計劃是什么?

我們將繼續優化我們的流式job,特別是更好地處理臨時傾斜(temporary skew)和慢節點(slow machines),同時不會對反壓機制(backpressure)和故障快速恢復造成影響。正如在Flink Forward大會上大家討論的,我們認為Flink作為批處理框架以及流式處理框架有著巨大潛力。我們正在努力利用Flink的批處理能力,希望在幾個月內在生產環境中使用Flink批處理模式。

會議的另一個熱門話題是流式SQL,我們將繼續在Flink中添加更多的SQL支持和Table API的支持。阿里巴巴的業務持續增長,這意味著我們的job會越來越大,確保我們可以擴展到更大的集群變得越來越重要。

非常重要的是,我們期待與社區繼續合作,以便將我們的工作貢獻回開源社區,以便所有Flink用戶都能從我們加入Blink的工作中受益。我們期待著在2017年Flink Forward大會上向您介紹我們的進展情況。

責任編輯:龐桂玉 來源: 大數據雜談
相關推薦

2021-03-10 08:22:47

FlinktopN計算

2021-06-06 13:10:12

FlinkPvUv

2013-08-04 21:02:59

實時計算存儲阿里巴巴和仲

2017-05-22 08:05:46

HBase阿里搜索實踐

2020-09-10 17:41:14

ClickHouse數據引擎

2018-01-26 16:28:24

阿里Blink核心

2018-01-25 12:01:08

阿里巴巴機器學習大數據

2022-04-22 09:05:12

蔚來汽車Flink實時數倉

2017-09-26 09:35:22

2015-10-09 13:42:26

hbase實時計算

2017-01-15 13:45:20

Docker大數據京東

2015-08-31 14:27:52

2022-08-10 09:02:03

風控Flink阿里云

2021-07-16 10:55:45

數倉一體Flink SQL

2022-11-10 08:48:20

開源數據湖Arctic

2019-02-15 15:41:11

代碼開發技術

2019-04-30 09:00:33

SQL數據庫Apache Flin

2019-02-14 09:04:55

阿里開源Blink

2017-09-14 12:12:52

Go大數據引擎

2022-12-29 09:13:02

實時計算平臺
點贊
收藏

51CTO技術棧公眾號

自拍偷拍21p| 色偷偷噜噜噜亚洲男人的天堂| 亚洲精品成人自拍| 国产精品无码天天爽视频| 亚洲男人都懂第一日本| 一本到高清视频免费精品| 日韩妆和欧美的一区二区| 国产成人无码精品久久久久| 精品视频自拍| 亚洲影院在线| 国产自产高清不卡| 欧美激情xxxx性bbbb| 一起草在线视频| 欧亚一区二区| 欧美国产日韩亚洲一区| 99国产在线视频| 波多野结衣视频网站| 日本精品黄色| 在线播放91灌醉迷j高跟美女| 国产精品一色哟哟| 色吊丝在线永久观看最新版本| 视频一区欧美精品| 欧美人交a欧美精品| mm131丰满少妇人体欣赏图| 精品国产不卡一区二区| 夜夜夜精品看看| 欧美一区二区三区在线免费观看| 在线观看亚洲国产| 激情综合激情| 中文字幕日韩欧美在线视频| 亚洲国产综合视频| 国产综合色激情| 亚洲第一成人在线| 亚洲欧美影院| 天天躁日日躁狠狠躁喷水| 经典三级在线一区| 8x拔播拔播x8国产精品| 欧美黄色一区二区三区| 日韩理论电影| 亚洲欧美国产精品久久久久久久| 中文字幕制服丝袜| 小黄鸭精品aⅴ导航网站入口| 亚洲精品欧美二区三区中文字幕| 成人91视频| 最新国产中文字幕| 久久三级视频| 欧美亚洲免费电影| 日本激情视频一区二区三区| 自拍自偷一区二区三区| 欧美一区二区三区视频免费| 欧美激情乱人伦一区| 亚洲人成无码网站久久99热国产 | 国产黄色免费在线观看| 99re在线精品| 国产精华一区| 亚洲欧美激情国产综合久久久| 男女激情视频一区| 日韩美女av在线免费观看| 色网站在线播放| 亚洲精品九九| 97视频国产在线| 国产极品美女高潮无套嗷嗷叫酒店 | 综合久久99| 伦理中文字幕亚洲| 爱爱免费小视频| 99re8这里有精品热视频免费| 欧美一区日本一区韩国一区| av在线网址导航| 国产另类xxxxhd高清| 在线亚洲免费视频| 在线免费观看av的网站| 都市激情亚洲一区| 91国产视频在线观看| 日本精品久久久久中文字幕| 日韩电影大全网站| 欧日韩精品视频| 天天操,天天操| 人人玩人人添人人澡欧美| 狠狠做深爱婷婷久久综合一区| 国产午夜福利100集发布| 国产在线天堂www网在线观看| 亚洲国产综合91精品麻豆| 可以看毛片的网址| av日韩国产| 亚洲国产乱码最新视频| 日日碰狠狠添天天爽超碰97| 樱桃视频成人在线观看| 欧美中文字幕一区二区三区亚洲| 亚洲36d大奶网| 97色婷婷成人综合在线观看| 欧美高清一级片在线| 佐山爱在线视频| 牛牛视频精品一区二区不卡| 日韩高清中文字幕| www.涩涩爱| 欧美一区二区性| 久久亚洲国产精品| 麻豆精品一区二区三区视频| 亚洲激情女人| 欧美国产精品人人做人人爱| 国产尤物在线视频| 极品少妇xxxx精品少妇偷拍| 成人av免费看| 黄色片在线播放| 日韩毛片视频在线看| 人妻夜夜添夜夜无码av| 日韩一级二级| 日韩一区二区精品葵司在线| 极品人妻一区二区三区| 忘忧草精品久久久久久久高清| 久久琪琪电影院| 欧美精品二区三区| 美女一区二区三区在线观看| 国产精品手机视频| www.中文字幕久久久| 亚洲一区免费在线观看| 能在线观看的av网站| 免费观看亚洲天堂| 亚洲男人av电影| 欧美黑人一级片| 欧美日韩免费观看一区=区三区| 91精品国产高清自在线| 国产精品视频在线观看免费| 国产高清一区日本| 四虎影视永久免费在线观看一区二区三区| 性爱视频在线播放| 欧美日韩欧美一区二区| 少妇饥渴放荡91麻豆| 亚洲欧美综合久久久| 日本在线精品视频| 欧美视频xxx| 国产精品水嫩水嫩| 久久这里只有精品23| 精品午夜视频| 色婷婷**av毛片一区| 国产91精品视频在线观看| 综合 欧美 亚洲日本| 中文在线一区| 91久久国产婷婷一区二区| 国产小视频免费在线网址| 最新欧美精品一区二区三区| 亚洲国产精品三区| 婷婷五月色综合香五月| 久久久久久久久综合| www.成人免费视频| 国产欧美日韩亚州综合| 激情五月开心婷婷| 亚洲精品国模| 午夜精品一区二区三区在线| 亚洲第一视频在线播放| 国内精品在线观看视频| 男人天堂网视频| 人在线成免费视频| 亚洲国产精品免费| 国产一级黄色av| 国产suv精品一区二区三区| 干日本少妇视频| 欧美videos粗暴| 亚洲图片欧美日产| 亚洲黄网在线观看| 国产色婷婷亚洲99精品小说| 粉嫩虎白女毛片人体| 蜜桃一区二区三区| 97涩涩爰在线观看亚洲| 色网站在线免费观看| 天天影视涩香欲综合网| 完美搭档在线观看| 欧美激情亚洲| 成人a视频在线观看| 久久视频www| 精品视频在线看| 国产小视频你懂的| 国产精品1区二区.| 农民人伦一区二区三区| 日本久久二区| 另类视频在线观看| 天天干免费视频| 五月天亚洲精品| 国产性生活毛片| 尤物在线精品| 欧美极品视频一区二区三区| 黄色精品视频| 久久精品国产欧美激情| www.热久久| 亚洲电影第三页| 日本高清久久天堂| 久久国产精品免费看| 久久精品人人做| 婷婷免费在线观看| 欧美99在线视频观看| 国产欧美在线一区二区| 国产精品av一区二区三区| 中文字幕日韩欧美在线视频| 性做久久久久久久久久| 欧美性极品xxxx娇小| 快灬快灬一下爽蜜桃在线观看| 国产精品一色哟哟哟| 日本中文字幕网址| 爽成人777777婷婷| 999国产视频| 国产超碰精品| xxx欧美精品| 人妻一区二区三区四区| 欧美羞羞免费网站| 国产一级在线观看视频| 91丨九色丨蝌蚪丨老版| 欧美在线aaa| 亚洲午夜电影| 欧美午夜精品久久久久免费视| 亚洲伦乱视频| 久久久欧美一区二区| 大地资源中文在线观看免费版| 欧美在线观看视频一区二区| 五月天综合在线| 国产精品青草久久| 熟妇高潮精品一区二区三区| 激情五月婷婷综合| 黑森林福利视频导航| 欧美黄污视频| 亚洲精品免费在线看| 亚洲日本va| 国产精品一香蕉国产线看观看| 蜜桃视频在线网站| 久久精品国产欧美激情| 韩日视频在线| 日韩一区二区免费视频| 这里只有精品国产| 欧美午夜久久久| 欧美精品一区二区蜜桃| 久久九九久久九九| 男男一级淫片免费播放| 精品一区二区三区免费| 久久久久久久少妇| 欧美.日韩.国产.一区.二区| 亚洲欧美日产图| 女仆av观看一区| 国产精品免费一区二区| 亚洲伦理一区二区| 亚洲国产另类精品专区| 精品欧美一区二区在线观看视频| 午夜精品久久久久久毛片| 国产成人高潮免费观看精品| 性爱视频在线播放| 久久中文字幕一区| 日本中文字幕电影在线观看| 亚洲电影免费观看高清完整版在线| 国产美女自慰在线观看| 欧美三级资源在线| 波多野结衣毛片| 亚洲mv在线观看| 伊人365影院| |精品福利一区二区三区| 加勒比一区二区| 99re6这里只有精品视频在线观看| 亚洲妇女无套内射精| 国产精品99久久久久久似苏梦涵 | 欧美日韩国产在线看| 日韩三级小视频| 亚洲成人精品在线观看| 福利一区二区三区四区| 午夜一区二区三区视频| 久久精品性爱视频| 无码av免费一区二区三区试看| 日本亚洲色大成网站www久久| 一区二区三区中文字幕精品精品| 麻豆国产尤物av尤物在线观看| 一区二区三区四区中文字幕| 精品爆乳一区二区三区无码av| 一区二区三区精品| 亚洲二区在线播放| 亚洲国产精品久久人人爱蜜臀| 人人干人人干人人干| 一本久道久久综合中文字幕| 亚洲第一在线播放| 欧美亚男人的天堂| 精品人妻一区二区三区换脸明星| 5月丁香婷婷综合| www日本视频| 日韩精品在线影院| 在线观看麻豆| 欧美精品生活片| 久草在线视频福利| 日韩av免费在线看| 国产a亚洲精品| 91精品久久久久久久久青青| 久久精品九色| 蜜桃成人免费视频| 亚洲精品国产精品粉嫩| 在线观看日本一区| 国产精品大片| 青青青免费在线| 久久丁香综合五月国产三级网站| 日韩一级裸体免费视频| 性色av蜜臀av| 欧美大片在线观看一区二区| 天天在线女人的天堂视频| 激情网站在线观看| 欧美日韩另类在线| 在线能看的av| 欧美日韩国产精品成人| 亚洲av少妇一区二区在线观看| 777色狠狠一区二区三区| 国产毛片毛片毛片毛片| 亚洲第一免费播放区| 中文日本在线观看| 久久久久中文字幕| 全球最大av网站久久| 国产成人免费电影| 精品久久影视| 日韩欧美精品在线不卡| 羞羞答答成人影院www| 成人午夜免费在线视频| 亚洲欧美日韩精品一区二区 | 国产福利精品在线| 秋霞影院一区| 免费av在线一区二区| 欧美3p视频| 久草青青在线观看| 国产精品一区一区三区| 95视频在线观看| 国产精品免费网站在线观看| 日韩av片在线播放| 欧美影视一区在线| 少妇高潮一区二区三区99小说| 亚洲美女性视频| av电影院在线看| 成人午夜激情网| 啪啪亚洲精品| 国产无限制自拍| 国产乱码一区二区三区| 精品丰满少妇一区二区三区| 亚洲成人av电影在线| 在线免费观看日韩视频| 精品小视频在线| 污污视频在线| 国产精品xxx视频| 久久久久观看| www.日本三级| 麻豆久久一区二区| 最新在线黄色网址| 一区二区三区高清不卡| 中文字幕观看视频| 国产香蕉精品视频一区二区三区| 看女生喷水的网站在线观看| 国产精品视频在线播放| 99精品中文字幕在线不卡| 日韩免费av电影| 久久久久国内| 久久久久久久穴| 亚洲最新在线观看| 亚洲一区二区三区高清视频| 日韩第一区第二区| 日韩电影大全在线观看| 99成人精品| www.xxx亚洲| 久久女同精品一区二区| 日韩污视频在线观看| 亚洲精品在线电影| 免费高清在线观看| 成人网在线观看| 91亚洲一区| 美女黄色片视频| 99re8在线精品视频免费播放| 亚洲精品1区2区3区| 亚洲精品视频久久| 黄色综合网址| 蜜桃麻豆91| 日韩和欧美的一区| 欧美精品日韩在线| 欧洲一区在线电影| 黄色小视频在线观看| 欧美亚洲视频在线观看| 精品久久美女| 亚洲色图偷拍视频| 亚洲国产精品精华液ab| 亚洲一区中文字幕在线| 在线视频亚洲欧美| 91大神在线观看线路一区| 日产国产精品精品a∨| 久久超碰97中文字幕| 三上悠亚作品在线观看| 日韩欧美卡一卡二| 两个人看的在线视频www| 日本一区二区三区四区高清视频| 性欧美暴力猛交另类hd| 极品人妻videosss人妻| 欧美久久免费观看| 啪啪免费视频一区| 欧美日韩一区二区三区在线视频| 免费看日韩精品| 久久久久噜噜噜亚洲熟女综合| 亚洲精品国产精品国自产在线 | 亚洲一区av在线播放| 欧美成人影院| 国产伦精品一区二区三区四区视频| 久久精品91| 色哟哟一一国产精品| 亚洲第一精品福利| 国精产品一区二区三区有限公司 | 国产精品三级电影|