精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Apache Flink在唯品會的實踐

大數據
目前在唯品會實時平臺并不是一個統一的計算框架,而是包括Storm,Spark,Flink在內的三個主要計算框架。由于歷史原因,當前在Storm平臺上的job數量是最多的,但是從去年開始,業務重心逐漸切換到Flink上面,所以今年在Flink上面的應用數量有了大幅增加。

唯品會實時平臺現狀

目前在唯品會實時平臺并不是一個統一的計算框架,而是包括Storm,Spark,Flink在內的三個主要計算框架。由于歷史原因,當前在Storm平臺上的job數量是最多的,但是從去年開始,業務重心逐漸切換到Flink上面,所以今年在Flink上面的應用數量有了大幅增加。

實時平臺的核心業務包含八大部分:實時推薦作為電商的重點業務,包含多個實時特征;大促看板,包含各種維度的統計指標(例如:各種維度的訂單、UV、轉化率、漏斗等),供領導層、運營、產品決策使用;實時數據清洗,從用戶埋點收集來數據,進行實時清洗和關聯,為下游的各個業務提供更好的數據;此外還有互聯網金融、安全風控、與友商比價等業務,以及Logview、Mercury、Titan作為內部服務的監控系統、VDRC實時數據同步系統等。

Apache Flink在唯品會的實踐

實時平臺的職責主要包括實時計算平臺和實時基礎數據。實時計算平臺在Storm、Spark、Flink等計算框架的基礎上,為監控、穩定性提供了保障,為業務開發提供了數據的輸入與輸出。實時基礎數據包含對上游埋點的定義和規范化,對用戶行為數據、MySQL的Binlog日志等數據進行清洗、打寬等處理,為下游提供質量保證的數據。

在架構設計上,包括兩大數據源。一種是在App、微信、H5等應用上的埋點數據,原始數據收集后發送到在kafka中;另一種是線上實時數據的MySQL Binlog日志。數據在計算框架里面做清洗關聯,把原始的數據通過實時ETL為下游的業務應用(包括離線寬表等)提供更易于使用的數據。

Apache Flink在唯品會的實踐

Flink在唯品會的實踐

場景一:Dataeye實時看板

Dataeye實時看板是支持需要對所有的埋點數據、訂單數據等進行實時計算時,具有數據量大的特點,并且需要統計的維度有很多,例如全站、二級平臺、部類、檔期、人群、活動、時間維度等,提高了計算的復雜程度,統計的數據輸出指標每秒鐘可以達到幾十萬。

以UV計算為例,首先對Kafka內的埋點數據進行清洗,然后與Redis數據進行關聯,關聯好的數據寫入Kafka中;后續Flink計算任務消費Kafka的關聯數據。通常任務的計算結果的量也很大(由于計算維度和指標特別多,可以達到上千萬),數據輸出通過也是通過Kafka作為緩沖,最終使用同步任務同步到HBase中,作為實時數據展示。同步任務會對寫入HBase的數據限流和同類型的指標合并,保護HBase。與此同時還有另一路計算方案作為容災。 

Apache Flink在唯品會的實踐

在以Storm進行計算引擎中進行計算時,需要使用Redis作為中間狀態的存儲,而切換到Flink后,Flink自身具備狀態存儲,節省了存儲空間;由于不需要訪問Redis,也提升了性能,整體資源消耗降低到了原來的1/3。

在將計算任務從Storm逐步遷移到Flink的過程中,對兩路方案先后進行遷移,同時將計算任務和同步任務分離,緩解了數據寫入HBase的壓力。

切換到Flink后也需要對一些問題進行追蹤和改進。對于FlinkKafkaConsumer,由于業務原因對kafka中的Aotu Commit進行修改,以及對offset的設定,需要自己實現支持kafka集群切換的功能。對不帶window的state數據需要手動清理。還有計算框架的通病——數據傾斜問題需要處理。同時對于同步任務追數問題,Storm可以從Redis中取值,Flink只能等待。

場景二:Kafka數據落地HDFS

之前都是通過Spark Streaming的方式去實現,現在正在逐步切換到Flink上面,通過OrcBucketingTableSink將埋點數據落地到HDFS上的Hive表中。在Flink處理中單Task Write可達到3.5K/s左右,使用Flink后資源消耗降低了90%,同時將延遲30s降低到了3s以內。目前還在做Flink對Spark Bucket Table的支持。

場景三:實時的ETL

對于ETL處理工作而言,存在的一個痛點就是字典表存儲在HDFS中,并且是不斷變化的,而實時的數據流需要與字典表進行join。字典表的變化是由離線批處理任務引起的,目前的做法是使用ContinuousFileMonitoringFunction和ContinuousFileReaderOperator定時監聽HDFS數據變化,不斷地將新數據刷入,使用***的數據去做join實時數據。

我們計劃做更加通用的方式,去支持Hive表和Stream的join,實現Hive表數據變化之后,數據自動推送的效果。

Flink On K8S

在唯品會內部有一些不同的計算框架,有實時計算的,有機器學習的,還有離線計算的,所以需要一個統一的底層框架來進行管理,因此將Flink遷移到了K8S上。

在K8S上使用了思科的網絡組件,每個docker容器都有獨立的ip,對外也是可見的。實時平臺的融合器整體架構如下圖所示。

Apache Flink在唯品會的實踐

唯品會在K8S上的實現方案與Flink社區提供的方案差異還是很大的。唯品會使用K8S StatefulSet模式部署,內部實現了cluster相關的一些接口。一個job對應一個mini cluster,并且支持HA。對于Flink來說,使用StatefulSet的***的原因是pod的hostname是有序的;這樣潛在的好處有:

hostname為-0和-1的pod可以直接指定為jobmanager;可以使用一個statefulset啟動一個cluster,而deployment必須2個;Jobmanager和TaskManager分別獨立的deployment。

pod由于各種原因fail后,由于StatefulSet重新拉起的pod的hostname不變,集群recover的速度理論上可以比deployment更快(deployment每次主機名隨機)。 鏡像的docker entrypoint腳本里面需要設置的環境變量設置說明:

| 環境變量名稱 | 參數 | 示例內容 | 說明 | |--- |---|---|---|---| | JOB_MANGER_HOSTS | StatefulSet.name-0,StatefulSet.name-1 | flink-cluster-0,flink-cluster-1 | JM的主機名,短主機名;可以不用FQDN | | FLINK_CLUSTER_IDENT | namespace/StatefulSet.name | default/flink-cluster | 用來做zk ha設置和hdfs checkpiont的根目錄 | | TASK_MANAGER_NUMBER_OF_TASK_SLOTS | containers.resources.cpu.limits | 2 | TM的slot數量,根據resources.cpu.limits來設置 | | FLINK_ZK_QUORUM | env:FLINK_ZK_QUORUM | 10.198.199.112:2181 | HA ZK的地址 | | JOB_MANAGER_HEAP_MB | env:JOB_MANAGER_HEAP_MB value:containers.resources.memory.limit -1024 | 4096 | JM的Heap大小,由于存在堆外內存,需要小于container.resources.memory.limits;否則容易OOM kill | | TASK_MANAGER_HEAP_MB | env:TASK_MANAGER_HEAP_MB value: containers.resources.memory.limit -1024 |4096 | JM的Heap大小,由于存在堆外內存,需要小于container.resources.memory.limits;否則容易OOM kill |

對應Flink集群所依賴的HDFS等其他配置,則通過創建configmap來管理和維護。

  1. kubectl create configmap hdfs-conf --from-file=hdfs-site.xml --from-file=core-site.xml 

后續計劃

當前實時系統,機器學習平臺要處理的數據分布在各種數據存儲組件中,如Kafka、Redis、Tair和HDFS等,如何方便高效的訪問,處理,共享這些數據是一個很大的挑戰,對于當前的數據訪問和解析常常需要耗費很多的精力,主要的痛點包括:

  • 對于Kafka,Redis,Tair中的binary(PB/Avro等格式)數據,使用者無法快速直接的了解數據的schema與數據內容,采集數據內容及與寫入者的溝通成本很高。
  • 由于缺少獨立的統一數據系統服務,對Kafka,Redis,Tair等中的binary數據訪問需要依賴寫入者提供的信息,如proto生成類,數據格式wiki定義等,維護成本高,容易出錯。
  • 缺乏relational schema使得使用者無法直接基于更高效易用的SQL或LINQ層API開發業務。
  • 無法通過一個獨立的服務方便的發布和共享數據。
  • 實時數據無法直接提供給Batch SQL引擎使用。
  • 此外,對于當前大部分的數據源的訪問也缺少審計,權限管理,訪問監控,跟蹤等特性。

UDM(統一數據管理系統)包括Location Manager, Schema Metastore以及Client Proxy等模塊,主要的功能包括:

  • 提供從名字到地址的映射服務,使用者通過抽象名字而不是具體地址訪問數據。
  • 用戶可以方便的通過Web GUI界面方便的查看數據Schema,探查數據內容。
  • 提供支持審計,監控,溯源等附加功能的Client API Proxy。
  • 在Spark/Flink/Storm等框架中,以最適合使用的形式提供這些數據源的封裝。

UDM的整體架構如下圖所示:

 

Apache Flink在唯品會的實踐

UDM的使用者包括實時,機器學習以及離線平臺中數據的生產者和使用者。在使用Sql API或Table API的時候,首先完成Schema的注冊,之后使用Sql進行開發,降低了開發代碼量。

Apache Flink在唯品會的實踐

在Flink中,使用UDMExternalCatalog來打通Flink計算框架和UDM之間的橋梁,通過實現ExternalCatalog的各個接口,以及實現各自數據源的TableSourceFactory,完成Schema和接入管控等各項功能。

關于作者:王新春目前在唯品會負責實時平臺相關內容,主要包括實時計算框架和提供實時基礎數據,以及機器學習平臺的工作。之前在美團點評,也是負責大數據平臺工作。他已經在大數據實時處理方向積累了豐富的工作經驗。

責任編輯:未麗燕 來源: 李博bluemind
相關推薦

2021-05-06 11:54:40

大數據Flink

2017-03-29 10:09:44

敏捷Scrum實踐

2017-03-21 10:24:40

敏捷Scrum實踐總結

2017-03-22 09:04:21

敏捷Scrum實踐

2024-06-03 10:19:05

2016-11-10 19:10:09

唯品會雙11

2021-05-20 09:55:23

Apache Flin阿里云大數據

2022-09-16 08:23:22

Flink數據湖優化

2014-02-25 19:22:18

唯品會樂蜂網

2019-04-30 09:00:33

SQL數據庫Apache Flin

2022-04-22 09:05:12

蔚來汽車Flink實時數倉

2015-08-11 07:17:56

唯品會電商運營移動互聯網

2022-05-10 08:27:15

小紅書FlinkK8s

2025-11-18 05:00:00

2022-06-10 15:21:15

MySQL CDCSqlServer數據庫

2013-08-09 16:54:07

華為ICT華為

2023-06-07 07:27:32

唯品會冷凍系統故障

2022-04-07 16:50:28

FlinkB站Kafka

2022-07-08 09:26:45

Flink快手計算
點贊
收藏

51CTO技術棧公眾號

国产传媒视频在线 | 蜜臀91精品国产高清在线观看| 亚洲一二三四久久| 精品视频导航| 中文字幕一区二区三区四区视频| 欧美在线日韩| 日韩精品亚洲视频| jizz大全欧美jizzcom| 在线中文字幕视频观看| 2023国产精品| 成人性生交大片免费看小说| www.av麻豆| 成人直播大秀| 亚洲国产成人精品一区二区 | 中文字幕求饶的少妇| 精品国产亚洲日本| 色婷婷久久99综合精品jk白丝| 一级日韩一区在线观看| 欧美一级免费片| 久久成人18免费观看| 欧美性在线观看| 亚洲波多野结衣| 九九视频精品全部免费播放| 日韩一区二区麻豆国产| 激情婷婷综合网| 日本色护士高潮视频在线观看| 久久久综合网站| 成人一区二区在线| 国产精品探花视频| 久久久成人网| 国外视频精品毛片| 欧美三级日本三级| 91视频一区| 亚洲午夜未删减在线观看| 最新版天堂资源在线| 色8久久久久| 欧洲视频一区二区| av天堂永久资源网| 国产99在线观看| 亚洲精品ww久久久久久p站| 日韩免费毛片| 四虎在线视频| 不卡一区在线观看| 都市激情久久久久久久久久久| 特级西西444www大精品视频免费看| 午夜日韩在线| 美女啪啪无遮挡免费久久网站| 午夜黄色福利视频| 欧美精选一区二区三区| 亚洲精品小视频在线观看| 韩国三级hd两男一女| 日韩欧美另类中文字幕| 69成人精品免费视频| 亚洲36d大奶网| 免费污视频在线一区| 色中色一区二区| 日韩av资源在线| 国产精品迅雷| 欧美在线一二三四区| 国产一区视频免费观看| 亚洲天堂一区二区| 日本韩国一区二区| 密臀av一区二区三区| 日本一区免费网站| 在线免费不卡视频| 91网址在线播放| 成人1区2区| 91精品婷婷国产综合久久| 一二三级黄色片| 日韩欧洲国产| 亚洲精品久久久久久久久久久久久| av无码一区二区三区| 全球av集中精品导航福利| 日韩极品精品视频免费观看| 欧美精品欧美极品欧美激情| 美女久久久久| 色妞色视频一区二区三区四区| 亚洲人与黑人屁股眼交| 综合精品一区| 91精品91久久久久久| 久久中文字幕免费| 日本欧美加勒比视频| 91免费看片网站| 黄频在线免费观看| 国产午夜亚洲精品理论片色戒| 亚洲精品人成| 肉肉视频在线观看| 精品久久久久久久久久久久久久 | 蜜桃视频m3u8在线观看| 日本精品视频一区二区三区| www.国产福利| 高清日韩中文字幕| 亚洲免费视频在线观看| 成年人看的免费视频| 欧美特黄一区| 国产成人免费av电影| 国产日韩欧美中文字幕| 成人av网站免费| 性欧美精品一区二区三区在线播放 | 高清在线视频不卡| 欧美午夜电影网| xxxxwww一片| 国产探花一区二区| 欧美成年人网站| 日韩人妻精品中文字幕| 韩国欧美国产1区| 黄色一区三区| 搞黄网站在线观看| 色综合久久久久| www激情五月| 国产精品嫩草影院在线看| 久久亚洲精品小早川怜子66| 亚洲s码欧洲m码国产av| 国产在线视频一区二区三区| 欧美一区视久久| 七七成人影院| 欧美久久久久久蜜桃| 91精品人妻一区二区| 999视频精品| 欧美性在线观看| 亚洲欧美另类综合| 亚洲欧洲国产日韩| 亚洲黄色av网址| 琪琪久久久久日韩精品 | 成人爽a毛片免费啪啪动漫| 欧美午夜寂寞影院| 野外性满足hd| 精品动漫一区| 91网站免费观看| av资源网在线观看| 日韩欧美精品网址| 国产精品一区二区人妻喷水| 亚洲精品888| 国产欧美在线视频| 在线免费看a| 欧洲国内综合视频| 午夜理伦三级做爰电影| 亚洲经典在线| 国产99在线免费| 2024短剧网剧在线观看| 欧美精选一区二区| 日韩精品久久久久久久的张开腿让| 久久一区欧美| 欧洲一区二区日韩在线视频观看免费 | 蜜臀尤物一区二区三区直播| www.日本不卡| 久无码久无码av无码| 亚洲一区二区免费在线观看| 欧美大片免费观看| www.黄色av| 亚洲黄色av一区| 久久精品一二三四| 中文av一区| 91久久精品www人人做人人爽| 黄色精品免费看| 欧美精品久久久久久久久老牛影院| 精品熟妇无码av免费久久| 日韩电影在线一区二区| 日韩在线国产| 欧美91在线|欧美| 搡老女人一区二区三区视频tv| 亚洲性猛交富婆| 国产精品久久久久影视| 亚洲国产成人va在线观看麻豆| 成人久久一区| 91亚洲国产精品| 日韩少妇视频| 日韩www在线| 一级黄色在线观看| 中文字幕一区二区视频| 四虎成人在线播放| 韩国在线视频一区| 麻豆精品视频| 精品成人av| 日韩在线国产精品| 性欧美8khd高清极品| 亚洲成av人片| xxxx日本黄色| 国产真实乱偷精品视频免| 日韩欧美精品免费| 久久影视三级福利片| 日韩免费在线免费观看| 亚洲s色大片| 精品少妇一区二区三区在线视频| www.国产高清| 国产精品色眯眯| 无码国产精品一区二区高潮| 国产欧美日本| 一区二区三区四区视频在线观看| 亚洲一区二区三区免费| 国产极品精品在线观看| h视频在线免费观看| 亚洲国产精彩中文乱码av在线播放 | 亚洲精品乱码久久久久久蜜桃欧美| 国产欧美在线| 中文字幕一区二区三区在线乱码 | 欧美白人最猛性xxxxx69交| 天天操天天摸天天干| 国产精品国产三级国产三级人妇| 最新日本中文字幕| 久久国产综合精品| 女人天堂av手机在线| 91久久高清国语自产拍| 久久精品aaaaaa毛片| 亚洲伊人精品酒店| 538国产精品视频一区二区| 黄网站免费在线观看| 精品中文字幕久久久久久| 国产肥老妇视频| 欧美亚洲国产bt| 日本熟女一区二区| 亚洲欧美日韩综合aⅴ视频| 亚洲天堂久久新| 国产成人三级在线观看| 午夜免费福利在线| 一本久道久久综合狠狠爱| 最新精品视频| 国产麻豆精品久久| 狠狠色综合一区二区| 看亚洲a级一级毛片| 国产精品视频公开费视频| 男人久久天堂| 欧美国产在线视频| 日本中文字幕在线播放| 亚洲精品在线不卡| 亚洲狼人综合网| 91精品国产色综合久久久蜜香臀| 国产免费一级视频| 亚洲成人av电影| 亚洲国产美女视频| 中文字幕一区二区视频| 男女做爰猛烈刺激| 91麻豆国产在线观看| av不卡中文字幕| 国产精品系列在线播放| 五月天激情播播| 蜜芽一区二区三区| 男女无套免费视频网站动漫| 国产精品毛片| 欧美日韩黄色一级片| 136国产福利精品导航网址| 视色,视色影院,视色影库,视色网 日韩精品福利片午夜免费观看 | 亚洲xxx拳头交| 一区二区三区四区欧美日韩| 99精品全国免费观看视频软件| 日韩精品不卡| 国产一区二区三区网| 日韩电影大全在线观看| 你懂的视频欧美| 欧美在线日韩精品| 欧美日韩久久精品| 亚洲国产欧洲综合997久久 | 少妇一级淫片免费放中国| 亚洲高清在线精品| 黄色激情视频在线观看| 姬川优奈aav一区二区| 国产精品第9页| 欧美网站在线观看| 久久国产乱子伦精品| 欧美中文字幕亚洲一区二区va在线 | 国产精品高潮呻吟视频| 国产精品黄色片| 国产男女猛烈无遮挡91| 国产精品亚洲欧美日韩一区在线 | 欧美激情视频一区| 爱情岛亚洲播放路线| 26uuu国产精品视频| 高清成人在线| 国产精品直播网红| 国产一区二区三区亚洲综合| 成人黄色在线免费观看| 欧美1区2区3区4区| 欧美一级爱爱| 爽成人777777婷婷| 免费的一级黄色片| 国产一区91| www.亚洲高清| 国产99精品国产| 国产在线观看无码免费视频| 欧美极品另类videosde| 一区二区成人免费视频| 午夜欧美2019年伦理| 久久久久久久久久一级| 91麻豆精品国产91久久久更新时间| 亚洲奶汁xxxx哺乳期| 亚洲色图日韩av| 粗大黑人巨茎大战欧美成人| 97成人超碰免| 伊人久久大香| 蜜桃麻豆91| 亚洲国产不卡| 欧美日韩亚洲一| 国产综合色视频| 国产偷人妻精品一区| 亚洲人精品午夜| 久久久久99精品成人片三人毛片| 欧美日韩和欧美的一区二区| 黑人乱码一区二区三区av| 最近2019免费中文字幕视频三| 污污的网站在线看| 国产精品jvid在线观看蜜臀| 欧美激情三级| 日韩精品一区二区三区色偷偷| 欧美一区视频| 亚洲高清在线免费观看| av午夜一区麻豆| 多男操一女视频| 色综合天天综合在线视频| 精品国精品国产自在久不卡| 在线日韩av观看| 国产拍在线视频| 98国产高清一区| 欧美日中文字幕| 久久免费视频3| 国产不卡高清在线观看视频| 亚洲不卡的av| 91精品福利在线| 无套内谢的新婚少妇国语播放| 久久亚洲影音av资源网 | 三叶草欧洲码在线| 亚洲欧美偷拍三级| 少妇一级淫片日本| 国产丝袜一区二区三区| 欧美家庭影院| 91免费观看网站| 天天综合国产| 婷婷激情四射五月天| 99久久综合99久久综合网站| 强行糟蹋人妻hd中文| 欧美丰满美乳xxx高潮www| 国产毛片在线看| 国产91精品不卡视频| 福利电影一区| 国内少妇毛片视频| 国产传媒一区在线| 成人免费视频国产免费观看| 精品视频色一区| av在线播放免费| 国产精品99久久久久久人| 免费视频国产一区| 久久久久久久久久久免费视频| 久久综合九色综合97婷婷| 日本熟妇成熟毛茸茸| 亚洲精品在线免费播放| 欧美videosex性欧美黑吊| yy111111少妇影院日韩夜片 | 久久亚洲精品视频| 国产精品一区二区三区四区在线观看 | 免费看av毛片| 国模吧一区二区| 麻豆一区二区| 99福利在线观看| 国产午夜精品一区二区 | 国产丝袜在线观看视频| 成人激情av| 夜夜精品视频| 国产全是老熟女太爽了| 在线观看精品一区| 日本中文字幕在线播放| 5566中文字幕一区二区| 国产精品激情电影| 少妇一级淫片免费放播放| 精品久久久香蕉免费精品视频| 偷拍自拍在线| 国产精品久久久久久久久久尿| 国内成人精品| 性chinese极品按摩| 一区二区三区在线播放| 日韩一区二区三区在线观看视频| 国产91精品久久久久久| 黄色不卡一区| 国产精欧美一区二区三区白种人| 亚洲欧美一区二区三区孕妇| 性生交大片免费看女人按摩| 国外色69视频在线观看| 欧美手机视频| 天天色天天干天天色| 午夜欧美大尺度福利影院在线看 | 久久精品在线播放| 97久久综合精品久久久综合| 日本久久久精品视频| 国产精品视频一二三| 性网爆门事件集合av| 欧美最近摘花xxxx摘花| 欧美肥老太太性生活| 2018国产精品| 色8久久人人97超碰香蕉987| 大片免费在线观看| 久久免费看av| 黄页网站大全一区二区| 日韩 欧美 精品| 中文字幕av一区中文字幕天堂| 麻豆一二三区精品蜜桃| 国产美女无遮挡网站| 自拍av一区二区三区| 欧美套图亚洲一区| 99re国产在线播放| 日韩av在线免费观看不卡| 五月天丁香激情| 一本久久综合亚洲鲁鲁|