精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

WeOLAP:微信 OLAP 湖倉新場景優化實踐

大數據 數據湖
ClickHouse 在微信團隊有著廣泛應用,如實時報表、AB 實驗和實時計算等,通過將 Hadoop 相關生態集成到 ClickHouse 中,性能得到了十倍到百倍的提升,能夠做到萬億級數倉、亞秒級響應和穩定高可用。

 ClickHouse 在微信有著廣泛應用,如何保障其自身查詢性能,并能在新場景中結合應用成為了關鍵問題。基于該背景,開發團隊首先針對ClickHouse 的性能問題,開發了相應的性能觀測工具,并在數據查詢、策略實驗等場景針對性進行了湖倉讀取、bitmap 計算等方面的探索優化,最后將 ClickHouse 在 AI 場景進行落地應用,沉淀了融合 OLAP 能力的成熟數據管線。

一、ClickHouse 在微信的應用

1. ClickHouse 在微信的應用

ClickHouse 在微信團隊有著廣泛應用,如實時報表、AB 實驗和實時計算等,通過將 Hadoop 相關生態集成到 ClickHouse 中,性能得到了十倍到百倍的提升,能夠做到萬億級數倉、亞秒級響應和穩定高可用。

圖片

ClickHouse 在微信的集群規模有數千臺,Top50 響應時長約 0.34 秒,平均響應時長為 4 秒,查詢量級為每天百萬級。當前的主要版本是基于社區的 22.8,少量版本對應社區 23.3。

圖片

2. 新場景應用

過去一年我們探索了 ClickHouse 的一些新的應用場景。在湖倉讀取方面,基于 Iceberg/Hive 進行讀取和湖上數據加工,來緩解數據孤島問題;在實驗新場景上,進行畫像分析、人群圈選,支撐實時可見的在線實驗系統;另外,也與 AI 進行結合,通過成熟的 OLAP 數據管線為近/離線模型推理進行提效。

圖片

二、ClickHouse 的性能觀察工具

作為一個用戶,需要感知查詢的資源消耗;作為一個運維同學,需要知道如何優化集群負載;作為一個開發同學,需要快速定位慢查詢的原因。這些都離不開性能觀察工具。ClickHouse 提供了一系列便捷的性能觀測工具,如 Query Log、Query Thread Log、Sampling Query Profiler 和 Flame Graph 等。

圖片

首先是最常用的 Query Log 和 Query Thread Log,通過查詢的 query id,可以對這條查詢性能進行觀察分析。我們還可以在代碼中增加自定義的 Profile Event,方便定制一些觀測指標。

圖片

第二個是 Sampling Query Profiler 和 ClickHouse Flame Graph,通過可視化的火焰圖能夠直觀地對內存和 CPU 進行分析,在 CH 可以對指定查詢進行 profile,支持的最細粒度為 query 級別。它有一個缺點,會將一個查詢涉及到的多個線程匯聚到一起,導致無法對單個線程的情況進行分析。我們針對這個問題也做了改進優化,使它能支持線程級的單個展示和查詢聚合。

圖片

第三個是 Processors Profile Log,它可以幫助我們清晰地看到每個算子的耗時,判斷算子間是否均衡、是否存在傾斜情況,也可以幫助我們看到算子間的依賴關系。

圖片

WeOLAP 團隊還自研了性能分析工具 Profile Engine,從事前和事后兩個場景進行優化。在事前對用戶提交的 SQL 結合集群信息和表信息進行分析,并基于索引、分區等給出相應可視化改進建議;在事后基于制定的規則對大查詢和慢查詢進行分析,給出優化建議。通過這個工具,既可以給使用者提出優化建議,也可以幫助使用者平衡集群負載。該工具上線后的使用效果很不錯。

圖片

三、湖倉讀取優化

ClickHouse 在湖倉鏈路中既是存儲組件又是計算組件,跨層的存在會導致一些問題:

  • ClickHouse 中的數據有孤島化傾向,不能被 Spark、Presto 等引擎查詢。
  • 數據冗余,Shared-nothing 帶來昂貴的機器成本。
  • 繁瑣的數據 ETL。

我們的改進目標是讓 ClickHouse 作為計算組件,直接讀取湖倉數據。

圖片

其中存在一些挑戰:

  • ClickHouse 目前只支持單機讀取 Hive。
  • ClickHouse 支持讀取 Iceberg,但僅限 S3 存儲。
  • Iceberg 沒有 C++ 的 API。
  • 現在只支持 Hive/Iceberg 外表,一旦表 schema 變化,需要手動同步 DDL 修改。
  • 部分場景的 ORC 讀取性能不佳。

圖片

針對上述問題,我們采取了如下優化措施:

  • 新增外置 HTTP 協議的 Iceberg API server,使用 Java 繞開 C++ 限制,實現外置 server。
  • 通過一致性 hash 分發文件路徑到各節點實現分布式讀取。
  • 對元信息和數據文件進行 cache。
  • 讀取集群和計算集群分離。

圖片

增加外庫實現,避免手動繁瑣的建表和元信息不一致問題。

圖片

ClickHouse 在讀取某些 ORC 文件時會很慢,例如示例的 select * 和 select count(1)。

圖片

通過火焰圖分析,我們發現 Apache Arrow 庫讀取 ORC 有大量的 memcpy,十分影響性能。我們切換到了 Apache ORC 庫進行讀取,整體性能提升了 0.5 到 1 倍。

圖片

在某些場景會出現 IO 浪費,如圖中的 select 一列,在 stripe size 為 4MB 和 64MB 時,對應解壓后的大小相等,但 HDFS 讀取量差異很大。

圖片

ReadBuffer 在讀取時很容易 cache 大量我們不需要的數據,幫我們緩存很多不需要的列,造成大量 IO 浪費。此外,在讀取時會先讀 stripe footer,再讀 row data,導致頻繁地 HDFS seek。以上這兩點是造成 IO 浪費的主要原因。

圖片

我們采用 IO 預讀機制對 ORC 的讀取性能進行優化。首先,ORC 文件可以提前計算文件中哪些 range 是需要被讀取的,基于此,我們將讀取規則改為當讀命中某個 range 時,按照 range 粒度執行預讀,并將臨近 range 進行合并,減少HDFS seek 次數。

圖片

在應用該讀取優化后,性能提升十分明顯,以圖中的讀取 6 列為例,原有的 40 秒查詢縮短至 3.7 秒,提升了 10 倍。

圖片

此外,我們還做了 HDFS 優化、元信息優化和資源并發鏈接限制,基于這些優化,在典型場景性能提升了 5 到 10 倍。

四、實驗場景 Bitmap 優化

在命中分析、畫像圈選中可以使用 bitmap 進行查詢加速,將原有的交并補邏輯轉換為位圖操作,相比明細表的聚合或 join 查詢,通常可以取得數倍的性能提升。

圖片

ClickHouse 數據按行進行拆分運算,在 bitmap 場景中,不用批數據的行數,即使行數相同,其代表的計算工作量也存在很大差異,造成了數據傾斜,其中某個 pipe 的工作量顯著高于別的 pipe,以至拖慢了整個查詢。

圖片

我們的解決方案是在執行引擎新增 repartition 階段,重新進行數據均衡,并將數據分發到所有后續 pipe。在大 bitmap 計算中,數據傾斜場景性能提升約 10%~20%。

圖片

我們通過 ClickHouse Flame Graph 對三個線程的執行過程進行分析,發現有兩個執行線程長時間等待,而另一個執行線程耗時在讀取 bitmap,讀取開銷遠大于計算。

圖片

ClickHouse 在 mark 級以下沒有任何并行化機制,我們針對性優化成支持行級并行讀取,對于大 bitmap 異步進行反序列化讀取,并減少內存拷貝操作。

圖片

另外,我們通過對原有字段編碼進行壓實,既節省了存儲空間,又提升了性能。

圖片

新增內核特性可編碼字典 Encode Dictionary,支持單機字典和副本同步字典,支持所有原生 ClickHouse 字典函數,支持 value to key 反查,以及 bitmap to bitmap 編碼。

圖片

在經過以上優化后,我們在測試數據集上的性能提升很明顯。在 bitmap32 上,求并集和交集有 10 倍的性能提升,在 bitmap64 上,有百倍的提升。

圖片

在實際業務應用上,bitmap64 場景從查不了變為查得快,bitmap32 場景從快到更快,在畫像分析、實驗留存分析和表存儲等方面優化效果都很不錯。

圖片

五、ClickHouse with AI

隨著機器學習的興起,圖片或文本通過 embedding 高維向量的方式表達,求解相似度會轉換為計算向量間的距離。在離線加工場景使用 OLAP 有很多優勢,比如可以基于元數據過濾、做一些聚合操作,以及配合 UDF 進行加工等等。此外,我們也在精確距離運算、ANN 索引等方面做了一些探索性的優化。

圖片

我們基于 ClickHouse 對整套算法鏈路做了重構,融合 OLAP 成熟數據管線,實現了推理、加工和檢索一體化。當有復用需求時,可以直接修改數據管線中的 SQL 配置或 UDF,從而大大降低了使用成本。

圖片

我們還做了向量精確檢索查詢優化,將其封裝為 SQL,對于后續的需求可以方便地進行修改迭代。并且對查詢 SQL 進行了性能優化:

圖片


  • 通過 SQL 改寫,采用 with 代替 join,減少冗余計算;prefilter 提前過濾不必要元素。
  • 使用 ZSTD 壓縮,優化數據結構。
  • 加入 repartition 階段,解決線程間數據傾斜問題。

圖片

另外,我們還優化了 embedding 計算相關函數,在業務場景中取得了 4 倍的性能提升:

  • 我們在內核中新增了一個向量距離計算函數 NormalizedCosineDistance,它可以在歸一化場景下減少整體計算量。
  • 同時我們也根據業務場景定制了 embedding vector distance 函數,通過大幅減少計算的過程中的 memcpy,性能有了很大的提升。

圖片

以上就是本次分享的內容,謝謝大家。

責任編輯:姜華 來源: DataFunTalk
相關推薦

2024-09-11 14:47:00

2023-10-13 07:25:50

2024-03-05 08:21:23

湖倉一體數據湖數據倉庫

2023-10-30 07:25:37

數據湖數據處理

2023-08-30 07:14:27

MaxCompute湖倉一體

2022-07-18 16:02:10

數據庫實踐

2024-12-16 08:34:13

2023-07-12 08:44:46

湖倉存儲系統數據湖

2022-09-15 09:32:42

數據倉處理

2022-12-21 08:32:34

OLAPDruid架構

2023-06-28 07:28:36

湖倉騰訊架構

2023-12-14 13:01:00

Hudivivo

2016-03-04 10:29:51

微信支付源碼

2019-06-21 10:40:25

微信小程序前端

2021-06-07 10:45:16

大數據數據倉庫數據湖

2012-03-13 15:46:44

計世網

2022-05-18 13:24:47

京東調優實踐

2021-06-11 14:01:51

數據倉庫湖倉一體 Flink
點贊
收藏

51CTO技術棧公眾號

蜜臀av中文字幕| 老司机av网站| аⅴ资源新版在线天堂| 人人超碰91尤物精品国产| 在线观看欧美日韩国产| 欧美色图校园春色| 蜜桃视频在线网站| 中文字幕字幕中文在线中不卡视频| 99re视频在线| 日本免费精品视频| 欧美91精品| 亚洲桃花岛网站| 韩国一区二区三区四区| 怡红院成人在线| 亚洲激情男女视频| 日本在线观看一区二区三区| 精品久久国产视频| 免费成人在线观看视频| 久久久亚洲成人| 成人无码精品1区2区3区免费看| 风间由美一区二区av101 | 精品一区二区影视| 4438全国成人免费| 超碰在线国产97| av一区二区在线观看| 精品免费国产二区三区| 黄色在线视频网| 色戒汤唯在线观看| 一区二区三区在线看| 亚洲精品二区| 久青青在线观看视频国产| 国产东北露脸精品视频| 国产日韩欧美成人| 亚洲天堂男人av| 亚洲尤物精选| 韩剧1988在线观看免费完整版| 国产免费久久久久| 日韩av在线中文字幕| 精品视频久久久久久久| 国产xxxxxxxxx| 久久九九精品视频| 欧美日韩国产区一| 日本三区在线观看| 蜜桃麻豆av在线| 婷婷久久综合九色国产成人 | 欧美精品videos另类| 久久久精品欧美丰满| 蜜桃久久精品乱码一区二区| 涩涩视频免费看| 国产电影一区二区三区| 91久久久久久久久久久| 一级黄色片在线看| 激情深爱一区二区| 成人乱人伦精品视频在线观看| 在线观看色网站| 青娱乐精品视频| 国产精品一区二区三| 国产成人av免费| 蜜臂av日日欢夜夜爽一区| 国产精品久久久久久久久久尿| 国产日韩久久久| 日本中文一区二区三区| 国产精品久久久久免费a∨大胸| 九九热最新视频| 人人爽香蕉精品| 91精品在线观看视频| 国产老妇伦国产熟女老妇视频| 韩国一区二区在线观看| 91免费在线视频网站| 99热这里只有精品在线| 成人福利视频在线看| 免费看成人午夜电影| 国产一级片在线| 国产精品蜜臀在线观看| 中文字幕久久一区| 色操视频在线| 精品福利在线观看| 欧美污视频网站| 深夜视频一区二区| 日韩精品一区国产| jizz久久久久久| 亚洲国产乱码最新视频| 国产特级黄色大片| 欧美日韩视频免费观看| 欧美日韩国产片| 99精品视频免费版的特色功能| 国产精品国产| 国产亚洲激情在线| 91视频综合网| 一本久道久久综合狠狠爱| 日本久久中文字幕| 国产男女无套免费网站| 99热在这里有精品免费| 亚洲精品自在在线观看| 毛片在线导航| 欧洲av一区二区嗯嗯嗯啊| 亚洲色图欧美自拍| 色88888久久久久久影院| 日韩专区中文字幕| 日本在线小视频| 久久精品国产精品亚洲红杏| 天堂成人免费av电影一区| 久久久免费电影| 国产天堂第一区| 盗摄精品av一区二区三区| 天堂社区 天堂综合网 天堂资源最新版 | 1pondo在线播放免费| 亚洲午夜精品在线| 日韩av在线中文| 日本成人中文| 欧美精品在线视频观看| 9i精品福利一区二区三区| 国产成人综合在线| 亚洲午夜高清视频| 樱花草涩涩www在线播放| 欧美一区二区三区喷汁尤物| 波多野结衣a v在线| 激情五月***国产精品| 成人免费午夜电影| 美丽的姑娘在线观看免费动漫| 亚洲激情av在线| 日本免费色视频| 九九精品在线| 97精品视频在线播放| 青青青在线观看视频| 啪啪小视频网站| 91热门视频在线观看| 欧美国产视频一区| 亚洲一区二区av| 一道本无吗dⅴd在线播放一区| 日韩三级视频在线| 国产精品99久久久久| 亚洲视频导航| 欧美aaa大片视频一二区| 亚洲欧美精品一区| 婷婷激情五月网| 成人午夜大片免费观看| 麻豆映画在线观看| 99亚洲男女激情在线观看| 亚洲色图偷窥自拍| 国产乱国产乱老熟| 99久精品国产| 国产午夜福利在线播放| 精品视频在线观看网站| 日韩中文综合网| 亚洲无码久久久久久久| 欧美高清在线一区二区| 黄色一级二级三级| 夜色77av精品影院| 91精品国产色综合久久不卡98| 亚洲第一页综合| 亚洲久草在线视频| 精产国品一区二区三区| 欧美成人嫩草网站| 成人高h视频在线| 免费人成在线观看播放视频| 欧美日韩中字一区| 日本在线观看网址| 国产一区在线观看麻豆| 桥本有菜av在线| 精品国产亚洲一区二区三区在线| 久久精品最新地址| 精品美女www爽爽爽视频| 一区二区三区四区激情| 91精品国产高清91久久久久久 | 黄色成人在线看| 精品国产影院| 欧亚精品在线观看| 成年人视频免费在线观看| 欧美日韩不卡一区| 日韩成人毛片视频| av在线综合网| 成人在线观看a| 999国产精品| 99c视频在线| 亚洲欧美韩国| 永久免费看mv网站入口亚洲| 国产伦精品一区二区三区视频痴汉| 日韩毛片一二三区| 欧美图片自拍偷拍| 久久久999| 激情五月五月婷婷| 日韩av资源网| 国产精品亚洲自拍| 欧美人与禽猛交乱配| 亚洲精品美女网站| 中文字幕 国产| 亚洲男帅同性gay1069| 91精品国产自产| 久久精品国产99| 成人精品视频在线播放| 精品国产91乱码一区二区三区四区| 国产在线视频91| free性m.freesex欧美| 亚洲色图17p| 国产黄a三级三级看三级| 丰满岳妇乱一区二区三区| 激情无码人妻又粗又大| 99这里只有精品| 九九热精品在线播放| 亚洲高清电影| 福利网在线观看| 国产欧美日韩| 国产经品一区二区| 成人午夜毛片| 456国产精品| 亚洲图区一区| 色悠悠国产精品| 成人在线观看91| 黄av在线播放| 亚洲精品日韩欧美| 亚洲av无码乱码国产麻豆| 在线视频国内自拍亚洲视频| 久久久久久久久久综合| 国产精品美女一区二区三区| 在线观看av中文字幕| 国产在线观看一区二区| www.日日操| 99日韩精品| 国产 欧美 日本| 日韩精品首页| 日本一区二区三区四区高清视频| 超碰成人免费| 91免费国产网站| 日本成人伦理电影| 性亚洲最疯狂xxxx高清| 亚洲无线看天堂av| 久久国产精品免费视频| 在线观看a视频| 亚洲欧美国产精品久久久久久久 | 日韩欧美亚洲区| 久久国产精品免费精品3p| 91在线在线观看| 国产在线不卡一区二区三区| 国产视频999| 91国拍精品国产粉嫩亚洲一区| 欧美一区二区三区免费视| 999福利在线视频| 久久久久国色av免费观看性色 | 高清不卡亚洲| 久久久久久久香蕉网| 一色桃子av在线| 日韩亚洲第一页| 77777影视视频在线观看| 亚洲一级黄色av| 国产特黄在线| 国产一区二区欧美日韩| 国产一级在线观看| 国产午夜精品一区二区三区 | 99久久精品国产网站| 亚洲欧美高清在线| 处破女av一区二区| 视频免费在线观看| www.色精品| 巨胸大乳www视频免费观看| 99视频在线精品| 好吊色视频一区二区三区| 欧美另类高清videos的特点| 国产视频一区二区三| 国产精品久久久久一区二区三区共| 性高潮久久久久久久| 国产拍揄自揄精品视频麻豆| 亚洲av无码国产精品麻豆天美| www久久精品| 鲁丝一区二区三区| 中文天堂在线一区| 日本黄色片免费观看| 一区二区三区四区亚洲| 黄网站免费在线| 亚洲3atv精品一区二区三区| 国产精品男女视频| 欧美在线视频你懂得| 一级黄色大片免费| 91精品国产福利| 农村少妇久久久久久久| 亚洲女成人图区| 丝袜美腿美女被狂躁在线观看| 久久最新资源网| hd国产人妖ts另类视频| 日韩免费av片在线观看| 日韩精品一级毛片在线播放| 97av影视网在线观看| 狼人精品一区二区三区在线 | 久久久噜噜噜久久中文字免| 台湾佬中文娱乐久久久| 91丨九色丨国产在线| 久久久久久久久久一区二区| 久久国产婷婷国产香蕉| 男男受被啪到高潮自述| 91色porny| 国产三级国产精品国产国在线观看 | 国产精品视频免费一区| 免费看成人哺乳视频网站| 国产成人精品免费看在线播放| 好吊一区二区三区| 国产第一页视频| 国产激情一区二区三区四区| 国产又爽又黄无码无遮挡在线观看| 国产精品二区一区二区aⅴ污介绍| 免费网站观看www在线观| 色爱区综合激月婷婷| 国产女人18毛片18精品| 亚洲人成电影网站| 污的网站在线观看| 国产成人啪精品视频免费网| 日韩成人视屏| 翔田千里亚洲一二三区| 夜久久久久久| 在线一区二区不卡| 国产情人综合久久777777| 精品无码一区二区三区电影桃花| 欧美最猛性xxxxx直播| 日韩在线观看视频一区| 久久精品福利视频| 粉嫩一区二区三区| 国产成人精品一区二区三区福利| 99国产**精品****| 99视频在线免费| 不卡一区在线观看| 国产精品三区在线观看| 欧美日韩一区二区在线观看| 免费在线黄色电影| 2019亚洲日韩新视频| aaa国产精品| 在线观看三级网站| 国内精品视频666| 欧美a级片免费看| 欧亚一区二区三区| 国产在线网站| 欧美亚洲国产成人精品| 91麻豆精品激情在线观看最新| 亚洲精品偷拍视频| 开心九九激情九九欧美日韩精美视频电影 | 97精品资源在线观看| 西游记1978| 日韩成人精品在线观看| 欧美色图亚洲激情| 精品美女久久久久久免费| 日韩一级片免费看| 97精品免费视频| 欧美福利在线播放网址导航| xxxx18hd亚洲hd捆绑| 风间由美一区二区三区在线观看| 欧美做爰爽爽爽爽爽爽| 欧美精品亚洲二区| 久久黄色美女电影| 91视频免费网站| 欧美日韩hd| 成人在线观看一区二区| 亚洲自拍欧美精品| 色婷婷中文字幕| 性色av一区二区三区| 网红女主播少妇精品视频| 欧美一区二区中文字幕| 91在线视频18| 久久人人爽人人爽人人片av免费| 亚洲少妇激情视频| av成人亚洲| 日本三级中文字幕在线观看| 国产黄色精品网站| 日韩av电影网| 亚洲欧洲国产一区| 欧美xnxx| wwwjizzjizzcom| 成人激情小说乱人伦| 欧美日韩综合一区二区三区| 在线观看欧美视频| 精品国产欧美| 国产人妻777人伦精品hd| 91老师国产黑色丝袜在线| 国产偷人爽久久久久久老妇app| 日韩在线视频网站| 日韩精品一级| 日本免费不卡一区二区| 国产婷婷色一区二区三区四区| 中文字幕人成人乱码亚洲电影| 久久久精品美女| 国产精品自在| 宅男噜噜噜66国产免费观看| 亚洲人一二三区| 天天干天天摸天天操| 国产成人一区二区三区| 欧美 日韩 国产 一区| 亚洲人人夜夜澡人人爽| 在线不卡中文字幕播放| 草草在线视频| 伊人久久大香线蕉午夜av| 成人高清伦理免费影院在线观看| 亚洲高清视频免费观看| 欧美激情视频在线观看| 久久综合色占| 不许穿内裤随时挨c调教h苏绵| 色94色欧美sute亚洲线路二| 成人福利在线观看视频| 久久综合婷婷综合| 激情深爱一区二区| 国产亚洲欧美在线精品| 久久亚洲精品小早川怜子66| 精品在线99| 国产性猛交96|