精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

OPPO 下一代大數據 AI 一體架構實踐

人工智能 大數據
云廠商用存儲吸引用戶,進而提供上層 SaaS 服務。云原生彈性計算架構可提高調度效率,實現資源的自動彈性伸縮,優化資源利用。本文將展示OPPO 下一代大數據 AI 一體架構在功能云上的實踐,希望為大家帶來啟發。

一、技術架構

OPPO 大數據場景豐富,擁有海外的 AWS 功能云,國內自建機房,機器規模超過萬臺,在印度則是使用混合云模式。

首先來介紹一下 AWS 上功能云 EMR 的實踐。

1. 云原生計算架構

圖片

OPPO 早期全部采用 EMR,其存在以下一些問題:

  • 首先,彈性伸縮遲滯。上圖中展示了資源的分配效率(不是真正的資源利用率和機器的物理利用率),以及資源彈性趨勢圖。可以看到,凌晨高峰時資源使用率瞬間變高,回收資源持續了很長時間,效率低,彈性差。
  • 另外,編碼機器選型固化。云上的機器基本都是 Intel 的 x86 機型,無論是 AWS 還是阿里云提出的 ARM 機型從單價上就便宜 20-30%,但是 EMR 產品不兼容 ARM 機型。
  • 最后是調度算法固定。

圖片

為了解決上述問題,OPPO 自研了極致彈性計算架構——Yarn on EKS。EKS 是AWS 提供的托管型 Kubernetes 服務。Kubernetes 難以滿足大規模快速調度的需求,無法做到快速調度、機器可掌控、資源可控制。因此我們選用了 Yarn on EKS。

業界有很多開源的 RSS 解決方案,包括阿里巴巴的 RSS 平臺和騰訊的 Uniform 平臺。OPPO 的云需求較少,因此投入比較低。我們的架構 base 在分布式內存Alluxio 上,在 AWS 上實現彈性的 Alluxio 集群。思路是只做 shuffle 服務,存儲交給性能高的、更合適的存儲系統,開始是 HDFS、Cubefs 分布式文件系統,后面選用了 Alluxio。內部測試系統性能比較高,包括彈性 RSS 服務,可以根據壓力自動調整彈性。

資源調度優化,核心在于計算架構資源。自研架構下,資源利用率彈性效率高,每個小時都有一個波峰波谷,平均物理資源利用率達到 80% 以上,長時間維持在 80-90% 上下。

另外,組件全云化。除了 Yarn 和 Spark,大數據鏈路中還有許多其他關鍵的組件和工具,包括任務調度和工作流管理。調度采用的是 Airflow,并對其進行了一些自定義修改,以適應特定的任務調度需求或環境。Airflow 的 worker 基本是常駐資源,每一個業務來了之后都會申請 2 個 worker,費用昂貴,所以將其改為彈性的資源配置,有任務需要執行時才進行資源配置。

圖片

上圖展示了我們自研架構的資源看板。從右下方的彈性效率圖可以看到,每小時都會有波峰波谷,物理資源的平均利用率可以達到 80% 以上。

圖片

上圖是成本看板。原本 AWS 兩天才會出一次賬單,使用自研架構后,每個小時就會出一個賬單,包括單價花費以及每個機型的使用時間。

2. Data&AI 一體化數據湖架構

圖片

整體架構如上圖所示。主要解決的問題包括:

  • 數據秒級入湖,在公司內部替代了部分資源的使用,達到了降本的效果。
  • 自動化管理,Iceberg 缺少一層服務層,業務需要自己管理。
  • 兼容非結構化數據,我們做了一個 DAA Catalog 來兼容非結構化數據的管理。

采用分布式內存來解決實時性問題,雖然線上集群規模較大,但內存閑置比較多,使用分布式內存可以將內存資源更好地利用起來,在數據湖上用這種方式解決了數據實時入湖的問題。數據實時寫入分布式內存的 block 里面,然后 Dump 服務會定時管理這些 block 何時落到 Iceberg 底層的存儲上。

圖片

DAA Catalog 主要包括兩個模塊:Metastore 和管理模塊。Metastore 類似于 HMS,主要解決元數據生命周期管理的問題。管理模塊的功能主要包括:數據安全和數據血緣、dump 服務和動態聚合、非結構化數據的版本管理,以及非結構化數據的轉換服務。

圖片

實現秒級實時的做法是,在內存里把數據做成 real-data,底層是 base-data。另外很多 dele-data 也是放在內存里,這樣 Dump 的時候自動合并。分布內存管理使用的是 Alluxio,但是對功能進行了魔改,Alluxio2.9 開源版本的通信傳輸效率不好,我們通過修改使性能得到了顯著提升。另外還實現了 Alluxio 流式讀寫,數據可以逐條寫入。

圖片

Data & AI 中,Data 指的是結構化的數據,AI 的數據全是非結構化的數據。

結構化數據的處理最初是基于 Iceberg,目前可兼容多種接口協議。自動化管理包括cluster、dumper、indexer、combiner 等。另外對索引能力也做了增強。

圖片

我們在結構化數據的處理上嘗試了很多優化。因為是分布式內存的緩存,緩存上的性能加速,數據的索引,熱表緩存和數據預熱在內存里。

圖片

上圖展示了一個比較特殊的案例,是搜推業務在實時樣本拼接時遇到的一個問題,HBase 成本較高,且性能也不能滿足需求。提出的解決方案是多數據源主鍵實時 Join。涉及到的樣本數據,單條數據量比較大,平均一兆左右,把數據的索引放到分布式內存中,數據實時過來后在內存里的 hash partition 找到相關的索引去拼接,類似于 MOR 機制。

圖片

非結構化數據的管理,主要問題在于元數據,我們希望非結構化數據能夠像結構化數據那樣方便地使用。另外一個問題是數據格式轉換,有些處理方式還比較原始,落到湖上之后會有 Trans-Service,例如將圖片數據轉換成 h5 或 dataset 格式,dataset 格式參照 Updataset 協議,提供一個統一的上層 API。

圖中元數據轉換使用的是我們自己的 AndesGPT,也可以調用 ChatGPT。元數據embedding 到數據庫里面,方便上層自然語言式的查詢和搜索。

圖片

上圖是一個管理示例,我們可以像 SQL 查詢一樣去查詢圖片、文本數據的詳情。

圖片

DataPrompter,在公司內部的聊天系統中,在對話框里 @機器人可以很方便地查詢各種數據指標。開發過程中遇到的問題是,每輸入一個表格,需要人工編織很多詳細的 prompt,使 GPT 更好地去認識數據,寫更精準的 SQL,海量的數據需要一個一個地制作 prompt,這就會構成瓶頸。入湖之后,根據元數據包括一些普通的信息都自動生成轉換范例 prompt,從而使大模型能夠更好地理解湖倉上的數據。

在此基礎上,還會將歷史查詢的業務含義反饋到 prompt 里,以及業務方的測試反饋。

Databricks 提供 Model Pre-Trainingt 的 TensorBoard 模型,把湖倉上的元數據進行訓練,后期我們也會使用這種模式進行模型微調。

圖片

數據入湖階段,大語言模型為更好地寫出更精準的 SQL,會把 SQL 的規則編寫到prompt 里面。另外,表結構、字段和指標口徑說明打開直接寫進去。模型輸出OutputCommand 關注點和格式要求,輸出 SQL 對應寫法要求和標準。

二、應用落地

1. 實時特征平臺

圖片

實時特征平臺的架構如上圖所示。

圖片

通過主鍵實時 Join,實現了每秒拼接單機 qps-7k,延伸到多臺機器實現了線性的擴展。

2. 機器學習訓練數據加速

圖片

下面介紹機器學習訓練湖倉數據加速的方法。首先是搜推算法訓練數據加速,很多數據是裸的文本數據,txt 格式,上層的 Python 讀取的時候會涉及到序列化性能慢的問題,我們將文本數據轉換為 Parquet 格式,并使用 Arrow 庫來讀取。經過線上測試,性能會有 10 倍的提升。

圖片

大模型的訓練加速,會將裸的圖片數據轉換成分割好的 tar 包的 Dataset 的數據格式,通過緩存加速大模型訓練數據的讀取。訓練時圖片數據加載還是個瓶頸,圖片數據的數據量比較大,如果用比較大的 tar 包性能會比較差。通過轉換為小的 dataset 能得到數倍的性能提升。

3. 混合云場景應用

圖片

混合云在印度業務中有使用,但由于沒有太多算法的業務,機器規模較小。以混合云上數據湖倉數據任務靈活編排。DAA-Catalog 統一管理混合云數據復制遷移。

圖片

通過混合云模式,混合云數據任務遷移中,帶寬是主要的瓶頸,遷移的時候通過找到數據和計算對帶寬依賴最小的子圖的方式去遷移,同時也會考慮底層的數據一致性,使得數據入湖底層路徑透明。

圖片

DataPrompt 落地的情況,Datachart 架構流程如圖,底層是湖倉的數據,先確定是否為數據分析問題然后轉化為 SQL 執行,數據在湖倉上解決不了的話就聯網分析。Glacier 湖倉服務會找到這個表的 Prompt 推給大語言模型,進行自然語言數據分析。

圖片

上圖中展示了內部的使用情況。通過數據對比可以得出,大語言模型在數據分析上是比較有幫助的。

三、展望

圖片

未來仍會注重大數據方面的開發和發展。在公有云架構方面進一步深挖,公有云實施的彈性架構為公司節省了大量財務支出,單任務計算成本相比 EMR 降低了約 80% 左右,后續將嘗試更多手段,繼續深化這塊領域的技術。公有云架構 Spark on GPU 的加速已經實現,進一步要對接 Shuttle Service。Spark on GPU 的收益為,性能提升 4 倍,成本降低約 50%。引擎向量化 Gluten+Velox 的概念,業內比較火熱,各大公司都在嘗試,開發中存在一些問題,所以目前沒有過多的投入,但是未來的一個方向。持續降本增效永遠是底層技術的主題,降本和穩定性是兩條生命線,降本是否可以犧牲一定的穩定性這一問題仍需思考。

另外一個方向是 Data & AI 湖倉架構,很多業界頂尖公司都在推動這一理念。但是元數據管理存在痛點,活躍度低的表仍需解決沖突問題,向上與大模型應用結合。半結構化數據通過統一接口訪問,封裝了 dataset 的接口,向下需與 Paimon 結合,兼容更多底層格式,方便用戶查找和訓練數據。

責任編輯:姜華 來源: DataFunTalk
相關推薦

2015-10-15 10:30:32

2017-03-08 10:56:03

大數據架構數據湖

2013-07-27 21:28:44

2013-08-20 12:26:41

FusionCube融合一體機華為

2018-05-17 11:31:45

大數據IOTA架構數據架構

2025-01-03 09:24:10

模型架構論文

2022-07-06 11:38:40

人工智能AI

2012-11-16 11:31:39

大數據CRM

2013-07-22 09:47:17

大數據IBM技術大會

2021-05-22 23:01:21

人工智能網絡安全

2015-03-09 14:24:59

TeradataAppCenterAster

2013-09-25 15:55:57

WLANWiFi智能

2013-06-27 11:21:17

2024-02-07 09:00:00

2025-11-13 17:35:18

微軟AgenticAI 系統

2025-11-19 08:00:00

AI智能體企業安全人工智能

2015-10-19 17:15:33

網絡架構/華三

2012-06-07 09:06:04

主流云計算產品大數據分析

2016-11-14 18:17:42

Apache Beam大數據

2020-09-27 17:27:58

邊緣計算云計算技術
點贊
收藏

51CTO技術棧公眾號

欧美老妇交乱视频| 亚洲综合久久久| 国产精品99久久久久久久久| 久久久久久久久福利| 99精品国自产在线| 中文字幕一区二区三区视频| 97人人模人人爽人人少妇| 97免费在线观看视频| 免费成人av| 在线不卡免费av| 波多野结衣之无限发射| 成年人在线视频免费观看| 日韩中文字幕亚洲一区二区va在线| 日韩中文视频免费在线观看| 无码av免费精品一区二区三区| 欧美男男tv网站在线播放| 国产精品视频免费看| 国产精品免费视频一区二区| 中文字幕视频二区| 日本波多野结衣在线| 日韩视频网站在线观看| 亚洲免费在线看| 欧美色图亚洲自拍| 亚洲免费黄色片| 久久精品国产99久久6| 97久久国产精品| 男女性高潮免费网站| 国内成人精品| 亚洲国产欧美一区| 欧美国产日韩另类| 国产精品极品美女在线观看| 亚洲国产精品一区二区www| 亚洲无玛一区| 国产高清在线看| 91亚洲男人天堂| 大波视频国产精品久久| 国产精品久久久久久久久久久久久久久久 | 夜夜嗨av一区二区三区四季av | 亚洲av综合色区无码另类小说| 国产精品毛片久久久久久久久久99999999| 亚洲aⅴ怡春院| 91大学生片黄在线观看| 麻豆av在线导航| 国产精品乱人伦一区二区| 欧美一进一出视频| 日本人妖在线| 91免费视频观看| 久久爱av电影| 亚洲 精品 综合 精品 自拍| 成人精品高清在线| 国产精品一区二区三区在线| 国产wwwxxx| 国产乱码一区二区三区| 亚洲a在线观看| 国产精品无码久久av| 久久激情五月激情| 成人激情视频网| 91麻豆国产视频| 国产综合一区二区| 国产精品丝袜高跟| 91av国产精品| 国产精品一区二区你懂的| 91美女片黄在线观| 亚洲av综合色区无码一区爱av| 国产乱子伦视频一区二区三区| 91视频观看视频| 日韩在线观看免费网站 | 国产成人1区| 亚洲男人天堂网站| 天天操天天舔天天射| 青青草综合网| 久久久精品国产亚洲| 中文字幕av久久爽av| 国产一区二区三区四区老人| 欧美黑人xxxx| 黄色片视频网站| 久久国产精品久久w女人spa| 国产精品高清在线观看| 国产精品乱码久久久| 国产一区二区视频在线| 不卡视频一区| 美女毛片在线看| 国产精品久久综合| 妞干网在线播放| 校园春色亚洲| 欧美日韩一区视频| 国产精久久久久| 亚洲日产av中文字幕| 国产亚洲美女精品久久久| 亚洲熟女少妇一区二区| 欧美精品九九| 97在线看免费观看视频在线观看| 97人妻一区二区精品视频| 狠狠色狠狠色综合日日91app| 97人人做人人人难人人做| 手机福利小视频在线播放| 中文字幕欧美日本乱码一线二线 | 亚洲久久一区二区| 国产精品久久久久久久久久99 | 成人一级生活片| 综合日韩av| 欧美一区二区在线免费观看| 久久精品国产99国产精品澳门| 9.1在线观看免费| 欧美日韩爱爱| 欧美激情亚洲视频| 国产精品sm调教免费专区| 国产不卡免费视频| 日韩免费电影一区二区| 欧美hdxxxxx| 欧美日韩免费高清一区色橹橹| 91人人澡人人爽| 久久人人88| 51ⅴ精品国产91久久久久久| 国产日产亚洲系列最新| 国产亚洲一本大道中文在线| 成人免费a级片| 成人a在线观看高清电影| 精品盗摄一区二区三区| fc2ppv在线播放| 久久九九电影| 国内精品国语自产拍在线观看| 三区四区电影在线观看| 欧美色图在线视频| 少妇搡bbbb搡bbb搡打电话| 日本欧美视频| 欧美做受高潮电影o| 韩国av免费在线观看| 日韩美女啊v在线免费观看| 热久久精品国产| 青青久久av| 欧美精品福利视频| 国产女无套免费视频| 国产欧美日韩久久| 青青草原av在线播放| 国产精品nxnn| 欧美日韩aaaa| www.xxx国产| 亚洲丝袜另类动漫二区| 日本美女高潮视频| 欧美精品momsxxx| 啪一啪鲁一鲁2019在线视频| 刘亦菲久久免费一区二区| 亚洲精品v日韩精品| 永久免费的av网站| 日韩一区二区在线免费| 国产精品久久av| jizzjizz在线观看| 欧美私模裸体表演在线观看| 天天躁夜夜躁狠狠是什么心态| 亚洲一区视频| 蜜桃视频日韩| 日韩成人亚洲| 色综合伊人色综合网| 97在线免费观看| 中文字幕在线2019| 国产精品你懂的在线| wwww.国产| 色综合久久一区二区三区| 国产精品欧美在线| 老司机午夜在线视频| 欧美一区二区日韩一区二区| 午夜精品福利在线视频| 国产精品77777| 草b视频在线观看| 色狼人综合干| 国产成人精品电影久久久| 免费国产在线观看| 欧美三级在线看| 日韩在线中文字幕视频| 国产成人免费在线视频| www精品久久| 人人精品亚洲| 国产精品免费在线免费| 免费在线你懂的| 精品精品欲导航| 日本熟女毛茸茸| 国产精品国产三级国产aⅴ原创 | 人妻夜夜添夜夜无码av| 欧美一性一交| 国产乱肥老妇国产一区二| huan性巨大欧美| 日韩成人av网址| 中文字字幕在线观看| 亚洲乱码一区二区三区在线观看| 久久久久亚洲av无码网站| 国产美女一区| 色呦呦网站入口| 日韩成人一级| 91精品啪在线观看麻豆免费| 暧暧视频在线免费观看| 亚洲偷欧美偷国内偷| 99草在线视频| 色综合久久久久网| 国产高潮流白浆| 久久亚洲欧美国产精品乐播| 亚洲精品视频三区| 国产亚洲精品久久久久婷婷瑜伽| 亚洲一二区在线| 欧美爱爱网站| 91中文在线观看| 蜜臀国产一区| 欧美国产精品人人做人人爱| 免费a在线观看| 精品国产凹凸成av人网站| 男人天堂视频在线| 亚洲一区二区三区爽爽爽爽爽| 国产成人精品免高潮在线观看| 亚洲一级片免费看| 天天影视网天天综合色在线播放| 亚洲激情图片网| 91亚洲永久精品| 麻豆av免费看| 黄页网站大全一区二区| 成人免费无码av| 亚洲高清自拍| 中国一级黄色录像| 第一社区sis001原创亚洲| 亚洲一区二区三区香蕉| 日韩三区免费| 欧美亚洲激情在线| 七七久久电影网| 粗暴蹂躏中文一区二区三区| 国产乱视频在线观看| 亚洲国产欧美一区| 亚洲奶汁xxxx哺乳期| 欧美一区二区三区播放老司机| 中文字幕+乱码+中文字幕明步| 婷婷综合久久一区二区三区| avove在线播放| 日本中文字幕视频一区| 日韩精品免费在线播放| 国产 日韩 欧美 综合| 91精品国产黑色紧身裤美女| 在线视频播放大全| 欧美三区免费完整视频在线观看| 国产午夜麻豆影院在线观看| 精品国产福利在线| 日本五十熟hd丰满| 亚洲一区二区精品3399| 久久亚洲av午夜福利精品一区| 亚洲人成精品久久久久| 老司机成人免费视频| 国产精品国产三级国产aⅴ原创| 欧美肉大捧一进一出免费视频| 风流少妇一区二区| 又色又爽又黄18网站| 国产成人午夜精品5599| 色诱av手机版| 成人免费高清视频在线观看| 精品人妻二区中文字幕| 国产91精品久久久久久久网曝门| ass极品水嫩小美女ass| 国产成人免费视频一区| 在线中文字日产幕| 99久久精品国产导航| 特级西西人体4444xxxx| 26uuu成人网一区二区三区| 成人无码www在线看免费| 久久亚洲私人国产精品va媚药| 97伦伦午夜电影理伦片| 国产亚洲精品bt天堂精选| 手机看片日韩av| 一区视频在线播放| www青青草原| 好吊成人免视频| 少妇一级淫片日本| 7777精品伊人久久久大香线蕉| 国产成人精品无码高潮| 精品国产一区二区亚洲人成毛片| 色一情一乱一区二区三区| 日韩av一区二区在线| 国产精品视频一区二区久久| 日韩在线视频一区| 欧美aaa免费| 欧美在线播放视频| 欧美日韩免费电影| 成人av影视在线| 久久av超碰| 日本在线视频www色| 影院欧美亚洲| 国产 porn| 国产精品亚洲午夜一区二区三区 | 亚洲高清视频网站| 亚洲精品91美女久久久久久久| 毛片网站在线| 成人97在线观看视频| 在线看片国产福利你懂的| 国产精品久久久久久五月尺| 精品午夜av| 欧美日本国产精品| 一区二区在线| 黄色片视频在线播放| 国内精品伊人久久久久影院对白| 免费看毛片的网站| 久久女同精品一区二区| 懂色av懂色av粉嫩av| 欧美日韩国产综合视频在线观看中文| 中文字幕一区二区人妻痴汉电车| 日韩欧美色电影| 91在线高清| 性色av一区二区三区免费| 全球最大av网站久久| 岛国一区二区三区高清视频| 成人中文在线| 免费在线观看亚洲视频| 精品一区二区三区影院在线午夜| av网页在线观看| 亚洲视频免费看| 日本熟女毛茸茸| 欧美精品一区二区三区一线天视频| lutube成人福利在线观看| 91精品国产高清自在线| 国产在线视频欧美一区| 清纯唯美一区二区三区| 99视频一区| 亚洲欧洲国产视频| 亚洲欧美激情视频在线观看一区二区三区 | 蜜桃av噜噜一区| 美女黄色一级视频| 1000部国产精品成人观看| 国产无遮挡呻吟娇喘视频| 欧美成人一区二区三区在线观看 | av 一区二区三区| 在线免费看av| 欧美日韩高清在线播放| 天堂av在线7| 欧美激情亚洲另类| 精品国产鲁一鲁****| 性欧美videosex高清少妇| 久久裸体视频| 自拍视频一区二区| 亚洲一区在线播放| 精品二区在线观看| 久久综合久久美利坚合众国| 国产精品久久久久久久久免费高清| 久久一区二区三区av| 国产日韩一区| 国产视频久久久久久| 亚洲综合色视频| 亚洲av永久无码国产精品久久| 日韩有码片在线观看| 国产一区高清| 亚洲精品在线免费| 美腿丝袜在线亚洲一区| a级黄色免费视频| 欧美亚日韩国产aⅴ精品中极品| 国产玉足榨精视频在线观看| 国产成人精品免费视频| 欧洲毛片在线视频免费观看| 成人在线看视频| 久久久综合精品| 三级黄色片播放| 亚洲码国产岛国毛片在线| 成人黄色免费视频| 欧美精品福利在线| 外国成人在线视频| 欧美性久久久久| 国产日产精品1区| 在线免费看av片| 久久精品国产成人| 久久久国产精品入口麻豆| 人妻无码一区二区三区四区| 成人激情午夜影院| 五月婷婷亚洲综合| 在线观看视频99| 麻豆国产精品| 热99这里只有精品| 久久久天堂av| 国产一区二区三区中文字幕| 欧美成人久久久| 婷婷亚洲成人| 亚洲精品久久久中文字幕| 亚洲免费观看高清完整版在线观看熊| 亚洲高清视频网站| 日韩免费精品视频| 国产精品99一区二区三| 美女流白浆视频| 色哟哟国产精品| 国产视频中文字幕在线观看| 国产一区视频观看| 男人的天堂久久精品| 看片网站在线观看| 亚洲精品自产拍| 精品一区二区三区中文字幕在线| 99热亚洲精品| 国产精品毛片大码女人| www日本视频| 国产成人在线播放| 欧美搞黄网站| 亚洲一区二区自偷自拍| 日韩欧美在线影院| 亚洲播播91| 国产黄色激情视频| 亚洲国产精品传媒在线观看| 亚洲黄色在线观看视频| 国产精品久久久久久久电影| 欧美色123| 日本精品久久久久中文| 亚洲成人黄色在线|