精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

數據湖演進之路:架構分裂推動AI分析的新時代

人工智能
數據湖這個詞在21世紀10年代初出現的時候,有些人認為它是在恰當的時間出現的一種恰當的架構。數據湖是一種非結構化的數據存儲庫,利用了新的低成本云對象存儲格式(如Amazon S3),可以容納來自網絡的大量數據。

數據湖這個詞在21世紀10年代初出現的時候,有些人認為它是在恰當的時間出現的一種恰當的架構。數據湖是一種非結構化的數據存儲庫,利用了新的低成本云對象存儲格式(如Amazon S3),可以容納來自網絡的大量數據。

然而,對其他人來說,數據湖是一個很容易被嘲笑的“市場結構”,他們將其稱之為“數據沼澤”。這個陣營中的許多人青睞長期存在、但并不便宜的關系數據倉庫。

盡管存在懷疑,但數據湖已經發展和成熟,成為當今AI和分析領域的重要組成部分。

隨著生成式AI讓焦點重新回到了數據架構上,我們就來仔細研究一下數據湖是如何演化的,以及數據湖在推動高級AI分析方面所發揮的作用。

市場對數據湖的需求

對于那些在電子商務和相關領域追求數據驅動洞察的年輕公司來說,實施數據湖的好處是多方面的。

亞馬遜、谷歌、雅虎、Netflix、Facebook和其他公司都構建了他們自己的數據工具。這些工具通常是基于Apache Hadoop和Spark分布式引擎的。這些新型系統處理的數據類型,要比當時分析數據倉庫中現有關系數據類型的結構性更低一些。

對于那個時代的系統工程師來說,這種架構顯示出了一些好處。“沼澤”或“湖泊”,它將成為搜索、異常檢測、價格優化、客戶分析、推薦引擎等先鋒應用的基礎。

這種更為靈活的數據處理,是成長中的網絡巨頭的首要需求。《Distributed Analytics》一書的作者Thomas Dinsmore稱,文本、圖像、音頻、視頻和其他數據“海嘯”根本不適合關系數據庫和數據倉庫處理。另一個缺點是:隨著每一批數據的加載,數據倉庫成本也隨之增長。

不管人們是否喜歡,數據湖如今仍在不斷地填充數據。在數據處理過程中,數據工程師可以“立即存儲”并決定以后如何處理數據。不過,基本的數據湖架構已經擴展為更高級的數據發現和管理功能。

這一演變趨勢是由自建解決方案以及Databricks、Snowflake等一流初創公司的解決方案引領的,但還有更多公司參與其中。隨著數據中心規劃人員著眼于新的AI領域,各種架構如今也在受到密切關注。

數據湖演進:從湖泊到湖屋

數據湖這場競賽的參與者包括Amazon Lake Formation、Cloudera Open Data Lakehouse、Dell Data Lakehouse、Dremio Lakehouse Platform、Google BigLake、IBM Watsonx. Data、Microsoft Azure Data Lake Storage、Oracle Cloud Infrastructure、Scality Ring和Starburst Galaxy等。

正如上述列舉所示,趨勢是將產品稱為“數據湖屋”,而不是“數據湖”。這個名字更類似于用于處理結構化數據的傳統數據倉庫。是的,這代表了另一個牽強的類比,就像之前的數據湖一樣,受到了人們的審視。

在數據市場中,命名是一門藝術。如今,那些解決數據湖最初缺陷的系統被指定為集成數據平臺、混合數據管理解決方案等,但奇怪的命名約定不能掩蓋功能方面的重要進步。

如今,在升級的分析平臺中,不同的數據處理組件以流水線方式連接。新數據工廠所取得的成果可能集中在以下幾個方面:

  • 新的表格式:例如,Delta Lake和Iceberg是建立在云對象存儲之上的,為Apache Spark、Hadoop和其他數據處理系統提供了ACID事務支持。經常關聯的Parquet格式可以幫助優化數據壓縮。
  • 元數據目錄:Snowflake Data Catalog和Databricks Unify Catalog等只是執行數據發現和跟蹤數據沿襲的一些工具。后者特性對于確保分析的數據質量至關重要。
  • 查詢引擎:查詢引擎為存儲為各種類型和位置的數據的高性能查詢提供了通用的SQL接口。PrestoDB、Trinio和Apache Spark就是其中幾個例子。

這些進展使數據分析更有條理、更高效和更易于控制。

隨之而來的,是向“現在攝取,以后轉換”方法的轉變。這是對數據倉庫熟悉的提取轉換加載(ETL)數據暫存序列的一種顛覆,現在解決方案可能是提取加載轉換(ELT)了。

不管叫什么名字,這都是高級數據架構的決定性時刻,恰逢新的生成式AI出現了。但總體來看,它從垃圾抽屜柜到定義更明確的容器,這個演變發展的過程是很緩慢的。

數據湖安全和治理問題

“數據湖導致了大數據的慘敗。它們剛出現時你什么都找不到,”SanjMo技術咨詢公司負責人Sanjeev Mohan說,那個時候就沒有治理或安全。

Mohan解釋說,人們需要的是護欄,保護數據免受未經授權的訪問,并遵守GDPR等治理標準,這意味著要應用元數據技術來識別數據。

“主要的需求是安全性。這就需要細粒度的訪問控制——而不僅僅是將文件扔進數據湖就行了,”他補充說,現在有更好的數據湖方法可以解決這個問題,組織中的不同角色反映在不同的權限設置中。

這種控制方式在早期的數據湖中并不常見,早期的數據湖主要是“僅追加”系統,很難更新。

新的表格格式改變了這種情況。近年來,Delta Lake、Iceberg和Hudi等表格格式應運而生,在數據更新支持方面取得了顯著的進步。

Sanjeev Mohan表示,Iceberg等工具的標準化和廣泛可用性,為最終用戶在選擇系統時提供了更多優勢,從而節省了成本并增強了技術控制。

用于生成式AI的數據湖

如今,生成式AI位列很多企業待辦事項清單之首,而數據湖和數據湖庫與這一現象是密切相關的。生成式AI模型要在大量數據上運行,與此同時計算成本可能會飆升。

隨著領先科技公司的專家們參與其中,AI與數據管理之間日益緊密的聯系揭示了未來的關鍵機遇和障礙:

“生成式AI將改變數據管理”

AWS數據湖和分析副總裁Ganapathy Krishnamoorthy這樣表示。AWS是S3對象存儲和大量云數據工具的創始方。

Krishnamoorthy表示,數據倉庫、數據湖和數據湖屋將有助于改進生成式AI,但這也是一條雙向道路。

生成式AI正在培育各種成果以大大增強數據處理過程本身,其中包括數據準備、構建BI儀表板和創建ETL管道。

“有了生成式AI,我們就有了獨特的機會來解決數據管理模糊的問題,比如數據清理,”Krishnamoorthy說。“以前這一直是一項人類活動,而自動化是有挑戰性的。而現在我們可以應用生成式AI技術來獲得相當高的準確性。實際上,你可以使用基于自然語言的交互來完成其中一部分工作,從而大大提高工作效率。”

Krishnamoorthy表示,越來越多的企業將跨多個數據湖連接工作,專注于更高程度的自動化操作來增強數據的可發現性。

“AI數據湖將帶來更具彈性的數據中心”

這是Hadoop先驅Cloudera公司首席產品官Dipto Chakravarty的觀點,該公司還在不斷地提供面向數據的新工具。

他說,AI正在挑戰現有的游戲規則,這意味著數據湖工具可以縮小也可以擴大,支持數據中心和云端的靈活計算。

“在某些月份的某些日子,數據團隊希望將東西移到本地。其他時候,他們又想將其移回云端。但是,當你來回移動所有這些數據工作負載時,就會產生負擔,”Chakravarty說。

當CFO們開始關注AI的“稅收”——也就是對支出的影響時,數據中心就成為了試驗場。IT領導者將專注于把計算帶入數據,實現真正的彈性可擴展性。

“AI基礎模型的輸出定制化是關鍵”

IBM Watsonx平臺產品營銷副總裁Edward Calvesbert表示,這就是賦予它業務語言的方式。IBM在21世紀10年代中期通過Watson認知計算工作推動了當今AI的復興。

他說:“你可以使用數據定制AI,它將以你希望的方式從用例和質量角度有效地代表你的企業。”

Calvesbert表示,Watsonx數據是Watsonx生態系統中數據中央存儲庫,現在支撐著AI的定制化,這些模型可以共置在企業的IT環境中。

定制應該是和新AI時代的數據治理相輔相成的。他說:“治理措施提供了生命周期管理和監控護欄,確保遵守你自己公司的政策以及任何監管政策。”

“更多本地處理即將到來”

這是Starburst公司董事長兼首席執行官Justin Borgman的說法,該公司將Trino SQL查詢引擎的早期工作轉化為成熟的數據湖屋產品,可以從湖屋之外提取數據。

他說,精心打造的數據湖和湖屋對于支持AI工作負載(包括與生成式AI相關的工作負載)來說至關重要,我們將看到,人們對混合數據架構的興趣激增,一部分原因就是AI和機器學習的興起。

“圍繞AI的這種勢頭將把越來越多的數據帶回到本地環境或者混合環境中。企業不會想把所有的數據和AI模型都發送到云端的,因為把數據從云端轉移到云端的成本很高。”

Borgman指出,使用本質上與存儲分離的查詢和計算引擎是一種主導趨勢,可以在人們已經擁有的多樣化數據基礎設施中以及跨多個數據湖發揮作用,通常被稱為“將計算轉移到數據”。

數據越多越好嗎?

AI工作負載基于未分類的、不充分的、或者無效的數據,這成了一個日益嚴重的問題。但正如數據湖發展歷程所表明的,這是一個可以通過數據管理解決的已知問題。

IT Market Strategy獨立分析師Merv Adrian表示,顯然,如果數據無法被理解,那么訪問大量數據是沒有用的。

“如果可以使用數據,數據越多總是越好的。但如果不能,數據就沒有任何用處,”他說。

Adrian認為,Iceberg和Delta Lake等軟件的定位是位于海量數據之上的一種描述層,將有助于AI和機器學習式的分析。投資于這些類型技術的組織,在進入這個美麗新世界時將獲得優勢。

但AI開發真正的好處,是團隊在使用這些工具所獲得的技能,Adrian說。

“數據湖、數據倉庫及其數據湖屋分支使企業能夠使用更多類型和更多數據量,這對生成式AI模型很有幫助,這些模型在對大型多樣化數據集進行訓練時會得到改進。”

如今,數據湖以某種形式存在。Mohan或許說得最好:“數據湖并沒有消失。數據湖萬歲!”

責任編輯:龐桂玉 來源: 至頂網
相關推薦

2024-03-15 11:17:07

物聯網IoT人工智能

2024-01-03 09:51:43

物聯網IOT數據安全

2025-03-07 08:31:34

2025-05-12 09:34:39

2017-05-22 20:31:42

華為

2011-06-28 14:22:22

H3C數據中心虛擬化

2017-03-21 13:00:05

網絡融合光網絡通信網絡

2018-08-31 17:37:52

intel云計算AI

2022-06-17 18:32:54

開源大數據數據調度

2016-03-15 16:24:47

集群調度框架演進

2014-01-15 09:09:56

2014-03-12 09:37:26

計算創新智能英特爾

2025-09-12 00:00:00

AI技術零信任安全

2017-01-22 15:43:47

數據架構演進

2023-07-02 11:14:21

工具TypeScript框架

2016-11-09 15:57:50

2024-09-30 15:19:41

點贊
收藏

51CTO技術棧公眾號

91麻豆成人精品国产| 精品1卡二卡三卡四卡老狼| 国产最新视频在线| 六月丁香婷婷久久| 久久久亚洲福利精品午夜| 亚洲AV无码国产精品| 欧美亚洲黄色| 粉嫩老牛aⅴ一区二区三区 | 欧美色女视频| 精品国产一区二区国模嫣然| 欧美精品无码一区二区三区| 中文字幕中文字幕在线十八区 | 日本在线观看不卡视频| 欧美成人四级hd版| 影音先锋制服丝袜| 久9re热视频这里只有精品| 精品视频1区2区| 天堂…中文在线最新版在线| 黄色精品免费看| 久久色在线观看| 99在线首页视频| 怡红院男人的天堂| 国产精品美女久久久| 美女少妇精品视频| 黄色av免费播放| 欧美国产不卡| 欧美xingq一区二区| 久久婷婷综合色| 欧美gv在线| 亚洲午夜久久久久中文字幕久| 一区二区三区欧美成人| 日本1级在线| 99这里都是精品| aa成人免费视频| 国产三级第一页| 蜜臀精品一区二区三区在线观看| 51久久精品夜色国产麻豆| 欧美精品一区二区蜜桃| 国产精品久久久久久影院8一贰佰| 亚洲乱码av中文一区二区| 中文字幕永久免费| 国产精一区二区| 欧美久久一二区| 亚欧美在线观看| 成人在线爆射| 色八戒一区二区三区| 欧美日韩亚洲一| 182在线视频观看| 亚洲成av人片在线| av女优在线播放| 不卡视频观看| 欧美日韩亚洲国产一区| 日韩欧美亚洲天堂| 性欧美又大又长又硬| 精品国产乱码久久久久酒店| 青草青青在线视频| heyzo在线欧美播放| 亚洲制服丝袜在线| 人妻互换免费中文字幕| 免费在线中文字幕| 五月天一区二区三区| 欧美精品自拍视频| 亚洲欧洲美洲av| 色欧美片视频在线观看在线视频| 免费日韩视频在线观看| 欧美日韩精品一区二区三区视频| 91精品办公室少妇高潮对白| 黄色三级视频在线| 欧美男女视频| 日韩午夜精品电影| 污片免费在线观看| 精品一区三区| 色狠狠久久aa北条麻妃| 紧身裙女教师波多野结衣| 在线看片不卡| 国模视频一区二区| www五月天com| 久久99蜜桃精品| 97伦理在线四区| 午夜小视频在线播放| 国产亚洲短视频| 黄色一级视频播放| av漫画网站在线观看| 色婷婷综合久色| 四虎成人在线播放| 欧美色图五月天| 最近2019年手机中文字幕| 麻豆视频在线免费看| 尹人成人综合网| 国产精品91在线观看| 国产91视频在线| 久久美女艺术照精彩视频福利播放| 亚洲春色综合另类校园电影| 色屁屁www国产馆在线观看| 精品久久久久久久大神国产| 欧美特级aaa| 激情视频极品美女日韩| 一本色道久久综合狠狠躁篇的优点| 欧美高清视频一区二区三区| 久久国产毛片| 99电影在线观看| 国产福利在线| 亚洲国产美国国产综合一区二区| 久久精品免费网站| 一区二区三区欧洲区| 亚洲精品视频久久| 免费看一级一片| 日韩av中文在线观看| 亚洲精品欧美日韩专区| 精品视频一二区| 亚洲成a人v欧美综合天堂下载| 制服丝袜综合网| 欧美亚洲大陆| 欧美精品在线免费观看| 中文无码av一区二区三区| 成人午夜私人影院| av电影一区二区三区| 国产精品粉嫩| 亚洲国产成人精品电影| 久久久久久久麻豆| 丝袜亚洲另类欧美| 精品日本一区二区三区| 91国内在线| 欧美精选午夜久久久乱码6080| 亚洲av无码成人精品国产| 亚洲成人国产| 国产精品亚洲片夜色在线| 日韩av成人| 亚洲v中文字幕| 国产精品欧美性爱| 国产精品毛片一区二区在线看| 国产99久久精品一区二区永久免费 | 男人的午夜天堂| 男人操女人的视频在线观看欧美| 久久久久久久久久码影片| 免费av不卡在线观看| 91精品国产综合久久久蜜臀粉嫩| 日本美女xxx| 久热综合在线亚洲精品| 蜜桃传媒视频麻豆第一区免费观看 | 555www成人网| 色在线免费视频| 精品人伦一区二区三区蜜桃网站| 性感美女一区二区三区| 欧美日韩一区自拍| 97超碰最新| 欧美人与禽猛交乱配| 欧美草草影院在线视频| 校园春色 亚洲| 国产精品 欧美精品| 中文字幕人妻熟女人妻洋洋| 免费观看在线一区二区三区| 欧美精品手机在线| 成人av一区二区三区在线观看| 一区二区三区中文免费| 中文在线字幕观看| 精久久久久久| 久久婷婷人人澡人人喊人人爽| 国产色播av在线| 亚洲欧美成人一区二区在线电影| 最近免费中文字幕大全免费版视频| 2023国产精品自拍| 五月婷婷狠狠操| 水蜜桃精品av一区二区| 91免费人成网站在线观看18| 视频在线这里都是精品| 日韩av综合中文字幕| 无码人妻久久一区二区三区| 中文字幕av在线一区二区三区| 中文av一区二区三区| 亚洲精品网址| 国产一区再线| 69堂精品视频在线播放| 久久偷看各类女兵18女厕嘘嘘| 国产黄色免费大片| 偷拍一区二区三区| 欧美另类z0zx974| 国产在线播放一区| 国产精品12345| 成人av二区| aaa级精品久久久国产片| 中文字幕色婷婷在线视频| 日日骚久久av| 色综合免费视频| 欧美日韩一级视频| 免费在线观看av网址| 91色porny| 蜜桃福利午夜精品一区| 亚洲三级免费| 一区二区三区四区五区精品 | 日本一区二区三区四区在线观看 | 日韩亚洲欧美高清| 日产精品久久久| 亚洲视频每日更新| 国产精品成人一区二区三区电影毛片| 免费看黄色91| 国产主播自拍av| 91麻豆精品国产91久久久平台| 国产日韩欧美亚洲一区| 欧美一级在线| 2020久久国产精品| 国产福利视频在线观看| 亚洲视频在线免费看| 99在线精品视频免费观看20| 一本久久综合亚洲鲁鲁五月天| 午夜写真片福利电影网| 国产三级精品三级在线专区| 性xxxxxxxxx| 久久成人18免费观看| 国产免费黄色av| 欧美一区二区三区久久精品茉莉花| 欧美日韩喷水| 99国产精品久久一区二区三区| 国产精品一区二区三区久久久 | 中文字幕乱视频| 激情五月婷婷综合| www.超碰com| 国产欧美91| 日韩 欧美 视频| 亚洲精品久久久| 正在播放久久| 成人高清电影网站| 欧美一区二区三区在线播放| 欧美aaaaaaaa牛牛影院| 99re在线国产| 国产精品亚洲欧美一级在线| 国产成人精品视频| 三妻四妾的电影电视剧在线观看 | 91欧美精品| 国产97色在线| 345成人影院| 欧美一级在线亚洲天堂| 欧美日韩国产观看视频| 国自在线精品视频| 毛片在线导航| 欧美极品美女电影一区| 中文在线免费| 久久成人精品电影| 国产色在线观看| 久久精品视频在线| 日本综合在线| 久久精品国产免费观看| 欧美jizzhd69巨大| 久久好看免费视频| 老司机免费在线视频| 麻豆乱码国产一区二区三区| 黄色网在线看| 欧美成人免费全部| 日韩经典av| 韩国精品久久久999| heyzo中文字幕在线| 91精品国产九九九久久久亚洲| av手机在线观看| 555www成人网| 欧美成人精品三级网站| 国产精品美女午夜av| 日韩成人在线电影| 亚洲综合社区网| 嗯用力啊快一点好舒服小柔久久| 国产欧美日韩综合一区在线观看| 欧美黑人巨大videos精品| 精品国产一区二区三| 精品视频免费| 最新中文字幕久久| 黄色av成人| 苍井空浴缸大战猛男120分钟| 日本在线观看不卡视频| www.五月天色| 9人人澡人人爽人人精品| 国产真实乱人偷精品人妻| 国产精品色婷婷| 欧美黑吊大战白妞| 欧美日韩亚洲精品内裤| 在线播放一级片| 精品剧情v国产在线观看在线| 天堂影院在线| 日韩在线视频一区| 男女在线视频| 国产精品旅馆在线| 亚洲成人五区| 蜜桃精品久久久久久久免费影院| 日韩免费久久| 男女日批视频在线观看| 久久美女性网| 日本美女久久久| 久久亚洲捆绑美女| www.av成人| 欧美日韩亚洲视频| 艳妇乳肉豪妇荡乳av| 亚洲精品一区二区三区四区高清| 国产福利第一视频在线播放| 欧美成aaa人片免费看| 中文一区一区三区高中清不卡免费| 国产日产欧美精品| 欧美成人专区| 日本一级淫片演员| 三级欧美韩日大片在线看| 第一页在线视频| 中文字幕av资源一区| 自拍偷拍欧美亚洲| 91精品久久久久久久91蜜桃| 日本1级在线| 欧美激情第99页| 欧美黄色成人| 区一区二区三区中文字幕| 国产综合视频| 亚洲av无日韩毛片久久| 国产日韩欧美精品一区| 香蕉免费毛片视频| 日韩一区二区不卡| 日本不卡视频| 国产精品第3页| 偷拍亚洲精品| 欧美视频在线观看视频| 精品一区二区免费在线观看| 亚洲精品视频久久久| 亚洲第一综合色| 国产人妻精品一区二区三区 | 成人免费在线| 国产精自产拍久久久久久蜜| 私拍精品福利视频在线一区| 女人被男人躁得好爽免费视频| 精品一区二区国语对白| 亚洲av毛片基地| 欧美性xxxx极品hd满灌| 天堂网在线中文| 欧美高清不卡在线| 在线不卡一区| 在线成人av电影| 美腿丝袜亚洲综合| 香蕉久久久久久久| 欧美中文字幕一区二区三区| 日本福利在线观看| 69av在线视频| 网曝91综合精品门事件在线| 免费看国产曰批40分钟| 粉嫩av亚洲一区二区图片| 青青操国产视频| 日韩欧美专区在线| 羞羞网站在线免费观看| 91偷拍精品一区二区三区| 欧美国产精品| 91亚洲一线产区二线产区| 亚洲一二三四区不卡| 囯产精品久久久久久| 午夜精品理论片| 欧美人与动xxxxz0oz| 91国视频在线| 国产亚洲精品精华液| 影音先锋黄色网址| 久久久国产影院| 秋霞一区二区三区| 久久久久福利视频| 大香伊人久久精品一区二区| 欧美日韩一级二级| 国家队第一季免费高清在线观看 | 欧美aaa级| 99精品一级欧美片免费播放| 国产乱色国产精品免费视频| 全网免费在线播放视频入口| 精品国产乱码久久久久久蜜臀| av伦理在线| 另类欧美小说| 老司机精品视频导航| 日本黄色小说视频| 亚洲精品第一页| 国模视频一区| 色撸撸在线观看| 粉嫩13p一区二区三区| 国产成人免费观看视频| 国产亚洲精品久久| 国产午夜亚洲精品一级在线| 国产3p露脸普通话对白| 国产欧美一区二区三区沐欲| 国产精品久久久国产盗摄| 国内精品美女av在线播放| 亚洲人挤奶视频| 亚洲精品20p| 亚洲va国产天堂va久久en| 国产youjizz在线| 亚洲综合社区网| 蜜桃久久av| 黄色一级片中国| 日韩毛片中文字幕| 成人自拍视频| 18禁男女爽爽爽午夜网站免费| 欧美国产亚洲另类动漫| 韩国av在线免费观看| 日韩免费高清在线观看| 欧美激情性爽国产精品17p| av无码av天天av天天爽| 91麻豆精品国产91久久久更新时间| www555久久| 亚洲欧洲一区二区| fc2成人免费人成在线观看播放| 久久久久久av无码免费看大片| 欧美激情18p| 日韩精品永久网址| 漂亮人妻被黑人久久精品| 欧美剧情片在线观看|