精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

邁向現(xiàn)代數(shù)據(jù)平臺(tái)的兩個(gè)步驟

大數(shù)據(jù) 數(shù)據(jù)分析
在構(gòu)建數(shù)據(jù)科學(xué)產(chǎn)品時(shí),一個(gè)重要的方面是讓您的數(shù)據(jù)可用并準(zhǔn)備使用。您需要一個(gè)平臺(tái)將數(shù)據(jù)帶到一起,并在整個(gè)公司中服務(wù)。但是你如何發(fā)展這樣一個(gè)數(shù)據(jù)平臺(tái)?

在構(gòu)建數(shù)據(jù)科學(xué)產(chǎn)品時(shí),一個(gè)重要的方面是讓您的數(shù)據(jù)可用并準(zhǔn)備使用。您需要一個(gè)平臺(tái)將數(shù)據(jù)帶到一起,并在整個(gè)公司中服務(wù)。但是你如何發(fā)展這樣一個(gè)數(shù)據(jù)平臺(tái)?閱讀數(shù)據(jù)倉(cāng)庫(kù),數(shù)據(jù)湖泊,湖泊和數(shù)據(jù)網(wǎng)格時(shí),很容易丟失。它們是如何不同的,什么應(yīng)該是第一步?

不同的數(shù)據(jù)平臺(tái)解決方案

> Databricks’ perspective on DWH vs Data Lake vs Lakehouse

數(shù)據(jù)平臺(tái)是將數(shù)據(jù)帶到整個(gè)公司中的數(shù)據(jù)的環(huán)境。數(shù)據(jù)倉(cāng)庫(kù)是第一個(gè)企業(yè)中央數(shù)據(jù)平臺(tái)。但是,隨著各種數(shù)據(jù)格式和源,它們并不足夠靈活。引入數(shù)據(jù)湖可以容易地從任何源以任何格式存儲(chǔ)原始數(shù)據(jù)。這是通過(guò)推遲模式創(chuàng)建和數(shù)據(jù)解釋來(lái)實(shí)現(xiàn)的,直到實(shí)際使用數(shù)據(jù)。這些湖泊經(jīng)常轉(zhuǎn)向所謂的數(shù)據(jù)沼澤,在那里沒(méi)有人能夠有效地真正使用數(shù)據(jù)。添加了所有數(shù)據(jù),但沒(méi)有準(zhǔn)備對(duì)數(shù)據(jù)進(jìn)行使用。繼任者是LakeHouse,數(shù)據(jù)湖與數(shù)據(jù)庫(kù)工具相結(jié)合,以輕松創(chuàng)建數(shù)據(jù)的可用視圖。替代方案是數(shù)據(jù)網(wǎng),它不會(huì)集中數(shù)據(jù),但是利用多個(gè)分散的數(shù)據(jù)環(huán)境,以更好地跨團(tuán)隊(duì)進(jìn)行規(guī)模。我稍后會(huì)更徹底地覆蓋數(shù)據(jù)網(wǎng)格。

但首先,讓我們看看我們實(shí)際解決的問(wèn)題。這些不同數(shù)據(jù)平臺(tái)的驅(qū)動(dòng)程序是什么?我將從烏托邦理想開(kāi)始,我們正在追逐,繼續(xù)在實(shí)踐中出現(xiàn)的平臺(tái),并用你可以采取的兩步包裝。在數(shù)據(jù)平臺(tái)方向上的兩個(gè)步驟,使機(jī)器學(xué)習(xí)解決方案,授權(quán)數(shù)據(jù)科學(xué)家,并分享內(nèi)部工作方式。

烏托邦理想

如果來(lái)自所有部門的所有數(shù)據(jù),則不會(huì)很容易訪問(wèn)。從一個(gè)中心位置訪問(wèn),使您的所有數(shù)據(jù)科學(xué)家們可以在需要時(shí)獲得所需的數(shù)據(jù)。他們可以專注于先進(jìn)的機(jī)器學(xué)習(xí),而數(shù)據(jù)工程師可以確保數(shù)據(jù)已準(zhǔn)備好使用。

讓我們見(jiàn)面Jane,我們的專家數(shù)據(jù)科學(xué)家。她正在開(kāi)發(fā)一個(gè)新的數(shù)據(jù)科學(xué)產(chǎn)品:收入預(yù)測(cè)。中央數(shù)據(jù)平臺(tái)提供了客戶,產(chǎn)品和銷售的所有數(shù)據(jù)。Jane在平臺(tái)中構(gòu)建完整數(shù)據(jù)集并將其加載到她的Jupyter Lab環(huán)境中。在與模型的目標(biāo)與業(yè)務(wù)的一系列對(duì)齊之后,她很快開(kāi)發(fā)了模型的第一版。

因此,該平臺(tái)提供了科學(xué)家需要開(kāi)發(fā)她的模型的一切,包括數(shù)據(jù),計(jì)算和工作環(huán)境。平臺(tái)開(kāi)發(fā)人員(云和數(shù)據(jù)工程師)確保它是可擴(kuò)展,實(shí)時(shí)和性能的。它們還提供數(shù)據(jù)譜系,數(shù)據(jù)治理和元數(shù)據(jù)等附加服務(wù)??茖W(xué)家們完全賦予了工程困難。這在視覺(jué)上表示如下:

> Utopian world: Single data platform taking care of all the data issues. Image by author.

在左側(cè),各個(gè)部門使用相應(yīng)的數(shù)據(jù)運(yùn)行其應(yīng)用程序。在技術(shù)產(chǎn)品公司中,這包括在特定領(lǐng)域努力的團(tuán)隊(duì)。數(shù)據(jù)可以居住在任何存儲(chǔ)中:MS Excel文件,數(shù)據(jù)庫(kù),CSV文件,Kafka主題,云桶,您將其命名為。

在中間,數(shù)據(jù)平臺(tái)團(tuán)隊(duì)提取該數(shù)據(jù),并將其加載到數(shù)據(jù)湖的著陸區(qū)。第一步是標(biāo)準(zhǔn)化日期和數(shù)字格式和列名稱的方面。這可以包括為歷史觀點(diǎn)拍攝數(shù)據(jù)的快照。生成的數(shù)據(jù)集收集存儲(chǔ)在所謂的“暫存”圖層中。然后將數(shù)據(jù)組合并放置在靜電層中。策級(jí)層是包含相干數(shù)據(jù)集,唯一標(biāo)識(shí)符和清晰關(guān)系的數(shù)據(jù)存儲(chǔ)。因此,我將此稱為DWH(數(shù)據(jù)倉(cāng)庫(kù))。但是,它可以是任何可用存儲(chǔ),包括大規(guī)模云數(shù)據(jù)庫(kù)(BigQuery),Hive表,Blob存儲(chǔ)(S3)或Delta Lake Parquet文件。該策級(jí)層的目標(biāo)是提供易于使用所有數(shù)據(jù)的總視圖。

在右側(cè),數(shù)據(jù)科學(xué)團(tuán)隊(duì)使用平臺(tái)的工作環(huán)境和數(shù)據(jù)集來(lái)解決它們的用例。

當(dāng)這不起作用

理想的聲音很棒。不幸的是,簡(jiǎn)的真實(shí)體驗(yàn)略有不同:

Jane需要一些額外的數(shù)據(jù)集可以在數(shù)據(jù)平臺(tái)上提供。為了獲得頭部開(kāi)始,金融部門為初步分析提供了一些CSV出口。簡(jiǎn)探測(cè)了預(yù)測(cè)需要在產(chǎn)品組上報(bào)告,而這些數(shù)據(jù)是在各個(gè)產(chǎn)品上。在幾個(gè)會(huì)議之后,她了解哪些內(nèi)部產(chǎn)品名稱屬于哪些組。產(chǎn)品的收入在組件中分開(kāi),部分是基礎(chǔ)產(chǎn)品,部分是附加組件。折扣是另一個(gè)故事;因?yàn)樗鼈儚目傎~單中減去了,因此歸屬變得有點(diǎn)棘手。另一個(gè)驚喜。三個(gè)月前公共產(chǎn)品煥然一新,重命名,結(jié)合一些舊的利基產(chǎn)品。隨著一些困難而且只丟棄最小的數(shù)據(jù),她管理將舊數(shù)據(jù)與大多數(shù)類似的新產(chǎn)品匹配。

管理數(shù)據(jù)平臺(tái)的數(shù)據(jù)工程師呢?好吧,他們只是入門:

最后,拾取了數(shù)據(jù)工程機(jī)票,數(shù)據(jù)工程師開(kāi)始提取,加載和轉(zhuǎn)換各種數(shù)據(jù)集。第一個(gè)步驟很容易,但現(xiàn)在他們需要在數(shù)據(jù)上創(chuàng)建可用視圖。他們需要與各種(可能)未來(lái)的用戶交談以了解哪些轉(zhuǎn)變很重要。他們與簡(jiǎn)言組織了一些細(xì)化會(huì)議。然后他們需要返回?cái)?shù)據(jù)產(chǎn)生部門以弄清楚數(shù)據(jù)實(shí)際意味著什么,以及它如何映射到區(qū)域。該部門忙于一些新的內(nèi)部產(chǎn)品。因此,他們將數(shù)據(jù)工程師轉(zhuǎn)發(fā)給數(shù)據(jù)科學(xué)團(tuán)隊(duì),這顯然已經(jīng)完成了一些準(zhǔn)備工作。

簡(jiǎn)而言之,這不是非常順利的。

有一些關(guān)鍵問(wèn)題:

  • 數(shù)據(jù)科學(xué)家需要能夠創(chuàng)建使用情況特定的轉(zhuǎn)換。
  • 平臺(tái)團(tuán)隊(duì)需要準(zhǔn)備他們不擁有的域的數(shù)據(jù),以便于使用案例他們無(wú)法正常工作。
  • 數(shù)據(jù)平臺(tái)團(tuán)隊(duì)成為數(shù)據(jù)科學(xué)家團(tuán)隊(duì)的瓶頸。

由此產(chǎn)生的解決方法

為了能夠解釋和轉(zhuǎn)換與特定用例相關(guān)的高度詳細(xì)數(shù)據(jù),您需要很多域知識(shí)。每個(gè)用例還需要特定的數(shù)據(jù)準(zhǔn)備。因此,數(shù)據(jù)工程師可以只做數(shù)據(jù)科學(xué)家所需的一部分。雖然數(shù)據(jù)科學(xué)家潛入商業(yè)案例,但他們獲得了很多域名知識(shí)。這使它們能夠準(zhǔn)備數(shù)據(jù)。

這導(dǎo)致以下解決方法:

> Extra data storage within the data science teams. Image by author.

數(shù)據(jù)科學(xué)團(tuán)隊(duì)現(xiàn)在將數(shù)據(jù)從中央數(shù)據(jù)平臺(tái)轉(zhuǎn)換為其模型培訓(xùn)的準(zhǔn)備。盡管數(shù)據(jù)平臺(tái)理想地提供完全可用的數(shù)據(jù)集,但實(shí)際上它太簡(jiǎn)單,對(duì)所有客戶來(lái)說(shuō)都不足夠了。

這種新的情況有一些好處:

  • 數(shù)據(jù)科學(xué)家變得更加自我。
  • 數(shù)據(jù)工程師不必為組織中的每個(gè)人創(chuàng)建視圖。它們可以專注于數(shù)據(jù)的標(biāo)準(zhǔn)化接口。
  • 數(shù)據(jù)工程師可以專注于保持?jǐn)?shù)據(jù)最近并提供良好的訪問(wèn)方法。

但是,有些事情仍然出了問(wèn)題:

  • 數(shù)據(jù)科學(xué)家的數(shù)據(jù)集及其生產(chǎn)流水線與數(shù)據(jù)平臺(tái)具有相同的標(biāo)準(zhǔn)。它們不會(huì)監(jiān)視,并不適用于失敗,并且任務(wù)調(diào)度并不標(biāo)準(zhǔn)化。
  • 通過(guò)更分散的轉(zhuǎn)換,多個(gè)數(shù)據(jù)科學(xué)團(tuán)隊(duì)正在重新發(fā)明眾所周知的輪子。

新的理想:數(shù)據(jù)網(wǎng)格

稍后,已經(jīng)出現(xiàn)了數(shù)據(jù)網(wǎng)格的概念(請(qǐng)參閱此有趣的博客文章和此操作。數(shù)據(jù)來(lái)自組織中的多個(gè)位置。數(shù)據(jù)網(wǎng)格而不是創(chuàng)建所有組合數(shù)據(jù)的單個(gè)表示,而不是創(chuàng)建所有組合數(shù)據(jù)的單個(gè)表示。為了使數(shù)據(jù)公司廣泛可用,每個(gè)團(tuán)隊(duì)的數(shù)據(jù)也被視為該團(tuán)隊(duì)的產(chǎn)品。該公司的團(tuán)隊(duì)還要注意創(chuàng)建其數(shù)據(jù)的可用意見(jiàn)。在這種情況下,機(jī)器學(xué)習(xí)(ML)產(chǎn)品團(tuán)隊(duì)(數(shù)據(jù)科學(xué)家)還將將其轉(zhuǎn)換的數(shù)據(jù)作為產(chǎn)品提供給其他數(shù)據(jù)科學(xué)家。他們從各種其他產(chǎn)品團(tuán)隊(duì)中獲取自己的數(shù)據(jù)。因此,每個(gè)產(chǎn)品團(tuán)隊(duì)(或團(tuán)隊(duì)團(tuán)隊(duì))不僅開(kāi)發(fā)了他們的產(chǎn)品,而且還向其他團(tuán)隊(duì)提供了可用的景色。在我解釋的是優(yōu)勢(shì)之前,讓我畫出新的情況:

> A data mesh approach. Image by author.

在左側(cè),部門或產(chǎn)品團(tuán)隊(duì)將通用數(shù)據(jù)作為服務(wù)提供。雖然一組規(guī)范化表(DWH)是一種可能性,但它也可以包括事件流(Kafka)或Blob存儲(chǔ)。這需要產(chǎn)品團(tuán)隊(duì)中的更多數(shù)據(jù)工程功能。而不是帶有數(shù)據(jù)工程師的中央團(tuán)隊(duì),數(shù)據(jù)工程師現(xiàn)在正在分布在所有產(chǎn)品團(tuán)隊(duì)中,包括分析和ML團(tuán)隊(duì)。

在中間,中央數(shù)據(jù)平臺(tái)已從數(shù)據(jù)產(chǎn)品團(tuán)隊(duì)(要求域知識(shí))更改為數(shù)據(jù)平臺(tái)作為服務(wù)團(tuán)隊(duì)(需要技術(shù)知識(shí))。他們開(kāi)發(fā)內(nèi)部平臺(tái),授權(quán)所有團(tuán)隊(duì)創(chuàng)建自己的數(shù)據(jù)存儲(chǔ)實(shí)例,功能存儲(chǔ),數(shù)據(jù)處理,數(shù)據(jù)譜系,調(diào)度,過(guò)程監(jiān)控,模型工件,模型服務(wù)實(shí)例等。因此,先前數(shù)據(jù)平臺(tái)團(tuán)隊(duì)的所有技術(shù)技能都用于創(chuàng)建工具。這樣,每個(gè)團(tuán)隊(duì)都可以成為自己(小規(guī)模)數(shù)據(jù)平臺(tái)團(tuán)隊(duì)。這確保了整個(gè)公司的工作和高標(biāo)準(zhǔn)的統(tǒng)一方式。

在右側(cè),數(shù)據(jù)科學(xué)團(tuán)隊(duì)不僅是數(shù)據(jù)的消費(fèi)者,還不僅是數(shù)據(jù)的制作者。他們的特征工程和數(shù)據(jù)宣傳的結(jié)果與其他數(shù)據(jù)科學(xué)團(tuán)隊(duì)共享。

這有很多好處:

  • 在域知識(shí)是創(chuàng)建的轉(zhuǎn)換。
  • 數(shù)據(jù)平臺(tái)團(tuán)隊(duì)瓶頸被刪除。
  • 自給自足的產(chǎn)品團(tuán)隊(duì)。

挑戰(zhàn)是:

  • 將中心平臺(tái)設(shè)置為服務(wù)團(tuán)隊(duì)。
  • 防止新的中央數(shù)據(jù)平臺(tái)成為成為新瓶頸的服務(wù)團(tuán)隊(duì)。
  • 以共同的工作方式將所有團(tuán)隊(duì)納入這種新方法。

在此設(shè)置中,中央平臺(tái)作為服務(wù)團(tuán)隊(duì)(或團(tuán)隊(duì))具有關(guān)鍵作用。它們以簡(jiǎn)單的自行服務(wù)方式設(shè)置并提供基礎(chǔ)架構(gòu)和軟件服務(wù)。當(dāng)他們創(chuàng)建平臺(tái)作為服務(wù)時(shí),該團(tuán)隊(duì)不需要大量的域特定知識(shí)。它只專注于技術(shù)方面,使其成為可重復(fù)的,并與所有團(tuán)隊(duì)分享解決方案。這促進(jìn)設(shè)置尺度非常好!我的同事Ruurtjan陣列在這個(gè)博客中展示了如何從團(tuán)隊(duì)成分角度來(lái)實(shí)現(xiàn)縮放。然而,有一個(gè)大風(fēng)險(xiǎn):采取瀑布方法。

數(shù)據(jù)網(wǎng)格方法解決了與數(shù)據(jù)重用相關(guān)的域知識(shí)的難度。這是通過(guò)將數(shù)據(jù)的責(zé)任移動(dòng)到生產(chǎn)和使用該數(shù)據(jù)的團(tuán)隊(duì)的責(zé)任來(lái)完成。而不是擁有所有數(shù)據(jù)的中央團(tuán)隊(duì),我們現(xiàn)在需要一個(gè)中央團(tuán)隊(duì),以方便所有團(tuán)隊(duì)管理他們的數(shù)據(jù)。

陷阱是在讓這個(gè)中央團(tuán)隊(duì)開(kāi)始和運(yùn)行時(shí)采取瀑布方法。在船上之前,不要?jiǎng)?chuàng)建所有必需的基礎(chǔ)架構(gòu)和服務(wù)。只要沒(méi)有使用服務(wù)的單一團(tuán)隊(duì),就沒(méi)有增加值。因此,您需要迭代地增長(zhǎng)和改善服務(wù),而團(tuán)隊(duì)則可以使用它。

第二個(gè)風(fēng)險(xiǎn)是使平臺(tái)成為服務(wù)團(tuán)隊(duì)決定了工作方式。這將使團(tuán)隊(duì)成為整個(gè)公司的瓶頸。在敏捷和迭代的方法中,一些團(tuán)隊(duì)需要新的工具或服務(wù),該服務(wù)尚未為公司采用準(zhǔn)備好生產(chǎn)。作為服務(wù)團(tuán)隊(duì)的平臺(tái),而不是限制那些早期的采用者,而是應(yīng)該允許和賦予新工具和服務(wù)的發(fā)現(xiàn)和試驗(yàn)。讓他們授權(quán)產(chǎn)品團(tuán)隊(duì)并加入軍隊(duì)。這將為兩支球隊(duì)提供分享工具和服務(wù)的經(jīng)驗(yàn)進(jìn)一步跨本公司。

是否可以轉(zhuǎn)換到數(shù)據(jù)網(wǎng)?是否有可能在中央數(shù)據(jù)平臺(tái)和數(shù)據(jù)網(wǎng)之間具有內(nèi)容?我們?nèi)绾蝿?wù)實(shí)地采取第一步?我們盡快收獲盡快收益。在一個(gè)針對(duì)您組織的基礎(chǔ)架構(gòu)功能上量身定制的解決方案中。此帖子的其余部分將解釋如何轉(zhuǎn)換到可實(shí)現(xiàn)機(jī)器學(xué)習(xí)解決方案,授權(quán)數(shù)據(jù)科學(xué)家的數(shù)據(jù)平臺(tái)的轉(zhuǎn)換,并分享內(nèi)部工作方式。

第一步:輕量級(jí)的中央數(shù)據(jù)平臺(tái)

您可以創(chuàng)建該數(shù)據(jù)平臺(tái)的第一步是什么?不幸的是,沒(méi)有餅干刀模板。該方法應(yīng)依賴于具體情況,包括現(xiàn)有的技術(shù)堆棧,可用技能和能力,流程和一般Devops以及MLOPS成熟。我可以給你通用的建議,希望有一個(gè)有用的滲透率。

一種方法是將以前版本的優(yōu)勢(shì)與未來(lái)的墊腳石結(jié)合起來(lái),更高級(jí)版本(如數(shù)據(jù)網(wǎng)格):

  • 數(shù)據(jù)工程師專注于提取和負(fù)載,變換最小。
  • 域特定(數(shù)據(jù)科學(xué))團(tuán)隊(duì)專注于高級(jí)轉(zhuǎn)換。
  • 工具應(yīng)提供授權(quán)團(tuán)隊(duì)。

該方法是創(chuàng)建一個(gè)輕量級(jí)的中央數(shù)據(jù)平臺(tái),包括以下步驟:

  • 使用特定用例拍攝一個(gè)數(shù)據(jù)科學(xué)團(tuán)隊(duì)。
  • 設(shè)置一支團(tuán)隊(duì),包括平臺(tái)工程師和數(shù)據(jù)工程師。
  • 該平臺(tái)工程師提供數(shù)據(jù)科學(xué)團(tuán)隊(duì),其中包含分析環(huán)境,包含至少存儲(chǔ)和處理。
  • 數(shù)據(jù)工程師從源表中加載原始數(shù)據(jù),添加基本標(biāo)準(zhǔn)化轉(zhuǎn)換,并將其提供給使用案例團(tuán)隊(duì)。與平臺(tái)工程師一起,他們創(chuàng)造了所需的服務(wù)。
  • 數(shù)據(jù)科學(xué)家與數(shù)據(jù)平臺(tái)工程師合作,在調(diào)度,運(yùn)行和運(yùn)行數(shù)據(jù)轉(zhuǎn)換,模型訓(xùn)練循環(huán)和模型服務(wù)時(shí),可以成為自我。他們與數(shù)據(jù)工程師合作,專業(yè)化其數(shù)據(jù)轉(zhuǎn)換。

在這種情況下,數(shù)據(jù)科學(xué)家仍然必須做很多數(shù)據(jù)播種。但是,我們接受它而不是假設(shè)不會(huì)發(fā)生,而是為他們提供最佳工作的工具。

這種方法的一個(gè)關(guān)鍵方面是從一個(gè)用例開(kāi)始焦點(diǎn)。數(shù)據(jù)工程師,平臺(tái)工程師和數(shù)據(jù)科學(xué)家首先解決這一案例。與此同時(shí),他們?cè)谏院箝_(kāi)發(fā)必要的工具方面獲得經(jīng)驗(yàn)。

結(jié)果如下:

> A lightweight data platform, as a step toward the data mesh. Image by author.

在左側(cè),我們保留了原始情況,部門或產(chǎn)品團(tuán)隊(duì)只是開(kāi)發(fā)或運(yùn)營(yíng)生產(chǎn)實(shí)例。這限制了公司廣泛的變化。

在中間,數(shù)據(jù)工程師專注于具有高質(zhì)量管道的輕量級(jí)數(shù)據(jù)建模。他們主要有助于加載數(shù)據(jù),并提供標(biāo)準(zhǔn)化的訪問(wèn)方法。他們具有強(qiáng)大的技術(shù)焦點(diǎn),包括基礎(chǔ)設(shè)施和服務(wù)。

在右側(cè),數(shù)據(jù)科學(xué)團(tuán)隊(duì)專注于根據(jù)所有必需的域知識(shí)創(chuàng)建數(shù)據(jù)產(chǎn)品。他們通過(guò)從客戶(使用他們的數(shù)據(jù)產(chǎn)品)和上游數(shù)據(jù)來(lái)源的團(tuán)隊(duì)來(lái)獲得所述域知識(shí)。他們運(yùn)行所有必需的分析和轉(zhuǎn)換,同時(shí)由平臺(tái)作為服務(wù)團(tuán)隊(duì)支持。他們有一個(gè)強(qiáng)大的領(lǐng)域和用例焦點(diǎn)。

在底部,平臺(tái)作為服務(wù)團(tuán)隊(duì)的工作組件創(chuàng)建可重用組件。因此,他們具有技術(shù)焦點(diǎn)。他們?yōu)榫哂杏蛎裹c(diǎn)的數(shù)據(jù)科學(xué)團(tuán)隊(duì)提供服務(wù)。作為服務(wù)團(tuán)隊(duì)的平臺(tái)應(yīng)由其要求推動(dòng)。

下一步:跨團(tuán)隊(duì)擴(kuò)展和分享

下一步是擴(kuò)展??梢栽诟鞣N維度上完成縮放,包括獲取更多源數(shù)據(jù)集,接入更多的數(shù)據(jù)科學(xué)團(tuán)隊(duì),或者將更多的授權(quán)平臺(tái)添加為服務(wù)(思考要素存儲(chǔ),型號(hào),依此類推)。同樣,這些選擇取決于情況。

目前,讓我們參加一個(gè)典型的步驟:接入更多數(shù)據(jù)科學(xué)團(tuán)隊(duì)。第一支球隊(duì)的登上隊(duì)確保了發(fā)達(dá)的服務(wù)很有用。第一個(gè)團(tuán)隊(duì)是推出的客戶。作為服務(wù)團(tuán)隊(duì)的平臺(tái)確保了良好的市場(chǎng)適合內(nèi)部客戶。下一個(gè)團(tuán)隊(duì)?wèi)?yīng)該更快,更順利地運(yùn)行。

使用多個(gè)團(tuán)隊(duì)使用該服務(wù),下一個(gè)障礙將是允許在數(shù)據(jù)科學(xué)團(tuán)隊(duì)之間共享數(shù)據(jù)。這可能需要服務(wù)的一些變化和工作方式。但如果達(dá)到該里程碑,平臺(tái)倡議將真正改善所有后續(xù)團(tuán)隊(duì)的生活。這導(dǎo)致以下情況:

> Scaling up by on-boarding more teams

與上一個(gè)圖像相比,我們現(xiàn)在有一個(gè)額外的數(shù)據(jù)科學(xué)團(tuán)隊(duì),開(kāi)發(fā)欺詐檢測(cè)產(chǎn)品。他們應(yīng)該能夠從平臺(tái)工程師中重用開(kāi)發(fā)的服務(wù)并從第一支預(yù)測(cè)團(tuán)隊(duì)中重復(fù)使用數(shù)據(jù)。

以下步驟:專業(yè)化和縮放

不要忘記這些數(shù)據(jù)平臺(tái)舉措的目標(biāo)。目標(biāo)是啟用更多數(shù)據(jù)產(chǎn)品。因此,除了登上多個(gè)數(shù)據(jù)科學(xué)團(tuán)隊(duì),還可以努力向生產(chǎn)模式工作。授權(quán)第一個(gè)(少數(shù))團(tuán)隊(duì)實(shí)際嵌入他們的模型預(yù)測(cè)到業(yè)務(wù)中。

使用這些平臺(tái),流程和工作方式,下一步不太清楚。有很多機(jī)會(huì)可以提高服務(wù)素質(zhì)和團(tuán)隊(duì)合作。

根據(jù)業(yè)務(wù)需求,可以提高所提供服務(wù)的質(zhì)量。也許需要一個(gè)實(shí)時(shí)特征存儲(chǔ),一個(gè)新的型號(hào)服務(wù)平臺(tái),自動(dòng)ml工具或更好的模型監(jiān)控?

就球隊(duì)的一致性而言,可能需要一些班次。也許很多案例需要一個(gè)“客戶360視圖”,這可能導(dǎo)致創(chuàng)建一個(gè)團(tuán)隊(duì)來(lái)管理該統(tǒng)一視圖,具有一些自動(dòng)生成的功能。各種類似的常見(jiàn)問(wèn)題可以用作創(chuàng)建新的常見(jiàn)解決方案的主動(dòng)性。

總結(jié)

通過(guò)對(duì)其開(kāi)發(fā)的敏捷方法,我已經(jīng)顯示了一種朝著更多數(shù)據(jù)驅(qū)動(dòng)組織移動(dòng)的方式。該帖子希望將您的情況進(jìn)行比較,而不是將任何解決方案提出“最佳方式”。

這種方法的關(guān)鍵組成部分是:

  • 敏捷(內(nèi)部)客戶集中的方法。
  • 平臺(tái)思考。
  • 刪除瓶頸,同時(shí)提供一個(gè)靈活性的平臺(tái),并賦予數(shù)據(jù)科學(xué)團(tuán)隊(duì)。
  • 自由團(tuán)隊(duì),自由和自主。它們可以自由地使用適合它們的服務(wù),并可以自主準(zhǔn)備他們的數(shù)據(jù)。

 

責(zé)任編輯:趙寧寧 來(lái)源: 今日頭條
相關(guān)推薦

2016-07-14 10:33:30

數(shù)據(jù)中心網(wǎng)絡(luò)計(jì)算環(huán)境白盒交換機(jī)

2021-04-19 14:18:17

數(shù)據(jù)分析互聯(lián)網(wǎng)運(yùn)營(yíng)大數(shù)據(jù)

2017-09-27 14:42:16

IaaS云計(jì)算云服務(wù)

2018-03-09 12:00:02

數(shù)字化數(shù)據(jù)庫(kù)容器

2012-02-08 09:58:58

數(shù)據(jù)中心網(wǎng)絡(luò)結(jié)構(gòu)

2018-11-21 14:44:33

數(shù)據(jù)庫(kù)容器數(shù)據(jù)架構(gòu)

2020-03-06 16:04:10

DataOps數(shù)據(jù)分析數(shù)據(jù)質(zhì)量

2010-03-29 17:43:32

2017-03-16 09:24:31

數(shù)據(jù)集成業(yè)務(wù)

2013-07-09 13:58:57

數(shù)據(jù)中心風(fēng)險(xiǎn)現(xiàn)代數(shù)據(jù)中心

2024-03-21 15:54:00

數(shù)據(jù)堆棧數(shù)據(jù)管理數(shù)據(jù)結(jié)構(gòu)

2022-07-18 20:03:55

DataOpsDevOps

2017-11-28 09:22:25

數(shù)據(jù)中心功耗

2016-03-09 10:07:54

數(shù)據(jù)架構(gòu)大數(shù)據(jù)即服務(wù)數(shù)據(jù)分析

2022-07-06 17:46:22

DataOpsDevOps

2017-11-03 10:47:04

數(shù)據(jù)中心容量管理

2024-04-29 13:09:00

數(shù)據(jù)中心

2020-01-09 10:50:46

數(shù)據(jù)中心IT技術(shù)

2017-11-23 05:50:14

2020-06-22 17:26:36

數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)數(shù)據(jù)庫(kù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

小h片在线观看| 一级黄色a毛片| 麻豆一区一区三区四区| 色综合天天在线| 涩涩日韩在线| 成人毛片视频免费看| 乱码第一页成人| 不卡伊人av在线播放| 交换做爰国语对白| 97成人资源| 亚洲欧美国产高清| 欧美aaaaa喷水| www三级免费| 日本成人在线不卡视频| 欧美激情图片区| 天天摸日日摸狠狠添| 福利电影一区| 欧美一级黄色大片| 久久久精品麻豆| 成年人黄色大片在线| 国产午夜精品久久| 国产精品乱子乱xxxx| 国产91精品看黄网站在线观看| 亚洲精品成人无限看| 亚洲四色影视在线观看| 欧美激情aaaa| av在线观看地址| 91精彩在线视频| gogogo免费视频观看亚洲一| 国产在线视频2019最新视频| 久久黄色精品视频| 国产主播一区| 久久亚洲精品毛片| 超薄肉色丝袜一二三| 人人精品亚洲| 精品国产91九色蝌蚪| 午夜免费看毛片| 外国电影一区二区| 色悠悠久久综合| 人妻精品无码一区二区三区| 暖暖在线中文免费日本| 最近日韩中文字幕| 亚洲精品一卡二卡三卡四卡| 青青草在线免费观看| 不卡一区在线观看| 高清视频在线观看一区| 国产女主播福利| 天堂av资源在线| 翔田千里一区二区| 69久久夜色精品国产69| 日本少妇久久久| 不卡的av影片| 在线亚洲激情| 欧美激情免费在线| 久久精品www| 亚洲午夜一区| 欧美激情一区二区三区在线视频观看| 欧美偷拍第一页| 亚洲色图二区| 欧美情侣性视频| 精品在线免费观看视频| 亚洲第一伊人| 欧美伊久线香蕉线新在线| 青青草av在线播放| 国产极品模特精品一二| thepron国产精品| 成人伊人精品色xxxx视频| 亚洲天堂久久久久| 国产在线一区二区| 欧美精品在线观看91| 视频一区二区三区免费观看| 精品国产伦一区二区三区| 国产精品夜夜嗨| 91精品天堂| 欧美一级在线免费观看| www.亚洲国产| 日韩一区免费观看| 国产黄色在线免费观看| 亚洲一区二区三区视频在线| 免费一级特黄特色毛片久久看| 日本在线啊啊| 欧美色大人视频| 污视频在线观看免费网站| 99a精品视频在线观看| 亚洲第五色综合网| 欧洲美熟女乱又伦| 中文乱码免费一区二区三区下载| 欧美国产日产韩国视频| 亚洲免费在线观看av| 蜜臀av在线播放一区二区三区 | 国产67194| 精品1区2区3区4区| 国产精品扒开腿做爽爽爽视频 | 亚洲图片欧美午夜| 久久嫩草捆绑紧缚| 亚洲美女少妇无套啪啪呻吟| 国产精品久久久久久久久免费看| 亚洲天堂视频网| 成人av网站免费观看| 亚洲电影一二三区| 国产调教在线| 欧美疯狂做受xxxx富婆| 日本一卡二卡在线| 久久精品影视| 日韩美女视频免费在线观看| av中文字幕免费在线观看| 91网页版在线| 国产又粗又猛又爽又黄的网站| 136福利第一导航国产在线| 欧美日韩中文字幕一区| 亚洲av人人澡人人爽人人夜夜| 色88久久久久高潮综合影院| 午夜精品福利视频| 国产视频手机在线观看| 欧美激情一区二区在线| 亚欧无线一线二线三线区别| 成人亚洲精品| 中文字幕视频在线免费欧美日韩综合在线看 | 中文字幕午夜精品一区二区三区| 国产成人黄色av| 好吊色一区二区| 亚洲精品v日韩精品| 99草草国产熟女视频在线| 福利在线一区| 免费91在线视频| 在线观看中文字幕网站| 久久影院午夜论| 成人免费性视频| 激情久久免费视频| 社区色欧美激情 | 日本视频www色| www一区二区| 免费看又黄又无码的网站| 亚洲无线观看| 久久99亚洲精品| 精品人妻一区二区三区换脸明星 | 麻豆久久久久| 国产亚洲精品美女| 无码人妻av一区二区三区波多野| 97精品视频在线观看自产线路二| 男女h黄动漫啪啪无遮挡软件| 国产精品一区二区免费福利视频| 亚洲欧美国产一本综合首页| 国产精品一区二区6| 成人爱爱电影网址| 日韩一级性生活片| 激情小说亚洲图片| 九九久久精品一区| 韩国av在线免费观看| 午夜精品福利在线| 亚洲色图14p| 国产农村妇女精品一区二区| 久久精品国产精品国产精品污| 日韩欧美精品一区二区三区| 日韩精品在线观看一区二区| 青青国产在线观看| 久久精品亚洲乱码伦伦中文| 搡女人真爽免费午夜网站| 三级电影一区| 99久久综合狠狠综合久久止| 超碰在线最新网址| 亚洲激情免费观看| 波多野结衣啪啪| 国产精品久线观看视频| 91热视频在线观看| 在线看片成人| 欧美日韩日本网| 91精品店在线| 欧美成人激情视频| 姝姝窝人体www聚色窝| 欧美视频在线观看 亚洲欧| 国精产品一区二区三区| 久久国产精品99久久久久久老狼 | 成人在线观看免费高清| 久久国产视频网| japanese在线播放| 欧美激情极品| 国产欧美精品一区二区| 中文字幕在线观看网站| 国产婷婷成人久久av免费高清| 91麻豆精品在线| 亚洲精品国产一区二区三区四区在线| 95视频在线观看| 男女性色大片免费观看一区二区 | 成人欧美大片| 精品国产欧美一区二区三区成人| 亚洲高清精品视频| 在线这里只有精品| 久久高清无码视频| 久久免费电影网| 手机在线播放av| 天堂在线亚洲视频| 成人短视频在线观看免费| 亚洲裸色大胆大尺寸艺术写真| 国产精品视频yy9099| 久久免费电影| 色噜噜狠狠狠综合曰曰曰| 成人免费一级视频| 欧美群妇大交群的观看方式| 日韩 欧美 精品| 成人免费在线视频观看| 亚洲第九十七页| 国产高清无密码一区二区三区| 99久久国产宗和精品1上映| 欧美 日韩 国产一区二区在线视频 | 亚洲精品进入| 3d精品h动漫啪啪一区二区| 最近高清中文在线字幕在线观看1| www.日韩系列| 国产在线一在线二| 亚洲国产一区二区三区在线观看| 伊人22222| 一本大道久久a久久精二百| 精品一区二区三区四| 亚洲视频一二区| 日本一道本视频| 97精品久久久午夜一区二区三区| 韩国三级丰满少妇高潮| 美日韩一区二区| 欧美亚洲日本在线观看| 亚洲精品一二| 日韩精品一区二区在线视频| 91欧美国产| 先锋影音欧美| 欧美一区二区三| 日本午夜一区二区三区| 天海翼精品一区二区三区| 波多野结衣成人在线| 国产精品高清一区二区| 国产精品一区二区女厕厕| 色8久久影院午夜场| 欧美综合国产精品久久丁香| √8天堂资源地址中文在线| 欧美激情亚洲精品| sm在线观看| 久久久噜噜噜久久| 超碰在线97国产| 欧美激情免费观看| 国产理论电影在线| 欧美激情按摩在线| 国产盗摄精品一区二区酒店| 欧美成人免费大片| 亚洲欧美成人影院| 欧美高清不卡在线| 国产美女情趣调教h一区二区| 欧美韩日一区二区| 高h视频在线播放| 国内精品小视频| 91超碰国产在线| 琪琪第一精品导航| 国产成人免费9x9x人网站视频| 热久久免费视频精品| 天天免费亚洲黑人免费| 日韩免费不卡av| www.一区| 亚洲a中文字幕| 91蝌蚪精品视频| 久久视频在线观看中文字幕| 九九久久成人| 亚洲资源视频| 欧美99在线视频观看| 隔壁人妻偷人bd中字| 悠悠资源网久久精品| 69堂免费视频| 秋霞成人午夜伦在线观看| av亚洲天堂网| 国产不卡一区视频| 欧美丰满少妇人妻精品| 日本一区二区三级电影在线观看| 欧美日韩生活片| 一区二区三区欧美亚洲| 日本三级午夜理伦三级三| 日本黄色一区二区| 国产又大又粗又长| 亚洲大胆人体视频| 91精品国产综合久久久久久豆腐| 欧美成年人在线观看| 不卡一本毛片| 国产精品偷伦免费视频观看的| 免费精品一区二区三区在线观看| 不卡一卡2卡3卡4卡精品在| 日韩美女精品| 综合操久久久| 亚洲综合精品四区| 91国内在线播放| 99精品欧美一区二区蜜桃免费 | 午夜精品电影| av动漫在线观看| 极品少妇一区二区| 黄色性生活一级片| 国产精品成人免费精品自在线观看| 九九免费精品视频| 欧美在线观看禁18| 蜜桃在线一区二区| 色青青草原桃花久久综合 | 狠狠干狠狠久久| 国产精品久久久久久69| 日韩电视剧免费观看网站| 视频一区二区三区不卡 | 不卡的国产精品| 麻豆视频成人| 国产精品www994| 视色视频在线观看| 91首页免费视频| 免费高清在线观看电视| 色综合视频在线观看| 午夜精品在线播放| 中文字幕一区电影| 婷婷六月国产精品久久不卡| 成人免费视频观看视频| 久久高清精品| 欧美激情精品久久久久久小说| 国产成人精品网址| 懂色av粉嫩av蜜臀av一区二区三区| 午夜不卡av在线| 性猛交富婆╳xxx乱大交天津 | 欧美日韩喷水| 亚洲激情综合| 亚洲最大视频网| 亚洲人成在线播放网站岛国| 免费黄色片视频| 日韩经典一区二区三区| 美女精品导航| 91九色在线观看| 91精品一区国产高清在线gif| www.天天射.com| 国产日韩欧美综合一区| 国产午夜在线播放| 亚洲成人精品av| 免费不卡av| 丁香婷婷久久久综合精品国产| 97精品国产一区二区三区 | 国产寡妇亲子伦一区二区三区四区| 精品国产欧美一区二区| 在线中文字幕电影| 亚洲一区二区三区乱码aⅴ| 色喇叭免费久久综合| 韩国中文字幕av| 国产欧美一区二区三区在线看蜜臀 | 亚洲一级二级片| 8x福利精品第一导航| 香蕉视频在线免费看| 成人免费在线视频网站| 97国产成人高清在线观看| 午夜av中文字幕| 亚洲欧美日韩在线| 精品人妻一区二区三区日产乱码| 欧美xxxx做受欧美.88| 国产亚洲观看| 久久亚洲a v| 成人高清在线视频| 欧美一二三区视频| 亚洲片国产一区一级在线观看| 二吊插入一穴一区二区| 亚洲精品国产一区| 狠狠色狠狠色综合日日91app| 国产免费一区二区三区四区| 51精品秘密在线观看| 91麻豆免费在线视频| 国产伦精品一区二区三区视频免费| 一区二区日本视频| av电影网站在线观看| 欧美日韩国产首页在线观看| 成人看av片| 国产伦精品一区二区三区照片| 国产精品试看| 欧美日韩中文字幕视频| 91精品欧美一区二区三区综合在 | 日本中文字幕成人| 成人在线电影在线观看视频| 91 视频免费观看| 亚洲主播在线播放| 欧美日韩在线中文字幕| 国产精品入口福利| 欧美激情性爽国产精品17p| 超碰97在线资源站| 欧美日韩亚洲综合在线 欧美亚洲特黄一级| 麻豆91在线| 精品国产免费人成电影在线观...| 视频一区中文字幕国产| 午夜剧场免费在线观看| 亚洲精品国精品久久99热一| 一区在线影院| 日韩精品在线中文字幕| 国产校园另类小说区| 国产av精国产传媒| 2020国产精品视频| 国产精品99一区二区三区| 久久精品女同亚洲女同13| 欧美午夜精品一区二区三区| 视频三区在线| 国产麻豆日韩| 紧缚捆绑精品一区二区| 国产成人综合欧美精品久久| 久久影院模特热| 久久99久久人婷婷精品综合| 欧美体内she精高潮| 在线亚洲+欧美+日本专区| 怡红院在线观看| 亚洲欧美日韩国产成人综合一二三区|