精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

AB實驗的采樣分流技術演進以及Sutva假設與現實挑戰

大數據
通過 AB實驗,我們可以發現退燒是因,出汗是果, 所以發燒捂汗的做法是不對的。在互聯網產品中,類似的問題很常見, AB實驗可以給決策者更清晰的因果鏈路, 從而讓產品經理或者業務決策者更全局的視角,更準的決策。

實驗文化在互聯網公司越來越普及,AB實驗作為業務決策的輔助工具,可以精準區分策略效果的隨機波動與顯著增長。此外AB實驗還可以評估策略的因果關系,舉一個生活中的例子,退燒的時候往往會出汗,那么退燒和出汗的因果關系是什么, 是不是發燒之后我們應該穿更多衣服捂汗?通過 AB實驗,我們可以發現退燒是因,出汗是果, 所以發燒捂汗的做法是不對的。在互聯網產品中,類似的問題很常見, AB實驗可以給決策者更清晰的因果鏈路, 從而讓產品經理或者業務決策者更全局的視角,更準的決策。

一、采樣分流技術的發展

傳統AB實驗,在實驗開始前分好AB組用戶,同時生效策略。例如醫學實驗, 實驗開始前招募志愿者,然后分為AB兩組。互聯網實驗的區別:A組實時采樣1%的用戶, B組同樣實時采樣1%的用戶, 然后啟動實驗,AB組的命中實驗的用戶會陸續進入實驗,第一天實驗組可能來了 0.2% 的用戶,隨著實驗時間增加,實驗用戶量逐漸接近 1%,這里和傳統的醫學實驗不一樣。

我們把互聯網產品的用戶看做一個有限個數的總體,從這個總體中,隨機無放回的采樣得到AB組用戶,一種簡單的工程實現:將大盤用戶隨機Shuffle一次,然后按照比例取出 AB組用戶。但這樣的采樣在工程化的時候比較復雜,因為每次啟動實驗,我們都需要對大盤用戶做一次Shuffle。進一步優化,我們可以選擇一個密碼學Hash函數實時采樣, 因為密碼學Hash函數可以保證任意兩個用戶ID的Hash Value是獨立的, 這個性質等價于隨機采樣。當實驗比較多的時候,我們發現這種hash模擬隨機采樣的分流方式還是有一個問題:用戶是有記憶性的, 上一個實驗的效果會延續到新的實驗,我們通過二次Hash來解決這個問題。除 Hash 采樣之外,再介紹一種更復雜的完美隨機分流策略,基于有限域(galois field)理論,我們給出一種完美隨機方案《Orthogonal Traffic Assignment in Online Overlapping A/B Tests》。

二、指標計算評估的發展

在互聯網業務大量使用 AB實驗之前, 數據分析師使用業務 BI 報表給老板匯報數據, BI報表數據往往是某一天,大盤用戶的行為數據,例如某天所有用戶的訪問時長除以當天的總人數,得到人均訪問時長。

AB 實驗初期,產品經理或者數據分析同學有之前的固定思維,一個實驗運行 7 天,他們會把每一天的用戶訪問時間加起來作為分子,再除把每一天進入實驗的用戶加起來(不去重)作為分母,計算“人均訪問時長”,這個指標和 BI 報表的指標是口徑一致的。用這個指標口徑做實驗,通過 jackknife/bootstrap 估計方差做統計推斷。但是這樣的口徑是不科學的,舉一個例子:在BI業務報表中,產品經理一般使用的是非聚合指標,例如看連續兩天報告,人均瀏點擊次數=(第一天點擊次數+第二天點擊次數)/ (第一天用戶數+第二天用戶數),這里用戶數在兩天內沒有做去重聚合。在AB實驗中,這樣定義指標有明顯缺陷。例如,A組和B組假設在第一天都進入了10個用戶,A組的策略非參糟糕,留存是0, 第二天沒有用戶訪問,B組策略比較好,留存是100%, 第二天這10個人都又分別點擊了一次,我們如果使用BI報表中的非聚合口徑計算指標,A組的人均點擊=(10+0)/(10+0) = 1 , B組的人均點擊=(10+10)/(10+10)=1 , A組指標=B組指標,我們得出AB組策略沒有差異,顯然是一個錯誤的結論。在AB實驗中,正確的指標定義是:人均瀏點擊次數=(第一天點擊次數+第二天點擊次數)/ (去重(第一天用戶數+第二天用戶數)), 新口徑下,A組指標=10/10=1 , B組指標=20/10=2 , 可以看出B組策略顯著好于A組。

指標的長期效果預測,AB 實驗的指標結果代表實驗期間對策略效果的評估,但是產品負責人或者老板更需要得到一個長期效果,策略對全年 OKR的貢獻。我們在這篇文章中有詳細的分析如何評估長期效果《Estimating Causal Effects of Long-Term Treatments》(EC'23)   

三、AB實驗統計推斷的發展

Sutva (Stable Unit Treatment Value Assumption)假設直觀的理解:在 AB實驗中,給 B組用戶一個策略,B組用戶的不會把策略效應溢出到 A組;

1.Sutva 假設成立時:

固定樣本假設推斷, 我們在實驗開始前,確定 Power 和業務檢驗精度,計算出實驗所需要的樣本量,然后啟動實驗。這是一個理想實驗設計,在采樣分流技術中有提到,互聯網實驗中,用戶是陸續進入實驗,所以這種固定樣本實驗有一些問題:

  • 實驗做 3 天與 7 天的檢驗統計量分布可能不同,例如3天的人均訪問時長和 7 天人均訪問時長,顯然是兩個不同的分布(計算口徑是人均去重指標,在 AB實驗指標計算中有提到)。
  • 實驗采樣是實時的,實驗第一天進入實驗的用戶成分,活躍用戶占比較高, 實驗運行累計兩天時,非活躍用戶占比上升,隨著實驗累計時間增加 ,實驗人群中非活躍占比逐漸增大,最終逐漸接近大盤中的用戶成分。當實驗策略在活躍與非活躍用戶的類型上產生不一樣的效應,那么實驗評估的準確性會受到影響。我們需要一些找到一個合適時間停止實驗,來降低這里的風險,我們最近完成的工作:《Enhancing External Validity of Experiments with Ongoing Sampling Process》(EC'24)。
  • 用戶連續觀測 Peeking 問題(重復看實驗導致一類錯誤升高),隨著基礎實時數倉的發展,業務需要對實時的指標做統計推斷,例如,有一個實時 CTR指標,業務希望在可以在任意時刻做統計推斷,這里帶來新的挑戰,序列化檢驗模型的落地與應用。

更復雜的場景,產品經理想對某一組 UI做實驗,例如一個按鈕的顏色也形狀和文案三個維度,每個維度有 4 個選擇,那么總共有 4*4*4=64 個策略,同時做這 64 個策略對比,這幾乎是一件不可能完成的任務。再例如,我們做一個模型超參實驗,超參數的取值在實數域,我們不可能通過 AB實驗枚舉實數域進行實驗。這里引入新的Multi-armed Bandit/Bayesian optimization 實驗方案。

2.Sutva 假設不成立時:

固定關系的干擾:

舉一個例子,在社交場景做實驗,實驗策略可以通過已知好友關系傳播,我們做一個 50%vs50% 的實驗,實驗組中的用戶通過好友關系,把實驗策略分享到對照組的用戶,結果實驗組和對照組都受到策略影響, 我們實驗的統計量(實驗組用戶均值-對照組用戶均值)檢測不到差異。這個例子中, AB 組之間的干擾都來源于已知的關系傳導,我們可以在隨機采樣的時候,考慮關系圖,進行圖采樣,得到兩個隔離的 AB 組進行實驗。另外一種處理思路是,因為傳導關系已知,我們可以通過定義一個可以表達傳導效應的新統計量進行實驗;最后一種思路是建模,我們通過模型預測數傳導效應進行實驗。我們最近完成的一些文章:

《Optimized Covariance Design for AB Test on Social Network under Interference》(NeurIPS'24)

《Unbiased Estimation for Total Treatment Effect Under Interference Using Aggregated Dyadic Data》(MitCoDE'23)

《Ego Group Partition: A Novel Framework for Improving Ego Experiments in Social Networks》(MitCoDE'23)

非固定關系的干擾:

舉一個例子,在主播實驗中,我們對 B組主播給一些激勵策略,那么 B 組主播的直播間會有更好的指標。因為 B組主播搶奪了原本進入 A 組主播的用戶。如果我們把這個策略全量上線之后,不存在 A 組策略的主播,也就不存在“搶奪”效應。所以在實驗過程中我們看到的 B 組效果好,可能是被高估的。這類場景比較復雜,因為非固定關系有很多不同的情況,大多來自推薦系統的策略和產品自身的傳導效應,還有外部因素的干預等。我們對于這種情況的實驗 case by case 分析,通過因果推斷、結構化模型、強化學習等一系列方法評估實驗效果,可以進一步閱讀我們最近完成的文章:《Estimating Treatment Effects under Recommender Interference: A Structured Neural Networks》(EC'24)  

四、AB實驗當前遇到的難點與挑戰

隨著業務越來越廣的應用AB實驗, 我們面臨一些新的挑戰:大數據量的挑戰,實驗數量快速增加,如何更快、更準、更穩的提供計算支持。相關工作我們整理發表在 VLDB'24 : 《Large-Scale Metric Computation in Online Controlled Experiment Platform 》

算法方向,復雜業務系統中 Sutva 不成立時,如何更準的支持實驗,例如搜索系統、推薦系統、廣告系統中。實驗結果如何更準確的反應業務大盤,以及更準的評估實驗長期收益。最后是很多不能做實驗的場景,我們如何把因果推斷技術標準化和效果評估做好,助力業務提供增長。我們開源了一套基于 Olap 引擎分的布式計算因果推斷庫,解決非標準化AB實驗評估問題。《Fast-Causal-Inference: a Causal Inference Tool at Scale》(MitCoDE'23)

責任編輯:姜華 來源: DataFunTalk
相關推薦

2023-09-06 18:37:21

可視化數倉平臺

2020-05-06 10:59:18

區塊鏈分布式比特幣

2010-03-25 10:43:24

2022-05-11 11:26:39

安全產品安全風險數據安全

2020-01-11 17:49:03

區塊鏈數字貨幣比特幣

2021-05-13 10:02:45

生物識別技術加密身份認證

2025-08-05 02:25:00

多模態大語言模型

2016-04-27 10:32:04

裸眼3DVR虛擬現實

2025-07-11 09:16:00

2023-12-07 14:20:05

2018-09-06 15:15:44

2025-01-06 13:51:37

2022-11-07 14:03:46

2009-03-17 09:37:00

ADSL分流寬帶接入

2022-09-14 11:15:33

多云混合云云數據庫

2025-06-16 04:00:00

Spring彈幕技術

2023-01-16 14:56:00

Graph圖數據庫

2017-06-08 12:26:23

2015-04-15 15:09:42

LET FDD

2023-04-04 10:54:12

點贊
收藏

51CTO技術棧公眾號

少妇一晚三次一区二区三区| 国产成人福利视频| 一级日本黄色片| av手机在线观看| 久久精品欧美一区二区三区不卡 | 亚洲第一区在线观看| 久久久久久久午夜| 日本不卡不卡| 99视频超级精品| 成人夜晚看av| 欧美一区二区三区不卡视频| 亚洲精品888| 精品网站999www| 黄色片免费网址| 暖暖成人免费视频| 亚洲精品成人精品456| 欧美日韩精品久久| 亚洲国产福利视频| 免费观看成人鲁鲁鲁鲁鲁视频| 欧美贵妇videos办公室| 国产一二三四视频| 任你躁在线精品免费| 日韩一区二区影院| 天天天干夜夜夜操| 欧美日韩在线观看首页| 亚洲欧美电影一区二区| 先锋影音一区二区三区| 四虎永久在线精品免费网址| 国产一区二三区好的| 国产成人精品一区二区三区| 久久视频免费在线观看| 午夜国产一区二区| 国产小视频91| 亚洲一区二区三区四区五区六区| 亚洲福利合集| 777亚洲妇女| 男女男精品视频站| 卡通欧美亚洲| 午夜电影一区二区| 青春草国产视频| av免费在线观看网址| 国产精品不卡视频| 色姑娘综合网| 国产福利第一视频在线播放| 久久久三级国产网站| 国产在线一区二区三区播放| 亚洲成人黄色片| 国产成人日日夜夜| 亚洲一区二区三区乱码aⅴ蜜桃女| 少妇又紧又色又爽又刺激视频| 久久高清一区| 26uuu另类亚洲欧美日本一| 国产无遮挡又黄又爽又色| 欧美日韩调教| 欧美国产中文字幕| 国产真实夫妇交换视频| 欧美视频不卡| 久久久久免费视频| 精品亚洲永久免费| 亚洲激情欧美| 欧美亚洲另类制服自拍| 国产又大又黄又粗| 丝袜亚洲另类欧美综合| 国产精品久久视频| 一区二区三区亚洲视频| 久久99久久精品欧美| 2019国产精品视频| 成人毛片在线免费观看| av高清久久久| 欧美日韩一区在线观看视频| 丁香婷婷在线观看| 中文字幕亚洲一区二区av在线 | 中文高清一区| 欧美中文在线视频| 亚洲欧美日韩一区二区三区四区| 日韩激情中文字幕| 91在线中文字幕| 亚洲av无码专区在线| 不卡av免费在线观看| 久久国产精品免费一区| 大胆av不用播放器在线播放| 亚洲欧美在线观看| av免费看网址| 日韩电影网站| 欧美一区二区二区| 成人免费无码大片a毛片| 蜜桃精品wwwmitaows| 色先锋资源久久综合5566| 亚洲综合网在线| 亚洲少妇在线| 91精品久久久久久久久久久| 黄色三级网站在线观看| 久久久99久久| 国产成人一二三区| 国模冰冰炮一区二区| 欧美高清你懂得| 亚洲精品国产成人av在线| 国产精品亚洲二区| 欧美日韩福利电影| 波多野结衣视频观看| 国产一区二区在线观看免费| 精品视频免费观看| 久草中文在线观看| 欧美性开放视频| 欧美日韩理论片| 欧美精美视频| 久久久久久久久久久av| 国内av在线播放| 不卡av在线网| 欧美xxxx吸乳| 高清av一区| 亚洲国产精品99| 久久国产美女视频| 丝袜美腿亚洲综合| 国产精品福利视频| 麻豆系列在线观看| 色综合久久88色综合天天| 国产裸体视频网站| 国产成人精品999在线观看| 色综合久综合久久综合久鬼88| 亚洲高清在线看| 波多野结衣一区二区三区| 激情图片qvod| 91福利精品在线观看| 日韩福利在线播放| 九九视频在线免费观看| 久久99精品国产.久久久久久| 久久大片网站| 国产乱码精品一区二三赶尸艳谈| 91精品国产综合久久久蜜臀图片| 日韩精品无码一区二区三区久久久| 亚洲黄页一区| 国产精品视频福利| 欧美xxxx黑人又粗又长| 884aa四虎影成人精品一区| 美国一级黄色录像| 久久亚洲不卡| 欧美成人综合一区| 手机av在线| 亚洲国产精品成人va在线观看| 日本老熟俱乐部h0930| 六月婷婷色综合| 相泽南亚洲一区二区在线播放 | 亚洲激情二区| 国产美女在线精品免费观看| 欧美xxxx免费虐| 精品乱人伦一区二区三区| 精品欧美一区二区久久久久| 国产一区二区三区美女| www.99riav| 日韩国产在线不卡视频| 欧美成人在线影院| 国产a级免费视频| 亚洲欧洲综合另类| 色综合久久久无码中文字幕波多| 你懂的国产精品| http;//www.99re视频| 午夜影院免费在线| 精品91自产拍在线观看一区| 精品无码久久久久久久| 99久久久久久| 成年人视频网站免费观看| 亚洲电影男人天堂| 国产精品日韩在线| 欧美激情黑人| 欧美mv日韩mv国产网站| 日韩福利片在线观看| 久久综合久久综合九色| 成年人视频在线免费| 欧美日韩激情在线一区二区三区| 国产精品久久一区| 18+视频在线观看| 精品国产乱码久久久久久夜甘婷婷| 日本三级视频在线| 久久久天堂av| 国产传媒免费观看| 在线免费高清一区二区三区| 麻豆av一区二区三区| h1515四虎成人| 色综合视频一区中文字幕| 丝袜视频国产在线播放| 欧美影院午夜播放| 91高清免费看| 92精品国产成人观看免费| 国产av无码专区亚洲精品| 国内精品久久久久久99蜜桃| 成人网址在线观看| 超碰97免费在线| 国产亚洲人成a一在线v站| 国产精品无码AV| 欧美日韩美女在线| 97精品在线播放| heyzo一本久久综合| www.亚洲高清| 亚洲裸体俱乐部裸体舞表演av| 日本一区二区三区视频免费看| 国产不卡精品| 国产精品久久久91| 伦理av在线| 永久免费精品影视网站| 亚洲精品一区二区三区四区| 在线观看国产91| 国产无遮挡免费视频| 一区在线播放视频| theav精尽人亡av| 国产精品1区二区.| 激情五月亚洲色图| 亚洲精品1区| 国产高清免费在线| 女人av一区| 国产精品久久久久免费| 欧美成人家庭影院| 45www国产精品网站| av在线看片| 中文字幕欧美专区| 日本成人一区二区三区| 日韩欧美自拍偷拍| 91av久久久| 色婷婷精品大在线视频| 可以在线观看av的网站| 亚洲激情在线激情| 小嫩苞一区二区三区| 国产欧美日韩在线看| 国产白嫩美女无套久久| 国产精品一区2区| 免费一区二区三区在线观看| 日韩在线一区二区三区| 国产欧美在线一区| 伊人精品成人久久综合软件| 国风产精品一区二区| 999成人网| 亚洲欧洲精品一区二区三区波多野1战4 | 亚洲av无码一区东京热久久| 国产在线精品一区二区三区不卡| 亚洲 中文字幕 日韩 无码| 亚洲欧美清纯在线制服| 欧美日本视频在线观看| 亚洲精品少妇| 成人黄色av片| 中文亚洲欧美| 人妻少妇被粗大爽9797pw| 99精品国产福利在线观看免费 | 电影一区二区三| 欧美一级高清免费播放| 日本在线影院| 欧美一级视频一区二区| 在线观看爽视频| 欧洲亚洲女同hd| 午夜欧美巨大性欧美巨大| 日本亚洲精品在线观看| 欧美性xxx| 国产精品欧美一区二区| 看片一区二区| 国产精品男女猛烈高潮激情| 国产一区二区三区四区五区3d | 国产精品网站在线看| 国产精品国产精品国产专区蜜臀ah | 国精产品一区一区三区mba桃花| 日韩成人av免费| 国产毛片精品国产一区二区三区| 18深夜在线观看免费视频| 成人在线视频首页| 一级欧美一级日韩片| 久久在线免费观看| 波多野结衣一二三四区| 亚洲视频1区2区| 国产亚洲第一页| 欧美性生活大片免费观看网址 | 精品国产电影一区二区| 午夜视频免费看| 亚洲人成伊人成综合网久久久| 最新97超碰在线| 欧美另类在线观看| a级片在线免费| 国产极品jizzhd欧美| 欧洲美女精品免费观看视频 | 97国产精品视频| 户外露出一区二区三区| 亚洲tv在线观看| 久久人人爽人人爽人人片av不| 欧美极品一区二区| 久久资源中文字幕| 成人在线播放网址| 视频一区免费在线观看| 一级黄色免费毛片| 92精品国产成人观看免费 | 亚洲一区二区三区不卡国产欧美| 欧美亚洲精品天堂| 777奇米成人网| 久久国产精品高清一区二区三区| 日韩亚洲欧美中文高清在线| av中文在线资源库| 国产精品丝袜久久久久久不卡| 97久久超碰| 色视频一区二区三区| 精品不卡视频| 性刺激的欧美三级视频| 成人av免费在线播放| 天堂av网手机版| 黄色91在线观看| 国产精品熟女久久久久久| 国产偷亚洲偷欧美偷精品| 成人免费网址| 国产精品看片资源| 美腿丝袜亚洲图片| 91九色国产ts另类人妖| 免费久久99精品国产| 中文字幕a在线观看| 亚洲欧洲国产专区| 日韩精品一区二区亚洲av| 精品乱码亚洲一区二区不卡| 欧美精品videos另类| 日本成人在线视频网址| 第四色在线一区二区| 在线观看成人av| 日韩激情视频在线观看| 91av在线免费| 亚洲国产aⅴ天堂久久| 国产乱淫a∨片免费视频| 亚洲天堂成人在线| 看黄在线观看| 国产成人精品福利一区二区三区| 国产精品国产一区| 亚洲欧美另类动漫| www久久久久| 日韩欧美三级视频| 欧美videossexotv100| 二区三区在线观看| 国产三级精品网站| 欧美hd在线| 超碰超碰在线观看| 国产丝袜欧美中文另类| 日本中文字幕第一页| 日韩电影中文字幕一区| 欧美一级鲁丝片| 精品久久久久亚洲| 影音先锋久久久| 在线观看亚洲免费视频| 亚洲影院理伦片| 国模无码一区二区三区| 欧美风情在线观看| 77成人影视| 国产 日韩 欧美在线| a级高清视频欧美日韩| 日韩字幕在线观看| 亚洲国产精品成人精品| aa视频在线观看| 久久99精品久久久久久久青青日本 | 99在线精品视频免费观看20| 久久高清视频免费| 久久伊人精品| 欧美久久在线观看| 成人免费av资源| 特级毛片www| 中文字幕日韩av| 91精品一区| 成人av在线播放观看| 成人h动漫精品一区二区| 成人精品免费在线观看| 亚洲欧美日本精品| 成人国产一区| 水蜜桃在线免费观看| 东方aⅴ免费观看久久av| 九九九国产视频| 亚洲女人天堂色在线7777| 日韩一区二区三区在线免费观看 | 在线成人小视频| 尤物视频在线看| 久久99精品国产一区二区三区| 日本大胆欧美人术艺术动态| 欧美手机在线观看| 精品伦理精品一区| 美女100%一区| 在线观看成人av| www.亚洲色图| 亚洲精品国产精品国自产网站按摩| 久久精品国产91精品亚洲| 国产成人精品福利| 男女啪啪网站视频| 综合欧美一区二区三区| 欧美性受xxxx狂喷水| 国产精品999| 欧美另类专区| 国产女主播喷水高潮网红在线| 欧美肥妇毛茸茸| av漫画网站在线观看| 亚洲欧美日韩在线综合 | 乐播av一区二区三区| 538prom精品视频线放| 第一福利在线视频| 亚洲一区二区高清视频| 成人爱爱电影网址| 狠狠躁夜夜躁人人爽视频| 欧美激情精品久久久久久蜜臀 | 91精品视频一区二区| 久久国产亚洲精品无码| 一区二区中文字幕在线| 可以在线观看的黄色| 成人自拍爱视频| 久久97超碰色|