精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Reddit排名算法工作原理

開發 后端 前端 算法
這是一篇繼《Hacker News 排名算法工作原理》之后的又一篇關于排名算法的文章。這次我將跟大家探討一下Reddit的文章排名算法和評論排名算法的工作原理。Reddit使用的算法也是很簡單,容易理解和實現。這篇文章里我將會對其進行深入分析。

 

這是一篇繼《Hacker News 排名算法工作原理》之后的又一篇關于排名算法的文章。這次我將跟大家探討一下Reddit的文章排名算法和評論排名算法的工作原理。Reddit使用的算法也是很簡單,容易理解和實現。這篇文章里我將會對其進行深入分析。

[[83916]]

首先我們關注的是文章排名算法。第二部分將重點介紹評論排名算法,Reddit的評論排名跟文章排名使用的不是同一種算法(這點跟Hacker News不一樣),Reddit的評論排名算法非常有趣,它是由xkcd的作者Randall Munroe發明的。

深入研究文章排名算法代碼

Reddit的源代碼是開源的,你可以下載它的任意代碼。它是用Python寫成的,代碼放在這里。里面的排名算法部分是用Pyrex實現的,這是一種開發Python的C語言擴展的編程語言。這里用Pyrex主要是出于速度的考慮。我用純Python重寫了他們的Pyrex實現,這樣更容易閱讀。

Reddit缺省的排名是’熱門‘排名,實現代碼如下:

  1. #Rewritten code from /r2/r2/lib/db/_sorts.pyx  
  2.  
  3. from datetime import datetime, timedelta  
  4. from math import log  
  5.  
  6. epoch = datetime(197011)  
  7.  
  8. def epoch_seconds(date):  
  9.     """Returns the number of seconds from the epoch to date.""" 
  10.     td = date - epoch  
  11.     return td.days * 86400 + td.seconds + (float(td.microseconds) / 1000000)  
  12.  
  13. def score(ups, downs):  
  14.     return ups - downs  
  15.  
  16. def hot(ups, downs, date):  
  17.     """The hot formula. Should match the equivalent function in postgres.""" 
  18.     s = score(ups, downs)  
  19.     order = log(max(abs(s), 1), 10)  
  20.     sign = 1 if s > 0 else -1 if s < 0 else 0 
  21.     seconds = epoch_seconds(date) - 1134028003 
  22.     return round(order + sign * seconds / 450007

這個“熱門“排名算法用數學公式表達是下面這個樣子(我從SEOmoz找到了它,但我懷疑他們未必是原作者):

reddit_cf_algorithm

文章提交時間對排名的影響

文章提交時間對排名的影響可以總結為以下幾點:

  • 提交時間對排名影響巨大,越新的文章排名會越高
  • 文章排名得分不會隨時間的流逝而降低,但新文章會比老文章獲得更高的分。這跟Hacker News的排名算法有很大區別,它的得分會隨時間流逝而降低。

下面是一個圖片,表現的是具有相同支持和反對的票數,但時間不同的文章的排名得分情況:

reddit_score_time

對數加強

Reddit在‘熱門’排名中使用了對數函數來強化前幾票的份量。基本是這個原理:

  • 前10個贊成票的份量和后面100個的份量,以及再后面1000票的份量是相同的,以此類推

下面是效果圖:

reddit_log_function

如果不使用對數加強,則分數會是這樣:

reddit_without_log

反對票對排名的影響

Reddit是少數幾個能投反對票的網站之一。就像你從代碼里看到的,一篇文章的的’得分‘定義如下:

  • up_votes – down_votes

這就是說,我們可以把它表現為下圖:

reddit_up_down

這種計算方式會對既有很的贊成票,又有很多反對票的文章(比如很有爭議的文章)帶來重大影響,它們可能會比那些只有很少贊成票的文章獲得更低的分數。這也就說明了為什么小貓小狗之類的帖子(以及其它無爭議的文章)會獲得如此高的評分。

#p#

對Reddit文章排名算法的總結

  • 提交時間是一項非常重要的指標,新文章比老文章得分更高
  • 頭10個贊成票的份量和后100個的份量相同。獲得10個贊成票和獲得50個贊成票的排名很接近
  • 具有相近贊成票和反對票數的有爭議文章會比只獲得贊成票的排名低。

Reddit評論排名算法工作原理

xkcd網站的Randall Munroe是Reddit網站上的‘最佳文章’排名算法的發明者。他寫了一篇很好的文章來解釋它。

你應該讀一讀這篇文章,它以很通俗的語言解釋了這個算法。這篇的文章的重點是:

  • ‘熱門‘排名算法對評論進行排名不是很有效,它會顯得對早期的評論過于偏愛。
  • 在一個評論系統中,我們的目的是找出最佳評論,不論它是什么時間提交的。
  • 1927年Edwin B. Wilson找到了一種很好的算法,被叫做”Wilson score interval”,它可以被用于“信任排序(the confidence sort)”
  • 信任排序把文章的獲得的票數當作全體讀者的一個抽樣統計——就像一次民意測驗。
  • 《How Not To Sort By Average Rating》這篇文章對這種信任評級算法做了詳細的解釋,絕對值得一讀!

深入分析評論排序代碼

Reddit里的信任排序算法是在_sorts.pyx這個文件里實現的,我用純Python重寫了它們的Pyrex實現(同時去掉了其中的緩存優化代碼):

 
  1. #Rewritten code from /r2/r2/lib/db/_sorts.pyx  
  2.  
  3. from math import sqrt  
  4.  
  5. def _confidence(ups, downs):  
  6.     n = ups + downs  
  7.  
  8.     if n == 0:  
  9.         return 0 
  10.  
  11.     z = 1.0 #1.0 = 85%, 1.6 = 95%  
  12.     phat = float(ups) / n  
  13.     return sqrt(phat+z*z/(2*n)-z*((phat*(1-phat)+z*z/(4*n))/n))/(1+z*z/n)  
  14.  
  15. def confidence(ups, downs):  
  16.     if ups + downs == 0:  
  17.         return 0 
  18.     else:  
  19.         return _confidence(ups, downs) 

信任排序使用Wilson score interval算法,它的數學表達式是這樣的:

wilsons_score_interval

在上面的公式中,各個參數的定義如下:

  • p是支持票的百分比
  • n總票數
  • zα/2是正態分布(1-α/2)分位數

我們對上面的介紹做一些總結:

  • 信任排序是把票數看作一次全體讀者的抽樣調查
  • 信任排序會給一條評論一個臨時評級,認為它有85%的可信度
  • 票數越多,可信度越高
  • Wilson’s interval算法能很好的處理票數很少和低端概率情況

Randall在他的文章里對信任排序的工作原理給了一個很好的例子:

如果一條評論只有一個贊成票和0個反對票,它有100%的支持率,但因為投票數太少,系統將會把它放在排名底部。但如果它有10個贊成票,而其只有1個反對票,那系統將會把它放到比具有40個贊成票和20個反對票的評論更高的排名上——可以推斷出,當這個評論獲得40個贊成票時,它極有可能獲得的反對票會少于20。這種算法最好的部分是,如果推斷錯了,那它會很快的獲得更多的數據來證明,因為它已經被排到了頂部。

發表時間對排名的影響:沒有!

信任排序一個優點是評論發表時間是不產生影響作用的(這跟‘熱門排序’和Hacker News的排名算法是不一樣的)。評論是通過信任評級,通過數據取樣計算,一條評論獲得的票數越多,它能獲得的評級越接近他的真實的得分。

圖表視圖

讓我們把信任排序做成圖表,看一看它是如何影響評論排序的。我們使用Randall的例子:

reddit_confidence_sort

可以看到,信任排序并不在意一條評論獲得了多少票數,它關注的是它的支持率和數據采樣規模!

排序之外的應用

正像Evan Miller所說的,Wilson’s score interval算法可以在非排名應用里使用,他列舉了3個例子:

  • 檢查垃圾信息:看過這條信息的人中有多大比例認為它是垃圾信息?
  • 制作“最優”排名:看過這條信息的人中有多大比例認為它是“最好的….”?
  • 制作“郵件轉發”排名:看過條信息這的人中有多大比例點擊了‘Email’按鈕?

使用這個算法你只需要兩個數據:

  • 取樣總數
  • 支持數

這個算法是如此有效,但很奇怪很多的網站如今仍然是最原始的評級方法,這包括著名的亞馬遜,它仍然使用“得分 = 支持票 / 總票數”。

英文原文:How Reddit ranking algorithms work

譯文鏈接:http://www.aqee.net/how-reddit-ranking-algorithms-work/

責任編輯:林師授 來源: 外刊IT評論
相關推薦

2013-08-22 09:53:52

Hacker News排名算法算法

2022-02-28 10:23:37

搜索競價排名

2014-11-05 09:37:31

路由算法原理

2009-06-18 13:31:03

Spring工作原理

2009-08-14 13:19:23

2012-03-14 10:43:55

算法開發

2011-06-23 11:36:27

網站排名

2011-04-26 10:00:17

2020-06-15 07:00:00

GitOpsKubernetesDevOps

2009-07-16 10:23:30

iBATIS工作原理

2009-06-15 15:57:21

Spring工作原理

2010-09-25 13:11:48

DHCP工作原理

2019-05-17 11:53:58

MySQLorder by數據庫

2021-02-05 15:01:41

GitLinux命令

2017-08-21 10:00:23

遺傳算法Python生物學

2021-03-15 10:10:56

算法AI技術

2023-10-11 07:59:06

Redditmods機器人

2020-02-10 09:23:09

LinuxReddit命令

2021-08-18 15:59:47

蘋果工具系統

2011-04-19 09:28:25

App Store蘋果應用商店
點贊
收藏

51CTO技術棧公眾號

欧美在线网址| free性欧美| 久久国产福利国产秒拍| 欧美精品做受xxx性少妇| 国产精品久久久免费观看| 日韩三级影视| 一区二区三区在线视频观看 | 欧美丝袜自拍制服另类| 国产精品大陆在线观看| 午夜免费激情视频| 天堂成人娱乐在线视频免费播放网站| 欧美三级电影在线看| 日韩美女爱爱视频| av基地在线| 成人av资源在线| 国产美女主播一区| av黄色在线看| 中文av一区| 在线成人免费网站| 天天插天天射天天干| 国产午夜精品一区在线观看| 一本色道**综合亚洲精品蜜桃冫| 成人免费在线视频播放| aⅴ在线视频男人的天堂 | 玖玖爱在线观看| 国产视频一区二| 在线观看视频欧美| 欧美性大战久久久久xxx| 欧美14一18处毛片| 国产精品久线观看视频| 欧美精品中文字幕一区二区| 国产综合在线播放| 国产麻豆精品在线| 国产又爽又黄的激情精品视频| 日本韩国欧美中文字幕| 韩日成人在线| 久久成人综合视频| 亚洲人做受高潮| 成人久久电影| 国产亚洲xxx| 亚洲专区区免费| 老汉色老汉首页av亚洲| 精品噜噜噜噜久久久久久久久试看| 亚洲精品成人在线播放| 国产91亚洲精品久久久| 欧美专区亚洲专区| 国产在线青青草| 在线看片福利| 日韩欧美aaa| 日韩精品一区二区三区久久| 美女av在线免费看| 欧美日韩国产区| 国产成人在线免费看| 人在线成免费视频| 天天亚洲美女在线视频| 你懂的av在线| 美女露胸视频在线观看| 欧美日韩中文字幕| 能看的毛片网站| 国产成人精品123区免费视频| 色噜噜狠狠色综合中国| 不卡av免费在线| 欧美日韩在线精品一区二区三区激情综合 | 国产亚洲成aⅴ人片在线观看| 免费久久99精品国产自| 国产三级电影在线观看| 国产精品久久久久影院色老大| 亚洲精品视频一二三| 国产精品刘玥久久一区| 一区二区激情小说| 国产中文字幕二区| se01亚洲视频| 这里只有精品免费| 2一3sex性hd| 亚洲资源网你懂的| 最近2019中文字幕大全第二页| 成人免费黄色小视频| 韩日精品视频| 青草热久免费精品视频| 国产一级片一区二区| 国产一区二区三区黄视频 | 色视频免费在线观看| 久久精品亚洲乱码伦伦中文 | 欧美三级在线| 91精品成人久久| 欧美日韩 一区二区三区| 国产在线看一区| 国产一区在线观| 高清日韩av电影| 国产精品传媒在线| 欧美日韩精品在线一区二区| 成人涩涩视频| 精品久久国产老人久久综合| 国产精品高清无码在线观看| 欧美xxxx中国| 久久福利视频网| 成人免费a视频| 激情久久五月天| 韩日午夜在线资源一区二区| 77777影视视频在线观看| 一区av在线播放| 日韩黄色片视频| 欧美影院在线| 亚洲人成电影在线| 久草视频在线资源| 日韩精品免费视频人成| 俄罗斯精品一区二区| aaa日本高清在线播放免费观看| 亚洲不卡av一区二区三区| 久久这里只精品| 久久久久久毛片免费看 | 日韩国产在线播放| 亚洲少妇xxx| 视频一区中文字幕国产| 国产精品日韩一区二区免费视频| 欧美大片aaa| 亚洲一区二区在线播放相泽| 99sesese| 亚洲宅男一区| 久久久久中文字幕2018| 国产精品久久久久久在线| 久久久电影一区二区三区| 欧美男女爱爱视频| 精品中文视频| 中文字幕无线精品亚洲乱码一区 | 国严精品久久久久久亚洲影视| 秋霞a级毛片在线看| 在线免费视频一区二区| 朝桐光av一区二区三区| 国模大胆一区二区三区| 91久久在线播放| 尤物视频在线免费观看| 色婷婷综合在线| 欧美在线一级片| 国产精品hd| 操一操视频一区| 羞羞网站在线看| 欧美一级黄色大片| 日本高清不卡免费| 久久99久久久欧美国产| 亚洲国产欧美不卡在线观看| 五月激情久久| 亚洲图片欧美日产| 亚洲国产成人精品女人久久| 久久亚洲一区二区三区四区| 亚洲中文字幕无码专区| 亚洲裸色大胆大尺寸艺术写真| 午夜精品一区二区三区在线播放| 欧美熟妇乱码在线一区| 午夜久久久影院| 国产麻豆剧传媒精品国产av| av成人激情| 久久久久久国产精品mv| 范冰冰一级做a爰片久久毛片| 精品夜色国产国偷在线| 91丨九色丨海角社区| 欧美国产欧美综合| 欧美成年人视频在线观看| 欧美电影免费观看高清| 成人激情综合网| 乌克兰美女av| 成年人免费在线视频| 91成人国产精品| 国产无遮挡在线观看| 蜜臀91精品一区二区三区 | 中文乱码人妻一区二区三区视频| 国产日韩1区| 日韩欧美第二区在线观看| h1515四虎成人| 久久亚洲综合国产精品99麻豆精品福利| 国产视频一区二区三| 亚洲国产精品自拍| 日本护士做爰视频| 久久这里只有| 曰韩不卡视频| 国产一区在线电影| 97精品伊人久久久大香线蕉| 免费黄网站在线观看| 欧美色大人视频| a级片在线观看免费| 91在线观看地址| 国内外成人免费在线视频| 国内精品久久久久国产盗摄免费观看完整版| 国外成人免费视频| 成人不卡视频| 欧美黑人极品猛少妇色xxxxx| 四虎影视精品成人| 欧美精品一二三四| 日韩成人免费观看| 国产精品五月天| 久久久久99人妻一区二区三区| 亚洲一区二区三区高清| 亚洲蜜桃在线| 欧美18免费视频| 国产精品日韩专区| 阿v视频在线| www.美女亚洲精品| 日韩中文字幕观看| 欧美日韩一区久久| 日韩少妇高潮抽搐| 中文字幕一区二区三区av| 亚洲精品视频大全| 国产精品自拍在线| 日本久久精品一区二区| 亚洲第一区色| 伊人情人网综合| 网友自拍区视频精品| 91福利入口| 成人在线视频免费看| 欧美一级大片在线观看| 在线观看小视频| 日韩视频免费看| 九一国产在线| 日韩av在线免播放器| 国产黄色免费大片| 在线电影院国产精品| 国产无遮挡又黄又爽又色视频| 午夜精品福利一区二区三区av| 成年人一级黄色片| 欧美激情一区二区三区四区| 欧美 日本 国产| 成人黄色av电影| 18深夜在线观看免费视频| 美腿丝袜亚洲综合| 日韩av播放器| 免费亚洲网站| heyzo亚洲| 99pao成人国产永久免费视频| 精品国精品自拍自在线| 日本少妇一区二区三区| 久久99国产精品久久| 黄色免费网址大全| 老司机午夜免费精品视频| 无码人妻丰满熟妇区96| 在线亚洲伦理| 欧美深夜福利视频| 亚洲毛片播放| 欧美日韩精品在线一区二区| 99热精品在线观看| 日韩中文字幕在线视频观看| 亚洲理论在线| 日本少妇高潮喷水视频| 亚洲毛片播放| 中国丰满人妻videoshd| 亚洲欧美日韩专区| 成年网站在线免费观看| 美女诱惑一区| 亚洲五月天综合| 热久久免费视频| 岛国毛片在线播放| 久久99国产精品尤物| 一级日本黄色片| 国产成人综合亚洲91猫咪| 欧美人与性动交α欧美精品| 国产精品综合网| 色悠悠在线视频| 2020国产精品自拍| 日本美女xxx| 亚洲欧洲韩国日本视频| 波多野结衣爱爱视频| 亚洲最大成人网4388xx| 91在线看视频| 欧美性大战久久久久久久蜜臀| 伊人网免费视频| 日韩视频一区二区三区在线播放 | 国产精品一二一区| 白丝校花扒腿让我c| 波多野结衣亚洲一区| 亚洲AV无码国产成人久久| 中文字幕第一区第二区| 91杏吧porn蝌蚪| 亚洲成av人片在www色猫咪| 天堂网视频在线| 欧美人动与zoxxxx乱| 国产高中女学生第一次| 日韩国产中文字幕| www.精品在线| 欧美国产另类| 可以免费观看av毛片| 青青草91视频| 久久久久久无码精品人妻一区二区| 暴力调教一区二区三区| 久久精品三级视频| 亚洲综合图片区| 天天干天天操天天爱| 91超碰这里只有精品国产| 黄色av小说在线观看| 色悠悠久久久久| 91精品国产黑色瑜伽裤| 国产精品一区二区久久久久| 成人激情自拍| 一本色道婷婷久久欧美| 亚洲麻豆一区| 黄色一级片免费播放| 久久婷婷综合激情| 老女人性淫交视频| 欧美中文字幕一二三区视频| 韩国av永久免费| 日韩午夜在线视频| 26uuu亚洲电影| 97在线中文字幕| 日韩精品电影| 红桃av在线播放| 成人免费视频网站在线观看| 国产jizz18女人高潮| 欧美日韩亚洲一区二| 精品久久久无码中文字幕| 一区二区三区亚洲| 欧美激情20| 99c视频在线| av亚洲在线观看| 久久国产亚洲精品无码| 国产v综合v亚洲欧| 成人欧美一区二区三区黑人一| 欧美特级www| 老牛影视av牛牛影视av| 久久艳片www.17c.com | 精品不卡在线| 黄色亚洲精品| 超碰在线超碰在线| 国产精品乱人伦| 亚洲天堂五月天| 国产丝袜一区二区三区| 91超碰在线| 草莓视频一区| 午夜国产精品视频| 想看黄色一级片| 国产蜜臀av在线一区二区三区| 中文字幕亚洲精品一区| 欧美精品一区二区三区蜜桃视频| 国产黄大片在线观看画质优化| 国产精品电影网站| 欧美人与拘性视交免费看| www.中文字幕在线| 99久久久国产精品| 国产无码精品视频| 精品国产露脸精彩对白| 久草在线新免费首页资源站| 亚洲aaa激情| 欧美不卡视频| 国产在线观看免费播放| 亚洲综合在线视频| 囯产精品一品二区三区| 欧美肥婆姓交大片| 台湾佬美性中文| 中文字幕在线观看一区| 中文有码在线播放| 色一情一乱一区二区| 精品国产美女a久久9999| 亚洲一区在线免费| 国产乱人伦偷精品视频免下载 | 成人在线观看网站| 国产精品免费久久久久影院| 欧美大黑bbbbbbbbb在线| 色18美女社区| 一区二区三区四区激情| 成人免费一级视频| 97视频免费在线观看| 伊人久久大香线蕉av不卡| 五月婷婷狠狠操| 亚洲人午夜精品天堂一二香蕉| www香蕉视频| 97成人超碰免| 成人在线免费观看视频| 成人av毛片在线观看| 亚洲亚洲精品在线观看| 日韩欧美在线番号| 国产精品色午夜在线观看| 亚洲国产精品日韩专区av有中文| 国产污在线观看| 91黄色免费看| av超碰免费在线| 久久一区二区精品| 老司机精品视频导航| 黄色一级视频在线观看| 国产丝袜高跟一区| gogo大尺度成人免费视频| 久操网在线观看| 欧美激情在线观看视频免费| 国产按摩一区二区三区| 26uuu日韩精品一区二区| 成人羞羞网站入口| 精品1卡二卡三卡四卡老狼| 在线视频国内一区二区| 欧美黑人xx片| 日韩精品欧美在线| 国产成人日日夜夜| 在线永久看片免费的视频| 欧美大片va欧美在线播放| 一区二区三区日本久久久| 成年人网站av| 色综合久久综合网97色综合| av官网在线播放| 亚洲人成77777| av在线不卡电影| 国产乱码精品一区二三区蜜臂 | 久久久久久久久久久久久女国产乱| 国产人妻精品一区二区三| 欧洲美女7788成人免费视频| 欧美日本不卡高清|