雙十一淘寶、京東服務器癱瘓大揭秘
2012年11月11日,各大電商風云大戰,淘寶網和京東網為首的電商賺足了眼球。淘寶雙十一網絡癱瘓遭詬病,支付寶被”搶癱”,好不容易進入支付過程,支付寶提示系統繁忙,經過反復嘗試,花費用戶很長時間實現支付。而京東當天流量暴漲,大量用戶登錄。結果京東商城的服務器被大流量沖垮,服務器也癱瘓。
從這件事情可以看出電商們脆弱的服務器和網站后臺系統。把錢過多的花在了門面工程上,在物流推廣方面都做的相當不錯。可惜在技術層面,在網站程序的開發,服務器的穩定問題上做的還非常不夠。
云測寶APM性能監測平臺對這兩家商城網站做了一次11.11全天24小時性能監測,以下是從服務器的響應時間和可用性以及網絡運營商進行綜合對比分析。
1、響應時間對比

響應時間是從手機客戶端發出請求(信息包層或交易層)至收到最后一個響應的時間就是整體的響應時間。網絡,服務器和應用都對整體響應時間有影響。響應時間是重定向、域名解析、建立連接、發送請求、等待響應、接收數據這幾個階段的用時總和。
從圖中可得出,京東商城響應時間遜色于淘寶網。京東商城下載內容時間為725.75ms,約是淘寶網的14倍。
而淘寶網總重定向時間為710.05ms,重定向是通過各種的方法將各種網絡請求重新定個方向轉到其它位置(如:網頁重定向、域名的重定向、路由選擇的變化也是對數據報文經由路徑的一種重定向)。
總體來說:淘寶網好于京東商城,而京東商城主要原因是頁面下載內容時間過長。網絡,服務器和網站都有對整體響應時間有影響,商家應該根據自己的情況去判斷找到問題根結。
2、可用性對比

服務器的可用性,其實就是要求服務器具有高可靠性和高穩定性。可用性也是反映應用、網站可用性情況的指標,其計算方法為:(總監測次數-監測故障次數) / 總監測次數。
常見的故障類型主要有DNS無法解析、連接超時、響應超時、重定向次數過多、服務器無響應。
圖中淘寶可行性為97.7%,京東為97.18%,兩者在可用性方面相當。
可用性統計圖如下:

由圖中可看到淘寶和京東商城故障類型主要是連接超時和響應超時。可以分別看到出現故障次數。
3、響應時間趨勢對比和可用性趨勢對比圖

從圖中可以看到在9:00-12:00以及18:30-24:00這個時間段京東商城比淘寶網響應時間長。而具體原因京東可以根據自己網站流量數據監測來分析到底是服務器不穩定的原因還是網站本身的原因。淘寶在下午15:00左右響應時間達到一天中的頂峰值,可能在這段時間用戶訪問量最大,導致服務器壓力過大。

京東商城在早上10:00可用性達到一天的低峰,其可用性低于85%,而在下午13:00后可用性慢慢好轉。反應在這時間段上服務器可靠性和穩定性極差。
導致此情況的原因有很多,很可能在這段時間用戶訪問量量暴漲,導致服務器癱瘓的問題。
4、區域響應時間對比和區域可用性對比

云測寶網絡分布在全國各地城市。從圖中我們可以看到手機客戶端訪問京東商城和淘寶在各個區域的響應時間對照圖。上海的手機客戶端訪問淘寶網的響應時間最短,而京東是在湖南手機客戶端訪問速度最快。在內蒙古的手機用戶訪問二者商城都是最慢的,這可能跟商家服務區分布區域以及網絡運營商等有關。

從圖中可看出兩家商城在可用性方面相當。嚴格來說淘寶要好于京東,但差距不明顯。
總結:
以上從各個層面和維度監測并分析淘寶和京東兩大電商在光棍節那天服務器癱瘓的具體數據分析和報告圖展示。
電商一定要考慮好網站的發展問題,一旦發現網站的流量和用戶增長了,就要立刻升級空間,或者將空間變成服務器。平時應該做好服務器和網站性能監測,隨時對網站的用戶增長進行預估,做好充分準備。當網站被突然暴漲的用戶搞掛掉的時候可以有備用的網站使用,同時分析哪些服務器訪問量,哪些服務器訪問量低,做到資源合理分配利用。
以上來自云測寶專業報告。




















