瀏覽器常見面試問題，請問你能接住幾個？

作者：前端人 2022-01-14 08:12:39

系統瀏覽器

前端程序員，每天接觸的都是瀏覽器。作為一個合格的前端工程師，瀏覽器相關的工作原理是我們對性能優化的基石，今天就來考考自己對瀏覽器了解有多少?

一、從輸入 URL 到頁面呈現發生了什么?

在瀏覽器中輸入一個網址，如：https://www.baidu.com 。從輸入地址到我們看到百度首頁，這一過程到底發生了什么?

1.1、構建網絡請求

1.2、查找緩存

檢查如果有緩存，則直接使用緩存，如果沒有緩存，則會向服務器發送網絡請求。

1.3、DNS解析

我們訪問網站的時候，輸入的是域名，比如上邊截圖內

域名：https://www.baidu.com

IP地址：36.152.44.95：443

真正的數據包是通過 IP 地址傳過來的，域名和 IP 是一一映射關系。我們根據域名獲取到具體的 IP 這個過程就叫做 DNS 解析。

IP 地址后的數字指定的端口號，如果沒有，默認是 80 。

1.4、建立 TCP 連接

服務器要是想把數據包傳給瀏覽器之前，首先要建立連接。建立 TCP 連接，就是保證服務器與瀏覽器之間能夠進行安全連接通信，數據傳輸完畢之后再斷開連接。

TCP (Transmission Control Protocol)，傳輸控制協議，是一種面向連接的，可靠的，基于字節流的傳輸層通信協議。

同一個域名下，最多能夠建立 6 個 TCP 連接，超過 6 個的話，剩余的會排隊等待。TCP 連接分為三個階段：

通過三次握手建立瀏覽器與服務器之間的連接。

進行數據傳輸，服務器向瀏覽器發送數據包。

斷開連接的階段，數據傳輸完畢之后，通過四次揮手來斷開連接。

1.5、發送 HTTP 請求

TCP 建立連接完畢后，瀏覽器和服務器可以開始通信了，即開始發送 HTTP 請求。

http 請求，前端程序員就很熟悉嘍!有請求和響應。

網絡請求流程圖：

二、頁面是如何渲染的?

第一個問題講的瀏覽內輸入 url 之后做了做了些啥，最后到發送網絡請求。服務器根據 url 提供的地址查找文件，然后加載 html、css、js、img等資源文件。接收到文件之后瀏覽器是如何渲染的呢?

瀏覽器渲染的過程為：

瀏覽器將獲取的 html 文檔解析成 DOM 樹。
處理 CSS 標記，構成層疊樣式表模型CSSOM。
將 DOM 和 CSSOM 合并，創建渲染樹(rendering tree)，代表一系列將被渲染的對象。
渲染樹的每個元素包含的內容都是計算過的，它被稱為布局 layout 。瀏覽器使用流式布局的方式，只需一次繪制操作布局所有的元素。
將渲染樹的各個節點繪制到屏幕上，這一步被稱之為 painting。

圖示：

三、瀏覽器緩存是怎么回事?

3.1、強緩存

檢查強緩存的時候，不會發送 http 請求。

如何來檢查呢?通過相應的字段來進行檢查的，在 hTTP/1.0 中使用的是 Expires /，在 HTTP/1.1 使用的是 Cache-Control 。

Expires

Expires 即過期時間，存在于服務端返回的響應頭，告訴瀏覽器在過期時間之前可以直接從緩存內獲取數據，無需再次發送網絡請求。

expires: Wed, 29 Dec 2021 07:19:28 GMT 
 
我是在2021-12-22 12:30左右 請求的 https://www.baidu.com/ ， 
返回的 expires 內容如上。 
表示資源在 2012-12-29 07:12:28 過期，在這之前不會向服務器發送請求

這個方式你看有毛病嗎?潛藏了一個大坑，如果電腦的本地時間與服務器時間不一致時，那么服務器返回的這個過期時間可能就是不準確的，因此這種方式在 HTTP 1.1 中被拋棄了。

Cache-Control

在 HTTP1.1 中，采用了一個非常關鍵的字段：Cache-Control 。這個字段也存在于響應頭中。如：

cache-control: max-age=2592000

代表的是這個響應返回后，在 (2592/3600=720小時)直接可以直接使用緩存。

它和 Expires 本質的不同在于它并沒有采用具體的時間點，而是采用的時長來控制強緩存。如果 Expires 和 Cache-Control 同時存在的時候，Cache-Control 會優先考慮。

強緩存有沒有可能失效呢?如果資源緩存時間超時，也就是強緩存失效了，接下來該怎么辦呢?此時就會進入到第二級屏障 -- 協商緩存。

3.2、協商緩存

強緩存失效之后，瀏覽器在請求頭中攜帶相應的緩存tag 向服務器發送請求，服務器根據這個緩存tag 決定到底是否使用緩存，這就是協商緩存

緩存 tag 有兩種：ETag 和 Last-Modified 。

ETag 是服務器根據當前文件內容生成的唯一標識，如果內容發生更新，唯一標識也會更新。瀏覽器接收到的 ETag 會作為 if-None-Match 字段的內容，并放到請求頭中，發送給服務器之后，服務器會與服務器上的值進行對比，如果兩者一樣，瀏覽器直接返回304，使用緩存。不一樣時發送 http 請求。

Last-Modified ，最后修改時間。瀏覽器第一次發送網絡請求后，服務器會在響應頭上加上該字段。瀏覽器再發請求時，會把該值作為 last-Modified-Since 的值，放入請求頭，然后服務器會與服務器上的最后修改時間進行對比，如果兩者一樣，瀏覽器直接返回304，使用緩存。不一樣時發送 http 請求。

兩者對比：

精準度上 ETag 更好一點。因為 ETag 能夠更準確的判斷資源是否有更新，保證拉取到的都是最新內容。

性能上 Last-Modified 剛好一點，只需要記錄一個時間點就好了。

如果兩者都存在的話，優先考慮 ETag。

3.3、緩存位置

前邊講述，瀏覽器請求地址時，服務器返回 304 表示使用瀏覽器緩存，這些資源究竟緩存到哪了呢?

緩存位置一共有四種，按照優先級由高到低排列分別為：

Service Worker
Memory Cache
Disk Cache
Push Cache

四、瀏覽器的本地存儲有哪些?

所謂本地存儲，就是把一些信息，存儲到客戶端本地，存儲的信息不會因為頁面的跳轉或關閉而消失。瀏覽器本地存儲主要分為：cookie、webStorage 和 indexDB。

4.1、cookie

cookie 主要為了辨別用戶身份。彌補 http 在狀態管理上的不足。

http 是一個無狀態協議，瀏覽器向服務器發送請求之后，服務器返回響應，下次再請求的時候，服務器已經不認識瀏覽器了，如果瀏覽器下次再發送請求時，能夠把 cookie 帶上，服務器進行解析，便能夠辨別瀏覽器的身份。

cookie 就是用來存儲狀態的，它的特點分別有：

能夠兼容所有瀏覽器，它和服務器之間有一定的關聯。
存儲大小限制：一般瀏覽器規定同源下最多只能存儲 4KB 大小
cookie 存在過期時間，過期時間可以自己設置。
cookie 不穩定，清除瀏覽器緩存或三方清理垃圾時容易把 cookie 移除掉。
用戶可以根據句自己的需求開啟 cookie 緩存，如果開啟無痕瀏覽器或隱身模式時，將關閉 cookie。

4.2、webStorage

webStorag 可分為 localStorage 和 sessionStorage ，是本地持久化存儲，本地持久化存儲用來保存一些不需要發送給服務器的信息，用來補充 cookie 存儲方式不足。

localStorage 特點：

不兼容低版本瀏覽器 IE6-8 。
生命周期是永久的，除非用戶主動清除，否則一直存在。
存儲的數據大小一般為 5M，各瀏覽器之間有差異。
不受瀏覽器無痕模式或隱身模式影響。
嚴格的本地存儲，與服務器之間沒有關系。

sessionStorage 特點：

不兼容低版本瀏覽器 IE6-8 。
僅在當前會話下有效，關閉當前頁面或關閉瀏覽器，就會被清除。
存儲的數據大小一般為 5M，各瀏覽器之間有差異。
嚴格的本地存儲，與服務器之間沒有關系。

localStorage 和 sessionStorage 有一個本質區別，localStorage 生命周期是永久化的，而 sessionStorage 只存在于當前會話。

4.3、indexedDB

indexedDB 是 html5 提供的一種本地存儲，一般保存大量用戶數據并要求數據之間有搜索需要的場景，當網絡斷開，做一些離線應用，數據格式為 json 。本質上是一個非關系型數據庫。它的容量是沒有上限的。

特點：

存儲空間較大，默認250M 。
鍵值對操作，可以進行數據庫讀取和遍歷，也可以用索引進行高效的檢索。
受同源策略限制，無法跨域訪問數據庫。

總結：瀏覽器本地存儲每種方式都有各自的特點，cookie 比較小適合存儲與服務器之間通信的較小狀態信息，webStorage 存儲不參與服務器通信的數據，indexedDB 存儲大型的非關系型數據庫。

五、什么是 XSS 攻擊?

XSS ( Cross Site Scripting ) 跨站腳本，為了與 CSS 區分，故意叫做 XSS 。主要是由于網站程序員對用戶輸入過濾不足，導致攻擊者利用輸入可以在頁面進行顯示或盜取用戶信息，利用身份信息進行惡意操作的一種攻擊方式。

講直白點，就是惡意攻擊者通過在輸入框處添加惡意 script 代碼，用戶瀏覽網頁的時候執行 script 代碼，從而達到惡意攻擊用戶的目的。

5.1、XSS 攻擊類型

XSS 攻擊實現有三種方式：存儲型、反射型和文檔寫。

存儲型

表面意思理解，就是將惡意腳本存儲起來。將腳本存儲到服務器的數據庫，然后在客戶端執行這些惡意腳本，從而達到攻擊效果。

比如，在評論區提交一段 script 代碼，如果前后端不做任何轉義工作，直接把腳本存儲到數據庫，頁面加載數據的時候，渲染時發現它是 js 代碼，就會直接執行，相當于執行了一段未知邏輯的 js 。

反射型

反射型 XSS 指的是惡意腳本作為網絡請求的一部分。

瀏覽器請求接口如：

http://www.xxx.com?q=<script>alert("惡意腳本")</script>

會將參數 q= 傳遞給服務器，服務器將內容返回給瀏覽器，瀏覽器渲染時，發現它是 js 腳本，就會直接執行。所以頁面一加載的時候，就會有一個彈框。

之所以稱為反射型，是因為它是從瀏覽器通過網絡請求經過服務器，然后又返回瀏覽器，執行解析。

文檔型

文檔型的 XSS 攻擊不會經過服務器，作為中間人的角色，在數據傳輸過程中劫持到網絡數據包，然后修改里面的 html 文檔。

常見的 wifi 劫持或者本地惡意軟件。

XSS 攻擊危害包括：

盜取用戶各類賬號，如機器登錄賬號，用戶網銀，各類管理員賬號。
控制企業數據，包括讀取，篡改、添加、刪除敏感數據。
盜竊具有商業價值的資料。
控制受害者機器向其他網站發起攻擊。
劫持別人的廣告，點擊廣告之后跳轉到自己的廣告頁

5.2、XSS防范措施

措施1：XSS 攻擊原理就是惡意執行 js 腳本，我們要防范它，只需要在用戶輸入的地方，對輸入的內容進行轉碼或過濾。

如： 
<script> 
  alert('惡意腳本') 
</script> 
 
//轉碼后 
<script>alert('惡意腳本')</script>

這樣在代碼 html 中解析時，不會當做 js 腳本執行。

措施2：CSP ，瀏覽器中的內容安全策略，就是決策瀏覽器加載哪些資源。具體的有：

同源策略，限制其他域下的資源加載。
禁止在當前頁面向其他域下提交數據。
提供上報機制，能夠及時發現 XSS 攻擊。

措施3：HttpOnly，如果 cookie 設置了 httponly，那么通過 js 腳本無法獲取到 cookie 信息。這樣能夠有效防止 XSS 攻擊，竊取用戶信息。

六、http 和 https

瀏覽器訪問 http 的網站的時候，域名前面會提示“不安全”，訪問 https//xxx.com 的時候瀏覽器提示 “安全”，這是為什么呢?

http 協議，超文本傳輸協議，被用于在服務器和瀏覽器之間傳遞信息，http協議以明文方式發送內容，不提供任何方式的數據加密，如果攻擊者直接截取瀏覽器和服務器之間傳輸報文，就可以直接讀懂其中的信息。

為了解決 http 協議的缺陷，使用 https 安全套接字層超文本傳輸協議，為了保證數據的安全性，在 http 協議的基礎上，新增了 SSL 協議，SSL依靠證書來驗證服務器的身份器，并未瀏覽器和服務器之間的通信加密。

https 并不是一個新協議，而是一個加強版的 http 。簡單講 https 協議由 SSL+http 協議構建成可進行加密傳輸、身份認證的網絡協議，要比 http 協議安全。

https 和 http 的區別：

https 協議需要申請安全證書，一般免費較少，需要費用，而 http 不需要。
https 具有 SSL 加密傳輸，更加安全，而 http 是明文傳輸，不安全。
https 和 http 使用的不同連接方式，用的默認端口不一樣，http 是 80，https是443。
http 的連接簡單，沒有狀態，而 https 是需要通過 SSL 校驗身份信息的，相對更加安全。

https 工作原理圖：

加解密過程

接著我們來談談瀏覽器和服務器進行協商加解密的過程。

首先，瀏覽器會給服務器發送一個隨機數client_random和一個加密的方法列表。

服務器接收后給瀏覽器返回另一個隨機數server_random和加密方法。

現在，兩者擁有三樣相同的憑證: client_random、server_random和加密方法。

接著用這個加密方法將兩個隨機數混合起來生成密鑰，這個密鑰就是瀏覽器和服務端通信的暗號。

責任編輯：姜華來源：今日頭條

瀏覽器面試問 http