深度學(xué)習(xí)之“Socket網(wǎng)絡(luò)編程詳解”
今天就以本篇文章內(nèi)容給小伙伴們詳細(xì)闡述一下"Socket技術(shù)原理與實(shí)現(xiàn)"。
一、 什么是"Socket"
在網(wǎng)絡(luò)中,根據(jù)IP我們可以識(shí)別具體的主機(jī),再根據(jù)tcp協(xié)議+端口我們就可以識(shí)別具體主機(jī)通訊的進(jìn)程了;那么socket在其中扮演者什么樣的角色呢?
我們經(jīng)常把socket定義為套接字,socket是在應(yīng)用層和傳輸層之間的一個(gè)抽象層,它把TCP/IP層復(fù)雜的操作抽象為幾個(gè)簡單的接口供應(yīng)用層調(diào)用已實(shí)現(xiàn)進(jìn)程在網(wǎng)絡(luò)中通信。 下面是網(wǎng)絡(luò)分層以及socket在分層中的實(shí)際位置:
?
?? 
我們可以發(fā)現(xiàn)socket就在應(yīng)用程序的傳輸層和應(yīng)用層之間,設(shè)計(jì)了一個(gè)socket抽象層,傳輸層的底一層的服務(wù)提供給socket抽象層,socket抽象層再提供給應(yīng)用層,問題又來了,應(yīng)用層和socket抽象層之間和傳輸層,網(wǎng)絡(luò)層之間如何通訊的呢,要想理解socket編程怎么通過socket關(guān)鍵詞實(shí)現(xiàn)和客戶端通訊,必須得實(shí)現(xiàn)的了解tcp/ip是怎么通訊的,在這個(gè)的基礎(chǔ)上在去理解socket的握手通訊
在tcp/ip協(xié)議中,tcp通過三次握手建立起一個(gè)tcp的鏈接,大致如下:
- 第一次握手:客戶端嘗試連接服務(wù)器,向服務(wù)器發(fā)送syn包,syn=j,客戶端進(jìn)入SYN_SEND狀態(tài)等待服務(wù)器確認(rèn)
- 第二次握手:服務(wù)器接收客戶端syn包并確認(rèn)(ack=j+1),同時(shí)向客戶端發(fā)送一個(gè)SYN包(syn=k),即SYN+ACK包,此時(shí)服務(wù)器進(jìn)入SYN_RECV狀態(tài)
- 第三次握手:客戶端收到服務(wù)器的SYN+ACK包,向服務(wù)器發(fā)送確認(rèn)包ACK(ack=k+1),此包發(fā)送完畢,客戶端和服務(wù)器進(jìn)入ESTABLISHED狀態(tài),完成三次握手
三次握手如下圖:
?
?? 
根據(jù)tcp的三次握手,socket也定義了三次握手,如下圖:
?
?? 
在上面圖的基礎(chǔ)上,如果我們得到上面的圖形,需要我們自己開發(fā)一些接口。所以程序大牛們將這些抽象化的理念接口化,針對(duì)協(xié)議提出的每個(gè)理念,專門的編寫制定的接口,與其協(xié)議一一對(duì)應(yīng),形成了現(xiàn)在的socket標(biāo)準(zhǔn)規(guī)范,然后將其接口封裝成可以調(diào)用的接口,供開發(fā)者使用,目前,開發(fā)者開發(fā)出了很多封裝的類來完善socket編程,都是更加方便的實(shí)現(xiàn)剛開始socket通信的各個(gè)環(huán)節(jié)。
小結(jié):
- socket即為套接字,在TCP/IP協(xié)議中,"IP地址+TCP或UDP端口號(hào)"唯一的標(biāo)識(shí)網(wǎng)絡(luò)通訊中的一個(gè)進(jìn)程,"IP地址+TCP或UDP端口號(hào)"就為socket。
- 在TCP協(xié)議中,建立連接的兩個(gè)進(jìn)程(客戶端和服務(wù)器)各自有一個(gè)socket來標(biāo)識(shí),則這兩個(gè)socket組成的socket pair就唯一標(biāo)識(shí)一個(gè)連接。
- socket本身就有"插座"的意思,因此用來形容網(wǎng)絡(luò)連接的一對(duì)一關(guān)系,為TCP/IP協(xié)議設(shè)計(jì)的應(yīng)用層編程接口稱為socket API。
二、 socket通信基本原理
通過上面我們理解了socket通訊過程,那我們作為編程需要哪些函數(shù)來實(shí)現(xiàn)呢,如下:
- 第一次握手:客戶端需要發(fā)送一個(gè)syn j 包,試著去鏈接服務(wù)器端,于是客戶端我們需要提供一個(gè)鏈接函數(shù)
- 第二次握手:服務(wù)器端需要接收客戶端發(fā)送過來的syn J+1 包,然后在發(fā)送ack包,所以我們需要有服務(wù)器端接受處理函數(shù)
- 第三次握手:客戶端的處理函數(shù)和服務(wù)器端的處理函數(shù)
三次握手只是一個(gè)數(shù)據(jù)傳輸?shù)倪^程,但是,我們傳輸前需要一些準(zhǔn)備工作,比如將創(chuàng)建一個(gè)套接字,收集一些計(jì)算機(jī)的資源,將一些資源綁定套接字里面,以及接受和發(fā)送數(shù)據(jù)的函數(shù)等等,這些功能接口在一起構(gòu)成了socket的編程
下面大致的按照客戶端和服務(wù)端將所需的函數(shù)和原理過程:
?
?? 
首先,服務(wù)端初始化ServerSocket,然后對(duì)指定的端口進(jìn)行綁定,接著對(duì)端口及進(jìn)行監(jiān)聽,通過調(diào)用accept方法阻塞,此時(shí),如果客戶端有一個(gè)socket連接到服務(wù)端,那么服務(wù)端通過監(jiān)聽和accept方法可以與客戶端進(jìn)行連接。
socket通信基本原理明白后,那我們就寫一個(gè)最簡單的示例,來理解通信過程:
客戶端的代碼:
對(duì)應(yīng)的服務(wù)端的代碼:
三、 Socket下的函數(shù)詳解
用程序在使用套接字前,首先必須擁有一個(gè)套接字,系統(tǒng)調(diào)用socket()向應(yīng)用程序提供創(chuàng)建套接字的手段,其調(diào)用格式如下:
該調(diào)用要接收三個(gè)參數(shù):af、type、protocol。參數(shù)af指定通信發(fā)生的區(qū)域:AF_UNIX、AF_INET、AF_NS等,而DOS、WINDOWS中僅支持AF_INET,它是網(wǎng)際網(wǎng)區(qū)域。因此,地址族與協(xié)議族相同。參數(shù)type 描述要建立的套接字的類型。這里分三種:
- 一是TCP流式套接字(SOCK_STREAM)提供了一個(gè)面向連接、可靠的數(shù)據(jù)傳輸服務(wù),數(shù)據(jù)無差錯(cuò)、無重復(fù)地發(fā)送,且按發(fā)送順序接收。內(nèi)設(shè)流量控制,避免數(shù)據(jù)流超限;數(shù)據(jù)被看作是字節(jié)流,無長度限制。文件傳送協(xié)議(FTP)即使用流式套接字。
- 二是數(shù)據(jù)報(bào)式套接字(SOCK_DGRAM)提供了一個(gè)無連接服務(wù)。數(shù)據(jù)包以獨(dú)立包形式被發(fā)送,不提供無錯(cuò)保證,數(shù)據(jù)可能丟失或重復(fù),并且接收順序混亂。網(wǎng)絡(luò)文件系統(tǒng)(NFS)使用數(shù)據(jù)報(bào)式套接字。
- 三是原始式套接字(SOCK_RAW)該接口允許對(duì)較低層協(xié)議,如IP、ICMP直接訪問。常用于檢驗(yàn)新的協(xié)議實(shí)現(xiàn)或訪問現(xiàn)有服務(wù)中配置的新設(shè)備。
參數(shù)protocol說明該套接字使用的特定協(xié)議,如果調(diào)用者不希望特別指定使用的協(xié)議,則置為0,使用默認(rèn)的連接模式。根據(jù)這三個(gè)參數(shù)建立一個(gè)套接字,并將相應(yīng)的資源分配給它,同時(shí)返回一個(gè)整型套接字號(hào)。因此,socket()系統(tǒng)調(diào)用實(shí)際上指定了相關(guān)五元組中的"協(xié)議"這一元。
1. 指定本地地址──bind()
當(dāng)一個(gè)套接字用socket()創(chuàng)建后,存在一個(gè)名字空間(地址族),但它沒有被命名。bind()將套接字地址(包括本地主機(jī)地址和本地端口地址)與所創(chuàng)建的套接字號(hào)聯(lián)系起來,即將名字賦予套接字,以指定本地半相關(guān)。其調(diào)用格式如下:
參數(shù)s是由socket()調(diào)用返回的并且未作連接的套接字描述符(套接字號(hào))。參數(shù)name 是賦給套接字s的本地地址(名字),其長度可變,結(jié)構(gòu)隨通信域的不同而不同。namelen表明了name的長度。如果沒有錯(cuò)誤發(fā)生,bind()返回0。否則返回SOCKET_ERROR。
2. 建立套接字連接──connect()與accept()
這兩個(gè)系統(tǒng)調(diào)用用于完成一個(gè)完整相關(guān)的建立,其中connect()用于建立連接。accept()用于使服務(wù)器等待來自某客戶進(jìn)程的實(shí)際連接。
connect()的調(diào)用格式如下:
參數(shù)s是欲建立連接的本地套接字描述符。參數(shù)name指出說明對(duì)方套接字地址結(jié)構(gòu)的指針。對(duì)方套接字地址長度由namelen說明。
如果沒有錯(cuò)誤發(fā)生,connect()返回0。否則返回值SOCKET_ERROR。在面向連接的協(xié)議中,該調(diào)用導(dǎo)致本地系統(tǒng)和外部系統(tǒng)之間連接實(shí)際建立。
由于地址族總被包含在套接字地址結(jié)構(gòu)的前兩個(gè)字節(jié)中,并通過socket()調(diào)用與某個(gè)協(xié)議族相關(guān)。因此bind()和connect()無須協(xié)議作為參數(shù)。
accept()的調(diào)用格式如下:
參數(shù)s為本地套接字描述符,在用做accept()調(diào)用的參數(shù)前應(yīng)該先調(diào)用過listen()。addr 指向客戶方套接字地址結(jié)構(gòu)的指針,用來接收連接實(shí)體的地址。addr的確切格式由套接字創(chuàng)建時(shí)建立的地址族決定。addrlen 為客戶方套接字地址的長度(字節(jié)數(shù))。如果沒有錯(cuò)誤發(fā)生,accept()返回一個(gè)SOCKET類型的值,表示接收到的套接字的描述符。否則返回值INVALID_SOCKET。
accept()用于面向連接服務(wù)器。參數(shù)addr和addrlen存放客戶方的地址信息。調(diào)用前,參數(shù)addr 指向一個(gè)初始值為空的地址結(jié)構(gòu),而addrlen 的初始值為0;調(diào)用accept()后,服務(wù)器等待從編號(hào)為s的套接字上接受客戶連接請求,而連接請求是由客戶方的connect()調(diào)用發(fā)出的。當(dāng)有連接請求到達(dá)時(shí),accept()調(diào)用將請求連接隊(duì)列上的第一個(gè)客戶方套接字地址及長度放入addr 和addrlen,并創(chuàng)建一個(gè)與s有相同特性的新套接字號(hào)。新的套接字可用于處理服務(wù)器并發(fā)請求。
四個(gè)套接字系統(tǒng)調(diào)用,socket()、bind()、connect()、accept(),可以完成一個(gè)完全五元相關(guān)的建立。socket()指定五元組中的協(xié)議元,它的用法與是否為客戶或服務(wù)器、是否面向連接無關(guān)。bind()指定五元組中的本地二元,即本地主機(jī)地址和端口號(hào),其用法與是否面向連接有關(guān):在服務(wù)器方,無論是否面向連接,均要調(diào)用bind(),若采用面向連接,則可以不調(diào)用bind(),而通過connect()自動(dòng)完成。若采用無連接,客戶方必須使用bind()以獲得一個(gè)唯一的地址。
3. 監(jiān)聽連接──listen()
此調(diào)用用于面向連接服務(wù)器,表明它愿意接收連接。listen()需在accept()之前調(diào)用,其調(diào)用格式如下:
參數(shù)s標(biāo)識(shí)一個(gè)本地已建立、尚未連接的套接字號(hào),服務(wù)器愿意從它上面接收請求。backlog表示請求連接隊(duì)列的最大長度,用于限制排隊(duì)請求的個(gè)數(shù),目前允許的最大值為5。如果沒有錯(cuò)誤發(fā)生,listen()返回0。否則它返回SOCKET_ERROR。
listen()在執(zhí)行調(diào)用過程中可為沒有調(diào)用過bind()的套接字s完成所必須的連接,并建立長度為backlog的請求連接隊(duì)列。
調(diào)用listen()是服務(wù)器接收一個(gè)連接請求的四個(gè)步驟中的第三步。它在調(diào)用socket()分配一個(gè)流套接字,且調(diào)用bind()給s賦于一個(gè)名字之后調(diào)用,而且一定要在accept()之前調(diào)用。
4. 數(shù)據(jù)傳輸──send()與recv()
當(dāng)一個(gè)連接建立以后,就可以傳輸數(shù)據(jù)了。常用的系統(tǒng)調(diào)用有send()和recv()。
send()調(diào)用用于s指定的已連接的數(shù)據(jù)報(bào)或流套接字上發(fā)送輸出數(shù)據(jù),格式如下:
參數(shù)s為已連接的本地套接字描述符。buf 指向存有發(fā)送數(shù)據(jù)的緩沖區(qū)的指針,其長度由len 指定。flags 指定傳輸控制方式,如是否發(fā)送帶外數(shù)據(jù)等。如果沒有錯(cuò)誤發(fā)生,send()返回總共發(fā)送的字節(jié)數(shù)。否則它返回SOCKET_ERROR。
recv()調(diào)用用于s指定的已連接的數(shù)據(jù)報(bào)或流套接字上接收輸入數(shù)據(jù),格式如下:
參數(shù)s 為已連接的套接字描述符。buf指向接收輸入數(shù)據(jù)緩沖區(qū)的指針,其長度由len 指定。flags 指定傳輸控制方式,如是否接收帶外數(shù)據(jù)等。如果沒有錯(cuò)誤發(fā)生,recv()返回總共接收的字節(jié)數(shù)。如果連接被關(guān)閉,返回0。否則它返回SOCKET_ERROR。
輸入/輸出多路復(fù)用──select():
select()調(diào)用用來檢測一個(gè)或多個(gè)套接字的狀態(tài)。對(duì)每一個(gè)套接字來說,這個(gè)調(diào)用可以請求讀、寫或錯(cuò)誤狀態(tài)方面的信息。請求給定狀態(tài)的套接字集合由一個(gè)fd_set結(jié)構(gòu)指示。在返回時(shí),此結(jié)構(gòu)被更新,以反映那些滿足特定條件的套接字的子集,同時(shí), select()調(diào)用返回滿足條件的套接字的數(shù)目,其調(diào)用格式如下:
參數(shù)nfds指明被檢查的套接字描述符的值域,此變量一般被忽略。
參數(shù)readfds指向要做讀檢測的套接字描述符集合的指針,調(diào)用者希望從中讀取數(shù)據(jù)。參數(shù)writefds 指向要做寫檢測的套接字描述符集合的指針。exceptfds指向要檢測是否出錯(cuò)的套接字描述符集合的指針。timeout指向select()函數(shù)等待的最大時(shí)間,如果設(shè)為NULL則為阻塞操作。select()返回包含在fd_set結(jié)構(gòu)中已準(zhǔn)備好的套接字描述符的總數(shù)目,或者是發(fā)生錯(cuò)誤則返回SOCKET_ERROR。
5. 關(guān)閉套接字──closesocket()
closesocket()關(guān)閉套接字s,并釋放分配給該套接字的資源;如果s涉及一個(gè)打開的TCP連接,則該連接被釋放。closesocket()的調(diào)用格式如下:
參數(shù)s待關(guān)閉的套接字描述符。如果沒有錯(cuò)誤發(fā)生,closesocket()返回0。否則返回值SOCKET_ERROR。

























