VB.NET抓取網頁出現錯誤解決方案
VB.NET編程語言特點比較突出,它是一個真正的實現面向對象以及支持繼承性的編程語言,其應用范圍廣泛,功能強大,幫助開發人員大大提高了編程效率。在調試VB.NET調用Microsoft.XMLHttp組件抓取網頁時,遇到了抓取中文字符出現亂碼,經測試若網頁meta標簽charset為utf-8的網頁不會亂碼,而charset為Gb2312的則會出現亂碼,本文提供了一個完整的解決方法,希望對研究VB.NET抓取網頁或者VB.NET實現采集功能的朋友有所幫助。
以下為VB.NET抓取網頁的函數LobDotCn 注:url_Link為抓取的目標頁面 IsGb2312為是否Gb2312字符
- Public Function LobDotCn(ByVal url_Link
As String, ByVal IsGb2312 As Boolean)- On Error Resume Next
- Dim XmlHttp As Object
- XmlHttp = CreateObject("Microsoft.XMLHttp")
- XmlHttp.Open("POST", url_Link, False)
- XmlHttp.Send()
- Dim WebContent As Object
- Dim Str_WebContent As String
- If IsGb2312 Then
- WebContent = XmlHttp.ResponseBody
- Str_WebContent = System.Text.Encoding.
Default.GetString(WebContent)- Else
- WebContent = XmlHttp.ResponseText
- Str_WebContent = WebContent.ToString
- End If
- XmlHttp = Nothing
- LobDotCn = Str_WebContent
- End Function
VB.NET抓取網頁的調用方式 :
變量 = LobDotCn("http://www.lob.cn", True) '抓取 Gb2312網頁
變量 = LobDotCn("此處填寫網址", False) ' 抓取utf-8網頁
【編輯推薦】

















