精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

介紹一款能取代 Scrapy 的爬蟲框架 - feapder

開發 后端
今天推薦一款更加簡單、輕量級,且功能強大的爬蟲框架:feapder

[[400143]]

 1. 前言

大家好,我是安果!

眾所周知,Python 最流行的爬蟲框架是 Scrapy,它主要用于爬取網站結構性數據

今天推薦一款更加簡單、輕量級,且功能強大的爬蟲框架:feapder

項目地址:

https://github.com/Boris-code/feapder

2. 介紹及安裝

和 Scrapy 類似,feapder 支持輕量級爬蟲、分布式爬蟲、批次爬蟲、爬蟲報警機制等功能

內置的 3 種爬蟲如下:

  •  AirSpider

    輕量級爬蟲,適合簡單場景、數據量少的爬蟲

  •  Spider

    分布式爬蟲,基于 Redis,適用于海量數據,并且支持斷點續爬、自動數據入庫等功能

  •  BatchSpider

    分布式批次爬蟲,主要用于需要周期性采集的爬蟲

在實戰之前,我們在虛擬環境下安裝對應的依賴庫 

  1. # 安裝依賴庫  
  2. pip3 install feapder 

3. 實戰一下

我們以最簡單的 AirSpider 來爬取一些簡單的數據

目標網站:aHR0cHM6Ly90b3BodWIudG9kYXkvIA==

詳細實現步驟如下( 5 步)

3-1  創建爬蟲項目

首先,我們使用「 feapder create -p 」命令創建一個爬蟲項目 

  1. # 創建一個爬蟲項目  
  2. feapder create -p tophub_demo 

3-2  創建爬蟲 AirSpider

命令行進入到 spiders 文件夾目錄下,使用「 feapder create -s 」命令創建一個爬蟲 

  1. cd spiders  
  2. # 創建一個輕量級爬蟲  
  3. feapder create -s tophub_spider 1 

其中

  •  1 為默認,表示創建一個輕量級爬蟲 AirSpider
  •  2 代表創建一個分布式爬蟲 Spider
  •  3 代表創建一個分布式批次爬蟲 BatchSpider

3-3  配置數據庫、創建數據表、創建映射 Item

以 Mysql 為例,首先我們在數據庫中創建一張數據表 

  1. # 創建一張數據表  
  2. create table topic  
  3.  
  4.     id         int auto_increment  
  5.         primary key,  
  6.     title      varchar(100)  null comment '文章標題',  
  7.     auth       varchar(20)   null comment '作者',  
  8.     like_count     int default 0 null comment '喜歡數',  
  9.     collection int default 0 null comment '收藏數',  
  10.     comment    int default 0 null comment '評論數'  
  11. ); 

然后,打開項目根目錄下的 settings.py 文件,配置數據庫連接信息 

  1. # settings.py  
  2. MYSQL_IP = "localhost"  
  3. MYSQL_PORT = 3306  
  4. MYSQL_DB = "xag"  
  5. MYSQL_USER_NAME = "root"  
  6. MYSQL_USER_PASS = "root" 

最后,創建映射 Item( 可選 )

進入到 items 文件夾,使用「 feapder create -i 」命令創建一個文件映射到數據庫

PS:由于 AirSpider 不支持數據自動入庫,所以這步不是必須

3-4  編寫爬蟲及數據解析

第一步,首先使「 MysqlDB 」初始化數據庫 

  1. from feapder.db.mysqldb import MysqlDB  
  2. class TophubSpider(feapder.AirSpider):  
  3.     def __init__(self, *args, **kwargs):  
  4.         super().__init__(*args, **kwargs)  
  5.         self.db = MysqlDB() 

第二步,在 start_requests 方法中,指定爬取主鏈接地址,使用關鍵字「download_midware 」配置隨機 UA 

  1. import feapder  
  2. from fake_useragent import UserAgent  
  3. def start_requests(self):  
  4.     yield feapder.Request("https://tophub.today/", download_midware=self.download_midware)  
  5. def download_midware(self, request):  
  6.     # 隨機UA  
  7.     # 依賴:pip3 install fake_useragent  
  8.     ua = UserAgent().random  
  9.     request.headers = {'User-Agent': ua}  
  10.     return request 

第三步,爬取首頁標題、鏈接地址

使用 feapder 內置方法 xpath 去解析數據即可 

  1. def parse(self, request, response):  
  2.     # print(response.text)  
  3.     card_elements = response.xpath('//div[@class="cc-cd"]')  
  4.     # 過濾出對應的卡片元素【什么值得買】  
  5.     buy_good_element = [card_element for card_element in card_elements if  
  6.                         card_element.xpath('.//div[@class="cc-cd-is"]//span/text()').extract_first() == '什么值得買'][0]  
  7.     # 獲取內部文章標題及地址  
  8.     a_elements = buy_good_element.xpath('.//div[@class="cc-cd-cb nano"]//a')  
  9.     for a_element in a_elements:  
  10.         # 標題和鏈接  
  11.         title = a_element.xpath('.//span[@class="t"]/text()').extract_first()  
  12.         href = a_element.xpath('.//@href').extract_first()  
  13.         # 再次下發新任務,并帶上文章標題  
  14.         yield feapder.Request(href, download_midware=self.download_midware, callback=self.parser_detail_page,  
  15.                               titletitle=title) 

第四步,爬取詳情頁面數據

上一步下發新的任務,通過關鍵字「 callback 」指定回調函數,最后在 parser_detail_page 中對詳情頁面進行數據解析 

  1. def parser_detail_page(self, request, response):  
  2.     """  
  3.     解析文章詳情數據  
  4.     :param request:  
  5.     :param response:  
  6.     :return:  
  7.     """  
  8.     title = request.title  
  9.     url = request.url  
  10.     # 解析文章詳情頁面,獲取點贊、收藏、評論數目及作者名稱  
  11.     author = response.xpath('//a[@class="author-title"]/text()').extract_first().strip()  
  12.     print("作者:", author, '文章標題:', title, "地址:", url)  
  13.     desc_elements = response.xpath('//span[@class="xilie"]/span')  
  14.     print("desc數目:", len(desc_elements))  
  15.     # 點贊  
  16.     like_count = int(re.findall('\d+', desc_elements[1].xpath('./text()').extract_first())[0])  
  17.     # 收藏 
  18.     collection_count = int(re.findall('\d+', desc_elements[2].xpath('./text()').extract_first())[0])  
  19.     # 評論  
  20.     comment_count = int(re.findall('\d+', desc_elements[3].xpath('./text()').extract_first())[0])  
  21.     print("點贊:", like_count, "收藏:", collection_count, "評論:", comment_count) 

3-5  數據入庫

使用上面實例化的數據庫對象執行 SQL,將數據插入到數據庫中即可 

  1. # 插入數據庫  
  2. sql = "INSERT INTO topic(title,auth,like_count,collection,comment) values('%s','%s','%s','%d','%d')" % (  
  3. title, author, like_count, collection_count, comment_count)  
  4. # 執行  
  5. self.db.execute(sql) 

4. 最后

本篇文章通過一個簡單的實例,聊到了 feapder 中最簡單的爬蟲 AirSpider 

 

責任編輯:龐桂玉 來源: Python編程
相關推薦

2018-01-17 15:05:22

框架設計爬蟲Scrapy

2017-05-15 21:00:15

大數據Scrapy爬蟲框架

2022-10-09 10:11:30

Python爬蟲神器

2021-07-23 16:50:19

httpJava框架

2011-08-09 09:16:44

Eclipse

2021-02-16 10:58:50

ScreenLinux命令

2021-01-27 13:16:39

ScreenLinux命令

2020-01-13 15:24:22

框架SparkHadoop

2018-08-08 11:40:24

ScrapyRequest網絡爬蟲

2017-06-30 16:24:40

大數據神經網絡NNabla

2021-11-09 09:46:09

ScrapyPython爬蟲

2021-11-08 14:38:50

框架Scrapy 爬蟲

2023-03-02 15:30:49

2025-03-18 08:20:58

數據庫管理工具

2021-01-08 09:07:19

Scrapy框架爬蟲

2021-08-06 09:50:13

SpringBoot框架Java

2021-01-27 07:24:38

TypeScript工具Java

2009-11-27 14:29:00

Cisco路由器模擬

2009-06-25 10:28:41

Flex網絡操作系統在線桌面系統

2022-09-08 09:00:38

Ansible開源
點贊
收藏

51CTO技術棧公眾號

中文无码av一区二区三区| 亚洲精品欧美专区| 欧美性猛交xxxx免费看| 色偷偷91综合久久噜噜| 欧美久久在线观看| 一本色道久久综合亚洲| 另类春色校园亚洲| 亚洲欧美国产高清| 国产欧美日韩一区| 青草影院在线观看| 日本一区二区电影| 久久久综合精品| 久久久久九九九九| 黄色aaaaaa| 亚洲免费视频一区二区三区| 亚洲色图丝袜| 亚洲成a人片在线观看中文| 国产66精品| 久久国产日本精品| 亚洲第一视频网站| 成人国产在线看| 一区精品在线观看| 狠狠爱www人成狠狠爱综合网| 91精品啪在线观看国产60岁| 亚洲视频在线二区| 中文无码精品一区二区三区| 国产精品theporn| 一本大道亚洲视频| 青青青国产在线视频| 欧美日韩免费做爰大片| 另类图片国产| 欧美另类xxx| 久久av一区二区三| 黄页在线观看免费| 成人午夜碰碰视频| 午夜精品www| 800av在线播放| 136福利第一导航国产在线| 99视频有精品| 欧美性受xxxx黑人猛交| 我和岳m愉情xxxⅹ视频| japanese23hdxxxx日韩| 国产日韩欧美不卡在线| 国产精品久久久av| 又嫩又硬又黄又爽的视频| 久久亚洲精品中文字幕| 99久久久成人国产精品| 国产精品天天看天天狠| 欧美午夜精品理论片a级按摩| 色一情一区二区三区四区| 一级黄色大片网站| 日韩精品不卡一区二区| 884aa四虎影成人精品一区| 国产日产欧美视频| 最近高清中文在线字幕在线观看| 国产综合久久久久久久久久久久| 欧美裸体男粗大视频在线观看 | 日韩精品免费视频人成| 中文字幕精品国产| 一区二区三区欧美精品| 免费污视频在线观看| 91色|porny| 国产日韩换脸av一区在线观看| 欧美亚洲日本在线| 中文字幕亚洲精品乱码| 亚洲国产精彩中文乱码av在线播放 | 国偷自产视频一区二区久| 欧美一区二区在线观看| 欧美精品卡一卡二| 天堂8中文在线| www欧美成人18+| 久久亚洲免费| 国产理论视频在线观看| 国产亚洲成人一区| 久久精品亚洲精品| 偷拍女澡堂一区二区三区| 日韩精品福利一区二区三区| 欧美日本视频在线| 欧美a在线视频| 欧美gv在线观看| 亚洲欧美日韩国产综合| 午夜在线视频免费观看| 色吊丝在线永久观看最新版本| 另类的小说在线视频另类成人小视频在线 | 69av成年福利视频| 综合五月激情网| 欧美精品色网| 色先锋资源久久综合5566| 人与动物性xxxx| 一区二区三区韩国免费中文网站| 亚洲精品有码在线| 影音先锋资源av| 91精品亚洲一区在线观看| 538prom精品视频线放| 人妻 丝袜美腿 中文字幕| 欧美偷窥清纯综合图区| 日韩欧美国产三级| 在线观看日本一区二区| 亚洲精品**中文毛片| 亚洲国产一区二区三区青草影视 | 欧美精品第一区| 亚洲电影免费观看高清完整版在线| 午夜视频在线观看国产| 日韩高清二区| 欧美人体做爰大胆视频| 亚洲一区二区三区四区av| 精品视频一区二区三区| 欧美日韩在线三级| 亚洲黄色a v| 成人亚洲欧美| 欧美性jizz18性欧美| 五月天激情视频在线观看| 天堂√8在线中文| 精品视频一区二区三区免费| 国产综合内射日韩久| 欧美偷拍自拍| 在线播放亚洲激情| 国产一级免费av| 精久久久久久| 久久久爽爽爽美女图片| 在线看成人av| 亚洲黄色三级| 欧美大片免费看| 久久久久亚洲av成人片| 激情欧美丁香| 国产日韩欧美自拍| 天堂成人在线| 久久久99精品免费观看| 日韩av电影免费在线观看| 国产高清视频在线| 中文字幕亚洲电影| 国内自拍中文字幕| 黄色成人在线网| 欧美日韩国产影片| 性久久久久久久久久| 国产精品大片免费观看| 成人免费看片视频| 亚洲第一大网站| 99久久精品免费看| 青青草原成人| 欧美成人高清在线| 亚洲欧美电影院| 亚洲36d大奶网| 国产调教一区二区三区| 久久九九亚洲综合| 亚洲精品一区二三区| 狠狠网亚洲精品| a级国产乱理论片在线观看99| 好吊视频一区二区三区| 91啦中文在线观看| 国产中文字幕二区| 日本美女久久| 亚洲欧洲成视频免费观看| 国产精品suv一区二区88| 老司机亚洲精品| 国产精品在线看| 亚洲爱爱综合网| 亚洲日本欧美天堂| 男人靠女人免费视频网站 | 99热在线播放| 在线观看h网| 午夜精品一区二区三区三上悠亚 | 成人高清在线视频| 日韩精品无码一区二区三区| 电影网一区二区| 亚洲美女动态图120秒| 亚洲 欧美 国产 另类| 秋霞午夜av一区二区三区| 国产99在线播放| 国产在线91| 亚洲一区二区三区小说| 国产免费a级片| 亚洲国产免费看| 国产一区免费在线观看| 一二三四视频在线中文| 亚洲免费视频观看| 制服丝袜在线一区| 成人欧美一区二区三区在线播放| 亚洲天堂av一区二区| 性欧美lx╳lx╳| 国产成人精品视频| 人妻妺妺窝人体色www聚色窝| 国产精品伦理一区二区| 欧美v在线观看| 国产a久久精品一区二区三区| 国产脚交av在线一区二区| 一级日本在线| 日韩欧美在线1卡| 六月丁香在线视频| 国产成人自拍网| 五月天亚洲综合情| 成人自拍视频| 色多多国产成人永久免费网站| 亚洲视频在线观看一区二区| 亚洲欧美激情插| 中文字幕在线免费看线人| 欧美视频在线观看| 久久久影院一区二区三区| 丝袜国产在线| 国产视频亚洲精品| 92久久精品一区二区| 亚洲无线码一区二区三区| 国产精品久久久久无码av色戒| 久久网站免费观看| 日韩av不卡电影| 完全免费av在线播放| 国产按摩一区二区三区| 欧美激情综合五月色丁香小说| 久在线观看视频| 国产成人高清精品免费5388| 日本午夜在线亚洲.国产| 日本a级在线| 日韩大陆欧美高清视频区| 日本熟妇色xxxxx日本免费看| 久久久久九九视频| 日韩精品xxx| 欧美精品福利| 免费看国产精品一二区视频| 国产精品99久久免费| 日产精品99久久久久久| 色www永久免费视频首页在线| 亚洲视频在线免费观看| 亚洲精品国产av| 欧美日韩一区在线观看| 久久久久久久久影院| 亚洲欧美激情插| 波多野结衣家庭教师在线观看| 99r国产精品| 又大又长粗又爽又黄少妇视频| 免费欧美在线视频| 亚洲一区在线直播| 一区二区三区视频免费观看| 成人自拍偷拍| 不卡一区视频| 国产精品自拍网| 欧美成人黑人| 538国产精品一区二区在线| 羞羞视频在线免费国产| www.日韩欧美| www.五月婷| 婷婷久久综合九色国产成人 | 中文字幕一区二区三区四区欧美| 亚洲综合一区在线| 无码成人精品区在线观看| 国内精品国产三级国产a久久| 国产精品天天av精麻传媒| 先锋影音国产一区| 一区二区精品在线观看| 一本久久青青| 久久综合九色99| 欧美偷窥清纯综合图区| 国产日韩一区二区三区| 粉嫩av一区二区| 成人午夜电影在线播放| 伊人久久大香线蕉av超碰| 欧洲中文字幕国产精品| 欧美激情午夜| 视频在线观看99| 亚洲s色大片| 日韩在线视频国产| 欧美性猛交xxx乱大交3蜜桃| 少妇高潮 亚洲精品| 欧美成人精品一区二区男人看| 久久精品一区中文字幕| 最新国产露脸在线观看| 欧美极品xxxx| av中文字幕在线看| 欧美一级bbbbb性bbbb喷潮片| 在线观看的黄色| 热久久免费视频精品| 韩日精品一区二区| 国产精品丝袜久久久久久高清| 国产综合色在线观看| 91精品国产综合久久久久久久久 | 伊人成人网在线看| 99精品人妻少妇一区二区| 久久国产精品久久久久久电车| www.com毛片| 日韩av二区在线播放| 污视频网址在线观看| 国产一区二区三区精品欧美日韩一区二区三区 | 国产欧美日韩中文| 国产精品久一| 97夜夜澡人人双人人人喊| 免费日韩电影| 国产精品国产三级国产专播精品人 | 久久精品在线播放| 青草影视电视剧免费播放在线观看| 欧美激情2020午夜免费观看| 天堂中文在线播放| 国产精品一区二区3区| 亚洲日韩中文字幕一区| 国产乱码精品一区二区三区中文 | 国产精品美女久久久久久久久久久| 欧美乱大交做爰xxxⅹ小说| 亚洲码国产岛国毛片在线| 国产无遮挡又黄又爽在线观看 | 99久久免费观看| 日本不卡免费一区| 99久久99久久精品| 久久激情久久| 成人免费播放视频| 极品少妇xxxx精品少妇| 亚洲精品国产成人av在线| 国产日韩欧美在线一区| 欧美精品入口蜜桃| 亚洲精品免费播放| 国产一二三区精品| 五月天一区二区三区| 亚洲天堂手机在线| 亚洲激情在线观看视频免费| 亚洲黄色小说网址| 国产香蕉一区二区三区在线视频| 欧美xxx.com| 欧美成人在线影院| 亚洲色图美国十次| 国产精品欧美激情在线播放| 香蕉视频亚洲一级| 成人区精品一区二区| 日韩欧美伦理| 777米奇影视第四色| 久久这里有精品15一区二区三区| 久久久福利影院| 国产日韩欧美激情| 一级片中文字幕| 精品粉嫩超白一线天av| 深夜福利视频在线观看| 蜜月aⅴ免费一区二区三区| 日本一道高清亚洲日美韩| 精品乱码一区二区三区| 精品国产乱码| 亚洲人一区二区| 欧美亚洲网站| 色婷婷精品久久二区二区密| 亚洲精品你懂的| 中文字幕日本视频| 欧美肥妇毛茸茸| 亚洲av无码国产综合专区| 中文字幕最新精品| 亚洲精品国产嫩草在线观看| 91精品视频在线免费观看| 亚洲天堂av资源在线观看| 中文字幕中文字幕在线中心一区| 中文字幕免费一区二区| 思思久久精品视频| 国产精品久久久久婷婷二区次| 波多野结衣 久久| 欧美酷刑日本凌虐凌虐| 番号集在线观看| 国产999在线| 最新亚洲精品| 国产亚洲天堂网| 91丝袜美腿高跟国产极品老师 | 自拍偷拍国产亚洲| 亚洲午夜激情视频| 色一区av在线| 91麻豆精品国产综合久久久| 黄色www在线观看| 国产原创一区二区| 国产美女福利视频| 亚洲电影激情视频网站| 国产精品一区无码| 亚洲欧美国产va在线影院| 欧美电影免费观看| 亚洲国产精品视频一区| 伊人成年综合电影网| av免费观看不卡| 天天av天天翘天天综合网| 日韩精品一二| 国产精品久久二区| 97欧美在线视频| 女人扒开腿免费视频app| 亚洲午夜电影在线| 欧美大片aaa| 国产精品日日摸夜夜添夜夜av| 91一区二区| 男人的天堂免费| 欧美日韩国产综合新一区| 国产免费福利视频| 亚洲欧洲中文天堂| jizz亚洲女人高潮大叫| 精品一区二区不卡| 久久一综合视频| 91嫩草丨国产丨精品| 亚洲精品一区二区三区福利| 中文不卡1区2区3区| 一区二区三区四区欧美日韩| 国产河南妇女毛片精品久久久| 日韩av免费网址| 亚洲少妇中文在线| 电影中文字幕一区二区| 日本午夜激情视频| 国产精品天美传媒沈樵| 天天操夜夜操视频| 欧美一级黄色录像| 久久五月精品| 国产精品网址在线| 亚洲视频免费| 国产1区2区在线观看| 色婷婷av一区二区三区软件 |