注冊帳號丨忘記密碼?
1.點擊網(wǎng)站首頁右上角的“充值”按鈕可以為您的帳號充值
2.可選擇不同檔位的充值金額,充值后按篇按本計費
3.充值成功后即可購買網(wǎng)站上的任意文章或雜志的電子版
4.購買后文章、雜志可在個人中心的訂閱/零買找到
5.登陸后可閱讀免費專區(qū)的精彩內(nèi)容
打開文本圖片集
摘 要:單機的網(wǎng)絡(luò)爬蟲爬取數(shù)據(jù)效率較低,而研究分布式網(wǎng)絡(luò)爬蟲能有效提高數(shù)據(jù)的爬取效率。文中選擇使用上更為簡單的Scrapy-Redis框架,設(shè)計一個架構(gòu)模式為主從式的分布式網(wǎng)絡(luò)爬蟲系統(tǒng),實現(xiàn)對當(dāng)當(dāng)網(wǎng)圖書信息的爬取;并對布隆過濾器算法進行研究,分析影響其性能的參數(shù),將算法集成到Scrapy-Redis的Scheduler的去重模塊中。(剩余6520字)
登錄龍源期刊網(wǎng)
購買文章
基于Scrapy-Redis的分布式爬取當(dāng)當(dāng)網(wǎng)圖書數(shù)據(jù)
文章價格:5.00元
當(dāng)前余額:100.00
閱讀
您目前是文章會員,閱讀數(shù)共:0篇
剩余閱讀數(shù):0篇
閱讀有效期:0001-1-1 0:00:00
違法和不良信息舉報電話:400-106-1235
舉報郵箱:[email protected]