• <fieldset id="8imwq"><menu id="8imwq"></menu></fieldset>
  • <bdo id="8imwq"><input id="8imwq"></input></bdo>
    最新文章專題視頻專題問答1問答10問答100問答1000問答2000關鍵字專題1關鍵字專題50關鍵字專題500關鍵字專題1500TAG最新視頻文章推薦1 推薦3 推薦5 推薦7 推薦9 推薦11 推薦13 推薦15 推薦17 推薦19 推薦21 推薦23 推薦25 推薦27 推薦29 推薦31 推薦33 推薦35 推薦37視頻文章20視頻文章30視頻文章40視頻文章50視頻文章60 視頻文章70視頻文章80視頻文章90視頻文章100視頻文章120視頻文章140 視頻2關鍵字專題關鍵字專題tag2tag3文章專題文章專題2文章索引1文章索引2文章索引3文章索引4文章索引5123456789101112131415文章專題3
    問答文章1 問答文章501 問答文章1001 問答文章1501 問答文章2001 問答文章2501 問答文章3001 問答文章3501 問答文章4001 問答文章4501 問答文章5001 問答文章5501 問答文章6001 問答文章6501 問答文章7001 問答文章7501 問答文章8001 問答文章8501 問答文章9001 問答文章9501
    當前位置: 首頁 - 科技 - 知識百科 - 正文

    node如何爬取網頁中的圖片(附代碼)

    來源:懂視網 責編:小采 時間:2020-11-27 19:32:11
    文檔

    node如何爬取網頁中的圖片(附代碼)

    node如何爬取網頁中的圖片(附代碼):本篇文章給大家帶來的內容是關于node如何爬取網頁中的圖片(附代碼),有一定的參考價值,有需要的朋友可以參考一下,希望對你有所幫助。目錄安裝node,并下載依賴搭建服務請求我們要爬取的頁面,返回json安裝node我們開始安裝node,可以去node官網下載h
    推薦度:
    導讀node如何爬取網頁中的圖片(附代碼):本篇文章給大家帶來的內容是關于node如何爬取網頁中的圖片(附代碼),有一定的參考價值,有需要的朋友可以參考一下,希望對你有所幫助。目錄安裝node,并下載依賴搭建服務請求我們要爬取的頁面,返回json安裝node我們開始安裝node,可以去node官網下載h
    本篇文章給大家帶來的內容是關于node如何爬取網頁中的圖片(附代碼),有一定的參考價值,有需要的朋友可以參考一下,希望對你有所幫助。

    目錄

  • 安裝node,并下載依賴

  • 搭建服務

  • 請求我們要爬取的頁面,返回json

  • 安裝node

    我們開始安裝node,可以去node官網下載https://nodejs.org/zh-cn/,下載完成后運行node使用,

    node -v

    安裝成功后會出現你所安裝的版本號。

    接下來我們使用node, 打印出hello world,新建一個名為index.js文件輸入

    console.log('hello world')

    運行這個文件

    node index.js

    就會在控制面板上輸出hello world

    搭建服務器

    新建一個·名為node的文件夾。

    首先你需要下載express依賴

    npm install express

    再新建一個名為demo.js的文件 目錄結構如圖:

    在demo.js引入下載的express

    const express = require('express');
    const app = express();
    app.get('/index', function(req, res) {
    res.end('111')
    })
    var server = app.listen(8081, function() {
     var host = server.address().address
     var port = server.address().port
     console.log("應用實例,訪問地址為 http://%s:%s", host, port)
    
    })

    運行node demo.js簡單的服務就搭起來了,如圖:

    請求我們要爬取的頁面

    請求我們要爬取的頁面

    npm install superagent
    npm install superagent-charset
    npm install cheerio

    superagent 是用來發起請求的,是一個輕量的,漸進式的ajax api,可讀性好,學習曲線低,內部依賴nodejs原生的請求api,適用于nodejs環境下.,也可以使用http發起請求

    superagent-charset防止爬取下來的數據亂碼,更改字符格式

    cheerio為服務器特別定制的,快速、靈活、實施的jQuery核心實現.。 安裝完依賴就可以引入了

    var superagent = require('superagent');
    var charset = require('superagent-charset');
    charset(superagent);
    const cheerio = require('cheerio');

    引入之后就請求我們的地址,https://www.qqtn.com/tx/weixintx_1.html,如圖:

    聲明地址變量:

    const baseUrl = 'https://www.qqtn.com/'

    這些設置完之后就是發請求了,接下來請看完整代碼demo.js

    var superagent = require('superagent');
    var charset = require('superagent-charset');
    charset(superagent);
    var express = require('express');
    var baseUrl = 'https://www.qqtn.com/'; //輸入任何網址都可以
    const cheerio = require('cheerio');
    var app = express();
    app.get('/index', function(req, res) {
     //設置請求頭
     res.header("Access-Control-Allow-Origin", "*");
     res.header('Access-Control-Allow-Methods', 'PUT, GET, POST, DELETE, OPTIONS');
     res.header("Access-Control-Allow-Headers", "X-Requested-With");
     res.header('Access-Control-Allow-Headers', 'Content-Type');
     //類型
     var type = req.query.type;
     //頁碼
     var page = req.query.page;
     type = type || 'weixin';
     page = page || '1';
     var route = `tx/${type}tx_${page}.html`
     //網頁頁面信息是gb2312,所以chaeset應該為.charset('gb2312'),一般網頁則為utf-8,可以直接使用.charset('utf-8')
     superagent.get(baseUrl + route)
     .charset('gb2312')
     .end(function(err, sres) {
     var items = [];
     if (err) {
     console.log('ERR: ' + err);
     res.json({ code: 400, msg: err, sets: items });
     return;
     }
     var $ = cheerio.load(sres.text);
     $('div.g-main-bg ul.g-gxlist-imgbox li a').each(function(idx, element) {
     var $element = $(element);
     var $subElement = $element.find('img');
     var thumbImgSrc = $subElement.attr('src');
     items.push({
     title: $(element).attr('title'),
     href: $element.attr('href'),
     thumbSrc: thumbImgSrc
     });
     });
     res.json({ code: 200, msg: "", data: items });
     });
    });
    var server = app.listen(8081, function() {
    
     var host = server.address().address
     var port = server.address().port
    
     console.log("應用實例,訪問地址為 http://%s:%s", host, port)
    
    })

    運行demo.js就會返回我們拿到的數據,如圖:

    一個簡單的node爬蟲就完成了。

    聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com

    文檔

    node如何爬取網頁中的圖片(附代碼)

    node如何爬取網頁中的圖片(附代碼):本篇文章給大家帶來的內容是關于node如何爬取網頁中的圖片(附代碼),有一定的參考價值,有需要的朋友可以參考一下,希望對你有所幫助。目錄安裝node,并下載依賴搭建服務請求我們要爬取的頁面,返回json安裝node我們開始安裝node,可以去node官網下載h
    推薦度:
    標簽: 的圖片 網站 網頁
    • 熱門焦點

    最新推薦

    猜你喜歡

    熱門推薦

    專題
    Top
    主站蜘蛛池模板: 中文精品久久久久国产网址| 精品人妻一区二区三区毛片| 国产女人18毛片水真多18精品| 亚洲中文字幕无码久久精品1 | 无码精品久久久久久人妻中字| 国产微拍精品一区二区| 999久久久免费精品国产| 无码国产乱人伦偷精品视频| 四虎成人精品| 久久99精品久久久久久秒播| 91精品啪在线观看国产电影| 久久精品国产亚洲综合色| 久久99精品国产自在现线小黄鸭| 网友偷拍日韩精品| 久久精品国产精品亚洲艾草网美妙| 91精品国产自产在线老师啪| 午夜影视日本亚洲欧洲精品一区| 国产国拍亚洲精品mv在线观看| 久久丫精品国产亚洲av| 日韩精品一区二区亚洲AV观看| 亚洲综合国产精品第一页 | 人妻少妇精品无码专区动漫| 精品久久久久一区二区三区| 98精品国产自产在线XXXX| 四虎精品成人免费观看| 精品一区二区在线观看| 国产精品久久久久久福利69堂| 99久久免费国产精精品| 国产精品久久久久天天影视| 国内精品久久国产大陆| 极品精品国产超清自在线观看| 国内精品在线视频| 久久九九亚洲精品| 91嫩草亚洲精品| 国产亚洲精品a在线观看| 精品国产一区二区22| 久久99精品免费一区二区| 久久精品国产一区二区电影| 亚洲精品偷拍视频免费观看| 亚洲精品无码鲁网中文电影| 久久精品国产亚洲av日韩|