• <fieldset id="8imwq"><menu id="8imwq"></menu></fieldset>
  • <bdo id="8imwq"><input id="8imwq"></input></bdo>
    最新文章專題視頻專題問答1問答10問答100問答1000問答2000關鍵字專題1關鍵字專題50關鍵字專題500關鍵字專題1500TAG最新視頻文章推薦1 推薦3 推薦5 推薦7 推薦9 推薦11 推薦13 推薦15 推薦17 推薦19 推薦21 推薦23 推薦25 推薦27 推薦29 推薦31 推薦33 推薦35 推薦37視頻文章20視頻文章30視頻文章40視頻文章50視頻文章60 視頻文章70視頻文章80視頻文章90視頻文章100視頻文章120視頻文章140 視頻2關鍵字專題關鍵字專題tag2tag3文章專題文章專題2文章索引1文章索引2文章索引3文章索引4文章索引5123456789101112131415文章專題3
    問答文章1 問答文章501 問答文章1001 問答文章1501 問答文章2001 問答文章2501 問答文章3001 問答文章3501 問答文章4001 問答文章4501 問答文章5001 問答文章5501 問答文章6001 問答文章6501 問答文章7001 問答文章7501 問答文章8001 問答文章8501 問答文章9001 問答文章9501
    當前位置: 首頁 - 科技 - 知識百科 - 正文

    python爬蟲怎么識別

    來源:懂視網(wǎng) 責編:小采 時間:2020-11-27 14:09:53
    文檔

    python爬蟲怎么識別

    python爬蟲怎么識別:1、輸入式驗證碼這種驗證碼主要是通過用戶輸入圖片中的字母、數(shù)字、漢字等進行驗證。如下圖解決思路:這種是最簡單的一種,只要識別出里面的內(nèi)容,然后填入到輸入框中即可。這種識別技術叫OCR,這里我們推薦使用Python的第三方庫,tesserocr。對于沒有什么背
    推薦度:
    導讀python爬蟲怎么識別:1、輸入式驗證碼這種驗證碼主要是通過用戶輸入圖片中的字母、數(shù)字、漢字等進行驗證。如下圖解決思路:這種是最簡單的一種,只要識別出里面的內(nèi)容,然后填入到輸入框中即可。這種識別技術叫OCR,這里我們推薦使用Python的第三方庫,tesserocr。對于沒有什么背

    1、輸入式驗證碼

    這種驗證碼主要是通過用戶輸入圖片中的字母、數(shù)字、漢字等進行驗證。如下圖

    2b08202427ba636761493ee4d452b3a.png

    解決思路:這種是最簡單的一種,只要識別出里面的內(nèi)容,然后填入到輸入框中即可。這種識別技術叫OCR,這里我們推薦使用Python的第三方庫,tesserocr。對于沒有什么背影影響的驗證碼如圖2,直接通過這個庫來識別就可以。但是對于有嘈雜的背景的驗證碼這種,直接識別識別率會很低,遇到這種我們就得需要先處理一下圖片,先對圖片進行灰度化,然后再進行二值化,再去識別,這樣識別率會大大提高。

    2.滑動式驗證碼

    475cc25edfb6818a2f24321e7f7f63d.png

    解決思路:對于這種驗證碼就比較復雜一點,但也是有相應的辦法。我們直接想到的就是模擬人去拖動驗證碼的行為,點擊按鈕,然后看到了缺口的位置,最后把拼圖拖到缺口位置處完成驗證。

    第一步:點擊按鈕。然后我們發(fā)現(xiàn),在你沒有點擊按鈕的時候那個缺口和拼圖是沒有出現(xiàn)的,點擊后才出現(xiàn),這為我們找到缺口的位置提供了靈感。

    第二步:拖到缺口位置。我們知道拼圖應該拖到缺口處,但是這個距離如果用數(shù)值來表示?通過我們第一步觀察到的現(xiàn)象,我們可以找到缺口的位置。這里我們可以比較兩張圖的像素,設置一個基準值,如果某個位置的差值超過了基準值,那我們就找到了這兩張圖片不一樣的位置,當然我們是從那塊拼圖的右側開始并且從左到右,找到第一個不一樣的位置時就結束,這是的位置應該是缺口的left,所以我們使用selenium拖到這個位置即可。這里還有個疑問就是如何能自動的保存這兩張圖?這里我們可以先找到這個標簽,然后獲取它的location和size,然后 top,bottom,left,right = location['y'] ,location['y']+size['height']+ location['x'] + size['width'] ,然后截圖,最后摳圖填入這四個位置就行。具體的使用可以查看selenium文檔,點擊按鈕前摳張圖,點擊后再摳張圖。最后拖動的時候要需要模擬人的行為,先加速然后減速。因為這種驗證碼有行為特征檢測,人是不可能做到一直勻速的,否則它就判定為是機器在拖動,這樣就無法通過驗證了。

    聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com

    文檔

    python爬蟲怎么識別

    python爬蟲怎么識別:1、輸入式驗證碼這種驗證碼主要是通過用戶輸入圖片中的字母、數(shù)字、漢字等進行驗證。如下圖解決思路:這種是最簡單的一種,只要識別出里面的內(nèi)容,然后填入到輸入框中即可。這種識別技術叫OCR,這里我們推薦使用Python的第三方庫,tesserocr。對于沒有什么背
    推薦度:
    • 熱門焦點

    最新推薦

    猜你喜歡

    熱門推薦

    專題
    Top
    主站蜘蛛池模板: 久久久久国产精品三级网| 国产精品欧美一区二区三区| 欧美黑人巨大精品| 无码日韩精品一区二区免费暖暖| 精品国产乱码一区二区三区| 久久青青草原精品国产软件| 99精品国产福利在线观看| 久久99热只有频精品8| 日韩精品一区二区三区中文字幕| 色婷婷在线精品国自产拍| 99riav国产精品| 538国产精品一区二区在线| 无码人妻精品一区二区三区66 | 久久99热国产这有精品| 日韩精品久久久久久久电影蜜臀| 日本精品一区二区久久久| 国内精品国语自产拍在线观看| 国产福利精品在线观看| 中文字幕精品亚洲无线码二区| 99在线精品视频| 久久国产精品成人影院| 日韩欧精品无码视频无删节| 亚洲av永久无码精品秋霞电影影院| 四虎国产精品成人免费久久| 久久精品国产福利国产秒| 中文字幕无码精品三级在线电影| 99热成人精品免费久久| 98香蕉草草视频在线精品看| 91精品国产麻豆国产自产在线 | 国产精品丝袜黑色高跟鞋| 一区二区日韩国产精品| 亚洲AV无码之日韩精品| 日本精品自产拍在线观看中文| 免费看污污的网站欧美国产精品不卡在线观看 | 日韩精品少妇无码受不了| 亚洲AV成人精品网站在线播放| 无码精品黑人一区二区三区| 亚洲福利精品一区二区三区| 久久综合精品国产二区无码| 国产这里有精品| 日本欧美国产精品第一页久久 |