• <fieldset id="8imwq"><menu id="8imwq"></menu></fieldset>
  • <bdo id="8imwq"><input id="8imwq"></input></bdo>
    最新文章專題視頻專題問答1問答10問答100問答1000問答2000關鍵字專題1關鍵字專題50關鍵字專題500關鍵字專題1500TAG最新視頻文章推薦1 推薦3 推薦5 推薦7 推薦9 推薦11 推薦13 推薦15 推薦17 推薦19 推薦21 推薦23 推薦25 推薦27 推薦29 推薦31 推薦33 推薦35 推薦37視頻文章20視頻文章30視頻文章40視頻文章50視頻文章60 視頻文章70視頻文章80視頻文章90視頻文章100視頻文章120視頻文章140 視頻2關鍵字專題關鍵字專題tag2tag3文章專題文章專題2文章索引1文章索引2文章索引3文章索引4文章索引5123456789101112131415文章專題3
    問答文章1 問答文章501 問答文章1001 問答文章1501 問答文章2001 問答文章2501 問答文章3001 問答文章3501 問答文章4001 問答文章4501 問答文章5001 問答文章5501 問答文章6001 問答文章6501 問答文章7001 問答文章7501 問答文章8001 問答文章8501 問答文章9001 問答文章9501
    當前位置: 首頁 - 科技 - 知識百科 - 正文

    asp.net采集頁面上所有圖像圖片資源的具體方法

    來源:懂視網 責編:小采 時間:2020-11-27 22:37:58
    文檔

    asp.net采集頁面上所有圖像圖片資源的具體方法

    asp.net采集頁面上所有圖像圖片資源的具體方法:有時我們需要采集一些信息到自己的數據庫,本地磁盤,我們經常使用的是WebClient,WebRequest等等,今天主要說一下,對于一個URI地址,采集這個頁面上所有的圖像資源,下面是源代碼,供大家參考,學習。 /// <summary> /// 下載指定UR
    推薦度:
    導讀asp.net采集頁面上所有圖像圖片資源的具體方法:有時我們需要采集一些信息到自己的數據庫,本地磁盤,我們經常使用的是WebClient,WebRequest等等,今天主要說一下,對于一個URI地址,采集這個頁面上所有的圖像資源,下面是源代碼,供大家參考,學習。 /// <summary> /// 下載指定UR

    有時我們需要采集一些信息到自己的數據庫,本地磁盤,我們經常使用的是WebClient,WebRequest等等,今天主要說一下,對于一個URI地址,采集這個頁面上所有的圖像資源,下面是源代碼,供大家參考,學習。

    /// <summary>
     /// 下載指定URL下的所有圖片
     /// </summary>
     public class WebPageImage
     {
     /// <summary>
     /// 獲取網頁中全部圖片
     /// </summary>
     /// <param name="url">網頁地址</param>
     /// <param name="charSet">網頁編碼,為空自動判斷</param>
     /// <returns>全部圖片顯示代碼</returns>
     public string getImages(string url, string charSet)
     {
     string s = getHtml(url, charSet);
     return getPictures(s, url);
     }
    
     /// <summary>
     /// 獲取網頁中全部圖片
     /// </summary>
     /// <param name="url">網址</param>
     /// <returns>全部圖片代碼</returns>
     public string getImages(string url)
     {
     return getImages(url, "");
     }
    
     string doman(string url)
     {
     Uri u = new Uri(url);
     return u.Host;
     }
    
     /// <summary>
     /// 獲取網頁內容
     /// </summary>
     /// <param name="url">網站地址</param>
     /// <param name="charSet">目標網頁的編碼,如果傳入的是null或者"",那就自動分析網頁的編碼 </param>
     /// <returns></returns>
     string getHtml(string url, string charSet)
     {
     WebClient myWebClient = new WebClient();
     //創建WebClient實例myWebClient 
     // 需要注意的: 
     //有的網頁可能下不下來,有種種原因比如需要cookie,編碼問題等等 
     //這是就要具體問題具體分析比如在頭部加入cookie 
     // webclient.Headers.Add("Cookie", cookie); 
     //這樣可能需要一些重載方法。根據需要寫就可以了 
    
     //獲取或設置用于對向 Internet 資源的請求進行身份驗證的網絡憑據。 
     myWebClient.Credentials = CredentialCache.DefaultCredentials;
     //如果服務器要驗證用戶名,密碼 
     //NetworkCredential mycred = new NetworkCredential(struser, strpassword); 
     //myWebClient.Credentials = mycred; 
     //從資源下載數據并返回字節數組。(加@是因為網址中間有"/"符號) 
     byte[] myDataBuffer = myWebClient.DownloadData(url);
     string strWebData = Encoding.Default.GetString(myDataBuffer);
    
     //獲取網頁字符編碼描述信息 
     Match charSetMatch = Regex.Match(strWebData, "<meta([^<]*)charset=([^<]*)\"", RegexOptions.IgnoreCase | RegexOptions.Multiline);
     string webCharSet = charSetMatch.Groups[2].Value.Replace("\"", "");
     if (charSet == null || charSet == "")
     charSet = webCharSet;
    
     if (charSet != null && charSet != "" && Encoding.GetEncoding(charSet) != Encoding.Default)
     strWebData = Encoding.GetEncoding(charSet).GetString(myDataBuffer);
     return strWebData;
     }
    
     string getPictures(string data, string url)
     {
     MatchCollection ps = Regex.Matches(data, @"<img\b[^<>]*?\bsrc[\s\t\r\n]*=[\s\t\r\n]*[""']?[\s\t\r\n]*(?<imgUrl>[^\s\t\r\n""'<>]*)[^<>]*?/?[\s\t\r\n]*>");
     string s = string.Empty;
     for (int i = 0; i < ps.Count; i++)
     {
     pictures p = new pictures(ps[i].Value, url);
     s += p.GetHtml + "<br />" + Environment.NewLine;
     }
     return s;
     }
    
     /// <summary>
     /// 圖片實體
     /// 圖片文件屬性處理類
     /// </summary>
     public class pictures
     {
     public pictures(string strHtml, string baseUrl)
     {
     _html = strHtml;
     Uri u1 = new Uri(baseUrl);
     _doman = u1.Host;
     _baseUrl = u1.Scheme + "://" + _doman;
     setSrc();
     }
    
     private string _html = string.Empty;
     private string _baseUrl = string.Empty;
     private string _doman = string.Empty;
    
     public string GetHtml
     {
     get { return _html; }
     }
    
     public string Alt
     {
     get
     {
     return GetAttribute("alt")[0];
     }
     }
    
     public string Src
     {
     get
     {
     string s = GetAttribute("src")[0];
     return s;
     }
     }
    
     /// <summary>
     /// 根據基路徑把相對路徑轉換成絕對徑
     /// </summary>
     /// <param name="baseUrl">基礎路徑</param>
     /// <param name="u">待轉換的相對路徑</param>
     /// <returns>絕對路徑</returns>
     public string absUrl(string baseUrl, string u)
     {
     Uri ub = new Uri(baseUrl);
     Uri ua = new Uri(ub, u);
     return ua.AbsoluteUri;
     }
    
     private void setSrc()
     {
     string strPattern = @"src[\s\t\r\n]*=[\s\t\r\n]*[""']?\S+[""']?";
     string src = GetAttribute("src")[0].ToLower();
     if (!(src.IndexOf("http://") == 0 || src.IndexOf("https://") == 0) && _baseUrl.Length > 10)
     {
     src = absUrl(_baseUrl, src);
     string s = "src=\"" + src + "\"";
     _html = Regex.Replace(_html, strPattern, s);
     }
     }
    
     /// <summary>
     /// 獲取HTML代碼中標簽屬性
     /// </summary>
     /// <param name="strHtml">HTML代碼</param>
     /// <param name="strAttributeName">屬性名稱</param>
     /// <returns>屬性值集合</returns>
     private string[] GetAttribute(string strAttributeName)
     {
     List<string> lstAttribute = new List<string>();
     string strPattern = string.Format(
     @"{0}[\s\t\r\n]*=[\s\t\r\n]*[""']?\S+[""']?",
     strAttributeName
     );
     MatchCollection matchs = Regex.Matches(_html, strPattern, RegexOptions.IgnoreCase);
     foreach (Match m in matchs)
     {
     lstAttribute.Add(m.Value.Split('=')[1].Replace("\"", "").Replace("'", ""));
     }
     if (lstAttribute.Count == 0) lstAttribute.Add("");
     return lstAttribute.ToArray();
     }
     }
     }
    

    調用:

    new WebPageImage().getImages(http://www.sina.com)

    結果:

    聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com

    文檔

    asp.net采集頁面上所有圖像圖片資源的具體方法

    asp.net采集頁面上所有圖像圖片資源的具體方法:有時我們需要采集一些信息到自己的數據庫,本地磁盤,我們經常使用的是WebClient,WebRequest等等,今天主要說一下,對于一個URI地址,采集這個頁面上所有的圖像資源,下面是源代碼,供大家參考,學習。 /// <summary> /// 下載指定UR
    推薦度:
    標簽: 圖片 資源 方法
    • 熱門焦點

    最新推薦

    猜你喜歡

    熱門推薦

    專題
    Top
    主站蜘蛛池模板: 亚洲精品国产成人99久久| 国产成人无码精品久久久免费 | 在线人成精品免费视频| 亚洲七七久久精品中文国产| 999久久久国产精品| 精品国产福利一区二区| 精品无码国产污污污免费网站国产 | 99久久99久久久精品齐齐 | 日韩亚洲精品福利| 国产香蕉国产精品偷在线 | 亚洲AV成人精品一区二区三区| 精品国产亚洲一区二区在线观看| 国产日韩欧美精品| 99久久国语露脸精品国产| 无码精品国产VA在线观看DVD| 日韩精品无码Av一区二区| 国产在线精品一区二区三区不卡| 午夜精品视频在线| 精品亚洲一区二区| 精品视频第一页| 久久亚洲精品视频| 精品三级在线观看| 久久99国产精品久久99| 极品精品国产超清自在线观看| 69国产成人综合久久精品| 99久久久精品免费观看国产| 国产精品美女久久久m| 91久久婷婷国产综合精品青草| 亚洲高清国产AV拍精品青青草原| 久久久久99精品成人片| 精品成人av一区二区三区| 精品a在线观看| 久久夜色精品国产www| 久久久亚洲精品蜜桃臀| 麻豆国内精品欧美在线| 精品久久久久久国产免费了| 精品国产亚洲一区二区在线观看| 久久se精品一区精品二区国产| 久久99精品久久久久久噜噜 | 欧美精品1区2区| 国产福利精品视频自拍 |