第二条本条例所称娱乐场所|轮盘娱乐场开户注册

蘇飛論壇

 找回密碼
 馬上注冊

QQ登錄

只需一步,快速開始

掃一掃,訪問微社區

分布式系統框架(V2.0) 輕松承載百億數據,千萬流量!討論專區 - 源碼下載 - 官方教程

HttpHelper萬能框架(V2.3-含.netcore) HttpHelper官方出品,無敵框架討論區 - 源碼下載 - 在線測試和代碼生成

HttpHelper爬蟲類(V2.0) 最牛的爬蟲類,沒有爬不到只有想不到 源碼 - 代碼生成器 - 討論區 - 教程- 例子

查看: 553|回復: 5
打印 上一主題 下一主題

[更新] HttpHelper萬能框架V2.3.66正式發布,請大家及時更新

[復制鏈接]
跳轉到指定樓層
樓主
發表于 2019-11-1 08:57:19 | 只看該作者 |只看大圖 回帖獎勵 |倒序瀏覽 |閱讀模式
HttpHelper萬能框架V2.3.66正式發布,請大家及時更新

本次修復的問題如下
[C#] 純文本查看 復制代碼
            //1.修復提取Title不兼容大小寫的問題屬性

            //2.修復提取Html代碼不完整的Bug

            //3.增加GetHtmlKeywords,和GetHtmlDescription方法

            //4.增加對稱加密算法

            //5.修復獲取img標簽的算法



HttpHelper萬能框架V2.3.66正式發布,請大家及時更新

1. 獲取Title方法

     title修復之后幾乎可以直接獲取所有頁面的title大家可以在線測試  http://seo.ruituoyun.com/title
使用方法如下
[C#] 純文本查看 復制代碼
string title= HttpHelper.GetHtmlTitle(html)

只需要將html頁面代碼傳入如下方法即可

2. 獲取keywords

使用方法
[C#] 純文本查看 復制代碼
string  keywords = HttpHelper.GetHtmlKeywords(html);

在線測試http://seo.ruituoyun.com/keywords

3.見面描述description

使用方法
[C#] 純文本查看 復制代碼
 string description = HttpHelper.GetHtmlDescription(html);

在線測試 http://seo.ruituoyun.com/description

4.獲取頁面所有的A鏈接。


[C#] 純文本查看 復制代碼
   List<AItem> list = HttpHelper.GetAList(html, host);

注:
AItem

[C#] 純文本查看 復制代碼
 //
    // 摘要:
    //     A連接對象 Copyright:[url]http://www.httphelper.com/[/url]
    public class AItem
    {
        public AItem();

        //
        // 摘要:
        //     鏈接地址
        public string Href { get; set; }
        //
        // 摘要:
        //     鏈接文本
        public string Text { get; set; }
        //
        // 摘要:
        //     鏈接的圖片,如果是文本鏈接則為空
        public ImgItem Img { get; set; }
        //
        // 摘要:
        //     整個連接Html
        public string Html { get; set; }
        //
        // 摘要:
        //     A鏈接的類型
        public AType Type { get; set; }
        //
        // 摘要:
        //     A鏈接的屬性 0是內連鏈,1是外鏈,2不是鏈接
        public int attr { get; set; }
        //
        // 摘要:
        //     是否_blank鏈接
        public bool is_blank { get; set; }
        //
        // 摘要:
        //     是否寫title
        public bool is_title { get; set; }
    }


host是指的當前html的host主機,主要是用于排除內個鏈接的。
大家可以直接在線測試看效果http://seo.ruituoyun.com/alink?site=http%3A%2F%2Fwww.ktypad.tw
如下


具體方法如下
[C#] 純文本查看 復制代碼
//get host
                        string host = site != null ? new Uri(site).Host : string.Empty;
//a list
                        List<AItem> list = HttpHelper.GetAList(html, host);
                        if (list != null)
                        {
                            alist = list;
//所有的圖片鏈接
                            imglist = alist.Where(t => t.Type == CsharpHttpHelper.Enum.AType.Img).ToList();
//所有的內部鏈接
                            neibulist = alist.Where(t => t.attr == 0).ToList();
//內部鏈接跳出的
                            neibuoutlist = alist.Where(t => t.attr == 0 && t.is_blank).ToList();
//外部鏈接
                            waibulist = alist.Where(t => t.attr == 1).ToList();
//外部鏈接跳出的
                            waibuoutlist = alist.Where(t => t.attr == 1 && t.is_blank).ToList();
//所有的無效鏈接
                            wuxiaolist = alist.Where(t => t.attr == 2).ToList();
//所有不帶Tittle的鏈接
                            notitlelist = alist.Where(t => t.is_title == false).ToList();
                        }


5.獲取所有的img圖片標簽的

在線測試效果http://seo.ruituoyun.com/img?site=http%3A%2F%2Fwww.ktypad.tw
與上的同大致相同使用方法如下

[C#] 純文本查看 復制代碼
  //get host
                        string host = site != null ? new Uri(site).Host : string.Empty;
                        //get imglist
                        var list = HttpHelper.GetImgList(html);
                        if (list != null)
                        {
                            mlist = list;
                            //獲取所有的圖片標簽
                            altlist = mlist.Where(t => t.alt == null).ToList();
                            //所有不帶alt的
                            kongaltlist = mlist.Where(t => t.alt == string.Empty).ToList();
                            //所有不帶title的
                            titlelist = mlist.Where(t => t.title == null).ToList();
                            //title為空的
                            kongtitlelist = mlist.Where(t => t.title == string.Empty).ToList();
                            //alt和title都不存在
                            twolist = mlist.Where(t => t.alt == null && t.title == null).ToList();
                            //alt和title都為空的
                            kongtwolist = mlist.Where(t => t.alt == string.Empty && t.title == string.Empty).ToList();
                        }


好了大家有興趣的可以下載最新版本進行測試。
有什么問題請回復給你留言


沙發
發表于 2019-11-1 09:42:18 | 只看該作者
板凳
發表于 2019-11-1 10:20:32 | 只看該作者
地板
發表于 2019-11-1 12:28:23 | 只看該作者
回復

使用道具 舉報

5
發表于 2019-11-1 22:03:58 | 只看該作者
6
發表于 2019-12-7 10:23:14 | 只看該作者
您需要登錄后才可以回帖 登錄 | 馬上注冊

本版積分規則

QQ|手機版|小黑屋|手機版|聯系我們|關于我們|廣告合作|蘇飛論壇 ( 豫ICP備17001017號-1)

GMT+8, 2019-12-18 09:03

© 2017-2018

快速回復 返回頂部 返回列表
第二条本条例所称娱乐场所 广东今天36选7开 wnba比分直播 球探比分app历史版本 山东11选5走势 足球比分网即时比分一一下载 pk10信誉群 棒球比分7m体育 湖北荆州麻将卡五星规则 山西快乐十分 球探比分手机比分 pk10走势技巧 北单比分直播新浪开奖 66江苏麻将下载 15选5 腾讯广东麻将151旧版本 澳洲幸运10官网免费下载