網絡爬蟲軟件(nwebcrawler)是一款小巧實用,操作簡單,功能強大的免費多線的網頁信息抓去工具,采用開源,C#開發的網絡爬蟲程序。網絡爬蟲軟件(nwebcrawler)功能十分的強大與全麵,所有也被網友稱為螞蟻、自動索引、模擬程序、網頁蜘蛛、網頁機器人等等。該軟件適用於的範圍相當的廣泛,常被用戶用於網站的優化。
NwebCrawler是用C#寫的一款多線程網絡爬蟲程序,它的實現原理是先輸入一個或多個種子URL到隊列中,然後從隊列中提取URL(先進先出原則),分析此網頁尋找相應標簽並獲得其href屬性值,爬取有用的鏈接網頁並存入網頁庫中,其中用爬取曆史來記錄爬過的網頁,這樣避免了重複爬取。提取URL存入隊列中,進行下一輪爬取。所以NwebCrawler的搜索策略為廣度優先搜索。采用廣度優先策略有利於多個線程並行爬取而且抓取的封閉性很強。
可配置:線程數,等待時間,連接超時,允許MIME類型和優先級,下載文件夾。
統計信息:URL數量,總下載文件,總下載字節數,CPU利用率和可用內存。
Preferential crawler:用戶可以設置優先級的MIME類型。
Robust: 10+ URL normalization rules, crawler trap avoiding rules
234KB / 01-09
聊天工具
下載321KB / 01-09
聊天工具
下載231KB / 01-09
聊天工具
下載140.5M / 09-05
76.4M / 03-25
55M / 06-05
237.9M / 04-13
900.9M / 03-02
96.2M / 07-06
311.2M / 07-06
335M / 07-06
200M / 07-06
413.8M / 07-06
484.7M / 09-27
165.4M / 09-05
353.9M / 06-05
131.8M / 04-13
195.6M / 03-03
45.6M / 09-08
665.2M / 07-06
2.84G / 07-06
93M / 07-06
338.3M / 07-06
1.38G / 07-26
488.3M / 07-16
109.8M / 06-03
142M / 01-08
1.2M / 11-23
548.8M / 04-13
1.6M / 04-13
1.48G / 03-18
646.6M / 03-03
133.7M / 03-03
110.5M / 09-05
33.4M / 09-05
325.8M / 08-12
60M / 04-29
254M / 04-25
659M / 04-23
1M / 12-26
253.4M / 12-08
253M / 12-08
1.19G / 11-16
369M / 09-22
181.5M / 09-22
201.2M / 09-05
488.3M / 07-16
248.9M / 12-08
248.9M / 12-08
100.6M / 03-06
148.9M / 03-06
1.12G / 07-06
1.25G / 07-06
1.76G / 09-22
1.92G / 04-17
116.2M / 04-10
201.5M / 04-13
7.31G / 07-01
94.3M / 07-06
2.48G / 07-06
7.63G / 07-06
1M / 07-06
778.1M / 07-06
561.8M / 07-11
72M / 07-06
548.7M / 07-06
1.00G / 07-06
9.13G / 07-06
126.2M / 07-06
72M / 07-06
105.1M / 07-06
132M / 07-06
132M / 07-06