網(wǎng)絡(luò)神采是一款專業(yè)的輕量級(jí)采集軟件,大家可以免費(fèi)使用,它可以幫助大家快速采集網(wǎng)頁數(shù)據(jù),它擁有極強(qiáng)的采集能力和詳細(xì)的采集數(shù)據(jù)展示,總之,你需要的它都會(huì)幫您完成,有需要的朋友歡迎下載使用。
軟件簡介:
《網(wǎng)絡(luò)神采》是一款輕量級(jí)的采集軟件,用于快速采集、下載網(wǎng)頁數(shù)據(jù)。
軟件速度快、好用、免費(fèi)。支持智能采集(不用配規(guī)則)、可視化采集(不用看源文件),支持二次開發(fā)、分布式部署。
為用戶的大數(shù)據(jù)分析、信息化平臺(tái),提供穩(wěn)定、持續(xù)、準(zhǔn)確的數(shù)據(jù)資源。
軟件優(yōu)勢:
1、采集強(qiáng)度
支持JS解析、POST分頁、登錄采集、跨層采集。對于疑難采集頁面,有成熟的解決方案。
2、速度快
支持多任務(wù)同時(shí)運(yùn)行,每個(gè)任務(wù)又可以設(shè)置多線程,確保運(yùn)行效率。
3、規(guī);
支持任務(wù)多級(jí)分類、批量管理。支持云服務(wù)器分布式部署,管理員團(tuán)隊(duì)協(xié)合。
4、流程化
支持定時(shí)采集,任務(wù)定時(shí)自動(dòng)啟動(dòng)。通過二次開發(fā),實(shí)現(xiàn)流程化的信息采集、信息處理。
5、運(yùn)行穩(wěn)定
系統(tǒng)運(yùn)行穩(wěn)定,要求“0bug”。目標(biāo)網(wǎng)頁改版后,自動(dòng)通知管理員。
6、準(zhǔn)確性
定制好任務(wù)后,采集準(zhǔn)確率可達(dá)100%,即一條不漏。
更新日志:
1、增加定期重啟軟件功能。
2、修復(fù)bug:定時(shí)采集啟動(dòng)任務(wù)時(shí)會(huì)進(jìn)隊(duì)列2次。
3、增加設(shè)置:特殊結(jié)果設(shè)置->記錄任務(wù)名稱。
4、修復(fù)bug:Win7下啟動(dòng)服務(wù)IO異常。
5、按任務(wù)統(tǒng)計(jì)插件。
6、修復(fù)bug:文本查看器切換到空白單元格會(huì)出錯(cuò)。
7、如果不下載文件,不要再生成子目錄(即使選中設(shè)置)。
8、F9運(yùn)行文件夾下所有任務(wù)后,子文件夾的任務(wù)狀態(tài)沒有改變。
9、修復(fù)bug:訪問休息間隔設(shè)置為“0-1秒”時(shí)失效。
10、處理JS中的相對地址時(shí),可識(shí)別“'”前面的轉(zhuǎn)義符“\”。
11、發(fā)生WorkerThreadError的異常時(shí),可記錄異常的詳細(xì)內(nèi)容。
12、讀取網(wǎng)址時(shí)出錯(cuò)后,可暫停任務(wù)。
13、發(fā)生WorkerThreadError的異常時(shí),任務(wù)可暫停;若暫停失敗,則停止任務(wù)。
14、修復(fù)bug:繼續(xù)任務(wù)時(shí),如果任務(wù)進(jìn)入任務(wù)隊(duì)列,則會(huì)重新開始任務(wù)。
15、停止任務(wù),同樣要寫日志。
16、改進(jìn)了任務(wù)隊(duì)列的查詢算法。
17、改進(jìn)了機(jī)器碼的可讀性。
18、WorkerThreadError:引發(fā)類型為“System.OutOfMemoryException”的異常。該異常發(fā)生后,可暫停任務(wù)。
19、保存“提取網(wǎng)址”時(shí)如果出錯(cuò),可恢復(fù)。
20、增加設(shè)置:如果“使用插件處理采集結(jié)果數(shù)據(jù)行”失。捶祷亍癴alse”),仍顯示采集結(jié)果。
21、廢棄設(shè)置:關(guān)閉軟件時(shí),如果有軟件正在運(yùn)行,強(qiáng)制停止所有任務(wù)。
22、改進(jìn)“源文件查看器”用戶體驗(yàn)3處:Cookie變化、粘貼POST參數(shù)時(shí)自動(dòng)分離、菜單快捷鍵。
23、捕獲地址時(shí),如果某個(gè)參數(shù)有變化,文本框背景色則變紅。
24、將檢查“關(guān)鍵規(guī)則”調(diào)整到“采集結(jié)果篩選”之前。
25、更新插件接口(IBget3.4),更新內(nèi)容:CheckSchedule、Create新增參數(shù):lastTaskState、lastPausingReason。
26、請求休息間隔,支持隨機(jī)數(shù)。
27、請求重試可以設(shè)置為無限次數(shù),同時(shí)增加“重試休息間隔”、“重試錯(cuò)誤范圍”設(shè)置。
28、任務(wù)增加設(shè)置:動(dòng)作失敗后不暫停任務(wù)。
29、下載文件時(shí),只請求一次。
30、運(yùn)行整個(gè)文件夾的任務(wù)時(shí),增加快捷鍵:F9。
31、修復(fù)bug:批量暫停正在啟動(dòng)的任務(wù)時(shí),會(huì)有“運(yùn)行中”狀態(tài)閃過。
32、解決:運(yùn)行信息窗口資源釋放問題。
33、使用插件處理結(jié)果數(shù)據(jù)行后,如果返回false,則數(shù)據(jù)行不再顯示。
34、循環(huán)采集拆分字符串?dāng)?shù)組時(shí),保留空值。
35、修復(fù)內(nèi)存bug一處。
36、修復(fù)bug:查看等待區(qū)出錯(cuò):集合已修改;可能無法執(zhí)行枚舉操作。
37、修復(fù)bug:由于插件日志回調(diào)事件,會(huì)引發(fā)異常:遠(yuǎn)程對象已斷開。
38、修復(fù)bug:設(shè)置窗口如果不操作,2分鐘后會(huì)拋異常:遠(yuǎn)程對象已斷開。
39、更新插件接口(IBget3.3),更新內(nèi)容:ExtractResult新增參數(shù):rowIndex;Create新增參數(shù):supportAsyncCall。
40、創(chuàng)建插件時(shí)如果出錯(cuò),任務(wù)不再提示連接數(shù)據(jù)庫。
41、特殊結(jié)果-》記錄當(dāng)前網(wǎng)址,如果有POST參數(shù),則包含在其中。
42、修復(fù)bug:任務(wù)完成后取消定時(shí)采集,在選中“使用插件檢查定時(shí)采集”時(shí)仍起作用。
43、修復(fù)bug:源文件查看器預(yù)覽功能,不能預(yù)覽框架頁。
44、增加復(fù)制采集規(guī)則功能。
45、提取下一網(wǎng)址時(shí),如果與網(wǎng)址隊(duì)列重復(fù),則提示:提取n條,已去重.
46、連續(xù)提取下一層網(wǎng)址失敗已達(dá)到n次后,不再提取下一頁網(wǎng)址,不然下次請求時(shí)會(huì)重復(fù)提取。
47、修復(fù)幾處內(nèi)存溢出問題。
48、修復(fù)bug:文本查看器html方式查看,關(guān)閉窗口后,再打開出錯(cuò)“未將對象引用設(shè)置到實(shí)例”。
49、改進(jìn)定時(shí)采集檢查思路:取當(dāng)前時(shí)間并緩存,這樣就沒有了定時(shí)偏差。