Octoparse是八爪魚采集器的海外版本,任何人都可以輕松抓取網(wǎng)頁,無需編碼就可以快速收集web數(shù)據(jù),通過單擊將網(wǎng)頁轉(zhuǎn)換為結(jié)構(gòu)化電子表格!
軟件特色:
先進的網(wǎng)頁抓取功能
你所需要的一切,以自動化你的網(wǎng)絡(luò)刮擦。
使用方便
用簡單的點和點擊刮取所有數(shù)據(jù)。
無需編碼。
處理所有網(wǎng)站
搜刮網(wǎng)站,無限滾動。
登錄、下拉、AJAX...
下載結(jié)果
以CSV、Excel、API的形式下載搜刮的數(shù)據(jù)。
或保存到數(shù)據(jù)庫中。
云端服務(wù)
在八爪魚云平臺上24小時不間斷地搜刮和訪問數(shù)據(jù)。
刮痧
安排任務(wù)在任何特定時間刮。
每小時、每天、每周...
IP輪換
自動旋轉(zhuǎn)IP,防止IP
從被封鎖。
更新日志:
1、主要更新
-更好的體驗:全新的軟件設(shè)計,更穩(wěn)定、更流暢的數(shù)據(jù)采集體驗。卡滯、慢的問題會得到改善。
-改進的網(wǎng)站兼容性:核心渲染瀏覽器已經(jīng)從Firefox升級到Chrome,具有更好的兼容性。
-更快的提取速度:顯著提高了本地運行的速度。
-更加簡潔的UI交互:界面更加簡潔,工作流邏輯更加清晰。
2、筆記
-您可以在設(shè)備上同時安裝8.1版和7版。
-支持Windows 7及更高版本(僅支持x64位系統(tǒng))。如果您使用的是Windows XP或x32位系統(tǒng),請下載7.3.0版。
-云服務(wù)器仍在版本7之下。版本8.1中配置的某些任務(wù)可能無法在云中正常運行。
3、刪除的功能
-向?qū)J剑磳⒑喜椤案呒壞J健保?/p>
4、即將推出的功能
-數(shù)據(jù)導(dǎo)出為JSON格式
-XPath工具
常見問題答疑:
如何輸入關(guān)鍵字列表并抓取搜索結(jié)果?
使用Octoparse,您可以輕松地在搜索框中添加 要搜索的關(guān)鍵字列表,然后從搜索結(jié)果中捕獲數(shù)據(jù) 。無需一一手動輸入關(guān)鍵字進行搜索。
常規(guī)工作流包括兩個主要部分:
1)搜索關(guān)鍵字列表 。
2)提取搜索結(jié)果。