西西軟件園多重安全檢測(cè)下載網(wǎng)站、值得信賴的軟件下載站!
西西首頁 電腦軟件 安卓軟件 電腦游戲 安卓游戲 排行榜 專題合集

網(wǎng)頁數(shù)據(jù)抓取工具SysNucleus WebHarvy

v5.5.0.168 官方版
  • 網(wǎng)頁數(shù)據(jù)抓取工具SysNucleus WebHarvyv5.5.0.168 官方版
  • 軟件大小:71.8M
  • 更新時(shí)間:2019-09-25 09:17
  • 軟件語言:中文
  • 軟件廠商:
  • 軟件類別:國(guó)產(chǎn)軟件 / 免費(fèi)軟件 / 瀏覽輔助
  • 軟件等級(jí):3級(jí)
  • 應(yīng)用平臺(tái):WinAll
  • 官方網(wǎng)站:http://www.webharvy.com/
  • 應(yīng)用備案:
好評(píng):50%
壞評(píng):50%

軟件介紹

SysNucleus WebHarvy是一款用于抓取網(wǎng)頁數(shù)據(jù)的工具,這款軟件可以幫你自動(dòng)從網(wǎng)頁中提取數(shù)據(jù),并保存在不同的格式提取內(nèi)容。軟件可以自動(dòng)抓取網(wǎng)頁上的文字、圖片、網(wǎng)址和電子郵件等內(nèi)容,你也可以直接將整個(gè)網(wǎng)頁保存為HTML的格式,從而提取網(wǎng)頁里面的所有文本以及圖標(biāo)內(nèi)容。

軟件特色:

1、SysNucleus WebHarvy可以讓您分析網(wǎng)頁上的數(shù)據(jù)

2、可以顯示從一個(gè)HTML地址上分析連接數(shù)據(jù)

3、可以延伸到下一個(gè)網(wǎng)頁頁面

4、可以指定搜索數(shù)據(jù)的范圍以及內(nèi)容

5、可以將掃描的圖片下載保存

6、支持在瀏覽器上復(fù)制鏈接搜索

7、支持配置對(duì)應(yīng)資源項(xiàng)目搜索

8、可以使用項(xiàng)目名稱以及資源名稱查找

9、SysNucleus WebHarvy可以輕松提取數(shù)據(jù)

10、提供更高級(jí)的多詞語搜索以及多頁搜索

功能介紹:

1、視覺點(diǎn)和點(diǎn)擊界面

WebHarvy是一個(gè)可視化的網(wǎng)頁提取工具。其實(shí)完全沒有必要編寫任何腳本或代碼用來提取數(shù)據(jù)。使用WebHarvy的內(nèi)置瀏覽器瀏覽網(wǎng)頁。您可以選擇用鼠標(biāo)點(diǎn)擊來提取數(shù)據(jù)。它是那么容易!

2、智能識(shí)別模式

自動(dòng)識(shí)別網(wǎng)頁中出現(xiàn)的數(shù)據(jù)模式。所以,如果你需要從一個(gè)網(wǎng)頁刮項(xiàng)目(姓名,地址,電子郵件,價(jià)格等)的列表,你不需要做任何額外的配置。如果數(shù)據(jù)重復(fù),WebHarvy會(huì)自動(dòng)刮。

3、導(dǎo)出捕獲的數(shù)據(jù)

可以保存從各種格式的網(wǎng)頁中提取的數(shù)據(jù)。 WebHarvy網(wǎng)站刮板的當(dāng)前版本允許你導(dǎo)出的刮數(shù)據(jù)作為XML,CSV,JSON或TSV文件。您還可以刮下數(shù)據(jù)導(dǎo)出到一個(gè)SQL數(shù)據(jù)庫。

4、從多個(gè)頁面提取

通常網(wǎng)頁顯示數(shù)據(jù),如在多個(gè)頁面中的產(chǎn)品目錄。 WebHarvy可以自動(dòng)抓取并從多個(gè)網(wǎng)頁中提取數(shù)據(jù)。只是指出了“鏈接到下一頁和WebHarvy網(wǎng)站刮板將自動(dòng)刮從所有頁面的數(shù)據(jù)。

5、基于關(guān)鍵字的提取

基于關(guān)鍵字的提取可讓您捕捉從搜索結(jié)果頁面輸入關(guān)鍵字的列表數(shù)據(jù)。您創(chuàng)建的配置將被自動(dòng)重復(fù)所有給定輸入關(guān)鍵字,而挖掘的數(shù)據(jù)?梢灾付ㄈ我鈹(shù)量的輸入關(guān)鍵字

6、通過代{過}{濾}理服務(wù)器提取

提取匿名和防止提取網(wǎng)絡(luò)軟件被封鎖的Web服務(wù)器,您必須通過代{過}{濾}理服務(wù)器訪問目標(biāo)網(wǎng)站的選項(xiàng)。可以使用一個(gè)單一的代{過}{濾}理服務(wù)器地址或代{過}{濾}理服務(wù)器的地址列表。

7、提取分類

WebHarvy網(wǎng)站刮板允許您從一個(gè)鏈接列表,從而導(dǎo)致一個(gè)網(wǎng)站內(nèi)的相似頁面抽取數(shù)據(jù)。這使您可以使用一個(gè)單一的配置刮網(wǎng)站內(nèi)的類別或小節(jié)。

8、使用正則表達(dá)式提取

WebHarvy可以應(yīng)用正則表達(dá)式(正則表達(dá)式)在文本或網(wǎng)頁的HTML源代碼,并提取去匹配的部分。這種強(qiáng)大的技術(shù)為您提供了更多的靈活性,同時(shí)拼搶的數(shù)據(jù)。

軟件標(biāo)簽: 數(shù)據(jù)抓取

其他版本下載

發(fā)表評(píng)論

昵稱:
表情: 高興 可 汗 我不要 害羞 好 下下下 送花 屎 親親
查看所有(0)條評(píng)論 > 字?jǐn)?shù): 0/500

TOP
軟件下載