簡(jiǎn)數(shù)采集器助手是一款免費(fèi)的網(wǎng)站數(shù)據(jù)采集阮籍,對(duì)于一些做網(wǎng)站的站長(zhǎng)來說可能就自己一個(gè)人經(jīng)營(yíng)通過采集的手段會(huì)比較方便快捷,簡(jiǎn)數(shù)采集器助手就可以幫你實(shí)現(xiàn)一鍵采集其他網(wǎng)站資源,阮籍可以完全滿足中小網(wǎng)站站長(zhǎng)的采集需求。
軟件介紹:
【簡(jiǎn)數(shù)采集】是新一代的網(wǎng)站文章采集和發(fā)布平臺(tái),它完全在線配置和使用云采集,功能強(qiáng)大,操作簡(jiǎn)單,配置快捷高效。
簡(jiǎn)數(shù)不僅提供網(wǎng)頁(yè)文章采集、數(shù)據(jù)批量修改、定時(shí)采集、定時(shí)定量自動(dòng)發(fā)布等基本功能,還集成強(qiáng)大的SEO工具,并創(chuàng)新實(shí)現(xiàn)了規(guī)則智能提取引擎、書簽一鍵采集發(fā)布等特色功能,大幅提升了采集配置和發(fā)布效率。
采集簡(jiǎn)單,發(fā)布更輕松:支持一鍵發(fā)布到WorpPress、帝國(guó)、織夢(mèng)、Z-Blog、Discuz、Destoon等CMS網(wǎng)站系統(tǒng),還可以發(fā)布到自定義Http接口。
另外還支持特定文章的“一鍵快速采集”,包括:微信公眾號(hào)文章、今日頭條、新聞泛采集、淘寶聯(lián)盟商品。
如果殺毒軟件誤報(bào)毒,請(qǐng)參閱安裝文件夾中的報(bào)毒說明,添加白名單放心放行即可。
采集步驟:
第一步:創(chuàng)建采集任務(wù)
點(diǎn)擊左側(cè)菜單按鈕“創(chuàng)建采集任務(wù)”,輸入采集任務(wù)名和要采集的”列表頁(yè)“網(wǎng)址,如:https://www.cnblogs.com/ (這里首頁(yè)即作為列表頁(yè):內(nèi)容含有多個(gè)詳情頁(yè)即可),詳情頁(yè)鏈接可不填,系統(tǒng)會(huì)自動(dòng)識(shí)別。
如下圖:
輸入后點(diǎn)擊 ”下一步“
第二步:完善列表頁(yè)的智能抽取結(jié)果(可選)
系統(tǒng)會(huì)先采用智能算法獲取需要采集的詳情頁(yè)鏈接(多個(gè)),用戶可以雙擊打開檢查,如果不是想要數(shù)據(jù),可以點(diǎn)擊“列表提取器”進(jìn)行手動(dòng)指定,只需要在可視化界面上用鼠標(biāo)點(diǎn)擊。
智能獲取結(jié)果如下圖:
另外:上面結(jié)果中,系統(tǒng)也智能發(fā)現(xiàn)了翻頁(yè)規(guī)則,用戶可以設(shè)置要采集多少頁(yè)。也可以稍后在任務(wù)中的“基本信息&入口網(wǎng)址”--》“按規(guī)則生成網(wǎng)址”項(xiàng)中進(jìn)行配置。
列表提取器 打開后如下圖:
第三步:完善詳情頁(yè)的智能抽取結(jié)果(可選)
上一步獲取了多個(gè)詳情頁(yè)鏈接后,繼續(xù)下一步,系統(tǒng)會(huì)使用其中一個(gè)詳情頁(yè)鏈接來智能抽取詳情頁(yè)數(shù)據(jù)(如:標(biāo)題,作者,發(fā)布日期,內(nèi)容,標(biāo)簽等)
詳情頁(yè)智能抽取結(jié)果如下:
如果智能抽取的內(nèi)容非想要的,那么可以打開"詳情提取器"進(jìn)行修改。
如下圖:
可以在左側(cè)對(duì)各字段進(jìn)行修改或增加刪除等。
還可以對(duì)每個(gè)字段進(jìn)行詳細(xì)設(shè)置或數(shù)據(jù)處理(雙擊字段即可):替換,提取,過濾,設(shè)置默認(rèn)值等等,
如下圖:
第四步:?jiǎn)?dòng)運(yùn)行
完成后,即可啟動(dòng)運(yùn)行,進(jìn)行數(shù)據(jù)采集了: