CSDN博客提取器通過(guò)分析CSDN博客源碼來(lái)生成一些必要的數(shù)據(jù),可能在以后使用當(dāng)中出現(xiàn)爬取不了的情況,可能是CSDN的源碼結(jié)構(gòu)修改了。由于生成PDF的時(shí)候需要依賴(lài)字庫(kù),所以在打包程序的時(shí)候把一些必要的字庫(kù)已經(jīng)放到程序中去了?赡茉谏梢恍㏄DF文件的時(shí)候出現(xiàn)亂碼問(wèn)題,那是因?yàn)槔锩嫒鄙傩枰淖謳?kù)。
CSDN博客提取器使用教程:
1、在用戶(hù)名中輸入需要提取的博客的用戶(hù)名
2、點(diǎn)擊“打開(kāi)”,設(shè)置保存目錄
3、點(diǎn)擊“分析博客”
4、選擇需要下載的博文,再選擇需要保存文件的格式
5、點(diǎn)擊“下載”,下載博文。
程序功能:
1、支持輸入CSDN博客用戶(hù)名針對(duì)性下載
2、支持選擇保存下載的文件
保存的結(jié)構(gòu)目錄為:
選擇的保存路徑\CSDN用戶(hù)名\img 該用戶(hù)的頭像保存路徑
選擇的保存路徑\CSDN用戶(hù)名\pdf 生成的PDF文件保存路徑
選擇的保存路徑\CSDN用戶(hù)名\doc 生成的DOC文件保存路徑
選擇的保存路徑\CSDN用戶(hù)名\txt 生成的TXT文件保存路徑
3、支持獲取用戶(hù)博客信息
4、支持顯示用戶(hù)所有的帖子列表
5、可以自己選擇需要下載的帖子,有全選、反選、重置按鈕
6、支持下載的文件保存為 pdf、doc、txt三種格式
7、生成的pdf、doc文件支持圖片
8、支持進(jìn)度顯示