<tt id="mbhgd"></tt>

西西軟件園多重安全檢測(cè)下載網(wǎng)站、值得信賴的軟件下載站！

軟件教程 | 最新更新 | 下載排行 | 軟件分類 | 軟件專題

搜索

西西首頁電腦軟件安卓軟件電腦游戲安卓游戲排行榜專題合集

您的位置：首頁 → 網(wǎng)絡(luò)工具 → 下載工具 → 筆趣閣小說爬取工具【附源碼】 Python版

軟件: 軟件文章

軟件介紹
軟件截圖
相關(guān)軟件
其他版本
用戶評(píng)論
下載地址

筆趣閣小說爬取工具【附源碼】

Python版

軟件大小:15M
更新時(shí)間:2020-09-11 08:32
軟件語言:中文
軟件廠商:
軟件類別:國(guó)產(chǎn)軟件 / 免費(fèi)軟件 / 下載工具
軟件等級(jí):
應(yīng)用平臺(tái):WinXP, Win7, win8
官方網(wǎng)站:暫無
應(yīng)用備案:

本地下載文件大小:15M

相關(guān)軟件

頂好評(píng):50%

踩壞評(píng):50%

報(bào)錯(cuò)

請(qǐng)簡(jiǎn)要描述您遇到的錯(cuò)誤，我們將盡快予以修正。

轉(zhuǎn)帖到論壇

輪壇轉(zhuǎn)帖HTML方式

輪壇轉(zhuǎn)帖UBB方式

本類軟件分類

本類精品

迅雷11最新版v12.0.8.2392 官方
5.2M/中文/6.4
阿里云網(wǎng)盤PC版v6.3.3
64.9M/中文/3.7
BitComet 2022(比特彗星)v1.95
28.3M/中文/1.9
Internet Download Manager(ID
41.4M/多國(guó)語言[中文]/5.2
迅雷U享版V3.2.1.498 官方版
28.7M/中文/5.0
BIGEMAP地圖下載器v19.2.0.0
29.2M/中文/9.8
老版迅雷5.8免費(fèi)穩(wěn)定版已絕版
7.0M/中文/7.6

本類下載排行

裝機(jī)必備軟件

QQ2024聊天工具
網(wǎng)易音樂 視頻播放
360安全衛(wèi)士安全軟件
迅雷11 下載工具
驅(qū)動(dòng)精靈硬件驅(qū)動(dòng)
釘釘 辦公聊天

軟件介紹

筆趣閣小說爬取工具【附源碼】，來自論壇用戶原創(chuàng)制作分享的一款小說爬取工具，由Python編寫，同時(shí)附上了源碼資源方便大家瀏覽。筆趣閣小說爬取工具可以免費(fèi)爬取下載網(wǎng)站小說資源，讓您輕松獲取想看的小說。使用前請(qǐng)參考相關(guān)說明，避免出現(xiàn)錯(cuò)誤。

筆趣閣小說爬取工具【附源碼】

筆趣閣小說爬取工具使用

程序運(yùn)行方法：解壓，在本文件夾中找到并打開dist文件夾，有一個(gè)“筆趣閣小說下載.exe”，雙擊運(yùn)行

1、前往http://www.xbiquge.la/，找到要保存的小說，復(fù)制那個(gè)小說的目錄頁鏈接

2、按要求輸入鏈接地址和小說名

3、爬取開始

（因?yàn)槭菃尉€程運(yùn)行，爬取速度略慢大概1-2秒一章）

4、爬取結(jié)束后，會(huì)將所有章節(jié)內(nèi)容整合成一個(gè)txt文件

筆趣閣小說爬取工具源碼

import requests

import re

header = {

'User-Agent':'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.97 Safari/537.36'

}

#定義全局變量，用于保存所有獲取到的小說內(nèi)容

story_all = []

#獲取標(biāo)題及章節(jié)鏈接地址

def main():

url = input("請(qǐng)輸入小說目錄頁地址（暫時(shí)僅支持‘http://www.xbiquge.la/’站內(nèi)小說）：")

book_name = input("請(qǐng)輸入小說名稱：")

print("-----爬取開始-----")

#獲取目錄頁的HTML文本

text = requests.get(url,header).content.decode('utf-8')

#獲取每個(gè)章節(jié)的章節(jié)名

title = re.findall(r'<dd>.*?<a.*?>(.*?)</a>',text,re.DOTALL)

#獲取每個(gè)章節(jié)的鏈接地址

loca = re.findall(r"<dd>.*?='(.*?)' >",text,re.DOTALL)

#因?yàn)閠itle和loca的長(zhǎng)度相同，所以以索引的方式遍歷，方便取值

for i in range(len(title)):

content(title[i],f'http://www.xbiquge.la{loca[i]}')

#小說爬取完畢，開始保存

print("@"*500)

with open(r'%s.txt'%book_name, 'w',encoding='utf-8')as file:

#遍歷每一項(xiàng)，按順序保存章節(jié)名和章節(jié)內(nèi)容

for story in story_all:

file.write(story['title']+'\n')

print(story['title'])

file.write(story['story'])

#解析章節(jié)內(nèi)容并保存

def content(title,url):

#獲取章節(jié)頁的HTML文本

text = requests.get(url,header).content.decode('utf-8')

#因?yàn)橹皩戇^直接爬取所有內(nèi)容的，爬取出來的文本都帶有\(zhòng)r不好處理

#所以就一句一句的獲取了

story_content = re.findall(r' (.*?)<br',text,re.DOTALL)

#因?yàn)檎鹿?jié)名中有“”空格，沒辦法作為文件名，所以把空格去掉

title = re.sub(' ','-',title)

#有時(shí)候不知道為什么小說內(nèi)容會(huì)爬取到一個(gè)空數(shù)組，所以這里添加了一個(gè)檢測(cè)程序

#如果爬取到的為空，就重新爬取，直到獲取到為止

if story_content==[]:

content(title,url)

return 0

story=""

#前面提到，因?yàn)槲沂且痪湟痪渑廊〉�，所以這里做一下拼接，順便去空格

for story_contents in story_content:

story = story+story_contents.strip()+'\n'

#將章節(jié)名稱和章節(jié)內(nèi)容保存為一個(gè)字典

this_story = {

"title":title,

"story":story

}

print(this_story['title'])

#將字典添加到開頭定義的全局變量中

story_all.append(this_story)

if __name__ == "__main__":

main()

軟件標(biāo)簽: 筆趣閣小說爬取源碼

軟件截圖

筆趣閣小說爬取工具【附源碼】 Python版

上一張下一張(1 / 1)

安裝詳細(xì)截圖

其他版本下載

下載地址

本類最新軟件

本類軟件推薦

Adobe Application Manager10.0 官方最新版

迅雷極速版v1.0.35.366 綠色精簡(jiǎn)版

維棠FLV視頻下載軟件V2.1.4.1 綠色去廣告版

迅雷7(集成本地Vip)v7.9.44.5056 去廣告精簡(jiǎn)綠色版

FLV網(wǎng)絡(luò)視頻嗅探器(FlvCapture)0.3 綠色版

迅雷9V9.1.49.1060官方正式版

foxy繁體V1.98 綠色免費(fèi)版

迅雷5(Thunder)V5.9.28.1564 官方正式版

115網(wǎng)盤客戶端v8.2.0.45 官方安裝版

uTorrentv3.5.5.46552 官方正式版

盛大下載器2016v1.9.0.6 官方穩(wěn)定版

步步高點(diǎn)讀機(jī)下載工具V2.1.0 官方最新版

碩鼠20180.4.8.1 官方最新版

維棠FLV視頻下載工具v3.0.1.0 官方正式版

QQ旋風(fēng)2014v4.5.760.400

QQ旋風(fēng)20174.8.773.400 官方正式版

Internet Download Manager(IDM)V6.35.3中文精簡(jiǎn)版

快車、迅雷、QQ旋風(fēng)、FS2You、RayFile、納米盤等鏈接轉(zhuǎn)換器V1.0 綠色離線版

MTV分享精靈20151.5.1 綠色免費(fèi)版

Internet Download Manager(IDM)V6.36.7.3官方完整版

比特精靈(BitSpirit)V3.6.0.500 免費(fèi)簡(jiǎn)體中文綠色版

最新評(píng)論查看所有(0)條評(píng)論 >

TOP

軟件下載

聯(lián)系我們 | 發(fā)展歷程 | 版權(quán)聲明 | 下載幫助(？) | 廣告服務(wù) | 軟件提交 | 意見反饋

聲明：西西軟件園為非贏利性網(wǎng)站不接受任何贊助和廣告

<span id="fjnvx"></span>