CSDN文章獲取器可以用來幫助我們打開CSDN網(wǎng)站中的各種文章,并把它們提取出來,可以直接獲取csdn文章并轉(zhuǎn)換為markdown格式。CSDN文章獲取器的功能還是比較實用,對于需要這些文章的人來說很有效。
軟件介紹
需要先創(chuàng)建一個parsel.Selector對象
from parsel import Selector
html 可以是請求某個網(wǎng)頁的源碼,也可以是html,xml格式的字符串
selector = Selector(html)
創(chuàng)建Selector對象之后就可以開始使用了
tags = selector.css(’.content’)
我們平時使用的css中,對某一個標簽進行修飾時,使用的是 .class_attr
在這里也是如此
.content 就是指查詢所有 class 為 content 的標簽
查詢的結(jié)果是一個特殊的對象,不能直接得到需要的數(shù)據(jù)
將css()函數(shù)查詢到的結(jié)果轉(zhuǎn)換為字符串或者列表,需要使用一個函數(shù)
如何轉(zhuǎn)載
用瀏覽器加載文章地址,打開文章
F12打開Developer Tools,并打開Elements頁面
這里寫圖片描述
將文章開頭部分的文字作為關鍵字在Elements界面搜索
以此文為例:http://blog.csdn.net/aggressive_snail/article/details/54375876
搜索找了好久關鍵字
這里寫圖片描述
向上選則div元素,一個一個查看,直到要轉(zhuǎn)載的原文變成被選取狀態(tài),如下圖,
這里寫圖片描述
復制該div元素
這里寫圖片描述
粘貼到自己的博客編輯器里(markdown編輯器)
把div源代碼,直接復制到編輯器里