西西軟件園多重安全檢測(cè)下載網(wǎng)站、值得信賴的軟件下載站!
西西首頁(yè) 電腦軟件 安卓軟件 電腦游戲 安卓游戲 排行榜 專題合集

Beautiful Soup

v4.3.2 官方最新版
  • Beautiful Soupv4.3.2 官方最新版
  • 軟件大小:151KB
  • 更新時(shí)間:2015-01-27 11:41
  • 軟件語(yǔ)言:中文
  • 軟件廠商:
  • 軟件類別:國(guó)產(chǎn)軟件 / 免費(fèi)軟件 / 源碼相關(guān)
  • 軟件等級(jí):4級(jí)
  • 應(yīng)用平臺(tái):WinAll, Win7
  • 官方網(wǎng)站:http://www.crummy.com/software/Beautiful
  • 應(yīng)用備案:
好評(píng):50%
壞評(píng):50%

本類精品

軟件介紹

Beautiful Soup是用Python寫的一個(gè)HTML/XML的解析器,它可以很好的處理不規(guī)范標(biāo)記并生成剖析樹(parse tree)。 它提供簡(jiǎn)單又常用的導(dǎo)航(navigating),搜索以及修改剖析樹的操作。它可以大大節(jié)省你的編程時(shí)間。

Beautiful Soup介紹:

1.Beautiful Soup提供了一些簡(jiǎn)單的方法和Python術(shù)語(yǔ),用于檢索和修改語(yǔ)法樹:一個(gè)用于解析文檔并提取相關(guān)信息的工具包。這樣你寫一個(gè)應(yīng)用不需要寫很多代碼。
2.Beautiful Soup自動(dòng)將輸入文檔轉(zhuǎn)換為Unicode編碼,并將輸出文檔轉(zhuǎn)化為UTF-8編碼。你不需要考慮編碼,除非輸入文檔沒(méi)有指出其編碼并且Beautiful Soup無(wú)法自動(dòng)檢測(cè)到,這時(shí)你需要指出原來(lái)的編碼方式。
3.Beautiful Soup位于一些流行的Python解析器比如lxml和html5lib的上層,這允許你使用不同的解析策略或者犧牲速度來(lái)?yè)Q取靈活性。

如何遍歷樹?

使用find_all 函數(shù)

find_all(name, attrs, recursive, text, limit, **kwargs)

舉例說(shuō)明:

print soup.find_all('title')
print soup.find_all('p','title')
print soup.find_all('a')
print soup.find_all(id="link2")
print soup.find_all(id=True)

返回值為:

[<title>The Dormouse's story</title>]
[<p class="title"><b>The Dormouse's story</b></p>]
[<a class="sister" href="http://example.com/elsie" id="link1">Elsie</a>, <a class="sister" href="http://example.com/lacie" id="link2">Lacie</a>, <a class="sister" href="http://example.com/tillie" id="link3">Tillie</a>]
[<a class="sister" href="http://example.com/lacie" id="link2">Lacie</a>]
[<a class="sister" href="http://example.com/elsie" id="link1">Elsie</a>, <a class="sister" href="http://example.com/lacie" id="link2">Lacie</a>, <a class="sister" href="http://example.com/tillie" id="link3">Tillie</a>]

使用方法:

1.下載完成之后需要解壓縮,假設(shè)放到D:/python下。
2.運(yùn)行cmd,切換到D:/python/beautifulsoup4-4.3.2/目錄下(根據(jù)自己解壓縮后的目錄和下載的版本號(hào)修改),cd /d D:/python//beautifulsoup4-4.3.2
3.運(yùn)行命令:
setup.py build
setup.py install
4.在IDE下from bs4 import BeautifulSoup,沒(méi)有報(bào)錯(cuò)說(shuō)明安裝成功。

軟件標(biāo)簽: 網(wǎng)頁(yè)解析

其他版本下載

發(fā)表評(píng)論

昵稱:
表情: 高興 可 汗 我不要 害羞 好 下下下 送花 屎 親親
查看所有(0)條評(píng)論 > 字?jǐn)?shù): 0/500

TOP
軟件下載