PyQuery是一个类似于jQuery的Python库,它提供了一种可用于解析和操作HTML文档的强大工具。下面是使用PyQuery库的详细说明:
PyQuery库可以通过pip安装。在终端中运行以下命令即可安装:
pip install pyquery
要使用PyQuery,需要导入该库。可以使用以下代码导入PyQuery:
from pyquery import PyQuery as pq
使用pq()
函数初始化HTML文档,可以从以下几种不同的来源获取HTML文档:
以下是示例:
doc = pq(url='http://www.baidu.com')
print(doc('title'))
doc = pq(filename='example.html')
print(doc('title'))
doc = pq('<html><head><title>PyQuery Example</title></head><body><h1>Hello, world!</h1></body></html>')
print(doc('title'))
可以使用PyQuery选择器在HTML文档中找到所需的内容。选择器类似于jQuery选择器。以下是一些示例:
doc = pq('<html><head><title>PyQuery Example</title></head><body><h1>Hello, world!</h1></body></html>')
print(doc('h1'))
doc = pq('<html><head><title>PyQuery Example</title></head><body><h1 class="title">Hello, world!</h1></body></html>')
print(doc('.title'))
doc = pq('<html><head><title>PyQuery Example</title></head><body><h1 id="main-title">Hello, world!</h1></body></html>')
print(doc('#main-title'))
doc = pq('<html><head><title>PyQuery Example</title></head><body><a href="http://www.baidu.com">Baidu</a></body></html>')
print(doc('a[href="http://www.baidu.com"]'))
PyQuery也可以用来修改HTML文档。以下是一些示例:
doc = pq('<html><head><title>PyQuery Example</title></head><body><h1>Hello, world!</h1></body></html>')
print(doc('h1').text())
doc = pq('<html><head><title>PyQuery Example</title></head><body><a href="http://www.baidu.com">Baidu</a></body></html>')
print(doc('a').attr('href'))
doc = pq('<html><head><title>PyQuery Example</title></head><body><h1>Hello, world!</h1></body></html>')
doc('body').append('<p>This is a paragraph.</p>')
print(doc)
doc = pq('<html><head><title>PyQuery Example</title></head><body><h1>Hello, world!</h1><p>This is a paragraph.</p></body></html>')
doc('p').remove()
print(doc)
以上是PyQuery库的使用攻略。
本文链接:http://task.lmcjl.com/news/759.html