PHP中的Simple HTML DOM是一个轻量级的HTML解析器,用于快速解析HTML文档。它提供了一种简单的方法来解析HTML文档,以便从中提取有用的信息。它可以轻松地解析任何HTML文档,包括XML,XHTML,HTML5和SGML。
要使用Simple HTML DOM解析HTML,需要引入simple_html_dom.php文件。可以使用以下代码来解析HTML文档:
$html = file_get_html('http://example.com/'); foreach($html->find('div.class') as $element) echo $element->innertext . '<br>';
上面的代码将获取位于http://example.com/上的HTML文档,并解析其中的div元素,返回其innertext。
Simple HTML DOM还可以使用CSS选择器语法来解析HTML文档。例如,要解析HTML文档中的所有元素,可以使用以下代码:
$html = file_get_html('http://example.com/'); foreach($html->find('span') as $element) echo $element->innertext . '<br>';
Simple HTML DOM还提供了一些有用的方法,可以用来更改HTML文档的内容。例如,可以使用以下代码来更改HTML文档中的所有元素:
$html = file_get_html('http://example.com/'); foreach($html->find('span') as $element) $element->innertext = 'New Text';
Simple HTML DOM还可以用来获取HTML文档中的属性,如id,class等。例如,要获取HTML文档中所有元素的id属性,可以使用以下代码:
$html = file_get_html('http://example.com/'); foreach($html->find('span') as $element) echo $element->id . '<br>';
Simple HTML DOM还可以用来查找HTML文档中的元素,例如,,