载入 html
要想解析html,首先我们需要加载html。这一步在jQuery是自动完成的,因为jQuery的运行在一个即时的DOM环境中。我们需要将HTML文档传入Cheerio中,那么如何加载呢?
这是需要加载的html:
<ul id="fruits">
<li class="apple">Apple</li>
<li class="orange">Orange</li>
<li class="pear">Pear</li>
</ul>
PS: 在后文示例中加载的 html,都将是上述中的这段代码。
首选:
var cheerio = require('cheerio'),
$ = cheerio.load(html);
将HTML作为字符串参数传入:
$ = require('cheerio');
$('ul', html);
或者作为根结点:
$ = require('cheerio');
$('li', 'ul', html);