CSS选择器使用说明

本文档将帮助你理解和使用CSS选择器来采集网页数据。通过合适的选择器,你可以准确地定位和提取所需的内容。

一、基础选择器

1. 类选择器(Class Selector)

<div class="news-item">这个会被选中</div>

2. ID选择器

<div id="main-content">这个会被选中</div>

3. 标签选择器

<div>所有div标签都会被选中</div>

二、组合选择器

1. 后代选择器(空格)

<div class="news-list">
    <div class="news-item">会被选中</div>
    <div class="other">
        <div class="news-item">也会被选中</div>
    </div>
</div>

2. 子元素选择器(>)

<div class="news-list">
    <div class="news-item">会被选中</div>
    <div class="other">
        <div class="news-item">不会被选中</div>
    </div>
</div>

三、复合选择器

1. 多类选择器

<div class="news-item featured">会被选中</div>
<div class="news-item">不会被选中</div>

四、属性选择器

1. 基本属性选择器

<a href="...">会被选中</a>
<a>不会被选中</a>

五、常见应用场景

1. 新闻列表采集

<!-- HTML结构 -->
<div class="news-list">
    <div class="news-item">
        <h3 class="title">新闻标题</h3>
        <span class="time">发布时间</span>
        <p class="summary">新闻摘要</p>
    </div>
</div>

<!-- 选择器配置 -->
列表选择器:.news-list .news-item
字段映射:
标题:.title
时间:.time
摘要:.summary

六、注意事项

使用选择器时请注意以下几点重要事项

1. 选择器优先级

2. 选择器性能

3. 调试技巧

4. 常见问题