当前位置：极客笔记 > Python > Python 精选笔记 > BeautifulSoup 如何在HTML文件中找到特定标签的所有出现

BeautifulSoup 如何在HTML文件中找到特定标签的所有出现

问题描述

在一个大的HTML文件中，我正在尝试使用BeautifulSoup返回所有具有特定标签的内容（例如： “span data-qa-id=”aditem_price””) 但我找不到答案，有人知道该怎么做吗？我正在尝试学习一些关于爬取网站的知识

解决方案

你可以使用 find_all 方法：（正如文档中提到的，第一个参数是标签名称，第二个参数是一个属性对象）

sample_web_page = 'your_url'
page = requests.get(sample_web_page)
soup = BeautifulSoup(page.content, "html.parser")

results = soup.find_all("span", {"data-qa-id" : "aditem_price"})

如果你从文件中阅读，可以将文件对象传递给它：

with open("your_file_path") as fp:
    soup = BeautifulSoup(fp, 'html.parser')
    results = soup.find_all("span", {"data-qa-id" : "aditem_price"})

Camera课程

API2 教程

Perf 教程

Native FW 教程

ISP 教程

Sensor 教程

Python教程

Python 教程

NumPy 教程

Django 教程

Java教程

Java 教程

Web教程

JavaScript 教程

jQuery 教程

CSS 教程

PHP 教程

Laravel 教程

TypeScript 教程

WordPress 教程

数据库教程

SQL 教程

SQLite 教程

MySQL 教程

PL/SQL 教程

MongoDB 教程

图形图像教程

OpenCV 教程

办公软件教程

Excel 教程

Linux教程

Linux命令全集

Linux内核API

LVGL 教程

计算机教程

操作系统教程

计算机网络教程

C语言教程

C++ 教程

Swift 教程

大数据教程

Hadoop 教程

Spark 教程

Scala 教程

开发工具教程

Git 教程

Jenkins 教程

ChatGPT 教程

IntelliJ 教程

回顶
回顶部