【Python/BeautifulSoup4】あるタグの全て・先頭のみ取得

Pythonモジュール「beautifulsoup4」であるタグの全て・先頭のみ取得する方法についてソースコード付きでまとめました。

あるタグの全て・先頭のみ取得

Pythonモジュール「beautifulsoup4」であるタグの全て・先頭のみ取得してみました。

サンプルコード(Python3)

サンプルプログラムのソースコードです。

# -*- coding: utf-8 -*-
import urllib.request
from bs4 import BeautifulSoup

# urlのHTMLを取得
url = 'https://algorithm.joho.info/'
html = urllib.request.urlopen(url)

# HTMLパース
soup = BeautifulSoup(html, 'html.parser')

# 先頭のdivタグを取得
div = soup.find('div')
print('div=', div)

# すべてのdivタグを取得
div_all = soup.find_all('div')
print('div_all=', div_all)
関連記事
1 【Python/BeautifulSoup4】Webスクレイピング入門Python入門 基本文法【Python】ネットワークプログラミング入門
関連記事