【Python/beautifulsoup4】CSSセレクタで指定したデータを取得

Python用Webスクレイピングモジュール「beautifulsoup4」でCSSセレクタで指定したデータを取得する方法についてソースコード付きでまとめました。

CSSセレクタで指定したデータを取得

PythonのWebスクレイピングモジュール「beautifulsoup4」を用いて、CSSセレクタで指定したデータを取得してみます。

サンプルコード(Python3)

サンプルプログラムのソースコードです。

# -*- coding: utf-8 -*-
import urllib.request
from bs4 import BeautifulSoup

# urlのHTMLを取得
url = 'https://algorithm.joho.info/'
html = urllib.request.urlopen(url)

# htmlをBeautifulSoupでパース
soup = BeautifulSoup(html, "html.parser")


# CSSセレクタで指定したタグ内のコンテンツを表示
print(soup.select_one(".entry-snippet").text)
関連記事
1 【Python/BeautifulSoup4】Webスクレイピング入門【Python】Webスクレイピング入門Python入門 基本文法【Python】ネットワークプログラミング入門
Python
技術雑記

コメント

タイトルとURLをコピーしました