Python用Webスクレイピングモジュール「feedparser」でRSSの情報を取得する方法についてソースコード付きでまとめました。
RSSの取得(記事タイトルとURL)
PythonのWebスクレイピングモジュール「feedparser」を用いて、RSSの情報を取得します。
そして、RSSに記載されている記事タイトルとURLを表示してみます。
※「feedparser」は外部モジュールなので下記のコマンド等でインストールする必要があります。
pip install feedparser
サンプルコード(Python3)
サンプルプログラムのソースコードです。
# -*- coding: utf-8 -*- import feedparser rss_url = "https://headlines.yahoo.co.jp/rss/trendy-all.xml" # urlからRSSを取得 feed = feedparser.parse(rss_url) # 記事の情報を表示 for entry in feed.entries: # 記事のタイトルとリンクを表示 print(entry.title) print(entry.link)
– | 関連記事 |
---|---|
1 | ■【Python/BeautifulSoup4】Webスクレイピング入門 ■【Python】Webスクレイピング入門 ■Python入門 基本文法 ■【Python】ネットワークプログラミング入門 |
コメント