【Webスクレイピング禁止?】Yahooファイナンス・画像検索(robots.txt)

Webスクレイピングが禁止されている「Yahooファイナンス」「Yahoo画像検索」の利用規約やrobots.txtについてまとめました。

Yahooファイナンスの利用規約

Yahooファイナンスでは、プログラムによる株価データの自動取得が全面禁止されています。(下記・利用規約より)
その代わりに、「VIP倶楽部」の「時系列データダウンロード」を利用した株価データの取得は認められています。(2018年6月現在)
Pythonなどのプログラミングを使ってYahooファイナンスの株価データ等を取得するのはやめたほうが良いでしょう。

参考:Yahoo!ファイナンス掲載情報の自動取得(スクレイピング)は禁止しています

Yahoo画像検索

Yahoo画像検索では、robots.txtに以下の記述があります。

User-agent: *
Disallow: /

URL:https://search.yahoo.co.jp/image/robots.txt

これは「全てのクローラーに対して、Yahoo画像検索のあらゆるパスにアクセスすることを禁止」しています。
つまり、「Pythonなどのプログラミングを使ってYahoo画像検索から画像等を自動取得するのを拒否」しています。
Yahooファイナンス同様、画像検索でもWebスクレイピングを行うのはやめたほうが良いでしょう。

参考:【robots.txtとは】アクセス許可・拒否の読み方など

関連ページ、その他
関連 【Python】Webスクレイピング入門・ライブラリ比較
情報収集 Qiita(Beautiful Soup関連記事一覧)
この記事を書いた人
西住技研

在学中はシステム制御理論や画像処理、機械学習を専攻分野として研究していました。就職後は、プログラミング(Python)を活用したデータ分析や作業自動化に取り組み、現在に至ります。そこで得たノウハウをブログで発信しています。
YoutubeX(旧Twitter)でも情報発信中です

西住技研をフォローする
コンピュータ

コメント