Webスクレイピングが禁止されている「Yahooファイナンス」「Yahoo画像検索」の利用規約やrobots.txtについてまとめました。
Yahooファイナンスの利用規約
Yahooファイナンスでは、プログラムによる株価データの自動取得が全面禁止されています。(下記・利用規約より)
その代わりに、「VIP倶楽部」の「時系列データダウンロード」を利用した株価データの取得は認められています。(2018年6月現在)
Pythonなどのプログラミングを使ってYahooファイナンスの株価データ等を取得するのはやめたほうが良いでしょう。
参考:Yahoo!ファイナンス掲載情報の自動取得(スクレイピング)は禁止しています
Yahoo画像検索
Yahoo画像検索では、robots.txtに以下の記述があります。
User-agent: * Disallow: /
URL:https://search.yahoo.co.jp/image/robots.txt
これは「全てのクローラーに対して、Yahoo画像検索のあらゆるパスにアクセスすることを禁止」しています。
つまり、「Pythonなどのプログラミングを使ってYahoo画像検索から画像等を自動取得するのを拒否」しています。
Yahooファイナンス同様、画像検索でもWebスクレイピングを行うのはやめたほうが良いでしょう。
参考:【robots.txtとは】アクセス許可・拒否の読み方など
– | 関連ページ、その他 |
---|---|
関連 | ■【Python】Webスクレイピング入門・ライブラリ比較 |
情報収集 | ■Qiita(Beautiful Soup関連記事一覧) |
コメント