Skip to content

Latest commit

 

History

History
47 lines (30 loc) · 1.73 KB

README.md

File metadata and controls

47 lines (30 loc) · 1.73 KB

Jリーグ公式サイトから各チームの選手一覧とシーズン成績をスクレイピング

やってること

例えば川崎フロンターレのページを例に出すと、

まず、選手名鑑のタブにあるテーブル情報を取得してcsvにします。

その後、各選手の行をクリックした先にある選手ページのシーズン成績のテーブルも取得し、csvにします。ファイル名は選手名_背番号.csvの形式です。

前提

  • Python
  • pip
  • ChromeDriver

ChromeDriverの準備

seleniumも使っているのでChromeDriverが必要になります。 こちらから適当なバージョンのドライバーをインストールしてそのパスをconfig.ymlに記述してください。デフォルトはルートディレクトリ直下になっています。

driver_path: ./chromedriver

依存ライブラリインストール

$ pip install -r requirements.txt

実行

$ python gen_table.py ${出力先フォルダ} ${チームURL}

チームURLはhttps://www.jleague.jp/club/***の形式です。この辺のページからたどって取得してみてください。

例えば川崎フロンターレだとhttps://www.jleague.jp/club/kawasakifになりますので、このように実行します。

$ python gen_table.py ./kawasaki https://www.jleague.jp/club/kawasakif