Skip to content

sakamotomasaki/estat_dl

Repository files navigation

estat_dlの概要

CodeZine記事「現場のAIエンジニアから学ぶ「時系列データの予測モデルの作り方」」にて使用したデータ、ソースコードです。

ソースコードの内容

chapter01.ipynb

https://codezine.jp/article/detail/11792
第1稿「ディープラーニングを用いた時系列データの予測モデルの作り方」で使用したソースコードです。

  • 目的変数:mig_in(年次転入者数)
  • 説明変数:*_lag1(前年の年次全データ)
  • ロジック:ディープラーニング(全結合ネットワーク)

chapter02_monthly.ipynb

https://codezine.jp/article/detail/11882
第2稿「AIサービスの開発に求められる予測性能以外のこととは?データ粒度の詳細化を例に学ぶ」で使用したソースコードです。

  • 目的変数:mig_in(月次転入者数)
  • 説明変数:*_lag1(前月の月次全データ)
  • ロジック:ディープラーニング(全結合ネットワーク)

chapter03__01_lag2.ipynb

https://codezine.jp/article/detail/12204
第3稿「ディープラーニングを用いた時系列データ予測 モデルの表現力を増すには?」で使用したソースコードです。

  • 目的変数:mig_in(月次転入者数)
  • 説明変数:*_lag1(前月の月次全データ), *_lag2(前々月の月次全データ)
  • ロジック:ディープラーニング(全結合ネットワーク)

chapter03_02_loclag.ipynb

https://codezine.jp/article/detail/12204
第3稿「ディープラーニングを用いた時系列データ予測 モデルの表現力を増すには?」で使用したソースコードです。

  • 目的変数:mig_in(月次転入者数)
  • 説明変数:*_lag1(前月の月次全データ), *_lag1_loclag1(隣接県の前々月の月次全データ)
  • ロジック:ディープラーニング(全結合ネットワーク)

chapter04_model_eval.ipynb

第4稿「ディープラーニングによる時系列データ予測モデルの問題点を解消する」で使用したソースコードです。 https://codezine.jp/article/detail/13234

  • 目的変数:mig_in(月次転入者数)
  • 説明変数:*_lag1(前月の月次全データ), *_lag2(前々月の月次全データ)
  • ロジック:ディープラーニング(全結合ネットワーク)

データの内容

  • 出典:政府統計の総合窓口(e-Stat) (https://www.e-stat.go.jp/)
  • 各データファイル(CSV)は、「住民基本台帳人口移動報告」,「住民基本台帳に基づく人口、人口動態及び世帯数調査」,「賃金構造基本統計調査」,「工業統計調査」,「商用統計調査」を加工して作成
  • 利用者がコンテンツを用いて行う一切の行為(コンテンツを編集・加工等した情報を利用することを含む)について何ら責任を負うものではありません。
  • コンテンツは予告なく変更、移転、削除等が行われることがあります。

data/00000000_pre_id.csv

  • prefecture:都道府県
  • prefecture_id:都道府県ID

data/00200523_migration.csv

  • datetime:日時
  • prefecture:都道府県
  • mig_in:県外からの転入者数
  • mig_out:県外への転出者数
  • mig_internal:県内移動者数

data/00200241_population.csv

  • datetime:日時
  • prefecture:都道府県
  • pop_male:男性人口数
  • pop_female:女性人口数
  • pop_sum:合計人口数
  • pop_households:世帯数

data/00450091_wage.csv

  • datetime:日時
  • prefecture:都道府県
  • wag_age:労働者の平均年齢
  • wag_salary:労働者の平均月給
  • wag_bonus:労働者の平均賞与
  • wag_workers:労働者の人数

data/00550010_industrial.csv

  • datetime:日時
  • prefecture:都道府県
  • idt_offices:工業事業所数
  • idt_employees:工業従業員数
  • idt_salaries:工業給与総額
  • idt_costs:工業原材料総額
  • idt_sales:工業出荷総額

data/00550020_retail.csv

  • datetime:日時
  • prefecture:都道府県
  • ret_offices:卸小売事業所数
  • ret_employees:卸小売従業員数
  • ret_sales:卸小売商品販売額

動作確認した環境構成

OS

  • macOS Mojave 10.14.6

Python

  • Python 3.7.2(anaconda3-5.3.1)

Python Packages

  • jupyter 1.0.0
  • numpy 1.15.1
  • pandas 0.23.4
  • scikit-learn 0.19.2
  • tensorflow 1.14.0
  • Keras 2.2.4
  • matplotlib 2.2.3

マシン環境の構築手順例

注意事項(例にて記載を省略している部分)

  • (1) ネットワーク経由でのインストールについて
社内NW環境等によりインターネットへのアクセスにプロキシを使用している場合、ネットワークを経由するコマンド毎にプロキシ設定をする必要があります
  • (2) matplotlibにおける日本語表示について
使用する日本語フォント(IPAexGothic)をインストールする必要があります

(例1)macOS

  • (1) Python環境構成管理ツール(pyenv)のインストール
$ /usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"
$ brew install pyenv
  • (2) Python環境(Anaconda)のインストール
$ pyenv install --list
$ pyenv install anaconda3-5.3.1
  • (3) 実行環境の構築
$ mkdir ~/work
$ cd ~/work
$ pyenv local anaconda3-5.3.1
  • (4) tensorflow,kerasのインストール
$ pip install PyHamcrest # tensorflowインストール時に、PyHamcrestがインストールされていないというエラーとなったため
$ conda update wrapt # tensorflowインストール時に、wraptがアンインストールできないというエラーとなったため
$ pip install tensorflow
$ pip install keras
  • (5) ソースコードのダウンロード
$ git clone https://github.com/sakamotomasaki/estat_dl.git
  • (6) jupyter notebookの起動
$ jupyter notebook
  • (7) ソースコードの実行
WEBブラウザにて起動されたjupyter notebook画面にて、「estat_dl」に移動し、「chapter01.ipynb」を起動する.
メニュータブにて、「Kernel」>[Restart& Run All]でソースコードを実行する.

(例2)OS:Windows 10(64bit)

  • (1) Python環境(Anaconda)のインストール
https://www.anaconda.com/distribution/#download-section から3.7系をダウンロードしてインストールする.
  • (2) Pythonパッケージのインストール
Windowsスタートメニューから「Anaconda3(64-bit)」/「Anaconda Prompt(anaconda3)」を選択する.
Pythonパッケージ構成管理ツール(conda)を用いて、keras(同時にtensorflow)をインストールする.
(base)C:\Users\<Windowsアカウント名>> conda install keras
  • (3) ソースコードのダウンロード
https://github.com/sakamotomasaki/estat_dl から[Clone or Download]より「estat_dl-master.zip」をダウンロードし、解凍する.
  • (4) jupyter notebookの起動
Windowsスタートメニューから「Anaconda3(64-bit)」/「Jupyter Notebook」を選択する.
  • (5) ソースコードの実行
WEBブラウザにて起動されたjupyter notebook画面にて、「estat_dl」に移動し、「chapter01.ipynb」を起動する.
メニュータブにて、「Kernel」>[Restart& Run All]でソースコードを実行する.

About

article codezine

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published