CodeZine記事「現場のAIエンジニアから学ぶ「時系列データの予測モデルの作り方」」にて使用したデータ、ソースコードです。
https://codezine.jp/article/detail/11792
第1稿「ディープラーニングを用いた時系列データの予測モデルの作り方」で使用したソースコードです。
- 目的変数:mig_in(年次転入者数)
- 説明変数:*_lag1(前年の年次全データ)
- ロジック:ディープラーニング(全結合ネットワーク)
https://codezine.jp/article/detail/11882
第2稿「AIサービスの開発に求められる予測性能以外のこととは?データ粒度の詳細化を例に学ぶ」で使用したソースコードです。
- 目的変数:mig_in(月次転入者数)
- 説明変数:*_lag1(前月の月次全データ)
- ロジック:ディープラーニング(全結合ネットワーク)
https://codezine.jp/article/detail/12204
第3稿「ディープラーニングを用いた時系列データ予測 モデルの表現力を増すには?」で使用したソースコードです。
- 目的変数:mig_in(月次転入者数)
- 説明変数:*_lag1(前月の月次全データ), *_lag2(前々月の月次全データ)
- ロジック:ディープラーニング(全結合ネットワーク)
https://codezine.jp/article/detail/12204
第3稿「ディープラーニングを用いた時系列データ予測 モデルの表現力を増すには?」で使用したソースコードです。
- 目的変数:mig_in(月次転入者数)
- 説明変数:*_lag1(前月の月次全データ), *_lag1_loclag1(隣接県の前々月の月次全データ)
- ロジック:ディープラーニング(全結合ネットワーク)
第4稿「ディープラーニングによる時系列データ予測モデルの問題点を解消する」で使用したソースコードです。 https://codezine.jp/article/detail/13234
- 目的変数:mig_in(月次転入者数)
- 説明変数:*_lag1(前月の月次全データ), *_lag2(前々月の月次全データ)
- ロジック:ディープラーニング(全結合ネットワーク)
- 出典:政府統計の総合窓口(e-Stat) (https://www.e-stat.go.jp/)
- 各データファイル(CSV)は、「住民基本台帳人口移動報告」,「住民基本台帳に基づく人口、人口動態及び世帯数調査」,「賃金構造基本統計調査」,「工業統計調査」,「商用統計調査」を加工して作成
- 利用者がコンテンツを用いて行う一切の行為(コンテンツを編集・加工等した情報を利用することを含む)について何ら責任を負うものではありません。
- コンテンツは予告なく変更、移転、削除等が行われることがあります。
- prefecture:都道府県
- prefecture_id:都道府県ID
- datetime:日時
- prefecture:都道府県
- mig_in:県外からの転入者数
- mig_out:県外への転出者数
- mig_internal:県内移動者数
- datetime:日時
- prefecture:都道府県
- pop_male:男性人口数
- pop_female:女性人口数
- pop_sum:合計人口数
- pop_households:世帯数
- datetime:日時
- prefecture:都道府県
- wag_age:労働者の平均年齢
- wag_salary:労働者の平均月給
- wag_bonus:労働者の平均賞与
- wag_workers:労働者の人数
- datetime:日時
- prefecture:都道府県
- idt_offices:工業事業所数
- idt_employees:工業従業員数
- idt_salaries:工業給与総額
- idt_costs:工業原材料総額
- idt_sales:工業出荷総額
- datetime:日時
- prefecture:都道府県
- ret_offices:卸小売事業所数
- ret_employees:卸小売従業員数
- ret_sales:卸小売商品販売額
- macOS Mojave 10.14.6
- Python 3.7.2(anaconda3-5.3.1)
- jupyter 1.0.0
- numpy 1.15.1
- pandas 0.23.4
- scikit-learn 0.19.2
- tensorflow 1.14.0
- Keras 2.2.4
- matplotlib 2.2.3
- (1) ネットワーク経由でのインストールについて
社内NW環境等によりインターネットへのアクセスにプロキシを使用している場合、ネットワークを経由するコマンド毎にプロキシ設定をする必要があります
- (2) matplotlibにおける日本語表示について
使用する日本語フォント(IPAexGothic)をインストールする必要があります
- (1) Python環境構成管理ツール(pyenv)のインストール
$ /usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"
$ brew install pyenv
- (2) Python環境(Anaconda)のインストール
$ pyenv install --list
$ pyenv install anaconda3-5.3.1
- (3) 実行環境の構築
$ mkdir ~/work
$ cd ~/work
$ pyenv local anaconda3-5.3.1
- (4) tensorflow,kerasのインストール
$ pip install PyHamcrest # tensorflowインストール時に、PyHamcrestがインストールされていないというエラーとなったため
$ conda update wrapt # tensorflowインストール時に、wraptがアンインストールできないというエラーとなったため
$ pip install tensorflow
$ pip install keras
- (5) ソースコードのダウンロード
$ git clone https://github.com/sakamotomasaki/estat_dl.git
- (6) jupyter notebookの起動
$ jupyter notebook
- (7) ソースコードの実行
WEBブラウザにて起動されたjupyter notebook画面にて、「estat_dl」に移動し、「chapter01.ipynb」を起動する.
メニュータブにて、「Kernel」>[Restart& Run All]でソースコードを実行する.
- (1) Python環境(Anaconda)のインストール
https://www.anaconda.com/distribution/#download-section から3.7系をダウンロードしてインストールする.
- (2) Pythonパッケージのインストール
Windowsスタートメニューから「Anaconda3(64-bit)」/「Anaconda Prompt(anaconda3)」を選択する.
Pythonパッケージ構成管理ツール(conda)を用いて、keras(同時にtensorflow)をインストールする.
(base)C:\Users\<Windowsアカウント名>> conda install keras
- (3) ソースコードのダウンロード
https://github.com/sakamotomasaki/estat_dl から[Clone or Download]より「estat_dl-master.zip」をダウンロードし、解凍する.
- (4) jupyter notebookの起動
Windowsスタートメニューから「Anaconda3(64-bit)」/「Jupyter Notebook」を選択する.
- (5) ソースコードの実行
WEBブラウザにて起動されたjupyter notebook画面にて、「estat_dl」に移動し、「chapter01.ipynb」を起動する.
メニュータブにて、「Kernel」>[Restart& Run All]でソースコードを実行する.