Amazon SageMaker Studio Labを使い教材を学ぶためのステップを解説します。
- アカウントを作成する
- ログインする
- Jupyter Labを起動する
- 教材を開く
- Studio Labをより便利に使う
- 日本語化する
- JupyterLabの拡張を導入する
- Jupyter Notebookでコード補完を行う
- Jupyter Notebookでコードフォーマットを行う
- Python以外の言語のKernelを追加する
- AWSへ接続する
- データサイエンスのリポジトリを作成する
- 参考資料
ハンズオンなどでこの資料を見ている時は、1 から 4 までを実行するとハンズオンで使用するNotebookが開けるはずです。手順の質問をするときは、手順の番号を伝えてください。(例: 1番のアカウント作成の手順3番目のapprovedのメールが届かない・・・など)。
- アカウント作成フォームからアカウントの申し込みを行う。
- リファラルコードをお持ちの場合は、アカウント作成フォームで忘れずに入力ください。リファラルコードの詳細は大規模な講座などでStudio Labのアカウントを発行するにはどうすればよいですか?をご参照ください。
Account request confirmed ...
のメールを受信する。- アカウントの申し込みが受け付けられた連絡です。リクエストの受付はすぐにメールが届きます。
Account request approved ...
のメールを受信し、メール内のリンクからアカウントを作成する。- 申し込みが承認された連絡です。承認から 7 日以内にメール内のリンクからアカウント作成を行ってください。
- 承認は 5 営業日以内に結果が通知されます。リファラルコードを利用している場合は 2~3 分以内に結果が届きます。
- この連絡がなかなか来ない、という場合は問い合わせフォームから連絡してください。
- リファラルコードを使用してもメールがすぐに届かない場合は、直接 https://studiolab.sagemaker.aws/signup へアクセスしてアカウント登録を試してみてください。
Verify your email ...
のメールを受信し、メール内のリンクからメールアドレスを認証する。- アカウント作成後にメールアドレスの認証を行います。メール内のリンクからメールアドレスを認証してください。
Your account is ready ...
のメールを受信する。- お待たせしました!利用開始いただけます。
Studio Labへのログインは、Studio Lab のランディングページから行います。
Studio LabではCPU/GPUのいずれかでJupyter Notebookを実行することができます。CPUは4時間/セッション (1日8時間まで)、GPUは4時間/セッション (1日4時間まで)です。
- 「My Project」の「Select compute type」から CPUかGPU を選択する。
- 通常のハンズオンはCPUで十分です。
- 「Start runtime」を押す。
- 起動時に多要素認証を求められた場合、使用可能なデバイスで認証を行います。
- ランタイムが開始したら「Open project」を押す。
- JupyterLab 環境が起動します。
「Open in Studio Lab」のボタンが付いた教材を開く手順は次の通りです。
- 教材の「Open Studio Lab」ボタンを押す(※↓のボタンは画像です)。
- 「Copy to Project」を押す。
- 「Clone Entire Repo」 か 「Copy Notebook Only」を押す。
- "Confirm you want to build..."が出たら「OK」を押す。
- 教材のNotebookを開く(ハンズオンの場合、どのNotebookを開くかは講師から指示があるはずです)。
JupyterLabの言語パックをインストールすることで、部分的に日本語化することができます。
ターミナルを起動し、次のコマンドを実行してください。
conda install -c conda-forge jupyterlab-language-pack-ja-jp
Settings > Languageから「日本語」が選択できるようになります。
全部日本語にしたいんだよ!!という場合は、次の記事を参考にしてください。
【AWS Expert Online】SageMaker Studio Lab
JupyterLabの拡張を入れることで開発環境をより便利にカスタマイズできます。拡張を有効にするには、拡張管理のセクションで拡張を"Enable"にしてください。
拡張をインストールした後は、JupyterLabを再起動してください。
JupyterLabを再起動します。
jupyterlab-lspの拡張を導入することで、Notebookでコード補完が行われるようにできます。
ターミナルを起動し、次のコマンドを実行してください。
conda install -c conda-forge nodejs jupyterlab-lsp python-lsp-server
JupyterLab再起動後、Notebookでコード補完が効くようになっているはずです。
jupyterlab_code_formatterを導入することでJupyterNotebook上のコードを成形することができます。black
とisort
を使いフォーマットができます。
conda install -c conda-forge jupyterlab_code_formatter black isort
保存したときに自動的に成形されるようにするには、Settings > Advanced Settings Editor > Jupyterlab Code FormatterからAuto format config
にチェックを入れてください。
JupyterはKernelを追加することで他の言語を動かすことができます。以下はその言語の一覧です。リストにある言語は理論上Studio Labで動かすことができます。
各言語の動かし方はQ&Aを参照してください。
Studio Labで用意されているCPUやGPU、ストレージが足りなくなった場合AWSと接続することで移行できます。
- Amazon S3: Amazon S3に接続することで15G以上のストレージが利用可能です。詳細はAmazon S3 に接続をご参照ください。
- SageMaker Studio: SageMaker Studioに移行することで、Studio Labと同様の使い勝手でAWS上のGPUインスタンスを利用することができます。詳細はAmazon SageMaker Studio への移行 を参照してください。
新しくリポジトリを作成する時は、テンプレートを使うことで品質の高いリポジトリを手早く作成できます。datascience-templateはそのうちの一つです。
他にも、Cookiecutter Data Scienceなどプロジェクトのテンプレートを生成してくれるツールがあります。新規にプロジェクトを開始する際は、こうしたベストプラクティスに沿ってリポジトリを作るとよいでしょう。
- 公式ドキュメント
- 公式FAQ
- Studio Lab日本コミュニティQA
- 使い方に関する質問があればこちらのDiscussionに投稿をお願いします!