Skip to content

Latest commit

 

History

History
170 lines (117 loc) · 10.8 KB

README_usage.md

File metadata and controls

170 lines (117 loc) · 10.8 KB

Amazon SageMaker Studio Lab の使い方

Amazon SageMaker Studio Labを使い教材を学ぶためのステップを解説します。

  1. アカウントを作成する
  2. ログインする
  3. Jupyter Labを起動する
  4. 教材を開く
  5. Studio Labをより便利に使う
    • 日本語化する
    • JupyterLabの拡張を導入する
      • Jupyter Notebookでコード補完を行う
      • Jupyter Notebookでコードフォーマットを行う
    • Python以外の言語のKernelを追加する
    • AWSへ接続する
    • データサイエンスのリポジトリを作成する
  6. 参考資料

ハンズオンなどでこの資料を見ている時は、1 から 4 までを実行するとハンズオンで使用するNotebookが開けるはずです。手順の質問をするときは、手順の番号を伝えてください。(例: 1番のアカウント作成の手順3番目のapprovedのメールが届かない・・・など)。

1. アカウントを作成する

  1. アカウント作成フォームからアカウントの申し込みを行う。
  2. Account request confirmed ...のメールを受信する。
    • アカウントの申し込みが受け付けられた連絡です。リクエストの受付はすぐにメールが届きます。
  3. Account request approved ...のメールを受信し、メール内のリンクからアカウントを作成する。
    • 申し込みが承認された連絡です。承認から 7 日以内にメール内のリンクからアカウント作成を行ってください。
    • 承認は 5 営業日以内に結果が通知されます。リファラルコードを利用している場合は 2~3 分以内に結果が届きます。
    • この連絡がなかなか来ない、という場合は問い合わせフォームから連絡してください。
    • リファラルコードを使用してもメールがすぐに届かない場合は、直接 https://studiolab.sagemaker.aws/signup へアクセスしてアカウント登録を試してみてください。
  4. Verify your email ...のメールを受信し、メール内のリンクからメールアドレスを認証する。
    • アカウント作成後にメールアドレスの認証を行います。メール内のリンクからメールアドレスを認証してください。
  5. Your account is ready ...のメールを受信する。
    • お待たせしました!利用開始いただけます。

2. ログインする

Studio Labへのログインは、Studio Lab のランディングページから行います。

  1. 右上の "Sign in" ボタンを押す。
    • signin.PNG
  2. Eメールアドレス/ユーザー名、パスワードを入力する。
  3. "Sign in" を押しプロジェクトのページを開く。
    • after-login.png

3. Jupyter Labを起動する

Studio LabではCPU/GPUのいずれかでJupyter Notebookを実行することができます。CPUは4時間/セッション (1日8時間まで)、GPUは4時間/セッション (1日4時間まで)です。

  1. 「My Project」の「Select compute type」から CPUかGPU を選択する。
    • 通常のハンズオンはCPUで十分です。
  2. 「Start runtime」を押す。
    • start_runtime.png
    • 起動時に“There is no runtime available right now.”と表示された場合は何回かボタンを押してみてください。
  3. 起動時に多要素認証を求められた場合、使用可能なデバイスで認証を行います。
    • mfa-mobile.png
    • 入力した電話番号に届いたコードを入力し認証してください。
  4. ランタイムが開始したら「Open project」を押す。
    • JupyterLab 環境が起動します。

4. 教材を開く

「Open in Studio Lab」のボタンが付いた教材を開く手順は次の通りです。

  1. 教材の「Open Studio Lab」ボタンを押す(※↓のボタンは画像です)。
    • open_in_studio_lab.png
  2. 「Copy to Project」を押す。
    • copy_to_project.png
  3. 「Clone Entire Repo」 か 「Copy Notebook Only」を押す。
    • Clone Entire Repo は、Studio Labのプロジェクト内に教材をすべてコピーします。Copy Notebook Onlyは開いているノートブックのみコピーします。
    • copy_from_github.png
    • clone_git_repository.png
  4. "Confirm you want to build..."が出たら「OK」を押す。
    • create_conda_environment.png
    • OKを押し忘れたらenvironment.ymlを右クリックし「Build Conda Environment」を実行してください。
    • environment.ymlがリポジトリに含まれない場合、このポップアップは登場しません。その際はリポジトリが指定する方法で環境を構築してください。
    • 起動したターミナルで実行されたコマンドが終了したら環境構築は完了です。「done」とコンソール上に表示され、環境を有効化するためのコマンド表示されます。
    • create_environment_in_terminal.png
  5. 教材のNotebookを開く(ハンズオンの場合、どのNotebookを開くかは講師から指示があるはずです)。
    • Notebookを開いて、右上のメニューから作成したKernelを選択し、作成した環境を選択します。
    • run_notebook.png

5. Studio Labをより便利に使う

日本語化する

JupyterLabの言語パックをインストールすることで、部分的に日本語化することができます。

ターミナルを起動し、次のコマンドを実行してください。

conda install -c conda-forge jupyterlab-language-pack-ja-jp

Settings > Languageから「日本語」が選択できるようになります。

全部日本語にしたいんだよ!!という場合は、次の記事を参考にしてください。

【AWS Expert Online】SageMaker Studio Lab

JupyterLabの拡張を導入する

JupyterLabの拡張を入れることで開発環境をより便利にカスタマイズできます。拡張を有効にするには、拡張管理のセクションで拡張を"Enable"にしてください。

enable-extension.PNG

拡張をインストールした後は、JupyterLabを再起動してください。

JupyterLabを再起動します。

restart-jupyter

Jupyter Notebookでコード補完を行う

jupyterlab-lspの拡張を導入することで、Notebookでコード補完が行われるようにできます。

ターミナルを起動し、次のコマンドを実行してください。

conda install -c conda-forge nodejs jupyterlab-lsp python-lsp-server

JupyterLab再起動後、Notebookでコード補完が効くようになっているはずです。

extension-lsp.PNG

Jupyter Notebookでコードフォーマットを行う

jupyterlab_code_formatterを導入することでJupyterNotebook上のコードを成形することができます。blackisortを使いフォーマットができます。

conda install -c conda-forge jupyterlab_code_formatter black isort

保存したときに自動的に成形されるようにするには、Settings > Advanced Settings Editor > Jupyterlab Code FormatterからAuto format configにチェックを入れてください。

Python以外の言語のKernelを追加する

JupyterはKernelを追加することで他の言語を動かすことができます。以下はその言語の一覧です。リストにある言語は理論上Studio Labで動かすことができます。

Jupyter kernels

各言語の動かし方はQ&Aを参照してください。

AWSへ接続する

Studio Labで用意されているCPUやGPU、ストレージが足りなくなった場合AWSと接続することで移行できます。

  • Amazon S3: Amazon S3に接続することで15G以上のストレージが利用可能です。詳細はAmazon S3 に接続をご参照ください。
  • SageMaker Studio: SageMaker Studioに移行することで、Studio Labと同様の使い勝手でAWS上のGPUインスタンスを利用することができます。詳細はAmazon SageMaker Studio への移行 を参照してください。

データサイエンスのリポジトリを作成する

新しくリポジトリを作成する時は、テンプレートを使うことで品質の高いリポジトリを手早く作成できます。datascience-templateはそのうちの一つです。

use-template.PNG

他にも、Cookiecutter Data Scienceなどプロジェクトのテンプレートを生成してくれるツールがあります。新規にプロジェクトを開始する際は、こうしたベストプラクティスに沿ってリポジトリを作るとよいでしょう。

6. 参考資料