SLM Innovator Lab

Azure AI/ML Platform を基盤とする SLM Innovator Lab で、AI プロジェクトの可能性を最大限に引き出しましょう。このラボは、Azure での複数の SLM モデルの微調整とデプロイに優れたお客様や、RAG アプリケーションを作成するための微調整を通じて基本モデルのパフォーマンスを最適化することを目指しているお客様向けに設計されています。AI Foundry の高度な機能により、効率的でスケーラブルな LLMOps を確立できます。

このハンズオンラボは、次の目的に適しています。

1日ワークショップ(お客様により異なる4〜7時間) / LLMOpsハンズオンによる2日ワークショップ
ハッカソンスターターコード
SLMのfine-tuning&serving PoC/Prototypeのリファレンスガイド

ハンズオンガイド:https://azure.github.io/slm-innovator-lab/

新しいコンテンツ (2024 年 10 月 25 日)

LLMOpsとpromptflow python SDK
このハンズオンでは、Python SDK を使用して、新しいフローを作成し、チャットフロー構造を定義し、微調整されたモデルエンドポイントを統合する方法を学習します。また、フローを使用してモデルのパフォーマンスを比較および評価する方法についても学習します。これは、以前に Azure AI Foundry UI に基づいて利用可能だったハンズオンに追加されるものです。
ノートブックに移動します

Microsoft Olive モデルの最適化
Microsoft Olive は、AI モデルのデプロイを効率化するために Microsoft が開発したハードウェア対応の AI モデル最適化ツールチェーンです。オリーブは、特にエッジデバイス、クラウド、およびさまざまなハードウェア構成で使用するために、AIモデルをより速く、より効率的にすることで、デプロイ用のAIモデルを準備するプロセスを簡素化します。このハンズオンでは、デバイス上またはハイブリッドのデプロイシナリオを検討します。
ノートブックに移動します

Python SDK
によるコンテンツの安全性このハンズオンでは、テキストブロックリストの管理、性的なコンテンツ、暴力、憎悪、自傷行為に関するテキストと画像の分析を、複数の深刻度レベルで行うことができます。また、Azure Open AI Service と統合する方法についても学習します: Azure Open AI Service を使用して、有害なコンテンツに対してコンテンツを書き換えます。
ノートブックに移動

必要条件

開始する前に、次の要件を満たす必要があります。

Azure OpenAI Service へのアクセス
Azure ML の概要: Azure ML ワークスペースに接続し<WORKSPACE_NAME>、. <RESOURCE_GROUP> <SUBSCRIPTION_ID>
Azure AI Foundry の概要: プロジェクトを作成する
Azure AI ドキュメントインテリジェンス (v4.0 - 2024-02-29 プレビュー)
[Computing Instance - コード開発用] GPU を使用しないローエンドインスタンスをお勧めします: Standard_E2as_v4 (AMD 2 コア、16 GB RAM、32 GB ストレージ) または Standard_DS11_v2 (Intel 2 コア、14 GB RAM、28 GB ストレージ、GPU なし)
[Computing Cluster - SLM/LLM の微調整用] 単一の NVIDIA A100 GPU ノード (Standard_NC24ads_A100_v4) をお勧めします。専用のクォータがない場合、または予算が限られている場合は、低優先度 VM を選択します。
[SLM/LLM の展開] 2 つの NVIDIA V100 GPU (Standard_NC6s_v3) または 2 つの NVIDIA A100 GPU (Standard_NC24ads_A100_v4) をお勧めします。

Note 管理されたオンラインエンドポイントの場合、 [Azure ML では、デプロイのクォータの 20% が予約されています].¹ デプロイ内の VM SKU に対して特定の数のインスタンスをリクエストする場合は、 ceil(1.2 × number of instances requested for deployment) × number of cores for the VM SKU エラーが発生しないように、使用可能なクォータが必要です。たとえば、 Standard_NC6s_v3 デプロイで VM (6 コアが付属) の 1 つのインスタンスを要求する場合、12 コア (ceil(1.2 × 1 インスタンス) = 2, 2 × 6 コア) のクォータが使用可能である必要があります。

上記の要件をまだお持ちでない場合は、まずラボの準備に進んでください。

Lab 0. ラボの準備

アカウントに合わせて .env ファイルを忘れずに変更してください。.env.sample のファイル名を .env 変更する、またはコピーして .env という名前で保存してください

注意

このワークショップは、パブリック環境で設定し、インターネットにアクセスできることを前提としています。プライベート環境で構成している場合は、サービスにアクセスするためにプライベートネットワークの設定が必要になる場合があります。プライベート環境で構成するときに発生する可能性のある一般的な問題を次に示します。

Azure ML ワークスペースと [Azure AI Foundry] プライベートネットワークを設定する場合、サービスにアクセスするためにVPNまたはプライベートリンクを設定する必要がある場合があります。
Low-priority VM を使用している場合は、VM が使用可能になるまで待つ必要がある場合があります。VM の可用性は、リージョンによって異なる場合があります。
BLOB ストレージがある場合は、それを使用してデータとモデルを格納できます。ただし、ワークスペース内の BLOB ストレージへの接続を設定する必要がある場合があります Azure ML 。
クォータの問題がある場合は、VM または GPU のクォータの引き上げをリクエストする必要があります。
ワークスペースでネットワークを設定すると Azure ML 、ネットワークを変更することはできません。ネットワークを変更する場合は、新しいワークスペースを作成する必要がある場合があります。
ワークスペースと同じリージョンにないコンピューティングインスタンスを使用している場合は Azure ML 、サービスにアクセスするために VPN またはプライベートリンクの設定が必要になる場合があります。
で作成したコンピュート・インスタンスを使用している場合 Azure AI スタジオ、そのコンピュート・インスタンスでトレーニング・ジョブを実行することはできません。ワークスペースに新しいコンピューティングインスタンスを作成する必要がある場合があります Azure ML 。
成果物のダウンロード時に PermissionMismatch エラーが発生した場合は、ワークスペースに適切なアクセス許可を割り当てなければならない場合があります Azure ML 。

使用を開始する方法

コンピューティングインスタンスを Azure ML に作成します。コード開発には、 Standard_DS11_v2 (2 コア、14 GB RAM、28 GB ストレージ、GPU なし) をお勧めします。

CIのターミナルを開き、次のコマンドを実行します。

git clone https://github.com/Azure/slm-innovator-lab.git
cd slm-innovator-lab && conda activate azureml_py310_sdkv2
pip install -r requirements.txt

ハンズオンラボ

Lab 1. データ準備

Lab 2. LLMのファインチューニングとサービング

Lab 3. LLMOps

参照

Expand

データ準備

Evolve-Instruct
GLAN (一般化命令チューニング)
Auto Evolve-Instruct
Azure Machine Learning サンプル

SLMの微調整

Phi-3/Phi-3.5

Azure ML を使用した Small Language Model (SLM) Phi-3 の微調整
microsoft/Phi-3-mini-4k-instruct: これは Microsoft の公式 Phi-3-mini-4k-instruct モデルです。
microsoft/Phi-3-mini-128k-instruct: これは Microsoft の公式 Phi-3-mini-128k-instruct モデルです。
microsoft/Phi-3.5-mini-instruct: これは Microsoft の公式 Phi-3.5-mini-instruct モデルです。
microsoft/Phi-3.5-MoE-instruct: これは Microsoft の公式 Phi-3.5-MoE-instruct モデルです。
KMMLU、CLIcK、HAE-RAEデータセットを用いたLLM/SLMモデルの韓国語能力評価
daekeun-ml/Phi-3-medium-4k-instruct-ko-poc-v0.1

Florence-2

Azure ML Python SDK と MLflow を使用した VQA (Visual Question Answering) の Florence-2 の微調整
Hugging Face Blog - Finetune Florence-2 on DoCVQA

LLMOps

プロンプトフローを利用した LLMOps (AI Foundry と Azure Machine Learning の両方をサポート)

貢献

このプロジェクトは、貢献と提案を歓迎します。ほとんどのコントリビューションでは、同意する必要があります。コントリビューターライセンス契約(CLA)は、お客様が当社に付与する権利を有し、実際に付与することを宣言します。あなたの投稿を使用する権利。詳しくは https://cla.opensource.microsoft.com をご覧ください。

プルリクエストを送信すると、CLAボットが自動的に提供する必要があるかどうかを判断します CLA を作成し、PR を適切に装飾します (ステータスチェック、コメントなど)。指示に従うだけですボットによって提供されます。この操作は、CLA を使用してすべてのリポジトリで 1 回だけ行う必要があります。

このプロジェクトでは、Microsoft Open Source Code of Conduct を採用しています。詳細については、行動規範に関するFAQまたは追加の質問やコメントがある場合は、opencode@microsoft.com にお問い合わせください。

商標

このプロジェクトには、プロジェクト、製品、またはサービスの商標またはロゴが含まれている場合があります。Microsoft の許可された使用商標またはロゴは、 Microsoft の商標およびブランドガイドライン。このプロジェクトの変更されたバージョンで Microsoft の商標またはロゴを使用することは、混乱を引き起こしたり、Microsoft のスポンサーシップを暗示したりしてはなりません。第三者の商標またはロゴの使用は、それらの第三者のポリシーの対象となります。

ライセンスの概要

このサンプルコードは、MIT-0 ライセンスの下で提供されています。LICENSE ファイルを参照してください。

Footnotes

この追加のクォータは、OS のアップグレードや VM の復旧など、システムが開始する操作用に予約されており、そのような操作が実行されない限り、コストは発生しません。 ↩

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README_ja.md

README_ja.md

SLM Innovator Lab

新しいコンテンツ (2024 年 10 月 25 日)

必要条件

Lab 0. ラボの準備

注意

使用を開始する方法

ハンズオンラボ

Lab 1. データ準備

Lab 2. LLMのファインチューニングとサービング

Lab 3. LLMOps

参照

データ準備

SLMの微調整

Phi-3/Phi-3.5

Florence-2

LLMOps

貢献

商標

ライセンスの概要

Files

README_ja.md

Latest commit

History

README_ja.md

File metadata and controls

SLM Innovator Lab

新しいコンテンツ (2024 年 10 月 25 日)

必要条件

Lab 0. ラボの準備

注意

使用を開始する方法

ハンズオンラボ

Lab 1. データ準備

Lab 2. LLMのファインチューニングとサービング

Lab 3. LLMOps

参照

データ準備

SLMの微調整

Phi-3/Phi-3.5

Florence-2

LLMOps

貢献

商標

ライセンスの概要

Footnotes