「マイクロソフト系技術情報 Wiki」は、「Open棟梁Project」,「OSSコンソーシアム .NET開発基盤部会」によって運営されています。
目次 †
概要 †
機械学習モデルを構築、トレーニング、デプロイが可能なプラットフォーム
詳細 †
用語 †
ワークスペース †
- 機械学習のモデルのトレーニングやデプロイに用いるすべてのリソースを管理する場所。
- 様々なPaaSと連携して動いている。その他、様々なリソースやアセットを持つ。
実験、実行、実行構成、スナップショット †
- 実験
機械学習のモデル構築のためにトレーニングを行うことを指す。
- 実行
- 実験に関する実行は、スクリプトを1回行うこと。
- メタデータ、メトリック、出力ファイル、スナップショットなどが記録される。
- スナップショット
実行時にスクリプトに含まれているファイルが実行レコードに保存される。
モデル、モデルレジストリ †
- TensorFlow?、PyTorch?、Scikit-learn、Chainerのような、
外部のフレームワークを使うことができる。
- ワークスペース内の学習モデルは、モデルレジストリで追跡可能
エンドポイント †
- クラウド上のWebサービス、IoTをエンドポイントとして指定
- 措定したエンドポイントにモジュールをデプロイする。
Machine Learning Studio †
- Azure Machine Learning 開発者向け Web ポータル
- UIとしては、言語(Python、R)とGUIがあり、StudioはGUIに相当する。
- ただ、言語(Python、R)だけでは完結しないので、
言語を使用するときもStudioを併用する必要があるらしい。
- ただし、言語を使用しないケースでは、Studioだけで完結できる。
(classic) †
2015年にリリースされたAzure Machine Learning Studioが先行してGUI環境を実現。
- ドラッグ アンド ドロップ機械学習ビルダー
- コード・ファーストが存在しなかった。
- Azure Machine Learningと相互運用できない。
- 2024 年 8 月 31 日に終了
- 2021 年 12 月 1 日以降、新しい リソースは作成できない。
メニュー †
以下のような構成になっている。
機能 †
Automated ML †
(自動機械学習
- モデルとモデルを作成するアルゴリズムの選択
- 作成されたモデルの(ハイパーパラメタ)チューニング
- モデルのリーダーボード(ランキング的な)と解釈
- 実行結果の確認
- 実行IDをクリック
- 以下のタブからチェック可能
- 詳細
実行IDの詳細情報
- データ ガードレール
データの品質をチェックできる。
- モデル
・モデルのリーダーボード
・個別のモデルの概要、説明、メトリック
・, etc.
Designer †
(GUI機械学習プロセス実行
- マウス操作でパイプライン構築
- パイプラインの構成
- 計算環境の設定(クラスタの選択
- 実験名を設定 or 選択し
学習(回帰、分類、クラスタリング)
- 推論(リアルタイム or バッチ)
- カスタムモデル・スクリプト(Python、R
- サンプル・テンプレートを活用可能
- テンプレートを選択
- パイプラインの構成
- データ選択
- 特徴量エンジニアリング
- データ分割(学習:テスト=7:3)
- モデル作成アルゴリズムの選択
- モデルの学習
- モデルの評価
Notebooks †
(コーディング環境
を保存できる。
- サンプルも用意されていて、
これをファイル管理下にクローンできる。
- また、GitHub上のコードを
ファイル管理下にクローンできる。
(Jupyter → Terminal で git cloneコマンド実行)
Compute †
(計算環境
- Compute Instance
≒ ローカル環境(開発・学習・推論で利用可能)
※ Notebooks(コーディング環境管理下のファイルを使う。
※ 各種のSKD、Azure Machine Learning Python SDKもインストール済み。
- Compute Clusters
≒ 学習環境
- 様々なスペックのVM
- 自動スケールアップ・ダウン
- ジョブ、スケジュール管理
- ライブラリ・データの自動準備
- 低優先度オプション(スポット VM
Datasets †
(データの登録・管理
- データの選択
- アップロード
- ダウンロード
- ストレージから選択
- オープンデータから選択
Models †
(モデル管理
チュートリアル †
タイタニック生存者予測 †
Automated ML(自動機械学習で、
https://aka.ms/titanic0611
をデータセットとして使用。
自動車価格の予測 †
Designer(GUI機械学習プロセス実行で、
Automobile price predictionサンプルを選択
参考 †
Qiita †
- Amazon SageMaker?とAzure MLにおける機械学習モデルのサービング技術比較
YouTube? †
Azure Machine Learning ハンズオンシリーズ †
https://www.youtube.com/playlist?list=PLzmfTuDFwtKEH_W9--AtsD4kwNSPEChPO
- 画像分類
動画なし
- Module#1 画像分類の考え方
- Module#2 PyTorch?による画像の取扱い
- Module#3 Azure ML によるモデルトレーニングとデプロイ
- スライドなし
microsoft.com †
Microsoft Azure †
Microsoft Docs †
Learn †
機能 †
ハンズオン †
mslearn-dp100 †
https://microsoftlearning.github.io/mslearn-dp100/
Machine Learning Best Practices †
https://azure.github.io/machine-learning-best-practices/#/
Machine-Learning-Collection †
https://github.com/aladdinpersson/Machine-Learning-Collection
Tags: :クラウド, :BI/AI, :Azure