「マイクロソフト系技術情報 Wiki」は、「Open棟梁Project」,「OSSコンソーシアム .NET開発基盤部会」によって運営されています。
目次 †
概要 †
機械学習モデルを構築、トレーニング、デプロイが可能なプラットフォーム
詳細 †
用語 †
ワークスペース †
- 機械学習のモデルのトレーニングやデプロイに用いるすべてのリソースを管理する場所。
- 様々なPaaSと連携して動いている。その他、様々なリソースやアセットを持つ。
- Azure Databricksと同じクォータ制限がある(ただし、ワークスペース単位に設定可能)。
実験、実行、実行構成、スナップショット †
- 実験
機械学習のモデル構築のためにトレーニングを行うことを指す。
- 実行
- 実験に関する実行は、スクリプトを1回行うこと。
- メタデータ、メトリック、出力ファイル、スナップショットなどが記録される。
- スナップショット
実行時にスクリプトに含まれているファイルが実行レコードに保存される。
モデル、モデルレジストリ †
- TensorFlow?、PyTorch?、Scikit-learn、Chainerのような、
外部のフレームワークを使うことができる。
- ワークスペース内の学習モデルは、モデルレジストリで追跡可能
エンドポイント †
- クラウド上のWebサービス、IoTをエンドポイントとして指定
- 措定したエンドポイントにモジュールをデプロイする。
Machine Learning Studio †
- Azure Machine Learning 開発者向け Web ポータル
- UIとしては、言語(Python、R)とGUIがあり、StudioはGUIに相当する。
- ただ、言語(Python、R)だけでは完結しないので、
言語を使用するときもStudioを併用する必要があるらしい。
- ただし、言語を使用しないケースでは、Studioだけで完結できる。
(classic) †
2015年にリリースされたAzure Machine Learning Studioが先行してGUI環境を実現。
- ドラッグ アンド ドロップ機械学習ビルダー
- コード・ファーストが存在しなかった。
- Azure Machine Learningと相互運用できない。
- 2024 年 8 月 31 日に終了
- 2021 年 12 月 1 日以降、新しい リソースは作成できない。
メニュー †
以下のような構成になっている。
機能 †
Automated ML †
(自動機械学習
- 特徴量エンジニアリング
- 手動設定可能
- 補完方法を選択可能
- モデルとモデルを作成するアルゴリズムの選択
- 作成されたモデルの(ハイパーパラメタ)チューニング
- モデルのリーダーボード(ランキング的な)と解釈
Designer †
(GUI機械学習プロセス実行
- マウス操作でパイプライン構築
- パイプライン構築
- 特徴量エンジニアリング
- 学習(回帰、分類、クラスタリング)
- 推論(リアルタイム or バッチ)
- カスタムモデル・スクリプト(Python、R
- サンプル・テンプレートを活用可能
- テンプレートを選択
- パイプラインの構成
- データ選択
- 特徴量選択
- 欠損データ補完
- データ分割(学習:テスト=7:3)
- モデル作成アルゴリズムの選択
- モデルの学習
- モデルの評価
Compute †
(計算環境
- Compute Clusters
- 様々なスペックのVM
- 自動スケールアップ・ダウン
- ジョブ、スケジュール管理
- ライブラリ・データの自動準備
- 低優先度オプション(スポット VM
Datasets †
(データの登録・管理
- データの選択
- アップロード
- ダウンロード
- ストレージから選択
- オープンデータから選択
チュートリアル †
タイタニック生存者予測 †
https://aka.ms/titanic0611
自動車価格の予測 †
デザイナでAutomobile price predictionサンプルを選択
参考 †
Qiita †
- Amazon SageMaker?とAzure MLにおける機械学習モデルのサービング技術比較
YouTube? †
Azure Machine Learning ハンズオンシリーズ †
https://www.youtube.com/playlist?list=PLzmfTuDFwtKEH_W9--AtsD4kwNSPEChPO
microsoft.com †
Microsoft Azure †
Microsoft Docs †
Learn †
機能 †
Tags: :クラウド, :BI/AI, :Azure