「マイクロソフト系技術情報 Wiki」は、「Open棟梁Project」,「OSSコンソーシアム .NET開発基盤部会」によって運営されています。
目次 †
概要 †
Azure Machine Learning(AzML)のチュートリアル。
準備 †
契約 †
AzMLの契約 †
Azure Databricksと異なり、無料アカウントが利用できるらしい。
環境 †
- ポータルで [リソースの作成] > [AI + Machine Learning] > [Machine Learning] の順に選択
- コンテナ・レジストリ
新規(なしのままでもOK
・osscjpdevinfraacr
・標準
- ネットワーク
- ○:パブリック・エンドポイント
- プライベート・エンドポイント
- [作成]ボタンを押下
ワークスペースの作成には数分かかる。
- 「デプロイが完了しました」が表示されたら、
- [リソースに移動]ボタンを押下する。
- [スタジオの起動]ボタンを押下する。
- Azure Machine Learning Studioに移動する。
- スタジオ起動後、右上の「⚙」メニューから言語の設定が可能。
- 使用量 + クォータ
- Azure Machine Learningのリソース画面で設定可能
- インスタンス、クラスタ作成の時、適宜、増やす必要がある。
- エンドポイントの保護
パブリック・エンドポイントの場合
インスタンス †
<Azure Machine Learning Studioから>
- 作成開始の方法
- 左メニューから[コンピューティング]に移動し、
- [コンピューティング インスタンス]タブから[新規]を押下。
- [作成]ボタンを押下
コンピューティング インスタンスの作成には数分かかる。
<スクリプトから>
クラスタ †
<Azure Machine Learning Studioから>
- 作成開始の方法
- 左メニューから[コンピューティング]に移動し、
- [コンピューティング クラスタ]タブから[新規]を押下。
- ノード数
・最小:0
・最大:1(クォータによって可変
- スケール ダウンする前のアイドル時間 (秒)
既定値(120秒
- [作成]ボタンを押下
コンピューティング クラスタの作成には数分かかる。
<スクリプトから>
学習と推論 †
タイタニック生存者予測 †
https://aka.ms/titanic0611
をデータセットとして使用。
- 作成開始の方法
- 左メニューから[データセット]に移動し[データセットの作成]を押下。
- [ローカル ファイルから]を選択して、以下の手順でアップロード
- 基本情報
・名前:Titanic.csv
・データセットの種類:表形式
・説明:任意の文字列
・[次へ]ボタンを押下
- データストアとファイルの選択
・[参照] -> [ファイルの参照]でアップロード
・[次へ]ボタンを押下
- 設定とプレビュー
・設定とプレビューを確認
・必要に応じて設定を修正
・[次へ]ボタンを押下
- スキーマ
・スキーマを確認
・必要に応じてスキーマを修正
・スキーマの変更
・列の論理削除
・[次へ]ボタンを押下
- 作成開始の方法
- 左メニューから[自動 ML]に移動し[新しい自動 MLの実行]を押下。
- 以下の手順で[新しい自動 MLの実行]を作成。
- データセットの選択
・データセットを選択
・[次へ]ボタンを押下
- 実行の構成
・実験名 -> 新規作成 -> 新しい実験名:Titanic-AutoML
・ターゲット列:Survived (Integer)
・コンピューティングの種類を選択:コンピューティング クラスタ
・Azure ML コンピューティング XXXを選択する:myazmlclst
・[次へ]ボタンを押下
- タスクと設定の選択
・タスクと設定の選択:(分類)、回帰、時系列の予測
・追加の構成設定を表示する -> 終了条件 -> トレーニング ジョブ時間 (時間単位):0.5
・特徴量化設定の表示 -> 手動での特徴量の設定(除外、型指定、補完方法)
- [オプション] 検証とテスト
・変更なし
・[終了]ボタンを押下
- 評価とデプロイ
- 左メニューから[実験]に移動し、
- 実験名 - > 実験IDから実験を表示する。
- 評価
- [詳細]タブ
- [データ ガードレール]タブ
- [モデル]タブ
- [出力とロク]タブ
- [子の実行]タブ
- [スナップショット]タブ
- デプロイ
- [モデル]タブを選択
- モデル(アルゴリズム名)を選択
- [デプロイ]ボタンを押下
- [ダウンロード]ボタンでダウンロードも。
定期預金申込予測 †
https://automlsamplenotebookdata.blob.core.windows.net/automl-sample-notebook-data/bankmarketing_train.csv
をデータセットとして使用。
自転車シェアリング需要予測 †
https://github.com/Azure/azureml-examples/blob/main/python-sdk/tutorials/automl-with-azureml/forecasting-bike-share/bike-no.csv
をデータセットとして使用。
自動車価格の予測 †
Automobile price predictionサンプルを選択
- 作成開始の方法
左メニューから[デザイナー]に移動し[サンプルの表示数を増やす]を押下。
- パイプラインの編集
- 学習データを[視覚化(データを表示する)]から確認
- 必要なら、データセットの差し替えが可能。
(登録済みDatasetsから追加&差替)
- パイプラインの編集
- パイプラインを確認(特徴量選択 -> 欠損値の補完 -> データ分割)
- 学習のアルゴリズムを確認(線形回帰のアルゴリズム)
- コンピューティング環境の設定
・「⚙」メニューからコンピューティング環境の設定が可能。
・既定のコンピューティング先
・コンピューティングの種類を選択:コンピューティング クラスタ
・Azure ML コンピューティング XXXを選択する:myazmlclst
- [送信]ボタンを押下
・実験名 -> 新規作成 -> 新しい実験名:APP-Designer
・[送信]ボタンを押下
・グラフが順次実行されて行く。
- 評価とデプロイ
- 左メニューから[実験]に移動し、
- 実験名 - > 実験IDから実験を表示する。
- 評価
- [グラフ]タブ
- [手順]タブ
- [出力とロク]タブ
- [メトリック]タブ
- [画像]タブ
- [スナップショット]タブ
- [説明]タブ
- [公平性]タブ
- 作成開始の方法
左メニューから[Notebooks]に移動、
- [ファイル]タブから[Samples]フォルダを作成
- [サンプル]タブからサンプルをクローン
- Pythonのバージョン毎にフォルダが在る。
- srcにルート(x.xx.x)フォルダを選択してクローンする。
- dstに作成した[Samples]フォルダを選択する。
Hello world †
- [ファイル]タブのフォルダから[新しいファイルの作成]を選択
- ファイル名:helloworld.ipynb
- ファイルの種類:ノートブック (*.ipynb)
- [作成]ボタンを押下
- メニューのエディターから他のIDE I/Fを選択可能。
- 以下の実装を行う。
print('Hello World')
VS Code †
Python、scikit-learn †
構築系 †
権限 †
カスタム ロールを割り当てる。
... †
参考 †
VNET †
- VNETテクノロジーでセキュリティ保護することができる。
- 複数のサービスが関連しているため、その構成は少し複雑。
... †
参考 †
参考 †
Qiita †
AutoML †
Designer †
Notebooks †
デプロイ †
YouTube? †
(AutoML & Designer 概要)
Azure Machine Learning ハンズオンシリーズ †
https://www.youtube.com/playlist?list=PLzmfTuDFwtKEH_W9--AtsD4kwNSPEChPO
- Module
- #1 Visual Studio Code 入門
- #2 Python と scikit-learn でのモデル学習とチューニング
- #3 様々な環境へのデプロイ
- 画像分類
動画なし
- Module#1 画像分類の考え方
- Module#2 PyTorch?による画像の取扱い
- Module#3 Azure ML によるモデルトレーニングとデプロイ
- スライドなし
Microsoft Docs †
クイックスタート †
ワークスペースの作成と管理 †
チュートリアル †
ハンズオン †
mslearn-dp100 †
リポジトリ †
Tags: :クラウド, :BI/AI, :Azure