Azure Machine Learningチュートリアルのバックアップ(No.11)

場所（リージョン）
- データ・パープライン系は「West US 2」辺りが良いかも。
- リージョン別の Azure 製品 | Microsoft Azure
  https://azure.microsoft.com/ja-jp/global-infrastructure/services/?products=databricks

その他、ストレージ系

ストレージ・アカウント
新規

キー・コンテナー
新規

Application Insight
新規

コンテナ・レジストリ
新規（なしのままでもOK
・osscjpdevinfraacr
・標準

ネットワーク
- ○：パブリック・エンドポイント
- プライベート・エンドポイント

詳細
既定値

[作成]ボタンを押下
ワークスペースの作成には数分かかる。
- 「デプロイが完了しました」が表示されたら、
- [リソースに移動]ボタンを押下する。
- [スタジオの起動]ボタンを押下する。
- Azure Machine Learning Studioに移動する。
- スタジオ起動後、右上の「⚙」メニューから言語の設定が可能。

使用量 + クォータ
- Azure Machine Learningのリソース画面で設定可能
- インスタンス、クラスタ作成の時、適宜、増やす必要がある。

エンドポイントの保護
パブリック・エンドポイントの場合
- IPアドレス制限
- Azure ADの認証が必要

IaC化

PowerShellで

情報なし。

Azure CLIで

v1.0では以下のように作成可能。

>az login
>az account subscription list --output table
>az account set --subscription xxxxx
>az ml workspace create --workspace-name [名称] --resource-group [既存のRG名] --location [場所（リージョン）]

v2.0ではYAMLを使用可能になり
Azure Private Endpointを使用するような
ケースでの対応が容易になる。

参考
・https://github.com/OpenTouryoProject/DataPipeline/blob/develop/AiBi/AI/AzML/README.md

参考

↑

インスタンス †

＜Azure Machine Learning Studioから＞

作成開始の方法
- 左メニューから[コンピューティング]に移動し、
- [コンピューティングインスタンス]タブから[新規]を押下。

値を指定

コンピューティング名
myazmlcompとか

仮想マシンの種類
(CPU)　or GPU

仮想マシンのサイズ
既定値

詳細 > 設定の構成
既定値

[作成]ボタンを押下
コンピューティングインスタンスの作成には数分かかる。

＜スクリプトから＞

Azure CLI
- 割愛
- 参考
  https://github.com/OpenTouryoProject/DataPipeline/blob/develop/AiBi/AI/AzML/README.md

Python

↑

クラスタ †

＜Azure Machine Learning Studioから＞

作成開始の方法
- 左メニューから[コンピューティング]に移動し、
- [コンピューティングクラスタ]タブから[新規]を押下。

値を指定

場所
ワークスペースの場所

バーチャルマシン層
(専用)　or 低優先度

仮想マシンの種類
(CPU)　or GPU

仮想マシンのサイズ
既定値

設定の構成

コンピューティング名
myazmlclstとか

ノード数
・最小：0
・最大：1（クォータによって可変

スケールダウンする前のアイドル時間 (秒)
既定値（120秒

[作成]ボタンを押下
コンピューティングクラスタの作成には数分かかる。

＜スクリプトから＞

Azure CLI
- 割愛
- 参考
  https://github.com/OpenTouryoProject/DataPipeline/blob/develop/AiBi/AI/AzML/README.md

Python

↑

学習と推論 †

↑

Automated ML（自動機械学習で、 †

↑

タイタニック生存者予測 †

https://aka.ms/titanic0611

をデータセットとして使用。

データセット

作成開始の方法
- 左メニューから[データセット]に移動し[データセットの作成]を押下。
- [ローカルファイルから]を選択して、以下の手順でアップロード

値を指定

基本情報・名前：Titanic.csv
・データセットの種類：表形式
・説明：任意の文字列
・[次へ]ボタンを押下

データストアとファイルの選択
・[参照] -> [ファイルの参照]でアップロード
・[次へ]ボタンを押下

設定とプレビュー
・設定とプレビューを確認
・必要に応じて設定を修正
・[次へ]ボタンを押下

スキーマ
・スキーマを確認
・必要に応じてスキーマを修正
　・スキーマの変更
　・列の論理削除
・[次へ]ボタンを押下

詳細の確認
・詳細を確認
・[作成]ボタンを押下

学習と推論

作成開始の方法
- 左メニューから[自動 ML]に移動し[新しい自動 MLの実行]を押下。
- 以下の手順で[新しい自動 MLの実行]を作成。

値を指定

データセットの選択
・データセットを選択
・[次へ]ボタンを押下

実行の構成
・実験名 -> 新規作成 -> 新しい実験名：Titanic-AutoML
・ターゲット列：Survived (Integer)
・コンピューティングの種類を選択：コンピューティングクラスタ
・Azure ML コンピューティング XXXを選択する：myazmlclst
・[次へ]ボタンを押下

タスクと設定の選択
・タスクと設定の選択：(分類)、回帰、時系列の予測
・追加の構成設定を表示する -> 終了条件 -> トレーニングジョブ時間 (時間単位)：0.5
・特徴量化設定の表示 -> 手動での特徴量の設定（除外、型指定、補完方法）

[オプション] 検証とテスト
・変更なし
・[終了]ボタンを押下

実験の実行画面に飛ぶ。

評価とデプロイ
- 左メニューから[実験]に移動し、
- 実験名 - > 実験IDから実験を表示する。

評価
- [詳細]タブ
- [データガードレール]タブ
- [モデル]タブ
- [出力とロク]タブ
- [子の実行]タブ
- [スナップショット]タブ

デプロイ
- [モデル]タブを選択
- モデル（アルゴリズム名）を選択
- [デプロイ]ボタンを押下
- [ダウンロード]ボタンでダウンロードも。

↑

定期預金申込予測 †

https://automlsamplenotebookdata.blob.core.windows.net/automl-sample-notebook-data/bankmarketing_train.csv

をデータセットとして使用。

↑

自転車シェアリング需要予測 †

https://github.com/Azure/azureml-examples/blob/main/python-sdk/tutorials/automl-with-azureml/forecasting-bike-share/bike-no.csv

をデータセットとして使用。

↑

Designer（GUI機械学習で、 †

↑

自動車価格の予測 †

Automobile price predictionサンプルを選択

プロジェクト・テンプレートの選択

作成開始の方法
左メニューから[デザイナー]に移動し[サンプルの表示数を増やす]を押下。

Regression - Automobile Price Prediction (Basic)を選択
（コレはAzure MLのプロジェクト・テンプレートのようなモノか？
グラフ概要：https://github.com/Azure/MachineLearningDesigner/blob/master/articles/samples/regression-automobile-price-prediction-basic.md

データセット

パイプラインの編集
- 学習データを[視覚化（データを表示する）]から確認
- 必要なら、データセットの差し替えが可能。
  （登録済みDatasetsから追加＆差替）

学習と推論

パイプラインの編集
- パイプラインを確認（特徴量選択 -> 欠損値の補完 -> データ分割）
- 学習のアルゴリズムを確認（線形回帰のアルゴリズム）

コンピューティング環境の設定
・「⚙」メニューからコンピューティング環境の設定が可能。
・既定のコンピューティング先
　・コンピューティングの種類を選択：コンピューティングクラスタ
　・Azure ML コンピューティング XXXを選択する：myazmlclst

[送信]ボタンを押下
・実験名 -> 新規作成 -> 新しい実験名：APP-Designer
・[送信]ボタンを押下
・グラフが順次実行されて行く。

評価とデプロイ
- 左メニューから[実験]に移動し、
- 実験名 - > 実験IDから実験を表示する。

評価
- [グラフ]タブ
- [手順]タブ
- [出力とロク]タブ
- [メトリック]タブ
- [画像]タブ
- [スナップショット]タブ
- [説明]タブ
- [公平性]タブ

デプロイ
- [公開]ボタンを押下

↑

Notebooks（コーディング環境で、 †

プロジェクト・テンプレートの準備

作成開始の方法左メニューから[Notebooks]に移動、

[ファイル]タブから[Samples]フォルダを作成
[サンプル]タブからサンプルをクローン
- Pythonのバージョン毎にフォルダが在る。
- srcにルート（x.xx.x）フォルダを選択してクローンする。
- dstに作成した[Samples]フォルダを選択する。

↑

Hello world †

[ファイル]タブのフォルダから[新しいファイルの作成]を選択
- ファイル名：helloworld.ipynb
- ファイルの種類：ノートブック (*.ipynb)
- [作成]ボタンを押下

実装

Jupyter NotebookライクなIDE I/Fが開く。

メニューのエディターから他のIDE I/Fを選択可能。

Jupyter Notebook

JupyterLab

VS Code

以下の実装を行う。
```
print('Hello World')
```

実行
- コンピューティング：myazmlcomp
- セルの左の[実行]ボタンを押下して実行する。

↑

VS Code †

Python for Visual Studio Codeにあるように設定する。
Azure MLからVS Codeを起動するとAzure MLと接続したVS Codeのウィンドウが起動
クローンなどの操作は、ターミナルのウィンドウから行う事もできる。

↑

Python、scikit-learn †

プロジェクト・テンプレートの選択

JupyterからTerminalを開き、以下をクローンし、
https://github.com/yomaki/azure-ml-python-handson

module2に移動して、順次、進めて行く。
- データセット
- 学習

module3に移動して、順次、進めて行く。
- デプロイ
- 推論

↑

構築系 †

↑

VNET †

VNETテクノロジーでセキュリティ保護することができる。
複数のサービスが関連しているため、その構成は少し複雑。

↑

... †

↑

参考 †

Azure Machine LearningのVNETデプロイと
MLFlowによるDatabricksのトラッキング
https://qiita.com/whata/items/f2483e4759e077848de4

Azure Machine Learning の Private Link 対応
https://zenn.dev/keonabut/articles/ad61e4d1da7ceb90862a

仮想ネットワーク (Vnet) 上で Azure Machine Learningを
使用する方法について | Japan Machine Learning Support Blog
https://jpmlblog.github.io/blog/2020/10/28/AML-use-behind-vnet/

↑