「マイクロソフト系技術情報 Wiki」は、「Open棟梁Project」,「OSSコンソーシアム .NET開発基盤部会」によって運営されています。
※ 今後、メイン・ストリームは、Azure Databricksに移って行く。
取り敢えず、.NET for Apache Spark ガイドのコンテンツをやってみる。
(Get started in 10 minutes)
※ 無料試用版サブスクリプションで利用可能との事。
>dotnet publish -c Release -f netcoreapp3.1 -r ubuntu.16.04-x64
次のファイルをダウンロードする。
※ *.shの行の終わりは Unix 形式 (LF) であることを確認
※ https://github.com/dotnet/spark/tree/master/deployment
次のファイルをアップロードする(Azure Storage Explorer)。
クラスタで install-worker.sh スクリプトを実行($1-3をパラメタライズ)
※ install-worker.sh は、.NET for Apache Spark 依存ファイルをクラスタのノードにコピーする。
$SPARK_HOME/bin/spark-submit \ --master yarn \ --class org.apache.spark.deploy.dotnet.DotnetRunner \ wasbs://<container_name>@<storage_account_name>.blob.core.windows.net/microsoft-spark-2-4_2.11-1.0.0.jar \ wasbs://<container_name>@<storage_account_name>.blob.core.windows.net/publish.zip mySparkApp※ wasbs://~は、
リソース グループを削除する。
≒ Azure Databricksのクラスタの作成中のdb-init.sh 設定+アプリの実行
https://docs.microsoft.com/ja-jp/azure/hdinsight/
...