「マイクロソフト系技術情報 Wiki」は、「Open棟梁Project」,「OSSコンソーシアム .NET開発基盤部会」によって運営されています。
目次  †
概要  †
- Hadoop テクノロジ スタックを使用した
エンタープライズ向けデータ分析マネージド・サービス 
- Hadoop テクノロジ スタック
- Hadoop
 
- Apache Spark
 
- Apache Hive
 
- LLAP
 
- Apache Kafka
 
- Apache Storm
 
- R
 
 
詳細  †
取り敢えず、.NET for Apache Spark ガイドのコンテンツをやってみる。
(Get started in 10 minutes)
※ 無料試用版サブスクリプションで利用可能との事。
ストレージ アカウントにアクセスする  †
- Azure Storage Explorerを使用する。
 
- 後述の「クラスタの作成」で必要になるため(≒前提)。
 
アプリの発行  †
- ターゲットはubuntu
 
- publishしたものをpublish.zipにまとめる。
 
ワーカーの依存関係のダウンロード  †
次のファイルをダウンロードする。
- Microsoft.Spark.Worker
 
- install-worker.sh
 
※ *.shの行の終わりは Unix 形式 (LF) であることを確認
※ https://github.com/dotnet/spark/tree/master/deployment
ファイルのアップロード  †
次のファイルをアップロードする。
- 発行したアプリ
- publish.zip
 
input.txt 
- microsoft-spark-2-4_2.11-1.0.0.jar(ローカル実行で使用したもの)
 
 
- 依存関係
- Microsoft.Spark.Worker
 
- install-worker.sh
 
 
クラスタの作成  †
- HDInsight Spark クラスタを作成
 
- Linux(ubuntu)ベース
 
- クラスタの作成には約 20 分かかる。
 
スクリプト アクションを実行  †
クラスタで install-worker.sh スクリプトを実行($1-3をパラメタライズ)
※ install-worker.sh は、.NET for Apache Spark 依存ファイルをクラスタのノードにコピーする。
アプリの実行  †
- マウントされたストレージにinput.txtをアップロード
(エラーログを確認して、/user/sshuser/input.txtにアップロードとか...) 
リソースのクリーンアップ  †
リソース グループを削除する。
スクリプト アクション実行
≒ クラスタの作成中のdb-init.sh 設定+アプリの実行
参考  †
gihyo.jp … 技術評論社  †
クリエーションライン株式会社  †
- HadoopをMicrosoft Azure上で動かしてみる!
 
Microsoft Azurez  †
Microsoft Docs  †
Azure HDInsight  †
https://docs.microsoft.com/ja-jp/azure/hdinsight/
- その他
- Runbook を使用してクラスターを作成する
 
- Apache Ambari のメール通知
 
- ETL パイプラインの作成
 
 
- サンプル
- Azure CLI のサンプル
 
- .NET のサンプル
 
- Java のサンプル
 
- Python のサンプル
 
- Azure サンプル ブラウザ
 
 
.NET、C#  †
...
- チュートリアル
- .NET for Apache Spark アプリケーションをデプロイする
 
 
- Channel 9 > .NET for Apache Spark 101
Deploy .NET for Apache Spark App to
 
開発基盤部会 Wiki  †
Tags: :クラウド, :Azure