「マイクロソフト系技術情報 Wiki」は、「Open棟梁Project」,「OSSコンソーシアム .NET開発基盤部会」によって運営されています。
目次 †
概要 †
- Hadoop テクノロジ スタックを使用した
エンタープライズ向けデータ分析マネージド・サービス
- Hadoop テクノロジ スタック
- Hadoop
- Apache Spark
- Apache Hive
- LLAP
- Apache Kafka
- Apache Storm
- R
詳細 †
取り敢えず、.NET for Apache Spark ガイドのコンテンツをやってみる。
(Get started in 10 minutes)
※ 無料試用版サブスクリプションで利用可能との事。
ストレージ アカウントにアクセスする †
- Azure Storage Explorerを使用する。
- 後述の「クラスタの作成」で必要になるため(≒前提)。
アプリの発行 †
- ターゲットはubuntu
- publishしたものをpublish.zipにまとめる。
ワーカーの依存関係のダウンロード †
次のファイルをダウンロードする。
- Microsoft.Spark.Worker
- install-worker.sh
※ *.shの行の終わりは Unix 形式 (LF) であることを確認
※ https://github.com/dotnet/spark/tree/master/deployment
ファイルのアップロード †
次のファイルをアップロードする。
- 発行したアプリ
- publish.zip
input.txt
- microsoft-spark-2-4_2.11-1.0.0.jar(ローカル実行で使用したもの)
- 依存関係
- Microsoft.Spark.Worker
- install-worker.sh
クラスタの作成 †
- HDInsight Spark クラスタを作成
- Linux(ubuntu)ベース
- クラスタの作成には約 20 分かかる。
スクリプト アクションを実行 †
クラスタで install-worker.sh スクリプトを実行($1-3をパラメタライズ)
※ install-worker.sh は、.NET for Apache Spark 依存ファイルをクラスタのノードにコピーする。
アプリの実行 †
- マウントされたストレージにinput.txtをアップロード
(エラーログを確認して、/user/sshuser/input.txtにアップロードとか...)
リソースのクリーンアップ †
リソース グループを削除する。
スクリプト アクション実行
≒ クラスタの作成中のdb-init.sh 設定+アプリの実行
参考 †
gihyo.jp … 技術評論社 †
クリエーションライン株式会社 †
- HadoopをMicrosoft Azure上で動かしてみる!
Microsoft Azurez †
Microsoft Docs †
Azure HDInsight †
https://docs.microsoft.com/ja-jp/azure/hdinsight/
- その他
- Runbook を使用してクラスターを作成する
- Apache Ambari のメール通知
- ETL パイプラインの作成
- サンプル
- Azure CLI のサンプル
- .NET のサンプル
- Java のサンプル
- Python のサンプル
- Azure サンプル ブラウザ
.NET、C# †
...
- チュートリアル
- .NET for Apache Spark アプリケーションをデプロイする
- Channel 9 > .NET for Apache Spark 101
Deploy .NET for Apache Spark App to
開発基盤部会 Wiki †
Tags: :クラウド, :Azure