マイクロソフト系技術情報 Wiki」は、「Open棟梁Project」,「OSSコンソーシアム .NET開発基盤部会」によって運営されています。

目次

概要

.NET for Apache Spark

準備

契約

環境

Get started in 10 minutes

アプリの発行

依存関係のダウンロード

※ URL : https://github.com/dotnet/spark/tree/master/deployment

※ *.shの行の終わりは Unix 形式 (LF) であることを確認

ファイルのアップロード

次のファイルをアップロードする

ジョブを作成して実行

※ コレにより、db-init.sh 内で install-worker.sh が構成される($1-3をパラメタライズ)。

参考

上記と同様に行ってみる例

ワークスペースをクリーンナップするか新規作成する必要があるので、
1つのバッチにまとめて、コマンドライン引数で切り替えるのが良いかも。

バッチ処理

構造化ストリーミング

ML.NETでの感情分析

Python (PySpark?)

Azure Databricksを使ってみた

参考中の「Azure Databricksを使ってみた」
...ちと古いし、他にも色々アレなので、パス。

Azure Databricks のチュートリアル

https://docs.microsoft.com/ja-jp/azure/databricks/tutorials/...

Azure Data Lake のチュートリアル

参考中の「チュートリアル:Azure Data Lake Storage Gen2、Azure Databricks、および Spark」をトレースする。

Azure Data Lake Storage Gen2 アカウントの作成

AzCopy? v10 をインストール

ストレージ BLOB データ共同作成者ロールの割当

フライト データのダウンロード

...ダウンロードできない。

Azure Databricksサービスの作成

参考

Microsoft Docs


Tags: :クラウド, :ビッグデータ, :Azure


トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS