マイクロソフト系技術情報 Wiki」は、「Open棟梁Project」,「OSSコンソーシアム .NET開発基盤部会」によって運営されています。

目次

概要

などが使用できる模様。

.NET for Apache Spark

準備

契約

環境

Get started in 10 minutes

アプリの発行

依存関係のダウンロード

※ URL : https://github.com/dotnet/spark/tree/master/deployment

※ *.shの行の終わりは Unix 形式 (LF) であることを確認

ファイルのアップロード

次のファイルをアップロードする

ジョブを作成して実行

※ コレにより、db-init.sh 内で install-worker.sh が構成される($1-3をパラメタライズ)。

参考

上記と同様に行ってみる例

ワークスペースをクリーンナップするか新規作成する必要があるので、
1つのバッチにまとめて、コマンドライン引数で切り替えるのが良いかも。

バッチ処理

構造化ストリーミング

ML.NETでの感情分析

Scala

Notebookのセルに記述可能。

Event Hubsと組み合わせるチュートリアル

参考中の「Event Hubs を使用して...ストリーム配信する」

感情分析のチュートリアル

参考中の「Azure Databricks を使用したストリーミング データに対する感情分析」

Python (PySpark?)

Notebookのセルに記述可能。

Azure Databricksを使ってみた

参考中の「Azure Databricksを使ってみた」
...ちと古いし、他にも色々アレなので、パス。

SQL Serverと組み合わせるチュートリアル

参考中の「...ノートブックから...SQL Server Linux Docker コンテナーのクエリを実行する」

ETL のチュートリアル

参考中の「...データの抽出、変換、読み込みを行う」

Azure Data Lake のチュートリアル

参考中の「チュートリアル:Azure Data Lake Storage Gen2、Azure Databricks、および Spark」をトレースする。

Azure Data Lake Storage Gen2 アカウントの作成

AzCopy? v10 をインストール

ストレージ BLOB データ共同作成者ロールの割当

フライト データのダウンロード

...ダウンロードできない。

Azure Databricksサービスの作成

Java

可能らしいがサンプルが無いのは、Scalaでやるから?

参考

microsoft.com

databricks.com


Tags: :クラウド, :ビッグデータ, :Azure


トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS