「マイクロソフト系技術情報 Wiki」は、「Open棟梁Project」,「OSSコンソーシアム .NET開発基盤部会」によって運営されています。
.NET で Spark の実装ができる for Apache Spark。
Sparkの仕様なので、Azure HDInsight・Azure Databricksの差異はない。
ローカル・ファイルを読むこともできる。
マウントされたストレージに直接アップロードしてソレを読む。
Databricks CLIを使用してアップロードしてソレを読む。
下記に対するURLを使用することも出来る。
.Format("socket")
コチラが参考になる。
string BOOTSTRAP_SERVERS = "hostname:9093"; // 9093 is the port used to communicate with Event Hubs, see [troubleshooting guide](https://docs.microsoft.com/azure/event-hubs/troubleshooting-guide) string EH_SASL = "org.apache.kafka.common.security.plain.PlainLoginModule required username=\"$ConnectionString\" password=\"<CONNECTION_STRING>\";"; // Connection string obtained from Step 1
SparkSession spark = SparkSession
.Builder()
.AppName("Connect Event Hub")
.GetOrCreate();
DataFrame df = spark
.ReadStream()
.Format("kafka")
.Option("kafka.bootstrap.servers", BOOTSTRAP_SERVERS)
.Option("subscribe", "spark-test")
.Option("kafka.sasl.mechanism", "PLAIN")
.Option("kafka.security.protocol", "SASL_SSL")
.Option("kafka.sasl.jaas.config", EH_SASL)
.Option("kafka.request.timeout.ms", "60000")
.Option("kafka.session.timeout.ms", "60000")
.Option("failOnDataLoss", "false")
.Load();
DataFrame dfWrite = df
.WriteStream()
.OutputMode("append")
.Format("console")
.Start();df.WriteStream()
.Format("kafka")
.Option("topic", topics)
.Option("kafka.bootstrap.servers", BOOTSTRAP_SERVERS)
.Option("kafka.sasl.mechanism", "PLAIN")
.Option("kafka.security.protocol", "SASL_SSL")
.Option("kafka.sasl.jaas.config", EH_SASL)
.Option("checkpointLocation", "./checkpoint")
.Start();// Create initial DataFrame
string BOOTSTRAP_SERVERS = "xxxx.servicebus.windows.net:9093";
string CONNECTION_STRING = "Endpoint=sb://xxxx.servicebus.windows.net/;SharedAccessKeyName=RootManageSharedAccessKey;SharedAccessKey=xxxx";
string EH_SASL = $"org.apache.kafka.common.security.plain.PlainLoginModule required username=\"$ConnectionString\" password=\"{CONNECTION_STRING}\";";
DataFrame lines = spark
.ReadStream()
.Format("kafka")
.Option("subscribe", "test")
.Option("kafka.bootstrap.servers", BOOTSTRAP_SERVERS)
.Option("kafka.sasl.mechanism", "PLAIN")
.Option("kafka.security.protocol", "SASL_SSL")
.Option("kafka.sasl.jaas.config", EH_SASL)
.Option("kafka.request.timeout.ms", "60000")
.Option("kafka.session.timeout.ms", "60000")
.Option("kafka.group.id", "$Default")
.Option("failOnDataLoss", "false")
.Load();>spark-submit ^ --class org.apache.spark.deploy.dotnet.DotnetRunner ^ --master local ^ microsoft-spark-3-0_2.12-2.0.0.jar ^ dotnet mySparkStreamingApp.dll※ エラー発生中(調査中
サーバーにはならない
Tags: :クラウド, :Azure, :.NET開発, :.NET Core, :.NET Standard