「マイクロソフト系技術情報 Wiki」は、「Open棟梁Project」,「OSSコンソーシアム .NET開発基盤部会」によって運営されています。
.NET で Spark の実装ができる for Apache Spark。
Sparkの仕様なので、Azure HDInsight・Azure Databricksの差異はない。
ローカル・ファイルを読むこともできる。
マウントされたストレージに直接アップロードしてソレを読む。
Databricks CLIを使用してアップロードしてソレを読む。
下記に対するURLを使用することも出来る。
.Format("socket")
コチラが参考になる。
string BOOTSTRAP_SERVERS = "hostname:9093"; // 9093 is the port used to communicate with Event Hubs, see [troubleshooting guide](https://docs.microsoft.com/azure/event-hubs/troubleshooting-guide) string EH_SASL = "org.apache.kafka.common.security.plain.PlainLoginModule required username=\"$ConnectionString\" password=\"<CONNECTION_STRING>\";"; // Connection string obtained from Step 1
SparkSession spark = SparkSession .Builder() .AppName("Connect Event Hub") .GetOrCreate(); DataFrame df = spark .ReadStream() .Format("kafka") .Option("kafka.bootstrap.servers", BOOTSTRAP_SERVERS) .Option("subscribe", "spark-test") .Option("kafka.sasl.mechanism", "PLAIN") .Option("kafka.security.protocol", "SASL_SSL") .Option("kafka.sasl.jaas.config", EH_SASL) .Option("kafka.request.timeout.ms", "60000") .Option("kafka.session.timeout.ms", "60000") .Option("failOnDataLoss", "false") .Load(); DataFrame dfWrite = df .WriteStream() .OutputMode("append") .Format("console") .Start();
df.WriteStream() .Format("kafka") .Option("topic", topics) .Option("kafka.bootstrap.servers", BOOTSTRAP_SERVERS) .Option("kafka.sasl.mechanism", "PLAIN") .Option("kafka.security.protocol", "SASL_SSL") .Option("kafka.sasl.jaas.config", EH_SASL) .Option("checkpointLocation", "./checkpoint") .Start();
// Create initial DataFrame string BOOTSTRAP_SERVERS = "xxxx.servicebus.windows.net:9093"; string CONNECTION_STRING = "Endpoint=sb://xxxx.servicebus.windows.net/;SharedAccessKeyName=RootManageSharedAccessKey;SharedAccessKey=xxxx"; string EH_SASL = $"org.apache.kafka.common.security.plain.PlainLoginModule required username=\"$ConnectionString\" password=\"{CONNECTION_STRING}\";"; DataFrame lines = spark .ReadStream() .Format("kafka") .Option("subscribe", "test") .Option("kafka.bootstrap.servers", BOOTSTRAP_SERVERS) .Option("kafka.sasl.mechanism", "PLAIN") .Option("kafka.security.protocol", "SASL_SSL") .Option("kafka.sasl.jaas.config", EH_SASL) .Option("kafka.request.timeout.ms", "60000") .Option("kafka.session.timeout.ms", "60000") .Option("kafka.group.id", "$Default") .Option("failOnDataLoss", "false") .Load();
>spark-submit ^ --class org.apache.spark.deploy.dotnet.DotnetRunner ^ --master local ^ microsoft-spark-3-0_2.12-2.0.0.jar ^ dotnet mySparkStreamingApp.dll※ エラー発生中(調査中
サーバーにはならない
Tags: :クラウド, :Azure, :.NET開発, :.NET Core, :.NET Standard