「マイクロソフト系技術情報 Wiki」は、「Open棟梁Project」,「OSSコンソーシアム .NET開発基盤部会」によって運営されています。
目次 †
概要 †
大量データ向けのプロダクトを使用した処理方式についてまとめる予定。
- RDB
- インメモリデータベース
- SSDアプライアンス、インスタンス
- Elastic DB
RDB †
インメモリデータベース †
SSDアプライアンス、インスタンス †
SQL Server 2014 のバッファー プール拡張のようなテンポラリの領域として如何に使用する。
SQL Server SSD Appliance †
SSD 付きインスタンス D シリーズ †
Elastic DB †
- RDBには、トランザクション処理の信頼性を保証するために求められる性質(ACID)を実装するためスケールアウトが困難。
- Elastic DBは以下を組み合わせた機能。
- 複数DBインスタンスのプールを管理する機能
- 分割キーにより複数DBインスタンスへの水平分散
- 分散トランザクション
参考 †
not RDB †
DWH †
重視するもの †
- 構造化データ
- 非ビッグデータ
- バッチ処理(分析集計)
プロダクト †
重視するもの †
重視するもの †
クエリ †
プロダクト毎に様々なクエリがある。
- 元来、SQLはRDB向けのクエリを意味する。
- 昨今、RDBではないNoSQLのクエリにもSQLと言う文言が利用されている。
SQL †
最も代表的で標準化されているRDB向けのクエリ。
Spark SQL †
Spark向けのクエリ。
HiveQL †
Apache Hiveのクエリ。
PolyBase? †
SQL ServerのNoSQLのクエリ。
SQL-H †
Teradata の SQL-H
Apache †
Drill †
Sqoop †
Cloudera Impala †
Tags: :データアクセス