「マイクロソフト系技術情報 Wiki」は、「Open棟梁Project」,「OSSコンソーシアム .NET開発基盤部会」によって運営されています。
目次 †
概要 †
- RDB
- インメモリデータベース
- SSDアプライアンス、インスタンス
- Elastic DB
等を組み合わせた大量データの処理方式についてまとめる予定です。
RDB †
インメモリデータベース †
SSDアプライアンス、インスタンス †
SQL Server 2014 のバッファー プール拡張のようなテンポラリの領域として如何に使用する。
SQL Server SSD Appliance †
SSD 付きインスタンス D シリーズ †
Elastic DB †
- RDBには、トランザクション処理の信頼性を保証するために求められる性質(ACID)を実装するためスケールアウトが困難。
- Elastic DBは以下を組み合わせた機能。
- 複数DBインスタンスのプールを管理する機能
- 分割キーにより複数DBインスタンスへの水平分散
- 分散トランザクション
非RDB †
DWH †
重視するもの †
- 構造化データ
- 非ビッグデータ
- バッチ処理(分析集計)
Hadoop †
重視するもの †
- 非構造化データ
- ビッグデータ
- バッチ処理(分析集計)
- ペタバイト級のデータを数十台で並列分散する。
- 事前にファイルを分散ファイルシステムHadoop HDFSに格納する
- データに対して関数(map関数とreduce関数)を渡して、分散計算する
Hadoop HDFS †
map関数とreduce関数 †
重視するもの †
Tags: :データアクセス