データベース管理システム(DBMS: Database Management System)とは、データベースの維持・管理を行うソフトウェアのことである。複数のユーザが同時にデータを更新・検索しても、一貫して効率よく処理できるように管理する。
関係モデル(リレーショナルモデル)に基づいたデータベース管理システムをリレーショナルデータベース管理システム(RDBMS: Relational Database Management System)という。
DBMS | 説明 |
---|---|
Apache Cassandra | 分散Key-Value Store型のデータベース管理システム |
Apache Derby | Apacheソフトウェア財団が開発しているJavaで実装されたRDBMS |
H2 Database | オープンソースのRDBMS |
Microsoft SQL Server | マイクロソフトが開発・販売しているRDBMS |
MySQL | オラクルが開発しているオープンソースのRDBMS |
Oracle Database | オラクルが開発・販売しているRDBMS |
SAP HANA | SAPが開発・販売するインメモリーデータベース |
PostgreSQL | オープンソースのオブジェクト関係データベース管理システム(ORDBMS) |
ロールバックとは、トランザクション開始直前の状態にまでデータを復旧させることである。データの復旧には更新前ジャーナルを用いる。
ロールフォワードとは、ディスク装置の障害などで破壊されたデータベースを障害発生の直前に復元することである。復元には更新後ジャーナルを用いる。
クレンジングとは、同じ意味を持つ言葉をまとめたり、不要なデータを削除して統合することである。
スライスとは、ある視点から情報を切り取って見ることである(薄切りの意から)。
ダイスとは、データをさまざまな視点から集計および分析することである(サイコロ切りの意から)。
スライス&ダイスとは、ある時点のデータを切り出し、いろいろと視点を変えながら分析を行うことである。
ETL (Extract, transform, load)とは、データソースのシステムからデータを抽出及び変換して、データウェアハウスにロードする処理のことである。変換はETLツールで行う。
ビッグデータの場合、データを変換してからロードするETLが適切でないことがある。この場合、データを抽出及びロードしてから変換するELT (Extract, load, transform)が採用される。変換はデータベースで行う。