データベース管理システム(DBMS)

データベース管理システム(DBMS: Database Management System)とは、データベースの維持・管理を行うソフトウェアのことである。複数のユーザが同時にデータを更新・検索しても、一貫して効率よく処理できるように管理する。

関係モデル(リレーショナルモデル)に基づいたデータベース管理システムをリレーショナルデータベース管理システム(RDBMS: Relational Database Management System)という。

代表的なデータベース管理システム(DBMS)の一覧
DBMS 説明
Apache Cassandra 分散Key-Value Store型のデータベース管理システム
Apache Derby Apacheソフトウェア財団が開発しているJavaで実装されたRDBMS
H2 Database オープンソースのRDBMS
Microsoft SQL Server マイクロソフトが開発・販売しているRDBMS
MySQL オラクルが開発しているオープンソースのRDBMS
Oracle Database オラクルが開発・販売しているRDBMS
SAP HANA SAPが開発・販売するインメモリーデータベース
PostgreSQL オープンソースのオブジェクト関係データベース管理システム(ORDBMS)

トランザクション処理

ロールバックとは、トランザクション開始直前の状態にまでデータを復旧させることである。データの復旧には更新前ジャーナルを用いる。

ロールフォワードとは、ディスク装置の障害などで破壊されたデータベースを障害発生の直前に復元することである。復元には更新後ジャーナルを用いる。

データベース応用

クレンジングとは、同じ意味を持つ言葉をまとめたり、不要なデータを削除して統合することである。

スライスとは、ある視点から情報を切り取って見ることである(薄切りの意から)。

ダイスとは、データをさまざまな視点から集計および分析することである(サイコロ切りの意から)。

スライス&ダイスとは、ある時点のデータを切り出し、いろいろと視点を変えながら分析を行うことである。

ETL

ETL (Extract, transform, load)とは、データソースのシステムからデータを抽出及び変換して、データウェアハウスにロードする処理のことである。変換はETLツールで行う。

ELT

ビッグデータの場合、データを変換してからロードするETLが適切でないことがある。この場合、データを抽出及びロードしてから変換するELT (Extract, load, transform)が採用される。変換はデータベースで行う。