データウェアハウス| ナレッジマネジメント

データウェアハウスは、直訳すると「データの倉庫」で、基幹系システムから必要情報を総合的に収集し、時系列に整理された大量の統合業務データ、もしくはその管理システムを指します。

データウェアハウスを使用しないデータ管理は、パソコンでのフォルダ管理をイメージすると理解しやすいでしょう。

データが少ないうちは、全体の情報を把握することは簡単かもしれません。
しかし、データが蓄積されていくと、目的のデータを探すことが大変になり、データが重複していたり、最新版がわからなくなったり、古いデータを削除するという作業があったりと、多くの手間を要するようになったはずです。

データウェアハウスを活用することで、大量のデータの中から条件に該当するものを抽出したり、データの重複を避けて保存したりできるため、「フォルダ管理」で生じる問題を解決できます。
ビッグデータを活用するためには、ビジネス上、必要不可欠なシステムと言えます。

目次

データウェアハウスが満たすべき要件

データウェアハウスには満たすべき4つの要件があります。

サブジェクトごとに整理 : 散在するデータをまとまった1つのデータして扱う
データを結合 : 表現の統一、重複の削除、データの整合性
時系列で整理 : リビジョン管理、現在の状態、変化の流れを把握
データが消えない : データを永続的に保管できる

データウェアハウス製品

主な市販データウェアハウス製品に次のようなものがあります。
このような製品を使わず、自社で、オリジナルのデータウェアハウスソフトを開発している組織もあります。

SAP : SAP NetWeaver Business Warehouse, SAP BW/4HANA, SAP IQ
Oracle : Oracle Database / Oracle Exadata
Teradata :Teradata Database / Teradata Vantage
IBM : Red Brick
Netezza : Netezza TwinFin
NEC : InfoFrame DWH Appliance
マイクロソフト : Microsoft SQL Server
日本HP : HP Neoview Platform

  • URLをコピーしました!
  • URLをコピーしました!
目次