ページの本文へ

Hitachi

日立ソリューションズ東日本

IBM Knowledge Catalogの機能

データカタログにおける様々なタスク

データカタログにおける様々なタスクのイメージ

(1) データガバナンス

ビジネス用語によるデータの管理と
コミュニケーション

企業/組織で利用するビジネス用語(業務用語名、説明、カテゴリーなど)を定義することができます。
ビジネスコンテキストを提供し、技術的なメタデータに関連付けることで、ユーザーが企業データとその使用方法をより理解できるようになります。

企業データの管理/保護/利用に関する
ポリシーとルールを一元的に管理

文書化されたポリシーやルールをカタログ内で管理でき、企業でのデータ活用において守るべきことを明示・共有できます。
サブポリシーやポリシーとルールの関連性、変更履歴や担当者(スチュワード)を確認することができます。

安全なデータ確認(データの保護)

データ保護ルールを定義しカタログに適用することで、指定した条件に合致するデータアセットへのアクセス不可、特定列のデータマスキング、特定行のフィルタリングを行うことができます。
安全にデータの情報をユーザーに提供することが可能になります。

データの検出と把握

データの列名や中身を分析し、どういったデータが入っているかを検出し、データクラスと呼ばれるデータの定義を実施します。
例えば、機密データやPIIデータなどのデータコンテンツを検出します。

(2) データ取込/整理

様々なデータ・キュレーション ツールの
提供

IBM Knowledge Catalogでは、様々なデータ取り込み/整理ニーズに対応できるツールを提供しています。
これらのツールは、プロジェクトという共通のワークスペースから利用可能になっており、円滑で効率的な作業が可能です。

データの情報をカタログに取込み
(メタデータ・インポート)

対象のデータ接続と範囲を指定するだけで、データの情報(メタデータ)をカタログに取り込むことができます。
簡単な操作でデータカタログの作成に着手できます。メタデータの再インポートやスケジュール実行設定の機能も提供しています。

データの理解とメタデータの付与
(メタデータ・エンリッチメント)

データをプロファイルし、データ品質スコアの算出、データの分類、ビジネス用語の自動マッピングを行うツール(メタデータ・エンリッチメント) を提供します。事前にデータを確認し、さらにデータとビジネス用語をマッピングしてカタログ登録することで、有用なデータが見つけやすくなります。

プロファイリングによるデータの特徴や
品質の確認

メタデータインポートなどによってデータ資産のプロファイルが行われると、詳細情報をドリルダウンすることができます。
列データに関する統計情報、データクラス、データタイプ、フォーマットに関する情報、列の値の度数分布などをグラフィカルに表示し、データの特徴や品質を直感的に理解することができます。

データリネージュの確認

※本機能はオンプレミス版のみの提供です

データやETLジョブ等の変換処理の情報を取り込むことで、データの流れを見える化することができます。データがどこで生成され、何と関連があり、どのような処理が行われたか(来歴分析)を把握することで、情報の信頼性を担保でき、また、データがどこで利用されているか(影響分析)を把握することで、列の変更などによる影響範囲の特定を行えるようになります。

(3) データの探索/利用

データプラットフォーム全体の検索

カタログ、ビジネス用語/ポリシー/ルールなどのガバナンス成果物、プロジェクトを対象としたプラットフォーム全体の検索機能(グローバル・サーチ)を提供します。便利なフィルター機能も提供し、データ資産だけでなく、関連する用語や利用されているプロジェクトなど、プラットフォーム全体から欲しい情報を見つけることができます。

カタログ - 分析目的にあうデータかを
クイックに検索・理解

カタログを使用して、データ資産、分析資産などの情報をユーザー向けに整理することができます。カタログに登録されたメタデータやデータのプリビュー/プロファイルを確認することで、ユーザーは分析の目的にあったデータかを迅速に知ることができます。

分析目的にあうデータかを
クイックに理解 - 概要タブ

カタログではデータ資産から取得された/登録された様々な情報を確認することが出来ます。概要タブでは、列情報、マッピングされたビジネス用語などのガバナンス資産を確認できます。また、企業固有の情報を登録したい場合などは、カスタム・プロパティーを追加することも可能です。

分析目的にあうデータかを
クイックに理解 - 資産

カタログではデータ資産の様々な情報を確認することが出来ます。
資産タブでは、データをプレビューすることができます。データ保護ルールが適用されたデータアセットは、アクセス拒否/マスキングされ、安全にユーザーに提供することができます。

分析目的にあうデータかを
クイックに理解 - プロファイル

カタログではデータ資産の様々な情報を確認することが出来ます。
プロファイルタブでは、データの出現頻度や最小値/最大値などの統計情報を視覚的に確認できます。例えば、値がほとんど入力されていない列を見つけ、作業対象から排除するといった判断が容易にできるようになります。

分析目的にあうデータかを
クイックに理解 - リネージュ

※本機能はオンプレミス版のみの提供です

カタログではデータ資産の様々な情報を確認することが出来ます。
リネージュタブでは、データがどこで生成され、どこで利用されているかをシンプルなビューで確認できます。データに関連付けられた用語も表示されるので、どのようなデータかを理解しながらリネージュ情報を見ることができます。

他サービスとの連携

データ検索から分析へ活用

カタログでデータを検索・確認し、利用可能なデータと判断したら、分析プロジェクトに追加して、そのまま分析を行うことが可能です。
ユーザーがデータを検索するだけでなく、データから洞察を得る・データ分析のスタートポイントとなるデータ・カタログです。

データ仮想化やデータ変換(加工と移動)を
併用したデータ提供

Cloud Pak or Dataでは、データ提供の方法として、仮想化とデータ変換(加工と移動/ETL)の両方を提供します。データや分析の特性に応じたデータ提供が可能で、データ提供作業のコスト・時間の削減がはかれます。

お問い合わせ・資料請求

直接の資料請求・お問い合わせは、
お問い合わせフォームからどうぞ

その他、デモ・トライアル・導入相談など、お問い合わせも受け付けております

直接の資料請求・お問い合わせは、お問い合わせフォームからどうぞ 直接の資料請求・お問い合わせは、お問い合わせフォームからどうぞ
TOP