経営と業務の改善「データ分析・利活用基盤ソリューション」
Fivetranは、レプリケーションと変換を行うデータ移動プラットフォームで、自動化されたデータパイプラインをクラウドサービスで提供します。様々なシステム/サービスからデータを取得し、データ分析基盤(データウェアハウス、レイクハウス)に登録します。また、データ分析基盤上でのデータ変換・加工を実行し、分析に適したデータを作成します。
Fivetranを利用することで、以下のような利点を得られます。
データ分析基盤は、多くのデータ/テーブルを収集・蓄積することが求められます。
従来、ETLやインタフェースのバッチ機能を開発する方法が用いられていますが、特に初期構築時に以下のような課題があります。
・テーブル数に応じ、多くの工数・費用、期間が必要
・ETLツールのライセンス購入費やハードウェア等の費用が高額
Fivetranでは、画面上で対象テーブルを選択することでデータ分析基盤へデータを登録できます。
ETLやインタフェースの機能開発が不要となるため、初期開発の工数・費用、期間を低減することができます。
また、利用した実績量に基づいた課金体系のため、初期費用を抑え、実態に見合った料金で利用できます。
一般的に、データ分析基盤へのデータ反映は日次バッチ処理で行われています。この場合、分析に利用できるデータは、1日前や前日時点となります。多くのデータ分析者や経営管理者が、よりタイムリーなデータを使いたいと考えています。
Fivetranでは、画面上で同期間隔を設定できます。数分~数時間の間隔を選択でき、最小では1分間隔です。
準リアルタイム/ニアリアルのデータを分析に活用できるようになります。
大量データを取りこむ場合、ソース側で変更があった差分データだけを処理する方法が合理的です。
しかし、ETLやインタフェースのバッチ機能開発では、変更レコードを検出するためのロジックを実装する必要があり、さらに、削除されたデータを検出・反映することはより困難です。
また、データ抽出→ファイル送信→データロードのステップで実装され、かつ、システムをまたがるため、複数のチーム/プロジェクトが分担・調整しながら開発運用を行うなど、複雑さが生じます。
Fivetranでは、単一のサービスで差分データの検出からデータ分析基盤への反映を行うことができます。
また、運用フェーズにおいて分析ニーズが増え対象テーブルを追加する場合にも、テーブルを選択し直すことで追加できますので、拡張が容易になります。
シンプルな実装・運用となることで、データエンジニアやマーケティング担当者などは、より付加価値を生むデータ分析業務に注力できるようになります。
特長 |
概要 |
---|---|
① コーディング/ETL開発が不要 |
データソースへの接続・認証を設定し、対象テーブルの選択でレプリケーションを定義します。 |
② 豊富なコネクタ |
SaaSアプリケーションやデータベースなど、300種類以上のシステム/サービスへのコネクタを利用できます。 |
③ データやスキーマの差分反映 |
レコード追加・変更・削除、スキーマの変更をサービスが識別し、差分をターゲットに反映します。 |
④ 最小1分間隔のデータ反映 |
最小1分間隔で同期頻度を設定できます。準リアルタイム/ニアリアルのデータを分析に活用できます。 |
⑤ ロード後の加工/変換 |
ロード完了時やスケジュール設定で、データ分析基盤上での加工/変換を行い、分析に適したデータを作成 |
⑥ マネージドサービス |
クラウドサービスとして提供されます。サーバーやミドルウェア等の運用保守が不要です。 |
⑦ 使用量ベースの課金 |
利用料金は、移動したデータの行に基づきます。 |
利用料金は、利用プランと移動したデータの行数(MAR)で算定されます。
利用プランを決めMARを概算することで、おおよその見込み価格を把握することができますので、詳細はお問い合わせください。
MAR(Monthly Active Rows、マー)は、月間アクティブ行数といい、1か月間に移動したデータの件数を指します。
ただし、1か月間にソースから宛先に移動した単純な「のべレコード件数」ではなく、「ユニークなレコードの数」です。
同月であれば、特定の1つのキーのレコードが複数回移動しても、1とカウントします。