Googleデータポータルでデータ統合する際の制約2020/07/28

Googleデータポータルを使い始めると複数のデータを結合したくなりますが、何でも出来るわけではありません。
本稿では、データ統合の制約(出来ること、出来ないこと)を紹介します。

1. Googleデータポータルにおける用語

(1)データの統合
SQLのJOINに相当します。
Googleデータポータルでは、データソース間の結合を「データの統合」と呼びます。

(2)統合データソース(混合データ)
SQLのVIEWに相当します。
Googleデータポータルでは、複数データソースが統合されたものを「統合データソース」と呼びます。
実際の画面では呼称が変わり、「混合データ」と表現されます。

 

2. 統合の制約(2020年7月27日時点)

(1)できるのは左外部結合(LEFT JOIN)のみ
Googleデータポータルでは、左外部結合(LEFT JOIN)のみサポートされています(詳しくは「データポータルのヘルプ」を参照)。

(2)左外部結合(LEFT JOIN)なら何でもできる訳ではない
3つ以上のデータソース、かつ複数の結合キーを使って統合するには、全てのデータソースに共通する結合キーが必要です。
具体的には、次のような場合に結合できます。

結合できる例のイラスト

これだけ見ると、「結合できて当たり前、これが結合できなければ困る」と感じると思います。
ですが、ここからが重要です。

なんと、次のような場合には結合できません。

結合できない例イラスト

「全てのデータソースに共通する結合キー」に違反するため、結合できません。
このような形で結合したいニーズは沢山あるのですが、結合できないことに筆者は驚きました。

(3)統合データソース(混合データ)をさらに結合することはできない
前述(2)のできない事例を解消するためには、データソースと統合データソースを結合したり、統合データソース同士を結合したくなります。

しかし、これも結合できません。

 

3. どうにかして結合するためには

できないものは仕方ないので、他の手段で結合するしかありません。
考えられる手段は

①事前にデータを全て結合してからデータポータルへ渡す
②必要最低限のデータを結合してからデータポータルへ渡した後、続きはデータポータルで結合する

の2通りです。
筆者の場合は②を選択し、データ結合にはGoogleスプレッドシートを利用しました。
ダッシュボード連携概要図

 

お困りごとの一助になりましたら幸いです。
H

これまでの記事

Googleデータポータルの関連記事