BLOG ブログ
Googleデータポータルを使い始めると複数のデータを結合したくなりますが、何でも出来るわけではありません。
本稿では、データ統合の制約(出来ること、出来ないこと)を紹介します。
1. Googleデータポータルにおける用語
(1)データの統合
SQLのJOINに相当します。
Googleデータポータルでは、データソース間の結合を「データの統合」と呼びます。
(2)統合データソース(混合データ)
SQLのVIEWに相当します。
Googleデータポータルでは、複数データソースが統合されたものを「統合データソース」と呼びます。
実際の画面では呼称が変わり、「混合データ」と表現されます。
2. 統合の制約(2020年7月27日時点)
(1)できるのは左外部結合(LEFT JOIN)のみ
Googleデータポータルでは、左外部結合(LEFT JOIN)のみサポートされています(詳しくは「データポータルのヘルプ」を参照)。
(2)左外部結合(LEFT JOIN)なら何でもできる訳ではない
3つ以上のデータソース、かつ複数の結合キーを使って統合するには、全てのデータソースに共通する結合キーが必要です。
具体的には、次のような場合に結合できます。
これだけ見ると、「結合できて当たり前、これが結合できなければ困る」と感じると思います。
ですが、ここからが重要です。
なんと、次のような場合には結合できません。
「全てのデータソースに共通する結合キー」に違反するため、結合できません。
このような形で結合したいニーズは沢山あるのですが、結合できないことに筆者は驚きました。
(3)統合データソース(混合データ)をさらに結合することはできない
前述(2)のできない事例を解消するためには、データソースと統合データソースを結合したり、統合データソース同士を結合したくなります。
しかし、これも結合できません。
3. どうにかして結合するためには
できないものは仕方ないので、他の手段で結合するしかありません。
考えられる手段は
①事前にデータを全て結合してからデータポータルへ渡す
②必要最低限のデータを結合してからデータポータルへ渡した後、続きはデータポータルで結合する
の2通りです。
筆者の場合は②を選択し、データ結合にはGoogleスプレッドシートを利用しました。
お困りごとの一助になりましたら幸いです。
H
これまでの記事
- GoogleスプレッドシートTIPS (2)
- Power Automate Desktop お試し (2)
- RedmineとBIツールの連携 (3)
- ニュースリリース (60)
- ブログ (61)
- 雑記 (3)