Atlassian Data Lake のデータ モデルについて理解する

各製品は、Atlassian Data Lake に独自のテーブルと列のセットを保持しています。製品のすべてのデータを含めることを選択した場合は、それらの各テーブルに対して、さらに列が追加されます。

現時点では、Jira、Jira Service Management、Jira Work Management、Jira Product Discovery、Confluence のデータのみが、Atlassian Data Lake で利用できます。今後、より多くの製品のデータが利用可能となる予定です。

製品テーブルは、スター スキーマで製品データをキャプチャします。つまり、一部のテーブルは他のテーブルを参照します。このため、Atlassian Analytics で必要なデータを取得するには、複数のクエリを結合しなければならない場合があります。

データ共有のデータ モデル

データ共有を使用すると、Atlassian Data Lake を組織の環境またはサードパーティ ツールに接続できます。ただし、データ共有のデータ モデルは、Atlassian Analytics で利用できるものとは異なります。データ共有のデータ モデルの詳細をご確認ください。

データの鮮度

For most tables, it can take up to 90 minutes for changes in your products to reflect in the Data Lake. This makes them especially useful for custom analysis, or when having the most up-to-date information is important.

However, for the following tables, it takes about five to eight hours for changes to reflect:

  • jira_issue

  • jira_issue_cycle_time

  • jira_issue_field

  • jira_issue_status_history

  • jira_project

Data Lake の日付とタイムスタンプ

日付とタイムスタンプのを含む列 (created_atupdated_at、など) はすべて UTC タイムゾーンであることに注意してください。これらを変換して別のタイムゾーンを使用するには、ワークスペース設定でワークスペースのタイムゾーンを変更するか、ダッシュボードの設定で個々のダッシュボードのタイムゾーンを変更します。

命名規則

テーブルと列の SQL 名に、特定の目的を示す特定の単語が含まれる場合があります。

テーブル名

_mapping

SQL 名にこのサフィックスが付いているテーブルには、その他のテーブルへの外部キーが格納されています。このテーブルの主な機能は、分析してインサイトを得るためにテーブルを横断してデータを組み合わせることです。

たとえば、Opsgenie スキーマの opsgenie_alert_responder_mapping テーブルは、どの対応者タイプがアラートに応答したかを表示するためのものです。このテーブルには、opsgenie_teamopsgenie_scheduleopsgenie_escalationatlassian_account、の各テーブルへの外部キーがあります。

_history または _history_

SQL 名に history が付いているテーブルには、特定のオブジェクトに関する現在までのすべての更新が格納されます。これに対応して、ほとんどの履歴テーブルには、そのオブジェクトの最新情報のみが格納される履歴なしテーブルがあります。

たとえば、jira_issue_history テーブルには、Jira が同じ課題 (ID で表示) に関する新しいデータを送信するたびに更新がキャプチャされます。これは通常、課題が別のステータスにトランジションするときなど、特定のイベントや状態の変更時に行われます。特定の課題に関するこれらのイベントはすべて履歴テーブルに保存されます。履歴なしテーブルである jira_issue には、課題の最新の更新のみが保存されます。

列の名前

_id

このサフィックスは主キーと外部キー専用です。これらの列を使用してテーブルを結合します。

たとえば、jira_issue テーブルでは、issue_id が課題オブジェクトの主キー、project_id がこのテーブルを jira_project テーブルに結合するために使用できる外部キーです。

_by または account_id または _account_id

このサフィックスは、列が account テーブルの外部キーであることを示します。列には、アカウントが実行したアクションのアカウント識別子が格納されます。

たとえば、confluence_page テーブルの created_by にある値は、ページを作成したユーザーのアカウント ID です。

唯一の例外は、account テーブルの account_id 列です。これはそのテーブルの主キーです。

_at または _until

これらのサフィックスは、値がタイムスタンプになることを示します。たとえば、confluence_page テーブルのcreated_atopsgenie_alert テーブルの snoozed_until などです。

_ref

このサフィックスは、値が特定のオブジェクトの製品内識別子になることを示します。たとえば、jira_issue テーブルの issue_ref などです。これは、データ レイク内にある一意の識別子で結合に必要な、オブジェクトの ID (_id サフィックス) とは異なります。

さらにヘルプが必要ですか?

アトラシアン コミュニティをご利用ください。