クエリサービスとデータDistillerに関するよくある質問

Last update: Fri Apr 04 2025 00:00:00 GMT+0000 (Coordinated Universal Time)

トピック：

作成対象：

ユーザー
開発者

このドキュメントでは、クエリサービスとデータDistillerに関するよくある質問に回答します。また、データの検証や変換されたデータのデータレイクへの書き戻しに「クエリ」製品を使用する際に表示される一般的なエラーコードも含まれます。その他のAdobe Experience Platform サービスに関する質問やトラブルシューティングについては、Experience Platform トラブルシューティングガイドを参照してください。

クエリサービスとデータDistillerがAdobe Experience Platform内でどのように連携するかを明確にするために、2 つの基本的な質問を以下に示します。

クエリサービスとデータDistillerの関係は何ですか？

クエリサービスとデータDistillerは、具体的なデータクエリ機能を提供する、独特の補完的なコンポーネントです。クエリサービスは、アドホッククエリ用に設計されており、データレイクを変更せずに、取り込まれたデータを調査、検証および実験します。これに対し、Data Distillerは、データを変換して強化するバッチクエリに重点を置いており、結果は後で使用するためにデータレイクに保存されます。 Data Distillerのバッチクエリは、スケジュール、監視、管理できるので、クエリサービスだけでは促進されない、より深いデータ処理と操作をサポートします。

クエリサービスを連携すると、迅速なインサイトが促進され、一方、Data Distillerでは詳細な永続的なデータ変換が可能になります。

クエリサービスとデータDistillerの違いは何ですか？

クエリサービス：データの調査、検証および実験に焦点を当てた SQL クエリに使用します。出力はデータレイクに保存されず、実行時間は 10 分に制限されます。アドホッククエリは、軽量でインタラクティブなデータのチェックと分析に適しています。

データDistiller：データを処理、クリーンアップ、エンリッチメントするバッチクエリを有効にし、結果をデータレイクに保存し直します。これらのクエリは、より長い実行（最大 24 時間）、スケジュール、監視、高速レポートなどの追加機能をサポートします。 Data Distillerは、詳細なデータ操作やスケジュールされたデータ処理タスクに最適です。

詳しくは、クエリサービスのパッケージ化ドキュメントを参照してください。

質問カテゴリ

よくある質問に対する次の回答のリストは、次のカテゴリに分類されています。

全般
Data Distiller
クエリ UI
データセットのサンプル
データの書き出し
SQL 構文
ITAS クエリ
サードパーティツール
PostgreSQL API エラー
REST API エラー

クエリサービスに関する一般的な質問

この節には、パフォーマンス、制限、プロセスに関する情報が含まれます。

クエリサービスエディターでオートコンプリート機能をオフにできますか？

回答

いいえ。オートコンプリート機能のオフは、現在、エディターでサポートされていません。

クエリを入力すると、クエリエディターの速度が遅くなることがあるのはなぜですか？

回答

1 つの潜在的な原因はオートコンプリート機能です。この機能は、特定のメタデータコマンドを処理するので、クエリの編集中にエディターの速度が遅くなることがあります。

Query Service API に Postman を使用できますか？

回答

はい、Postman（無料のサードパーティアプリケーション）を使用して、すべての Adobe API サービスを視覚化し、操作できます。Adobe Developer Console でプロジェクトを設定し、Postman で使用するために必要な資格情報をすべて取得する手順については、Postman 設定ガイドをご覧ください。 Postman コレクションの開始、実行、共有に関するガイダンスの公式ドキュメントを参照してください。

UI を使用してクエリから返される行の最大数に制限はありますか？

回答

はい、明示的な制限が外部で指定されていない限り、クエリサービスは内部的に 50,000 行の制限を適用します。詳しくは、インタラクティブクエリの実行に関するガイダンスを参照してください。

クエリを使用して行を更新できますか？

回答

バッチクエリでは、データセット内の行の更新はサポートされていません。

クエリの結果の出力にデータサイズの制限はありますか？

回答

いいえ。データサイズに制限はありませんが、インタラクティブセッションからのクエリタイムアウトは 10 分間に制限されています。クエリがバッチ CTAS として実行される場合、10 分間のタイムアウトは適用されません。詳しくは、インタラクティブクエリの実行に関するガイダンスを参照してください。

クエリが 10 分でタイムアウトしないようにするにはどうすればよいですか？

回答

クエリがタイムアウトした場合に備えて、次の解決策の 1 つ以上をお勧めします。

クエリを CTAS クエリに変換し、実行をスケジュールします。実行のスケジュールは、UI または API を使用して設定できます。
追加のフィルター条件を適用して、より小さいデータチャンクに対してクエリを実行します。
EXPLAIN コマンドを実行して、詳細を収集します。
データセット内のデータの統計を確認します。
クエリを簡略化された形式に変換し、準備済み文を使用して再実行します。

複数のクエリを同時に実行した場合、クエリサービスのパフォーマンスに問題や影響はありますか？

回答

いいえ。クエリサービスには、自動スケーリング機能があり、同時クエリがサービスのパフォーマンスに大きな影響を与えないようにします。

予約済みのキーワードを列名として使用できますか？

回答

ORDER、GROUP BY、WHERE、DISTINCT など、列名として使用できない特定の予約済みキーワードがあります。これらのキーワードを使用する場合は、これらの列をエスケープする必要があります。

階層データセットから列名を見つけるにはどうすればよいですか？

回答

次の手順では、UI を使用してデータセットの表形式表示を表示する方法について説明します。これには、ネストされたすべてのフィールドと列がフラット化された形式で表示されます。

Experience Platform にログインした後、UI の左側のナビゲーションで「データセット」を選択して、データセットダッシュボードに移動します。
データセットの「参照」タブが開きます。検索バーを使用して、使用可能なオプションを絞り込むことができます。表示されたリストからデータセットを選択します。

検索バーとハイライトされたデータセットを含むExperience Platform UI のデータセットダッシュボード。

データセットアクティビティ画面が表示されます。「データセットをプレビュー」を選択して、XDM スキーマのダイアログと、選択したデータセットからフラット化されたデータの表形式表示を開きます。詳しくは、データセットのプレビューに関するドキュメントを参照してください

データセットのプレビューがハイライト表示された、データセットダッシュボードの「データセットアクティビティ」タブ。

スキーマから任意のフィールドを選択して、フラット化された列にその内容を表示します。列の名前は、ページの右側の内容の上に表示されます。この名前をコピーして、このデータセットのクエリに使用する必要があります。

フラット化されたデータの XDM スキーマと表形式表示。ネストされたデータセットの列名は、UI でハイライト表示されます。

クエリエディターまたはサードパーティのクライアントを使用して、ネストされたデータ構造を操作する方法の完全なガイダンスについては、ドキュメントを参照してください。

配列を含むデータセットに対するクエリを高速化するにはどうすればよいですか？

回答

配列を含むデータセットに対するクエリのパフォーマンスを向上させるには、実行時に CTAS クエリとして配列を展開し、処理時間を改善する機会をさらに探索する必要があります。

CTAS クエリが、少数の行に対して何時間も処理されたままになっているのはなぜですか？

回答

非常に小さなデータセットでクエリに時間がかかる場合は、カスタマーサポートにお問い合わせください。

処理中にクエリが停止する理由はいくつか考えられます。正確な原因を特定するには、ケースバイケースで詳細な分析が必要です。この処理を行うには、アドビのカスタマーサポートにお問い合わせください。

アドビのカスタマーサポートに問い合わせるにはどうすればよいですか？

回答

アドビのカスタマーサポートの電話番号の完全なリストは、アドビのヘルプページで入手できます。または、次の手順を実行してオンラインでヘルプを見つけることもできます。

Web ブラウザーで https://www.adobe.com/ に移動します。
上部のナビゲーションバーの右側にある「ログイン」を選択します。

サインインがハイライト表示されたアドビの web サイト。

Adobe ライセンスに登録されている Adobe ID とパスワードを使用します。
上部のナビゲーションバーから「ヘルプとサポート」を選択します。

ヘルプとサポート、エンタープライズサポート、お問い合わせがハイライト表示された上部ナビゲーションバーのドロップダウンメニュー。

「ヘルプとサポート」セクションを含むドロップダウンバナーが表示されます。「お問い合わせ」を選択してアドビカスタマーケアバーチャルアシスタントを開くか、 エンタープライズサポート を選択して大規模組織向けの専用ヘルプを入手してください。

前のジョブが正常に完了しない場合に後続のジョブを実行せずに、一連のジョブを順次実装するにはどうすればよいですか？

回答

匿名ブロック機能を使用すると、順に実行される 1 つ以上の SQL 文を連結できます。また、例外処理のオプションも使用できます。

詳しくは、匿名ブロックのドキュメントを参照してください。

クエリサービスでカスタム属性を実装するにはどうすればよいですか？

回答

カスタム属性を実装する方法は 2 つあります。

既存の Adobe 定義関数の組み合わせを使用して、使用例のニーズが満たされているかどうかを特定します。
前の提案が使用例を満たさない場合は、ウィンドウ関数を組み合わせて使用する必要があります。ウィンドウ関数は、シーケンス内のすべてのイベントを調べます。また、履歴データを確認でき、任意の組み合わせで使用することもできます。

簡単に再利用できるようにクエリをテンプレート化できますか？

回答

はい、準備済み文を使用してクエリをテンプレート化できます。準備済みステートメントは、パフォーマンスを最適化でき、クエリの再解析の繰り返しを回避できます。詳しくは、準備済みステートメントのドキュメントを参照してください。

クエリのエラーログを取得するにはどうすればよいですか？

回答

特定のクエリのエラーログを取得するには、最初にクエリサービス API を使用してクエリログの詳細を取得する必要があります。HTTP 応答には、クエリエラーの調査に必要なクエリ ID が含まれています。

複数のクエリを取得するには、GET コマンドを使用します。API を呼び出す方法については、サンプル API 呼び出しのドキュメントを参照してください。

応答から、調査するクエリを特定し、その id 値を使用して別の GET リクエストを行います。詳細な手順については、ID によるクエリの取得に関するドキュメントを参照してください。

リクエストが成功した場合は、HTTP ステータス 200 が返され、応答に errors 配列が含まれています。ここでは、簡潔にするために、応答は短縮されています。

{
    "isInsertInto": false,
    "request": {
                "dbName": "prod:all",
                "sql": "SELECT *\nFROM\n  accounts\nLIMIT 10\n"
            },
    "clientId": "8c2455819a624534bb665c43c3759877",
    "state": "SUCCESS",
    "rowCount": 0,
    "errors": [{
      'code': '58000',
      'message': 'Batch query execution gets : [failed reason ErrorCode: 58000 Batch query execution gets : [Analysis error encountered. Reason: [sessionId: f055dc73-1fbd-4c9c-8645-efa609da0a7b Function [varchar] not defined.]]]',
      'errorType': 'USER_ERROR'
      }],
    "isCTAS": false,
    "version": 1,
    "id": "343388b0-e0dd-4227-a75b-7fc945ef408a",
}

クエリサービス API リファレンスドキュメントでは、使用可能なすべてのエンドポイントについて詳しく説明しています。

「スキーマの検証エラー」とはどういう意味ですか？

回答

「スキーマの検証エラー」メッセージは、システムがスキーマ内のフィールドを見つけることができないことを意味します。クエリサービスでのデータアセットの整理のベストプラクティスドキュメントを参照した後、Create Table As Select クエリのドキュメントを参照してください。

次の例は、CTAS 構文と struct データ型の使用方法を示しています。

CREATE TABLE table_name WITH (SCHEMA='schema_name')

AS SELECT '1' as _id,

 STRUCT

  ('2021-02-17T15:39:29.0Z' AS taskActualCompletionDate,

    '2020-09-09T21:21:16.0Z' AS taskActualStartDate,

    'Consulting' AS taskdescription,

    '5f6527c10011e09b89666c52d9a8c564' AS taskguide,

    'Stakeholder Consulting Engagement' AS taskname,

    '2020-09-09T15:00:00.0Z' AS taskPlannedStartDate,

    '2021-02-15T11:00:00.0Z' AS taskPlannedCompletionDate

  ) AS _workfront ;

システムに毎日入力される新しいデータを迅速に処理するにはどうすればよいですか？

回答

SNAPSHOT 句を使用すると、スナップショット ID に基づいて、テーブルのデータを増分的に読み取ることができます。これは、最後の読み込み実行以降に作成または変更されたデータセット内の情報のみを処理する増分読み込みデザインパターンで使用するのに最適です。その結果、処理効率が向上し、ストリーミングデータ処理とバッチデータ処理の両方で使用できます。

プロファイル UI に表示される数値とプロファイル書き出しデータセットから計算される数値に違いがあるのはなぜですか？

回答

プロファイルダッシュボードに表示される数値は、最後のスナップショットの時点で正確です。プロファイル書き出しテーブルで生成される数値は、書き出しクエリに完全に依存します。その結果、特定のオーディエンスに適格なプロファイルの数をクエリしていることが、この不一致の一般的な原因となっています。

NOTE

クエリには履歴データが含まれるのに対して、UI には現在のプロファイルデータのみが表示されます。

クエリで空のサブセットが返されたのはなぜですか？どうすればよいですか？

回答

最も可能性の高い原因は、クエリの範囲が狭すぎることです。データが表示されるようになるまで、WHERE 句のセクションを系統的に削除してください。

次のような小さなクエリを使用して、データセットにデータが含まれていることを確認することもできます。

SELECT count(1) FROM myTableName

データをサンプリングできますか？

回答

この機能は、現在開発中です。詳しくは、リリースノートを参照してください。機能のリリース準備が整った時点で、Experience Platform UI ダイアログを通じて使用可能になります。

クエリサービスでサポートされているヘルパー関数は何ですか？

回答

クエリサービスには、SQL 機能を拡張するビルトイン SQL ヘルパー関数がいくつか用意されています。クエリサービスでサポートされている SQL 関数の完全なリストについては、ドキュメントを参照してください。

ネイティブの Spark SQL 関数はすべてサポートされていますか？それとも、アドビが提供するラッパー Spark SQL 関数のみに制限されていますか？

回答

まだ、すべてのオープンソースの Spark SQL 関数がデータレイクデータでテストされているわけではありません。テストして確認すると、サポート対象のリストに追加されます。特定の関数を確認するには、サポート対象の Spark SQL 関数のリストを参照してください。

ユーザーは、他のクエリで使用できる独自のユーザー定義関数（UDF）を定義できますか？

回答

データセキュリティの考慮事項により、UDF のカスタム定義は許可されていません。

スケジュール済みクエリが失敗した場合はどうすればよいですか？

回答

まず、ログを調べてエラーの詳細を確認します。ログ内のエラーの検索に関する FAQ の節では、これを行う方法について詳しく説明しています。

また、UI でのスケジュール済みクエリの実行と API を使用したスケジュール済みクエリの実行の方法については、ドキュメントを参照してください。

Query Editor を使用する場合、既に作成および保存されたクエリにのみスケジュールを追加できます。これは、Query Service API には適用されません。

「セッション制限に達しました」エラーはどういう意味ですか？

回答

「セッション制限に達しました」とは、組織で許可されているクエリサービスセッションの最大数に達したことを意味します。組織の Adobe Experience Platform 管理者に連絡してください。

クエリログでは、削除されたデータセットに関連するクエリをどのように処理しますか？

回答

クエリサービスは、クエリ履歴を削除しません。つまり、削除されたデータセットを参照するクエリが結果として、「有効なデータセットがありません」を返します。

クエリのメタデータのみを取得するにはどうすればよいですか？

回答

ゼロ行を返すクエリを実行して、応答のメタデータのみを取得できます。この例のクエリは、指定したテーブルのメタデータのみを返します。

SELECT * FROM <table> WHERE 1=0

CTAS（Create Table As Select）クエリをマテリアライズせずに、すばやく繰り返し実行する方法を教えてください。

回答

一時テーブルを作成して、クエリを素早く繰り返し実験してから、使用するクエリをマテリアライズできます。また、一時テーブルを使用して、クエリが機能しているかどうかを検証することもできます。

例えば、新しいテーブルを作成できます。

CREATE temp TABLE temp_dataset AS
SELECT *
FROM actual_dataset
WHERE 1 = 0;

次に、一時テーブルを次のように使用できます。

INSERT INTO temp_dataset
SELECT a._company AS _company,
a._id AS _id,
a.timestamp AS timestamp
FROM actual_dataset a
WHERE timestamp >= TO_TIMESTAMP('2021-01-21 12:00:00')
AND timestamp < TO_TIMESTAMP('2021-01-21 13:00:00')
LIMIT 100;

タイムゾーンを UTC タイムスタンプに変更したり、UTC タイムスタンプから変更したりする方法を教えてください。

回答

Adobe Experience Platform はデータを UTC（協定世界時）タイムスタンプ形式で保持します。 UTC 形式の例は 2021-12-22T19:52:05Z です

クエリサービスは、指定されたタイムスタンプを UTC 形式に変換したり、UTC 形式から変換したりするための組み込みの SQL 関数に対応しています。 to_utc_timestamp() メソッドと from_utc_timestamp() メソッドのどちらとも 2 つのパラメーター（タイムスタンプとタイムゾーン）を指定します。

パラメーター

説明

タイムスタンプ

タイムスタンプは、UTC 形式または単純な {year-month-day} 形式で記述できます。時間を指定しない場合、指定した日の午前 0 時がデフォルト値になります。

タイムゾーン

タイムゾーンは {continent/city}) 形式で記述されます。パブリックドメイン TZ データベースにある、認識されているタイムゾーンコードのいずれかである必要があります。

UTC タイムスタンプに変換

この to_utc_timestamp() メソッドは指定されたパラメーターを解釈し、UTC 形式の ローカルタイムゾーンのタイムスタンプに 変換します。例えば、韓国のソウルのタイムゾーンは、UTC／GMT +9 時間です。日付のみのタイムスタンプを指定すると、メソッドではデフォルト値の午前 0 時が使用されます。タイムスタンプとタイムゾーンは、UTC 形式（その地域の時刻からローカル地域の UTC タイムスタンプ）に変換されます。

SELECT to_utc_timestamp('2021-08-31', 'Asia/Seoul');

クエリは、ユーザーのローカル時間のタイムスタンプを返します。この場合、ソウルは 9 時間先なので、前日の午後 3 時になります。

2021-08-30 15:00:00

別の例として、指定されたタイムスタンプが Asia/Seoul タイムゾーンの 2021-07-14 12:40:00.0 である場合、返される UTC タイムスタンプは 2021-07-14 03:40:00.0 になります

クエリサービス UI で提供されるコンソール出力は、人間が読みやすい形式になっています。

8/30/2021, 3:00 PM

UTC タイムスタンプからの変換

この from_utc_timestamp() メソッドは、指定されたパラメーターを ローカルタイムゾーンのタイムスタンプから 解釈し、目的の地域の同等のタイムスタンプを UTC 形式で提供します。次の例では、時間はユーザーのローカルタイムゾーンの午後 2 時 40 分になります。変数として渡されるソウルのタイムゾーンは、ローカルタイムゾーンの 9 時間前です。

SELECT from_utc_timestamp('2021-08-31 14:40:00.0', 'Asia/Seoul');

クエリは、パラメーターとして渡されたタイムゾーンのタイムスタンプを UTC 形式で返します。結果は、クエリを実行したタイムゾーンより 9 時間早くなります。

8/31/2021, 11:40 PM

時系列データをフィルタリングするにはどうすればよいですか？

回答

時系列データに対するクエリを実行する場合は、可能な限りタイムスタンプフィルターを使用して、より正確な分析を行う必要があります。

NOTE

日付文字列は yyyy-mm-ddTHH24:MM:SS の形式である必要があります。

タイムスタンプフィルターの使用例を以下に示します。

SELECT a._company  AS _company,
       a._id       AS _id,
       a.timestamp AS timestamp
FROM   dataset a
WHERE  timestamp >= To_timestamp('2021-01-21 12:00:00')
       AND timestamp < To_timestamp('2021-01-21 13:00:00')

`CAST` 演算子を正しく使用して SQL クエリのタイムスタンプを変換する方法を教えてください。

回答

CAST 演算子を使用してタイムスタンプを変換する場合は、日付 および 時間の両方を含める必要があります。

例えば、以下に示すように、時間コンポーネントが見つからない場合、次のエラーが発生します。

SELECT * FROM ABC
WHERE timestamp = CAST('07-29-2021' AS timestamp)

CAST 演算子の正しい使用法を以下に示します。

SELECT * FROM ABC
WHERE timestamp = CAST('07-29-2021 00:00:00' AS timestamp)

ワイルドカード（* など）を使用してデータセットからすべての行を取得する必要がありますか？

回答

ワイルドカードを使用して行からすべてのデータを取得することはできません。クエリサービスは従来の行ベースのストアシステムではなく、列ストア として扱われる必要があるためです。

SQL クエリで `NOT IN` を使用する必要がありますか？

回答

NOT IN 演算子は、他のテーブルや SQL 文に見つからない行を取得する場合によく使用されます。この演算子を使用するとパフォーマンスが低下する可能性があるほか、比較対象の列に NOT NULL が指定されていたり、大量のレコードが存在したりする場合、予期せぬ結果が返されることがあります。

NOT IN を使用する代わりに、NOT EXISTS または LEFT OUTER JOIN の使用を推奨します。

例えば、次のテーブルを作成したとします。

CREATE TABLE T1 (ID INT)
CREATE TABLE T2 (ID INT)
INSERT INTO T1 VALUES (1)
INSERT INTO T1 VALUES (2)
INSERT INTO T1 VALUES (3)
INSERT INTO T2 VALUES (1)
INSERT INTO T2 VALUES (2)

NOT EXISTS 演算子を使用して次のクエリを実行すれば、NOT IN 演算子を使用せずに同じ機能を実行できます。

SELECT ID FROM T1
WHERE NOT EXISTS
(SELECT ID FROM T2 WHERE T1.ID = T2.ID)

あるいは、LEFT OUTER JOIN 演算子を使用して次のクエリを実行しても、NOT IN 演算子を使用せずに同じ機能を実行できます。

SELECT T1.ID FROM T1
LEFT OUTER JOIN T2 ON T1.ID = T2.ID
WHERE T2.ID IS NULL

UI に表示されているような、アンダースコアが名前に 2 つ入ったデータセットを CTAS クエリを使用して作成できますか？例：`test_table_001`。

回答

いいえ。これは、クエリサービスを含むすべてのアドビサービスに適用される、Experience Platform 全体にわたる意図的な制限です。スキーマ名とデータセット名にはアンダースコアを 2 つ入れることができますが、データセットのテーブル名には 1 つしか入れられません。

クエリは同時にいくつまで実行できますか？

回答

バッチクエリがバックエンドジョブとして実行されるので、クエリの同時実行制限はありません。ただし、クエリのタイムアウト制限は 24 時間に設定されています。

クエリのアクティビティとステータスを確認できるアクティビティダッシュボードはありますか？

回答

クエリのアクティビティとステータスを確認するための監視機能と警告機能があります。詳しくは、クエリサービス監査ログの統合およびクエリログに関するドキュメントを参照してください。

更新をロールバックする方法はありますか？例えば、データをExperience Platformに書き戻す際、エラーが発生したり一部の計算を再設定しなければならなかったりする場合、そうしたシナリオはどのように処理する必要がありますか？

回答

現在、ロールバックやそのような更新はサポートされていません。

Adobe Experience Platform でクエリを最適化するにはどうすればよいですか？

回答

システムはデータベースではないのでインデックスを持っていませんが、データストアに関連付けられた他の最適化方法が用意されています。次のオプションを使用して、クエリを調整できます。

timeseries データの時系列でのフィルタリング。
構造体データタイプのプッシュダウンの最適化。
配列とマップのデータタイプのコスト面およびメモリ面におけるプッシュダウンの最適化。
スナップショットを使用した増分処理。
一貫性のあるデータ形式。

ログイン権限をクエリサービスの特定の機能に制限できますか。それとも、このソリューションの権限は、「すべて許可かすべて禁止」の二択ですか。

回答

クエリサービスは、「すべて許可かすべて禁止」のソリューションです。部分的なアクセス権限は提供できません。

クエリサービスで使用するデータを制限できますか。それとも、Adobe Experience Platform データレイク全体に単純にアクセスするだけですか。

回答

可能です。読み取り専用アクセス権限を持つデータセットのみにクエリ実行対象を制限できます。

クエリサービスがアクセスできるデータを制限するための他のオプションはありますか？

回答

アクセスを制限する方法は 3 つあります。次の 3 つです。

SELECT ステートメントのみを使用し、データセットに読み取り専用アクセス権限を付与します。また、クエリ管理権限も割り当てます。
SELECT／INSERT／CREATE ステートメントを使用して、データセットに書き込みアクセス権限を付与します。また、クエリ管理権限を割り当てます。
上に提示した方法で統合アカウントを使用するとともに、クエリ統合権限を割り当てます。

クエリサービスがデータを返した後、保護されたデータが返されていないことを確認するために、Experience Platformが実行できるチェックはありますか？

クエリサービスは、属性ベースのアクセス制御をサポートしています。データへのアクセスは、列／リーフレベルや構造体レベルで制限できます。属性ベースのアクセス制御について詳しくは、該当するドキュメントを参照してください。

サードパーティのクライアントへの接続に SSL モードを指定できますか？例えば、Power BI で「verify-full」を指定して使用できますか？

回答

はい。SSL モードはサポートされています。使用可能な SSL モードの分類とその保護レベルについて詳しくは、SSL モードのドキュメントを参照してください。

Power BI クライアントからクエリサービスへのすべての接続に対して TLS 1.2 が適用されていますか？

回答

はい。転送中のデータはすべて HTTPS に準拠しています。現在サポートされているバージョンは TLS1.2 です。

ポート 80 で確立された接続では、引き続き https を使用しますか？

回答

はい、ポート 80 で確立された接続では SSL を使用します。また、ポート 5432 を使用することもできます。

特定の接続での特定のデータセットや列へのアクセスを制御することはできますか？この設定方法を教えてください。

回答

はい。設定に応じて、属性ベースのアクセス制御が適用されます。詳しくは、属性ベースのアクセス制御の概要を参照してください。

クエリサービスは「INSERT OVERWRITE INTO」コマンドをサポートしていますか？

回答

いいえ、クエリサービスは「INSERT OVERWRITE INTO」コマンドをサポートしていません。

ライセンス使用状況ダッシュボードに表示されている使用状況データが、Data Distiller Compute Hours 用に更新される頻度はどれくらいですか？

回答

Data Distillerのコンピューター時間のライセンス使用状況ダッシュボードは、6 時間ごとに 1 日 4 回更新されます。

データDistillerへのアクセス権を持たずに CREATE VIEW コマンドを使用できますか？

回答

はい、データDistillerへのアクセス権 CREATE VIEW 持たずにコマンドを使用できます。このコマンドは、データの論理ビューを提供しますが、データレイクには書き戻しません。

DbVisualizer で匿名ブロックを使用できますか？

回答

はい。ただし、DbVisualizer などの特定のサードパーティクライアントでは、SQL ブロックの前後に別の識別子が必要になる場合があり、スクリプトの一部を 1 つのステートメントとして処理する必要があることを示します。詳しくは、匿名ブロックのドキュメントまたは公式の DbVisualizer ドキュメントを参照してください。

Data Distiller

Data Distillerのライセンス使用状況はどのように追跡されますか。また、どこで確認できますか。

回答\

バッチクエリの使用状況の追跡に使用される主な指標は、時間の計算です。ライセンス使用状況ダッシュボードから、この情報および現在の使用状況にアクセスできます。

計算時間とは何ですか？

回答\

計算時間とは、バッチクエリの実行時にクエリサービスエンジンがデータの読み取り、処理およびデータレイクへの書き込みに要した時間の測定値です。

計算時間の測定方法

回答\

計算時間は、許可されたすべてのサンドボックスについて累積的に測定されます。

同じクエリを連続して実行しても、計算時間の消費量にバリエーションが生じるのはなぜですか？

回答\

クエリの計算時間は、複数の要因によって変動する場合があります。これには、処理されるデータボリューム、SQL クエリ内の変換操作の複雑さなどが含まれます。クエリサービスは、各クエリで上記のパラメーターに基づいてクラスターのスケールを行うので、計算時間の違いが生じる可能性があります。

同じデータを使用して同じクエリを長期間実行すると、計算時間が短縮されるのが通常ですか？なぜこのようなことが起こっているのでしょうか？

回答\

バックエンドインフラストラクチャは、コンピューティング時間の使用率と処理時間を最適化するために継続的に改善されています。その結果、パフォーマンスの強化が実装されるにつれて、時間の経過と共に変化に気付く場合があります。

クエリ UI

クエリサービスに接続しようとすると、「クエリを作成」が停止し、「接続を初期化中…」と表示される。問題を修正するにはどうすればよいですか？

回答

「クエリの作成」が「接続の初期化中」で停止している場合は、接続またはセッションの問題がある可能性があります。 Experience Platform UI を使用している場合は、ブラウザーを更新して、もう一度試してください。

データセットのサンプル

システムデータセットにサンプルを作成できますか？

回答

いいえ。システムデータセットに対する書き込み権限は制限されているので、サンプルを作成できません。

データの書き出し

この節では、データの書き出しと制限について説明します。

クエリの処理後にクエリサービスからデータを抽出し、結果を CSV ファイルに保存する方法はありますか？

回答

はい。クエリサービスからデータを抽出でき、SQL コマンドを使用して結果を CSV 形式で保存するオプションもあります。

PSQL クライアントを使用する場合、クエリの結果を保存する方法は 2 つあります。 COPY TO コマンドを使用するか、次の形式を使用してステートメントを作成できます。

SELECT column1, column2
FROM <table_name>
\g <table_name>.out

COPY TO コマンドの使用に関するガイダンスは、SQL 構文リファレンスドキュメントに記載されています。

CTAS クエリ（テラバイトなどの大量のデータが含まれると仮定して）で取り込まれた最終的なデータセットの内容を抽出することはできますか？

回答

いいえ。現在、取り込んだデータを抽出する機能はありません。

Analytics データコネクタがデータを返さない理由

回答

この問題の一般的な原因は、時間フィルターを使用せずに時系列データをクエリすることです。以下に例を示します。

SELECT * FROM prod_table LIMIT 1;

次のように記述する必要があります。

SELECT * FROM prod_table
WHERE
timestamp >= to_timestamp('2022-07-22')
and timestamp < to_timestamp('2022-07-23');

SQL 構文

MERGE INTO は Data Distillerまたはクエリサービスでサポートされていますか？

回答

MERGE INTO SQL コンストラクトは、Data Distillerまたはクエリサービスではサポートされていません。

ITAS クエリ

ITAS クエリとは

回答

INSERT INTO クエリは、ITAS クエリと呼ばれます。なお、CREATE TABLE クエリは CTAS クエリと呼ばれます。

サードパーティツール

この節では、サードパーティのツール（PSQL や Power BI など）の使用に関する情報を示します。

クエリサービスをサードパーティのツールに接続できますか？

回答

はい。複数のサードパーティ製デスクトップクライアントをクエリサービスに接続できます。使用可能なクライアントと、それらをクエリサービスに接続する方法の詳細については、ドキュメントを参照してください。

クエリサービスを 1 回接続して、サードパーティのツールで継続的に使用する方法はありますか？

回答

はい。有効期限のない資格情報を 1 回設定するだけで、サードパーティ製デスクトップクライアントをクエリサービスに接続できます。許可されたユーザーが有効期限のない資格情報を生成し、ローカルマシンに自動的にダウンロードされる JSON ファイルで受信できます。有効期限のない資格情報の作成とダウンロード方法に関する完全なガイダンスはドキュメントに記載されています。

有効期限のない資格情報が機能しない理由

回答

有効期限のない資格情報の値は、設定 JSON ファイルから取得した technicalAccountID と credential からの連結引数です。パスワードの値は {{technicalAccountId}:{credential}} 形式で指定します。
資格情報を使用して外部クライアントに接続する方法について詳しくは、ドキュメントを参照してください。

クエリサービスエディターに接続できるサードパーティの SQL エディターの種類を教えてください。

回答

PSQL または Postgres クライアントに準拠したサードパーティ製の SQL エディターであれば、クエリサービスエディターに接続できます。使用可能な手順のリストについては、クエリサービスへのクライアントの接続のドキュメントを参照してください。

Power BI ツールをクエリサービスに接続できますか？

回答

はい、Power BI をクエリサービスに接続できます。 Power BI デスクトップアプリをクエリサービスに接続する手順については、ドキュメントを参照してください。

クエリサービスに接続すると、ダッシュボードの読み込みに時間がかかるのはなぜですか？

回答

クエリサービスに接続されている場合、システムはインタラクティブまたはバッチ処理エンジンに接続されています。その結果、処理されたデータを反映するための読み込み時間が長くなる可能性があります。

ダッシュボードの応答時間を改善する場合は、Business Intelligence（BI）サーバーを、クエリサービスと BI ツールの間のキャッシュレイヤーとして実装する必要があります。通常、ほとんどの BI ツールには、サーバー用の追加のオファリングがあります。

キャッシュサーバーレイヤーを追加する目的は、クエリサービスからのデータをキャッシュし、それをダッシュボードで利用して応答を高速化することです。実行されるクエリの結果が毎日 BI サーバーにキャッシュされるので、この処理が可能です。次に、キャッシュサーバーは、同じクエリを使用するすべてのユーザーにこれらの結果を提供し、待ち時間を短縮します。この設定の説明については、使用しているユーティリティまたはサードパーティツールのドキュメントを参照してください。

pgAdmin 接続ツールを使用してクエリサービスにアクセスできますか？

回答

いいえ、pgAdmin 接続には対応していません。使用可能なサードパーティクライアントの一覧と、それらをクエリサービスに接続する方法については、ドキュメントを参照してください。

PostgreSQL API エラー

次の表に、PSQL エラーコードと考えられる原因を示します。

エラーコード

接続状態

説明

考えられる原因

08P01

なし

メッセージの種類がサポートされていません。

28P01

起動 - 認証

パスワードが無効です。

認証トークンが無効です。

28000

起動 - 認証

認証タイプが無効です。

認証タイプが無効です。AuthenticationCleartextPassword である必要があります。

42P12

起動 - 認証

テーブルが見つかりません。

使用するテーブルが見つかりません。

42601

クエリ

構文エラー。

コマンドが無効であるか、構文にエラーがあります。

42P01

クエリ

テーブルが見つかりません。

クエリで指定されたテーブルが見つかりませんでした。

42P07

クエリ

テーブルが存在します

同じ名前のテーブルが既に存在します（CREATE TABLE）

53400

クエリ

LIMIT が最大値を超えています。

ユーザーが LIMIT 句で 100,000 を超える行数を指定しました。

53400

クエリ

ステートメントがタイムアウトになりました。

送信されたステートメントの処理時間が最大値の 10 分を超えました。

58000

クエリ

システムエラー。

内部システム障害が発生しています。

0A000

クエリ／コマンド

サポートなし

クエリ／コマンドの機能はサポートされていません

42501

DROP TABLE クエリ

クエリサービスで作成されていないテーブルの削除中

削除中のテーブルは、CREATE TABLE 文を使用してクエリサービスで作成されたものではありません

42501

DROP TABLE クエリ

認証済みユーザーが作成していないテーブル

削除中のテーブルは、現在ログインしているユーザーによって作成されたものではありません

42P01

DROP TABLE クエリ

テーブルが見つかりません。

クエリで指定されたテーブルが見つかりませんでした

42P12

DROP TABLE クエリ

dbName のテーブルが見つかりません。dbName を確認してください

現在のデータベースにテーブルが見つかりませんでした

テーブルで history_meta() メソッドを使用すると、58000 エラーコードが表示されたのはなぜですか？

回答

history_meta() メソッドを使用して、データセットからスナップショットにアクセスします。以前は、Azure Data Lake Storage（ADLS）の空のデータセットに対してクエリを実行すると、データセットが存在しないことを示す 58000 エラーコードが表示されていました。古いシステムエラーの例を以下に示します。

ErrorCode: 58000 Internal System Error [Invalid table your_table_name. historyMeta can be used on datalake tables only.]

クエリに戻り値がないために、このエラーが発生しました。この動作が修正され、次のメッセージが返されるようになりました。

Query complete in {timeframe}. 0 rows returned.

REST API エラー

次の表に、HTTP エラーコードと考えられる原因を示します。

HTTP ステータスコード

説明

考えられる原因

400

Bad request

クエリの形式が不正であるか、不正なクエリです。

401

Authentication failed

認証トークンが無効です。

500

Internal server error

内部システム障害が発生しています。

recommendation-more-help

クエリサービスとデータDistillerに関するよくある質問

クエリサービスとデータDistillerの関係は何ですか？

クエリサービスとデータDistillerの違いは何ですか？

質問カテゴリ

クエリサービスに関する一般的な質問

クエリサービスエディターでオートコンプリート機能をオフにできますか？

クエリを入力すると、クエリエディターの速度が遅くなることがあるのはなぜですか？

Query Service API に Postman を使用できますか？

UI を使用してクエリから返される行の最大数に制限はありますか？

クエリを使用して行を更新できますか？

クエリの結果の出力にデータサイズの制限はありますか？

クエリが 10 分でタイムアウトしないようにするにはどうすればよいですか？

複数のクエリを同時に実行した場合、クエリサービスのパフォーマンスに問題や影響はありますか？

予約済みのキーワードを列名として使用できますか？

階層データセットから列名を見つけるにはどうすればよいですか？

配列を含むデータセットに対するクエリを高速化するにはどうすればよいですか？

CTAS クエリが、少数の行に対して何時間も処理されたままになっているのはなぜですか？

アドビのカスタマーサポートに問い合わせるにはどうすればよいですか？

前のジョブが正常に完了しない場合に後続のジョブを実行せずに、一連のジョブを順次実装するにはどうすればよいですか？

クエリサービスでカスタム属性を実装するにはどうすればよいですか？

簡単に再利用できるようにクエリをテンプレート化できますか？

クエリのエラーログを取得するにはどうすればよいですか？

「スキーマの検証エラー」とはどういう意味ですか？

システムに毎日入力される新しいデータを迅速に処理するにはどうすればよいですか？

プロファイル UI に表示される数値とプロファイル書き出しデータセットから計算される数値に違いがあるのはなぜですか？

クエリで空のサブセットが返されたのはなぜですか？ どうすればよいですか？

データをサンプリングできますか？

クエリサービスでサポートされているヘルパー関数は何ですか？

ネイティブの Spark SQL 関数はすべてサポートされていますか？ それとも、アドビが提供するラッパー Spark SQL 関数のみに制限されていますか？

ユーザーは、他のクエリで使用できる独自のユーザー定義関数（UDF）を定義できますか？

スケジュール済みクエリが失敗した場合はどうすればよいですか？

「セッション制限に達しました」エラーはどういう意味ですか？

クエリログでは、削除されたデータセットに関連するクエリをどのように処理しますか？

クエリのメタデータのみを取得するにはどうすればよいですか？

CTAS（Create Table As Select）クエリをマテリアライズせずに、すばやく繰り返し実行する方法を教えてください。

タイムゾーンを UTC タイムスタンプに変更したり、UTC タイムスタンプから変更したりする方法を教えてください。

UTC タイムスタンプに変換

UTC タイムスタンプからの変換

時系列データをフィルタリングするにはどうすればよいですか？

CAST 演算子を正しく使用して SQL クエリのタイムスタンプを変換する方法を教えてください。

ワイルドカード（* など）を使用してデータセットからすべての行を取得する必要がありますか？

SQL クエリで NOT IN を使用する必要がありますか？

UI に表示されているような、アンダースコアが名前に 2 つ入ったデータセットを CTAS クエリを使用して作成できますか？例：test_table_001。

クエリは同時にいくつまで実行できますか？

クエリのアクティビティとステータスを確認できるアクティビティダッシュボードはありますか？

Adobe Experience Platform でクエリを最適化するにはどうすればよいですか？

ログイン権限をクエリサービスの特定の機能に制限できますか。それとも、このソリューションの権限は、「すべて許可かすべて禁止」の二択ですか。

クエリサービスで使用するデータを制限できますか。それとも、Adobe Experience Platform データレイク全体に単純にアクセスするだけですか。

クエリサービスがアクセスできるデータを制限するための他のオプションはありますか？

クエリサービスがデータを返した後、保護されたデータが返されていないことを確認するために、Experience Platformが実行できるチェックはありますか？

サードパーティのクライアントへの接続に SSL モードを指定できますか？例えば、Power BI で「verify-full」を指定して使用できますか？

Power BI クライアントからクエリサービスへのすべての接続に対して TLS 1.2 が適用されていますか？

ポート 80 で確立された接続では、引き続き https を使用しますか？

特定の接続での特定のデータセットや列へのアクセスを制御することはできますか？ この設定方法を教えてください。

クエリサービスは「INSERT OVERWRITE INTO」コマンドをサポートしていますか？

ライセンス使用状況ダッシュボードに表示されている使用状況データが、Data Distiller Compute Hours 用に更新される頻度はどれくらいですか？

データDistillerへのアクセス権を持たずに CREATE VIEW コマンドを使用できますか？

DbVisualizer で匿名ブロックを使用できますか？

Data Distiller

Data Distillerのライセンス使用状況はどのように追跡されますか。また、どこで確認できますか。

計算時間とは何ですか？

計算時間の測定方法

同じクエリを連続して実行しても、計算時間の消費量にバリエーションが生じるのはなぜですか？

同じデータを使用して同じクエリを長期間実行すると、計算時間が短縮されるのが通常ですか？ なぜこのようなことが起こっているのでしょうか？

クエリ UI

クエリサービスに接続しようとすると、「クエリを作成」が停止し、「接続を初期化中…」と表示される。 問題を修正するにはどうすればよいですか？

データセットのサンプル

システムデータセットにサンプルを作成できますか？

データの書き出し

クエリの処理後にクエリサービスからデータを抽出し、結果を CSV ファイルに保存する方法はありますか？

CTAS クエリ（テラバイトなどの大量のデータが含まれると仮定して）で取り込まれた最終的なデータセットの内容を抽出することはできますか？

Analytics データコネクタがデータを返さない理由

SQL 構文

MERGE INTO は Data Distillerまたはクエリサービスでサポートされていますか？

ITAS クエリ

ITAS クエリとは

サードパーティツール

クエリサービスをサードパーティのツールに接続できますか？

クエリサービスを 1 回接続して、サードパーティのツールで継続的に使用する方法はありますか？

有効期限のない資格情報が機能しない理由

クエリで空のサブセットが返されたのはなぜですか？どうすればよいですか？

ネイティブの Spark SQL 関数はすべてサポートされていますか？それとも、アドビが提供するラッパー Spark SQL 関数のみに制限されていますか？

`CAST` 演算子を正しく使用して SQL クエリのタイムスタンプを変換する方法を教えてください。

SQL クエリで `NOT IN` を使用する必要がありますか？

UI に表示されているような、アンダースコアが名前に 2 つ入ったデータセットを CTAS クエリを使用して作成できますか？例：`test_table_001`。

特定の接続での特定のデータセットや列へのアクセスを制御することはできますか？この設定方法を教えてください。

同じデータを使用して同じクエリを長期間実行すると、計算時間が短縮されるのが通常ですか？なぜこのようなことが起こっているのでしょうか？

クエリサービスに接続しようとすると、「クエリを作成」が停止し、「接続を初期化中…」と表示される。問題を修正するにはどうすればよいですか？