Directives générales pour l’exécution des requêtes dans Query Service
- Rubriques :
- Requêtes
Créé pour :
- Utilisateur ou utilisatrice
- Développeur
Ce document détaille les informations importantes à connaître lors de la rédaction de requêtes dans Adobe Experience Platform Query Service.
Pour plus d’informations sur la syntaxe SQL utilisée dans Query Service, consultez la documentation sur la syntaxe SQL.
Modèles d’exécution de requêtes
Adobe Experience Platform Query Service propose deux modes d’exécution des requêtes : interactive et non interactive. L’exécution interactive est utilisée pour le développement de requêtes et la génération de rapports dans les outils de Business Intelligence, tandis que l’exécution non interactive est utilisée pour les tâches plus importantes et les requêtes opérationnelles dans le cadre d’un workflow de traitement des données.
Exécution de requête interactive
Les requêtes peuvent être exécutées de manière interactive en les envoyant via l’interface utilisateur Query Service ou via un client connecté. Lors de l’exécution de Query Service via un client connecté, une session active s’exécute entre le client et Query Service jusqu’à ce que la requête envoyée soit renvoyée ou qu’elle expire.
L’exécution de requête interactive présente les limites suivantes :
Paramètre | Limite |
---|---|
Délai d’expiration de la requête | 10 minutes |
Nombre maximal de lignes renvoyées | 50 000 |
Nombre maximal de requêtes simultanées | 5 |
LIMIT 0
dans votre requête. Le délai d’expiration de 10 minutes s’applique toujours.Par défaut, les résultats des requêtes interactives sont renvoyés au client et ne sont pas conservés. Pour conserver les résultats sous forme d’un jeu de données dans Experience Platform, la requête doit utiliser la syntaxe CREATE TABLE AS SELECT
.
Exécution de requête non interactive
Les requêtes envoyées via l’API Query Service sont exécutées de manière non interactive. L’exécution non interactive signifie que Query Service reçoit l’appel API et exécute la requête dans l’ordre dans lequel elle est reçue. Les requêtes non interactives entraînent toujours la génération d’un nouveau jeu de données en Experience Platform de recevoir les résultats, ou l’insertion de nouvelles lignes dans un jeu de données existant.
Accès à un champ spécifique dans un objet
Pour accéder à un champ dans un objet de votre requête, vous pouvez utiliser soit la notation par points (.
), soit la notation par crochets ([]
). L’instruction SQL suivante utilise la notation par points pour parcourir l’objet endUserIds
jusqu’à l’objet mcid
.
SELECT endUserIds._experience.mcid
FROM {ANALYTICS_TABLE_NAME}
WHERE endUserIds._experience.mcid IS NOT NULL
AND TIMESTAMP = to_timestamp('{TARGET_YEAR}-{TARGET_MONTH}-{TARGET_DAY}')
LIMIT 1
{ANALYTICS_TABLE_NAME}
L’instruction SQL suivante utilise la notation par crochets pour parcourir l’objet endUserIds
jusqu’à l’objet mcid
.
SELECT endUserIds['_experience']['mcid']
FROM {ANALYTICS_TABLE_NAME}
WHERE endUserIds._experience.mcid IS NOT NULL
AND TIMESTAMP = to_timestamp('{TARGET_YEAR}-{TARGET_MONTH}-{TARGET_DAY}')
LIMIT 1
{ANALYTICS_TABLE_NAME}
Les deux exemples de requête ci-dessus renvoient un objet aplati, plutôt qu’une seule valeur :
endUserIds._experience.mcid
--------------------------------------------------------
(48168239533518554367684086979667672499,"(ECID)",true)
(1 row)
L’objet endUserIds._experience.mcid
renvoyé contient les valeurs correspondantes pour les paramètres suivants :
id
namespace
primary
Lorsque la colonne est déclarée uniquement à l’objet, elle renvoie l’objet entier sous forme de chaîne. Pour afficher uniquement l’identifiant, utilisez :
SELECT endUserIds._experience.mcid.id
FROM {ANALYTICS_TABLE_NAME}
WHERE endUserIds._experience.mcid IS NOT NULL
AND TIMESTAMP = to_timestamp('{TARGET_YEAR}-{TARGET_MONTH}-{TARGET_DAY}')
LIMIT 1
endUserIds._experience.mcid.id
----------------------------------------
48168239533518554367684086979667672499
(1 row)
Citations
Les guillemets simples, les guillemets doubles et les guillemets inverses ont des utilisations différentes dans les requêtes Query Service.
Guillemets simples
Le guillemet simple ('
) est utilisé pour créer des chaînes de texte. Par exemple, il peut être utilisé dans l’instruction SELECT
pour renvoyer une valeur de texte statique dans le résultat, et dans la clause WHERE
pour évaluer le contenu d’une colonne.
La requête suivante déclare une valeur de texte statique ('datasetA'
) pour une colonne :
SELECT
'datasetA',
timestamp,
web.webPageDetails.name
FROM {ANALYTICS_TABLE_NAME}
WHERE TIMESTAMP = to_timestamp('{TARGET_YEAR}-{TARGET_MONTH}-{TARGET_DAY}')
LIMIT 10
La requête suivante utilise une chaîne entre guillemets simples ('homepage'
) dans sa clause WHERE pour renvoyer des événements pour une page spécifique.
SELECT
timestamp,
endUserIds._experience.mcid.id
FROM {ANALYTICS_TABLE_NAME}
WHERE web.webPageDetails.name = 'homepage'
AND TIMESTAMP = to_timestamp('{TARGET_YEAR}-{TARGET_MONTH}-{TARGET_DAY}')
LIMIT 10
Guillemets doubles
Le guillemet double ("
) est utilisé pour déclarer un identifiant avec des espaces.
La requête suivante utilise des guillemets doubles pour renvoyer des valeurs de colonnes spécifiées lorsqu’une colonne contient une espace dans son identifiant :
SELECT
no_space_column,
"space column"
FROM
( SELECT
'column1' as no_space_column,
'column2' as "space column"
)
Accents graves
L’accent grave `
permet d’ignorer les noms de colonne réservés uniquement avec l’utilisation de la syntaxe de notation par points. Par exemple, comme order
est un mot réservé dans SQL, vous devez utiliser des accents graves pour accéder au champ commerce.order
:
SELECT
commerce.`order`
FROM {ANALYTICS_TABLE_NAME}
WHERE TIMESTAMP = to_timestamp('{TARGET_YEAR}-{TARGET_MONTH}-{TARGET_DAY}')
LIMIT 10
Les accents graves sont également utilisés pour accéder à un champ qui commence avec un nombre. Par exemple, pour accéder au champ 30_day_value
, vous devez utiliser la notation avec accents graves.
SELECT
commerce.`30_day_value`
FROM {ANALYTICS_TABLE_NAME}
WHERE TIMESTAMP = to_timestamp('{TARGET_YEAR}-{TARGET_MONTH}-{TARGET_DAY}')
LIMIT 10
Les accents graves ne sont pas nécessaires si vous utilisez la notation par crochets.
SELECT
commerce['order']
FROM {ANALYTICS_TABLE_NAME}
WHERE TIMESTAMP = to_timestamp('{TARGET_YEAR}-{TARGET_MONTH}-{TARGET_DAY}')
LIMIT 10
Affichage des informations du tableau
Après vous être connecté à Query Service, vous pouvez afficher tous les tableaux disponibles sur Experience Platform à l’aide des commandes \d
ou SHOW TABLES
.
Mode Tableau standard
La commande \d
affiche la vue PostgreSQL standard pour répertorier les tableaux. Vous trouverez ci-dessous un exemple de sortie de cette commande :
List of relations
Schema | Name | Type | Owner
--------+-----------------+-------+----------
public | luma_midvalues | table | postgres
public | luma_postvalues | table | postgres
(2 rows)
Vue détaillée du tableau
SHOW TABLES
commande est une commande personnalisée qui fournit des informations plus détaillées sur les tableaux. Vous trouverez ci-dessous un exemple de sortie de cette commande :
name | dataSetId | dataSet | description | resolved
-----------------+--------------------------+----------------+-------------+----------
luma_midvalues | 5bac030c29bb8d12fa992e58 | Luma midValues | | false
luma_postvalues | 5c86b896b3c162151785b43c | Luma midValues | | false
(2 rows)
Informations sur le schéma
Pour afficher des informations plus détaillées sur les schémas du tableau, vous pouvez utiliser la commande \d {TABLE_NAME}
, où {TABLE_NAME}
est le nom du tableau dont vous souhaitez afficher les informations de schéma.
L’exemple suivant illustre les informations de schéma de la table luma_midvalues
, qui s’affichent à l’aide de \d luma_midvalues
:
Table "public.luma_midvalues"
Column | Type | Collation | Nullable | Default
-------------------+-----------------------------+-----------+----------+---------
timestamp | timestamp | | |
_id | text | | |
productlistitems | anyarray | | |
commerce | luma_midvalues_commerce | | |
receivedtimestamp | timestamp | | |
enduserids | luma_midvalues_enduserids | | |
datasource | datasource | | |
web | luma_midvalues_web | | |
placecontext | luma_midvalues_placecontext | | |
identitymap | anymap | | |
marketing | marketing | | |
environment | luma_midvalues_environment | | |
_experience | luma_midvalues__experience | | |
device | device | | |
search | search | | |
De plus, vous pouvez obtenir des informations supplémentaires sur une colonne spécifique en ajoutant le nom de la colonne au nom du tableau. Cela serait écrit dans le format \d {TABLE_NAME}_{COLUMN}
.
L’exemple suivant montre des informations supplémentaires pour la colonne web
et sera appelé à l’aide de la commande suivante : \d luma_midvalues_web
:
Composite type "public.luma_midvalues_web"
Column | Type | Collation | Nullable | Default
----------------+-----------------------------------+-----------+----------+---------
webpagedetails | luma_midvalues_web_webpagedetails | | |
webreferrer | web_webreferrer | | |
Association de jeux de données
Vous pouvez joindre plusieurs jeux de données pour inclure des données provenant d’autres jeux de données dans votre requête.
L’exemple suivant joint les deux jeux de données suivants (your_analytics_table
et custom_operating_system_lookup
) et crée une instruction SELECT
pour les 50 premiers systèmes d’exploitation en fonction du nombre de pages vues.
Requête
SELECT
b.operatingsystem AS OperatingSystem,
SUM(a.web.webPageDetails.pageviews.value) AS PageViews
FROM your_analytics_table a
JOIN custom_operating_system_lookup b
ON a._experience.analytics.environment.operatingsystemID = b.operatingsystemid
WHERE TIMESTAMP >= TO_TIMESTAMP('2018-01-01') AND TIMESTAMP <= TO_TIMESTAMP('2018-12-31')
GROUP BY OperatingSystem
ORDER BY PageViews DESC
LIMIT 50;
Résultats
Déduplication
Query Service prend en charge la déduplication des données ou la suppression des lignes en double des données. Pour plus d’informations sur la déduplication, consultez le guide de déduplication de Query Service.
Calculs de fuseau horaire dans Query Service
Query Service normalise les données persistantes dans Adobe Experience Platform à l’aide du format d’horodatage UTC. Pour plus d’informations sur la traduction de vos exigences en matière de fuseau horaire vers et depuis un horodatage UTC, reportez-vous à la section FAQ sur la modification du fuseau horaire en et depuis un horodatage UTC.
Étapes suivantes
En lisant ce document, vous avez pris connaissance de certaines considérations importantes lors de la rédaction de requêtes à l’aide de Query Service. Pour plus d’informations sur l’utilisation de la syntaxe SQL pour la rédaction de vos propres requêtes, veuillez lire la documentation sur la syntaxe SQL.
Pour plus d’exemples de requêtes pouvant être utilisées dans Query Service, veuillez lire la documentation de cas d’utilisation suivante :