查詢服務中的SQL語法
您可以在Adobe Experience Platform Query Service中為SELECT
敘述句使用標準ANSI SQL和其他有限命令。 本文介紹Query Service支援的SQL語法。
選取查詢 select-queries
下列語法定義了Query Service支援的SELECT
查詢:
[ WITH with_query [, ...] ]
SELECT [ ALL | DISTINCT [( expression [, ...] ) ] ]
[ * | expression [ [ AS ] output_name ] [, ...] ]
[ FROM from_item [, ...] ]
[ SNAPSHOT { SINCE start_snapshot_id | AS OF end_snapshot_id | BETWEEN start_snapshot_id AND end_snapshot_id } ]
[ WHERE condition ]
[ GROUP BY grouping_element [, ...] ]
[ HAVING condition [, ...] ]
[ WINDOW window_name AS ( window_definition ) [, ...] ]
[ { UNION | INTERSECT | EXCEPT | MINUS } [ ALL | DISTINCT ] select ]
[ ORDER BY expression [ ASC | DESC | USING operator ] [ NULLS { FIRST | LAST } ] [, ...] ]
[ LIMIT { count | ALL } ]
[ OFFSET start ]
下面的標籤區段提供FROM、GROUP和WITH關鍵字的可用選項。
code language-sql |
---|
|
code language-sql |
---|
|
code language-sql |
---|
|
code language-sql |
---|
|
code language-sql |
---|
|
code language-sql |
---|
|
code language-sql |
---|
|
code language-sql |
---|
|
code language-sql |
---|
|
code language-sql |
---|
|
code language-sql |
---|
|
下列小節提供您可在查詢中使用的其他條款的詳細資訊,前提是這些條款遵循上述格式。
SNAPSHOT子句
此子句可用於根據快照ID逐步讀取資料表上的資料。 快照ID是以長型別數字表示的查核點標籤,每次將資料寫入資料湖表格時都會套用至該數字。 SNAPSHOT
子句會將其自身附加到它旁邊所使用的資料表關係。
[ SNAPSHOT { SINCE start_snapshot_id | AS OF end_snapshot_id | BETWEEN start_snapshot_id AND end_snapshot_id } ]
範例
SELECT * FROM table_to_be_queried SNAPSHOT SINCE start_snapshot_id;
SELECT * FROM table_to_be_queried SNAPSHOT AS OF end_snapshot_id;
SELECT * FROM table_to_be_queried SNAPSHOT BETWEEN start_snapshot_id AND end_snapshot_id;
SELECT * FROM table_to_be_queried SNAPSHOT BETWEEN HEAD AND start_snapshot_id;
SELECT * FROM table_to_be_queried SNAPSHOT BETWEEN end_snapshot_id AND TAIL;
SELECT * FROM (SELECT id FROM table_to_be_queried BETWEEN start_snapshot_id AND end_snapshot_id) C
(SELECT * FROM table_to_be_queried SNAPSHOT SINCE start_snapshot_id) a
INNER JOIN
(SELECT * from table_to_be_joined SNAPSHOT AS OF your_chosen_snapshot_id) b
ON a.id = b.id;
下表說明SNAPSHOT子句中每個語法選項的意義。
SINCE start_snapshot_id
AS OF end_snapshot_id
BETWEEN start_snapshot_id AND end_snapshot_id
start_snapshot_id
且包括end_snapshot_id
。BETWEEN HEAD AND start_snapshot_id
start_snapshot_id
中的列。BETWEEN end_snapshot_id AND TAIL
end-snapshot_id
之後讀取資料到資料集結尾(不包括快照識別碼)。 這表示如果end_snapshot_id
是資料集中的最後一個快照,則查詢將傳回零列,因為除了最後一個快照之外,沒有任何快照。SINCE start_snapshot_id INNER JOIN table_to_be_joined AS OF your_chosen_snapshot_id ON table_to_be_queried.id = table_to_be_joined.id
table_to_be_queried
讀取從指定的快照識別碼開始的資料,並將其與來自table_to_be_joined
的資料聯結,因為它位於your_chosen_snapshot_id
。 此聯結是以兩個要聯結之表格的ID欄中的相符ID為基礎。SNAPSHOT
子句與資料表或資料表別名搭配使用,但不會在子查詢或檢視的頂端。 SNAPSHOT
子句可在任何可套用資料表上SELECT
查詢的位置運作。
此外,您也可以使用HEAD
和TAIL
做為快照子句的特殊位移值。 使用HEAD
會參照第一個快照之前的位移,而TAIL
會參照最後一個快照之後的位移。
resolve_fallback_snapshot_on_failure
),則可能會發生下列兩種情況:- 如果設定了選擇性備援行為旗標,查詢服務會選擇最早的可用快照,將其設定為開始快照,並傳回最早可用快照與指定結束快照之間的資料。 此資料為最早可用快照集的 包含。
WHERE子句
依預設,SELECT
查詢上的WHERE
子句產生的符合專案區分大小寫。 如果您希望比對不區分大小寫,可以使用關鍵字ILIKE
而非LIKE
。
[ WHERE condition { LIKE | ILIKE | NOT LIKE | NOT ILIKE } pattern ]
下表說明LIKE和ILIKE子句的邏輯:
WHERE condition LIKE pattern
~~
WHERE condition NOT LIKE pattern
!~~
WHERE condition ILIKE pattern
~~*
WHERE condition NOT ILIKE pattern
!~~*
範例
SELECT * FROM Customers
WHERE CustomerName ILIKE 'a%';
此查詢會傳回名稱以「A」或「a」開頭的客戶。
加入
使用聯結的SELECT
查詢的語法如下:
SELECT statement
FROM statement
[JOIN | INNER JOIN | LEFT JOIN | LEFT OUTER JOIN | RIGHT JOIN | RIGHT OUTER JOIN | FULL JOIN | FULL OUTER JOIN]
ON join condition
UNION、INTERSECT和EXCEPT
UNION
、INTERSECT
和EXCEPT
子句是用來合併或排除兩個或更多資料表中類似的資料列:
SELECT statement 1
[UNION | UNION ALL | UNION DISTINCT | INTERSECT | EXCEPT | MINUS]
SELECT statement 2
建立表格為選取 create-table-as-select
下列語法定義CREATE TABLE AS SELECT
(CTAS)查詢:
CREATE TABLE table_name [ WITH (schema='target_schema_title', rowvalidation='false', label='PROFILE') ] AS (select_query)
schema
rowvalidation
true
。label
profile
的這個標籤,將您的資料集標示為已啟用設定檔。 這表示您的資料集在建立後會自動標示為設定檔。 如需使用label
的詳細資訊,請參閱衍生屬性延伸檔案。select_query
範例
CREATE TABLE Chairs AS (SELECT color, count(*) AS no_of_chairs FROM Inventory i WHERE i.type=="chair" GROUP BY i.color)
CREATE TABLE Chairs WITH (schema='target schema title', label='PROFILE') AS (SELECT color, count(*) AS no_of_chairs FROM Inventory i WHERE i.type=="chair" GROUP BY i.color)
CREATE TABLE Chairs AS (SELECT color FROM Inventory SNAPSHOT SINCE 123)
SELECT
陳述式必須有彙總函式的別名,例如COUNT
、SUM
、MIN
等。 此外,SELECT
陳述式可以有括弧()或不含括弧()提供。 您可以提供SNAPSHOT
子句,將增量增量增量讀入目標資料表。插入到
INSERT INTO
命令的定義如下:
INSERT INTO table_name select_query
範例
INSERT INTO Customers SELECT SupplierName, City, Country FROM OnlineCustomers;
INSERT INTO Customers AS (SELECT * from OnlineCustomers SNAPSHOT AS OF 345)
SELECT
陳述式括在括弧()中。 此外,SELECT
陳述式結果的結構描述必須符合INSERT INTO
陳述式中定義的資料表結構描述。 您可以提供SNAPSHOT
子句,將增量增量增量讀入目標資料表。在根層級找不到實際XDM結構描述中的大部分欄位,且SQL不允許使用點標籤法。 若要使用巢狀欄位達到逼真的結果,您必須對應INSERT INTO
路徑中的每個欄位。
若要INSERT INTO
巢狀路徑,請使用下列語法:
INSERT INTO [dataset]
SELECT struct([source field1] as [target field in schema],
[source field2] as [target field in schema],
[source field3] as [target field in schema]) [tenant name]
FROM [dataset]
範例
INSERT INTO Customers SELECT struct(SupplierName as Supplier, City as SupplierCity, Country as SupplierCountry) _Adobe FROM OnlineCustomers;
放置表格
DROP TABLE
命令會卸除現有的資料表,並從檔案系統刪除與該資料表關聯的目錄(如果它不是外部資料表)。 如果資料表不存在,則會發生例外狀況。
DROP TABLE [IF EXISTS] [db_name.]table_name
IF EXISTS
建立資料庫
CREATE DATABASE
命令會建立Azure Data Lake Storage (ADLS)資料庫。
CREATE DATABASE [IF NOT EXISTS] db_name
卸除資料庫
DROP DATABASE
命令會從執行個體刪除資料庫。
DROP DATABASE [IF EXISTS] db_name
IF EXISTS
刪除結構描述
DROP SCHEMA
命令卸除現有的結構描述。
DROP SCHEMA [IF EXISTS] db_name.schema_name [ RESTRICT | CASCADE]
IF EXISTS
RESTRICT
CASCADE
建立檢視 create-view
SQL檢視是以SQL敘述句的結果集為基礎的虛擬表格。 使用CREATE VIEW
陳述式建立檢視,並為它命名。 然後,您可以使用該名稱來參照查詢的結果。 這可讓您更輕鬆地重複使用複雜查詢。
下列語法定義資料集的CREATE VIEW
查詢。 此資料集可以是ADLS或加速存放區資料集。
CREATE VIEW view_name AS select_query
範例
CREATE VIEW V1 AS SELECT color, type FROM Inventory
CREATE OR REPLACE VIEW V1 AS SELECT model, version FROM Inventory
下列語法定義了在資料庫和結構描述內容中建立檢視的CREATE VIEW
查詢。
範例
CREATE VIEW db_name.schema_name.view_name AS select_query
CREATE OR REPLACE VIEW db_name.schema_name.view_name AS select_query
db_name
schema_name
view_name
select_query
範例
CREATE VIEW <dbV1 AS SELECT color, type FROM Inventory;
CREATE OR REPLACE VIEW V1 AS SELECT model, version FROM Inventory;
顯示檢視
下列查詢顯示檢視清單。
SHOW VIEWS;
Db Name | Schema Name | Name | Id | Dataset Dependencies | Views Dependencies | TYPE
----------------------------------------------------------------------------------------------
qsaccel | profile_agg | view1 | view_id1 | dwh_dataset1 | | DWH
| | view2 | view_id2 | adls_dataset | adls_views | ADLS
(2 rows)
放置檢視
下列語法定義DROP VIEW
查詢:
DROP VIEW [IF EXISTS] view_name
IF EXISTS
view_name
範例
DROP VIEW v1
DROP VIEW IF EXISTS v1
匿名區塊 anonymous-block
匿名區塊包含兩個區段:可執行檔和例外狀況處理區段。 在匿名區塊中,可執行區段是必要的。 不過,「例外狀況處理」區段是選擇性的。
下列範例說明如何建立區塊,其中有一或多個要一起執行的陳述式:
$$BEGIN
statementList
[EXCEPTION exceptionHandler]
$$END
exceptionHandler:
WHEN OTHER
THEN statementList
statementList:
: (statement (';')) +
以下是使用匿名區塊的範例。
$$BEGIN
SET @v_snapshot_from = select parent_id from (select history_meta('email_tracking_experience_event_dataset') ) tab where is_current;
SET @v_snapshot_to = select snapshot_id from (select history_meta('email_tracking_experience_event_dataset') ) tab where is_current;
SET @v_log_id = select now();
CREATE TABLE tracking_email_id_incrementally
AS SELECT _id AS id FROM email_tracking_experience_event_dataset SNAPSHOT BETWEEN @v_snapshot_from AND @v_snapshot_to;
EXCEPTION
WHEN OTHER THEN
DROP TABLE IF EXISTS tracking_email_id_incrementally;
SELECT 'ERROR';
$$END;
匿名區塊中的條件陳述式 conditional-anonymous-block-statements
當條件評估為TRUE時,IF-THEN-ELSE控制項結構會啟用條件式執行陳述式清單。 此控制項結構僅適用於匿名區塊。 如果將此結構用作獨立命令,則會導致語法錯誤(「匿名區塊外部的命令無效」)。
下列程式碼片段示範匿名區塊中IF-THEN-ELSE條件陳述式的正確格式。
IF booleanExpression THEN
List of statements;
ELSEIF booleanExpression THEN
List of statements;
ELSEIF booleanExpression THEN
List of statements;
ELSE
List of statements;
END IF
範例
下列範例會執行SELECT 200;
。
$$BEGIN
SET @V = SELECT 2;
SELECT @V;
IF @V = 1 THEN
SELECT 100;
ELSEIF @V = 2 THEN
SELECT 200;
ELSEIF @V = 3 THEN
SELECT 300;
ELSE
SELECT 'DEFAULT';
END IF;
END$$;
此結構可與raise_error();
搭配使用,以傳回自訂錯誤訊息。 以下所示的程式碼區塊會以「自訂錯誤訊息」終止匿名區塊。
範例
$$BEGIN
SET @V = SELECT 5;
SELECT @V;
IF @V = 1 THEN
SELECT 100;
ELSEIF @V = 2 THEN
SELECT 200;
ELSEIF @V = 3 THEN
SELECT 300;
ELSE
SELECT raise_error('custom error message');
END IF;
END$$;
巢狀IF陳述式
匿名區塊中支援巢狀IF陳述式。
範例
$$BEGIN
SET @V = SELECT 1;
IF @V = 1 THEN
SELECT 100;
IF @V > 0 THEN
SELECT 1000;
END IF;
END IF;
END$$;
例外狀況區塊
匿名區塊中支援例外狀況區塊。
範例
$$BEGIN
SET @V = SELECT 2;
IF @V = 1 THEN
SELECT 100;
ELSEIF @V = 2 THEN
SELECT raise_error(concat('custom-error for v= ', '@V' ));
ELSEIF @V = 3 THEN
SELECT 300;
ELSE
SELECT 'DEFAULT';
END IF;
EXCEPTION WHEN OTHER THEN
SELECT 'THERE WAS AN ERROR';
END$$;
自動切換為JSON auto-to-json
查詢服務支援選擇性工作階段層級設定,以便從互動式SELECT查詢傳回頂層複雜欄位做為JSON字串。 auto_to_json
設定允許將複雜欄位中的資料以JSON傳回,然後使用標準程式庫剖析為JSON物件。
在執行包含複雜欄位的SELECT查詢之前,將功能標幟auto_to_json
設定為true。
set auto_to_json=true;
設定auto_to_json
標幟之前
下表提供套用auto_to_json
設定之前的查詢結果範例。 在這兩種情況下都使用同一個SELECT查詢(如下所示)來定位具有複雜欄位的表格。
SELECT * FROM TABLE_WITH_COMPLEX_FIELDS LIMIT 2;
結果如下:
_id | _experience | application | commerce | dataSource | device | endUserIDs | environment | identityMap | placeContext | receivedTimestamp | timestamp | userActivityRegion | web | _adcstageforpqs
-----------------------------------+----------------------------------------------------------------------------+--------------+----------------------------------------------+------------+--------------------------------------------------------------------+--------------------------------------------------------+-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+-----------------------------------------------------+-------------------------------------------------------------------------+-----------------------+-----------------------+--------------------+--------------------------------------------------------------------------------------+-----------------
31892EE15DE00000-401D52664FF48A52 | ("("("(1,1)","(1,1)")","(-209479095,4085488201,-2105158467,2189808829)")") | (background) | (NULL,"(USD,NULL)",NULL,NULL,NULL,NULL,NULL) | (475341) | (32,768,1024,205202,https://ns.adobe.com/xdm/external/deviceatlas) | ("("(31892EE080007B35-E6CE00000000000,"(AAID)",t)")") | ("(en-US,f,f,t,1.6,"Mozilla/5.0 (iPhone; U; CPU iPhone OS 4_1 like Mac OS X; ja-jp) AppleWebKit/532.9 (KHTML, like Gecko) Version/4.0.5 Mobile/8B117 Safari/6531.22.7",490,1125)",xo.net,64.3.235.13) | [AAID -> "{(31892EE080007B35-E6CE00000000000,t)}"] | ("("(34.01,-84.0)",lawrenceville,US,524,30043,ga)",600) | 2022-09-02 19:47:14.0 | 2022-09-02 19:47:14.0 | (UT1) | ("(f,Search Results,"(1.0)")","(http://www.google.com/search?ie=UTF-8&q=,internal)") |
31892EE15DE00000-401B92664FF48AE8 | ("("("(1,1)","(1,1)")","(-209479095,4085488201,-2105158467,2189808829)")") | (background) | (NULL,"(USD,NULL)",NULL,NULL,NULL,NULL,NULL) | (475341) | (32,768,1024,205202,https://ns.adobe.com/xdm/external/deviceatlas) | ("("(31892EE100007BF3-215FE00000000001,"(AAID)",t)")") | ("(en-US,f,f,t,1.5,"Mozilla/5.0 (iPhone; U; CPU iPhone OS 4_1 like Mac OS X; ja-jp) AppleWebKit/532.9 (KHTML, like Gecko) Version/4.0.5 Mobile/8B117 Safari/6531.22.7",768,556)",ntt.net,219.165.108.145) | [AAID -> "{(31892EE100007BF3-215FE00000000001,t)}"] | ("("(34.989999999999995,138.42)",shizuoka,JP,392005,420-0812,22)",-240) | 2022-09-02 19:47:14.0 | 2022-09-02 19:47:14.0 | (UT1) | ("(f,Home - JJEsquire,"(1.0)")","(NULL,typed_bookmarked)") |
(2 rows)
設定auto_to_json
標幟後
下表說明auto_to_json
設定在結果資料集上的結果差異。 兩種情況下都使用了相同的SELECT查詢。
_id | receivedTimestamp | timestamp | _experience | application | commerce | dataSource | device | endUserIDs | environment | identityMap | placeContext | userActivityRegion | web | _adcstageforpqs
-----------------------------------+-----------------------+-----------------------+-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+----------------------------------+----------------------------------+------------------+-------------------------------------------------------------------------------------------------------------------------------------------+----------------------------------------------------------------------------------------------------------------+--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+----------------------------------------------------------------------+----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+------------------------------+------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+-----------------
31892EE15DE00000-401D52664FF48A52 | 2022-09-02 19:47:14.0 | 2022-09-02 19:47:14.0 | {"analytics":{"customDimensions":{"eVars":{"eVar1":"1","eVar2":"1"},"props":{"prop1":"1","prop2":"1"}},"environment":{"browserID":-209479095,"browserIDStr":"4085488201","operatingSystemID":-2105158467,"operatingSystemIDStr":"2189808829"}}} | {"userPerspective":"background"} | {"order":{"currencyCode":"USD"}} | {"_id":"475341"} | {"colorDepth":32,"screenHeight":768,"screenWidth":1024,"typeID":"205202","typeIDService":"https://ns.adobe.com/xdm/external/deviceatlas"} | {"_experience":{"aaid":{"id":"31892EE080007B35-E6CE00000000000","namespace":{"code":"AAID"},"primary":true}}} | {"browserDetails":{"acceptLanguage":"en-US","cookiesEnabled":false,"javaEnabled":false,"javaScriptEnabled":true,"javaScriptVersion":"1.6","userAgent":"Mozilla/5.0 (iPhone; U; CPU iPhone OS 4_1 like Mac OS X; ja-jp) AppleWebKit/532.9 (KHTML, like Gecko) Version/4.0.5 Mobile/8B117 Safari/6531.22.7","viewportHeight":490,"viewportWidth":1125},"domain":"xo.net","ipV4":"64.3.235.13"} | {"AAID":[{"id":"31892EE080007B35-E6CE00000000000","primary":true}]} | {"geo":{"_schema":{"latitude":34.01,"longitude":-84.0},"city":"lawrenceville","countryCode":"US","dmaID":524,"postalCode":"30043","stateProvince":"ga"},"localTimezoneOffset":600} | {"dataCenterLocation":"UT1"} | {"webPageDetails":{"isHomePage":false,"name":"Search Results","pageViews":{"value":1.0}},"webReferrer":{"URL":"http://www.google.com/search?ie=UTF-8&q=","type":"internal"}} |
31892EE15DE00000-401B92664FF48AE8 | 2022-09-02 19:47:14.0 | 2022-09-02 19:47:14.0 | {"analytics":{"customDimensions":{"eVars":{"eVar1":"1","eVar2":"1"},"props":{"prop1":"1","prop2":"1"}},"environment":{"browserID":-209479095,"browserIDStr":"4085488201","operatingSystemID":-2105158467,"operatingSystemIDStr":"2189808829"}}} | {"userPerspective":"background"} | {"order":{"currencyCode":"USD"}} | {"_id":"475341"} | {"colorDepth":32,"screenHeight":768,"screenWidth":1024,"typeID":"205202","typeIDService":"https://ns.adobe.com/xdm/external/deviceatlas"} | {"_experience":{"aaid":{"id":"31892EE100007BF3-215FE00000000001","namespace":{"code":"AAID"},"primary":true}}} | {"browserDetails":{"acceptLanguage":"en-US","cookiesEnabled":false,"javaEnabled":false,"javaScriptEnabled":true,"javaScriptVersion":"1.5","userAgent":"Mozilla/5.0 (iPhone; U; CPU iPhone OS 4_1 like Mac OS X; ja-jp) AppleWebKit/532.9 (KHTML, like Gecko) Version/4.0.5 Mobile/8B117 Safari/6531.22.7","viewportHeight":768,"viewportWidth":556},"domain":"ntt.net","ipV4":"219.165.108.145"} | {"AAID":[{"id":"31892EE100007BF3-215FE00000000001","primary":true}]} | {"geo":{"_schema":{"latitude":34.989999999999995,"longitude":138.42},"city":"shizuoka","countryCode":"JP","dmaID":392005,"postalCode":"420-0812","stateProvince":"22"},"localTimezoneOffset":-240} | {"dataCenterLocation":"UT1"} | {"webPageDetails":{"isHomePage":false,"name":"Home - JJEsquire","pageViews":{"value":1.0}},"webReferrer":{"type":"typed_bookmarked"}} |
(2 rows)
解決失敗時的遞補快照 resolve-fallback-snapshot-on-failure
resolve_fallback_snapshot_on_failure
選項是用來解決快照識別碼過期的問題。 快照中繼資料會在兩天後到期,而過期的快照可能會使指令碼的邏輯失效。 使用匿名區塊時,可能會發生問題。
將resolve_fallback_snapshot_on_failure
選項設定為true,以使用先前的快照識別碼覆寫快照。
SET resolve_fallback_snapshot_on_failure=true;
下列程式碼行會以中繼資料中最早可用的snapshot_id
覆寫@from_snapshot_id
。
$$ BEGIN
SET resolve_fallback_snapshot_on_failure=true;
SET @from_snapshot_id = SELECT coalesce(last_snapshot_id, 'HEAD') FROM checkpoint_log a JOIN
(SELECT MAX(process_timestamp)process_timestamp FROM checkpoint_log
WHERE process_name = 'DIM_TABLE_ABC' AND process_status = 'SUCCESSFUL' )b
on a.process_timestamp=b.process_timestamp;
SET @to_snapshot_id = SELECT snapshot_id FROM (SELECT history_meta('DIM_TABLE_ABC')) WHERE is_current = true;
SET @last_updated_timestamp= SELECT CURRENT_TIMESTAMP;
INSERT INTO DIM_TABLE_ABC_Incremental
SELECT * FROM DIM_TABLE_ABC SNAPSHOT BETWEEN @from_snapshot_id AND @to_snapshot_id WHERE NOT EXISTS (SELECT _id FROM DIM_TABLE_ABC_Incremental a WHERE _id=a._id);
Insert Into
checkpoint_log
SELECT
'DIM_TABLE_ABC' process_name,
'SUCCESSFUL' process_status,
cast( @to_snapshot_id AS string) last_snapshot_id,
cast( @last_updated_timestamp AS TIMESTAMP) process_timestamp;
EXCEPTION
WHEN OTHER THEN
SELECT 'ERROR';
END
$$;
資料資產組織
隨著資料資產的成長,在Adobe Experience Platform資料湖中以邏輯方式組織這些資料資產非常重要。 Query Service可擴充SQL建構,讓您在邏輯上將資料資產分組在沙箱中。 這種組織方法允許在結構描述之間共用資料資產,而不需要實際移動它們。
下列使用標準SQL語法的SQL建構可供您以邏輯方式組織資料。
CREATE DATABASE dg1;
CREATE SCHEMA dg1.schema1;
CREATE table t1 ...;
CREATE view v1 ...;
ALTER TABLE t1 ADD PRIMARY KEY (c1) NOT ENFORCED;
ALTER TABLE t2 ADD FOREIGN KEY (c1) REFERENCES t1(c1) NOT ENFORCED;
請參閱資料資產的邏輯組織指南,取得查詢服務最佳實務的更詳細說明。
表格已存在
table_exists
SQL命令是用來確認資料表目前是否存在於系統中。 如果資料表 確實 存在,命令會傳回布林值: true
,如果資料表 確實 存在,則傳回false
。
藉由在執行陳述式之前驗證資料表是否存在,table_exists
功能會簡化寫入匿名區塊的程式,以涵蓋CREATE
和INSERT INTO
使用案例。
下列語法定義table_exists
命令:
$$
BEGIN
#Set mytableexist to true if the table already exists.
SET @mytableexist = SELECT table_exists('target_table_name');
#Create the table if it does not already exist (this is a one time operation).
CREATE TABLE IF NOT EXISTS target_table_name AS
SELECT *
FROM profile_dim_date limit 10;
#Insert data only if the table already exists. Check if @mytableexist = 'true'
INSERT INTO target_table_name (
select *
from profile_dim_date
WHERE @mytableexist = 'true' limit 20
) ;
EXCEPTION
WHEN other THEN SELECT 'ERROR';
END $$;
內嵌 inline
inline
函式將結構陣列中的元素分開,並將值產生到表格中。 它只能放在SELECT
清單或LATERAL VIEW
中。
inline
函式 無法 放在有其他產生器函式的選取清單中。
依預設,產生的欄會命名為「col1」、「col2」等。 如果運算式為NULL
,則不會產生任何列。
RENAME
命令重新命名資料行名稱。範例
> SELECT inline(array(struct(1, 'a'), struct(2, 'b'))), 'Spark SQL';
此範例傳回以下內容:
1 a Spark SQL
2 b Spark SQL
第二個範例進一步示範inline
函式的概念和應用程式。 此範例的資料模型如下圖所示。
範例
select inline(productListItems) from source_dataset limit 10;
從source_dataset
取得的值可用來填入目標資料表。
Spark SQL命令
以下小節涵蓋Query Service支援的Spark SQL命令。
設定
SET
命令會設定屬性,並傳回現有屬性的值或列出所有現有屬性。 如果提供現有屬性索引鍵的值,則會覆寫舊值。
SET property_key = property_value
property_key
property_value
若要傳回任何設定的值,請使用不含property_value
的SET [property key]
。
PostgreSQL命令
以下子區段涵蓋Query Service支援的PostgreSQL命令。
分析表格 analyze-table
ANALYZE TABLE
命令會針對一個或多個具名資料表執行分佈分析和統計計算。 ANALYZE TABLE
的使用會因資料集是儲存在加速存放區還是資料湖而有所不同。 如需其使用方式的詳細資訊,請參閱其各自的章節。
加速存放區上的計算統計資料 compute-statistics-accelerated-store
ANALYZE TABLE
命令會計算加速存放區上資料表的統計資料。 統計資料是在加速存放區上特定資料表的已執行CTAS或ITAS查詢上計算的。
範例
ANALYZE TABLE <original_table_name>
以下是使用ANALYZE TABLE
命令後可用的統計計算清單:-
field
data-type
count
distinct-count
missing
max
min
mean
stdev
資料湖上的計算統計資料 compute-statistics-data-lake
您現在可以使用COMPUTE STATISTICS
SQL命令計算Azure Data Lake Storage (ADLS)資料集的資料行層級統計資料。 計算整個資料集、資料集子集、所有欄或欄子集上的欄統計資料。
COMPUTE STATISTICS
擴充ANALYZE TABLE
命令。 但是,加速存放區資料表不支援COMPUTE STATISTICS
、FILTERCONTEXT
和FOR COLUMNS
命令。 ANALYZE TABLE
命令的這些延伸目前僅支援ADLS表格。
範例
ANALYZE TABLE tableName FILTERCONTEXT (timestamp >= to_timestamp('2023-04-01 00:00:00') and timestamp <= to_timestamp('2023-04-05 00:00:00')) COMPUTE STATISTICS FOR COLUMNS (commerce, id, timestamp);
FILTER CONTEXT
命令會根據提供的篩選條件,計算資料集子集的統計資料。 FOR COLUMNS
命令會鎖定特定資料行進行分析。
Statistics ID
和統計資料只對每一個工作階段有效,無法跨不同的PSQL工作階段存取。限制:
- 陣列或對應資料型別不支援產生統計資料
- 計算的統計資料是 不 跨工作階段持續存在。
skip_stats_for_complex_datatypes
SET skip_stats_for_complex_datatypes = false
主控台輸出會顯示如下。
| Statistics ID |
| ---------------------- |
| adc_geometric_stats_1 |
(1 row)
然後,您可以參照Statistics ID
直接查詢計算的統計資料。 使用Statistics ID
或下列範例陳述式中所示的別名來完整檢視輸出。 若要深入瞭解此功能,請參閱別名檔案。
-- This statement gets the statistics generated for `alias adc_geometric_stats_1`.
SELECT * FROM adc_geometric_stats_1;
使用SHOW STATISTICS
命令來顯示工作階段中產生之所有暫時統計資料的中繼資料。 這個指令可以協助您縮小統計分析的範圍。
SHOW STATISTICS;
SHOW STATISTICS的範例輸出如下所示。
statsId | tableName | columnSet | filterContext | timestamp
----------------------+---------------+-----------+-----------------------------+--------------------
adc_geometric_stats_1 | adc_geometric | (age) | | 25/06/2023 09:22:26
demo_table_stats_1 | demo_table | (*) | ((age > 25)) | 25/06/2023 12:50:26
age_stats | castedtitanic | (age) | ((age > 25) AND (age < 40)) | 25/06/2023 09:22:26
如需詳細資訊,請參閱資料集統計資料檔案。
表格範例 tablesample
Adobe Experience Platform查詢服務提供範例資料集,作為其近似查詢處理功能的一部分。
若不需要資料集彙總作業的精確答案,最好使用資料集範例。 若要藉由發出近似查詢以傳回近似答案,對大型資料集執行更有效的探索查詢,請使用TABLESAMPLE
功能。
範例資料集是使用現有Azure Data Lake Storage (ADLS)資料集的統一隨機範例建立的,僅使用原始資料集的記錄百分比。 資料集範例功能使用TABLESAMPLE
和SAMPLERATE
SQL命令擴充ANALYZE TABLE
命令。
在以下範例中,第一行示範如何計算表格的5%樣本。 第二行示範如何從表格內資料的篩選檢視中計算5%樣本。
範例
ANALYZE TABLE tableName TABLESAMPLE SAMPLERATE 5;
ANALYZE TABLE tableName FILTERCONTEXT (timestamp >= to_timestamp('2023-01-01')) TABLESAMPLE SAMPLERATE 5:
如需詳細資訊,請參閱資料集範例檔案。
開始
BEGIN
命令,或者是BEGIN WORK
或BEGIN TRANSACTION
命令會起始交易區塊。 在開始命令之後輸入的任何陳述式都會在單一交易中執行,直到給出明確的COMMIT或ROLLBACK命令為止。 這個命令與START TRANSACTION
相同。
BEGIN
BEGIN WORK
BEGIN TRANSACTION
關閉
CLOSE
命令會釋放與開啟游標相關的資源。 游標關閉後,不允許對其執行後續操作。 游標不再需要時,應該將其關閉。
CLOSE name
CLOSE ALL
如果使用CLOSE name
,name
代表必須關閉的開啟游標名稱。 如果使用CLOSE ALL
,則會關閉所有開啟的游標。
解除配置
若要解除配置先前準備的SQL陳述式,請使用DEALLOCATE
命令。 如果您沒有明確解除配置準備好的陳述式,會在工作階段結束時解除配置。 您可以在PREPARE命令區段中找到更多有關準備陳述式的資訊。
DEALLOCATE name
DEALLOCATE ALL
如果使用DEALLOCATE name
,則name
代表必須取消配置的準備陳述式名稱。 如果使用DEALLOCATE ALL
,則會取消配置所有準備好的陳述式。
宣告
DECLARE
命令可讓使用者建立游標,該游標可用來從較大的查詢中擷取少量資料列。 建立游標之後,會使用FETCH
從其中擷取資料列。
DECLARE name CURSOR FOR query
name
query
SELECT
或VALUES
命令。執行
EXECUTE
命令是用來執行先前準備的陳述式。 由於準備的陳述式只存在於工作階段中,所以準備的陳述式必須是由目前工作階段中先前執行的PREPARE
陳述式所建立。 您可以在PREPARE
命令區段中找到更多有關使用準備陳述式的資訊。
如果建立陳述式的PREPARE
陳述式指定了某些引數,則必須將相容的引數集傳遞至EXECUTE
陳述式。 如果未傳入這些引數,則會引發錯誤。
EXECUTE name [ ( parameter ) ]
name
parameter
說明
EXPLAIN
命令會顯示所提供陳述式的執行計畫。 執行計畫會顯示如何掃描陳述式所參考的資料表。 如果參照了多個表格,它會顯示使用哪些聯結演演算法來合併每個輸入表格中所需的列。
EXPLAIN statement
若要定義回應的格式,請使用FORMAT
關鍵字搭配EXPLAIN
命令。
EXPLAIN FORMAT { TEXT | JSON } statement
FORMAT
FORMAT
命令指定輸出格式。 可用的選項為TEXT
或JSON
。 非文字輸出包含與文字輸出格式相同的資訊,但程式更容易剖析。 此引數預設為TEXT
。statement
SELECT
、INSERT
、UPDATE
、DELETE
、VALUES
、EXECUTE
、DECLARE
、CREATE TABLE AS
或CREATE MATERIALIZED VIEW AS
陳述式。EXPLAIN
關鍵字執行時,SELECT
陳述式可能傳回的任何輸出都會被捨棄。 陳述式的其他副作用如常發生。範例
下列範例顯示具有單一integer
欄和10000個資料列的資料表上的簡單查詢計畫:
EXPLAIN SELECT * FROM foo;
QUERY PLAN
---------------------------------------------------------
Seq Scan on foo (dataSetId = "6307eb92f90c501e072f8457", dataSetName = "foo") [0,1000000242,6973776840203d3d,6e616c58206c6153,6c6c6f430a3d4d20,74696d674c746365]
(1 row)
擷取
FETCH
命令使用先前建立的游標擷取資料列。
FETCH num_of_rows [ IN | FROM ] cursor_name
num_of_rows
cursor_name
準備 prepare
PREPARE
命令可讓您建立準備好的陳述式。 準備的陳述式是伺服器端物件,可用來將類似的SQL陳述式範本化。
準備的陳述式可以使用引數,這些引數是在執行時替代到陳述式中的值。 使用已準備的陳述式時,引數會依位置參照,使用$1、$2等。
您可以選擇指定引數資料型別的清單。 如果未列出引數的資料型別,則可以從內容推斷型別。
PREPARE name [ ( data_type [, ...] ) ] AS SELECT
name
data_type
回覆
ROLLBACK
命令會取消目前的交易,並捨棄該交易所做的所有更新。
ROLLBACK
ROLLBACK WORK
選取到
SELECT INTO
命令會建立新資料表,並以查詢計算的資料填入該資料表。 資料不會傳回給使用者端,因為它與一般的SELECT
命令相同。 新資料表的資料行具有與SELECT
命令的輸出資料行關聯的名稱和資料型別。
[ WITH [ RECURSIVE ] with_query [, ...] ]
SELECT [ ALL | DISTINCT [ ON ( expression [, ...] ) ] ]
* | expression [ [ AS ] output_name ] [, ...]
INTO [ TEMPORARY | TEMP | UNLOGGED ] [ TABLE ] new_table
[ FROM from_item [, ...] ]
[ WHERE condition ]
[ GROUP BY expression [, ...] ]
[ HAVING condition [, ...] ]
[ WINDOW window_name AS ( window_definition ) [, ...] ]
[ { UNION | INTERSECT | EXCEPT } [ ALL | DISTINCT ] select ]
[ ORDER BY expression [ ASC | DESC | USING operator ] [ NULLS { FIRST | LAST } ] [, ...] ]
[ LIMIT { count | ALL } ]
[ OFFSET start [ ROW | ROWS ] ]
[ FETCH { FIRST | NEXT } [ count ] { ROW | ROWS } ONLY ]
[ FOR { UPDATE | SHARE } [ OF table_name [, ...] ] [ NOWAIT ] [...] ]
在SELECT查詢區段中找到有關標準SELECT查詢引數的詳細資訊。 本節僅列出SELECT INTO
命令專屬的引數。
TEMPORARY
或TEMP
UNLOGGED
new_table
範例
下列查詢會建立新資料表films_recent
,其中僅包含資料表films
中的最近專案:
SELECT * INTO films_recent FROM films WHERE date_prod >= '2002-01-01';
顯示
SHOW
命令會顯示執行階段引數的目前設定。 這些變數可以使用SET
陳述式、透過編輯postgresql.conf
組態檔、透過PGOPTIONS
環境變數(當使用libpq或以libpq為基礎的應用程式時)或透過命令列旗標在啟動Postgres伺服器時進行設定。
SHOW name
SHOW ALL
name
SERVER_VERSION
:此引數顯示伺服器的版本號碼。SERVER_ENCODING
:此引數顯示伺服器端字元集編碼。LC_COLLATE
:此引數顯示定序(文字順序)的資料庫地區設定。LC_CTYPE
:此引數顯示用於字元分類的資料庫地區設定。IS_SUPERUSER
:此引數顯示目前的角色是否具有超級使用者許可權。ALL
範例
下列查詢顯示引數DateStyle
的目前設定。
SHOW DateStyle;
DateStyle
-----------
ISO, MDY
(1 row)
複製
COPY
命令會將任何SELECT
查詢的輸出複製到指定位置。 使用者必須擁有此位置的存取權,才能順利執行此命令。
COPY query
TO '%scratch_space%/folder_location'
[ WITH FORMAT 'format_name']
query
format_name
format_name
可以是parquet
、csv
或json
其中之一。 預設值為parquet
。adl://<ADLS_URI>/users/<USER_ID>/acp_foundation_queryService/folder_location/<QUERY_ID>
變更表格 alter-table
ALTER TABLE
命令可讓您新增或刪除主索引鍵或外部索引鍵條件約束,並將資料行新增至資料表。
新增或卸除限制
下列SQL查詢顯示新增或卸除限制至表格的範例。 主索引鍵和外部索引鍵限制可使用逗號分隔值新增到多個欄中。 您可以傳遞兩個或多個欄名稱值來建立複合索引鍵,如以下範例所示。
定義主要或複合金鑰
ALTER TABLE table_name ADD CONSTRAINT PRIMARY KEY ( column_name ) NAMESPACE namespace
ALTER TABLE table_name ADD CONSTRAINT PRIMARY KEY ( column_name1, column_name2 ) NAMESPACE namespace
根據一或多個索引鍵定義資料表之間的關係
ALTER TABLE table_name ADD CONSTRAINT FOREIGN KEY ( column_name ) REFERENCES referenced_table_name ( primary_column_name )
ALTER TABLE table_name ADD CONSTRAINT FOREIGN KEY ( column_name1, column_name2 ) REFERENCES referenced_table_name ( primary_column_name1, primary_column_name2 )
定義識別資料行
ALTER TABLE table_name ADD CONSTRAINT PRIMARY IDENTITY ( column_name ) NAMESPACE namespace
ALTER TABLE table_name ADD CONSTRAINT IDENTITY ( column_name ) NAMESPACE namespace
卸除條件約束/關聯性/身分
ALTER TABLE table_name DROP CONSTRAINT PRIMARY KEY ( column_name )
ALTER TABLE table_name DROP CONSTRAINT PRIMARY KEY ( column_name1, column_name2 )
ALTER TABLE table_name DROP CONSTRAINT FOREIGN KEY ( column_name )
ALTER TABLE table_name DROP CONSTRAINT FOREIGN KEY ( column_name1, column_name2 )
ALTER TABLE table_name DROP CONSTRAINT PRIMARY IDENTITY ( column_name )
ALTER TABLE table_name DROP CONSTRAINT IDENTITY ( column_name )
table_name
column_name
referenced_table_name
primary_column_name
新增或刪除主要和次要身分
若要新增或刪除主要與次要識別資料表資料行的條件約束,請使用ALTER TABLE
命令。
下列範例透過新增限制來新增主要身分和次要身分。
ALTER TABLE t1 ADD CONSTRAINT PRIMARY IDENTITY (id) NAMESPACE 'IDFA';
ALTER TABLE t1 ADD CONSTRAINT IDENTITY(id) NAMESPACE 'IDFA';
也可以透過捨棄限制來移除身分,如下面的範例所示。
ALTER TABLE t1 DROP CONSTRAINT PRIMARY IDENTITY (c1) ;
ALTER TABLE t1 DROP CONSTRAINT IDENTITY (c1) ;
如需詳細資訊,請參閱在臨時資料集中設定身分的相關檔案。
新增欄
下列SQL查詢顯示新增資料行至表格的範例。
ALTER TABLE table_name ADD COLUMN column_name data_type
ALTER TABLE table_name ADD COLUMN column_name_1 data_type1, column_name_2 data_type2
支援的資料型別
下表列出在Azure SQL中將資料行新增到具有Postgres SQL、XDM和Accelerated Database Recovery (ADR)的表格時接受的資料型別。
bigint
int8
bigint
integer
int4
integer
smallint
int2
smallint
tinyint
int1
tinyint
varchar(len)
string
varchar(len)
varchar
。double
float8
double precision
FLOAT8
和FLOAT
是DOUBLE PRECISION
的有效同義字。 double precision
是浮點資料型別。 浮點值會儲存在8位元組中。double precision
float8
double precision
FLOAT8
是double precision
的有效同義字。double precision
是浮點資料型別。 浮點值會儲存在8位元組中。date
date
date
date
資料型別是4位元組儲存的行事曆日期值,沒有任何時間戳記資訊。 有效日期的範圍為01-01-0001到12-31-9999。datetime
datetime
datetime
datetime
包含限定詞: year、month、day、hour、second和fraction。 datetime
宣告可包含這些時間單位中在該順序中連結的任何子集,或甚至僅包含單一時間單位。char(len)
string
char(len)
char(len)
關鍵字用於表示專案是長度固定的字元。新增結構描述
下列SQL查詢顯示將表格新增至資料庫/綱要的範例。
ALTER TABLE table_name ADD SCHEMA database_name.schema_name
移除結構描述
下列SQL查詢顯示從資料庫/綱要移除表格的範例。
ALTER TABLE table_name REMOVE SCHEMA database_name.schema_name
參數
table_name
column_name
data_type
顯示主索引鍵
SHOW PRIMARY KEYS
命令會列出指定資料庫的所有主索引鍵條件約束。
SHOW PRIMARY KEYS
tableName | columnName | datatype | namespace
------------------+----------------------+----------+-----------
table_name_1 | column_name1 | text | "ECID"
table_name_2 | column_name2 | text | "AAID"
顯示外部索引鍵
SHOW FOREIGN KEYS
命令會列出指定資料庫的所有外部索引鍵條件約束。
SHOW FOREIGN KEYS
tableName | columnName | datatype | referencedTableName | referencedColumnName | namespace
------------------+---------------------+----------+---------------------+----------------------+-----------
table_name_1 | column_name1 | text | table_name_3 | column_name3 | "ECID"
table_name_2 | column_name2 | text | table_name_4 | column_name4 | "AAID"
顯示資料群組
SHOW DATAGROUPS
命令會傳回所有關聯資料庫的表格。 對於每個資料庫,表格都包含綱要、群組型別、子型別、子名稱和子ID。
SHOW DATAGROUPS
Database | Schema | GroupType | ChildType | ChildName | ChildId
-------------+-------------------+-----------+----------------------+----------------------------------------------------+--------------------------------------
adls_db | adls_scheema | ADLS | Data Lake Table | adls_table1 | 6149ff6e45cfa318a76ba6d3
adls_db | adls_scheema | ADLS | Accelerated Store | _table_demo1 | 22df56cf-0790-4034-bd54-d26d55ca6b21
adls_db | adls_scheema | ADLS | View | adls_view1 | c2e7ddac-d41c-40c5-a7dd-acd41c80c5e9
adls_db | adls_scheema | ADLS | View | adls_view4 | b280c564-df7e-405f-80c5-64df7ea05fc3
顯示表格的資料群組
SHOW DATAGROUPS FOR 'table_name'
命令會傳回包含引數作為其子系的所有關聯資料庫的表格。 對於每個資料庫,表格都包含綱要、群組型別、子型別、子名稱和子ID。
SHOW DATAGROUPS FOR 'table_name'
參數
table_name
:您要尋找關聯資料庫的資料表名稱。
Database | Schema | GroupType | ChildType | ChildName | ChildId
-------------+-------------------+-----------+----------------------+----------------------------------------------------+--------------------------------------
dwh_db_demo | schema2 | QSACCEL | Accelerated Store | _table_demo2 | d270f704-0a65-4f0f-b3e6-cb535eb0c8ce
dwh_db_demo | schema1 | QSACCEL | Accelerated Store | _table_demo2 | d270f704-0a65-4f0f-b3e6-cb535eb0c8ce
qsaccel | profile_aggs | QSACCEL | Accelerated Store | _table_demo2 | d270f704-0a65-4f0f-b3e6-cb535eb0c8ce