(Eingeschränkte Version) Datensatzbeispiele

WICHTIG

Die Datensatzbeispielfunktion ist derzeit in einer eingeschränkten Version verfügbar und steht nicht allen Kunden zur Verfügung.

Adobe Experience Platform Query Service bietet Beispiel-Datensätze als Teil seiner Funktionen zur ungefähren Abfrageverarbeitung. Beispieldatensätze werden mit einheitlichen Zufallsproben aus vorhandenen Azure Data Lake Storage (ADLS)-Datensätze, die nur einen Prozentsatz der Datensätze aus dem Original verwenden. Dieser Prozentsatz wird als Sampling-Rate bezeichnet. Durch die Anpassung der Stichprobenrate zur Kontrolle der Genauigkeit und Verarbeitungszeit können Sie forschende Abfragen zu Big Data durchführen, wobei die Verarbeitungszeit auf Kosten der Genauigkeit der Abfrage erheblich verkürzt wird.

Da viele Benutzer keine genaue Antwort für einen Aggregat-Vorgang über einen Datensatz benötigen, ist die Ausgabe einer Näherungsabfrage zur Rückgabe einer ungefähren Antwort für explorative Abfragen über große Datensätze effizienter. Da Beispieldatensätze nur einen Prozentsatz der Daten aus dem ursprünglichen Datensatz enthalten, können Sie die Abfragegenauigkeit für eine verbesserte Antwortzeit nutzen. Zum Lesen muss Query Service weniger Zeilen scannen, was Ergebnisse schneller generiert, als wenn Sie den gesamten Datensatz abfragen würden.

Um Ihnen bei der Verwaltung Ihrer Beispiele für die ungefähre Abfrageverarbeitung zu helfen, unterstützt Query Service die folgenden Vorgänge für Datensatzbeispiele:

Erste Schritte

Um die oben beschriebenen Funktionen zur ungefähren Abfrageverarbeitung zu verwenden, müssen Sie das Sitzungs-Flag auf true. Geben Sie in der Befehlszeile des Abfrage-Editors oder Ihres PSQL-Clients die SET aqp=true; Befehl.

HINWEIS

Sie müssen jedes Mal, wenn Sie sich bei Platform anmelden, das Sitzungs-Flag aktivieren.

Der Abfrage-Editor mit dem Befehl "SET aqp=true;" hervorgehoben.

Erstellen einer einheitlichen Stichprobe zufälliger Datensätze

Verwenden Sie die ANALYZE TABLE -Befehl mit einem Datensatznamen, um eine einheitliche zufällige Stichprobe aus diesem Datensatz zu erstellen.

Die Stichprobenrate ist der Prozentsatz der Datensätze, die aus dem ursprünglichen Datensatz entnommen wurden. Sie können die Stichprobenrate mithilfe des TABLESAMPLE SAMPLERATE Suchbegriffe. In diesem Beispiel entspricht der Wert von 5,0 einer Stichprobenrate von 50 %. Ein Wert von 2,5 würde 25 % usw. entsprechen.

WICHTIG

Das System lässt für jeden Datensatz maximal fünf Proben zu. Wenn Sie versuchen, einen sechsten Beispieldatensatz zu erstellen, wird auf dem Bildschirm eine Fehlermeldung angezeigt, die besagt, dass die Stichprobenbegrenzung erreicht wurde.

ANALYZE TABLE example_dataset_name TABLESAMPLE SAMPLERATE 5.0;

Anzeigen der Beispielliste

Verwenden Sie die sample_meta() -Funktion, um die Liste der mit einer ADLS-Tabelle verknüpften Beispiele anzuzeigen.

SELECT sample_meta('example_dataset_name')

Die Liste der Datensatzbeispiele wird im folgenden Format angezeigt.

                  sample_table_name                  |    sample_dataset_id     |    parent_dataset_id     | sample_type | sampling_rate | sample_num_rows |       created
-----------------------------------------------------+--------------------------+--------------------------+-------------+---------------+-----------------+---------------------
 x5e5cd8ea0a83c418a8ef0928_uniform_4_0_percent_ughk7 | 62ff19853d338f1c07b18965 | 5e5cd8ea0a83c418a8ef0928 | uniform     |           4.0 |             391 | 19/08/2022 05:03:01
(1 row)

Beispieldatensatz abfragen

Verwenden Sie die {EXAMPLE_DATASET_NAME} , um Beispieltabellen direkt abzufragen. Alternativ können Sie die WITHAPPROXIMATE -Keyword an das Ende einer Abfrage anhängen, und Query Service verwendet automatisch das zuletzt erstellte Beispiel.

SELECT * FROM example_dataset_name WITHAPPROXIMATE;

Datensatzbeispiele löschen

Mit dem Löschvorgang können Sie neue Beispiele erstellen, sobald die maximale Grenze von fünf Datensatzbeispielen erreicht wurde.

DROP TABLE SAMPLE x5e5cd8ea0a83c418a8ef0928_uniform_2_0_percent_bnhmc;
HINWEIS

Wenn Sie mehrere Beispieldatensätze aus einem ursprünglichen ADLS-Datensatz haben, werden beim Ablegen des Originals auch alle zugehörigen Beispiele gelöscht.

Auf dieser Seite