Documentatie Experience Platform Handleiding voor zoekservice

Gegevenssetvoorbeelden

Last update: Wed Oct 29 2025 00:00:00 GMT+0000 (Coordinated Universal Time)

Onderwerpen:
Query's

Gemaakt voor:

Gebruiker
Ontwikkelaar

De Dienst van de Vraag van Adobe Experience Platform verstrekt steekproefdatasets als deel van zijn benaderende mogelijkheden van de vraagverwerking. De datasets van de steekproef worden gecreeerd met eenvormige willekeurige steekproeven van bestaande Azure Data Lake Storage (ADLS) datasets gebruikend slechts een percentage verslagen van origineel. Dit percentage staat bekend als de bemonsteringsfrequentie. Als u de samplingfrequentie aanpast om de balans tussen nauwkeurigheid en verwerkingstijd te bepalen, kunt u verkennende query's uitvoeren op grote gegevens met een aanzienlijk kortere verwerkingstijd, wat ten koste gaat van de nauwkeurigheid van de query.

Aangezien vele gebruikers geen nauwkeurig antwoord voor een gezamenlijke verrichting over een dataset nodig hebben, is het uitgeven van een benaderende vraag om een benaderend antwoord terug te keren efficiënter voor verkennende vragen over grote datasets. Aangezien de steekproefdatasets slechts een percentage van de gegevens van de originele dataset bevatten, laat het u toe om vraagnauwkeurigheid voor een betere reactietijd te ruilen. Bij read-time, moet de Dienst van de Vraag minder rijen aftasten die sneller resultaten dan veroorzaakt als u de volledige dataset moest vragen.

Om u te helpen uw steekproeven voor benaderende vraagverwerking beheren, steunt de Dienst van de Vraag de volgende verrichtingen voor datasetsteekproeven:

Gegevenssetvoorbeelden

Aan de slag get-started

Als u de benaderende verwerkingsmogelijkheden voor query's die in dit document worden beschreven, wilt gebruiken, moet u de sessiemarkering instellen op true . Voer de opdracht SET aqp=true; in vanaf de opdrachtregel van de Query-editor of van uw PSQL-client.

NOTE

U moet de sessiemarkering inschakelen telkens wanneer u zich aanmeldt bij Experience Platform.

de Redacteur van de Vraag met SET qp=true;benadrukt bevel.

Een uniforme steekproef voor een willekeurige gegevensset maken create-a-sample

Gebruik het bevel ANALYZE TABLE <table_name> TABLESAMPLE SAMPLERATE x met een datasetnaam om een eenvormige willekeurige steekproef van die dataset tot stand te brengen.

Het steekproeftarief is het percentage verslagen die van de originele dataset worden genomen. U kunt de samplefrequentie bepalen met de trefwoorden TABLESAMPLE SAMPLERATE . In dit voorbeeld komt de waarde 5,0 overeen met een bemonsteringsfrequentie van 50%. Een waarde van 2,5 komt overeen met 25% enzovoort.

IMPORTANT

Het systeem staat maximaal vijf steekproeven voor elke dataset toe. Als u probeert om een zesde steekproefdataset tot stand te brengen, verschijnt een foutenmelding op het scherm die dat de steekproefgrens is bereikt.

ANALYZE TABLE example_dataset_name TABLESAMPLE SAMPLERATE 5.0;

Optioneel filtercriteria opgeven optional-filter-criteria

U kunt ervoor kiezen filtercriteria op te geven voor uniforme willekeurige monsters. Op deze manier kunt u een monster maken op basis van de gefilterde subset van de geanalyseerde tabel.

Wanneer u een voorbeeld maakt, wordt eerst het optionele filter toegepast en vervolgens wordt het voorbeeld gemaakt van de gefilterde weergave van de gegevensset. Een datasetsteekproef met een toegepast filter volgt het volgende vraagformaat:

ANALYZE TABLE <tableToAnalyze> TABLESAMPLE FILTERCONTEXT (<filter_condition>) SAMPLERATE X.Y;
ANALYZE TABLE <tableToAnalyze> TABLESAMPLE FILTERCONTEXT (<filter_condition_1> AND/OR <filter_condition_2>) SAMPLERATE X.Y;
ANALYZE TABLE <tableToAnalyze> TABLESAMPLE FILTERCONTEXT (<filter_condition_1> AND (<filter_condition_2> OR <filter_condition_3>)) SAMPLERATE X.Y;

Praktische voorbeelden van dit type gefilterde steekproefdataset zijn als volgt:

ANALYZE TABLE large_table TABLESAMPLE FILTERCONTEXT (month(to_timestamp(timestamp)) in ('8', '9')) SAMPLERATE 10;
ANALYZE TABLE large_table TABLESAMPLE FILTERCONTEXT (month(to_timestamp(timestamp)) in ('8', '9') AND product.name = "product1") SAMPLERATE 10;
ANALYZE TABLE large_table TABLESAMPLE FILTERCONTEXT (month(to_timestamp(timestamp)) in ('8', '9') AND (product.name = "product1" OR product.name = "product2")) SAMPLERATE 10;

In de gegeven voorbeelden is de tabelnaam large_table , de filtervoorwaarde in de oorspronkelijke tabel is month(to_timestamp(timestamp)) in ('8', '9') en de bemonsteringsfrequentie (X% van de gefilterde gegevens), in dit geval 10 .

De lijst met voorbeelden weergeven view-list-of-samples

Gebruik de functie sample_meta() om de lijst met voorbeelden weer te geven die aan een ADLS-tabel zijn gekoppeld.

SELECT sample_meta('example_dataset_name')

De lijst van datasetsteekproeven wordt getoond in het formaat van het hieronder voorbeeld.

                  sample_table_name                  |    sample_dataset_id     |    parent_dataset_id     | sample_type | sampling_rate | sample_num_rows |       created
|-----------------------------------------------------+--------------------------+--------------------------+-------------+---------------+-----------------+---------------------
 x5e5cd8ea0a83c418a8ef0928_uniform_4_0_percent_ughk7 | 62ff19853d338f1c07b18965 | 5e5cd8ea0a83c418a8ef0928 | uniform     |           4.0 |             391 | 19/08/2022 05:03:01
(1 row)

Vraag de steekproefdataset query-sample-datasets

Gebruik {EXAMPLE_DATASET_NAME} om steekproeflijsten direct te vragen. U kunt ook het trefwoord WITHAPPROXIMATE toevoegen aan het einde van een query en Query Service gebruikt automatisch het meest recent gemaakte voorbeeld.

SELECT * FROM example_dataset_name WITHAPPROXIMATE;

Gegevenssetvoorbeelden verwijderen delete-a-sample

De schrappingsverrichting staat u toe om nieuwe steekproeven tot stand te brengen zodra de maximumgrens van vijf datasetsteekproeven is bereikt.

DROP TABLESAMPLE x5e5cd8ea0a83c418a8ef0928_uniform_2_0_percent_bnhmc;

NOTE

Als u veelvoudige steekproefdatasets hebt die uit een originele dataset van ADLS worden afgeleid, wanneer origineel wordt gelaten vallen alle bijbehorende steekproeven ook worden geschrapt.

recommendation-more-help

ccf2b369-4031-483f-af63-a93b5ae5e3fb