Creare e pubblicare un modello di apprendimento automatico

Fingi di possedere un sito web online per la vendita al dettaglio. Quando i clienti acquistano il sito web per la vendita al dettaglio, desideri presentarli con consigli di prodotto personalizzati per esporre una varietà di altri prodotti offerti dalla tua azienda. Nel corso dell’esistenza del sito web, hai raccolto continuamente i dati dei clienti e desideri in qualche modo utilizzare tali dati per generare consigli sui prodotti personalizzati.

Adobe Experience Platform Data Science Workspace fornisce i mezzi per raggiungere il tuo obiettivo utilizzando la composizione predefinita del prodotto Recommendations. Segui questa esercitazione per scoprire come accedere e comprendere i tuoi dati retail, creare e ottimizzare un modello di apprendimento automatico e generare informazioni in Data Science Workspace.

Questa esercitazione riflette il flusso di lavoro di Data Science Workspace e descrive i seguenti passaggi per la creazione di un modello di apprendimento automatico:

  1. Preparare i dati
  2. Creare il modello
  3. Addestrare e valutare il modello
  4. Operazionalizzare il modello

Introduzione

Prima di avviare questa esercitazione, è necessario disporre dei seguenti prerequisiti:

  • Accesso a Adobe Experience Platform. Se non hai accesso a un'organizzazione IMS in Experience Platform, rivolgiti all'amministratore di sistema prima di procedere.

  • Risorse di abilitazione. Rivolgiti al rappresentante del tuo account per richiedere il provisioning dei seguenti elementi.

    • Ricetta Recommendations
    • Set di dati di ingresso Recommendations
    • Schema di input Recommendations
    • Set di dati di output Recommendations
    • Schema di output Recommendations
    • Set di dati dorati postValues
    • Schema set di dati dorati
  • Scarica i tre file Jupyter Notebook richiesti dall' Adobe public Git repository, che verranno utilizzati per dimostrare il flusso di lavoro JupyterLab in Data Science Workspace.

Informazioni sui seguenti concetti chiave utilizzati in questa esercitazione:

  • Experience Data Model: Lo sforzo di standardizzazione condotto da Adobe per definire schemi standard come Profile e ExperienceEvent per la gestione delle esperienze cliente.
  • Set di dati: Un costrutto di storage e gestione per i dati effettivi. Un'istanza fisica istanziata di uno schema XDM.
  • Batch: I set di dati sono costituiti da batch. Un batch è un insieme di dati raccolti in un periodo di tempo ed elaborati insieme come una singola unità.
  • JupyterLab: JupyterLab è un’interfaccia web open-source per Project Jupyter ed è strettamente integrata in Experience Platform.

Prepara i dati

Per creare un modello di apprendimento automatico che consigli prodotti personalizzati ai clienti, è necessario analizzare gli acquisti precedenti sul sito web. Questa sezione esplora il modo in cui questi dati vengono acquisiti in Platform tramite Adobe Analytics e come tali dati vengono trasformati in un set di dati di funzionalità che deve essere utilizzato dal modello di apprendimento automatico.

Esplorare i dati e comprendere gli schemi

Accedi a Adobe Experience Platform e seleziona Datasets per elencare tutti i set di dati esistenti e seleziona il set di dati da esplorare. In questo caso, il Analytics set di dati Golden Data Set postValues.

Viene visualizzata la pagina dell’attività del set di dati, in cui sono elencate le informazioni relative al set di dati. Per esaminare i record di esempio, seleziona Preview Dataset in alto a destra. Puoi anche visualizzare lo schema per il set di dati selezionato. Seleziona il collegamento dello schema nella barra a destra. Viene visualizzato un puntatore, quando si seleziona il collegamento in schema name lo schema viene aperto in una nuova scheda.

Gli altri set di dati sono stati precompilati con batch a scopo di visualizzazione dell’anteprima. Puoi visualizzare questi set di dati ripetendo i passaggi precedenti.

Nome set di dati Schema Descrizione
Set di dati dorati postValues Schema set di dati dorati Analytics dati di origine dal sito Web
Set di dati di ingresso Recommendations Schema di input Recommendations I dati Analytics vengono trasformati in un set di dati di formazione utilizzando una pipeline di funzioni. Questi dati vengono utilizzati per addestrare il Modello di apprendimento automatico del prodotto Recommendations. itemid e userid corrispondono a un prodotto acquistato da quel cliente.
Set di dati di output Recommendations Schema di output Recommendations Il set di dati per il quale sono memorizzati i risultati del punteggio conterrà l’elenco dei prodotti consigliati per ciascun cliente.

Creare il modello

Il secondo componente del ciclo di vita di Data Science Workspace include l'authoring di Esempi e modelli. Product Recommendations Recipe è progettato per generare consigli sui prodotti su larga scala utilizzando i dati di acquisto precedenti e l'apprendimento automatico.

Le ricette sono la base di un modello in quanto contengono algoritmi di apprendimento automatico e logica progettati per risolvere problemi specifici. Ancora più importante, le entrate consentono di democratizzare l'apprendimento automatico in tutta l'organizzazione, consentendo ad altri utenti di accedere a un modello per diversi casi d'uso senza scrivere alcun codice.

Esplora la ricetta Recommendations del prodotto

Ad Experience Platform, accedi a Models dalla colonna di navigazione a sinistra, quindi seleziona Recipes nella navigazione in alto per visualizzare un elenco delle ricette disponibili per la tua organizzazione.

Quindi, individua e apri il Recommendations Recipe fornito selezionandone il nome. Viene visualizzata la pagina di panoramica Ricetta .

Quindi, nella barra a destra, seleziona Recommendations Input Schema per visualizzare lo schema che sta alla base della ricetta. I campi dello schema "itemId" e "userId" corrispondono a un prodotto acquistato da tale cliente (interactionType) in un momento specifico (timestamp). Segui gli stessi passaggi per esaminare i campi relativi a Recommendations Output Schema.

Ora hai esaminato gli schemi di input e output richiesti da Product Recommendations Recipe. Procedi alla sezione successiva per scoprire come creare, addestrare e valutare un modello Recommendations per prodotto.

Traccia e valuta il modello

Ora che i dati sono preparati e la composizione è pronta, è possibile creare, addestrare e valutare il modello di apprendimento automatico.

Creare un modello

Un modello è un'istanza di una composizione, che consente di addestrare e valutare i dati in scala.

In Experience Platform, accedi a Models dalla colonna di navigazione a sinistra, quindi seleziona Recipes nella navigazione superiore. Viene visualizzato un elenco delle ricette disponibili per l'organizzazione. Selezionate la ricetta di raccomandazione del prodotto.

Dalla pagina della ricetta, seleziona Create Model.

crea modello

Il flusso di lavoro crea modello inizia selezionando una ricetta. Seleziona Recommendations Recipe , quindi seleziona Next nell’angolo in alto a destra.

Quindi, fornisci un nome di modello. Sono elencate le configurazioni disponibili per il modello che contengono le impostazioni per i comportamenti di formazione e valutazione predefiniti del modello. Esamina le configurazioni e seleziona Finish.

Viene reindirizzata la pagina di panoramica dei modelli con una nuova esecuzione di formazione generata. Un'esecuzione di formazione viene generata per impostazione predefinita quando viene creato un modello.

Puoi scegliere di attendere il completamento dell’esecuzione del corso di formazione oppure continuare a creare una nuova esecuzione del corso di formazione nella sezione seguente.

Addestra il modello utilizzando i parametri ipertestuali personalizzati

Nella pagina Panoramica modello, seleziona Train in alto a destra per creare una nuova esecuzione di formazione. Seleziona lo stesso set di dati di input utilizzato durante la creazione del modello e seleziona Next.

Viene visualizzata la pagina Configuration . Qui puoi configurare il valore delle esecuzioni di formazione num_recommendations, noto anche come iperparametro. Un modello addestrato e ottimizzato utilizzerà i parametri ipertestuali più performanti in base ai risultati dell'esecuzione di formazione.

Non è possibile apprendere gli iperparametri, pertanto è necessario assegnarli prima che si verifichino gli allenamenti. La regolazione degli iperparametri può modificare la precisione del modello addestrato. Poiché l'ottimizzazione di un modello è un processo iterativo, possono essere necessarie più fasi di formazione prima di ottenere una valutazione soddisfacente.

SUGGERIMENTO

Impostare num_recommendations su 10.

Nel grafico di valutazione del modello vengono visualizzati punti di dati aggiuntivi. Al termine dell’esecuzione, potrebbero essere necessari fino a diversi minuti per visualizzarlo.

Valutare il modello

Ogni volta che un'esecuzione di formazione viene completata, puoi visualizzare le metriche di valutazione risultanti per determinare il livello di prestazioni del modello.

Per esaminare le metriche di valutazione (precisione e richiamo) per ogni esecuzione di formazione completata, selezionare l'esecuzione di formazione.

Puoi esplorare le informazioni fornite per ogni metrica di valutazione. Più alte sono queste metriche, migliore sarà il modello eseguito.

Puoi visualizzare il set di dati, lo schema e i parametri di configurazione utilizzati per ogni esercitazione eseguita nella barra a destra. Torna alla pagina Modello e identifica l’esecuzione del corso di formazione più performante osservando le relative metriche di valutazione.

Operazionalizzare il modello

L’ultimo passaggio nel flusso di lavoro di Data Science consiste nell’operazionalizzare il modello al fine di valutare e utilizzare le informazioni provenienti dall’archivio dati.

Punteggio e generazione di approfondimenti

Nella pagina di panoramica del modello di consigli per i prodotti , seleziona il nome dell’esecuzione di formazione con le prestazioni migliori, con i valori di richiamo e precisione più elevati.

punteggio migliore

Quindi, in alto a destra della pagina dei dettagli dell’esecuzione del corso di formazione, seleziona Score.

seleziona punteggio

Quindi, seleziona Recommendations Input Dataset come set di dati di input per il punteggio, che è lo stesso set di dati utilizzato quando hai creato il Modello ed eseguito le relative esecuzioni di formazione. Quindi, seleziona Next.

Una volta che hai il set di dati di input, seleziona Recommendations Output Dataset come set di dati di output per il punteggio. I risultati del punteggio sono memorizzati in questo set di dati come batch.

Infine, controlla le configurazioni di punteggio. Questi parametri contengono i set di dati di input e output selezionati in precedenza insieme agli schemi appropriati. Seleziona Finish per iniziare l’esecuzione del punteggio. Il completamento dell'esecuzione potrebbe richiedere alcuni minuti.

Visualizzare le informazioni con punteggio

Una volta completata l’esecuzione del punteggio, puoi visualizzare in anteprima i risultati e le informazioni generate.

Nella pagina delle esecuzioni del punteggio, seleziona l’esecuzione del punteggio completato, quindi seleziona Preview Scoring Results Dataset nella barra a destra.

Nella tabella di anteprima, ogni riga contiene i consigli di prodotto per un particolare cliente, etichettati rispettivamente come recommendations e userId . Poiché il parametro iperparametro num_recommendations è stato impostato su 10 nelle schermate di esempio, ogni riga di consigli può contenere fino a 10 identità di prodotto delimitate da un simbolo numerico (#).

Passaggi successivi

Questa esercitazione ti ha introdotto al flusso di lavoro di Data Science Workspace, dimostrando come i dati non elaborati possono essere trasformati in informazioni utili tramite l’apprendimento automatico. Per ulteriori informazioni sull'utilizzo di Data Science Workspace, continua con la guida successiva su creazione dello schema di vendita al dettaglio e del set di dati.

In questa pagina