Commencer

Dans le cadre de ce processus, qui nécessite l’entraînement d’un modèle de machine learning, ce document suppose une connaissance pratique d’un ou de plusieurs environnements de machine learning.

Cet exemple utilise Python et l’environnement de développement Jupyter Notebook. Bien qu’il existe de nombreuses options disponibles, Jupyter Notebook est recommandé, car il s’agit d’une application web open source qui nécessite peu de calculs. Il peut être téléchargé à partir du site officiel de Jupyter.

Avant de commencer, vous devez importer les bibliothèques nécessaires. FuzzyWuzzy est une bibliothèque Python open source construite sur la bibliothèque difflib et utilisée pour faire correspondre des chaînes. Il utilise Levenshtein Distance pour calculer les différences entre les séquences et les motifs. FuzzyWuzzy a les exigences suivantes :

  • Python 2.4 (ou version ultérieure)
  • Python-Levenshtein

Sur la ligne de commande, utilisez la commande suivante pour installer FuzzyWuzzy :

pip install fuzzywuzzy

Ou utilisez la commande suivante pour installer également Python-Levenshtein :

pip install fuzzywuzzy[speedup]

Vous trouverez plus d’informations techniques sur les Fuzzywuzzy dans leur documentation officielle.

Se connecter à Query Service

Vous devez connecter votre modèle de machine learning à Query Service en fournissant vos informations d’identification de connexion. Des informations d’identification arrivant à expiration et non arrivant à expiration peuvent être fournies. Pour plus d’informations sur l’acquisition des informations d’identification nécessaires🔗 consultez le guide des informations d’identification . Si vous utilisez Jupyter Notebook, veuillez lire le guide complet sur comment se connecter à Query Service.

Veillez également à importer le package numpy dans votre environnement Python pour activer l’algèbre linéaire.

import numpy as np

Les commandes ci-dessous sont nécessaires pour se connecter à Query Service à partir de Jupyter Notebook :

import psycopg2
conn = psycopg2.connect('''
sslmode=require
host=<YOUR_ORGANIZATION_ID>
port=80
dbname=prod:all
user=<YOUR_ADOBE_ID_TO_CONNECT_TO_QUERY_SERVICE>
password=<YOUR_QUERY_SERVICE_PASSWORD>
''')
cur = conn.cursor()

Votre instance Jupyter Notebook est maintenant connectée à Query Service. Si la connexion est établie, aucun message ne s’affiche. Si la connexion a échoué, une erreur s’affiche.