온라인 소매 웹 사이트를 소유하고 있다고 가정해 보십시오. 고객이 소매 웹 사이트에서 쇼핑할 때 개인화된 제품 권장 사항을 제시하여 비즈니스에 제공하는 다양한 기타 제품을 표시하고 싶을 것입니다. 웹 사이트 존재의 기간 동안 고객 데이터를 지속적으로 수집하여 이 데이터를 통해 맞춤형 제품 추천을 생성하고자 합니다.
Adobe Experience Platform Data Science Workspace 사전 제작된 제품 Recommendations 레시피를 사용하여 목표를 달성할 수 있는 방법을 제공합니다. 이 튜토리얼에 따라 소매 데이터에 액세스하고 이를 이해하며 기계 학습 모델을 생성 및 최적화하고 인사이트를 생성하는 방법을 확인하십시오 Data Science Workspace.
이 자습서는 기계 학습 모델 Data Science Workspace을 만들기 위한 다음 단계에 대해 설명합니다.
이 튜토리얼을 시작하기 전에 다음 전제 조건이 필요합니다.
액세스 권한 Adobe Experience Platform. 에서 IMS 조직에 액세스할 수 없는 경우 시스템 관리자 Experience Platform에게 연락하여 진행하십시오.
활성 에셋. 다음 항목을 제공하려면 계정 담당자에게 문의하십시오.
Adobe Jupyter Notebook 공용 저장소에서 필요한 세 개의 파일 Git 을 다운로드하면이 파일을 사용하여 작업 과정을 JupyterLab 보여줍니다 Data Science Workspace.
이 튜토리얼에서 사용되는 다음 주요 개념에 대한 작업 이해:
고객에게 개인화된 제품을 추천할 수 있는 기계 학습 모델을 만들려면 웹 사이트에서 이전에 구입한 고객을 분석해야 합니다. 이 섹션에서는 이 데이터가 어떻게 수집되는지 Platform 와 이 데이터가 기계 학습 모델에 의해 사용되는 기능 데이터 세트로 어떻게 변환되는지 Adobe Analytics살펴봅니다.
다른 데이터 세트는 미리 보기 목적으로 배치로 미리 채워집니다. 위 단계를 반복하여 이러한 데이터 세트를 볼 수 있습니다.
데이터 세트 이름 | 스키마 | 설명 |
---|---|---|
골든 데이터 세트 postValues | 골든 데이터 집합 스키마 | Analytics 웹 사이트의 소스 데이터 |
Recommendations 입력 데이터 세트 | Recommendations 입력 스키마 | 이 Analytics 데이터는 기능 파이프라인을 사용하여 교육 데이터 세트로 변환됩니다. 이 데이터는 제품 Recommendations 기계 학습 모델을 교육하는 데 사용됩니다. itemid 해당 고객이 구매한 제품에 userid 해당합니다. |
Recommendations 출력 데이터 세트 | Recommendations 출력 스키마 | 점수 지정 결과가 저장되는 데이터 세트에 각 고객에 대해 권장되는 제품 목록이 포함됩니다. |
라이프사이클의 두 번째 구성 요소에는 Data Science Workspace 레서피 및 모델 작성에 포함됩니다. 제품 Recommendations 레시피는 과거 구매 데이터와 머신 러닝을 활용하여 제품 추천을 규모에 맞게 생성하도록 설계되었습니다.
레서피는 특정 문제를 해결하기 위해 고안된 기계 학습 알고리즘과 로직을 포함하고 있어 모델의 기본입니다. 더욱 중요한 것은 레서피 솔루션을 통해 조직 전체에서 머신 러닝을 민주화할 수 있으므로 다른 사용자가 코드를 작성하지 않고도 서로 다른 사용 사례에 맞는 모델을 이용할 수 있습니다.
이제 제품 Recommendations 레서피에 필요한 입력 및 출력 스키마를 검토했습니다. 이제 다음 섹션으로 이동하여 제품 Recommendations 모델을 생성, 교육 및 평가하는 방법을 확인할 수 있습니다.
데이터가 준비되고 레서피 사용 준비가 되었으니 기계 학습 모델을 만들고, 교육하고, 평가할 수 있습니다.
모델은 레서피 인스턴스로, 데이터를 규모에 따라 트레이닝하고 점수를 매길 수 있습니다.
교육 실행이 끝날 때까지 기다리거나 다음 섹션에서 새 교육 실행을 계속 만들 수 있습니다.
[ 모델 개요 ] 페이지에서 오른쪽 위 의 [교육]을 클릭하여 새 교육 실행을 만듭니다. 모델을 만들 때 사용한 것과 동일한 입력 데이터 세트를 선택하고 다음을 클릭합니다.
구성 페이지가 나타납니다. 여기서는 Hyperparameter라고도 하는 교육 실행의 "num_recommendations" 값을 구성할 수 있습니다. 훈련되고 최적화된 모델은 트레이닝 실행 결과를 기반으로 가장 성과가 좋은 하이퍼링크 매개 변수를 활용합니다.
하이퍼매개 변수는 알 수 없으므로, 교육이 실행되기 전에 할당해야 합니다. 하이퍼매개 변수를 조정하면 훈련된 모델의 정확도가 변경될 수 있습니다. 모델 최적화는 반복적인 프로세스이므로 만족스러운 평가가 이루어지기 전에 여러 개의 교육 실행이 필요할 수 있습니다.
num_recommendations 를 10으로 설정합니다.
새 교육 실행이 완료되면 모델 평가 차트에 추가 데이터 포인트가 나타납니다. 이 작업은 최대 몇 분 정도 걸릴 수 있습니다.
교육 실행이 완료될 때마다 결과 평가 지표를 보고 모델이 얼마나 잘 수행되었는지 확인할 수 있습니다.
데이터 과학 워크플로우의 마지막 단계는 데이터 저장소에서 통찰력을 수집하고 사용하기 위해 모델을 조작하는 것입니다.
점수부여 실행이 성공적으로 완료되면 결과를 미리 보고 생성된 인사이트를 볼 수 있습니다.
제품 추천을 성공적으로 생성했습니다.
이 자습서에서는 기계 학습을 통해 처리되지 않은 원시 데이터를 유용한 정보로 변환하는 방법을 Data Science Workspace시연하는 작업 과정을 소개합니다. 사용 방법에 대한 자세한 내용 Data Science Workspace은 소매 판매 스키마 및 데이터 세트 를 만드는 방법에 대한 다음 가이드를 계속 참조하십시오.