신뢰할 수 있는 흐름을 사용한 고급 통계 모델링 개요

AVAILABILITY
이 기능은 Data Distiller 추가 기능을 구입한 고객이 사용할 수 있습니다. 자세한 내용은 Adobe 담당자에게 문의하십시오.

통계 모델링은 예측을 하고, 패턴을 감지하고, 데이터에서 통찰력을 생성하는 데 사용됩니다. 이는 분산 방식으로 복잡한 구조를 갖는 큰 고차원 데이터 세트에 적용됩니다. Data Distiller SQL 확장 기능을 사용하면 대규모 데이터 세트에서 적시, 병렬 및 확장 가능한 방식으로 데이터 사전 처리를 간소화하고 자동화하여 통계 모델을 활용하고 원시 데이터를 변환할 수 있습니다.

이 일련의 문서는 Data Distiller SQL 확장을 사용하여 Trusted Flow에서 기존 기능 엔지니어링 및 머신 러닝 작업을 수행하는 방법에 대한 포괄적인 안내서를 제공합니다. 이 문서는 SQL 기반 기능 엔지니어링, SQL 기반 모델 생성 및 알고리즘 처리를 효과적으로 구현하고 활용하는 데 도움이 되도록 설계되었습니다. 이 설명서는 고급 통계 모델링을 일반 SQL 데이터 워크플로우에 원활하게 통합하는 데 필요한 중요한 측면을 안내합니다.

기능 capabilities

Data Distiller은 원시 데이터를 의미 있는 기능으로 변환하고, 통계 모델을 구축 및 교육하며, 예측 분석에 이들 모델을 사용하는 데 필요한 도구를 제공합니다. 설명서는 이러한 기능을 단계별로 이해하고 적용하는 데 도움이 되도록 구성되어 있습니다.

  1. 기능 엔지니어링: 가장 관련성이 높은 기능을 추출, 변환 및 선택하여 데이터를 전처리하는 방법에 대해 알아봅니다. 기능 엔지니어링 프로세스를 간소화 및 자동화하는 사용 가능한 SQL 기능과 모델 교육을 위해 데이터가 최적으로 준비되도록 하는 방법에 대해 알아봅니다.

  2. 모델: SQL을 사용하여 진행률 통계 모델을 관리, 평가 및 예측하는 방법을 알아봅니다. SQL과 관련된 핵심 프로세스를 이해하여 데이터 세트에서 이러한 모델의 라이프 사이클을 정의합니다.

  3. 알고리즘: 클러스터링, 분류 및 회귀 작업을 포함하여 Data Distiller에서 지원하는 고급 통계 모델링 알고리즘을 살펴보십시오. 이 문서에서는 사용 가능한 알고리즘을 사용하는 프로세스, 해당 매개 변수 및 비즈니스 요구 사항에 맞게 SQL 확장을 사용하여 고객별 모델을 생성하는 방법에 대해 자세히 설명합니다.

다음 단계

Data Distiller 기능을 사용하여 복잡한 기계 학습 작업을 수행하는 방법에 대해 알아보려면 기능 엔지니어링 문서를 참조하십시오. 데이터를 모델링할 준비가 된 기능으로 변환하는 방법에 대해 설명합니다. 그런 다음 조작한 기능을 사용하여 신뢰할 수 있는 모델을 만들고, 교육하고, 관리하는 과정을 안내하는 모델 문서를 진행합니다. 마지막으로 고급 통계 모델 구현 문서를 살펴보고 사용 가능한 다양한 신뢰할 수 있는 모델과 SQL 워크플로 내에서 구현하는 방법에 대해 알아보십시오.

recommendation-more-help
ccf2b369-4031-483f-af63-a93b5ae5e3fb