성향 점수 계산

성향 점수에 대한 통계 계산은 정의됩니다.

개념적으로, 각 방문자에 대해 계산된 점수는 지정된 이벤트(대상 필터에 의해 정의됨)가 발생할 수 있는 예상 가능성으로, 0에서 100% 사이의 점수 값 범위가 됩니다. 점수 지정 절차에서는 기존 샘플을 교육 데이터로 사용하여 이벤트 확률과 선택된 독립 관심 변수 간의 관계를 찾습니다.

수학적으로, 이러한 관계는 각 독립 변수에 연관된 각 수량 값에 반영됩니다. 이러한 값을 모델 계수라고 합니다. ScoreDim은 현재 IRLS(Iterally Reweited Less Square) 알고리즘을 사용하여 모델 계수를 예상합니다. IRLS는 현재 패스와 이전 패스 간의 계수의 차이가 1.0e-6보다 작을 때까지 샘플을 여러 번 거치는데, 이 점은 융합됨​이라고 합니다. 그러나 데이터에 따라 IRLS는 컨버전스에 도달하지 못할 수 있습니다.

이 경우 모델 교육 반복은

  • 계수는 더 작은 것보다 더 커집니다
  • 1,000개의 패스에 도달했거나,
  • 수학적 오류로 인해 반복을 방지할 수 있습니다.

IRLS가 수렴되지 않으면 SGD(Stochastic Gradient Remoted)라는 백업 알고리즘이 사용됩니다. SGD는 또한 여러 번 훈련 샘플을 조사합니다. 그러나 IRLS와 달리 SGD 모델 계수는 반복 간의 차이가 항상 지수 방식으로 감소하도록 제어됩니다. 마찬가지로 SGD는 계수 차이가 1.0e-6 또는 100,000회 가공 패스에 도달하면 종료됩니다. IRLS 오류 및 SGD 참여는 추적 로그에 기록됩니다.

두 알고리즘 모두에 대해 모든 샘플이 모델 교육에 들어가는 것은 아닙니다. 80%는 현재 모델을 훈련하는데 사용된다. 모델을 교육한 후 나머지 20% 샘플을 사용하여 모델 강도를 정확하게 모델 매트릭스에서 계산된 정밀도, 리콜 및 정밀도로 평가합니다. 100%에 가까울수록 점수 모델이 좋아집니다.

이 페이지에서는