Oneven van een hashbotsing

Adobe Analytics gebruikt 32-bits hashes voor de meeste afmetingen, wat betekent dat er 2 zijn32 mogelijke hash-combinaties (ongeveer 4,3 miljard). Elke maand wordt een nieuwe hash-tabel voor elke dimensie gemaakt. De benaderende kansen om een knoeiboelbotsing te ontmoeten die op het aantal unieke waarden wordt gebaseerd zijn als volgt. Deze kansen zijn gebaseerd op één enkele dimensie voor één enkele maand.

Unieke waardenOneven
1.0000,01%
10.0001%
50.00026%
100.00071%

Vergelijkbaar met de verjaardagsparadoxDe kans op hash-botsingen neemt aanzienlijk toe naarmate het aantal unieke waarden toeneemt. Bij 1 miljoen unieke waarden, is het waarschijnlijk dat er minstens 100 knoeiboelbotsingen voor die dimensie zijn.

Hashbotsingen verminderen

De meeste hash-botsingen gebeuren met twee ongebruikelijke waarden, die geen betekenisvolle invloed hebben op rapporten. Zelfs als een hash een algemene en soms voorkomende waarde heeft, is het resultaat te verwaarlozen. In zeldzame gevallen waarin twee populaire waarden een hash-botsing ervaren, is het echter mogelijk het effect ervan duidelijk te zien. Adobe beveelt het volgende aan om het effect ervan in rapporten te verminderen:

  • Het datumbereik wijzigen: Hash-tabellen worden elke maand gewijzigd. Als u het datumbereik wijzigt in een tijdsbereik van een andere maand, kan elke waarde verschillende hashes hebben die niet botsen.
  • Het aantal unieke waarden verminderen: U kunt uw implementatie of gebruik aanpassen Verwerkingsregels helpen het aantal unieke waarden dat een dimensie verzamelt, te verminderen. Als uw dimensie bijvoorbeeld een URL verzamelt, kunt u querytekenreeksen of -protocol verwijderen.
Vorige paginaPakketmonitoren
Volgende paginaVeelgestelde vragen

Analytics