Hash-botsingen
Dimensies in Adobe Analytics verzamelen tekenreekswaarden. Soms zijn deze tekenreeksen honderden tekens lang, terwijl andere tekens kort zijn. Om de prestaties te verbeteren, worden deze koordwaarden niet gebruikt direct in rapport-tijd verwerking. In plaats daarvan wordt voor elke waarde een hash berekend, wat een id met een uniforme grootte geeft. Voor de meeste velden wordt de waarde omgezet in kleine letters voordat hashing wordt uitgevoerd. Hierdoor wordt het totale aantal unieke waarden verminderd. Alle rapporten lopen op deze gehakte waarden, die drastisch hun prestaties verhogen.
Adobe Analytics houdt een afzonderlijke hash-tabel bij voor elke variabele en elke tabel wordt elke maand opnieuw samengesteld. Binnen om het even welke van die lijsten, kunnen twee verschillende bronwaarden de zelfde knoeiboel nu en dan veroorzaken, die als botsing van de a wordt bekend.
De botsingen van de as kunnen in rapporten als volgt manifesteren:
- Als u een rapport in tijd bekijkt en een onverwachte punt ziet, is het mogelijk dat de veelvoudige unieke waarden voor die variabele de zelfde knoeiboel gebruiken.
- Als u een segment gebruikt en een onverwachte waarde ziet, is het mogelijk dat het onverwachte afmetingspunt de zelfde knoeiboel gebruikt zoals een ander afmetingspunt dat uw segment aanpaste.
Oneven van een hashbotsing
Adobe Analytics gebruikt hashes met 32 bits voor de meeste afmetingen, zo betekent het dat er 2 32 mogelijke knoeiboelcombinaties (ongeveer 4.3 miljard) zijn. De benaderende kansen om een knoeiboelbotsing te ontmoeten die op het aantal unieke waarden wordt gebaseerd zijn als volgt. Deze kansen zijn gebaseerd op één enkele dimensie voor één enkele maand.
Gelijkaardig aan de verjaardagsparadox , neemt de waarschijnlijkheid van knoeiboelbotsingen drastisch toe aangezien het aantal unieke waarden stijgt. Bij 1 miljoen unieke waarden, is het waarschijnlijk dat er minstens 100 knoeiboelbotsingen voor die dimensie zijn.
Hashbotsingen verminderen
De botsingen van de knoeiboel kunnen niet volledig worden geëlimineerd, maar hun effect op rapporten kan worden verlicht. De meeste hash-botsingen gebeuren met twee ongebruikelijke waarden, die geen betekenisvolle invloed hebben op rapporten. Zelfs als een hash een algemene en soms voorkomende waarde heeft, is het resultaat te verwaarlozen. In zeldzame gevallen waarin twee populaire waarden een hash-botsing ervaren, is het echter mogelijk het effect ervan duidelijk te zien. Adobe raadt het volgende aan om het effect ervan in rapporten te beperken:
- verander de datumwaaier: De lijsten van de knoeiboel veranderen elke maand. Als u het datumbereik wijzigt in een tijdsbereik van een andere maand, kan elke waarde verschillende hashes hebben die niet botsen. Het is meestal de snelste manier om een zichtbare anomalie uit een specifiek verslag te verwijderen.
- Verlaag het aantal unieke waarden: U kunt uw implementatie aanpassen of de regels van de Verwerking gebruiken helpen het aantal unieke waarden verminderen die een dimensie verzamelt. Als uw dimensie bijvoorbeeld een URL verzamelt, kunt u querytekenreeksen of -protocol verwijderen.
- van het gebruik of de Evoer van Gegevens : Deze hulpmiddelen baseren zich niet op knoeiboellijsten.
- Beweging aan Customer Journey Analytics : Customer Journey Analytics heeft geen het hakken laag en geen kardinaliteitsgrenzen op dimensies . Overweeg naar dit product als hash-botsingen of Low-Traffic vaak van invloed zijn op uw rapporten.