Der har været et udslæt af tweets og blogindlæg, der for nylig talte om problemerne med at bruge gennemsnit i PPC-markedsføring. For eksempel, hvor Julie Bacchini hævder, at "gennemsnit er en sucky metrisk":
Selvom det er sandt, at nogle gange gennemsnit kan være meget vildledende, er problemet med ovenstående datasæt den store befolkningsvariation og standardafvigelsen i prøven.
$config[code] not foundI dette indlæg vil jeg tale om den matematik, der er involveret her, og gøre en sag for værdien af middelværdier, såvel som at reagere på nogle af kritikerne af rapportering om gennemsnit, som jeg har set i PPC-samfundet i det seneste.
Varians, standardafvigelse og variationskoefficient
Prøvevariation er et mål for spredning - ved hvor meget værdierne i datasættet sandsynligvis vil afvige fra gennemsnitsværdien af dit datasæt. Det beregnes ved at tage gennemsnittet af kvadraterne af forskellene for hvert datapunkt fra gennemsnittet. Kvadrering af forskellene sikrer, at negative og positive afvigelser ikke afbryder hinanden.
Så for klient 1 beregner du kun forskellen mellem 0,5 procent og den gennemsnitlige ændring på 3,6 procent, så square det nummer. Gør dette for hver klient, og tag derefter gennemsnittet af afvigelserne: det er din stikprøvevariation.
Prøve Standardafvigelse er simpelthen kvadratroden af variansen.
Simpelthen falder værdierne i dette datasæt typisk i 5,029 procent væk fra det samlede gennemsnit på 3,6 procent (det vil sige tallene er meget spredte), hvilket betyder, at du ikke kan konkludere meget fra denne distribution.
En forenklet måde at vurdere, om dine standardafvigelser er "for høje" (forudsat at du leder efter en normal fordeling) er at beregne en varianskoefficient (eller relativ standardafvigelse), som simpelthen er standardafvigelsen divideret med gennemsnittet.
Hvad betyder dette, og hvorfor skal vi passe? Det handler om værdien af rapportering om gennemsnit. Når WordStream gør en undersøgelse med klientdata, beregner vi ikke kun gennemsnit fra små datasæt og gør store konklusioner - vi er interesserede i fordelingen af dataene. Hvis tallene er overalt, smider vi dem ud og prøver at segmentere prøven på en anden måde (efter industri, udgifter osv.) For at finde et mere meningsfuldt mønster, hvorfra vi mere trygt kan drage konklusioner.
Selvbetydende gennemsnit efter definition Inkluder værdier over og under gennemsnittet
En anden kritik fra den gennemsnitlige lejr er den opfattelse, at et gennemsnit ikke taler for hele befolkningen. Dette er selvfølgelig sandt, per definition.
Ja, middelværdier indeholder datapunkter, der falder over og under gennemsnitsværdien. Men dette er ikke et godt argument for at udslette gennemsnittet helt.
Hvis du antager en normal fordeling, ville du forvente, at ca. 68 procent af dine datapunkter falder +/- 1 standardafvigelse fra dit gennemsnit, 95 procent inden for +/- 2 standardafvigelser og 99,7 procent inden for +/- 3 standardafvigelser som illustreret her.
Som du kan se, findes der udelukkende fejl, men hvis du har en stram standardfordeling i datasættet, er de ikke så almindelige, som du måske tror. Så hvis du er forsigtig med matematikken, kan gennemsnittet stadig være meget nyttig information for det store flertal af annoncører.
I PPC Marketing, Math Wins
Lad os ikke kaste gennemsnit med badevand. Tværtimod rapporteres stort set alle præstationsmålingerne i AdWords som (CTR, CPC, Gennemsnitlig position, Konverteringsfrekvenser osv.) Som gennemsnitsværdier.
I stedet for at ignorere gennemsnit, lad os bruge magtens magt til at finde ud af, om det gennemsnit, du kigger på, er meningsfuldt eller ej.
Udgivet med tilladelse. Original her.
Gennemsnitlig foto via Shutterstock
Mere i: Udgiverkanalindhold