Google-søgning og spam i søgemaskinen
2. marts 2011
I januar blev der bragt en række historier om Googles søgekvalitet. Hvis du har læst nogle af de seneste artikler, spørger du måske dig selv, om vores søgekvalitet er blevet lavere. Det korte svar er, at ifølge de målemetoder, som vi har raffineret gennem mere end 10 år, er Googles søgekvalitet bedre end nogensinde, hvad angår relevans, opdatering og alsidighed. I dag er der mindre end halvt så meget engelsksproget spam som for fem år siden, og der er endnu mindre spam på de fleste andre sprog. Vi har dog set en let opadgående kurve for spam i de seneste måneder, og selv om vi allerede har gjort fremskridt, er der også nye initiativer på vej, som skal fortsætte forbedringen af vores søgekvalitet.
Webspam er uønsket data, som du kan se i søgeresultaterne, når websteder prøver at snyde sig til højere placeringer i søgeresultaterne eller på anden vis overtræder søgemaskiners kvalitetsretningslinjer. For 10 år siden var der så meget spam, at søgemaskiner jævnligt returnerede urelateret webspam for mange forskellige søgninger. Google har stort set formået at bekæmpe denne form for "ren webspam" – selv om nogle spammere griber til snedigere og endda ulovlige metoder såsom at hacke websteder.
Da vi de seneste måneder både har øget vores størrelse og opdateringshyppighed, har vi naturligt nok indekseret en masse godt indhold og også noget spam. Som reaktion på den udfordring har vi lanceret en ny forbedret klassificering på dokumentniveau, som gør det sværere for spamindhold at rangere højere på siden. Den nye klassificering er bedre til at spore spam på de enkelte websider, f.eks. gentagne spamord – den form for udtryk, som du ofte kan se i uønskede, automatiserede, selvpromoverende blogkommentarer. Vi har også radikalt forbedret vores evne til at spore hackede websteder, som var en stor kilde til spam i 2010. Og vi vurderer talrige ændringer, som bør formindske mængden af spam endnu mere, heriblandt én ændring, som primært påvirker websteder, der kopierer andres indhold, og websteder, der indeholder en lille mængde af originalt indhold. Vi fortsætter med at udforske nye metoder til at reducere mængden af spam, heriblandt nye måder, hvorpå brugerne kan give tydeligere feedback om websteder, der indeholder spam eller har en lav kvalitet.
Eftersom der med tiden kommer mindre "ren webspam", er opmærksomheden blevet rettet mod "indholdsfarme", som er websteder med overfladisk indhold eller indhold af lav kvalitet. I 2010 lancerede vi to store algoritmiske ændringer, der fokuserede på websteder af lav kvalitet. Ikke desto mindre kan vi høre feedbacken fra nettet højt og tydeligt. Folk efterspørger endnu mere håndfast handling mod indholdsfarme og websteder, der hovedsageligt indeholder spam eller indhold af lav kvalitet. Vi er stolte over Google-søgning og stræber efter at gøre hver eneste søgning perfekt. Vi er ikke perfekte, og kombineret med brugernes stigende forventninger til Google bliver disse svagheder blæst op i bredformat. Ikke desto mindre kan og skal vi gøre det bedre.
Én misforståelse, som vi har set de sidste par uger, er opfattelsen af, at Google ikke reagerer så håndfast mod spamindhold i vores indeks, hvis det kommer fra websteder, som viser Google-annoncer. For at skære det ud i pap:
- Google reagerer i forhold til websteder, der overtræder vores retningslinjer for kvalitet, uafhængigt af, om de har annoncer, der leveres af Google.
- Det hjælper ikke på et websteds rangering i Google, at det viser Google-annoncer.
- Køb af Google-annoncer forbedrer ikke et websteds rangering i Google-søgeresultater.
Disse principper har altid været gyldige, og det er vigtigt at understrege, at de stadig gælder.
Folk bekymrer sig så meget om Google, at de gerne – nogle gange følelsesladet – gør os opmærksom på, hvad de ønsker ændret. Vi sætter stor pris på denne feedback. Kombineret med vores egne videnskabelige undersøgelser gør feedback fra brugerne det muligt for os at efterforske alle muligheder for tænkelige forbedringer. Fortæl os, hvordan vi kan gøre det bedre, så vil vi fortsat arbejde mod et bedre Google.
Skrevet af Matt Cutts, Principal Engineer og oversat af Anu, Alexander & Fredrik - Search Quality
Webspam er uønsket data, som du kan se i søgeresultaterne, når websteder prøver at snyde sig til højere placeringer i søgeresultaterne eller på anden vis overtræder søgemaskiners kvalitetsretningslinjer. For 10 år siden var der så meget spam, at søgemaskiner jævnligt returnerede urelateret webspam for mange forskellige søgninger. Google har stort set formået at bekæmpe denne form for "ren webspam" – selv om nogle spammere griber til snedigere og endda ulovlige metoder såsom at hacke websteder.
Da vi de seneste måneder både har øget vores størrelse og opdateringshyppighed, har vi naturligt nok indekseret en masse godt indhold og også noget spam. Som reaktion på den udfordring har vi lanceret en ny forbedret klassificering på dokumentniveau, som gør det sværere for spamindhold at rangere højere på siden. Den nye klassificering er bedre til at spore spam på de enkelte websider, f.eks. gentagne spamord – den form for udtryk, som du ofte kan se i uønskede, automatiserede, selvpromoverende blogkommentarer. Vi har også radikalt forbedret vores evne til at spore hackede websteder, som var en stor kilde til spam i 2010. Og vi vurderer talrige ændringer, som bør formindske mængden af spam endnu mere, heriblandt én ændring, som primært påvirker websteder, der kopierer andres indhold, og websteder, der indeholder en lille mængde af originalt indhold. Vi fortsætter med at udforske nye metoder til at reducere mængden af spam, heriblandt nye måder, hvorpå brugerne kan give tydeligere feedback om websteder, der indeholder spam eller har en lav kvalitet.
Eftersom der med tiden kommer mindre "ren webspam", er opmærksomheden blevet rettet mod "indholdsfarme", som er websteder med overfladisk indhold eller indhold af lav kvalitet. I 2010 lancerede vi to store algoritmiske ændringer, der fokuserede på websteder af lav kvalitet. Ikke desto mindre kan vi høre feedbacken fra nettet højt og tydeligt. Folk efterspørger endnu mere håndfast handling mod indholdsfarme og websteder, der hovedsageligt indeholder spam eller indhold af lav kvalitet. Vi er stolte over Google-søgning og stræber efter at gøre hver eneste søgning perfekt. Vi er ikke perfekte, og kombineret med brugernes stigende forventninger til Google bliver disse svagheder blæst op i bredformat. Ikke desto mindre kan og skal vi gøre det bedre.
Én misforståelse, som vi har set de sidste par uger, er opfattelsen af, at Google ikke reagerer så håndfast mod spamindhold i vores indeks, hvis det kommer fra websteder, som viser Google-annoncer. For at skære det ud i pap:
- Google reagerer i forhold til websteder, der overtræder vores retningslinjer for kvalitet, uafhængigt af, om de har annoncer, der leveres af Google.
- Det hjælper ikke på et websteds rangering i Google, at det viser Google-annoncer.
- Køb af Google-annoncer forbedrer ikke et websteds rangering i Google-søgeresultater.
Disse principper har altid været gyldige, og det er vigtigt at understrege, at de stadig gælder.
Folk bekymrer sig så meget om Google, at de gerne – nogle gange følelsesladet – gør os opmærksom på, hvad de ønsker ændret. Vi sætter stor pris på denne feedback. Kombineret med vores egne videnskabelige undersøgelser gør feedback fra brugerne det muligt for os at efterforske alle muligheder for tænkelige forbedringer. Fortæl os, hvordan vi kan gøre det bedre, så vil vi fortsat arbejde mod et bedre Google.
Skrevet af Matt Cutts, Principal Engineer og oversat af Anu, Alexander & Fredrik - Search Quality