Google # 39s Duplicate Internet Content Filter in Action


   nbsp; av: Tony Simpson
Hvis du dont mener Googles Duplicate Content Filter eksisterer, har jeg Dramatiske Proof deres internett-innhold filter finnes og it er veldig effektiv.
5. juli 2005 Jeg publiserte en artikkel med tittelen “7 Top måter å unngå Link Theft”, som ble plukket opp og inngår som innhold på andre nettsteder.
Før artikkelen ble utgitt jeg sjekket på Google om noen resultater som allerede eksisterte på den eksakte frasen “7 Top måter å unngå Link tyveri” og det var ingen oppføringer for dette ordet.
I løpet av de neste ukene jeg overvåkes via et søk på Google hvor mange resultater dukket opp i Google for tittelen på artikkelen min. En uke etter publisering var det 6760 resultater oppført i Google, en uke senere var det 14.100, og den nådde en topp på 17,000 resultater innen 26. juli 2005.
4 uker etter offentliggjøring av resultatene i Google hadde falt litt til 16600.
Nesten 6 uker etter offentliggjøring av resultatene oppført i Google hadde falt til 44.
I løpet av mindre enn to uker antall søkeresultater på Google.com etter tittelen på artikkelen min hadde gått fra 16600 til bare 44.
I tilfelle youre tro at dette er fordi alle disse andre nettstedene falt med artikkelen og erstattet den med innhold og jeg bør legge til at et søk på Yahoo.com på samme dag fremdeles viste 14300 resultater for artikkelen min.
What er flere av disse 44 treff på Google, mer enn halvparten består av oppføringer fra samme nettsteder. Med andre ord enkelte steder har de samme artikkel duplisert på ulike sider på nettstedet sitt.
Så Google Internet Content Filter brukes ikke til å fjerne dupliserte oppføringer fra den foretrukne websites den velger å holde i søkeresultatene.
Den 28 august 2005 8 uker etter første publikasjon Jeg distribuerte den artikkelen igjen til en ny liste over artikkelen steder å gjenta prosessen. Etter 6 uker av samme artikkel hadde nådd en topp på 5620 treff på Google. Mindre enn 2 uker senere resultatene falt til 217.
For meg var dette dramatisk bevis på at Googles Duplicate Internet Content Filter er aktiv og meget effektiv. Hvis youre lurte på om andre store søkemotorene har et duplikat innhold filter Jeg kan bekrefte at Yahoo absolutt ikke. Den samme artikkelen som en gang var oppført på 14.300 nettsteder på Yahoo, har falt til 344 i samme periode.
Fra disse resultatene vil det synes Google tar ca 6 til 8 uker for å fjerne duplisert innhold ved hjelp av Duplicate Internet Content Filter.
Men spørsmålet gjenstår er bare hvordan Google avgjøre hvilke av over 16000 resultater betyr det holder, og som gjør det avviser?
Jeg har vært vitne til situasjoner hvor mine egne artikler vises i resultater på andre nettsteder, men er ikke oppført i resultatene for min egen nettside.
Så klart Google ikke tar hensyn til hvem som er opphavsmann og forfatter av den opprinnelige artikkelen ble når du bestemmer hvilke nettsteder som blir værende i sine søkeresultater.
Det synes også å ha noe å gjøre med hvor Google først finner artikkelen.
Noen av artiklene jeg har publisert på nettstedet mitt i flere uker før vi lanserer dem for distribusjon til andre nettsteder.
På den tiden Googles edderkopper har besøkt webområdet mitt flere ganger, og Google har hatt nok tid til å regne ut at artikkelen ble først funnet på nettstedet mitt.
Det ville være interessant å se om it er mulig å finne ut hvilke faktorer som Google bruker i sin Internet Content Filter å avgjøre hvilke resultater å holde på sin liste, og hvilke du vil fjerne. Men thats for en annen artikkel.

This entry was posted in Fritid and tagged , , , , , , . Bookmark the permalink.