Ik vroeg mij af of het scrapen van wikipedia teksten slecht is voor de positie van een website in de zoekmachines. Ik heb namelijk een website waarop ik dit doe, maar niet om hoger te scoren in de zoekmachines maar zuiver en alleen om informatie te voorzien aan de bezoekers. Nu vroeg ik mij dus af of ik beter deze inhoud verstop voor de zoekmachines? Of is dit niet nodig?
Inhoud verstoppen voor zoekmachines lijkt me in ieder geval geen goed idee. Dit is nadrukkelijk verboden in de richtlijnen van Google en kan je dus een penalty opleveren.
Wanneer je letterlijk teksten van Wikipedia gaat plaatsen op je site, zal dit in ieder geval niet in het voordeel van je vindbaarheid werken, maar het is de vraag of het ook daadwerkelijk nadelig zal zijn. Zolang je genoeg eigen content op je website hebt staan verwacht ik niet dat zoekmachines het zullen zien als dubbele content. Aangezien ik geen inschatting kan doen van de verhouding eigen content vs. Wikipedia content is het moeilijk om hier een inschatting van te doen.
Ik vraag me wel af waarom je geen eigen content zou schrijven. Dit lijkt me voor je bezoekers ook relevanter. En zal je uiteindelijk ook wel helpen met je vindbaarheid in zoekmachines.
Verstoppen is natuurlijk een slecht gekozen woord. Maar uitsluiten dmv een robots.txt bestand kan natuurlijk wel. Een andere optie is om het niet indexeerbaar te maken dmv een iframe of Javascript oid.
Scrapen van Wikipedia zal je een berg duplicate content opleveren wat niet bevordelijk is voor je rankings.
Mijn advies: zorg voor voldoende (in ieder geval de eerste 1/2 alineas van een pagina) unieke content en wanneer je daarbij kleine stukken van Wikipedia plaatst laat het dan gewoon indexeren. Gaat het om een boel pagina’s met identieke content van Wikipedia zorg dan dat ze niet indexeerbaar zijn.
Uit eigen ervaring weet ik dat het gebruik van wikipediateksten op lange termijn slecht is voor je website… tenzij je veel aanvullende content aanlevert zoals answers.com
Ik zou je de tijd besparen.
Greetz Seth
Hoi, De eerste 4 of vijf zinnen zijn wel eigen tekst natuurlijk. Het gaat hier bijvoorbeeld om one day trips, bijvoorbeeld naar Parijs. Je ziet vier of vijf zinnen eigen tekst met daaronder bijvoorbeeld een reisschema vervolgens een google map waarop je Parijs ziet. en daaronder pas het wikipedia artikel over Parijs. Op die manier zien de paginas er een beetje gezellig uit. Er zijn geen teruglinks naar Wikipedia buiten een enkele die de bron wikipedia vermeld. Dus in Principe is dat toch geen overtreding van een of andere wetgeving?