Hej, Jeg har et library over produkt beskrivelser med cirka 56000. Problemet er at mange er meget identiske. Vi har lavet det sådan at hver beskrivelse har sin egen .html side så som site.dk/library/id-34449-navn site.dk/library/id-34450-navn2 osv. Det giver så 56000 sider og alt er fint og brugerne kan fint søge i det. Problemet er bare at selv på html siderne til hvert produkt er der noget text der igen bliver for meget det samme. spørgsmålet er så Hver html side har unik title meta tags osv da der er en nyt nummer men stadig kan det opleves som dublicate når der er 56000. Er det klogest helt at fjerne det fra serveren for at undgå panda, eller det fint nok med Disallow: /library/i robots.txt eller vil google se der ligger en masse dublicate og deranke siten? Problemet er at teksten er relevant for brugerne der skal søge i det , tekniske folk. Men ud fra googles syn vil den tro det er en masse dublicate content. |
Du kan finde svaret her:
http://www.ktj-media.dk/blog/robots-txt-udbredt-misforstaaelse/
MVH Kim