Hey
Først og fremmest lyder det som om de fleste som har svaret på denne tråd har misforstået hvad robots.txt egentlig gør.
Det eneste robots.txt gør er at fortælle søgemaskinerne om de må "crawle" ens hjemmeside. Den fortæller ikke om en side må blive indekseret. Det gør man med en noindex robots metatag. men det kræver jo så at søgemaskinen må crawle siden som ikke skal indekseres. eller endnu bedre så skal siderne beskyttes af password og brugernavn, så vil du være sikker på at de ikke bliver crawlet.
Som udgangspunkt skal man lade søgemaskinen crawle sin hjemmeside, da man så på hjemmesiden styre hvad søgemaskinen skal gøre med hjemmesiden.
Det har så vidt mine tests af robots.txt viser, ikke nogen betydning om der står allow før eller efter disallow. Google kan godt se hvilke sider som ikke må crawles, og hvilke der må også selvom man fx som i dette tilfælde skriver allow / på sidste linje. sådan har jeg selv gjort det alle dage, og der har intet problem været med at få crawlet, for til sidst indekseret mine sider. man kan samtidig også teste sin robots.txt i GWT, og den vil jo fortælle om en side må tilgås eller om der er en blokering i robots.txt.
Der hvor jeg kunne se et problem er mere ved den tekniske del.
fx at der er SÅ meget kode i forhold til almindelig tekst indhold.
At hjemmesidens hastighed ifølge Googles "Page Speed" og "Yslow" kunne blive en del bedre
At HTML koden ikke validerer
At sproget som er defineret står til engelsk, men du skriver jo på dansk
Fjern evt index, follow på siderne, den behøver ikke være der.
Skriv evt mere tekst på siderne, da langt de fleste af dine sider ligner hinanden enormt meget hvad angår indholdet, og reelt set er det ikke ret meget indhold som skifter, jeg ved endnu ikke hvor DC grænsen går.
Ovenstående punkter kan være med til at søgemaskiner som Google ser din hjemmeside som værende af dårlig kvalitet, og derfor vil de ikke indekserer siden. Du har tilfældigvis ikke en statistik på hjemmesiden som fortæller OM google har været forbi for at crawle siden?
Jeg siger ikke at ovenstående svar er de endegyldige svar og lige det der skal til for at din hjemmeside bliver indekseret, der er nemlig så mange steder det reelt set kan gå galt.
MVH Kim