Udelukke Google vha. htaccess-fil

Tilmeldt 12. Oct 10

Indlæg ialt: 540

Peter1982 Skrevet 07-01-2013 kl. 10:45

Hvor mange stjerner giver du? :

Hej alle,

Jeg har en Wordpress-side hvor jeg ønsker at udelukke søgemaskinerne fra én bestemt undermappe. Til dette ved jeg, at jeg skal bruge min htaccess-fil - jeg er blot i tvivl om jeg gør det rigtigt. Jeg har læst mig frem til, at jeg skal tilføje følgende:

User-agent: *
Disallow: /udelukket-undermappe/

Skal dette tilføjes FØR eller EFTER "# BEGIN wordpress"???

Lige nu ser min htaccess-fil sådan ud:

# BEGIN WordPress
<IfModule mod_rewrite.c>
RewriteEngine On
RewriteBase /
RewriteRule ^index\.php$ - [L]
RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_FILENAME} !-d
RewriteRule . /index.php [L]

# compress text, html, javascript, css, xml:
AddOutputFilterByType DEFLATE text/plain
AddOutputFilterByType DEFLATE text/html
AddOutputFilterByType DEFLATE text/xml
AddOutputFilterByType DEFLATE text/css
AddOutputFilterByType DEFLATE application/xml
AddOutputFilterByType DEFLATE application/xhtml+xml
AddOutputFilterByType DEFLATE application/rss+xml
AddOutputFilterByType DEFLATE application/javascript
AddOutputFilterByType DEFLATE application/x-javascript

# Or, compress certain file types by extension:
<files *.html>
SetOutputFilter DEFLATE
</files>

# END WordPress Vh. Peter

Floraton.com

Fra Ølstykke

Tilmeldt 18. Jul 09

Indlæg ialt: 1604

Patrick Olsen Fra Better-Web ApS Skrevet 07-01-2013 kl. 10:48

Hvor mange stjerner giver du? :

Gennemsnit 5,0 stjerner givet af 1 person

Hej Peter,

Den omtalte kode skal ikke ind i din .htaccess, men ind i din robots.txt-fil.

Better-Web - Webdesign, programmering & online markedsføring.

Tilmeldt 12. Oct 10

Indlæg ialt: 540

Peter1982 Skrevet 07-01-2013 kl. 10:50

Hvor mange stjerner giver du? :

Hej Patrick,

Aaargh, ja tak for det. U rock.

Vh. Peter

Floraton.com

Fra Ølstykke

Tilmeldt 18. Jul 09

Indlæg ialt: 1604

Patrick Olsen Fra Better-Web ApS Skrevet 07-01-2013 kl. 10:59

Hvor mange stjerner giver du? :

Peter1982:

Hej Patrick,

Aaargh, ja tak for det. U rock.

Vh. Peter

No problemo :-)

Held og lykke med sitet.

Better-Web - Webdesign, programmering & online markedsføring.

Tilmeldt 21. Sep 06

Indlæg ialt: 2606

Gita Street Fra StreetPatrol.com StreetPatrol.dk Skrevet 07-01-2013 kl. 11:16

Hvor mange stjerner giver du? :

Gennemsnit 5,0 stjerner givet af 1 person

Når det kun er en mappe så kan du putte en .htaccess-fil ind i den relevante mappe i stedet for at fylde .htaccess-filen i roden med unødigt stof.

Test dog om adressen returnerer noindex, nofollow her, da der kan være grunde til det nogengange ikke virker:
http://www.ktj-media.dk/blog/noindex-via-htaccess/

Du kan downloade .htaccess-filen her:
http://streetpatrol.dk/downloads/noindex-follow.zip

Tilføjelse: Ja, Patrick har ret i at den kode Peter skrev var til robots.txt-filen, men hvis det er for at sørge for at der intet bliver indekseret i Google kan der bruges noindex.

Sparetips på Sparefeber.dk

WordPress hjemmesider & SEO

Fra Ølstykke

Tilmeldt 18. Jul 09

Indlæg ialt: 1604

Patrick Olsen Fra Better-Web ApS Skrevet 07-01-2013 kl. 11:38

Hvor mange stjerner giver du? :

Gennemsnit 5,0 stjerner givet af 1 person

Gita Street:

Når det kun er en mappe så kan du putte en .htaccess-fil ind i den relevante mappe i stedet for at fylde .htaccess-filen i roden med unødigt stof.

Test dog om adressen returnerer noindex, nofollow her, da der kan være grunde til det nogengange ikke virker:
http://www.ktj-media.dk/blog/noindex-via-htaccess/

Du kan downloade .htaccess-filen her:
http://streetpatrol.dk/downloads/noindex-follow.zip

Tilføjelse: Ja, Patrick har ret i at den kode Peter skrev var til robots.txt-filen, men hvis det er for at sørge for at der intet bliver indekseret i Google kan der bruges noindex.

Helt enig Gita.

Den eneste "sikrer" løsning på at Google ikke kommer ind på sitet, og bruger noget data, siger de selv er ved brugen af en server-side adgangsbeskyttelse. Men det bedste alternativ er noindex.

Better-Web - Webdesign, programmering & online markedsføring.

Fra København S

Tilmeldt 1. Feb 06

Indlæg ialt: 3534

Kim Tetzlaff - Kim Tetzlaff ApS Fra Kim Tetzlaff ApS Kim Tetzlaff Ejendom Skrevet 07-01-2013 kl. 11:45

Hvor mange stjerner giver du? :

Gennemsnit 5,0 stjerner givet af 1 person

Gita Street:

Når det kun er en mappe så kan du putte en .htaccess-fil ind i den relevante mappe i stedet for at fylde .htaccess-filen i roden med unødigt stof.

Test dog om adressen returnerer noindex, nofollow her, da der kan være grunde til det nogengange ikke virker:
http://www.ktj-media.dk/blog/noindex-via-htaccess/

Du kan downloade .htaccess-filen her:
http://streetpatrol.dk/downloads/noindex-follow.zip

Tilføjelse: Ja, Patrick har ret i at den kode Peter skrev var til robots.txt-filen, men hvis det er for at sørge for at der intet bliver indekseret i Google kan der bruges noindex.

Takker for deling... Det eneste man skal være opmærksom på i det tilfælde er at hvis man opretter en mappe, og der rent faktisk er en side med samme navn på sin hjemmeside. Kan man risikere at serveren prøver at vise filerne hvis ikke man har deaktiveret index.

Ud over det skal man helst heller ikke have den indskrevet i sin robots.txt, da Google skal kunne crawle for at se om der er andre ting den skal tage højde for. og det leder så til at der helst heller ikke må stå noindex i x-robots-tag, og index i robots metatagget, hvilket er en fejl som rigtig mange hjemmesider laver.

MVH Kim

Kim Tetzlaff

🚀 Hastighedsekspert ⚙️WordPress hjemmesider 🎯SEO
Siden 1995 - hjemmeside Udvikling og teknisk optimering af hjemmesider
👉 Mere om mig

Hastighedsekspert og wordpress nørd

Tilmeldt 21. Sep 06

Indlæg ialt: 2606

Gita Street Fra StreetPatrol.com StreetPatrol.dk Skrevet 07-01-2013 kl. 20:52

Hvor mange stjerner giver du? :

Kim Tetzlaff - KTJ-Media.dk:

Det eneste man skal være opmærksom på i det tilfælde er at hvis man opretter en mappe, og der rent faktisk er en side med samme navn på sin hjemmeside. Kan man risikere at serveren prøver at vise filerne hvis ikke man har deaktiveret index.

Ud over det skal man helst heller ikke have den indskrevet i sin robots.txt, da Google skal kunne crawle for at se om der er andre ting den skal tage højde for. og det leder så til at der helst heller ikke må stå noindex i x-robots-tag, og index i robots metatagget, hvilket er en fejl som rigtig mange hjemmesider laver.

Tak for supplerende oplysninger. Det er altid godt at lære noget nyt.

Jeg testede det faktisk af på samme webhotel med både WordPress og Prestashop, men gætter på at sidstnævnte ikke virkede pga det måske er MVC-baseret (Model View Controller). Kender ikke Prestashop ret godt endnu, men tester det lidt af sammen med Magento, da det er svært at finde saglige argumenter for hvad der er bedst. Har arbejdet med MVC websites i .NET, og der går hele den der med "mapper" som URL-adresser jo tabt når der laves URL'er.

Sparetips på Sparefeber.dk

WordPress hjemmesider & SEO

Tilmeldt 21. Sep 06

Indlæg ialt: 2606

Gita Street Fra StreetPatrol.com StreetPatrol.dk Skrevet 07-01-2013 kl. 20:57

Hvor mange stjerner giver du? :

Patrick Olsen:
Den eneste "sikrer" løsning på at Google ikke kommer ind på sitet, og bruger noget data, siger de selv er ved brugen af en server-side adgangsbeskyttelse. Men det bedste alternativ er noindex.

Serverside passwordbeskyttet adgang, vel at mærke. Ja, det er vi enige i. Har ellers lige haft diskussionen på Google+, hvor en erfaren mand mener at robots.txt er svaret. Men det er det selvfølgelig også når det måske er den eneste mulighed der er i hostede og Windows-baserede løsninger. Den slags er vi heldigvis ude over når vi er til Linux og open source :-)

Sparetips på Sparefeber.dk

WordPress hjemmesider & SEO

Fra Ølstykke

Tilmeldt 18. Jul 09

Indlæg ialt: 1604

Patrick Olsen Fra Better-Web ApS Skrevet 07-01-2013 kl. 22:27

Hvor mange stjerner giver du? :

Gita Street:

Serverside passwordbeskyttet adgang, vel at mærke. Ja, det er vi enige i. Har ellers lige haft diskussionen på Google+, hvor en erfaren mand mener at robots.txt er svaret. Men det er det selvfølgelig også når det måske er den eneste mulighed der er i hostede og Windows-baserede løsninger. Den slags er vi heldigvis ude over når vi er til Linux og open source :-)

Jeg har før set brudstykker af søgeresultater, som ikke burde være der iflg. robots.txt, så helt sikker er den løsning ikke. Men den er nem at opsætte og kan klare de flestes behov.

Better-Web - Webdesign, programmering & online markedsføring.