Jeg har lavet mig en robots.txt fil, som jeg har uploaded til mit root directory på min webserver. Filen indeholder 3 linjer: User-Agent: * Nu er det sådan, at Google allerede har indexeret et par PDF filer og disse kan findes ved bestemte søgninger. Det vil jeg jo gerne undgå (det har jeg lært i en bog jeg har downloaded ;-) ). Mit spørgsmål er nu, hvornår fjerner Google så mine PDF filer fra søgeresultaterne? |
Google er ret flinke til at overholde det man beder dem om i robots.txt så jeg tror du vil opleve at filen fjernes rimeligt hurtig. Dog vil man ofte kunne finde den slags hvis man søger MEGET precist, f.eks. direkte på domæne og filnavnet.
Du kan også logge ind på Googles webmasters tools og bede dem om at fjerne siden fra deres indeks også plejer det at gå rigtig hurtigt. Se mere her http://www.google.dk/support/webmasters/bin/answer.py?answer=61062
Sidst kunne du jo også overveje at omdøbe filen/filerne på din server så Googles link i det mindste ikke ville virke, og jeg tror ikke du vil opleve at Google tilføjer flere PDF'er hvis du beder den om at lade være :)