Tja...been there done that. Jeg tror ikke det kan lade sig gøre for alm. mennesker eller sågar alm. store virksomheder. Du skal have et kæmpe budget.
Jeg og en kammerat samt en ekstern hyret programmør arbejdede i 1½ år på et lignende projekt og kom aldrig tæt på at være i mål.
Det kræver så enorm stor kapacitet, at lave en linkdatabase, hente indhold, parse indhold og så igen rangere skidtet. Når vi var færdige med én af processerne var vi allerede milevidt bagud. Der kommer så mange nye sider til hvert minut, at det er umuligt, at følge med.
Jeg har en hel del kode til at ligge du gerne må overtage, hvis du er interesseret og agter, at begive dig ud i det.
Et par goderåd , der måske er oplagte, men som godt kan være faldgrubber:
1) Lav en niche søgemaskine, der måske er bedre end Google på nichen. Hele nettet er for stort. Vi var bl.a. nødt til, at sortere porno sider fra - der går så også tid med at lave et filter, der fungerer nogenlunde.
2) Pas på med at din bot ikke render i en autogeneret kalender. Så kommer botten pludselig på meget overarbejde og mens du sover og botten snurrer kan du have spildt 8 timer på at hente inholf fra en uendelig kalender.
3) Lad være med at købe udstyr før det er strengt nødvendigt og du er sikker på, at det hele kører. Har selv brugt alt for mange penge på udstyr, der hurtigt bliver forældet. bl.a. en server til 35.000 kr. jeg ikke kan få 5.000 kr for i dag her 1½ år senere.