Jeg vil fastholde at en variant af en algoritme der vægter hjemmesider ved at beregne egenværdien af et polynomie af sammenhængsgrafen for internettet (eller et lokalt udsnit) ligger i kernen af effektive søgemaskiner. Når jeg kalder sådan en algoritme "page rank type" - skyldes det at disse algoritmer matematisk set er variationer over Page Rank - godt nok med andre vægte, og polynomier, men alligevel ... Når det er sagt, så kender jeg kun den akademiske side af søgningsteorien, og det kunne måske være spændende at invitere sådan en som dig fra erhverslivet til en gæsteforelæsning, næste gang vi kører et søgemaskinekursus. Jeg aner ikke hvad googles toolbar gør, det kan godt være at den kaster en terning, og slår op i et horoskop, men jeg kender i hvert fald matematikken bag de fleste (publicerede) indekseringsalgoritmer. |
> men jeg kender i hvert fald matematikken bag de fleste (publicerede) indekseringsalgoritmer.
Din sidste kommentar er vigtig :)
Jeg betvivler på ingen måde din teoretiske viden, men der er nogle ting omkring publiceret materiale, som vi må forholde os til, når det handler om aktive søgemaskiner som Google, Yahoo, MSN og AskJeves (Teoma) - der er de fire absolut største.
Jeg betvivler på ingen måde din teoretiske viden, men der er nogle ting omkring publiceret materiale, som vi må forholde os til, når det handler om aktive søgemaskiner som Google, Yahoo, MSN og AskJeves (Teoma) - der er de fire absolut største.
- Vi kan ikke med sikkerhed vide om de teorier eller konkrete patenter der er publiceret faktisk anvendes eller ej. Det oprindelige PageRank patent har man kunne læse i mange år - men om det nogensinde har været brugt ved kun Google selv med sikkerhed. Vi andre må nøjes med at "gætte" os frem baseret på praktisk erfaring, teoretisk indsigt, analyser og reversed engineering på forskellige niveauer. Der er nok ikke nogen der har al den viden samlet, men det er min klare oplevelse når jeg mødes med alle de andre "æggehoveder" (som hver især ved en masse) til de store udenlandske konferencer, at der er enighed mellem de fleste af os om at PageRank er en død sild :)
- Vi kan ikke med sikkerhed vide hvilke andre teknologier søgemaskinerne har indbygget. Der er overvejende sandsynlighed for, at de anvender praktiske løsninger, som de har beholdt som egne hemmeligheder - som forretningshemmeligheder, frem for patenter (som alle jo kan læse efterfølgende).
- Der er mange veje til Rom - og gode rankings i søgemaskinerne. Ved at anvende avanceret matematik og teoretisk viden om hvordan søgeteknologier virker kan man opnå gode resultater. De samme gode resultater kan også opnås ved hjælp af langt mere simple fortolkninger og modeller. Det svarer lidt til forskellen mellem den måde de gamle Grækere så på Solsystemet og så den måde vi betragter det nu. Begge dele var (såvidt jeg er orienteret) korrekt, men den ene model var bare lettere at arbejde med end den anden.
Som en af mine gode venner, og medvært på WebmasterRadio, DaveN sagde for nyligt til en konference hvor vi sad sammen i panelet (frit oversat fra hukommelsen): "Det handler om at finde hullerne og så bare HAMRE løs indtil man trænger igennem!" - det er vist det man kalder "brute force" modellen - en model der også kendes fra bl.a. hacking og kodebrydning :) Effektivt, men ikke særlig elegant.