Hej Mikkel Jeg har nyligt læst mig igennem "The Anatomy of a Large-Scale Hypertextual Web Search Engine" af Page og Brin tilbage fra 1998. Allerede dengang gjorde de det klart at PageRank ikke kunne stå alene:
Så rigtigtnok er PageRank en del af indekset, men som det fremgår af ovenstående beregnede de allerede tilbage i 1998 en IR Score som inkluderede indgående links med det pågældende søgeord - hvilket jeg godt mener man kan kalde en "run-time linkpopularitet". Jeg skal ikke kunne afgøre om Teoma er bedre til det, men jeg mener Google har taget højde for det med denne IR Score, som naturligt nok er forbedret henad vejen. Jeg synes mange (ikke nødvendigvis dig Mikkel) uberettiget beskylder Google for at have startet ud med en teknologi (PageRank) der hurtigt blev forældet og måtte forlades fordi den var utidsvarende. PageRank kan højst sandsynligt allerede tilbage i 1998 have haft en sekundær betydning i forhold til den runtime bestemte IR Score, ligesåvel som PageRank den dag i dag kan have en sekundær (eller tertiær) betydning på søgeresultaterne (som ikke nødvendigvis kan påvises ved reengineering). Mvh Jesper |
> indgående links med det pågældende søgeord
Nej, det er misforstået. Den PageRank/linkpopularitets-værdi Google beregner i indekset er helt uafhængig af det som brugerne søger på - altså run-time. Det er en statisk værdi i indekset.
Problemet med det kan f.eks. eksemplificeres ved to aviser - den ene er den bedste, sådan overordnet set, men den anden har en bedre sportssektion. Den bedste avis har flest links. Problemet er så, at uanset hvordan man søger, så vil den avis med flest link score højest - i hvert fald i forhold til linkværdien/PageRank. Med Teoma's metode, der beregner de linkværdien i run-time, på basis af de relevante sites - og dermed ville den generelt dårligere avis, men med en bedre sportssektion, teoretisk set få en højere score på sportssøgninger.