Hov. Du er ikke logget ind.
DU SKAL VÆRE LOGGET IND, FOR AT INTERAGERE PÅ DENNE SIDE

Hvordan laver jeg en søgemaskine?

Side 9 ud af 10 (98 indlæg)
Fra København
Tilmeldt 22. Jan 09
Indlæg ialt: 1760
Fra  Buehøjgård Møbler Skrevet kl. 23:47
Hvor mange stjerner giver du? :

johnnyj:
Nej undskyld, maase lidt for haardt skrevet. Men svaerere er det altsaa heller ikke.

Du undervurderer opgaven i allerhøjeste grad. Alle der har beskæftiget sig med dette på professionelt seriøst business plan ved at det slet ikke er så let.

Lad os tage udgangspunkt i et telefon nummer index som du nævner:
Det kan måske forekomme nemt når man med sine første spæde programmeringslinier hurtigt kan scanne et eller tusindvis af websites for data og kategorisere det. Men så kommer alt det svære arbejde:

vedligehold af data, opdatering af data, udvidelse af data.
- Hvad sker der når fx eniro.dk du scanner ændrer deres html/javascript?
- Hvad sker der når din rutine har scannet hele CVR.dk og tror at det var telefonnumre, fordi de var 8-cifret?
- Hvordan håndterer du når du har samme telefonnummer 10 gange fra forskellige websites), men med forskellige tilknyttede persondata?
- Etc. etc. etc.

Undtagelserne i programmeringen og rensning+strukturering af data er den helt store udfordring her, og det er bestemt ikke let. Jo dybere man graver og jo bedre en service man vil levere, jo sværere forstår man at det er.

Bare spørg en hvilken som helst derude som har forsøgt at stille en professionel service til rådighed og leve af det... (jeg selv inklusiv)

Fra København
Tilmeldt 22. Jan 09
Indlæg ialt: 1760
Fra  Buehøjgård Møbler Skrevet kl. 23:54
Hvor mange stjerner giver du? :

Jonas Jacobsen:
Der skal stadigvæk være en crawler og indeksering. Den skal bare KUN crawle de sider, der bliver godkendt. Forestil dig google, der kun søger på sites, der først er blevet manuelt udvalgt.

Det er lige præcis det google gør med Google News, bl.a. ?

Så hedder det sig godt nok at det er til nyheder og den slags, men der findes alt slags indhold (for alle tekster kan i princippet være en nyhed eller artikel) og det indeholder såvidt jeg ved kun sites som er godkendt af Google.

Tilmeldt 20. Oct 10
Indlæg ialt: 6
Skrevet kl. 23:57
Hvor mange stjerner giver du? :

Lars Meyer:

johnnyj:
Nej undskyld, maase lidt for haardt skrevet. Men svaerere er det altsaa heller ikke.

Du undervurderer opgaven i allerhøjeste grad. Alle der har beskæftiget sig med dette på professionelt seriøst business plan ved at det slet ikke er så let.

Lad os tage udgangspunkt i et telefon nummer index som du nævner:
Det kan måske forekomme nemt når man med sine første spæde programmeringslinier hurtigt kan scanne et eller tusindvis af websites for data og kategorisere det. Men så kommer alt det svære arbejde:

vedligehold af data, opdatering af data, udvidelse af data.
- Hvad sker der når fx eniro.dk du scanner ændrer deres html/javascript?
- Hvad sker der når din rutine har scannet hele CVR.dk og tror at det var telefonnumre, fordi de var 8-cifret?
- Hvordan håndterer du når du har samme telefonnummer 10 gange fra forskellige websites), men med forskellige tilknyttede persondata?
- Etc. etc. etc.

Undtagelserne i programmeringen og rensning+strukturering af data er den helt store udfordring her, og det er bestemt ikke let. Jo dybere man graver og jo bedre en service man vil levere, jo sværere forstår man at det er.

Bare spørg en hvilken som helst derude som har forsøgt at stille en professionel service til rådighed og leve af det... (jeg selv inklusiv)

Jeg mener ikke jeg undervurderer den tekniske udfordring. 

Et cvrnummer er vel lige saa godt hit paa en soegning paa et 8 cifret nummer som et telefonnummer, saa jeg ser ikke noget problem i det. Kald det en "nummer" tabel snarere end telefonnummer tabel (jeg naevnte blot telefon numre fordi det er noget jeg selv har soegt paa). 

Anyway det er meningsloest at diskutere. Som idealistisk programmoer mener jeg slet ikke det er umuligt at tage kampen op med google, og at hoere nogen sige de har brugt flere aar paa det uden resultat, det forstaar jeg slet ikke. 

 

Tilmeldt 20. Apr 07
Indlæg ialt: 16014
30% af profil udfyldt
Skrevet kl. 23:58
Hvor mange stjerner giver du? :
Gennemsnit 1,0 stjerner givet af 1 person

Det er meget simpelt - du kan lave den i programmerings sproget "PHP"

Du skal indsætte følgende kode på en hjemmeside:

"<?

echo 'search-engine better than google';

?>"

Hvis du mangler kapital til opstart/registrering af hjemmeside, vil jeg gerne investere i dig. Du skal bare sende mig en PM med dit dankortnummer, udløbsdato og cvc kode.

Tilmeldt 20. Oct 10
Indlæg ialt: 6
Skrevet kl. 00:05
Hvor mange stjerner giver du? :

Lars Meyer:

johnnyj:
Nej undskyld, maase lidt for haardt skrevet. Men svaerere er det altsaa heller ikke.

Du undervurderer opgaven i allerhøjeste grad. Alle der har beskæftiget sig med dette på professionelt seriøst business plan ved at det slet ikke er så let.

Lad os tage udgangspunkt i et telefon nummer index som du nævner:
Det kan måske forekomme nemt når man med sine første spæde programmeringslinier hurtigt kan scanne et eller tusindvis af websites for data og kategorisere det. Men så kommer alt det svære arbejde:

vedligehold af data, opdatering af data, udvidelse af data.
- Hvad sker der når fx eniro.dk du scanner ændrer deres html/javascript?
- Hvad sker der når din rutine har scannet hele CVR.dk og tror at det var telefonnumre, fordi de var 8-cifret?
- Hvordan håndterer du når du har samme telefonnummer 10 gange fra forskellige websites), men med forskellige tilknyttede persondata?
- Etc. etc. etc.

Undtagelserne i programmeringen og rensning+strukturering af data er den helt store udfordring her, og det er bestemt ikke let. Jo dybere man graver og jo bedre en service man vil levere, jo sværere forstår man at det er.

Bare spørg en hvilken som helst derude som har forsøgt at stille en professionel service til rådighed og leve af det... (jeg selv inklusiv)

Og iovrigt, jeg har aldrig proevet at lave noget som programmoer som jeg ikke er lykkes med. 

Saa det svaert for mig at forholde mig til at sige dit og dat kan ikke lade sig goere. Sf. kan det lade sig goere. Uanset om man er 2 eller 2000 programmoerer. 

Men man skal braende for det, det er 100. 

Fra Aarhus
Tilmeldt 15. Aug 08
Indlæg ialt: 557
Skrevet kl. 09:48
Hvor mange stjerner giver du? :

Johnny, hvis det du siger passer, hvorfor gør du så ikke noget mere ud af det? Du kunne jo blive ansat hos Google. Bumbum - Milliarderne ligger og venter, bare kom igang.

Jeg tvivler ikke på at du er en dygtig programmør, men der sidder trods alt højtuddannede nørder hos Google, der hvér dag forsker i udvikling af søgemaskinen. Googles folk er ikke nødvendigvis de bedste, men man overtager ikke verden i denne branche, hvis ikke man er mindst ca. ekstremt meget bedre end de andre, på en skala fra 1 til hest.

Tilmeldt 10. Nov 09
Indlæg ialt: 0
Skrevet kl. 14:59
Hvor mange stjerner giver du? :

johnnyj:

Og iovrigt, jeg har aldrig proevet at lave noget som programmoer som jeg ikke er lykkes med. 

Saa det svaert for mig at forholde mig til at sige dit og dat kan ikke lade sig goere. Sf. kan det lade sig goere. Uanset om man er 2 eller 2000 programmoerer. 

Men man skal braende for det, det er 100. 

Imponerende at du aldrig er fejlet med et projekt! Er det så fordi du er blændende dygtig, eller er det fordi du ikke  sætter dit ambitionsniveau højere end at du er 110% sikker på at du kan lave det med venstre hånd?

Den svære del af en søgemaskine er nok ikke at indsamle data fra hjemmesider, men måske nærmere at bestemme hvilken side der skal vises først hvis du f.eks søger på "hest".

 

Fra Hellerup
Tilmeldt 11. Apr 06
Indlæg ialt: 3722
Fra  CloudSprout Skrevet kl. 22:15
Hvor mange stjerner giver du? :

johnnyj:

Og iovrigt, jeg har aldrig proevet at lave noget som programmoer som jeg ikke er lykkes med. 

Så er du enten meget rig eller fuldstændig uden ambitioner og fantasi!

Det lyder måske lidt hårdt, men sådan er det egenligt ikke ment.

Jeg har faktisk selv haft det engang, da jeg i jeg tror det var 6. eller 7. klasse havde læst Brian & Ritchie C bog, og troede at jeg nu kunne bygge et vilkårligt verdens fedeste spil. Jeg havde plan og ambitioner i skala med World of Warcraft, og vi snakker i 80'erne.

Det selvfølgeligt ikke særligt realistisk, men i begyndelsen kommer til at tænke sådan, er at programmering mere faktisk er det eneste fag, hvor man 100% via brainpower bygger noget. Så i princippet kan alle bygge alt.

Men omvendt så sagde rygtet at det tog 10.000 mandeår at bygge MS Word 2000, og så længe lever de færreste.

Mit råd til dig i fremtiden, er at selvom du lærer lidt mere om dine egne begrænsninger med tiden, så lad endelig vær med at glemme den barnlige naivitet! Den er ligeså meget en styrke som en svaghed!

Fra Næstved
Tilmeldt 24. Jun 10
Indlæg ialt: 202
Skrevet kl. 23:59
Hvor mange stjerner giver du? :

Mikkel deMib Svendsen:

Og hvad er det for nogle dyre principper du mener man kan undgå - båndbredde, regnekraft og harddisc plads. Jeg glæder mig da til at se, hvordan du vil lave en søgemaskiner, der ikke trækker på den slags ligegyldige detaljer :)

En fiks idé i hovedet på en dygtig IT-haj vil formentlig inden længe gøre det muligt at udnytte fælles maskinkraft, fremfor at finansiere gildet selv. En løsning der ligner den de forskellige torrents benytter kunne da sagtens se dagens lys i en nær fremtid.

En open source søgemaskine, der "bor" på 100.000.000 PC'er rundt om i verden. Jeg kan godt lide idéen :-)

Fra Lyngby
Tilmeldt 26. Mar 05
Indlæg ialt: 9733
Fra  DEMIB HOLDINGS ApS Waimea Digital Skrevet kl. 00:15
Hvor mange stjerner giver du? :

Distributed computing er ikke nyt - og det har skam også været afprøvet til at lave en stor søgemaskine med. Men den blev ingen succes. P.t. mener jeg Majestic er de eneste der crawler med en distributed crawling model.

Side 9 ud af 10 (98 indlæg)