ps: Har du husket at faa tilladelse fra disse 130 websites til at kopiere data fra dem, og indsaette det paa dit eget site?
Hvad mener du? Så længe han linker over til hjemmesiden han henter data fra så er crawling ikke ulovligt. Tænk hvis Google skulle tage kontakt til alle hjemmesider de henter data fra.
Han taler om noget der hedder ophavsret. Altså Google må gerne tage en lille bid tekst og præsentere men Google må ikke kopiere hele sider og vise dem med f.eks. reklamer på.
Hvis man ønsker at crawle sites med informationer og informationerne udgør mere end hvad man kan kalde citater (eller mindre brudstykker med tydelig kildegengivelse), skal man altså have tilladelse.
ps: Har du husket at faa tilladelse fra disse 130 websites til at kopiere data fra dem, og indsaette det paa dit eget site?
Hvad mener du? Så længe han linker over til hjemmesiden han henter data fra så er crawling ikke ulovligt. Tænk hvis Google skulle tage kontakt til alle hjemmesider de henter data fra.
Ikke korrekt.Du maa ikke bare kopiere tekst/billeder fra et website og saette dem ind paa din egen side. Og nej det bliver ikke noedvendigvis lovligt bare fordi du henviser til kilden. Det afhaenger af hvordan du bruger data og er temlig kompliceret. Du maa jo foreksempel heller ikke kopiere et blog indlaeg fra amino ind paa din egen webside, og saa bare linke til originalen paa amino.
Et andet eksempel er program informationen fra http://www.dr.dk/tv/oversigt#side%281%29. Den maa du heller ikke bare crawle, og kopiere ind paa din egen website.
Og selv hvis den brug der paataenkes her er lovlig, saa ville det vaere uheldigt at bruge >100.000 kroner paa en plan, som kan stoppes hvis de naevnte sites laver en robots.txt fil, der siger at denne service ikke maa crawle dem. (Kan ikke forestille mig at det er lovligt at crawle et site som har en robots.txt som siger nej).
Jeg ville godt kunne løse sådan en opgave. Prisen ville afhænge af hvordan disse 130 hjemmesider skal crawles (api eller html scrape) og hvordan selve sitet skulle opbygges.
Jeg vil dog estimere at 210 timer er for lidt. Det giver max. 1,5 time pr. crawler (210/130) - går ud fra de har forskellig opsætning - hertil ligges server setup (ville ikke anbefale et webhotel til sådan noget), database opbygning, performance, skalerbarhed + hele sitet skal bygges.
Der min opfattelse, at det IKKE kræver tilladelse af crawle fra andre sites. Eksempelvis har Boliga ikke fra starten af fået accept fra samtlige mæglere. Men det klart, at vi skal have fuldstændig styr på ophavsret.
Hvor går grænsen? Boliga kunne jo designe et system som også henter boligbeskrivelsen, plantegning og alle billeder af boligen. Så vil der nærmest ikke være nogen grund til at gå ind på mæglerens side. Men det går vel ikke... går jeg ud fra.
Så er der en anden interessant problematik: hvis vi crawler fra 130 sider, går jeg ikke ud fra, at vi samtidig må konkurrere mod dem. Hvis f.eks., at det muligt at oprette en boligannonce på boliga. Så vil boliga crawle info fra mæglernes sider og samtidig konkurrere mod dem.
Der min opfattelse, at det IKKE kræver tilladelse af crawle fra andre sites. Eksempelvis har Boliga ikke fra starten af fået accept fra samtlige mæglere. Men det klart, at vi skal have fuldstændig styr på ophavsret.
Hvor går grænsen? Boliga kunne jo designe et system som også henter boligbeskrivelsen, plantegning og alle billeder af boligen. Så vil der nærmest ikke være nogen grund til at gå ind på mæglerens side. Men det går vel ikke... går jeg ud fra.
Så er der en anden interessant problematik: hvis vi crawler fra 130 sider, går jeg ikke ud fra, at vi samtidig må konkurrere mod dem. Hvis f.eks., at det muligt at oprette en boligannonce på boliga. Så vil boliga crawle info fra mæglernes sider og samtidig konkurrere mod dem.
En kravspec er en specifikation der beskriver alle detaljer i projektet. Uden sådan en kan man ikke få et realistisk bud på prisen, eller dvs, det er meget svært at få en realistisk pris og der er større risiko for at projektet løber løbsk hvis ikke alt er defineret fra start.
Angående Boliga så kan de IKKE lave et system der henter billeder, plantegninger m.m. hvis ikke de har lov til at vise det. Hvis en mægler tager et billede er ophavsretten hans. I øvrigt skal boliga ikke nødvendigvis have aftale med alle mæglere, men derimod nogle rammeaftaler med kæderne. Der er flere kæder der har strittet imod hvorfor boliga ikke viser billeder til alle boliger.
Til din sidste problematik er svaret at det slet ikke er sikkert I må crawle siderne og vise indholdet. Det er lige gyldigt om I er konkurrenter eller ej, ophavsretten gælder stadig, så I skal sikre jer at det I ønsker at crawle og vise ikke falder ind under den kategori da I ellers kan komme til at betale ganske betragtelige beløb.
10.000 besøgende og pris: Det kommer jo an på hvad siden omhandler. Hvis det er advokat priser kan du jo nok tjene lidt mere end hvis det er et katte galleri.
Helt enig og Excel øvelser giver ingenting ;-)
Med venlig hilsen,
Àsgeir Gunnarsson
Stifter af SONNURMEDIA - Alt indenfor webudvikling