Bliv gratis medlem på Amino
 

Køb et Amino Sponsorlink

 

Nye ekspertblog-indlæg
om  E-handel, Internet & Online marketing

Læs flere ekspertindlæg
 

Top karmaliste (30 dage)

De flinkeste Amino’er der hjælper mest med "Teknik, hosting & e-handelsløsninger"

 

Web scrapers eller webcrawlers

Side 1 ud af 1 (8 indlæg)
Amino-karma 364
Tilmeldt 25. feb 12
Indlæg ialt: 88

 
Skrevet 10-08-2012 kl. 16:18

Hej,

Er der nogen herinde der ved hvordan jeg for hente daglig informationer ned fra en hjemmeside, jeg har læst lidt om crawlers og scrapers men er der nogen der ved hvad der nemmest og gratis at bruge, og det bliver nød til at pr. Automatik, og det så bliver gemt i en XML fil eller andet jeg så kan hente dataen fra hver dag.

Håber der nogle af jer amino folk der kan hjælpe

Pft.




Amino-karma 23.535
Fra Helsingborg
Tilmeldt 3. apr 05
Indlæg ialt: 4.895
flag
Amino Plus Moderator

lhcreative:
Er der nogen herinde der ved hvordan jeg for hente daglig informationer ned fra en hjemmeside,

Normalt er det en webscraper som tager indholdet på hjemmesiden og piller de dele ud som du skal bruge. Men du skal tænke på at laver ejerne indholdet om så skal webscraperen rettes.

Det bedste du kan gøre er at spørge om dem der har hjemmesidem om de har nogle webservices du kan hente fra.

Send SMS'er til dine kunder for kun 17 øre pr stk. Intet abonnement eller oprettelsesafgif. www.textreactor.com

Erfaren programmør i .NET - Jeg har været programmør i mere end 14 år - Er flydende i Umbraco

Amino-karma 1.573
Fra Struer
Tilmeldt 15. mar 11
Indlæg ialt: 335
Amino Plus

Du kan fx benytte Scrapy som basis for en scraper du selv udvikler. Den kan også logge ind på et site med denne scraper, og på den måde hente content som du normalt ikke kan scrape.

Hvis du finder en "færdig" løsning, må du gerne poste den her.

Amino-karma 364
Tilmeldt 25. feb 12
Indlæg ialt: 88

Lars Christensen  
Skrevet 10-08-2012 kl. 16:51

Hej,

Tak for svaret.

Ja jeg ved den mulighed er der, men hvis jeg ikke har den mulighed, enten skal jeg selv manuelt ind og skrive værdier af eller have det således at en scrapers eller hvad de hedder henter det pr. Automatik, og det er de sidste jeg helst ser. Så hvis der er nogle der har kendskab til programmer eller lign. Vil jeg meget gerne høre om det.

Pft





Amino-karma 364
Tilmeldt 25. feb 12
Indlæg ialt: 88

Lars Christensen  
Skrevet 10-08-2012 kl. 16:54

Ja har læst om scrapy men håber lidt på, der noget mere brugervenligt software, så jeg ikke selv skal kode det men "bare" fortælle den at den skal hente fra den og den side inden for de og de HTML tags osv.

Amino-karma 2.343
Fra Aalborg
Tilmeldt 14. jan 08
Indlæg ialt: 524
Amino Plus
B. Hvarregaard
Fra GreenWeb ApS
Skrevet 10-08-2012 kl. 18:19

Du skal lige være opmærksom på ophavsret hvis du gør det her. Det lyder til du kan risikere at bryde nogens ophavsret. Læs evt. mere her: http://www.byens-advokat.dk/kopieret-tekst-billeder-saadan-goer-du/

GREENWEB.DK Infosystemer og Touch
Digitale skilte til din virksomhed, brug din eksisterende computer og LCD skærm og omdan dem til et digitalt skiilt. Vis reklamer for dine produkter og opnå bedre salg. Kommuniker let og effektivt med dine kunder. Vi udvikler også touch applikationer til selvbetjening lad dine kunder betjene sig selv med en touch skærm. Besøg os på www.greenweb.dk

Amino-karma 364
Tilmeldt 25. feb 12
Indlæg ialt: 88

Lars Christensen  
Skrevet 10-08-2012 kl. 18:42

Det har jeg undersøgt, og jeg bryder ikke nogen ophavsret ved at gøre det. Altså hvis jeg finder ud af hvordan man kan gøre det :)

Amino-karma 891
Fra 9500 Hobro
Tilmeldt 29. sep 07
Indlæg ialt: 237

Lars Borup Jensen
Skrevet 10-08-2012 kl. 19:13

Ta' f.eks. et kig på JSOUP ( http://jsoup.org/ ) som godt nok er til Java, men ret nemt at gafle fra HTML sourcen via noget der ligner JQuery selectors og andet godt..

Så skal du evt. bare bygge en simpel crawler oven på alt efter hvor avanceret du ønsker det..

/Lars Borup

it-arbejde.dk - specialister i middleware og server-side softwareudvikling, J2EE konsulent og Django.

 

Side 1 ud af 1 (8 indlæg)

RSS-feed
 
E-handel, Internet & Online marketing er venligst sponseret af: