Web scrapers eller webcrawlers

Tilmeldt 25. Feb 12

Indlæg ialt: 131

lars Skrevet 10-08-2012 kl. 16:18

Hvor mange stjerner giver du? :

Hej,

Er der nogen herinde der ved hvordan jeg for hente daglig informationer ned fra en hjemmeside, jeg har læst lidt om crawlers og scrapers men er der nogen der ved hvad der nemmest og gratis at bruge, og det bliver nød til at pr. Automatik, og det så bliver gemt i en XML fil eller andet jeg så kan hente dataen fra hver dag.

Håber der nogle af jer amino folk der kan hjælpe

Pft.

Fra Helsingborg

Tilmeldt 3. Apr 05

Indlæg ialt: 6571

Niels Henriksen Fra TextReactor Skrevet 10-08-2012 kl. 16:43

Hvor mange stjerner giver du? :

lhcreative:
Er der nogen herinde der ved hvordan jeg for hente daglig informationer ned fra en hjemmeside,

Normalt er det en webscraper som tager indholdet på hjemmesiden og piller de dele ud som du skal bruge. Men du skal tænke på at laver ejerne indholdet om så skal webscraperen rettes.

Det bedste du kan gøre er at spørge om dem der har hjemmesidem om de har nogle webservices du kan hente fra.

Jeg har programmeret i over 27 år. Jeg har kodet i C, C++, Java, Delphi, Perl, JavaScript, C#, F#, VB.NET, ASP, Myresnak :D, Comal80 osv....

Fra Struer

Tilmeldt 15. Mar 11

Indlæg ialt: 340

Christoffer Hauthorn Boisen Fra Emplate ApS Hauthorn IT Skrevet 10-08-2012 kl. 16:49

Hvor mange stjerner giver du? :

Du kan fx benytte Scrapy som basis for en scraper du selv udvikler. Den kan også logge ind på et site med denne scraper, og på den måde hente content som du normalt ikke kan scrape.

Hvis du finder en "færdig" løsning, må du gerne poste den her.

Hauthorn IT - WordPress hjemmesider i høj kvalitet

Tilmeldt 25. Feb 12

Indlæg ialt: 131

lars Skrevet 10-08-2012 kl. 16:51

Hvor mange stjerner giver du? :

Hej,

Tak for svaret.

Ja jeg ved den mulighed er der, men hvis jeg ikke har den mulighed, enten skal jeg selv manuelt ind og skrive værdier af eller have det således at en scrapers eller hvad de hedder henter det pr. Automatik, og det er de sidste jeg helst ser. Så hvis der er nogle der har kendskab til programmer eller lign. Vil jeg meget gerne høre om det.

Pft

Tilmeldt 25. Feb 12

Indlæg ialt: 131

lars Skrevet 10-08-2012 kl. 16:54

Hvor mange stjerner giver du? :

Ja har læst om scrapy men håber lidt på, der noget mere brugervenligt software, så jeg ikke selv skal kode det men "bare" fortælle den at den skal hente fra den og den side inden for de og de HTML tags osv.

Fra Aalborg

Tilmeldt 14. Jan 08

Indlæg ialt: 669

B. Hvarregaard Fra GreenWeb ApS Skrevet 10-08-2012 kl. 18:19

Hvor mange stjerner giver du? :

Du skal lige være opmærksom på ophavsret hvis du gør det her. Det lyder til du kan risikere at bryde nogens ophavsret. Læs evt. mere her: http://www.byens-advokat.dk/kopieret-tekst-billeder-saadan-goer-du/

Jeg laver rådgivning, software, integrationer og softwarerrobotter. Se mere på median.dk

Tilmeldt 25. Feb 12

Indlæg ialt: 131

lars Skrevet 10-08-2012 kl. 18:42

Hvor mange stjerner giver du? :

Det har jeg undersøgt, og jeg bryder ikke nogen ophavsret ved at gøre det. Altså hvis jeg finder ud af hvordan man kan gøre det :)

Fra 9500 Hobro

Tilmeldt 29. Sep 07

Indlæg ialt: 237

Lars Borup Jensen Skrevet 10-08-2012 kl. 19:13

Hvor mange stjerner giver du? :

Ta' f.eks. et kig på JSOUP ( http://jsoup.org/ ) som godt nok er til Java, men ret nemt at gafle fra HTML sourcen via noget der ligner JQuery selectors og andet godt..

Så skal du evt. bare bygge en simpel crawler oven på alt efter hvor avanceret du ønsker det..

/Lars Borup

it-arbejde.dk - specialister i middleware og server-side softwareudvikling, J2EE konsulent og Django.