Hov. Du er ikke logget ind.
DU SKAL VÆRE LOGGET IND, FOR AT INTERAGERE PÅ DENNE SIDE

Scanning, dokumenthåndtering, søgbare PDF-filer m.m.

Side 1 ud af 3 (21 indlæg)
Tilmeldt 6. Dec 05
Indlæg ialt: 63
Skrevet kl. 12:41
Hvor mange stjerner giver du? :
Hej alle,

 

Personligt får jeg meget ud af at læse diverse indlæg her på Amino, og jeg vil derfor gerne give lidt igen.

 

Jeg driver en specialistvirksomhed, der ikke laver andet end at rådgive om scannere, scanning, datafangst (OCR,ICR,OMR osv..) og dokumenthåndtering i store og små virksomheder.

 

Jeg vil gerne tilbyde at give nogle gode råd med på vejen til alle her på Amino - ganske gratis

 

Så er der nogen der f.eks. sidder med tanker om:

- at skulle anskaffe sige en dokumentscanner

- gerne at ville skabe søgbare PDF-dokumenter

- at scanne og ocr-behandle dokumenter, brochurer, bøger o.lign. så resultatet efterfølgende kan redigeres

- aat nskaffe sig et system til elektronisk dokumenthåndtering

- elektroniske arbejdsgange (workflows)

- datafangst (Automatisk læsning af tal og bogstaver, skrevet med maskinskrift, håndskrift, stregkoder eller markeringer..)

 

..så skal I bare skrive!

 

Min erfaring siger mig, at de fleste der kaster sig ud i noget med elektronisk dokumenthåndtering har mange spørgsmål til at starte med.. og det er dem jeg gerne vil tilbyde at hjælpe med..

 

Mange hilsner

 

Michael Fray

DELTA ECM

 

 

 

 

 

Tilmeldt 27. Oct 05
Indlæg ialt: 146
Skrevet kl. 12:59
Hvor mange stjerner giver du? :
Jeg vil da gerne lægge ud, da jeg er grøn udi scanning, men forsøger at lære lidt.

Jeg har for nylig ville scanne farve produkt blade ind som pdf''er, så jeg blot kan maile til folk istedet for at sende produkt blade per post. Når jeg scanner arket (A4) ind (HP Scanjet 4850) viser min skærm en prøve. Men af og til "hopper" markeringen af det scannede ind og stiller sig ex midt i det scannede - og viser samtidig kun en del af det scannede som "aktivt".  Samtidig gøres det scannede ark "mindre" - dvs jeg får en hvis kant udenom. Det er ufikst.

Hvor gør jeg fejlen ?

Hvad er forskellen på at scanne til pdf eller pdf (kan søges i).

 

Mvh/

Tilmeldt 6. Dec 05
Indlæg ialt: 63
Skrevet kl. 13:25
Hvor mange stjerner giver du? :

 Hej Toga,


 Jeg kender ikke lige præcis den software der følger med til en HP Scanjet 4850, men det er nok ikke så meget anderledes end det HP normalt leverer.


 Jeg vil med det samme sige, at flatbedscannere ikke er specielt velegnet til at indscanne dokumenter. Dermed ikke sagt at det ikke kan lade sig gøre. Det tager bare lang tid..


 Hvad scannings software angår, bør der være nogle forskellige steder hvor du kan indstille hvordan den automatiske markering skal fungere. Normal vil scanningssoftwaren selv prøve at finde ud af hvor på dokumentet der er nogen der skal scannes. Hvis du kan finde et sted hvor du kan sætte markeringen til at være hele A4-siden, vil det være en fordel. Så skulle du også slippe for, at nogle af dine indscanninger faktisk bliver mindre en originalen. - Mere kan jeg desværre ikke lige sige om HP-softwaren, da jeg kun sjældent bruger den selv..


 Det kan også betale sig at overveje hvilken opløsning du scanner med.


http://www.karbosguide.dk/pctutor/hardware/modul9b01.htm har Michael Karbo nogle ganske gode beskrivelser af forskellige typer scannere, opløsninger m.m.


 
 

Forskellen på PDF og søgbar PDF er, at en almindelig PDF der er blevet skabt ud fra et indscannet dokument, bare indeholder et billede af dokumentet. Dvs. et billede og ikke andet. I dette kan man ikke søge eller f.eks. kopiere teksten.

 I en søgbar PDF, er det indscannede billede blevet OCR-behandlet, og resultaterne fra OCR-behandlingen gemmes

Fra Silicon Valley (USA)
Tilmeldt 31. Mar 05
Indlæg ialt: 4047
Fra  InspireAnalytics Inc. Skrevet kl. 15:01
Hvor mange stjerner giver du? :

Dato: 6/26/2006 12:58:35 PM Forfatter: Toga



Jeg har for nylig ville scanne farve produkt blade ind som pdf'er, så jeg blot kan maile til folk istedet for at sende produkt blade per post.





Hej Toga,

Hvem har lavet produktbladet? Har du selv vil jeg anbefale dig at konvertere filen direkte fra det program det er lavet i - eks. med PDFCreator (http://sourceforge.net/projects/pdfcreator/) - det giver et meget bedre resultat end at scanne. Hvis det er et reklamebureau el. lign. der har lavet produktbladet kan de lave en PDF for dig.

Men har du kun det trykte produktblad og ikke kan få fat i det som en fil, ja så kan scanning jo være eneste udvej.

mvh Carsten


Fra Silicon Valley (USA)
Tilmeldt 31. Mar 05
Indlæg ialt: 4047
Fra  InspireAnalytics Inc. Skrevet kl. 15:03
Hvor mange stjerner giver du? :
Hmm.... Jeg fik kludret gevaldigt i min quote, men du kan sikkert læse det alligevel

mvh Carsten

Tilmeldt 6. Dec 05
Indlæg ialt: 63
Skrevet kl. 20:41
Hvor mange stjerner giver du? :
Hej Carsten,

 

Jeg er helt enig med dig. Det vil klart være at foretrække, at få originalmaterialet. På den måde kan man i stedet lave fine PDF-filer, ved at benytte en PDF-printer eller ved at gemme dokumenterne som PDF (hvis programmet kan dette)..

 

En anden god PDF-printer er CutePDF, som også er gratis. Den kan du finde her: http://www.cutepdf.com/

 

Desværre er der mange der af en eller anden grund ikke har adgang til originalmaterialet, og så er der scanning tilbage. I sidste uge hjalp jeg en virksomhed med et lignende problem. Da havde en hel stak produktblade fra et firma der ikke længere eksisterede. Disse ville de gerne have scannet og omdannet til tekst og billeder, så de kunne benytte indholdet på deres hjemmeside. Programmet Readiris var lige hvad de havde brug for. En Wizard
tager sige at få lavet den rigtige opsætning til jobbet, og efter scanning
og OCR-behandling havde de fine fine sider i MS Word, lige til at redigere
i.



 

Fra København K
Tilmeldt 8. Jan 06
Indlæg ialt: 3643
Fra  Regnskabsskolen ApS Skrevet kl. 22:32
Hvor mange stjerner giver du? :
Hej Michael

Tak for dit indlæg, det er en fin udmelding. Jeg interesserer mig lidt for emnet, fordi mit firma håndterer relativt store mængder originalmateriale (OK - alt er relativt: Vi har mange mapper med papir...), og det kunne være værd at overveje at modernisere lidt. Jeg har en enkelt kunde, vi bogfører for, som scanner alt materialet ind og mailer, og på den måde er vi i princippet landsdækkende.  Og jeg kan se nogle klare fordele ved den arbejdsmetode. Herudover er jeg ved at indlede et forsøg med samarbejde med et dansk firma, som outsourcer bogholderi til "Langbortistan", bare for at se, om det virker. Jeg har forstået, at den elektroniske opbevaring er tilstrækkelig, og at man i princippet kan smide materialet ud, hvis det er scannet ind, men er der særlige krav?

Jeg var lige på et kort visit på din hjemmeside, men kunne hverken finde noget nyhedsbrev at tilmelde mig eller nogen invitation til fyraftensmøde. Men jeg er interesseret i at følge med på sidelinjen, mens jeg overvejer i hvor høj grad workflow og andre ord, jeg ikke helt er familiære med, er en del af min kommende udvikling.

Mange hilsner

 

 

 

Tilmeldt 6. Dec 05
Indlæg ialt: 63
Skrevet kl. 16:15
Hvor mange stjerner giver du? :
 

Hej Anette,



Der er ingen tvivl om at indscannede dokumenter fylder mindre end papirudgaverne. Det er også hurtigere at finde dem igen når de er scannet og indekseret med gode søgeord (keywords, nøgleord, metadata.. - Kært barn har mange navne..)


Der er også flere personer der kan se de samme dokumenter på samme tid.



Dette er bare nogle af de fordele jeg ser ved at elektronisk dokumenthåndtering. De virksomheder jeg har hjulpet, har næsten alle hver deres gode grunde til at gå i gang med at scanne og arkivere elektronisk.




Hvad ser du selv af fordele ved at modernisere sin virksomhed med dokumenthåndtering og elektroniske arbejdsgange (workflows)?


 

Det er korrekt at den elektroniske opbevaring er tilstrækkelig. Men der er dog nogle krav der skal opfyldes.





Dette er min egen fortolkning af reglerne / retningslinierne..


Når det gælder fakturaer, skal disse scannes og gemmes i TIFF Gruppe 4 formatet. Dernæst skal de opbevares på et ikke-redigerbart medie. Dette er ikke helt nemt, da de fleste gemmer deres filer på almindelige harddiske. I stedet skal det system hvor i man gemmer og arbejder med fakturaerne have et såkaldt "audit trail" el. transaktionsspor. De fleste kalder det bare for en log over alt hvad der er sket med dokumentet (fakturaen). Med denne log og det elektroniske dokument i hånden, skulle bevisværdien være i orden. Der er dog i skrivende stund ikke nogen domsafgørelser om bevisligheden og værdien af indscannede dokumenter.

 

Fra Roskilde
Tilmeldt 6. Sep 05
Indlæg ialt: 23
Skrevet kl. 19:17
Hvor mange stjerner giver du? :
Hej.

 

Interessant indlæg. Der er nok ingen tvivl om at elektronisk dokumenthåndtering er vejen frem.

 

Lige en ting - Hvis du har Adobe Acrobat 6 Pro, eller nyere, er det her muligt at foretage en OCR uden brug af andet software.

Tilmeldt 6. Dec 05
Indlæg ialt: 63
Skrevet kl. 21:34
Hvor mange stjerner giver du? :
Hej Michael H,

 

Korrekt.. Har du Adobe Acrobat 6 eller nyere (ikke Acrobat Reader!), kan man OCR-behandle dokumenter. Enten ved at scanne dokumentet ind i Acrobat eller ved at åbne at tidligere indscannet dokument med Acrobat.

 

Herefter vælges i menuen "Document" -> "Paper Capture" -> "Start Capture". Husk at trykke på "Edit"-knappen under "Settings" for at vælge sprog og hvordan outputtet ønskes.

 

Det er en god ide at gennemgå de ord som Acrobat var i tvivl om bagefter ved at vælge "Find First OCR Suspects" el. "Find All OCR Suspects".

 

Jeg synes desværre ikke at mulighederne med OCR er ret gode i Acrobat, da det kan være svært at bestemme hvad der skal behandles som tekst, hvad der skal behandles som billede og hvad der slet ikke skal behandles.

Har men flere dokumenter der skal behandles, kommer man hurtigt til at bruge for meget tid på arbejdet med Acrobat. Så jeg vil æde min hat på at det godt kan betale sig at ofre lidt under 1000 kr. på et stykke software der er lavet KUN til at OCR-behandle mange dokumenter. Et andet issue er den OCR-engine Acrobet benytter. Den er ikke lige så hurtigt og lige så god som en man har betalt for.

Dette er ikke for at nedgøre dit indlæg, for du har helt ret i at man kan bruge Acrobat. Jeg vil bare gerne have at folk ved at de måske kommer til at bruge unødigt meget tid på arbejdet.



 

 

Jeg lavede lige en lille test på en farveindscannet gammel brochure.

 

Acrobat brugte 30 sekunder på at OCR-behandle hele siden med svensk som det valgte sprog.

En bid af esultatet:

 


Forskningen d& det gäller kuggremmar har under de senaste Aren
ägnats At att I M problemet med hur man avsevätt skulle kunna öka
effektöverföringen i remmen. Det gällde att konstruera en rem för stora
drivmoment vid laga hastigheter men att halla remmen inom rimliga
dimensioner när det galler tjocklek och bredd.


Mit foretrukne program brugte: 10 sekunder på at behandle hele siden med svensk som det valgte sprog.
En bid af esultatet:



Forskningen då det gäller kugg remmar har under de senaste åren
ägnats åt att lösa problemet med hur man avsevärt skulle kunna öka
effektöverföringen i remmen. Det gällde att konstruera en rem för stora
drivmoment vid låga hastigheter men att hålla remmen inom rimliga
dimensioner när det gäller tjocklek och bredd.




 

Her er den indscannede bid







 

Vurder selv korrektheden af resultaterne, og bemærk at det tog Acrobat 3 gange så lang tid at komme frem til et dårligere resultat.


- Spørg ikke hvorfor jeg har brugt et svensk dokument som eksempel... Jeg aner det ikke


Håber at du og andre kan bruge disse erfaringer til noget.


 


 


Side 1 ud af 3 (21 indlæg)