Inscannen en OCR

Hallo,

Ik ben bezig veel stukken (A4) in te scannen. Het zijn vrijwel allemaal prints van de printer, of kopieën. Ik wil graag ruimte maken en niet stapels papier hebben in mijn kantoor.

Ideaal is het om ook te kunnen zoeken in de bestanden. Met welk programma kan ik het omzetten naar OCR leesbare documenten waarin ik kan zoeken op mijn mac. Het handigst is dan om een hele directory om te zetten.

Dank voor jullie hulp.

Ik heb ervaring met het scan programma Prizmo, dit programma levert documenten waarvan de documenten redelijk tot goed ge-OCRd zijn. Bij slechte scans is dit echter niet het geval. Ik heb betere ervaring met PDFpen, hiervan is de OCR van de bestanden beter. Batch OCR kan echter alleen met PDFpenPRO, als ik me niet vergis.

Op mijn werk gebruiken we Adobe Acrobat DC, voor Windows weliswaar maar er is ook een Mac versie. Deze geeft ook goed ge-OCRde bestanden.

ABBYY FineReader Express schijnt ook goed te zijn, maar daar heb ik geen ervaring mee.

Ik gebruik in scripts Tesseract, dit is gratis en de documenten zijn heel goed ge-OCRd. Dit is opensource software en moet via Brew geïnstalleerd worden. Tesseract is de engine en met een ander terminal programma ocrmypdf zet ik de scans om in een ge-OCRd PDF-bestanden.

1 like

Nog wat alternatieven naast de al door ome-kor genoemde.

Welk merk scanner gebruik je? Mijn HP all-in-one kan OCR opslaan.

De scannersoftware van mijn Samsung M2070W printer/scanner kan alleen opslaan als PDF zonder OCR.

Als je niet bang bent van de Terminal, zou je eens naar OCRmyPDF kunnen kijken. Dat is een command-line programma waarmee je in één keer een aantal PDF documenten kunt omzetten naar PDF + doorzoekbare tekst.

Yep, OCRmyPDF gebruik ik ook en de OCR van de PDF-bestanden die daarmee gemaakt zijn is zeer goed.

Zoals ik al zei maakt OCRmyPDF gebruik van Tesseract. Dit programma gebruik ik ook om schermprintjes om te zetten naar platte tekst.

@ome-kor: Ik zie nu dat jij ocrmypdf al genoemd had.

Ik heb OCRmyODF zojuist geïnstalleerd op mijn M1 MBA mbv HomeBrew.

Ik ontdek nu dat veel van de PDF bestanden die ik op mijn Mac heb staan, al doorzoekbaar zijn. :slight_smile:

Als je bijvoorbeeld in Safari een website opslaat als PDF, krijg je ook al een doorzoekbare PDF.

Het valt dus nog niet mee om een PDF zónder tekst te vinden. :slight_smile:

OCRtoPDF werkt ook met images (scans) als input. De output is dan een PDF met doorzoekbare tekst.

Ik heb een aantal gebruikershandleidingen gescand en daar dankbaar gebruik van gemaakt. Eerst probeerde ik het met Prizmo, maar de OCR daarvan was niet zo goed. Met OCRtoPDF daarentegen wel.

1 like

Ik wil jullie graag bedanken voor de hulp, meedenken en support !!