(g)ocr

Discussion:

(g)ocr

Dieter

2009-10-21 20:37:23 UTC

Heeft iemand ocr al eens met succes geprobeerd? Ik kan wel vanalles gaan
proberen, maar als iemand tips heeft voor een gerede kans van slagen zou
dat fijn zijn.

Groet, Dieter.

--
Ubuntu-NL mailing list
Ubuntu-NL-***@public.gmane.org
Info/Uitschrijven: https://lists.ubuntu.com/mailman/listinfo/ubuntu-nl

Niels Egberts

2009-10-21 21:00:24 UTC

Permalink

Ik gebruik zelf deze wel eens: http://www.free-ocr.com/

Dan gooi ik er gewoon een gescant document in, en dan moet je er wel
nog een keer overheen om de tikfouten eruit te halen. Maar dat is
altijd nog minder tijd dan alles zelf overtikken. De accuraatheid
verschilt nogal met de kwaliteit van je documentje.

Niels.

Post by Dieter
Heeft iemand ocr al eens met succes geprobeerd? Ik kan wel vanalles gaan
proberen, maar als iemand tips heeft voor een gerede kans van slagen zou
dat fijn zijn.
Groet, Dieter.
--
Ubuntu-NL mailing list
Info/Uitschrijven: https://lists.ubuntu.com/mailman/listinfo/ubuntu-nl

--
Ubuntu-NL mailing list
Ubuntu-NL-***@public.gmane.org
Info/Uitschrijven: https://lists.ubuntu.com/mailman/listinfo/ubuntu-nl

Niels Egberts

2009-10-22 18:15:24 UTC

Permalink

Op woensdag 21-10-2009 om 23:00 uur [tijdzone +0200], schreef Niels

Post by Niels Egberts
Ik gebruik zelf deze wel eens: http://www.free-ocr.com/

Ik heb het formulier gescand met xsane, en dan met het ocr programma wat
daarbij zit, een tekst bestand laten maken. Maar dat leek echt helemaal
nergens op. Vermoedelijk is het ocr programma wat jij gebruikt hetzelfde
wat in xsane wordt gebruikt.
Wat voor parameters gebruik jij?
Groet, Dieter.

Ik upload het gewoon naar de site. Ze zeggen dat ze Tesseract
gebruiken. Die heeft een GPL licensie en (mede) ontwikkelt door
Google. Het schijnt dat ze het ook gebruiken voor het inscannen van
alle boeken.

--
Ubuntu-NL mailing list
Ubuntu-NL-***@public.gmane.org
Info/Uitschrijven: https://lists.ubuntu.com/mailman/listinfo/ubuntu-nl

Marc Coevoet

2009-10-22 19:02:24 UTC

Permalink

Post by Niels Egberts

Op woensdag 21-10-2009 om 23:00 uur [tijdzone +0200], schreef Niels

Post by Niels Egberts
Ik gebruik zelf deze wel eens: http://www.free-ocr.com/

Tesseract komt van HP. Ontwikkeld ergens in de jaren 80 al.
HP gaf de broncode vrij, want onderzoek doen op zoiets dat neit 100%
perfect raakt, is niet leuk.

http://en.wikipedia.org/wiki/Tesseract_(software)

Marc
--
Shortwave transmissions in English, Francais, Deutsch, Suid-Afrikaans, Urdu, Cantonese, Greek, Spanish, Portuguese, ...
http://users.fulladsl.be/spb13810/radio/swlist/
Stations list: http://users.fulladsl.be/spb13810/radio/txlist/

--
Ubuntu-NL mailing list
Ubuntu-NL-***@public.gmane.org
Info/Uitschrijven: https://lists.ubuntu.com/mailman/listinfo/ubuntu-nl

Dieter

2009-10-22 19:12:17 UTC

Permalink

Op woensdag 21-10-2009 om 23:00 uur [tijdzone +0200], schreef Niels

Post by Niels Egberts
Ik gebruik zelf deze wel eens: http://www.free-ocr.com/
Dan gooi ik er gewoon een gescant document in, en dan moet je er wel
nog een keer overheen om de tikfouten eruit te halen. Maar dat is
altijd nog minder tijd dan alles zelf overtikken. De accuraatheid
verschilt nogal met de kwaliteit van je documentje.

--
Ubuntu-NL mailing list
Ubuntu-NL-***@public.gmane.org
Info/Uitschrijven: https://lists.ubuntu.com/mailman/listinfo/ubuntu-nl

Koen Wybo

2009-10-23 06:27:59 UTC

Permalink

Op woensdag 21-10-2009 om 23:00 uur [tijdzone +0200], schreef Niels

Je kan ook gebruikmaken van tesseract: een vrijgegeven OCR-engine uit de
jaren 90 en dat sinds enkele jaren verder wordt ontwikkeld. Doet de job
beter dan gocr en clara.
De meest gemakkelijk manier om hem te installeren is samen met
gscan2pdf. Kies dan vervolgens tesseract als OCR.
Vergeet ook niet de nederlandstalige modules mee te installeren (anders
doet het engelstalige heuristiek).

mvg,

Koen Wybo

--
Ubuntu-NL mailing list
Ubuntu-NL-***@public.gmane.org
Info/Uitschrijven: https://lists.ubuntu.com/mailman/listinfo/ubuntu-nl

alain

2009-10-31 10:42:48 UTC

Permalink

Goede Morgen

Heb een Update gedaan naar Ubuntu 9.10....alles goed

Maar ik wil in Synaptic VLC installeren....dit gaat niet ?

Wanneer ik herladen kies " pakket informatie downloaden " dan blijft
hij vast op de helft.
Dan krijg je de melding kon geen verbinding maken met arschief...

vb:

W: Ophalen van
http://be.archive.ubuntu.com/ubuntu/dists/karmic/main/i18n/Translation-nl.bz2
Kan niet verbinden met be.archive.ubuntu.com http: is mislukt

Ben ik iets vergeten ?!

Groeten

Alain

--
Ubuntu-NL mailing list
Ubuntu-NL-***@public.gmane.org
Info/Uitschrijven: https://lists.ubuntu.com/mailman/listinfo/ubuntu-nl

Niels Egberts

2009-10-31 12:49:47 UTC

Permalink

Post by alain
Maar ik wil in Synaptic VLC installeren....dit gaat niet ?
Wanneer ik herladen kies " pakket informatie downloaden " dan blijft
hij vast op de helft.
Dan krijg je de melding kon geen verbinding maken met arschief...

Wie weet heeft je archief problemen ofzo. Je kunt even wachten of ze
het misschien zelf verhelpen, of je kunt even een andere mirror
proberen. Dat kan je bij systeem->beheer->softwarebronnen. Daar kan je
een andere (bijvoorbeeld Nederlandse) server proberen. Dan je
pakkettenlijst even herladen en opnieuw proberen.

Niels.

--
Ubuntu-NL mailing list
Ubuntu-NL-***@public.gmane.org
Info/Uitschrijven: https://lists.ubuntu.com/mailman/listinfo/ubuntu-nl

Floris

2009-10-31 18:04:04 UTC

Permalink

Beste Alain,

helaas krijg ik op dit moment (zaterdag avond om 19:00 uur)
ook geen verbinding met http://be.archive.ubuntu.com

http://nl.archive.ubuntu.com doet het wel, dus even een andere
mirror instellen. Of wachten tot de server het weer doet.

veel succes,

Floris

Post by alain
Goede Morgen
Heb een Update gedaan naar Ubuntu 9.10....alles goed
Maar ik wil in Synaptic VLC installeren....dit gaat niet ?
Wanneer ik herladen kies " pakket informatie downloaden " dan blijft
hij vast op de helft.
Dan krijg je de melding kon geen verbinding maken met arschief...
W: Ophalen van
http://be.archive.ubuntu.com/ubuntu/dists/karmic/main/i18n/Translation-nl.bz2
Kan niet verbinden met be.archive.ubuntu.com http: is mislukt
Ben ik iets vergeten ?!
Groeten
Alain

--
Ubuntu-NL mailing list
Ubuntu-NL-***@public.gmane.org
Info/Uitschrijven: https://lists.ubuntu.com/mailman/listinfo/ubuntu-nl

alain

2009-11-01 07:42:40 UTC

Permalink

Post by Floris
Beste Alain,
helaas krijg ik op dit moment (zaterdag avond om 19:00 uur)
ook geen verbinding met http://be.archive.ubuntu.com
http://nl.archive.ubuntu.com doet het wel, dus even een andere
mirror instellen. Of wachten tot de server het weer doet.
veel succes,
Floris

ik probeerde nl en het ging nu wel.

Alvast bedankt

--
Ubuntu-NL mailing list
Ubuntu-NL-***@public.gmane.org
Info/Uitschrijven: https://lists.ubuntu.com/mailman/listinfo/ubuntu-nl