Discussion:
(g)ocr
Dieter
2009-10-21 20:37:23 UTC
Permalink
Heeft iemand ocr al eens met succes geprobeerd? Ik kan wel vanalles gaan
proberen, maar als iemand tips heeft voor een gerede kans van slagen zou
dat fijn zijn.

Groet, Dieter.
--
Ubuntu-NL mailing list
Ubuntu-NL-***@public.gmane.org
Info/Uitschrijven: https://lists.ubuntu.com/mailman/listinfo/ubuntu-nl
Niels Egberts
2009-10-21 21:00:24 UTC
Permalink
Ik gebruik zelf deze wel eens: http://www.free-ocr.com/

Dan gooi ik er gewoon een gescant document in, en dan moet je er wel
nog een keer overheen om de tikfouten eruit te halen. Maar dat is
altijd nog minder tijd dan alles zelf overtikken. De accuraatheid
verschilt nogal met de kwaliteit van je documentje.

Niels.
Post by Dieter
Heeft iemand ocr al eens met succes geprobeerd? Ik kan wel vanalles gaan
proberen, maar als iemand tips heeft voor een gerede kans van slagen zou
dat fijn zijn.
Groet, Dieter.
--
Ubuntu-NL mailing list
Info/Uitschrijven: https://lists.ubuntu.com/mailman/listinfo/ubuntu-nl
--
Ubuntu-NL mailing list
Ubuntu-NL-***@public.gmane.org
Info/Uitschrijven: https://lists.ubuntu.com/mailman/listinfo/ubuntu-nl
Niels Egberts
2009-10-22 18:15:24 UTC
Permalink
Op woensdag 21-10-2009 om 23:00 uur [tijdzone +0200], schreef Niels
Post by Niels Egberts
Ik gebruik zelf deze wel eens: http://www.free-ocr.com/
Ik heb het formulier gescand met xsane, en dan met het ocr programma wat
daarbij zit, een tekst bestand laten maken. Maar dat leek echt helemaal
nergens op. Vermoedelijk is het ocr programma wat jij gebruikt hetzelfde
wat in xsane wordt gebruikt.
Wat voor parameters gebruik jij?
Groet, Dieter.
Ik upload het gewoon naar de site. Ze zeggen dat ze Tesseract
gebruiken. Die heeft een GPL licensie en (mede) ontwikkelt door
Google. Het schijnt dat ze het ook gebruiken voor het inscannen van
alle boeken.
--
Ubuntu-NL mailing list
Ubuntu-NL-***@public.gmane.org
Info/Uitschrijven: https://lists.ubuntu.com/mailman/listinfo/ubuntu-nl
Marc Coevoet
2009-10-22 19:02:24 UTC
Permalink
Post by Niels Egberts
Op woensdag 21-10-2009 om 23:00 uur [tijdzone +0200], schreef Niels
Post by Niels Egberts
Ik gebruik zelf deze wel eens: http://www.free-ocr.com/
Ik heb het formulier gescand met xsane, en dan met het ocr programma wat
daarbij zit, een tekst bestand laten maken. Maar dat leek echt helemaal
nergens op. Vermoedelijk is het ocr programma wat jij gebruikt hetzelfde
wat in xsane wordt gebruikt.
Wat voor parameters gebruik jij?
Groet, Dieter.
Ik upload het gewoon naar de site. Ze zeggen dat ze Tesseract
gebruiken. Die heeft een GPL licensie en (mede) ontwikkelt door
Google. Het schijnt dat ze het ook gebruiken voor het inscannen van
alle boeken.
Tesseract komt van HP. Ontwikkeld ergens in de jaren 80 al.
HP gaf de broncode vrij, want onderzoek doen op zoiets dat neit 100%
perfect raakt, is niet leuk.


http://en.wikipedia.org/wiki/Tesseract_(software)

Marc
--
Shortwave transmissions in English, Francais, Deutsch, Suid-Afrikaans, Urdu, Cantonese, Greek, Spanish, Portuguese, ...
http://users.fulladsl.be/spb13810/radio/swlist/
Stations list: http://users.fulladsl.be/spb13810/radio/txlist/
--
Ubuntu-NL mailing list
Ubuntu-NL-***@public.gmane.org
Info/Uitschrijven: https://lists.ubuntu.com/mailman/listinfo/ubuntu-nl
Dieter
2009-10-22 19:12:17 UTC
Permalink
Op woensdag 21-10-2009 om 23:00 uur [tijdzone +0200], schreef Niels
Post by Niels Egberts
Ik gebruik zelf deze wel eens: http://www.free-ocr.com/
Dan gooi ik er gewoon een gescant document in, en dan moet je er wel
nog een keer overheen om de tikfouten eruit te halen. Maar dat is
altijd nog minder tijd dan alles zelf overtikken. De accuraatheid
verschilt nogal met de kwaliteit van je documentje.
Ik heb het formulier gescand met xsane, en dan met het ocr programma wat
daarbij zit, een tekst bestand laten maken. Maar dat leek echt helemaal
nergens op. Vermoedelijk is het ocr programma wat jij gebruikt hetzelfde
wat in xsane wordt gebruikt.
Wat voor parameters gebruik jij?

Groet, Dieter.
--
Ubuntu-NL mailing list
Ubuntu-NL-***@public.gmane.org
Info/Uitschrijven: https://lists.ubuntu.com/mailman/listinfo/ubuntu-nl
Koen Wybo
2009-10-23 06:27:59 UTC
Permalink
Op woensdag 21-10-2009 om 23:00 uur [tijdzone +0200], schreef Niels
Post by Niels Egberts
Ik gebruik zelf deze wel eens: http://www.free-ocr.com/
Dan gooi ik er gewoon een gescant document in, en dan moet je er wel
nog een keer overheen om de tikfouten eruit te halen. Maar dat is
altijd nog minder tijd dan alles zelf overtikken. De accuraatheid
verschilt nogal met de kwaliteit van je documentje.
Ik heb het formulier gescand met xsane, en dan met het ocr programma wat
daarbij zit, een tekst bestand laten maken. Maar dat leek echt helemaal
nergens op. Vermoedelijk is het ocr programma wat jij gebruikt hetzelfde
wat in xsane wordt gebruikt.
Wat voor parameters gebruik jij?
Groet, Dieter.
Je kan ook gebruikmaken van tesseract: een vrijgegeven OCR-engine uit de
jaren 90 en dat sinds enkele jaren verder wordt ontwikkeld. Doet de job
beter dan gocr en clara.
De meest gemakkelijk manier om hem te installeren is samen met
gscan2pdf. Kies dan vervolgens tesseract als OCR.
Vergeet ook niet de nederlandstalige modules mee te installeren (anders
doet het engelstalige heuristiek).

mvg,

Koen Wybo
--
Ubuntu-NL mailing list
Ubuntu-NL-***@public.gmane.org
Info/Uitschrijven: https://lists.ubuntu.com/mailman/listinfo/ubuntu-nl
alain
2009-10-31 10:42:48 UTC
Permalink
Goede Morgen


Heb een Update gedaan naar Ubuntu 9.10....alles goed

Maar ik wil in Synaptic VLC installeren....dit gaat niet ?

Wanneer ik herladen kies " pakket informatie downloaden " dan blijft
hij vast op de helft.
Dan krijg je de melding kon geen verbinding maken met arschief...

vb:

W: Ophalen van
http://be.archive.ubuntu.com/ubuntu/dists/karmic/main/i18n/Translation-nl.bz2
Kan niet verbinden met be.archive.ubuntu.com http: is mislukt

Ben ik iets vergeten ?!

Groeten

Alain
--
Ubuntu-NL mailing list
Ubuntu-NL-***@public.gmane.org
Info/Uitschrijven: https://lists.ubuntu.com/mailman/listinfo/ubuntu-nl
Niels Egberts
2009-10-31 12:49:47 UTC
Permalink
Post by alain
Maar ik wil in Synaptic VLC installeren....dit gaat niet ?
Wanneer ik herladen  kies " pakket informatie downloaden " dan blijft
hij vast op de helft.
Dan krijg je de melding kon geen verbinding maken met arschief...
Wie weet heeft je archief problemen ofzo. Je kunt even wachten of ze
het misschien zelf verhelpen, of je kunt even een andere mirror
proberen. Dat kan je bij systeem->beheer->softwarebronnen. Daar kan je
een andere (bijvoorbeeld Nederlandse) server proberen. Dan je
pakkettenlijst even herladen en opnieuw proberen.

Niels.
--
Ubuntu-NL mailing list
Ubuntu-NL-***@public.gmane.org
Info/Uitschrijven: https://lists.ubuntu.com/mailman/listinfo/ubuntu-nl
Floris
2009-10-31 18:04:04 UTC
Permalink
Beste Alain,

helaas krijg ik op dit moment (zaterdag avond om 19:00 uur)
ook geen verbinding met http://be.archive.ubuntu.com

http://nl.archive.ubuntu.com doet het wel, dus even een andere
mirror instellen. Of wachten tot de server het weer doet.

veel succes,

Floris
Post by alain
Goede Morgen
Heb een Update gedaan naar Ubuntu 9.10....alles goed
Maar ik wil in Synaptic VLC installeren....dit gaat niet ?
Wanneer ik herladen kies " pakket informatie downloaden " dan blijft
hij vast op de helft.
Dan krijg je de melding kon geen verbinding maken met arschief...
W: Ophalen van
http://be.archive.ubuntu.com/ubuntu/dists/karmic/main/i18n/Translation-nl.bz2
Kan niet verbinden met be.archive.ubuntu.com http: is mislukt
Ben ik iets vergeten ?!
Groeten
Alain
--
Ubuntu-NL mailing list
Ubuntu-NL-***@public.gmane.org
Info/Uitschrijven: https://lists.ubuntu.com/mailman/listinfo/ubuntu-nl
alain
2009-11-01 07:42:40 UTC
Permalink
Post by Floris
Beste Alain,
helaas krijg ik op dit moment (zaterdag avond om 19:00 uur)
ook geen verbinding met http://be.archive.ubuntu.com
http://nl.archive.ubuntu.com doet het wel, dus even een andere
mirror instellen. Of wachten tot de server het weer doet.
veel succes,
Floris
Post by alain
Goede Morgen
Heb een Update gedaan naar Ubuntu 9.10....alles goed
Maar ik wil in Synaptic VLC installeren....dit gaat niet ?
Wanneer ik herladen kies " pakket informatie downloaden " dan blijft
hij vast op de helft.
Dan krijg je de melding kon geen verbinding maken met arschief...
W: Ophalen van
http://be.archive.ubuntu.com/ubuntu/dists/karmic/main/i18n/Translation-nl.bz2
Kan niet verbinden met be.archive.ubuntu.com http: is mislukt
Ben ik iets vergeten ?!
Groeten
Alain
ik probeerde nl en het ging nu wel.

Alvast bedankt
--
Ubuntu-NL mailing list
Ubuntu-NL-***@public.gmane.org
Info/Uitschrijven: https://lists.ubuntu.com/mailman/listinfo/ubuntu-nl
Loading...