mikrocontroller.net

Forum: PC Hard- und Software Dokumente vernünftig einscannen


Announcement: there is an English version of this forum on EmbDev.net. Posts you create there will be displayed on Mikrocontroller.net and EmbDev.net.
Autor: Wurstrakete (Gast)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Tach,
ich digitalisiere zurzeit etliche Dokumente, bin aber mit den 
Ergebnissen nicht wirklich zufrieden :-/

Der Scanner ist zwar ganz gut, kennt aber nur drei Modi:
 1. Farbe
 2. Graustufen
 3. Schwarzweiß

Farbe:
Die Scans sehen exakt so aus wie das Original. Bilder, Unterschriften 
etc. sind sehr gut erkennbar. Nachteil: z.B. Ökopapier ist natürlich im 
Scan nicht weiß, sondern grau/braun. Damit lässt sich der Scan dann 
später nicht mehr ausdrucken.
=> Nicht wirklich geeignet

Graustufen:
Im Prinzip wie der Farbmodus, nur dass eben die Farbinformationen fehlen 
;-) Die Nachteile sind aber die gleichen.
=> Noch weniger geeignet

Schwarzweiß:
Hier wird die Papierfarbe sauber ignoriert und weiß gefärbt. Inhalt und 
Papier heben sich maximal gut voneinander ab. Auch funktioniert die OCR 
hier am besten. Nachteile: Logos und Bilder sind komplett kaputt. 
Unterschriften etc. sind ebenfalls unlesbar.
=> Auch nicht wirklich geeignet

Nun frage ich mich, ob es nicht eine Scan-Software gibt, die das besser 
hinbekommt. D.h. eine saubere Erkennung von Papiertyp, Text, Grafiken 
etc.
Am Ende hätte ich gerne einen weißen Hintergrund (unabhängig vom 
Papiertyp), sauberen, gut lesbaren Text (für OCR) und farbige Grafiken.

Natürlich geht das alles mit Photoshop von Hand, aber eine 
automatisierte Lösung wäre mir lieber ;-) (und sollte technisch machbar 
sein)

Autor: Rudi Radlos (Gast)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Wurstrakete schrieb:
> ob es nicht eine Scan-Software gibt

Es gibt jede Menge SW und Scanner. Was benutzt Du bisher?
Mal FineReader-Testversion benutzt?
https://www.heise.de/download/product/finereader-75254

Autor: Walter T. (nicolas)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Der echte, teure Adobe Acrobat ist ganz gut darin, beim Scannen den 
Hintergrund zu entfernen. Ob man den sich den leisten will, ist aber 
eine andere Frage.

Oft ist in den Scannertreibern selbst auch eine 
Hintergrund-Entfernen-Funktion vorhanden. Meist zu finden unter 
irgendwelchen "Experteneinstellungen". Manchmal ist die gut. Manchmal 
nicht. Muß man ausprobieren.

: Bearbeitet durch User
Autor: Wurstrakete (Gast)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Rudi Radlos schrieb:
> Es gibt jede Menge SW und Scanner. Was benutzt Du bisher?

Ich habe das Windows Standardtool, die Brother-Software ("iPrint & 
Scan"?) und das kostenlose NAPS2 (https://www.naps2.com/) probiert.
Aber keins der Tools beherrscht eine nennenswert intelligente 
Nachbearbeitung.

Abby FineReader sieht ziemlich mächtig aus (kann vermutlich alles was 
ich mir wünsche), kostet aber 200€. Das sprengt leider den Rahmen :-/

Autor: Rudi Radlos (Gast)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Wurstrakete schrieb:
> Aber keins der Tools beherrscht eine nennenswert intelligente
> Nachbearbeitung.

RICHTIG scannen ist nicht in 5 Minuten erlernt. Man muß testen und 
optimieren. Gute SW +HW+optimale Einstellungen bringen schon was. Unser 
Kodak hat >10k€ gekostet.

Autor: Morgenfreude (Gast)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Gimp DBP?
Das funktioniert erfahrungsgemäß aber auch nur gut bei Leuten die sich 
ein bisschen auskennen wie Features wie Kantenerkennung usw. 
funktionieren.

Autor: Joachim B. (jar)
Datum:

Bewertung
0 lesenswert
nicht lesenswert

: Bearbeitet durch User
Autor: Sebastian S. (amateur)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Schau doch mal nach, ob sich nicht irgendwo komfortabel Scanprofile 
vordefinieren lassen. Dann kannst Du via Klick Schwarz-Weiß erzwingen, 
oder den vollen Farbraum nutzen. Den Flyer mit lau einscannen und Dein 
Foto mit maximaler Auflösung archivieren.

Autor: Wurstrakete (Gast)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Sebastian S. schrieb:
> Dann kannst Du via Klick Schwarz-Weiß erzwingen,
> oder den vollen Farbraum nutzen.

Das Problem sind vor allem Seiten, auf denen beides zu finden ist. Z.B. 
ein Vertrag mit gedruckter schwarze Schrift und einer Unterschrift mit 
blauer Tinte.
Auch sind oft Grafiken oder Firmenlogos auf den Dokumenten, die ich 
gerne erhalten würde.

Autor: Sebastian S. (amateur)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Ich glaube nicht, dass es eine Software gibt, die selektiv scannen kann.
Hier gilt:
1. Computer sind doof
2. Jedes Blatt ist anders
Schon eine - eigentlich einfache - Unterscheidung: "Ist das der 
Hintergrund des Logos oder Umweltschutzpapier" ist automatisch kaum 
möglich.

Autor: Wurstrakete (Gast)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Sebastian S. schrieb:
> Ich glaube nicht, dass es eine Software gibt, die selektiv scannen kann.
> Hier gilt:
> 1. Computer sind doof
> 2. Jedes Blatt ist anders
> Schon eine - eigentlich einfache - Unterscheidung: "Ist das der
> Hintergrund des Logos oder Umweltschutzpapier" ist automatisch kaum
> möglich.

Die Farbe des Papiers lässt sich sehr einfach an den Rändern des 
Dokuments ermitteln, da die ja nie bis zum rand bedruckt sind.
Danach sollte eine einfache Tonwertkorrektur reichen, um den Hintergrund 
"weiß" zu bekommen ohne den schwarzen Text in Mitleidenschaft zu ziehen.

Als Sahnehäubchen könnte man dann nach bunten Bereichen suchen 
(=Bilder), und diese von der Tonwertkorrektur ausklammern.

Das klingt jetzt nicht nach Hexenwerk ;-)
(Grafiktools leisten da noch ganz anderes)

Autor: Sebastian S. (amateur)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
@Wurstrakete
Da hast Du zweifelsfrei Recht.

Es gibt dabei aber eine kleine Einschränkung: DU kannst das!
DU kannst in Deiner Grafiksoftware Bereiche auswählen, die von DIR 
definiert behandelt werden sollen. Und zwar nach DEINEN Vorstellungen.

Schon allein die Logik: "Der Rand beinhaltet die Hintergrundfarbe", hat 
jede Menge Pferdefüße.

Aber wie Du bereits gesagt hast: Können tut die Grafiksoftware vieles. 
Nur musst Du ihr das auch ganz genau "erklären".

Autor: Wegstaben V. (wegstabenverbuchsler)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Irfan kann auch einiges zur Bildverbesserung

Autor: Mutluit M. (mutluit)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Ich habe einen alten Scanner und scanne nur selten. Da gibt es beim 
Kommandozeilenpgm "scanimage" unter Linux zwei Optionen für 
Scanner-Kalibrierung. Wozu dient so eine Kalibrierung eigentlich?
Die Manpage sagt leider nichts darüber aus.

(Ich weiss, unter Linux gibt's auch ScanPgme mit GUI wie "XSane Image 
scanning program", "Simple Scan" und auch aus "LibreOffice" heraus, aber 
ich bevorzuge das KommandozeilenPgm weil ich so auch halbautomatischen 
Batch-Betrieb machen kann)

$ echo $SCANNER
genesys:libusb:002:063

$ scanimage -h -d $SCANNER
...
    --calibration-file <string> [/home/xxxxx/.sane/hewlett-packard-scanjet-4850c.cal]
        Specify the calibration file to use
  Sensors:
  Buttons:
    --clear-calibration
        Clear calibration cache

Autor: Daniel S. (Gast)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Evtl. kann ScanTailor helfen:
https://scantailor.org/

Die Bedienung ist etwas gewöhnungsbedürftig...

Gruß Daniel

Autor: F. F. (foldi)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Mal eine blöde Anmerkung dazu.
Scannen mache ich nicht mehr wirklich, aber mit Dropbox fotografiere ich 
die Sachen. Nennt sich dann auch scannen und da wird die Seite immer 
weiß dargestellt.

Autor: Copymaster (Gast)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Eine Kopie ist eine Kopie, sonst wäre es keine Kopie!

Autor: Mutluit M. (mutluit)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Copymaster schrieb:
> Eine Kopie ist eine Kopie, sonst wäre es keine Kopie!

Eine Kopie kann aber auch 100% identisch mit dem Original sein.  :-)

Autor: ● J-A V. (Firma: FULL PALATINSK) (desinfector) Benutzerseite
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Wurstrakete schrieb:
> Nachteil: z.B. Ökopapier ist natürlich im
> Scan nicht weiß, sondern grau/braun. Damit lässt sich der Scan dann
> später nicht mehr ausdrucken.

dann musst Du die "Freiflächen" weiss drucken

:]

Autor: Dietmar S. (didi2)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Wurstrakete schrieb:
> Dokumente vernünftig einscannen

Keine Ahnung ob ich dir damit weiterhelfe, hier nur ein paar meiner 
persönlichen Erfahrungen:

Unter Windows habe ich die besten Ergebnisse meist mit der 
Original-Software, die mit dem Scanner mitgeliefert wurde, erzielt.

Unter Linux verwende ich "gscan2pdf" mit der Einstellung 
"Strichzeichnung" und 600 dpi. Abspeichern als PDF (Kompression: ZIP). 
Ist optimal um Dokumente gut auf dem Bildschirm lesen zu können und 
später auch wieder sauber auszudrucken. Die Dateigröße ist dabei sehr 
klein. Mit Helligkeit, Kontrast und Schwellwert musst du 
experimentieren.

Für Bilder/Grafiken nicht optimal, aber mit den richtigen Einstellungen 
sind sie einigermaßen erkennbar. Gute Fotos kann man natürlich 
vergessen. Ich hab damit alle meine Dokumente eingescannt. Ist sehr 
praktisch, da ich sie eben mal aufrufen kann ohne minutenlang suchend 
Ordner zu wälzen.

Die besten Ergebnisse habe ich jedoch mit einer Android-App erzielt 
(weiß auswendig nicht mehr welche, nur eine fand ich gut). Allerdings 
war es mir zu umständlich die Dokumente jedes mal auf den PC zu 
übertragen. Man muss sie ja bezeichnen und auf dem Handy finde ich das 
Tippen mühsam.

: Bearbeitet durch User
Autor: Christoph db1uq K. (christoph_kessler)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Mich erstaunt immer wieder, wie gut gimagereader mit tesseract heute 
funktioniert, und das kostenlos.
gscan2pdf hab ich ausprobiert, aber da wird jedes Wort in einem eigenen 
Textfeld abgelegt, man kann anschließend nicht einfach komplette Texte 
aus dem PDF entnehmen.

Autor: Mutluit M. (mutluit)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Mutluit M. schrieb:
> Ich habe einen alten Scanner und scanne nur selten. Da gibt es beim
> Kommandozeilenpgm "scanimage" unter Linux zwei Optionen für
> Scanner-Kalibrierung. Wozu dient so eine Kalibrierung eigentlich?

Hab jetzt diese Seite gefunden (Abschnitt CALIBRATION):
https://www.systutorials.com/docs/linux/man/5-sane-genesys/

Ich glaube ich brauch's nicht kalibrieren weil die Qualität für mich 
akzeptabel ist.

Was gut wäre, ist, wenn das ScanPgm autom. die Scan-Area erkennen könnte 
und somit den Aussenbereich (Rand/Ränder) nicht schwarz machen würde... 
(kostet ja Tinte, bzw. Toner in diesem Fall...)
Klar kann man den Scan-Bereich manuell selber definieren, aber autom. 
wäre mir lieber.

: Bearbeitet durch User
Autor: Lochmacher (Gast)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Speziell für Scans von Schemas halte ich mich an das Rezept vom 
RadioMuseum.Org (habe ansonsten "nix" mit Bildbearbeitung i.A. und GIMP 
i.S. zu tun, kenne mich da also überhaupt nicht aus)

* <https://www.radiomuseum.org/forum/schaltplaene_perfekt_mit_gimp.html>;

Ja, das ist nicht ganz auf der Spur vom Threadstarter, sorry...

Autor: ● J-A V. (Firma: FULL PALATINSK) (desinfector) Benutzerseite
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Ich mach mir um Dokumentendigitalisierung keinen Kopp.
Wirft jemand die Originale nach dem Digitalisieren weg?

Wahrscheinlich nicht. Also brauchst du immer noch die Z4rges-Kiste.
Dann kann ich das auch gleich so lassen.

Autor: Lochmacher (Gast)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
● J-A V. schrieb:
> Ich mach mir um Dokumentendigitalisierung keinen Kopp.
> Wirft jemand die Originale nach dem Digitalisieren weg?

Du hast keine Gebrauchtgeräte, zu denen Du von einem Kumpel die 
Papierdoku geliehen bekommst?
Ach so: Du gibst geliehene Doku nie zurück...

Autor: ● J-A V. (Firma: FULL PALATINSK) (desinfector) Benutzerseite
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Dokus zu Geräten finde ich im Web

Autor: Mutluit M. (mutluit)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Lochmacher schrieb:
> Speziell für Scans von Schemas halte ich mich an das Rezept vom
> RadioMuseum.Org (habe ansonsten "nix" mit Bildbearbeitung i.A. und GIMP
> i.S. zu tun, kenne mich da also überhaupt nicht aus)
>
> * <https://www.radiomuseum.org/forum/schaltplaene_perfekt_mit_gimp.html>;

Ja, das ist doch eine coole Fundgrube! Thx.

Autor: Wurstrakete (Gast)
Datum:
Angehängte Dateien:

Bewertung
0 lesenswert
nicht lesenswert
Aus Neugier/Spaß an der Freude habe ich jetzt einfach mal angefangen mir 
mein eigenes Scan-Tool zu schreiben ;-)

Input:
Im Anhang seht ihr den Input, ein eingescanntes Bahnticket (auf 
Ökopapier). Darauf habe ich noch ein paar Bilder ge-photoshopped.

Output:
Das Tool färbt das Papier weiß, macht den Text etwas lesbarer (Kontrast) 
und erhält gleichzeitig alle Grafiken.

Ich finde das Ergebnis für einen ersten Wurf schon ganz gut. Jedenfalls 
um Welten besser als das, was z.B. die Bother-Software ausspuckt.

Autor: ● J-A V. (Firma: FULL PALATINSK) (desinfector) Benutzerseite
Datum:

Bewertung
0 lesenswert
nicht lesenswert
warum braucht man eigentlich Pinguine
und grüne Gibber-Monster auf einem Ticket?

Autor: Thomas S. (tom_63)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Mit welchem scanner arbeitest Du eigentlich?

Autor: Naseweis J-A. V. (Gast)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
● J-A V. schrieb:
> Dokus zu Geräten finde ich im Web

Du bist so gut, hilf doch mal denen da:
Beitrag "[S] Schema zu VOLTCRAFT Digitales DCF77 Funkuhrsystem"
Beitrag "Denon DR-M11, Schema?"
u.v.m

Autor: Sebastian L. (sebastian_l72)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Tschuldigung
ein online ticket wird gedruckt, gestempelt und danach gescannt?
ist das the art of german overengineering?

Emails druckt man doch auch nicht aus.


und für soetwas machst du einen Aufwand?
Für den Rechnungsprüfer reicht auch etwas fast unleserliches.

Wenn das jetzt alte Familiendias wären....

Autor: Wurstrakete (Gast)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Thomas S. schrieb:
> Mit welchem scanner arbeitest Du eigentlich?

Ein Brother ADS 1700W.

Sebastian L. schrieb:
> Tschuldigung
> ein online ticket wird gedruckt, gestempelt und danach gescannt?
> ist das the art of german overengineering?
>
> Emails druckt man doch auch nicht aus.

Schlaukopf ^^
Das hatte ich gerade zur Hand und hab es daher als Test-Dokument 
benutzt.

Ziel des ganzen ist es alle Dokuemente im Haushalt zu digitaliseren und 
in ein DMS einzupflegen. Ich hab die Nase voll von Schrankwänden voller 
Ordner...

Autor: M.M.M (Gast)
Datum:

Bewertung
-1 lesenswert
nicht lesenswert
Hallo

Wurstrakete schrieb:
> Ziel des ganzen ist es alle Dokumente im Haushalt zu digitaliseren und
> in ein DMS einzupflegen. Ich hab die Nase voll von Schrankwänden voller
> Ordner...

Und dafür der große Aufriß? Ich scanne nun in der Firma wie auch privat 
gefühlt schon 'ne halbe Ewigkeit Dokumente ein. Das geschieht IMHO, habe 
gerade keinen Zugriff drauf, mit >=200dpi, Farbe. Erstellt werden 
durchsuchbare PDF, also quasi der Scan als Foto mit auf anderer Ebene 
hinterlegtem Text.
Eingestellt ist die Software grob so, daß die Scans vernünftig lesbar 
sind. Selbstverständlich bleiben Papierfarbe und Textur sichtbar. Das 
ist auch bei eventuellem Ausdruck, abgesehen vom S/W-Laser, kein 
Problem. Und so oft muß ich nichts ausdrucken, daß die Farbkosten 
Schmerzen bereiten täten
Früher hat man aufwendig Text und Grafiken getrennt, um wertvollen 
Speicherplatz zu sparen. Das ist aber heute nun wirklich obsolet.

Nebenbei: Wirklich wichtige Dokumente behält man eh im Original und den 
Ausdrucken darf man durchaus ansehen, daß das Kopien sind. Auf keinen 
Fall will man mit den Kopien den Eindruck erwecken, auch nicht 
versehentlich, es handele sich um die Originale.

MfG

Autor: Wurstrakete (Gast)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
M.M.M schrieb:
> Und dafür der große Aufriß?

Hey, wir sind doch hier Bastler/Tüftler/Maker/Coder/Hacker ;-)

Ich wollte nur mal probieren, ob es nicht auch besser geht. Ob ich jetzt 
tatsächlich noch das Scannen und den PDF Export + OCR implementiere weiß 
ich allerdings auch nicht...

Scans in Farbe wären natürlich auch eine Option. In wie weit bläst das 
die Dateigröße auf?

Und da ich einen SW-Laser habe, dürfte das ausdrucken von gescanntem 
Ökopapier schwierig werden. Kommt aber tatsächlich so gut wie nie vor, 
wie du ja schon geschrieben hast.
Ggf. könnte man das PDF dann vor dem Drucken auch noch mal "einweißen".

Autor: michael_ (Gast)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Wurstrakete schrieb:
> Thomas S. schrieb:
>> Mit welchem scanner arbeitest Du eigentlich?
>
> Ein Brother ADS 1700W.

Das ist ein Einzugscanner.
Wohl ein modernes Superding, eigentlich für eine Behörde.
Hat aber auch Nachteile gegen über Flachbett.

Hast du denn die Eigenschaften der mitgelieferteb Software voll 
ausgeschöpft?
Die sollte doch das können. Da braucht man sicher nicht selbst 
programmieren.
Helligkeit, Kontrast, Gamma-Korrektur usw.. Und das für jede Farbe 
einzeln.
Dazu noch Profile abspeichern.

Das konnte schon mein alter MiraScan (ACER).

Autor: Tobi P. (Gast)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Wurstrakete schrieb:
> Nun frage ich mich, ob es nicht eine Scan-Software gibt, die das besser
> hinbekommt. D.h. eine saubere Erkennung von Papiertyp, Text, Grafiken
> etc.
> Am Ende hätte ich gerne einen weißen Hintergrund (unabhängig vom
> Papiertyp), sauberen, gut lesbaren Text (für OCR) und farbige Grafiken.

Acrobat ist da sehr gut. Hab eine alte günstige Version in einer XP 
Emulation laufen.

Autor: ● J-A V. (Firma: FULL PALATINSK) (desinfector) Benutzerseite
Datum:

Bewertung
-1 lesenswert
nicht lesenswert
Sebastian L. schrieb:
> Emails druckt man doch auch nicht aus.

sicher?

ich schreibe einem Kollegen eine Mail und womit kommt der zurück,
wenn der 'ne Gegenfrage hat?

Naseweis J-A. V. schrieb:
> ● J-A V. schrieb:
>> Dokus zu Geräten finde ich im Web
>
> Du bist so gut, hilf doch mal denen da:
> Beitrag "[S] Schema zu VOLTCRAFT Digitales DCF77 Funkuhrsystem"
> Beitrag "Denon DR-M11, Schema?"

es ging darum die geliehene Doku zu scannen, ja?
erstens ist di dann ja vorhanden,
2. hab ich ein Handy und mache davon ein Foto.

Wat braucht man dann einen Scanner? Dann Farbwerte, Kontrast etcpp 
anpassen.
äh... willst Du Kopien davon verkaufen oder nur selbst den Kram 
verstehen?

Leute, macht Euch doch nicht immer alles so dermassen kompliziert.

Ist ja kein Wunder, dass in diesem Land alles nur so lahmarschig läuft.

Autor: M.M.M (Gast)
Datum:
Angehängte Dateien:

Bewertung
0 lesenswert
nicht lesenswert
Hallo

Wurstrakete schrieb:
> Ich wollte nur mal probieren, ob es nicht auch besser geht. Ob ich jetzt

Verbessern kann man immer. Fragt sich, ob es den Aufwand lohnt.

> Scans in Farbe wären natürlich auch eine Option. In wie weit bläst das
> die Dateigröße auf?

Kommt auf's Ausgangsmaterial an. Bei mir sind Farbscans im Schnitt 
300-400kB groß. Ich komprimiere allerdings beim Speichern stark. Es geht 
hier ja um's Archivieren von Dokumenten, nicht um's Archivieren der 
Urlaubsfotos.

> Und da ich einen SW-Laser habe, dürfte das ausdrucken von gescanntem
> Ökopapier schwierig werden. Kommt aber tatsächlich so gut wie nie vor,
> wie du ja schon geschrieben hast.

Extra für mal für Dich:
Originalscan.jpg ist eine im letzten Jahrtausend in S/W und IMHO 300dpi 
eingescannte Rechnung, runterkomprimiert auf 128,9kB. Selbst die links 
unten hochkant stehenden Ziffern sind erkennbar.

KopievomAusdruckdesScans.jpg ist ein Handyfoto, extra mit einem billigen 
Lumia 520 gemacht, von einem Ausdruck von Originalscan.jpg mittels 
S/W-Laserdrucker, runterkomprimiert auf 132,6kB. Das die Ziffern links 
unten nicht mehr erkennbar sind, liegt am Handyfoto, nicht am Ausdruck. 
Der Ausdruck läßt alles Wesentliche erkennen und ist damit akzeptabel.

Das zeigt, daß man durchaus einen hochkomprimierten Scan mit Graustufen 
auf S/W-Laser ausdrucken kann. Zudem zeigt es, daß eigentlich gar kein 
Scanner notwendig ist. Man kann das auch mit dem Handy erledigen. Selbst 
auf dem Foto von der Kopie des Scans, ist alles Wesentliche zu erkennen 
und damit ist auch dieses akzeptabel.

MfG

Autor: oszi40 (Gast)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
M.M.M schrieb:
> auf dem Foto von der Kopie des Scans, ist alles Wesentliche zu erkennen

Naja es gibt schon Unterschiede durch Verzerrung wenn man das Handy 
nimmt gegenüber einen Flachbettscanner. Aufwand und Nutzen ...

Autor: Wurstrakete (Gast)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
M.M.M schrieb:
> Kommt auf's Ausgangsmaterial an. Bei mir sind Farbscans im Schnitt
> 300-400kB groß. Ich komprimiere allerdings beim Speichern stark. Es geht
> hier ja um's Archivieren von Dokumenten, nicht um's Archivieren der
> Urlaubsfotos.

Kommt die OCR denn auch problemlos damit klar? Oder leidet die 
Erkennung?

M.M.M schrieb:
> Zudem zeigt es, daß eigentlich gar kein
> Scanner notwendig ist. Man kann das auch mit dem Handy erledigen.

Naja, einen ganzen Stapel Papier in den Einzug legen zu können hat schon 
seine (zeitlichen) Vorteile ;-)

Autor: Karl (Gast)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Hallo

"Vorbildlich" (nein absolut lächerlich und pedantisch) die Rechnung von 
1993 in Deutsche Mark für eine Computermaus auf zu bewahren und dann 
noch ein zu scannen.
Auch schön im Sinne des Datenschutzes und gegen Schleichwerbung die 
Adresse der Verkaufsstelle (die sicherlich noch existiert.. wenn wir 
1995 hätten) geschwärzt wurde.

So was wird hoffentlich nicht nur bei mir spätestens nach Ablauf der 
Garantie entsorgt.
Welcher Kaufkraft entsprechen 49DM (Was sind DM? - Google hilft...) von 
1993 wohl heute in Euro? 30 - 40 oder gar der Wahnsinn summe von 50 ?
Oder hatte die Maus 25Jahre Garantiezeit - erstaunlich...

Etwas OT - aber so was kann ich nicht unkommentiert stehen lassen.

Karl

Autor: ● J-A V. (Firma: FULL PALATINSK) (desinfector) Benutzerseite
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Karl schrieb:
> "Vorbildlich" (nein absolut lächerlich und pedantisch) die Rechnung von
> 1993 in Deutsche Mark für eine Computermaus auf zu bewahren und dann
> noch ein zu scannen

und jetzt wieder ausdrucken...

Autor: M.M.M (Gast)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Hallo

Wurstrakete schrieb:
> M.M.M schrieb:
>> Kommt auf's Ausgangsmaterial an. Bei mir sind Farbscans im Schnitt
>> 300-400kB groß. Ich komprimiere allerdings beim Speichern stark. Es geht

> Kommt die OCR denn auch problemlos damit klar? Oder leidet die
> Erkennung?

OCR läuft ja vor dem komprimierten Abspeichern. Scans mit 300dpi sollte 
im jedem Fall keine Probleme machen. Dokumente mit üblicher Schriftgröße 
machen auch mit 200dpi keine Probleme. Hakelig wird's bei kleiner 
Schrift, am besten graue Schrift auf hellgrauem Hintergrund, wie in 
mancher Fußnote.

> M.M.M schrieb:
>> Zudem zeigt es, daß eigentlich gar kein
>> Scanner notwendig ist. Man kann das auch mit dem Handy erledigen.
>
> Naja, einen ganzen Stapel Papier in den Einzug legen zu können hat schon
> seine (zeitlichen) Vorteile ;-)

Wenn das Papier gleiches Format hat, ja.

MfG

Beitrag #5869417 wurde von einem Moderator gelöscht.
Autor: Sebastian L. (sebastian_l72)
Datum:

Bewertung
1 lesenswert
nicht lesenswert
Wurstrakete schrieb:

> Ziel des ganzen ist es alle Dokuemente im Haushalt zu digitaliseren und
> in ein DMS einzupflegen. Ich hab die Nase voll von Schrankwänden voller
> Ordner...

A)
Sorge dafür das so wenig wie möglich auf Papier ins Haus kommt.
Betriebsanleitungen etc die Produkten beigelegt sind, rauschen hier 
gleich ins Altpapier und das pdf wird geholt.

B)
Denke wie eine Archivar. Was wird noch gebraucht? Was kann weg? Was soll 
zu Forschungszwecken und Nostalgie aufbewahrt werden?
Drucksachen kannst du aus der DNB nachbestellen - auch in aller Zukunft.

C)
Ich scanne auf so einem Canon Multifunktionsdingens das mal eben 200 
Blatt frisst. DPI hoch, Farbtiefe runter. Egal - es geht ums was nicht 
um darum an der Gestaltung zukünftig noch zu forschen. Ich verliere 
Qualität. EGAL. Die Zeit die ich später mal beim Entziffern brauche habe 
ich 100fach beim Scannen gespart.

Zieldateiformat ist pdf/A und z.T. ePub.

Wichtig ist eine Erschliessung - sonst hat man statt Schränken voller 
Altpapier nur Datenmüll.

Eine (zugegeben recht miese) OCR lege ich zur Indexierung an.
Verschlagwortung einer Humanintelligenz ist aber überlegen.

Wieviele Metadaten du anreichern willst, sei dir überlassen.

Ausgangspunkt ist bei mir die die ISAD(G) und die Schlagwortnormdatei 
der DNB https://www.dnb.de/DE/Standardisierung/GND/gnd_node.html

Wähle ein einigermassen verbreitete Findmittelsoftware, dass du später 
mal bequem auf was anderes umsteigen kannst ohne selber scripts 
schreiben zu müssen. Alles vor EAD XML ist nun wirklich zu proprietär.


D)
Revisionsfristen.
Lege unbedingt Revisionsfristen zur Wiedervorlage an. Du betreibst ja 
keine Nationalbücherei oder ein Staatsarchiv, die "für immer" 
aufbewahren.
Was will man mit der Gebrauchsanweisung des CD Kinderradios zyx, welches 
mal EUR 17,99 gekostet hat, das vor 5 Jahren mit Vanilleeis gefüttert 
wurde und das man vor 3 Jahren geschrottet hat? Der Teenager ist 
konfirmiert und streamt eh nur noch vom Mobiltelefon.
Selbst Kaufbelege von Waren helfen dir nach 5 Jahren normal nix mehr.
Jaja es sind nur ein paar kB aber die Datenbank wird grösser und 
langsamer.

Autor: test (Gast)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
oszi40 schrieb:
> Naja es gibt schon Unterschiede durch Verzerrung wenn man das Handy
> nimmt gegenüber einen Flachbettscanner.

Minimal, die Software ist da mittlerweile wirklich gut. Und wann man 
Ausrichtung und Papiergröße korrekt angibt, dann kann man das damit 
erstellte PDF auch einfach ausdrucken und erhält eine anständige Kopie.

Aber ich nutze das eher als FAX. Zum archivieren... Ne, ist doch sehr 
viel aufwendiger als das Papier einfach in Kisten zu lagern, jedenfalls 
für privat.

Antwort schreiben

Die Angabe einer E-Mail-Adresse ist freiwillig. Wenn Sie automatisch per E-Mail über Antworten auf Ihren Beitrag informiert werden möchten, melden Sie sich bitte an.

Wichtige Regeln - erst lesen, dann posten!

  • Groß- und Kleinschreibung verwenden
  • Längeren Sourcecode nicht im Text einfügen, sondern als Dateianhang

Formatierung (mehr Informationen...)

  • [c]C-Code[/c]
  • [avrasm]AVR-Assembler-Code[/avrasm]
  • [code]Code in anderen Sprachen, ASCII-Zeichnungen[/code]
  • [math]Formel in LaTeX-Syntax[/math]
  • [[Titel]] - Link zu Artikel
  • Verweis auf anderen Beitrag einfügen: Rechtsklick auf Beitragstitel,
    "Adresse kopieren", und in den Text einfügen




Bild automatisch verkleinern, falls nötig
Bitte das JPG-Format nur für Fotos und Scans verwenden!
Zeichnungen und Screenshots im PNG- oder
GIF-Format hochladen. Siehe Bildformate.

Mit dem Abschicken bestätigst du, die Nutzungsbedingungen anzuerkennen.