Der Hauptnachteil des Scannens mit optischer Zeichenerkennung besteht darin, dass ein gescanntes Dokument möglicherweise Fehler enthält. Kein OCR-Scansystem ist unfehlbar und Dokumente von schlechter Qualität können so viele Fehler verursachen, dass lange und zeitaufwändig- aufwendiges Korrekturlesen. Handschrift und nicht-lateinische Schriftarten sind besonders schwer korrekt zu scannen.
Optische Scanner können auch Probleme mit Dokumenten haben, die keinen signifikanten Kontrast zwischen Zeichen und Hintergrund aufweisen. Verschmutzte oder auf farbigem Papier gedruckte Seiten können einen Scanner verwirren und zu großen ungelesenen Textblöcken führen. Die zusätzlichen Schritte, die erforderlich sind, um minderwertige Originale für das OCR-Scannen geeignet zu machen, können die potenzielle Zeitersparnis, die die Technologie bietet, vollständig zunichte machen.
Der beste Weg, um sicherzustellen, dass das OCR-Scannen so genau und schnell wie möglich ist, besteht darin, das Originaldokument speziell für das optische Scannen zu entwerfen. Viele OCR-Pakete haben beispielsweise Schwierigkeiten, zwischen ähnlichen Zeichen wie der Ziffer Null und dem Buchstaben O zu unterscheiden. OCR-freundliche Schriftarten lassen diese beiden Zeichen so unterschiedlich wie möglich erscheinen, um dem Computer das Lesen des Dokuments zu erleichtern.
Handgeschriebene Dokumente erfordern einen gleichmäßigen, klaren Abstand zwischen den Buchstaben, um ein ordnungsgemäßes Scannen zu gewährleisten. Aus diesem Grund verlangen Formulare, die OCR-Technologie verwenden, häufig, dass Benutzer in Großbuchstaben in einer Reihe von Feldern drucken. Jeder einzelne Karton kann dann einzeln gescannt werden, um zu verhindern, dass der Computer zusammengelaufene Buchstaben falsch liest.