Optische Zeichenerkennung (OCR) – FAQ

Haben Sie Fragen? Anfrage einreichen

F: Was ist OCR?
A: Optische Zeichenerkennung (OCR) ist eine Form des maschinellen Lernens, die physisch gescannte Dokumente in maschinenlesbaren Text umwandelt. Sobald diese gescannten Dokumente oder Bilddateien in den VDR hochgeladen werden, durchlaufen sie eine OCR-Konvertierung, die sie für die Benutzersuche und -analyse lesbar macht.

F: Ist OCR für meine Firmex Seite aktiviert?
A: Wenn Ihre Firmex Seite nach dem 11. März 2021 erstellt wurde, ist OCR für Ihre Seite aktiviert. Wurde Ihre Seite vor diesem Datum erstellt, ist OCR deaktiviert. Sie können den Firmex Support kontaktieren, um OCR für zukünftige Projekte zu aktivieren.

F: Kann ich mein bestehendes Projekt mit OCR neu indizieren, damit meine gescannten Dokumente durchsuchbar sind?
A: Die OCR-Funktionalität von Firmex gilt nur für neu hochgeladene Dokumente. Um OCR in bestehenden Projekten zu nutzen, müssen Sie die Dokumente erneut hochladen.

F: Gibt es zusätzliche Kosten für OCR?
A: OCR ist im Preis Ihres Firmex Abonnements enthalten.

F: Welche Dokumenttypen unterstützt OCR?
A: PDF-Dokumente, MS Office-Dokumente (.docx, .xlsx, .pptx, .docm) und Bilddateien (.jpeg, .png, .tiff)

F: Bleibt der OCR-Text auswählbar, wenn ich Dokumente herunterlade?
A: Derzeit nicht. Nach dem Herunterladen enthalten OCR-verarbeitete Dokumente keinen auswählbaren Text.

F: Kann OCR für ein Projekt aktiviert werden, aber nicht für ein anderes?
A: Derzeit nicht. OCR ist eine Funktion auf Seitenebene und kann nur für die gesamte Firmex-Seite aktiviert oder deaktiviert werden.

F: Wie wird der OCR-Text gesichert?
A: Der OCR-Text wird mit denselben hohen Sicherheits- und Compliance-Standards geschützt wie alle anderen Dokumente.

F: Kann ich OCR-Inhalte im Firmex Viewer und im Firmex Schwärzungstool durchsuchen?
A: Nur Dokumente, bei denen OCR vor dem Hochladen auf Firmex angewendet wurde, sind im Firmex Viewer oder Schwärzungstool durchsuchbar. Derzeit unterstützen diese Tools keine Suche in Inhalten, die während des Uploads von Firmex-OCR verarbeitet wurden.

F: Wie funktioniert OCR derzeit mit anderen Sprachen als Englisch?
A:

  • Lateinische Schriftsysteme (z. B. Deutsch, Französisch, Italienisch): OCR funktioniert, solange der Suchbegriff keine Sonderzeichen wie Akzente enthält (z. B. ç, é, â, Ü).
  • Nicht-lateinische Schriftsysteme (z. B. Mandarin, Russisch, Japanisch) werden derzeit nicht unterstützt.

F: Wie genau ist die OCR-Funktion von Firmex?
A: Die Genauigkeit hängt von mehreren Faktoren ab, darunter:

  • Bildqualität
  • Sprache
  • Schriftgröße
  • Lesbarkeit der Schrift
  • Kontrast/Helligkeit des Bildes

OCR bemüht sich, den korrekten Text basierend auf diesen Parametern zu extrahieren.

F: Gibt es eine maximale Bildgröße für Dokumente?
A: Die maximale unterstützte Bildgröße beträgt 32.000 × 32.000 Pixel. Wenn ein Bild im Dokument größer ist, wird der Text in keinem der Bilder durchsuchbar sein. Wir empfehlen, die Bildgröße vor dem Hochladen zu reduzieren.

F: Wie lange dauert es, bis ein OCR-Dokument nach dem Hochladen durchsuchbar ist?
A: Abhängig von der Anzahl der Bilder und Dateien kann es 2 bis 10 Minuten dauern, bis ein Dokument in den Suchergebnissen erscheint.

Beiträge in diesem Abschnitt

War dieser Beitrag hilfreich?
0 von 0 fanden dies hilfreich