P: ¿Qué es OCR?
R: El Reconocimiento Óptico de Caracteres (OCR) es una forma de aprendizaje automático que convierte documentos escaneados físicamente en texto legible por máquina. Una vez que estos documentos escaneados o archivos de imagen se cargan en el VDR, se procesan mediante una conversión OCR que los hace legibles para búsquedas y análisis por parte del usuario.
P: ¿Está habilitado OCR en mi sitio de Firmex?
R: Si tu sitio de Firmex fue creado después del 11 de marzo de 2021, entonces OCR está habilitado. Si fue creado antes de esa fecha, OCR está deshabilitado. Puedes contactar al soporte de Firmex para habilitar OCR en proyectos futuros.
P: ¿Puedo reindexar mi proyecto existente usando OCR para que mis documentos escaneados sean buscables?
R: La funcionalidad OCR de Firmex se aplica solo a documentos recién cargados. Para usar OCR en proyectos existentes, deberás volver a cargar los documentos.
P: ¿Tiene un costo adicional OCR?
R: No. OCR está incluido en el precio de tu suscripción a Firmex.
P: ¿Qué tipos de documentos admite OCR?
R: Documentos PDF, documentos de MS Office (.docx, .xlsx, .pptx, .docm) y archivos de imagen (.jpeg, .png, .tiff)
P: Cuando descargo documentos que han sido procesados con OCR, ¿el texto sigue siendo seleccionable?
R: Actualmente no. Una vez descargados, los documentos procesados con OCR no contendrán texto seleccionable.
P: ¿Se puede habilitar OCR para un proyecto pero no para otro?
R: Actualmente no. OCR es una función a nivel de sitio. Solo puede habilitarse o deshabilitarse para todo el sitio de Firmex.
P: ¿Cómo se protege el texto OCR?
R: El texto OCR está protegido con los mismos altos estándares de seguridad y cumplimiento que los documentos actuales.
P: ¿Puedo buscar contenido OCR en el visor de Firmex y en la herramienta Firmex Redact?
R: Solo los documentos a los que se les haya aplicado OCR antes de ser cargados en Firmex serán buscables en el visor o en la herramienta Redact. Actualmente, estas herramientas no permiten buscar contenido procesado con OCR durante la carga.
P: ¿Cómo funciona OCR con idiomas distintos al inglés?
R:
- Idiomas con escritura latina (por ejemplo, alemán, francés, italiano): OCR funcionará si el término de búsqueda no contiene caracteres especiales como acentos (por ejemplo, ç, é, â, Ü).
- Idiomas con escritura no latina (por ejemplo, mandarín, ruso, japonés): actualmente no son compatibles con OCR.
P: ¿Qué tan precisa es la funcionalidad OCR de Firmex?
R: La precisión depende de varios factores, incluyendo:
- Calidad de la imagen
- Idioma
- Tamaño de fuente
- Legibilidad de la fuente
- Contraste/brillo de la imagen
OCR hará lo posible por extraer el texto correcto según estos parámetros.
P: ¿Cuál es el tamaño máximo de imagen para los documentos?
R: El tamaño máximo admitido es de 32.000 × 32.000 píxeles. Si alguna imagen del documento supera estas dimensiones, el texto no será buscable en ninguna de las imágenes. Se recomienda reducir el tamaño de las imágenes antes de cargarlas.
P: ¿Cuánto tiempo tarda un documento OCR en ser buscable después de cargarse?
R: Dependiendo del número de imágenes y archivos, puede tardar entre 2 y 10 minutos en aparecer en los resultados de búsqueda.