¿Tiene un documento impreso y necesita hacer una copia digital? Escanear es una opción rápida. Más rápido aun sería fotografiarlo con su smartphone. En ambos casos, lo que obtiene es una imagen del texto, y lo más probablemente es que se haya guardado en un formato de imagen ráster, como PNG, JPEG o TIFF. De hecho, este último a menudo es preferido por dispositivos de escaneo y envío de faxes debido a la representación de texto de buena calidad.
Pero siendo un formato accesible y flexible que admite tanto compresión con pérdida como sin pérdida de calidad, TIFF tiene una desventaja importante. Los textos escaneados en este formato no pueden ser editados ni permiten búsquedas. Esto podría ser un problema si, por ejemplo, tiene un libro escaneado y necesita buscar una determinada palabra clave. O si quiere traducir un documento escaneado a través de la traducción automática. La mejor solución en estos casos sería convertirlo a un formato que puede ser editado y permite búsquedas, es decir, PDF.
La última versión de reaConverter viene con reconocimiento óptico de caracteres (OCR) como parte del proceso de conversión, lo que permite convertir imágenes TIFF con texto escaneado en PDF que se pueden editar y permiten búsquedas. OCR es una tecnología avanzada con la cual el software imite el funcionamiento del ojo humano y el cerebro, reconociendo ciertos patrones y características en el texto de entrada y convirtiéndolo en una copia digital que permite búsquedas y edición. La función no se limita al texto, pero también se extiende al reconocimiento del formato (columnas, números, párrafos, etc) y datos no textuales, ofreciendo una copia exacta de archivo TIFF de origen en el PDF de destino.
cons_rcp.exe -s source.tiff -o output.pdf -create_searchable_pdf 1 -searchable_pdf_lang eng