Live Text en macOS Monterey destruye estas aplicaciones de extracción de texto pagas

El texto y las imágenes de mapa de bits son dos tipos diferentes de animales. El texto se puede escribir, editar, copiar, pegar, eliminar y procesar. Las imágenes, sin embargo, son un montón de píxeles en una cuadrícula que se combinan de la manera correcta para transmitir algún tipo de información: se asemejan a una foto, una ilustración o un texto renderizado. Entonces, ¿dónde pueden encontrarse los dos?
El reconocimiento óptico de caracteres (OCR) fue el nombre que le dimos a la extracción de texto de las imágenes. Pero el término ha perdido popularidad a medida que el software intenta cada vez más y automáticamente identificar el texto en una imagen y hacer que se pueda buscar y, a menudo, esté disponible para copiar.
Si está tratando de acceder al texto de las imágenes que tiene, ya sean documentos, fotos o formularios, tiene muchas opciones disponibles. Estos tipos también incluyen archivos PDF con imágenes escaneadas que no tienen una capa de texto ya insertada o extraída. Es posible que ya tenga una cuenta gratuita o una suscripción paga a uno de los servicios a continuación o que sea propietario del software.
Al investigar este artículo, probé una variedad de imágenes y documentos que demostraron ser bastante consistentes en cada servicio o aplicación. Para una comparación lado a lado que demostró claramente mis resultados, copié los resultados del reconocimiento contra la misma copia legiblemente compuesta de una revista de un artículo de Popular Mechanics de la década de 1920 (sobre la producción de tiras cómicas). Puede ver las cifras a continuación con cada aplicación o servicio anotado. Probablemente no realice la extracción de texto en artículos de revistas de la década de 1920, ¡quizás sí, si es como yo! tipografía renderizada prístina.
Mis pruebas incluyeron el uso de la versión beta pública de macOS Monterey. También, Apple señala como una nota al pie en el sitio web de vista previa de macOS Monterey que se requiere un M1. Con macOS Monterey beta cuatro, Apple Habilitó la funcionalidad de texto en vivo en Intel Macs.
PDFpen y Live Text de macOS Monterey se desempeñaron con extrema precisión. OneNote, una vez que Microsoft realizó su reconocimiento diferido, también estuvo bastante cerca de esos dos. Evernote muestra coincidencias dentro del texto a medida que escribe y parece rivalizar con Monterey y PDFpen. Los cuatro fueron abrumadoramente mejores que Acrobat y Google Docs, que tuvieron resultados vergonzosamente malos.

macOS Monterey Live Text en Safari y Fotos
En la próxima versión de macOS 12 Monterey (así como en iOS 15 y iPadOS 15), Safari reconoce automáticamente el texto de las imágenes en una página web y en la aplicación Fotos cuando estás viendo una imagen. Puede seleccionar y copiar ese texto. La característica requiere AppleEl motor neuronal de , disponible en M1 Apple Macs de silicona y móviles con chip A12 Bionic o posterior, que aparecieron a partir de algunos iPhones en 2018 y algunos iPads en 2019. Puedes probar esto usando la versión beta pública. Hace un excelente trabajo.

Adobe Acrobat Pro DC
Al abrir un PDF en Acrobat Pro DC, normalmente se inicia automáticamente el reconocimiento de texto. Cuando termine, puede seleccionar cualquier rango de texto para copiar. OCR dentro de Acrobat es parte de una suscripción completa de Creative Cloud ($ 52.59 a $ 79.49 por mes), y Adobe también ofrece planes específicos de Acrobat (desde $14.99 a $24.99 por mes). Los resultados, sin embargo, no son buenos.

Evernote
Evernote realiza OCR en cualquier imagen o PDF con imágenes incrustadas importadas en el servicio o capturadas a través de la cámara de un dispositivo móvil. Esto hace que el texto se pueda buscar por completo, pero desconcertantemente no te permite copiar el texto reconocido. (Sin embargo, un PDF exportado requerirá que se agregue la capa de texto). El nivel gratuito permite buscar texto en imágenes; el nivel pagado ($7.99 por mes) para realizar búsquedas en archivos PDF, ya sea que incluyan texto o que el texto se extraiga mediante OCR.

Google Drive y Documentos de Google
Disponible en niveles gratuitos y pagos, carga el PDF o la imagen en Google Drive, ya sea a través de Google Drive en su escritorio o en un navegador web. Luego abra el archivo en Google Docs. Esta acción importa la imagen o el PDF y pega el texto extraído con algún formato a continuación. Como puede ver, el servicio no funcionó del todo bien.

microsoft una nota
OneNote comprueba automáticamente cualquier imagen pegada en una página de OneNote en busca de texto. Control-clic en la imagen y seleccione Copiar texto de la imagen. Sin embargo, Microsoft señala: “El proceso de reconocimiento de texto OCR es muy complejo y utiliza los servicios en línea de Microsoft y, por lo tanto, puede llevar unos minutos para imágenes simples y hasta horas para imágenes complejas antes de que el comando Copiar texto de imagen esté disponible cuando Controle. -haz clic en la imagen.” Dado que Apple, Google y las aplicaciones de terceros pueden realizar OCR al instante, quizás OneNote se esté quedando atrás, aunque los resultados son muy buenos. OneNote es parte de las suscripciones de Microsoft 365.

PDFbolígrafo
PDFpen es una excelente aplicación para trabajar con archivos PDF. Para ocultar texto en PDFpen, elija Editar > Página OCR o mantenga presionada la tecla Opción y elija Editar > Documento OCR. Si hay capas de texto OCR existentes, primero debe borrarlas a través de Editar > Borrar capa OCR en página/documento. PDFpen viene en versiones regular ($79.95) y Pro ($129.95). El trabajo que hizo en mi prueba fue impresionante.

Hemos compilado una lista de las preguntas que nos hacen con más frecuencia, junto con respuestas y enlaces a columnas: lea nuestras súper preguntas frecuentes para ver si su pregunta está cubierta. Si no, ¡siempre estamos buscando nuevos problemas para resolver! Envíe el suyo por correo electrónico a [email protected], incluyendo capturas de pantalla según corresponda y si desea que se use su nombre completo. No se responderán todas las preguntas, no respondemos a los correos electrónicos y no podemos proporcionar consejos directos para la resolución de problemas.