Google La investigación muestra una nueva forma de utilizar la IA para leer la escritura a mano que podría cambiar radicalmente la forma en que las máquinas convierten lo que se escribe en papel en letras digitales. El sistema InkSight transforma fotografías de palabras escritas a mano en texto digital aprovechando la inteligencia artificial sin la necesidad de ningún dispositivo como intermediario.
La idea es reemplazar el reconocimiento óptico de caracteres (OCR), a veces falible, con IA que pueda emular cómo los humanos realmente aprenden a leer, específicamente reescribiendo texto existente para aprender cómo se ven y significan las palabras completas. Para ello, los investigadores tuvieron que enseñar a la IA a reconocer e imitar la escritura a mano de los humanos.
“La toma de notas digitales está ganando popularidad y ofrece una forma duradera, editable y fácilmente indexable de almacenar notas en forma vectorizada, conocida como tinta digital. Sin embargo, sigue existiendo una brecha sustancial entre esta forma de tomar notas y la tradicional con lápiz y lápiz. -Tomar notas en papel, una práctica que todavía favorece la gran mayoría”, explican los investigadores en su estudio. papel. “Nuestro enfoque combina conocimientos previos de lectura y escritura, lo que permite entrenar un modelo en ausencia de grandes cantidades de muestras pareadas, que son difíciles de obtener. Hasta donde sabemos, este es el primer trabajo que representa de manera efectiva texto escrito a mano en fotografías arbitrarias con diversas características visuales. y antecedentes.”
InkSight es más que una simple técnica alternativa. Proporciona resultados más precisos en circunstancias que no son ideales. Por ejemplo, si la foto se tomó con poca luz, tiene texto parcialmente oscurecido o tiene un fondo confuso cuando se examina con OCR. Los investigadores descubrieron que los humanos podían leer el 87% de los trazos de texto realizados con InkSight. Dos tercios eran lo suficientemente buenos como para que la gente no pudiera distinguirlos de la escritura real; Puede ver a continuación cómo se ve cuando funciona InkSight.
Escrito por IA
Si le gusta escribir cosas a mano, InkSight tiene algunos beneficios potenciales. Imagínese escribir a mano en un cuaderno de papel y luego mostrar las notas a su cámara para que se puedan buscar instantáneamente y organizarlas en contexto con notas anteriores en páginas físicas. Si eres como yo y tienes una letra particularmente desordenada, InkSight podría ayudarte a convertir tus garabatos en texto mecanografiado que sigue siendo exacto a lo que garabateas.
A mayor escala, esto podría ser una herramienta crucial para descifrar y convertir textos escritos a mano a lo largo de los siglos en formato digital. Incluso cuando el texto está en un idioma sin mucha presencia digital, InkSight podría ayudar a preservar la escritura a mano para ayudar a crear fuentes de capacitación para esos idiomas.
Google no es el único lugar donde se están desarrollando herramientas de inteligencia artificial para descifrar la escritura a mano. Por ejemplo, Amazonas's nuevo Kindle Escriba mejora la capacidad del lector electrónico para transformar notas escritas a mano en texto legible. También hay buenas notasuna aplicación para tomar notas digitales que puede leer escritura a mano y que debutó recientemente edición de escritura a mano herramientas que utilizan su tecnología Goodnotes Smart Ink para convertir la escritura a mano en texto mecanografiado. Las herramientas agregadas le permiten editar notas escritas a mano como si estuvieran escritas a máquina, incluida la alineación de notas, copiar y pegar y redistribuir el texto para hacerlo más lógico.