Google ha compartido detalles de SynthID Text, una nueva herramienta diseñada para marcar con agua y detectar texto generado por IA, que se ha lanzado como código abierto.
Disponible a través de Hugging Face, los desarrolladores y las empresas pueden comenzar a usarlo Texto de SynthID incrustar marcas de agua en el texto generado por IA para facilitar la identificación del contenido creado por modelos genAI.
La compañía espera que su nueva herramienta ayude a prevenir la desinformación, así como a garantizar una atribución adecuada.
Google ahora puede marcar el texto con IA
SynthID Text funciona cambiando la distribución de tokens, los componentes básicos del texto generado por IA, que de otro modo se caracterizan como grupos de letras que forman palabras o partes de palabras. Existente AI Los modelos ya generan texto basándose en probabilidades o adivinando qué palabra viene a continuación. Todo lo que SynthID Text hace es cambiar la probabilidad de que se seleccionen ciertas palabras, creando un patrón de marca de agua específico que luego puede identificar.
Google considera que la herramienta aún puede funcionar después de que el texto haya sido parafraseado o modificado ligeramente, pero la compañía reconoció algunas limitaciones. Por ejemplo, los textos breves, las traducciones y las respuestas objetivas donde hay poco margen de variación pueden limitar la eficacia de SynthID Text. La compañía también señaló que reescribir minuciosamente una respuesta puede “reducir en gran medida” las puntuaciones de confianza del detector.
SynthID Text ya se ha integrado en Gemini desde principios de este año, sin embargo, Google no es el único jugador en el espacio de la IA. Abierto AIlo que hace que Géminis rivalice ChatGPTes poco probable que quiera utilizar la herramienta de su competidor. En cambio, ha estado explorando su propia tecnología de marcas de agua.
Además, no está claro cómo estos diferentes sistemas interoperarán en el futuro a medida que el contenido generado por IA se generalice en Internet, y si un sistema surgirá como un estándar de la industria o si los marcos legales impondrán su uso.