OpenAI no marcará con agua el texto de ChatGPT porque sus usuarios podrían ser descubiertos

OpenAI tiene un sistema para marcar con marca de agua el texto creado en ChatGPT y una herramienta para detectar la marca de agua lista desde hace aproximadamente un año. informes El periodico de Wall StreetPero la empresa está dividida internamente sobre si publicarlo o no. Por un lado, parece que es lo más responsable, pero por otro, podría perjudicar sus resultados.

La marca de agua de OpenAI se describe como un ajuste de la forma en que el modelo predice las palabras y frases más probables que seguirán a las anteriores, creando un patrón detectable. (Es una simplificación, pero puedes consultar la de Google explicación más detallada para Marca de agua del texto de Géminis para más).

Al parecer, la empresa descubrió que esto tiene una “efectividad del 99,9 %” para hacer que el texto de la IA sea detectable cuando hay suficiente cantidad (una posible ventaja para los profesores que intentan disuadir a los estudiantes de que le dejen tareas escritas a la IA), sin afectar la calidad del texto que produce su chatbot. En una encuesta que encargó la empresa, “la gente de todo el mundo apoyó la idea de una herramienta de detección de IA por un margen de cuatro a uno”, dijo. Diario escribe.

Pero parece que a OpenAI le preocupa que el uso de marcas de agua pueda desanimar a los usuarios encuestados de ChatGPT, casi el 30 por ciento de los cuales evidentemente le dijeron a la empresa que usarían menos el software si se implementara la marca de agua.

Algunos miembros del personal tenían otras preocupaciones, como que la marca de agua podría ser fácilmente frustrada usando trucos como rebotar el texto de un idioma a otro con el traductor de Google o hacer que ChatGPT agregue emojis y luego los elimine después, según el Diario.

A pesar de ello, los empleados siguen pensando que el enfoque es eficaz. Sin embargo, a la luz de los molestos sentimientos de los usuarios, el artículo Dice que algunos sugieren probar métodos que son “potencialmente menos controvertidos entre los usuarios, pero no están probados”. Supongo que algo es mejor que nada.

Fuente