Para funcionar correctamente, la IA generativa (como Apple Intelligence) necesita extraer “información de entrenamiento”. Esta se puede obtener de diversas fuentes, aunque si desea asegurarse de que la menor cantidad posible de personas se enojen con su modelo de inteligencia artificial, deberá asegurarse de que la fecha utilizada sea “ética”.
Eso significa que necesitas el permiso de esas fuentes para poder usar los datos sin preocupaciones. De lo contrario, terminarás en un atolladero de problemas de violación de derechos de autor y problemas legales, como les sucede a muchos. O, si eres Google, entonces puedes pedirle a los gobiernos que la ley de derechos de autor no se aplique a ti y puedas usar los datos que quieras para entrenar a tu IA sin necesidad de permiso ni de pagar.
Porque eres especial.
Apple considera, sin embargo, que necesita pagar por los datos que utiliza para entrenar. Inteligencia de Appleaunque está encontrando sus propios problemas, a saber, que un montón de algunos de los editores más importantes de Internet no quieren tener nada que ver con la IA que ha creado.
Los editores dan un rotundo 'no'
Según WiredMuchos editores, como el New York Times e incluso Facebook, han utilizado una función que impide que Apple rastree su contenido cuando entrena a Apple Intelligence. Se llama, imaginativamente, “Robot.txt', un archivo de texto que le indica al robot de extracción de datos de Apple que evite el contenido en cuestión.
La oferta de Apple de pagar por los datos no ha impedido que el 25% de los sitios web bloqueen el raspador, una cifra que podría aumentar a medida que se acerca el lanzamiento oficial de Inteligencia de Apple La IA se acerca cada vez más. El mundo editorial es cada vez más consciente de la IA y se muestra cada vez más receloso de ella, sobre todo si tenemos en cuenta que el New York Times está demandando actualmente al mayor modelo de IA generativa, ChatGPT, por su uso del contenido del NYT para entrenarse.