(Actualización) Apple y Salesforce rompen el silencio sobre las acusaciones de que usaron “videos robados de YouTube” para entrenar a la IA

ACTUALIZACIÓN: 18 de julio de 2024, 16:44 EDT Salesforce se puso en contacto con Mashable con un comentario en respuesta al informe de Wired.

A nuevo reporte afirmó que gigantes tecnológicos como Apple, Nvidia, Anthropic y Salesforce utilizaron datos de “miles de videos de YouTube” para entrenar a la IA. La investigación, realizada por Proof News y publicada en Cableadoalegó que los subtítulos de 173.000 vídeos de YouTube fueron robados para los modelos de inteligencia artificial de las empresas.

El conjunto de datos, denominado “Subtítulos de YouTube”, contiene transcripciones de videos de canales educativos como Khan Academy, MIT y Harvard, así como Wall Street JournalNPR y la BBC. También se descubrió material de estrellas de YouTube como PewDiePie, Marques Brownlee y MrBeast.

Aún no hemos tenido noticias de Anthropic después de contactarnos para hacer comentarios, pero Apple y Salesforce han emitido una respuesta a De Wired informe.

¿Apple utilizará estos datos para Apple Intelligence y otros servicios de inteligencia artificial?

La respuesta corta es no, pero aquí está la respuesta más larga para aquellos que no se identifican con el grupo “TLDR”:

En un correo electrónico a Mashable, Apple dijo que su modelo de lenguaje de código abierto, OpenELM, en efecto usó el conjunto de datos, pero no de la forma en que algunos podrían estar pensando.

El proyecto OpenELM es parte de los esfuerzos continuos de Apple por beneficiar a la comunidad de investigación en general. En otras palabras, según Apple, el modelo OpenELM fue creado con fines de investigación. solo y la voluntad no respaldar cualquier hardware o servicio de inteligencia artificial impulsado por aprendizaje automático de Apple, incluido Inteligencia de Apple.

Velocidad de la luz que se puede mezclar

Para los no iniciados, Inteligencia de Apple es el nuevo conjunto de funciones de inteligencia artificial de la empresa, que se revelaron en WWDC 2024 (Evento anual de Apple en el que la compañía revela detalles de lo que vendrá con sus ofertas de software, incluidos iOS y iPadOS).

Inteligencia de Applepor ejemplo, puede ayudar a resumir texto, ya sea un correo electrónico o un mensaje de texto, para interacciones más rápidas con amigos, seres queridos, compañeros de trabajo y más. También respaldará funciones más centradas en el entretenimiento como Genmojique genera nuevos emojis de iOS con una solicitud. También está Image Playground, que permite a los usuarios crear imágenes generadas por IA sobre la marcha.

Nueva función Genmoji llega a iOS 18.
Crédito: Apple

Cuando se trata de utilidades de IA para sus consumidores, Apple destacó que ofrece a los sitios web la opción de optar por no permitir que su contenido se utilice para el entrenamiento de IA. Apple aseguró que sus modelos generativos se construyen y ajustan utilizando datos de alta calidad, incluido contenido con licencia de editoriales y empresas de imágenes de archivo, junto con datos disponibles públicamente en la web.

Para decirlo sucintamente, Apple no niega que su modelo de lenguaje de código abierto, OpenELM, utilizó el conjunto de datos, pero quiere dejar en claro que no respaldará ninguno de sus servicios de inteligencia artificial, incluido Apple Intelligence.

Salesforce afirma que su uso se basa en el ámbito académico

En un correo electrónico a Mashable, Salesforce también ofreció su versión de la historia:

“El conjunto de datos de Pile al que se hace referencia en el artículo de investigación se utilizó para entrenar un modelo de IA en 2021 con fines académicos y de investigación”, dijo un representante de Salesforce. “El conjunto de datos estaba disponible públicamente y se publicó bajo una licencia permisiva”.

¿Qué tiene que decir Nvidia?

También nos comunicamos con Nvidia para solicitar comentarios, pero la compañía, conocida por incorporar IA a muchos de sus servicios y hardware de juegos, se negó a emitir una declaración.

Actualizaremos este artículo si recibimos alguna información de Anthropic.



Fuente