La guerra de búsqueda de IA ha comenzado

Cada segundo de cada día, personas de todo el mundo escriben decenas de miles de consultas en Google, lo que suma un total de billones de búsquedas al año. Google y algunos otros motores de búsqueda son el portal a través del cual miles de millones de personas navegan por Internet. Muchas de las empresas tecnológicas más poderosas del mundo, incluidas Google, Microsoft y OpenAI, han detectado recientemente una oportunidad de rehacer esa puerta de acceso con IA generativa y están compitiendo para aprovecharla. Y a partir de esta semana, las guerras de búsquedas con IA generativa están en pleno apogeo.

El valor de una barra de búsqueda impulsada por IA es claro: en lugar de tener que abrir y leer varios enlaces, ¿no sería mejor escribir la consulta en un chatbot y recibir una respuesta inmediata y completa? Sin embargo, para que este enfoque funcione, los modelos de IA deben poder rastrear la web en busca de información relevante. Casi dos años después de la llegada de ChatGPT, y con los usuarios cada vez más conscientes de que muchos productos de IA generativa tienen Se ha construido efectivamente sobre información robadaLas empresas tecnológicas están intentando llevarse bien con los medios de comunicación que suministran el contenido que estas máquinas necesitan.

Esta mañana, la start-up Perplexity, que ofrece un “motor de respuestas” impulsado por IA, anunció acuerdos de reparto de ingresos con Tiempo, Fortunay varios otros editores. En el futuro, estos editores recibirán una compensación cuando Perplexity obtenga ingresos por publicidad de las respuestas generadas por IA que citen contenido de socios. El sitio actualmente no publica anuncios, pero comenzará a hacerlo en forma de “preguntas de seguimiento relacionadas” patrocinadas este otoño: una marca de ropa deportiva podría pagar para que aparezca una pregunta de seguimiento en respuesta a una consulta sobre Babe Ruth, y si la IA utilizada Tiempo En su respuesta, entonces Tiempo obtendría una parte de los ingresos por publicidad por cada cita. OpenAI ha estado creando su propia lista de medios fogonaduraincluidos News Corp, Vox Media y El Atlánticoy la semana pasada anunció su propio prototipo de búsqueda de inteligencia artificial, Búsqueda en GPT. (La división editorial de El Atlántico (Google opera de forma independiente de la división de negocios, que anunció su asociación corporativa con OpenAI en mayo). Google ha comprado los derechos para usar el contenido de Reddit para entrenar futuros modelos de IA, y actualmente parece ser el único motor de búsqueda importante al que Reddit le permite mostrar su contenido. Antes, lo predeterminado era que consumieras directamente el trabajo de otra persona; ahora una IA puede masticarlo y regurgitarlo primero, y luego determinar lo que ves en función de su opaco algoritmo subyacente. Esto también significa que muchos de los lectores humanos a los que los medios de comunicación actualmente muestran anuncios y venden suscripciones tendrán menos razones para visitar los sitios web de los editores.

En el pasado, las empresas tecnológicas han cerrado acuerdos con medios periodísticos, pagándoles a los editores para que utilicen productos como Facebook Live y Snapchat Discover, pero estos robots de búsqueda con inteligencia artificial son diferentes. Facebook y Snapchat son productos sociales en esencia; uno se conecta a ellos para ver lo que publican otras personas y, para muchos usuarios, el contenido de noticias puede ser incidental. Perplexity y SearchGPT, en cambio, necesitan contenido oportuno y de alta calidad para responder a las preguntas con precisión.

Los modelos de IA generativa no tienen información interna más allá de sus datos de entrenamiento, que suelen tener meses o años de antigüedad. Sin historias más recientes, estos productos serían limitados y no podrían brindar información relevante sobre H5N1el intento de asesinato de Donald Trump, los Juegos Olímpicos, etc. El modelo más avanzado de OpenAI, por ejemplo, fue lanzado En Mayo pero tiene Sin conocimiento de eventos después de octubre de 2023. Cuando hablé por primera vez con Dmitry Shevelenko, director comercial de Perplexity, en junio, me dijo: “Uno de los ingredientes clave para nuestro éxito a largo plazo es que necesitamos que los editores web sigan creando un gran periodismo cargado de hechos, porque no se pueden responder bien las preguntas si no se cuenta con material fuente preciso”.

Por supuesto, los productos de IA existentes están absolutamente llenos de medios por los que los editores no han recibido compensación alguna. (Shevelenko me dijo que Perplexity no dejará de citar a los editores fuera de su acuerdo de reparto de ingresos, ni mostrará preferencia alguna por sus socios pagos en el futuro). Las empresas de IA no parecen valorar las palabras humanas, las fotos humanas y los videos humanos como obras de artesanía o productos del trabajo; en cambio, tratan el contenido como minas de información. “La gente no viene a Perplexity para consumir periodismo; viene a Perplexity para consumir hechos”, me dijo Shevelenko en una entrevista antes del anuncio de hoy. “El contenido de los periodistas es rico en hechos, conocimiento verificado, y esa es la función de utilidad que desempeña para un motor de respuestas de IA”. Para Shevelenko, eso significa que Perplexity y los periodistas no están en competencia directa: el primero responde preguntas; el segundo da noticias o proporciona prosa e ideas convincentes. Pero incluso él admitió que la búsqueda con inteligencia artificial enviará menos tráfico a los sitios web de medios que los motores de búsqueda tradicionales, porque los usuarios tienen menos motivos para hacer clic en cualquier enlace: el bot es quien proporciona la respuesta.

El creciente número de acuerdos entre IA y medios es, entonces, una extorsión. Claro, Shevelenko me dijo que Perplexity cree que compartir los ingresos es lo correcto, pero la IA está recopilando contenido de los editores, lo quieran o no: las empresas de medios pueden ser tontas o cobrar. Aun así, la naturaleza de estos acuerdos también sugiere que los editores pueden tener más poder del que parece. Perplexity y OpenAI, por ejemplo, están ofreciendo incentivos bastante diferentes a los socios de medios, lo que significa que las empresas emergentes de tecnología están compitiendo para ganarse a los editores. Todos estos productos han cometido errores básicos, como citar fuentes incorrectamente y fabricar información. Tener un robot de búsqueda basado en “conocimiento verificado” creado por humanos podría ayudar a aliviar estos problemas, especialmente para eventos recientes para los que el modelo de IA no fue entrenado. Los editores también tienen al menos cierta capacidad para Limitar la capacidad de los motores de búsqueda de IA para leer sus sitios web.También pueden negarse a firmar o renegociar acuerdos, o incluso demandar a las empresas de IA por violación de derechos de autor, como El New York Times Las empresas de IA parecen tener sus propios métodos. alrededor de las barricadas de las empresas de mediospero se trata de una carrera armamentista en curso sin un ganador claro.

Los editores ahora pueden tener influencia sobre las empresas de IA que necesitan contenido de alta calidad creado por humanos para responder consultas de los usuarios o entrenar futuros modelos de IA, como GPT-5 o GPT-6. Nicholas Thompson, director ejecutivo de El Atlánticodijo en un entrevista con el periodista tecnológico Nilay Patel que El AtlánticoEl contrato de con OpenAI expirará después de dos años y está diseñado para crear “más influencia cuando haya otro momento de negociación”. Reddit ha cortado recientemente los motores de búsqueda Además de Google, si DuckDuckGo, Perplexity o Bing quieren mostrar a los usuarios nuevas publicaciones de Reddit, tendrán que “hacer promesas exigibles con respecto a su uso del contenido de Reddit, incluido su uso para IA”, dijo un portavoz de Reddit. dijo El borde(Por supuesto, Reddit tiene una base de usuarios incondicionales y no es una organización de noticias tradicional: las empresas de medios compiten constantemente por llamar la atención y pueden sentirse menos cómodas al cerrarle el acceso a audiencias potenciales).

En otras palabras, el que OpenAI, Perplexity, Google u otro gane la guerra de búsquedas de IA podría no depender enteramente de su software: los socios de medios también son una parte importante de la ecuación. Esto podría cambiar. Shevelenko me dijo que cree que el uso que hace Perplexity del contenido de los editores es legal según Ley de derechos de autory si un juez demuestra que tiene razón, las empresas de inteligencia artificial podrían perder el incentivo de pagar a los editores. Por ahora, esa decisión está en el aire y los editores están aprovechando una pequeña ventana de oportunidad. Perplexity, por su parte, ha sido acusada de plagiar contenido de editores como Forbes y Conde Nastlo que podría disuadir a otros editores de asociarse con la start-up; Shevelenko ha dijo Semáforo Perplexity tuvo que convencer a su lista inicial de socios para que pasaran por alto estas acusaciones. Se suponía que la empresa anunciaría su programa de reparto de ingresos aproximadamente cuando Shevelenko habló conmigo en junio, pero retrasó el lanzamiento formal en medio de una ola de críticas. Ahora, dijo, “la pelota está en nuestra cancha para mostrarles a los editores que somos un actor de buena fe que toma las decisiones correctas a largo plazo”.

La guerra de búsquedas es un intento de cambiar la forma en que la gente navega por Internet, el sistema a través del cual el mundo contemporáneo organiza y difunde el conocimiento. Pero el terreno subyacente no ha cambiado: el conocimiento, sin importar su organización, sigue siendo la suma de la escritura, el arte y el pensamiento de la humanidad, no de un robot.

Fuente