Por qué el debut de la IA de Apple está condenado a decepcionar
— Ariela Basson/Inversa; imágenes falsas

Después de algunas burlas y años de implementaciones reservadas de aprendizaje automático, se espera que Apple realice la WWDC 2024. todo sobre la IA. Pero según los informes publicados antes del evento, lo que la compañía tiene reservado no será un enfoque tan revolucionario como muchos esperan.

Cuando Siri se lanzó en el iPhone 4S en 2011, Apple estaba por delante del juego. Se habían hecho demostraciones de asistentes de inteligencia artificial controlados por voz (Siri era técnicamente una adquisición), pero Apple fue la primera empresa de tecnología en enviar uno en un producto de consumo masivo. En el Asistente de Google y los años siguientes llenos de Amazon Alexa, las actualizaciones de Apple han sido más modestas. El aprendizaje automático y el procesamiento del lenguaje natural están en todo iOS, y Siri se ejecuta en el dispositivo, pero no se han materializado pantallas llamativas de IA. Con chatbots que suenan naturales y parecen cada vez más capaces como ChatGPT Ahora es una opción que todos conocen y pueden acceder, Apple se ha quedado atrás.

Existe la expectativa de que, al llegar tarde (después de varios lanzamientos de GPT), El copiloto de Microsofty Gemini de Google: Apple aportará el enfoque más pulido y coherente a la IA generativa que cualquiera de sus competidores. De manera realista, lo que la compañía ha planeado parece que será más de lo mismo, en gran parte porque Apple tiene que ser cautelosa y no está claro que la IA sea tan útil como se anuncia.

Una gran cantidad de resúmenes de texto

La mayoría de las funciones de software creadas en torno a la IA generativa se definen por la capacidad de un modelo de lenguaje grande para digerir, procesar y generar texto. No parece que eso vaya a cambiar con la opinión de Apple. Residencia en un informe de Bloomberg, Apple planea introducir resúmenes generados por IA en todos sus sistemas operativos, condensando mensajes de texto, correos electrónicos, notificaciones, notas de voz y tal vez incluso archivos compartidos, para, en teoría, ahorrarle tiempo. También se espera que la generación de texto llegue a las aplicaciones de productividad de Apple, permitiéndole crear texto nuevo basándose en un simple mensaje.

Muy parecido a Google Editor mágico, se espera que la aplicación Fotos obtenga nuevas capacidades de edición, como eliminar fondos y generar contenido nuevo cuando se cambia el tamaño de una foto. Según se informa, Apple también espera permitir a los usuarios generar sus propios emojis.

En términos de la oferta original de IA de Apple, Siri se volverá más inteligente, aunque no está claro exactamente cómo lo hará la compañía. De acuerdo a Bloomberg, Apple ha llegado a algún tipo de acuerdo con OpenAI para incorporar los modelos de la compañía a sus plataformas. Ya sea que sea tan simple como insertar GPT-4o para Siri y dar por terminado el día, o un sistema más elaborado que maneje algunas respuestas en el dispositivo y otras en una nube de privacidad que opera Apple, iría más allá de lo que Siri ofrece actualmente. .

El concepto más interesante que la compañía está explorando es también el que, según se informa, no lanzará hasta el próximo año. Planes de Apple para permitir que Siri interactúe y opere lo que parecen ser todas las aplicaciones que se ejecutan en su dispositivo. Podrías pedirle a Siri que envíe una nota de voz por correo electrónico o que mueva una nota entre carpetas, y podría hacerlo sin hacer preguntas. Apple tiene investigación publicada sobre enseñar a la IA a comprender las pantallas de las aplicaciones, lo que en última instancia podría respaldar esta expansión de Siri.

Hemos visto estas características antes

Si ha estado prestando atención a los anuncios de IA del último año o dos, todos los planes de Apple le resultarán familiares. En mayo, Google I/O se llenó con una pizca similar de generación y resumen de texto en Google Workspace y Android. Aparte de la interacción directa con Gemini y algunas habilidades únicas basadas en imágenes, todo lo que la empresa está impulsando se puede dividir en resumir correos electrónicos, mensajes o archivos largos y generar texto e imágenes mediocres en todos los campos donde está permitido.

Lo único que realmente se destaca son las formas en que Google está explorando las capacidades multimodales de Gemini, combinando una comprensión de las imágenes con respuestas en lenguaje natural, o incluso algo parecido a la empresa famosas gafas de google excepto que esta vez con una IA que puede identificar mejor el entorno que lo rodea. Hasta donde sabemos, Apple no tiene planes para nada que se acerque a eso, ni necesariamente tiene sentido para las plataformas que opera actualmente.

Trabajar con OpenAI podría tener sus ventajas, por supuesto. Las respuestas y el reconocimiento en tiempo real. Se demostró que GPT-4o tenía podría permitir interacciones más personales con Siri, o al menos una comprensión más contextual de las cosas que estás haciendo en tu computadora portátil o teléfono. Pero al igual que las demostraciones multimodales de Google, no está claro si Apple usará algún GPT de esa manera en las versiones de iOS, iPadOS y macOS de este año.

Muy grande para fallar

Apple se encuentra en una posición complicada. A diferencia del Visión Proque pasó casi una década en desarrollo de una forma u otra antes de ser lanzado en 2024, se informa que el impulso interno para ofrecer funciones de inteligencia artificial es reciente. El periodico de Wall Street escribe que el enfoque se aceleró cuando el vicepresidente senior de ingeniería de software, Craig Federighi, probó GitHub Copilot de Microsoft por primera vez en 2022 y quedó impresionado. Dos años no dejan mucho tiempo para el pulido que Apple normalmente exige y esperan los clientes.

La empresa también se ve afectada en muchos sentidos por su propio éxito. Existen más de 2 mil millones de dispositivos Apple y Apple todavía admite la mayoría de ellos. Implementar una función de inteligencia artificial que comete errores o comparte información incorrecta no es algo que Apple debería sentirse razonablemente cómodo debido a la cantidad de personas a las que podría afectar. ¿Pensaste que el lanzamiento inicial de Apple Maps fue malo? Ahora, imagínate eso, pero en 10 veces más dispositivos. Por supuesto, el acceso a esos miles de millones de dispositivos es lo que hace que OpenAI esté dispuesto a ser un socio en primer lugar, por lo que la rueda da vueltas y vueltas.

Por todas estas razones, la IA en el iPhone, iPad o Mac nunca puede ser demasiado aventurera. Sólo debe hacer las cosas que Apple sabe que se pueden lograr con una cantidad mínima de error. Pero eso también deja ideas más inventivas o integrales para algún futuro que tal vez nunca llegue. Hablando desde la experiencia, por muy flexibles que sean los modelos de IA actuales, también están limitados en formas que requieren que usted los solucione, y no al revés. Es probable que Apple adopte un enfoque conservador, no solo porque tiene que hacerlo, sino porque la IA actual realmente no puede hacer mucho. Esto es decepcionante, pero es una realidad que sería mejor para todos aceptarla.

Fuente