si fueras Para destruir las credenciales de privacidad de Apple de un solo movimiento, podría hacer algo peor que lanzar unos AirPods con cámaras. Ya sea que lleguen al mercado o no, todos los omnipresentes auriculares de Apple existentes se convertirían en un signo de interrogación para todos los que están cerca: ¿Me están grabando ahora mismo?
Según Mark Gurman, de Bloomberg, Apple ha diseñado unos AirPods equipados con una cámara para permitir que Siri «vea» el entorno del usuario. Se encuentran en las últimas etapas de prueba con empleados de Apple como parte de un «impulso de dispositivo de IA».
Sin embargo, una fuente que pidió permanecer en el anonimato porque no está autorizada a hablar públicamente sobre el asunto le dice a WIRED que Apple probablemente retrasará la cámara de los AirPods. Si bien el hardware está listo, la inteligencia visual de Siri no está a la altura. A los ejecutivos de Apple también les preocupa que la compañía esté introduciendo un riesgo significativo para la privacidad con las cámaras de los auriculares sin casos de uso convincentes. Apple no respondió de inmediato a la solicitud de comentarios de WIRED.
Esto nos lleva a la pregunta principal: ¿Qué ventajas buscaría Apple al agregar cámaras a sus AirPods, especialmente en un momento en que las preocupaciones de los consumidores sobre la privacidad respecto de la vigilancia informal a través de cámaras de gafas inteligentes, cámaras de timbre e incluso cámaras de teléfonos están aumentando?
Navegación, compras y una Siri más inteligente
Según Bloomberg, estos AirPods tienen vástagos más grandes para albergar cámaras de baja resolución: actúan como los ojos de Siri como contexto visual para las solicitudes habladas. No están diseñadas para capturar fotografías y vídeos, como las gafas inteligentes. Algunos casos de uso mencionados en el informe incluyen navegación basada en puntos de referencia e identificación de alimentos para ayudar con las compras.
«La ubicación basada en la visión es la más obvia», dice Anshel Sag, analista principal de Moor Insights & Strategy. «Tiene que ser un tipo de experiencia muy pasiva, y es por eso que creo que tiene sentido usarlo para obtener precisión basada en la ubicación, para rectificar el GPS». Google también está utilizando cámaras en sus próximas gafas inteligentes para comprender la orientación de un usuario cuando utiliza la navegación a pie con Google Maps.
Otras características potenciales resultarán familiares para cualquiera que esté actualizado en gafas inteligentes. A Peter Richardson, vicepresidente de Counterpoint Research, le gusta la idea de pararse frente al refrigerador y preguntarle al asistente de IA qué preparar para la cena, como ejemplo de cómo los datos de múltiples dispositivos podrían funcionar juntos.
«Eso es algo que requiere información visual», dice Richardson. «Hay mucho contexto: ¿es a mitad de semana? ¿Tengo entrenamiento por la mañana? ¿Es un viernes cuando tal vez me gusta tomar una copa de vino? ¿Vienen mis amigos?». De manera similar, combinados con el Apple Watch, los datos visuales podrían hacer que Siri sea más intuitivo. «Si estoy en la estación de Paddington y estoy corriendo, tal vez llegue tarde al tren, así que tal vez no me llames», dice.
Como ocurre con muchos dispositivos portátiles de nicho, también existen algunas aplicaciones de accesibilidad interesantes. 9to5mac sugiere que un Siri que todo lo ve a través de AirPods, tal vez con capacidades de infrarrojos en la mezcla, podría mejorar las capacidades de las funciones Image Explorer y Voice Over de Apple para usuarios con discapacidad visual. En todos estos escenarios, una información clave que aún no tenemos es si las cámaras estarían orientadas hacia adelante o hacia el mundo. Gurman indica que una “pequeña luz LED” se encenderá cuando se introduzcan datos visuales en la nube.
Datos visuales para IA
A primera vista, el razonamiento aquí podría ser obvio: una captura de datos del mundo real. A medida que los grandes fabricantes de modelos de IA y las nuevas empresas emprendedoras avanzan más allá de los modelos de lenguaje grande basados en texto, hacia imágenes, mapas y robótica, el popular y asequible accesorio de Apple podría transformarse en el equivalente de 2026 de los autos StreetView de Google.
«Obtener información, visual o incluso acústica, es información nueva que nunca se ha utilizado para entrenar la IA», dice Richardson. «Pero sólo es útil si luego se puede utilizar para entrenarlo».


