En la conferencia de desarrolladores I/O de Google esta semana, tuvimos la oportunidad de realizar una breve práctica con sus próximas gafas con tecnología de inteligencia artificial, no las gafas de solo audio que Google dijo que comenzarán a distribuirse este otoño, sino las gafas que ofrecen una experiencia combinada de audio y visual.
Anunciadas por primera vez en el evento del año pasado, estas gafas Android XR ofrecen una pantalla en la lente que muestra información útil frente a usted, superpuesta sobre el mundo real. Esto incluye widgets que pueden mostrar cosas como el clima, indicaciones para caminar, detalles de recogida en Uber, traducción en vivo y más, incluso widgets que usted mismo diseñó usando IA.
Las gafas también se emparejarán con teléfonos iOS y Android, señaló la compañía, tanto en el formato de solo audio como en la futura versión de pantalla.
Las gafas con pantalla están destinadas a ser el siguiente paso más allá de la primera generación de gafas con audio que se lanzará a finales de este año. Las gafas en sí fueron desarrolladas en asociación con Warby Parker, Gentle Monster y Samsung, combinando la tecnología de Google con la estética del diseño de sus marcas.
Mientras tanto, las gafas que probamos todavía eran en gran medida un prototipo, aunque lo suficientemente pulidas como para probarlas ahora externamente. Los representantes que hicieron la demostración de las gafas XR explicaron que el prototipo permitió a Google no preocuparse por algunos de los detalles cosméticos relacionados con diferentes estilos y formas, por lo que podría centrarse en experimentar con la tecnología de pantalla más libremente y su impacto en la duración de la batería. Eso significa que estas gafas son muy diferentes de cualquier versión futura de gafas que se envíe en términos de ajuste, forma, dimensiones y atención al detalle. Más bien, es más como poder experimentar con el “interior” de las gafas, sin dejar de tener una montura básica y cómoda.
La versión de envío de las gafas podrá detectar cuándo se colocan y se quitan las gafas en la cabeza, pero las que probamos no tenían esta función.
Para activar Gemini, debes presionar durante dos segundos el lado derecho del marco de las gafas. Sonará un timbre de inicio para informarle que Gemini está encendido y escuchando. En la versión de demostración, iniciar Gemini también iniciaría la cámara al mismo tiempo, pero la versión de envío permitirá al usuario configurar si desea encender la cámara cuando Gemini se inicie o no.
En una prueba inicial, reproducimos música a través de las gafas pidiéndole a Gemini que interpretara a su artista favorito. Desafortunadamente, el lugar era demasiado ruidoso para evaluar la calidad del sonido, ya que la música estaba al máximo volumen y todavía era relativamente difícil escucharla de manera nítida y detallada. Pero la impresión inicial de esta experiencia limitada fue que las gafas no serían un gran sustituto de los auriculares de mayor calidad, aunque servirían si solo quisieras escuchar algo de música mientras estabas afuera, caminando, caminando o haciendo las tareas del hogar. La ventaja de no tener auriculares es que puedes escuchar a alguien hablar más fácilmente, en comparación con las experiencias del modo transparencia en dispositivos como los AirPods de Apple.
Para apagar la música, simplemente toque una vez en el costado del marco, alrededor del medio, como si estuviera tocando su sien.
En la segunda prueba, presionamos el botón de captura de fotos con el dedo para tomar una foto de una persona. La pantalla estaba apagada, por lo que la imagen se transfirió a nuestro teléfono y reloj. (Más adelante podrás capturar un video con una pulsación larga, pero esta opción no estaba disponible para probar con el prototipo. En el caso del video, verías una vista previa en miniatura del video en lugar de una foto).
También puedes simplemente pedirle a Gemini que tome una foto sin tener que presionar el botón de foto y realizar algún tipo de manipulación de IA en el resultado. Por ejemplo, puedes decir algo como «toma una foto y convierte a la persona en un personaje de anime». La foto se envía al teléfono, luego a los servidores Gemini y Nano Banana, y luego regresa en su versión editada.
En el lugar de Google I/O, donde el Wi-Fi estaba bajo una gran carga, el viaje de ida y vuelta tomó alrededor de 45 segundos.
Con la pantalla habilitada, verá aparecer una pantalla de inicio simple en su campo de visión. La versión de demostración tenía algunos widgets precargados que mostraban el clima y una cuenta regresiva para el evento I/O de Google. También puedes crear lanzadores rápidos en aplicaciones específicas, como Google Maps o Translate, si esos estuvieran entre tus principales casos de uso para las gafas.
El prototipo tenía solo una pantalla sobre el ojo derecho, pero la plataforma puede admitir pantallas simples y duales, así como gafas con solo audio. La imagen en sí estaba un poco borrosa, pero lo atribuimos a nuestros lentes de contacto recetados, que implican usar una lente optimizada para la visión de lejos en un lado y otra optimizada para la visión de cerca en el otro. Cuando cerramos un ojo, la imagen se enfocó mejor, pero la experiencia casi de inmediato nos dejó con algo de fatiga visual sobre el ojo derecho, y no está claro si la prescripción fue toda la culpa.
Una de las mejores demostraciones fue la de la experiencia de traducción de idiomas en las gafas, respaldada por la aplicación Google Translate en el teléfono. Uno de los manifestantes hablaba español rápidamente y las gafas automáticamente detectaban el idioma y mostraban el texto en inglés en la pantalla, mientras Gemini hablaba inglés en nuestro oído. Pudimos ver a viajeros del mundo comprando gafas solo para esta experiencia.
Debemos tener en cuenta que Translate también funcionará en las gafas de solo audio, pero sin que el texto se muestre en las gafas. En cambio, podría ver la transcripción en el teléfono, si es necesario, además de la respuesta de audio en tiempo real.
Otra demostración implicó el uso de gafas para navegar. Si bien obviamente no pudimos salir a caminar y abandonar el lugar para probar su precisión, pudimos tener una idea de cómo funcionaría. Puedes iniciar la experiencia de Google Maps pidiéndole a Gemini que te lleve a un destino, que puede ser incluso tan vago como algo como «la cafetería más cercana».
Gemini activará Google Maps en el teléfono, pero no es necesario que saques el teléfono del bolso o del bolsillo para usarlo. Después de un breve retraso mientras se carga la experiencia, las gafas muestran instrucciones paso a paso. Cuando estás mirando hacia adelante, lo que se muestra es la información de tu próximo giro. Pero si necesitas orientarte en el espacio, puedes mirar hacia el suelo y ver tu punto azul en un mapa. También puedes girar hacia la izquierda y hacia la derecha para rotar en el espacio, tal como intentarías que el punto azul apunte en la dirección correcta en tu teléfono.
Luego, si vuelves a mirar hacia arriba, podrás seguir caminando sin que el mapa se interponga en tu camino.
Debido a que la experiencia está vinculada a Google Maps en su teléfono, los destinos guardados como «casa» y «trabajo» ya estarán disponibles.
También pudimos usar brevemente las gafas para identificar una variedad de objetos a nuestra vista y hacer preguntas sobre ellos. Inicialmente, las gafas tuvieron dificultades para identificar la réplica de una pintura de Monet en un estante frente a nosotros, pero eso se debe a que el prototipo no habilitó automáticamente la cámara: tuvo que encenderse nuevamente desde la aplicación. Aun así, fueron necesarias un par de preguntas antes de que Géminis dijera que parecía un Monet incluso después de que nos acercamos para centrarnos en la firma de Monet en la parte inferior izquierda.
Otras pruebas fueron más sencillas, ya que los vasos identificaron inmediatamente la planta en el estante y respondieron preguntas sobre diferentes recetas en un libro. Aún así, pensamos que estas eran cosas que se podían hacer hoy con Google Lens (u otros modelos de IA integrados en aplicaciones de chatbot), aunque suponemos que es interesante poder hacerlas sin tener que sacar el teléfono.
Google dice que tendrá más que compartir sobre sus gafas con pantalla Android XR a finales de este año, cuando amplíe su programa de pruebas de confianza.
Mientras tanto, la compañía cree que el audio será suficiente para las necesidades de algunos usuarios, lo que quizás sea una forma inteligente de darle la vuelta al hecho de que no tiene sus gafas de visualización listas, a pesar de la competencia de Meta y Snap en este frente.
Al igual que la versión con pantalla, las gafas de audio también brindan acceso a Gemini AI de Google, que se escucha de forma privada a través de los parlantes del marco de las gafas. Puede hacer cosas como escuchar música a través de las gafas, presionar un botón para tomar una foto, hacer una llamada o acceder a las aplicaciones de su teléfono, desde estas gafas, como puede hacerlo en las futuras versiones de pantalla.
Aprovechar otras aplicaciones de terceros no estaba entre los elementos que demostramos, pero las gafas permitirán a los usuarios decirle a Gemini que haga cosas como «tomar los ingredientes de esta receta y agregarlos a mi lista de compras».
En otro ejemplo que Google mostró durante el discurso de apertura del evento, las gafas podían ver una comida que el usuario estaba cocinando en la estufa y ofrecer comentarios sobre la comida, como si la carne ya estaba completamente cocida o no.
Cuando compra a través de enlaces en nuestros artículos, podemos ganar una pequeña comisión. Esto no afecta nuestra independencia editorial.



