Après Google I/O 2024, qui s'est tenu au Shoreline Amphitheatre de Mountain View, le PDG de Google, Sundar Pichai, a souligné l'importance de l'intelligence artificielle (IA) dans ses dernières innovations. Voici les mises à jour critiques dévoilées lors du discours d’ouverture de deux heures.
Projet Astra : un assistant IA universel
Google a présenté Project Astra, un assistant avancé basé sur l'IA pour améliorer la vie quotidienne. Démontré à travers une vidéo filmée en une seule prise, l’assistant interagit de manière transparente avec l’environnement. L'utilisateur navigue dans les bureaux de Google à Londres et engage des conversations naturelles avec Astra via sa caméra. Astra identifie avec précision l'emplacement des lunettes égarées de l'utilisateur sans mention préalable. La vidéo fait allusion au développement de lunettes intelligentes avec caméras embarquées, rivalisant potentiellement avec les lunettes intelligentes Ray-Ban de Meta.
Veo et Imagen 3 : nouveaux moteurs de création de médias IA
Google a lancé Veo et Imagen 3, deux puissants outils de création multimédia basés sur l'IA. Veo est en concurrence avec Sora d'OpenAI, générant des vidéos 1080p de haute qualité d'une durée d'une minute, avec une compréhension des concepts cinématographiques comme le timelapse. Imagen 3, un générateur de texte en image, surpasse son prédécesseur en produisant des images photoréalistes très détaillées avec un minimum d'artefacts, ce qui le positionne par rapport au DALLE-3 d'OpenAI.
Intégration Gemini avec Android 15
La prochaine version d'Android 15 comportera une intégration directe avec Gemini, permettant des interactions spécifiques au contexte. Les utilisateurs peuvent accéder à Gemini en superposition pour poser des questions sur l'application, l'image ou la vidéo actuellement utilisée. L'avenir de Google Assistant reste incertain, puisqu'il était notamment absent de la keynote.
Mises à jour transformatrices de la recherche Google
Google a annoncé des changements importants dans la fonctionnalité de recherche. De nouvelles fonctionnalités, telles que répondre à des requêtes complexes et planifier des repas ou des vacances, seront accessibles via Search Labs, permettant aux utilisateurs de tester des fonctionnalités expérimentales. Un ajout notable concerne les aperçus de l'IA, qui fourniront des réponses générées par l'IA en haut des résultats de recherche. Cette fonctionnalité, testée pendant un an, sera bientôt disponible pour des millions d'utilisateurs aux États-Unis et à terme pour plus d'un milliard dans le monde d'ici la fin de l'année.
Google Photos amélioré avec l'IA
Google Photos est sur le point de devenir encore plus performant pour les abonnés Google One aux États-Unis. Les utilisateurs peuvent poser des questions complexes telles que « Montrez-moi la meilleure photo de chaque parc national que j'ai visité », en tirant parti des données GPS et de l'IA pour sélectionner les meilleures images. De plus, les utilisateurs peuvent générer des sous-titres pour les publications sur les réseaux sociaux, améliorant ainsi l'expérience globale.
Présentation de Gemini 1.5 Flash et mises à jour de Gemini Pro
Google a dévoilé Gemini 1.5 Flash, un nouveau modèle d'IA optimisé pour la vitesse et l'efficacité. Positionné entre Gemini 1.5 Pro et Gemini 1.5 Nano, Flash s'adresse aux développeurs à la recherche d'une solution rentable avec une longue fenêtre contextuelle d'un million de jetons. Plus tard cette année, Google prévoit de doubler la fenêtre contextuelle de Gemini pour la porter à deux millions de jetons, permettant ainsi le traitement simultané d'un contenu vidéo, audio, code et texte étendu.
Ces annonces soulignent l'engagement de Google à intégrer l'IA sur ses plates-formes, promettant des améliorations innovantes pour les utilisateurs du monde entier.