Google annonce Gemini 4 : le point sur les nouveautés
Le mot d'ordre de Gemini 4 est sans équivoque : l'agentivité. Si les versions précédentes excellaient à répondre à des questions, Gemini 4 est conçu pour agir.
- Le projet Mariner : Cette fonctionnalité, au cœur de Gemini 4, permet à l'IA de prendre le contrôle sécurisé de votre navigateur ou de votre smartphone pour accomplir des tâches complexes à votre place : organiser un voyage complet, comparer des produits ou déboguer un logiciel.
- Capacités d'auto-correction : Contrairement aux modèles actuels qui peuvent s'enliser dans une erreur, Gemini 4 intègre des boucles de rétroaction lui permettant de corriger son plan d'action en temps réel.
Un raisonnement "System 2" généralisé
Google introduit avec Gemini 4 un nouveau mode de pensée appelé "Thinking mode".
- Temps de réflexion modulable : Pour des tâches complexes (mathématiques, architecture réseau, droit), le modèle pourra prendre quelques secondes pour "réfléchir" avant de répondre, augmentant drastiquement la fiabilité des réponses.
- Fiabilité factuelle : L'objectif affiché est de réduire le taux d'hallucination à un niveau quasi nul pour les usages professionnels.
Une multimodalité totale et instantanée
Si Gemini était déjà multimodal, Gemini 4 pousse le concept à son paroxysme :
- Mémoire à long terme (Persistent memory) : Le modèle ne se contente plus d'une fenêtre de contexte ; il peut se "souvenir" de vos préférences et de vos interactions passées sur des semaines, devenant un véritable assistant personnel cohérent.
- Traitement vidéo en temps réel : Grâce aux avancées du projet Astra, Gemini 4 peut analyser un flux vidéo en direct avec une latence quasi inexistante, capable de décrire ce qu'il voit et d'interagir avec l'environnement de l'utilisateur.
L'intégration système et l'exécution "on-device"
Pour les passionnés d'optimisation et d'architecture logicielle, la véritable révolution de Gemini 4 réside dans sa fusion avec le noyau des systèmes d'exploitation Android et ChromeOS. Ce n'est plus une application tierce, mais un service système de bas niveau.
L'optimisation poussée pour la nouvelle puce Tensor G6 permet d'exécuter une version massive du modèle directement sur le NPU (Neural Processing Unit). Cette approche "local-first" garantit deux points cruciaux pour les utilisateurs exigeants :
- Confidentialité absolue : Le traitement des données les plus sensibles (fichiers personnels, flux caméra en direct) ne quitte jamais l'appareil, éliminant les risques liés au cloud.
- Réactivité hardware : En s'affranchissant de la latence réseau, Gemini 4 peut interagir avec les API système à une vitesse fulgurante, transformant l'IA en une extension naturelle du processeur plutôt qu'en un simple outil déporté.
Avec cette annonce, Google ne cache plus son ambition de reprendre la pole position. Gemini 4 ne cherche pas seulement à être plus intelligent, il cherche à être plus utile en devenant le premier véritable agent capable de naviguer dans le monde numérique à notre place.