Aller au contenu principal
⚙️Technologie
Pour moi, Antigravity/Gemini 3 a réussi son entretien d’embauche

Pour moi, Antigravity/Gemini 3 a réussi son entretien d’embauche

Olivier RafalOlivier Rafal
Technologie5 min

Embauche validée - à ma grande surprise !

Je dois vous avouer que le passage annoncé de Gemini de sa version 2.5 à sa version 3 me laissait plutôt de marbre. J’ai appris à déléguer un certain nombre de tâches à Gemini 2.5, pour mettre à jour notre site Wenvision en mode conversationnel, et le bilan oscille entre plutôt bon et très bon, sans être totalement exceptionnel : il fait le job, il prend en charge des manipulations bien trop complexes pour moi, mais il faut le surveiller étroitement. Et l’usage en ligne de commande dans un terminal est plutôt rugueux.

Je n’étais donc pas forcément hyper enthousiaste à l’idée de faire passer un entretien d’embauche à sa nouvelle mouture.

Ah oui, il faut que je vous explique pourquoi je parle d'entretien : j'ai vu cela dans un article d'Ethan Mollick, et je trouve ce vocabulaire parfaitement approprié. Quel LLM utiliser pour une tâche précise ? À quel benchmark se fier pour les LLM ? Quel est le meilleur LLM pour ceci ou cela ? À chaque fois qu'un client me posait une question de ce type, je répondais que cela dépendait fortement de la tâche qu'il allait lui confier. Les scores aux benchmarks, en particulier, ne donnent qu'une indication très imparfaite, un peu comme les scores de QI pour les humains : ce n'est pas parce que le LLM ou l'humain est capable de réaliser parfaitement une tâche telle que prévue par le benchmark qu'il sera performant dans votre contexte.

En d’autres termes, comme le souligne Ethan Mollick,il vaut mieux évaluer les modèles d'IA comme des candidats à un poste, en les testant sur les tâches réelles qu'ils devront effectuer. C’est donc ce que j’ai fait avec la nouvelle génération du LLM de Google, en prenant soin de lui offrir son environnement d’exécution ad hoc : Antigravity.

Un agent IA proactif, ça change vraiment

Nos collègues et amis de sfeir.dev ont décrit en détail ce remarquable environnement pour agents IA qu'est Antigravity, je n'y reviendrai donc pas ici. Disons juste qu'il s'agit d'un énorme "level up" pour quiconque aurait déjà utilisé Gemini 2.5, même à l'intérieur de VSCode. L'association Gemini 3 + Antigravity m'a offert de toutes nouvelles possibilités pour effectuer des modifications rapidement et en toute sécurité. Plus besoin de demander à son agent IA de nous soumettre d'abord un plan d'action, de tester les choses de son côté, il s'occupe de tout, détaille ses intentions et ses actions et même documente sa démarche.

Il faut bien garder en tête que c’est une jeune IA, avide de faire plaisir à son manager : certaines de ses suggestions peuvent être un peu osées. Il ne faut pas hésiter à les soumettre à l’opinion d’un collègue un peu plus expérimenté, comme ClaudeCode, par exemple, et lui donner ensuite le feedback obtenu pour ajuster son plan d’action. Mais clairement, dans l’ensemble, en tant que manager, j’ai fait un beau recrutement.

Et avant que vous ne me posiez la question : non, cela ne m'empêchera pas de recruter de jeunes collègues tout à fait humains !