La semaine dernière, lors du Google I/O Connect 2025, une poignée de privilégiés ont pu découvrir en avant-première ce qui s’apparente à une bascule de paradigme dans l’univers de la vidéo générée par IA : Veo 3. À la croisée de la prouesse technique et du vertige éthique, cette nouvelle mouture du générateur vidéo de Google a littéralement électrisé la salle. Une démonstration aussi marquante que celle du Google Summit, où nous étions présents avec SFEIR. Quelques secondes de démos, et la frontière entre fiction et réalité semblait s’être évaporée.
SFEIR au Google Summit 2025 à l'Accor Arena
Une claque visuelle et sonore
Les vidéos dévoilées ? D’un réalisme saisissant. Mouvements fluides, éclairages cinématographiques, profondeur de champ maîtrisée… mais surtout, du son. Une grande première. Bruits ambiants, dialogues synchronisés avec les lèvres, effets sonores contextuels (le crépitement d’un feu, le grondement d’une foule)… Veo 3 n’anime plus seulement des images, il insuffle une ambiance, une atmosphère crédible. Nous sommes entrés dans l’ère du text-to-cinema.
Un exemple marquant ? Un salon automobile, des interviews de visiteurs, des plans léchés et des répliques dignes d’un micro-trottoir. À un détail près : rien n’est vrai. Aucun plan n’a été tourné, aucun personnage n’existe, et même les voix sont entièrement générées. Cette vidéo virale publiée par László Gaál a été générée de A à Z par Veo 3, le nouvel outil d’intelligence artificielle de Google. Et le résultat est vraiment bluffant ! Un utilisateur a même généré plus de 100 clips en une nuit, simulant micro-trottoirs, séquences de jeux vidéo ou publicités.
Une avancée fulgurante, mais à quel prix ?
Derrière cette performance se cache un modèle nourri aux milliards d’heures de vidéos disponibles sur YouTube — le trésor de guerre de Google. Une immersion si parfaite qu’elle interroge : comment distinguer le vrai du faux ? Cette démonstration d’un faux reportage automobile, relayée massivement sur les réseaux, a bluffé tous les testeurs. Personne, absolument personne, n’a deviné que l’intégralité avait été générée par IA.
Nous ne sommes plus à l’époque des visages flous ou des sixièmes doigts trahissant la machine. Avec Veo 3, le faux a le goût du vrai. Et comme le soulignait récemment Luc Julia dans les colonnes de sfeir.dev : « Le plus grand défi de notre génération sera de douter de tout. Car la réalité ne sera jamais aussi proche de la fiction. »
Sora et Veo 3 : deux visions, une même révolution
OpenAI avait ouvert la voie avec Sora Turbo, repoussant les limites de l’imaginaire avec une précision esthétique impressionnante. Mais l’absence de son laissait une pièce du puzzle manquante. Google, avec Veo 3, vient de la placer. Là où Sora excelle dans la narration visuelle stylisée, Veo 3 s’impose comme le plus cinématographique des outils IA à ce jour.
Les deux modèles, basés sur des architectures mêlant transformers et modèles de diffusion, semblent aujourd’hui converger vers un même objectif : offrir à chacun les moyens de produire un film, un spot, un rêve. Le tout, à la simple force d’un prompt bien formulé.
Un outil, une responsabilité collective
La performance est vertigineuse, mais la menace est réelle. Deepfakes indétectables, vidéos de désinformation, falsifications visuelles et auditives… Dans un monde déjà saturé d’images, la prolifération de contenus indifférenciables de la réalité pourrait bien achever ce qui restait de confiance dans le visible.
Google promet des garde-fous : filigranes, métadonnées C2PA, vérificateurs intégrés. Mais ces mesures sauront-elles résister à l’ingéniosité des faussaires ?
🎬 Tests avec VEO3
Je ne pouvais évidemment pas résister à l’envie de tester l’outil. Je me suis donc amusée à prompter différents scenarii, dont voici quelques exemples :
Prompt 1: "À la manière d’un film de Tarantino, génère une scène où des axolotls célèbrent dans un bar western les 30 ans de Java."
Test vidéo généré par Veo 3
Résultat ? Une ambiance digne des Huit Salopards revisitée par Pixar. L’anniversaire est vite éclipsé par une bagarre générale… mais l’effet est là.
Et si on tentait une image plus réaliste.
Prompt 2: "Des axolotls dans un lac mexicain, nageant paisiblement au milieu d’une flore adaptée."
Le déconcertant réalisme de Veo 3
Textures, lumière, mouvements… j’ai été bluffée. Mais tentons l'expérience audio.
Prompt 3 : "À la manière d’un Pixar, génère une scène festive dans un bar où des axolotls chantent ‘Happy Birthday sfeir.dev !’ pour célébrer les deux ans du média."
Vidéo générée par Veo3 pour célébrer les deux ans de notre média sfeir.dev !
Une vidéo prometteuse, mais sans son, Véronique!
Patience : tout n’est pas encore disponible en Europe.
Et maintenant ?
Veo 3 n’est effectivement pas encore accessible depuis l’Europe sans VPN, et nécessite un abonnement AI Pro ou Ultra via Gemini ou l’application Flow. Mais cela ne saurait tarder.
Cette révolution s’écrit maintenant. Elle nous fascine autant qu’elle nous inquiète. Une chose est sûre : la vidéo ne sera plus jamais la même. Et nous non plus.
Alors, doutons de tout, car la frontière entre réalité et fiction n’a jamais été aussi ténue.