[01] BigQuery Conversational Analytics avec Gemini CLI

Mon expérience avec l'extension BigQuery Conversational Analytics pour Gemini CLI

J'ai récemment eu l'occasion de tester l'extension BigQuery Conversational Analytics pour Gemini CLI, et l'expérience transforme véritablement la manière d'interagir avec les données structurées. Fini les allers-retours constants vers la console GCP pour générer des analyses ; cette extension permet d'obtenir des insights intelligents directement à partir de vos jeux de données BigQuery en utilisant simplement des commandes en langage naturel.

Qu'est-ce que l'extension BigQuery Conversational Analytics ?

L'extension BigQuery Conversational Analytics pour Gemini CLI permet aux développeurs de se connecter et d'interagir facilement avec les ensembles de données BigQuery. Elle offre un accès aux insights avancés fournis par un agent intégré derrière l'API Conversational Analytics (accessible via geminidataanalytics.googleapis.com).

L'API sous-jacente est conçue pour créer et interagir avec des agents de données qui utilisent le langage naturel pour répondre à des questions sur vos données structurées, y compris celles de Looker, BigQuery et Looker Studio.

Prérequis et Configuration

Pour pouvoir commencer mon test, j'ai dû m'assurer de respecter plusieurs prérequis :

Gemini CLI installé (version +v0.6.0) : npm install -g @google/gemini-cli
Un projet Google Cloud avec les APIs suivantes activées : Data Analytics API with Gemini, Gemini for Google Cloud API, et BigQuery API.
Des rôles IAM spécifiques, notamment :
- BigQuery User (roles/bigquery.user) : pour exécuter les requêtes et visualiser les métadonnées.
- Gemini for Google Cloud (roles/cloudaicompanion.user) : pour utiliser l'API Conversational Analytics.

L'installation de l'extension se fait via une simple commande : gemini extensions install https://github.com/gemini-cli-extensions/bigquery-conversational-analytics.

De plus, il est crucial de configurer des variables d'environnement, notamment BIGQUERY_PROJECT (l'ID du projet GCP).

Les Outils Clés de l'Agent

L'extension fonctionne comme un serveur MCP configuré appelé BigQuery Conversational Analytics, intégrant deux outils principaux qui facilitent l'analyse :

search_catalog : Utilisé pour trouver des tables, vues, modèles, routines ou connexions pertinents, notamment en réponse à une requête en langage naturel.
ask_data_insights : L'outil fondamental pour l'analyse de données, permettant d'obtenir des insights ou de répondre à des questions complexes sur le contenu de tables BigQuery spécifiques.

Exemple de l'extension BigQuery Conversational Analytics pour Gemini CLI

Exemples de Tests

Mon test a simulé des scénarios typiques d'un analyste de données, en utilisant des questions complexes nécessitant une analyse inter-tables. Voici trois exemples qui illustrent la puissance de l'agent :

Exemple 1 : Identifier les produits les plus vendus

J'ai commencé par une question simple mais concrète :

> What are the top 10 best selling products by sales revenue in 2024 ?

Le processus de l'agent s'est déroulé en plusieurs étapes :

Il a utilisé search_catalog pour trouver les tables pertinentes liées aux ventes et aux produits.
Il a ensuite utilisé search_catalog à nouveau pour localiser des tables de liaison comme "orders" ou "order_items".
Enfin, il a exécuté ask_data_insights en référençant ces tables pour calculer et lister les 10 produits les plus vendus, comme par exemple The North Face Apex Bionic Soft Shell Jacket Men's avec 8127,0 $ de revenus.

Exemple d'identification des produits les plus vendus

Exemple 2 : Obtenir des insights directes (Analyse Contextuelle)

J'ai enchaîné avec une question qui exploitait le contexte de la conversation précédente :

> What's the evolution for 2025 until now ?

L'agent a intelligemment utilisé ask_data_insights à nouveau, en appliquant le contexte des mêmes tables de produits et de commandes. L'agent a fourni un insight qualitatif immédiat : un changement significatif s'est produit, les meilleurs vendeurs de 2024 (comme les vestes The North Face) étant absents des données de 2025, remplacés par des accessoires (bandeaux et ceintures). L'agent a même suggéré qu'une analyse plus approfondie serait nécessaire pour déterminer la cause exacte (changement de catalogue, tendances de consommation, ou saisonnalité).

Exemple 3 : Analyse année après année

Pour tester une agrégation complexe, j'ai demandé :

> Aggregate sales revenue by category and year, then compare 2024 with 2025

L'agent a utilisé ask_data_insights pour agréger les revenus par catégorie et par an, présentant les résultats dans un tableau comparatif avec les années pivotées en colonnes. Ce format permet une comparaison côte à côte des performances de chaque catégorie. Par exemple, la catégorie "Accessories" est passée de 106 245,40 $ en 2024 à 152 066,46 $ en 2025.

Exemple d'analyse d'une année sur l'autre

Conclusion

Le Conversational Analytics pour Gemini CLI offre un moyen puissant et fluide d'exploiter les données BigQuery. Le fait de pouvoir exécuter des requêtes d'analyse complexes en langage naturel et de recevoir non seulement des données brutes, mais aussi des insights contextuels, démontre la valeur ajoutée de cette extension pour les analystes et les utilisateurs métier.

Il est essentiel de souligner que la performance de cet outil est intrinsèquement liée à la qualité des données et de leurs métadonnées. Chez SFEIR, nous guidons nos clients dans l'élaboration de leur Data Platform et explorons activement l'intégration de l'IA Générative, en particulier pour optimiser les métadonnées.