Génération d'images pédagogiques avec IA

Le skill image-generator

Formation GT IA & Maths Google Gemini (Nano Banana)

Au programme

Qu'est-ce que le skill image-generator ?
Fonctionnement global
Workflow en 3 étapes
Cas d'usage pédagogiques
Limites et contraintes
Conseils pratiques

Qu'est-ce que le skill image-generator ?

Un skill Claude pour générer des images éducatives

Utilise Google Gemini 2.5 Flash Image
Optimisé pour les ressources pédagogiques
Styles adaptés à l'impression économique
Génère des corpus d'images cohérents

Fonctionnement global

Demande à Claude : "Génère des images pour mes ressources"

Skill image-generator s'active automatiquement

Analyse du besoin → fichier JSON de prompts

Script Python génère via API Google

Images PNG + métadonnées sauvegardées

Workflow détaillé (1/3)

Étape 1 : Analyse du besoin

Exemple : "5 images escape game médiéval fractions"

Combien d'images ?
Contexte de chaque image ?
Style visuel ?
Contraintes impression ?

Workflow détaillé (2/3)

Étape 2 : Création prompts

python generate_prompt.py \
  --output "prompts/escape_fractions.json" \
  --style "minimal_color_print" \
  --theme "escape_game_medieval" \
  --num_images 5

Fichier JSON avec prompts optimisés

Workflow détaillé (3/3)

Étape 3 : Génération API

python generate_images.py \
  --prompt_file "prompts/escape_fractions.json" \
  --output_dir "images/escape_fractions" \
  --num_variations 2

2 variations/image
PNG + métadonnées
~2 min pour 10 images

Ce que ça permet de faire

Fiches & exercices

Illustrations thématiques
Enrobages ludiques
Visuels cohérents

Personnages récurrents

Mascotte de classe
Guides pédagogiques
Storytelling

Optimisation impression

Ligne claire noir/blanc
2-3 couleurs maximum
Économie d'encre ~85%

Escape games

Scènes cohérentes
Énigmes visuelles
Récompenses

Styles disponibles

Appuyez sur ↓ pour voir chaque style en détail

minimal_color_print

Usage : Impressions économiques quotidiennes
Caractéristiques : 2-3 couleurs max, traits nets, contraste élevé
Économie : ~85% d'encre en moins

moderate_color_classroom

Usage : Affichage classe + impressions spéciales
Caractéristiques : 4-6 couleurs vives, détails moyens
Idéal pour : Activités, projets, escape games

educational_illustration

Usage : Schémas et explications visuelles
Caractéristiques : Style didactique, clarté maximale
Idéal pour : Cours, fiches de synthèse, démonstrations

Exemple concret : Escape game médiéval

Contexte : Fractions 4ème

30 copies à imprimer
Budget encre limité
Enrobage ludique

Solution : 5 images

Porte du donjon
Coffre à cadenas
Carte au trésor
Énigme symboles
Couronne royale

Appuyez sur ↓ pour voir les images

Images générées (1/2)

Porte mystérieuse avec énigme

Coffre au trésor avec cadenas

Images générées (2/2)

Carte au trésor avec calculs

Récompense finale - médaille

Exemple de prompt

{
  "context": "Porte mystérieuse avec énigme",
  "prompt": "Simple black and white line art of a medieval wooden door with mathematical symbols (numbers, geometric shapes, pi symbol) carved into it...",
  "negative_prompt": "color, shading, gradient, realistic..."
}

Exemple : Personnage récurrent

Contexte : Mascotte "Maître Renard"

8 scènes différentes
Style ligne claire N&B
2 variations/scène

16 assets prêts

Appuyez sur ↓ pour voir les exemples

Assets générés (1/2)

Renard qui partage

Renard qui enquête

Assets générés (2/2)

Renard qui calcule

8 scènes × 2 variations = 16 assets disponibles

Exemple de prompt

{
  "context": "Renard qui enquête",
  "prompt": "Simple black and white line art of a clever fox character standing upright as a detective, holding a magnifying glass and examining clues. The fox has a curious, investigative expression with a lightbulb icon above its head. Clean cartoon style with clear black outlines on white background, no shading...",
  "negative_prompt": "color, shading, gradient, realistic, photo, complex details..."
}

Limites importantes

PNG uniquement
(pas de SVG)

Pas d'image-to-image
(description textuelle)

Variabilité du style
(résultats variables)

Quota API limité
(selon plan Google)

Configuration requise
(clé API + auth)

Configuration nécessaire

Configuration déjà faite dans BFcours (GT_IA_MATHS) - pour info :

Créer projet GCP

Activer API Vertex AI

Documentation : .claude/skills/image-generator/README.md

Appuyez sur ↓ pour les étapes suivantes

Configuration (suite)

Auth : gcloud auth login

Configurer fichier .env

Installer dépendances Python

Tarification Google Vertex AI

Modèle	Vitesse	Qualité	Coût	Usage recommandé
`imagen-4.0-fast`	Rapide	Bonne	~$0.02/image	Tests, itérations
`imagen-4.0`	Normale	Très bonne	~$0.04/image	Production standard
`imagen-4.0-ultra`	Lente	Excellente	~$0.08/image	Qualité maximale

Exemple : Escape game avec 5 images × 2 variations = 10 générations

Modèle rapide : 10 × $0.02 = $0.20
Modèle standard : 10 × $0.04 = $0.40

Nouveau compte Google : $300 de crédits gratuits (90 jours)

Conseils d'utilisation

Privilégier le N&B
pour impression quotidienne
2-3 variations
pour comparer
Tester avant
1 impression → 30 copies

Être précis
✓ "wooden door with lock"
✗ "door"
Vérifier quota API
avant génération massive

Structure du skill

.claude/skills/image-generator/ ├── SKILL.md # Instructions pour agents Claude ├── README.md # Documentation utilisateur ├── requirements.txt # Dépendances Python ├── .env.example # Template configuration ├── scripts/ │ ├── generate_prompt.py # Génération de prompts JSON │ ├── generate_images.py # Génération via Vertex AI │ └── ... ├── knowledge/ │ ├── styles.md # 5 styles disponibles documentés │ ├── prompting_guidelines.md # Guide de prompting efficace │ ├── ... ├── config/ │ ├── escape_game_medieval.json │ ├── ... └── examples/ └── escape_game.md # Exemple complet détaillé

L'agent : Un expert autonome

Le skill image-generator est utilisé par un agent dédié : image-user

Appuyez sur ↓ pour voir comment ça marche

Commande vague → Amélioration automatique

Vous donnez une commande vague

"Génère des images pour mon escape game sur les fractions"

L'agent améliore automatiquement

Analyse le contexte pédagogique
Choisit le style optimal
Crée des prompts experts
Configure les paramètres

Code automatique et expertise de l'agent

Code automatique

Fichiers JSON de prompts
Commandes de génération
Configuration des styles
Gestion des variations

Vous n'écrivez jamais de code !

L'agent connaît :

Bonnes pratiques prompting
Styles images éducatifs
Optimisation impression
Contraintes pédagogiques

Résultat : Vous obtenez des images professionnelles sans expertise technique

Pourquoi générer via agent ?

Modèle optimal

Qualité adaptée
Multi-fournisseurs

Prompts experts

Auto-génération
Résultats optimaux

L'agent fait le travail complexe pour vous !

Appuyez sur ↓ pour voir plus d'avantages

Avantages supplémentaires (1/2)

Expérimentation

Tests rapides
Comparaison styles

Auto-amélioration

Apprentissage continu
Prompts sauvegardés

Avantages supplémentaires (2/2)

Économie

Un seul compte API
Contrôle des coûts

Personnalisation

Styles sur mesure
Sans maîtriser l'API

Résultats typiques

Temps de création

Génération des prompts : 2 min
Génération des images : 2 min
Sélection : 5 min
Intégration LaTeX : 10 min

Total : ~20 minutes

Économies

Style minimal : ~85% encre en moins
Pour 30 copies : ~33 pages économisées
Coût API : $0.20-0.40 par projet

ROI exceptionnel !

vs création manuelle : gain de temps considérable

Autres cas d'usage possibles

Sciences

Schémas expériences
Illustrations bio
Diagrammes physiques

Géographie

Cartes thématiques
Paysages types
Infographies

Appuyez sur ↓ pour d'autres disciplines

Encore plus de possibilités

Histoire

Scènes historiques
Personnages
Frises chronologiques

Langues

Vocabulaire illustré
Scènes de dialogue
Culture visuelle

En résumé

Points forts

Création rapide d'images personnalisées
Cohérence visuelle garantie
Optimisation impression/coût
Gain de temps considérable
Flexibilité des styles

À garder en tête

Configuration initiale requise
Format PNG uniquement
Variabilité entre générations
Quota API à surveiller
Toujours tester avant impression

Idéal pour créer des ressources pédagogiques visuelles cohérentes et économiques

Ressources

Documentation

README.md - Guide utilisateur
SKILL.md - Instructions agents
knowledge/ - Guides détaillés
examples/ - Exemples pratiques

Liens utiles

Google Cloud Console
Docs Vertex AI
Tarification

Questions ?