Génération d'images pédagogiques avec IA

Le skill image-generator

Formation GT IA & Maths Google Gemini (Nano Banana)

Au programme

  1. Qu'est-ce que le skill image-generator ?
  2. Fonctionnement global
  3. Workflow en 3 étapes
  4. Cas d'usage pédagogiques
  5. Limites et contraintes
  6. Conseils pratiques

Qu'est-ce que le skill image-generator ?

Un skill Claude pour générer des images éducatives

  • Utilise Google Gemini 2.5 Flash Image
  • Optimisé pour les ressources pédagogiques
  • Styles adaptés à l'impression économique
  • Génère des corpus d'images cohérents

Fonctionnement global

1
Demande à Claude : "Génère des images pour mes ressources"
2
Skill image-generator s'active automatiquement
3
Analyse du besoin → fichier JSON de prompts
4
Script Python génère via API Google
5
Images PNG + métadonnées sauvegardées

Workflow détaillé (1/3)

Étape 1 : Analyse du besoin

Exemple : "5 images escape game médiéval fractions"

  • Combien d'images ?
  • Contexte de chaque image ?
  • Style visuel ?
  • Contraintes impression ?

Workflow détaillé (2/3)

Étape 2 : Création prompts

python generate_prompt.py \
  --output "prompts/escape_fractions.json" \
  --style "minimal_color_print" \
  --theme "escape_game_medieval" \
  --num_images 5

Fichier JSON avec prompts optimisés

Workflow détaillé (3/3)

Étape 3 : Génération API

python generate_images.py \
  --prompt_file "prompts/escape_fractions.json" \
  --output_dir "images/escape_fractions" \
  --num_variations 2
  • 2 variations/image
  • PNG + métadonnées
  • ~2 min pour 10 images

Ce que ça permet de faire

Fiches & exercices

  • Illustrations thématiques
  • Enrobages ludiques
  • Visuels cohérents

Personnages récurrents

  • Mascotte de classe
  • Guides pédagogiques
  • Storytelling

Optimisation impression

  • Ligne claire noir/blanc
  • 2-3 couleurs maximum
  • Économie d'encre ~85%

Escape games

  • Scènes cohérentes
  • Énigmes visuelles
  • Récompenses

Styles disponibles

Appuyez sur ↓ pour voir chaque style en détail

minimal_color_print

  • Usage : Impressions économiques quotidiennes
  • Caractéristiques : 2-3 couleurs max, traits nets, contraste élevé
  • Économie : ~85% d'encre en moins

moderate_color_classroom

  • Usage : Affichage classe + impressions spéciales
  • Caractéristiques : 4-6 couleurs vives, détails moyens
  • Idéal pour : Activités, projets, escape games

educational_illustration

  • Usage : Schémas et explications visuelles
  • Caractéristiques : Style didactique, clarté maximale
  • Idéal pour : Cours, fiches de synthèse, démonstrations

Exemple concret : Escape game médiéval

Contexte : Fractions 4ème

  • 30 copies à imprimer
  • Budget encre limité
  • Enrobage ludique

Solution : 5 images

  1. Porte du donjon
  2. Coffre à cadenas
  3. Carte au trésor
  4. Énigme symboles
  5. Couronne royale

Appuyez sur ↓ pour voir les images

Images générées (1/2)

Porte mystérieuse

Porte mystérieuse avec énigme

Coffre au trésor

Coffre au trésor avec cadenas

Images générées (2/2)

Carte au trésor

Carte au trésor avec calculs

Médaille

Récompense finale - médaille

Exemple de prompt

{
  "context": "Porte mystérieuse avec énigme",
  "prompt": "Simple black and white line art of a medieval wooden door with mathematical symbols (numbers, geometric shapes, pi symbol) carved into it...",
  "negative_prompt": "color, shading, gradient, realistic..."
}

Exemple : Personnage récurrent

Contexte : Mascotte "Maître Renard"

  • 8 scènes différentes
  • Style ligne claire N&B
  • 2 variations/scène

16 assets prêts

Appuyez sur ↓ pour voir les exemples

Assets générés (1/2)

Renard qui partage

Renard qui partage

Renard enquêteur

Renard qui enquête

Assets générés (2/2)

Renard qui calcule

Renard qui calcule

8 scènes × 2 variations = 16 assets disponibles

Exemple de prompt

{
  "context": "Renard qui enquête",
  "prompt": "Simple black and white line art of a clever fox character standing upright as a detective, holding a magnifying glass and examining clues. The fox has a curious, investigative expression with a lightbulb icon above its head. Clean cartoon style with clear black outlines on white background, no shading...",
  "negative_prompt": "color, shading, gradient, realistic, photo, complex details..."
}

Limites importantes

PNG uniquement
(pas de SVG)

Pas d'image-to-image
(description textuelle)

Variabilité du style
(résultats variables)

Quota API limité
(selon plan Google)

Configuration requise
(clé API + auth)

Configuration nécessaire

Configuration déjà faite dans BFcours (GT_IA_MATHS) - pour info :

1
Créer projet GCP
2
Activer API Vertex AI

Documentation : .claude/skills/image-generator/README.md

Appuyez sur ↓ pour les étapes suivantes

Configuration (suite)

3
Auth : gcloud auth login
4
Configurer fichier .env
5
Installer dépendances Python

Tarification Google Vertex AI

Modèle Vitesse Qualité Coût Usage recommandé
imagen-4.0-fast Rapide Bonne ~$0.02/image Tests, itérations
imagen-4.0 Normale Très bonne ~$0.04/image Production standard
imagen-4.0-ultra Lente Excellente ~$0.08/image Qualité maximale

Exemple : Escape game avec 5 images × 2 variations = 10 générations

  • Modèle rapide : 10 × $0.02 = $0.20
  • Modèle standard : 10 × $0.04 = $0.40

Nouveau compte Google : $300 de crédits gratuits (90 jours)

Conseils d'utilisation

  • Privilégier le N&B
    pour impression quotidienne
  • 2-3 variations
    pour comparer
  • Tester avant
    1 impression → 30 copies
  • Être précis
    ✓ "wooden door with lock"
    ✗ "door"
  • Vérifier quota API
    avant génération massive

Structure du skill

.claude/skills/image-generator/ ├── SKILL.md # Instructions pour agents Claude ├── README.md # Documentation utilisateur ├── requirements.txt # Dépendances Python ├── .env.example # Template configuration ├── scripts/ │ ├── generate_prompt.py # Génération de prompts JSON │ ├── generate_images.py # Génération via Vertex AI │ └── ... ├── knowledge/ │ ├── styles.md # 5 styles disponibles documentés │ ├── prompting_guidelines.md # Guide de prompting efficace │ ├── ... ├── config/ │ ├── escape_game_medieval.json │ ├── ... └── examples/ └── escape_game.md # Exemple complet détaillé

L'agent : Un expert autonome

Le skill image-generator est utilisé par un agent dédié : image-user

Appuyez sur ↓ pour voir comment ça marche

Commande vague → Amélioration automatique

Vous donnez une commande vague

"Génère des images pour mon escape game sur les fractions"

L'agent améliore automatiquement

  • Analyse le contexte pédagogique
  • Choisit le style optimal
  • Crée des prompts experts
  • Configure les paramètres

Code automatique et expertise de l'agent

Code automatique

  • Fichiers JSON de prompts
  • Commandes de génération
  • Configuration des styles
  • Gestion des variations

Vous n'écrivez jamais de code !

L'agent connaît :

  • Bonnes pratiques prompting
  • Styles images éducatifs
  • Optimisation impression
  • Contraintes pédagogiques

Résultat : Vous obtenez des images professionnelles sans expertise technique

Pourquoi générer via agent ?

Modèle optimal

  • Qualité adaptée
  • Multi-fournisseurs

Prompts experts

  • Auto-génération
  • Résultats optimaux

L'agent fait le travail complexe pour vous !

Appuyez sur ↓ pour voir plus d'avantages

Avantages supplémentaires (1/2)

Expérimentation

  • Tests rapides
  • Comparaison styles

Auto-amélioration

  • Apprentissage continu
  • Prompts sauvegardés

Avantages supplémentaires (2/2)

Économie

  • Un seul compte API
  • Contrôle des coûts

Personnalisation

  • Styles sur mesure
  • Sans maîtriser l'API

Résultats typiques

Temps de création

  • Génération des prompts : 2 min
  • Génération des images : 2 min
  • Sélection : 5 min
  • Intégration LaTeX : 10 min

Total : ~20 minutes

Économies

  • Style minimal : ~85% encre en moins
  • Pour 30 copies : ~33 pages économisées
  • Coût API : $0.20-0.40 par projet

ROI exceptionnel !

vs création manuelle : gain de temps considérable

Autres cas d'usage possibles

Sciences

  • Schémas expériences
  • Illustrations bio
  • Diagrammes physiques

Géographie

  • Cartes thématiques
  • Paysages types
  • Infographies

Appuyez sur ↓ pour d'autres disciplines

Encore plus de possibilités

Histoire

  • Scènes historiques
  • Personnages
  • Frises chronologiques

Langues

  • Vocabulaire illustré
  • Scènes de dialogue
  • Culture visuelle

En résumé

Points forts

  • Création rapide d'images personnalisées
  • Cohérence visuelle garantie
  • Optimisation impression/coût
  • Gain de temps considérable
  • Flexibilité des styles

À garder en tête

  • Configuration initiale requise
  • Format PNG uniquement
  • Variabilité entre générations
  • Quota API à surveiller
  • Toujours tester avant impression

Idéal pour créer des ressources pédagogiques visuelles cohérentes et économiques

Ressources

Documentation

  • README.md - Guide utilisateur
  • SKILL.md - Instructions agents
  • knowledge/ - Guides détaillés
  • examples/ - Exemples pratiques

Liens utiles

  • Google Cloud Console
  • Docs Vertex AI
  • Tarification

Questions ?