Skip to content

Latest commit

 

History

History
433 lines (338 loc) · 16.3 KB

File metadata and controls

433 lines (338 loc) · 16.3 KB

Scripts Cloud Temple Documentation

Ce dossier contient les scripts d'automatisation pour la génération et la maintenance de la documentation Cloud Temple.

📋 Liste des Scripts

🚀 generate_models_doc.py

Générateur automatique de documentation LLMaaS

Génère automatiquement la documentation Markdown des modèles LLM as a Service à partir du fichier de configuration YAML.

Utilisation

# Via Python directement
python scripts/generate_models_doc.py

Fonctionnalités

  • 36 modèles automatiquement documentés
  • Formatage Docusaurus avec métadonnées
  • Logging coloré avec indicateurs de progression
  • Gestion d'erreurs robuste
  • Types Python pour la qualité du code
  • Documentation auto-générée avec timestamp

Source et Sortie

  • Entrée : memory-bank/models_config.yaml
  • Sortie : docs/llmaas/models.md

Exemple de sortie

🚀 Générateur de Documentation LLMaaS Cloud Temple
============================================================

ℹ️ Lecture du fichier memory-bank/models_config.yaml
✅ Configuration chargée: 36 modèles trouvés
ℹ️ 🔨 Génération de la documentation en cours...
✅ Documentation générée : docs/llmaas/models.md
ℹ️ 📊 6 modèles de grande taille
ℹ️ 🔧 34 modèles spécialisés
ℹ️ 🎯 6 cas d'usage documentés

🎉 Documentation générée avec succès !

🐍 translate_py/translate.py (Recommandé)

Système de traduction moderne avec détection intelligente des changements

Système de traduction Python avancé utilisant l'API Cloud Temple LLMaaS avec une interface utilisateur moderne, détection automatique des changements par hash SHA-256, et gestion optimisée de la concurrence.

✨ Fonctionnalités Avancées

  • 🎨 Interface Rich : Affichage moderne avec barres de progression en temps réel
  • Concurrence optimisée : Pool de workers pour utilisation maximale de l'API
  • 📊 Statistiques avancées : Tokens IN/OUT, vitesse tokens/s en temps réel
  • 🔍 Détection intelligente : Hash SHA-256 pour détecter les fichiers modifiés
  • 🚫 Support .notranslation : Exclusion automatique de répertoires
  • 🔄 Détection automatique : Racine du projet détectée automatiquement
  • 📋 Métadonnées intelligentes : Traduction incrémentale optimisée
  • 🎯 Mode debug : Logs détaillés avec comparaison des hash
  • Mode initialisation : Génération et gestion des métadonnées

Installation et Configuration

# Installation des dépendances
cd scripts/translate_py
pip install -r requirements.txt

# Configuration (copier depuis .env.example)
cp .env.example .env
# Éditer .env avec vos paramètres

Variables d'environnement (.env)

# API Configuration
CLOUDTEMPLE_API_KEY=your_api_key_here
CLOUDTEMPLE_API_URL=https://api.ai.cloud-temple.com/v1/chat/completions
TRANSLATION_MODEL=qwen3:30b-a3b

# Performance Settings
CONCURRENT_TRANSLATIONS=8         # Nombre de traductions simultanées
MAX_TOKENS_PER_BLOCK=5000        # Taille max des blocs de traduction
MAX_RETRIES=5                    # Nombre de tentatives par traduction
RETRY_DELAY=5.0                  # Délai entre tentatives (secondes)

# Model Parameters
TRANSLATION_TEMPERATURE=0.1      # Créativité du modèle (0.0-2.0)
TRANSLATION_TOP_P=1.0           # Nucleus sampling (0.0-1.0)

Utilisation

# Depuis le répertoire racine ou scripts/translate_py/
python translate.py [OPTIONS]

# Exemples d'utilisation
python translate.py --dry-run                    # Simulation
python translate.py --force                      # Force retraduction
python translate.py --lang=en                    # Traduction anglaise uniquement
python translate.py --debug                      # Mode debug avec logs détaillés
python translate.py --test-api                   # Test de connexion API

Options Disponibles

  • --dry-run : Mode simulation sans modifications
  • --force : Force la retraduction de tous les fichiers
  • --init : Mode initialisation des métadonnées
  • --translate-missing : Traduit seulement les fichiers manquants
  • --lang=<code> : Langue cible spécifique (en, de, es, it)
  • --debug : Mode debug avec logs détaillés
  • --no-debug-system-prompt : Masque le prompt système en debug
  • --test-api : Test la connexion API et affiche le résultat

Fonctionnalité .notranslation

Placez un fichier .notranslation dans un répertoire pour forcer la copie (au lieu de la traduction) de tous les fichiers de ce répertoire :

# Exemple : Licences LLM non traduisibles
docs/llmaas/licences/.notranslation

# Résultat : Tous les .md dans licences/ sont copiés identiques
# dans toutes les langues au lieu d'être traduits

Interface Utilisateur

L'interface moderne affiche en temps réel :

🇫🇷 Cloud Temple Documentation Translation 🌍

📋 Configuration
🗣️ Langues Cibles

⏱️ 00:02:45 | 🚀 PRODUCTION | 🗣️ en, de, es, it

📊 Progression          │ 📈 Statistiques
════════════════════════ │ ═══════════════════
🌍 Progression Globale   │ ✅ Traduits    : 42
█████████████░░░ 78%     │ 📋 Copiés     : 8
                        │ ❌ Échecs     : 0
api.md → en             │ 
█████████░░░ 3/4        │ 🔤 Tokens IN  : 125,847
                        │ 📤 Tokens OUT : 98,342
📝 Logs Récents          │ ⚡ Tokens/s   : 1,247.3
════════════════════════ │
✅ Traduction: api.md → en
🔄 Traduction: concepts.md → de

Workflow de Détection des Changements

1. Mode Initialisation (--init)

# Génère les métadonnées pour la première fois
python translate.py --init

# Initialise ET traduit les fichiers manquants
python translate.py --init --translate-missing

2. Détection Automatique

# Vérifie quels fichiers ont changé
python translate.py --dry-run --debug

# Exemple de sortie :
# [DRY RUN] Contenu modifié: llmaas/concepts.md → en
#   Hash actuel : 66e0869319196d8d3009c79c3e994e9d4c736677962502ffb5ded09d637284be
#   Hash stocké : 99033f972d83789a35fb75077e53e170df0b14b9fd465ecdbd691bdacdca2b74

3. Traduction Intelligente

# Traduit uniquement les fichiers modifiés
python translate.py

# Les hash sont automatiquement mis à jour après traduction réussie

Architecture du Système

scripts/translate_py/
├── translate.py              # 🚀 Script principal
├── config.py                # ⚙️ Configuration et environnement
├── models.py                # 📋 Modèles de données
├── ui.py                   # 🎨 Interface utilisateur Rich
├── translator.py            # 🌐 Moteur de traduction
├── file_manager.py          # 📁 Gestion fichiers et métadonnées
├── translation-meta.json    # 🔍 Métadonnées et hash SHA-256
├── requirements.txt         # 📦 Dépendances Python
├── .env.example            # 📝 Template configuration
└── .env                   # 🔒 Configuration locale

Détection des Changements par Hash SHA-256

Le système utilise des hash SHA-256 pour une détection précise :

✅ Fichier modifié : Hash différent → Traduction nécessaire

Hash stocké : 99033f972d83789a35fb75077e53e170df0b14b9fd465ecdbd691bdacdca2b74
Hash actuel : 66e0869319196d8d3009c79c3e994e9d4c736677962502ffb5ded09d637284be
→ TRADUCTION REQUISE

✅ Fichier inchangé : Hash identique → Ignore

Hash stocké : 99033f972d83789a35fb75077e53e170df0b14b9fd465ecdbd691bdacdca2b74
Hash actuel : 99033f972d83789a35fb75077e53e170df0b14b9fd465ecdbd691bdacdca2b74
→ AUCUNE ACTION

Avantages :

  • Précision absolue : Détecte le moindre changement
  • Performance optimale : Évite les traductions inutiles
  • 🔒 Intégrité : Garantit la cohérence des traductions
  • 📊 Traçabilité : Logs détaillés des décisions

🌐 oldies/translate.js (Legacy - Archivé)

Script de traduction multilingue avec Cloud Temple LLMaaS

⚠️ Archivé : Script déplacé dans oldies/. Utilisez translate_py/translate.py pour toutes les nouvelles traductions.

Script Node.js legacy pour la traduction automatique de la documentation Markdown (fichiers .md) du français vers d'autres langues en utilisant l'API Cloud Temple LLMaaS. Ce script est désormais archivé et remplacé par le système Python moderne.

Configuration Requise

Avant d'utiliser le script, vous devez configurer vos identifiants d'API et d'autres paramètres via un fichier .env placé à la racine de votre projet Docusaurus. Un fichier d'exemple scripts/.env.example est fourni. Copiez-le en .env à la racine et modifiez les valeurs :

cp scripts/.env.example .env
# Ensuite, éditez .env avec vos informations

Variables d'environnement principales :

  • CLOUDTEMPLE_API_KEY: (Obligatoire) Votre clé API pour le service Cloud Temple LLMaaS.
  • CLOUDTEMPLE_API_URL: (Optionnel) URL de l'API LLMaaS. Par défaut : https://api.ai.cloud-temple.com/v1/chat/completions.
  • TRANSLATION_MODEL: (Optionnel) Modèle LLM à utiliser. Par défaut : Qwen/Qwen3-30B-A3B-FP8.
  • CONCURRENT_TRANSLATIONS: (Optionnel) Nombre de fichiers à traiter en parallèle. Par défaut : 4.
  • TRANSLATION_TEMPERATURE: (Optionnel) Température pour la génération. Par défaut : 1.
  • TRANSLATION_TOP_P: (Optionnel) Top_p pour la génération (nucleus sampling). Par défaut : 1.
  • DOC_BASE_PATH: (Optionnel) Chemin de base de la documentation si le script n'est pas lancé depuis la racine. Par défaut : .

Utilisation

Exécutez le script depuis la racine de votre projet Docusaurus :

node scripts/translate.js [options]

Options de Ligne de Commande

  • --dry-run: Simule l'exécution sans modifier de fichiers ni appeler l'API. Affiche ce qui serait fait.
  • --force: Force la retraduction de tous les fichiers, même s'ils semblent à jour.
  • --init: Mode initialisation. Calcule et stocke les hachages des fichiers sources français existants dans translation-meta.json sans traduire. Si des traductions existent déjà, leur hachage est associé au source français actuel.
    • --init --translate-missing: En mode initialisation, traduit également les fichiers pour lesquels une traduction n'existe pas encore.
  • --translate-missing: En mode de traduction normal (pas --init), traduit uniquement les fichiers pour lesquels une traduction n'existe pas encore, sans vérifier les hachages des traductions existantes.
  • --lang=<code>: Cible une langue spécifique pour la traduction (ex: --lang=en). <code> peut être en, de, es, it.

Langues Supportées

  • 🇫🇷 Français (langue source, depuis le dossier docs/)
  • 🇬🇧 Anglais (code: en)
  • 🇩🇪 Allemand (code: de)
  • 🇪🇸 Espagnol (code: es)
  • 🇮🇹 Italien (code: it)

Les traductions sont placées dans i18n/<code>/docusaurus-plugin-content-docs/current/.

Fonctionnement

  1. Le script scanne le dossier docs/.
  2. Pour chaque fichier .md, il calcule un hachage de son contenu.
  3. Il compare ce hachage avec celui stocké dans scripts/translation-meta.json pour chaque langue cible.
  4. Si un fichier a été modifié (hachage différent) ou si la traduction est manquante (et que l'option appropriée est utilisée), le contenu est envoyé à l'API Cloud Temple LLMaaS pour traduction.
  5. La traduction est sauvegardée dans le dossier i18n/ correspondant.
  6. Le nouveau hachage du fichier source est enregistré dans translation-meta.json.
  7. Les fichiers non .md sont copiés dans les dossiers i18n/ respectifs s'ils n'existent pas ou s'ils sont différents.

🔧 Configuration yarn

Les scripts sont intégrés dans package.json pour faciliter l'utilisation :

{
  "scripts": {
    "generate:models": "python scripts/generate_models_doc.py",
    "generate:docs": "yarn generate:models"
  }
}

📁 Architecture des Fichiers

scripts/
├── README.md                    # 📋 Ce fichier
├── generate_models_doc.py       # 🚀 Générateur LLMaaS
└── translate_py/                # 🐍 Système de traduction moderne
    ├── translate.py             # 🚀 Script principal
    ├── translation-meta.json    # 🔍 Métadonnées et hash SHA-256
    ├── config.py               # ⚙️ Configuration
    ├── models.py               # 📋 Modèles de données
    ├── ui.py                   # 🎨 Interface utilisateur
    ├── translator.py           # 🌐 Moteur de traduction
    ├── file_manager.py         # 📁 Gestion fichiers
    ├── requirements.txt        # 📦 Dépendances
    ├── .env.example           # 📝 Template config
    └── .env                   # 🔒 Configuration locale

oldies/
└── translate.js                 # 🌐 Script Node.js archivé

🎯 Workflow de Documentation

Génération LLMaaS

  1. Éditer : memory-bank/models_config.yaml
  2. Générer : yarn generate:models
  3. Vérifier : Documentation mise à jour dans docs/llmaas/models.md

Processus de Traduction

  1. Source : Créer contenu en français dans /docs/
  2. Traduire : python scripts/translate_py/translate.py
  3. Vérifier : Contenu traduit dans /i18n/[langue]/

🐍 Dépendances Python

Le script generate_models_doc.py nécessite :

# Dépendances requises
pip install pyyaml

# Ou via requirements.txt (à créer si nécessaire)
pip install -r requirements.txt

🔍 Dépannage

Erreurs communes

FileNotFoundError: models_config.yaml

# Vérifier que le fichier existe
ls memory-bank/models_config.yaml

# S'assurer d'être dans le bon répertoire
cd /path/to/docs/
yarn generate:models

ModuleNotFoundError: No module named 'yaml'

# Installer PyYAML
pip install pyyaml

Permission denied

# Rendre le script exécutable
chmod +x scripts/generate_models_doc.py

Validation de sortie

Le fichier généré docs/llmaas/models.md doit contenir :

  • ✅ En-tête Docusaurus avec métadonnées
  • ✅ Avertissement de génération automatique
  • ✅ Statistiques globales (36 modèles)
  • ✅ Sections "Modèles de Grande Taille" et "Modèles Spécialisés"
  • ✅ Cas d'usage recommandés
  • ✅ Informations de génération en pied de page

📊 Métriques de Performance

Script generate_models_doc.py

  • Temps d'exécution : < 5 secondes
  • Fichiers traités : 1 YAML → 1 Markdown
  • Taille sortie : ~150KB (36 modèles documentés)
  • Encoding : UTF-8 (support multilingue)

🚀 Évolutions Futures

Prochaines fonctionnalités planifiées

  • Génération API : Script pour api.md depuis OpenAPI spec
  • Génération use-cases : Script pour use-cases.md depuis YAML
  • Validation automatique : Vérification cohérence YAML
  • CI/CD Integration : Hooks Git pour génération automatique
  • Template engine : Support de templates Jinja2 personnalisables

Améliorations en cours

  • Requirements.txt : Dépendances Python formalisées
  • Unit tests : Tests automatisés pour les scripts
  • Configuration : Fichier de config central pour tous les scripts
  • Logging : Logs persistants pour debug

📞 Support

Pour toute question sur les scripts :

  1. Documentation : Consulter ce README
  2. Issues : Créer une issue dans le repository
  3. Logs : Vérifier la sortie colorée des scripts
  4. Team : Contacter l'équipe Cloud Temple Documentation

🎉 Contribution

Ajouter un nouveau script

  1. Créer : scripts/nouveau_script.py
  2. Documenter : Ajouter docstrings et types
  3. Tester : Vérifier le bon fonctionnement
  4. Intégrer : Ajouter dans package.json
  5. Documenter : Mettre à jour ce README

Standards de code

  • Python : Suivre PEP 8, utiliser type hints
  • JavaScript : Suivre ESLint, utiliser JSDoc
  • Documentation : Docstrings complètes
  • Logs : Utiliser les couleurs pour la lisibilité
  • Erreurs : Gestion robuste avec messages clairs

Dernière mise à jour : 05/06/2025 Scripts maintenus par l'équipe Cloud Temple Documentation