#IA #SpeechAI #API
🇫🇷 Mistral AI, startup française, vient de dévoiler, le 15 juillet 2025, Voxtral, une famille de modèles vocaux open-source (licence Apache 2.0) disponible en deux tailles : 24 milliards de paramètres (production) et 3 milliards (local/edge).
Quoi ?
C’est bien plus qu’un transcripteur : en plus de la SA – Speech-to-Text – Voxtral intègre la compréhension (Q&A, résumés, détection de la langue), et peut déclencher des fonctions ou appels API à la voix, le tout sur 32 000 tokens (~30 min audio) .
Où & pour quel secteur ?
Usage : cloud et on-premises.
Langues prises en charge : anglais, français, espagnol, portugais, hindi, allemand, italien, néerlandais… idéal pour les PME/ETI internationales.
Combien ?
💰 0,001 $ par minute via API.

💡 Pourquoi Voxtral intéresse les entreprises ?
- 💸 Coût divisé par deux : moins de la moitié du tarif des API propriétaires (OpenAI, ElevenLabs…) .
- Tout-en-un : transcription + compréhension sémantique + fonctions déclenchées à la voix, élimine la chaîne ASR → LLM, donc intégration simplifiée et moins de latence.
- Flexibilité & contrôle : open-source + autohébergement + fine-tuning domaine + support ingénieur prioritaire = personnalisation pour chatbot vocaux, apps mobiles, centres d’appels…
- Multilingue & long contexte : parfait pour les applications globales avec long contenu audio.
📥 API Voxtral – Usages immédiats
🎧 3 façons d’essayer Voxtral dès aujourd’hui :
🔹 Téléchargement local
Envie d’autonomie ? Téléchargez Voxtral (24B) ou Voxtral Mini (3B) directement sur Hugging Face et exécutez-les en local, sur vos propres serveurs ou appareils edge. Idéal pour les intégrations sensibles ou déconnectées.
🔹 API ultra-simple & accessible
Ajoutez une intelligence vocale à vos apps en quelques lignes de code grâce à l’API Voxtral. À partir de 0,001 $/minute, vous obtenez transcription, résumé ou déclenchement d’action vocale, en temps réel.
🔹 Testez sur “Le Chat”
Jouez avec Voxtral en vocal sur Le Chat (disponible sur web & mobile). Enregistrez ou uploadez un audio, obtenez une transcription, posez vos questions ou demandez un résumé. Déploiement global prévu dans les prochaines semaines.
👩💼 Ton appli vocale + Voxtral = Super combo
- Assistant mobile vocal : compréhension contextuelle, résumé, déclenchement d’actions (ex : rappel, ticket…).
- Centre d’appel : résumé automatique des conversations, insertion de workflows (ex : « envoyer mail », « ouvrir ticket ») sans développement LLM séparé.
- Objets connectés / IoT : edge computing avec le modèle Mini ; comprend la voix et exécute commandes locales (ex : domotique, industriel).
- Multilingue & global : un seul modèle pour plusieurs marchés, sans surcoût de licence.
🔧 En résumé
- Voxtral est disponible dès maintenant, en open-source et via API commerciale.
- Il offre transcription+compréhension+fonctionnalités API dans un seul modèle, à un coût imbattable (~0.001 $/min) et avec open-source clé en main.
- Idéal pour intégrer la voix dans des applications internes sans faire de compromis sur la qualité ni sur le budget.