IA Souveraine — Hébergé en France

L'IA puissante sans les coûts absurdes

Une API compatible OpenAI hébergée sur hardware dédié en France. Aucun partage de données. Aucune surprise sur la facture. Des modèles open-source de pointe à des prix imbattables.

→ Démarrer gratuitement ⌥ Voir la documentation

30×

Moins cher qu'OpenAI

100%

Données en France

24/7

Disponibilité

TERMINAL — test api

$ curl https://api.maestrostudio.fr/v1/chat/completions

-H "Authorization: Bearer mst-xxxx"

-d '{"model":"qwen2.5-14b","messages":[...]}'

# Réponse en 187ms

{

"model": "qwen2.5-14b",

"choices": [{ "message": { "content":

"Bonjour ! Comment puis-je vous aider ?"

}

Nouveau service

Audio → Texte en secondes

Whisper Large-v3 Turbo — le meilleur modèle de transcription au monde, disponible directement depuis votre navigateur.

🎙️

50+ langues supportées

Français, anglais, espagnol, arabe, chinois... Détection automatique de la langue.

📄

Formats multiples

Texte brut, sous-titres .SRT, timestamps — téléchargement immédiat.

🔒

100% privé

Vos fichiers sont traités sur notre serveur en France et supprimés après transcription.

🎙️ Essayer la transcription →

TRANSCRIPTION — réunion_equipe.mp3

// Résultat en 4.2 secondes

"Bonjour à tous, merci de vous être connectés.

Aujourd'hui nous allons discuter des résultats

du troisième trimestre et des objectifs pour

le quatrième trimestre de cette année..."

✓ TXT ✓ SRT ✓ Timestamps

Modèles disponibles

De l'inférence. Pas du cloud.

Modèles open-source de dernière génération, tournant sur RTX 3090 dédiée. Aucun cold start. Aucune mise en file d'attente.

LLM · Texte

Qwen 2.5 14B

Modèle de langage multilingue haute performance. Excellent en français, code, analyse et raisonnement général.

14BParamètres

8kContexte

Q4Quantisation

LLM · Raisonnement

DeepSeek-R1 14B

Spécialisé raisonnement avancé, mathématiques et code complexe. Performances comparables à GPT-4o sur les benchmarks.

14BParamètres

8kContexte

Q4Quantisation

Audio · Transcription

Whisper Large-v3

Transcription audio multilingue state-of-the-art. Support de plus de 50 langues avec une précision exceptionnelle.

1.5BParamètres

50+Langues

FP16Précision

Image · Génération

Flux.1 Schnell

Génération d'images photo-réalistes ultra-rapide. Prochainement disponible sur la plateforme.

12BParamètres

<3sGénération

SoonStatut

Comparatif

Pourquoi pas OpenAI ?

Parce que payer 0,15€ pour 1000 tokens quand on peut en avoir pour 0,0003€, c'est une question de bon sens.

Concurrent GPT-4o

Prix input / 1M tokens5,00 €

Prix output / 1M tokens15,00 €

Données hébergéesUSA 🇺🇸

ConfidentialitéUtilisées pour training

RGPD natifNon

Latence moyenne800ms+

Rate limitsStricts

        Maestro API
        Qwen 2.5 14B
      
Prix input / 1M tokens0,30 €
Prix output / 1M tokens0,60 €
Données hébergéesFrance 🇫🇷
ConfidentialitéDonnées non partagées
RGPD natifOui
Latence moyenne< 200ms
Rate limitsFlexibles

Tarification

Simple. Prévisible. Honnête.

Crédits prépayés ou abonnement mensuel. Aucune surprise, aucun engagement.

// FREE

Découverte

^€0_/mois

Pour tester l'API et valider votre use case.

100k tokens offerts
Accès à tous les modèles
1 clé API
Support communautaire

Créer un compte

// POPULAIRE

Starter

^€19_/mois

Pour les développeurs et petits projets.

20€ de crédits inclus
Tous les modèles LLM + Audio
5 clés API
2M tokens/minute
Support email

Démarrer

// PRO

Pro

^€49_/mois

Pour les startups et équipes en croissance.

55€ de crédits inclus
Priorité GPU garantie
Clés API illimitées
10M tokens/minute
Support prioritaire

Passer Pro

// BUSINESS

Business

^€149_/mois

Pour les entreprises avec des besoins intensifs.

180€ de crédits inclus
SLA 99.5% uptime
Usage illimité
Fine-tuning sur demande
Support dédié + appel

Nous contacter

Documentation

Compatible OpenAI. Migration en 30s.

Changez juste l'URL de base. Votre code existant fonctionne sans modification.

Python

JavaScript

cURL

# Installez : pip install openai
from openai import OpenAI

client = OpenAI(
    base_url="https://api.maestrostudio.fr/v1",
    api_key="mst-votre-cle-api"
)

response = client.chat.completions.create(
    model="qwen2.5-14b",
    messages=[{"role": "user", "content": "Bonjour !"}]
)

print(response.choices[0].message.content)
    

// npm install openai
import OpenAI from 'openai';

const client = new OpenAI({
  baseURL: 'https://api.maestrostudio.fr/v1',
  apiKey: 'mst-votre-cle-api',
});

const response = await client.chat.completions.create({
  model: 'qwen2.5-14b',
  messages: [{ role: 'user', content: 'Bonjour !' }],
});

console.log(response.choices[0].message.content);
    

curl https://api.maestrostudio.fr/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer mst-votre-cle-api" \
  -d '{
    "model": "qwen2.5-14b",
    "messages": [
      {"role": "user", "content": "Bonjour !"}
    ]
  }'
    

Témoignages

Ils ont fait le switch.

Des développeurs et startups qui ont remplacé OpenAI par Maestro API.

On a divisé notre facture IA par 25 en migrant vers Maestro. La qualité du modèle est bluffante pour le prix, et le fait que les données restent en France c'est un vrai argument commercial avec nos clients.

Thomas L.

CTO — Startup LegalTech, Paris

Migration en moins d'une heure. On a juste changé l'URL de base dans notre config. Aucune modification de code. La latence est même meilleure qu'avec OpenAI pour nos use cases.

Sarah M.

Lead Dev — Agence IA, Lyon

Enfin une API IA qui respecte le RGPD nativement. Pour notre cabinet médical c'était non-négociable. Maestro coche toutes les cases : souveraineté, prix, qualité.

Dr. Renard

Directeur — Cabinet médical, Bordeaux

FAQ

Questions fréquentes.

Oui, à 100%. L'endpoint est compatible avec le format OpenAI /v1/chat/completions. Il suffit de changer la base URL et votre clé API. Tous les SDK OpenAI (Python, JS, etc.) fonctionnent sans modification.

Non. Vos requêtes ne sont jamais utilisées pour entraîner quoi que ce soit. Elles ne sont pas partagées avec des tiers. Les logs sont conservés 30 jours à des fins de débogage puis supprimés définitivement.

Le service tourne 24h/24, 7j/7 sur hardware dédié. Le SLA Business garantit 99.5% d'uptime. En cas de maintenance planifiée, vous êtes prévenus 48h à l'avance.

Deux options : crédits prépayés (pay-as-you-go, minimum 5€) ou abonnement mensuel avec crédits inclus. Les crédits non utilisés sont reportés au mois suivant. Paiement par CB via Stripe, facture disponible dans votre dashboard.

Oui, tous les plans incluent un usage commercial. Les modèles utilisés (Qwen, Whisper) sont sous licences open-source permettant l'usage commercial.

Le fine-tuning est disponible sur le plan Business et en option sur le plan Pro. Contactez-nous pour discuter de votre use case et obtenir un devis personnalisé.