Zetos

    Intelligence Artificielle

    L'IA, mais utile.

    L'IA est une révolution qui est là pour durer. Nous vous aidons à l'intégrer à votre solution existante ou à concevoir de nouveaux produits basés sur l'IA.

    Nos succès clients

    On construit nos propres produits. C'est pour ça qu'on sait construire les vôtres.

    L'IA est passée du démo-effet aux fondations produit. Ce qu'on construit pour vous tombe dans deux cas : (1) un produit dont l'IA est le cœur de valeur — agent, assistant, automatisation — ou (2) une brique IA ajoutée à un produit existant : recherche sémantique, classification, extraction de données. Si vous cherchez un POC pour un comité ou un PowerPoint, ce n'est pas pour nous. Si vous voulez quelque chose qui passe en production avec des utilisateurs réels et un coût d'inférence maîtrisé, on est faits pour bosser ensemble.

    Cas d'usage typiques

    Agent vertical métier

    Agent commercial, juridique ou RH avec RAG sur documents internes, mémoire de session et fallback humain.

    Extraction structurée

    Pipeline OCR + LLM pour transformer PDF, scans et factures en données structurées exploitables (devis, contrats, ID).

    Support produit IA

    Chatbot intégré au produit avec accès au contexte utilisateur, escalade humaine et observabilité de la qualité des réponses.

    Notre méthode en bref

    Quatre phases : (1) Audit usage — on identifie où l'IA crée vraiment de la valeur vs gimmick. (2) Choix de la stack — modèle propriétaire (Claude, GPT, Mistral) ou open-weight self-hosted (Llama, Qwen) selon contraintes RGPD, coût et latence. (3) Build itératif — on commence sur un use-case, on mesure (qualité, coût, latence), on étend. (4) Production — observabilité (LangSmith, Langfuse), guardrails, fallback, monitoring du drift. Pas d'expérimentation infinie : un milestone produit toutes les 2 semaines.

    Stack & technologies

    LLM : Claude 4 Opus / Sonnet / Haiku, GPT-4o / o1, Gemini 2.0, Mistral Large, Llama 3.3 et Qwen 2.5 self-hosted. Frameworks : LangChain, LangGraph, Vercel AI SDK, Mastra. Vector DB : pgvector, Qdrant, Pinecone. Observabilité : LangSmith, Langfuse, Helicone. Hébergement : Vercel, AWS Bedrock, Azure OpenAI selon l'exigence régulatoire.

    // 6 produits IA en production livrés en 2024-2025 (dont Moriarty, The Patch, CS Consulting)

    Questions fréquentes

    Combien coûte un produit IA en production ?+

    Le développement va de 30k€ pour une intégration ciblée à 150k€+ pour un agent vertical complet. Le coût d'inférence est plus important : 200 à 5 000€/mois selon volume et choix du modèle. On dimensionne ce poste dès le cadrage pour éviter les mauvaises surprises.

    Open-source ou API propriétaire ?+

    Pour 80% des cas, les API propriétaires (Claude, GPT, Mistral) gagnent en qualité, latence et time-to-market. On part en self-hosted (Llama, Qwen) quand RGPD/souveraineté l'imposent, ou quand le volume justifie l'investissement infra. Le choix se fait au cadrage, pas par dogmatisme.

    Comment vous gérez les hallucinations ?+

    Trois leviers : (1) RAG strict avec citations sources visibles à l'utilisateur, (2) validation structurée (JSON schema, function calling) plutôt que texte libre quand c'est possible, (3) garde-fous applicatifs et human-in-the-loop sur les décisions à fort impact. On mesure le taux d'hallucination en continu via évaluations automatisées.

    Quels sont les délais typiques ?+

    Un POC fonctionnel en 4-6 semaines, un MVP IA en production en 8-12 semaines, un produit IA mature en 4-6 mois. On livre en cycles de 2 semaines avec démo, donc vous voyez avancer dès la troisième semaine.

    Vous avez un projet ?

    Rien ne vaut une conversation pour élaborer ensemble les solutions adaptées.