Whisper
Le modèle open source de transcription d'OpenAI. Tourne en local (whisper.cpp, faster-whisper). Précision quasi-humaine, gratuit, pas de remontée cloud. Indispensable pour transcription RGPD-friendly (médecins, juristes, données sensibles).
Les médecins passent un tiers de leur temps sur de l'admin. L'IA bien choisie récupère 1 à 2h par jour de consultation effective.
Le modèle open source de transcription d'OpenAI. Tourne en local (whisper.cpp, faster-whisper). Précision quasi-humaine, gratuit, pas de remontée cloud. Indispensable pour transcription RGPD-friendly (médecins, juristes, données sensibles).
LLM médical open source 7B et 70B basé Llama-2, pré-entraîné sur PubMed et les guidelines cliniques. Référence académique de l'EPFL pour fine-tuner ses propres modèles santé.
Pipeline spaCy pour textes biomédicaux par Allen AI : tokenisation, NER (gènes, médicaments, maladies), résolution UMLS. Pour extraire des entités cliniques structurées d'un compte-rendu.
NLP clinique en Python : détection de sections, négation, contexte temporel. Multilingue, support du français. Le compagnon naturel de ScispaCy pour la pratique cabinet.
Détection et anonymisation automatique de données personnelles (PII/PHI) en 18 catégories HIPAA. License MIT, prêt prod. Indispensable avant d'envoyer un texte santé ou juridique à un LLM cloud.
Ambient scribe MIT : orchestre Whisper en local + un LLM (Claude ou Ollama offline) pour transcrire la consultation et générer le compte-rendu. Stack self-hostable RGPD-native. Projet jeune mais actif.
LLM médical multilingue basé Mistral-7B, co-développé par les universités d'Avignon et Nantes. Perle française open source entraînée sur PubMed. Pour POCs cliniques en FR, statut recherche.
En 2024 c'était de la dictée vocale. En 2025 des assistants consultation en bêta. En 2026 on parle de scribe ambient qui écoute la consult, structure le compte-rendu, propose le courrier et met à jour le dossier patient — pendant que le médecin regarde son patient.
Le bénéfice concret est mesurable : 1h à 2h par jour récupérées sur l'admin. Soit 4 à 8 consultations en plus par semaine, soit la fin du compte-rendu du soir à 22h. Et un point clé : les briques open source 2026 sont assez matures pour monter une stack 100% self-hostable, donc RGPD-native par construction.
Quatre couches dans un pipeline cabinet, quatre familles de briques open source. Tu peux les assembler toi-même (technique mais maître de ta data) ou passer par un SaaS HDS (rapide mais cher et fermé).
Whisper d'OpenAI reste l'étalon — précision quasi-humaine en FR, tourne en local via whisper.cpp ou faster-whisper, zéro remontée cloud. Pour orchestrer un ambient scribe complet (audio → compte-rendu structuré), OpenScribe combine Whisper + un LLM (Claude API ou Ollama offline) sous license MIT.
ScispaCy d'Allen AI et medspaCy sont les deux pipelines NLP de référence en santé : détection d'entités (médicaments, maladies, gènes), résolution UMLS, négation, contexte temporel. medspaCy supporte le français — c'est ce qui te permet de transformer une transcription brute en compte-rendu structuré exploitable.
Pour un LLM spécialisé santé open source, Meditron (EPFL, 7B/70B Llama-2) et BioMistral (Mistral-7B, perle française co-développée par Avignon et Nantes) sont les références. Statut recherche, à utiliser en POC. Pour la prod, un LLM généraliste (Claude, ChatGPT) reste plus performant — à condition d'anonymiser avant.
Microsoft Presidio fait le boulot : 18 catégories d'identifiants HIPAA détectés et remplacés, license MIT, prêt prod. C'est la brique qui te permet d'envoyer un texte à un LLM cloud sans risque ordinal — à condition de la passer en premier.
Une donnée santé identifiante envoyée à un LLM grand public, c'est une fuite RGPD et un risque ordinal. La règle simple : si tu pourrais pas envoyer ça par mail non chiffré, tu peux pas le coller dans ChatGPT. Passe systématiquement par Presidio en amont, ou héberge ta stack en local (Whisper + Ollama + un LLM open source).
Meditron et BioMistral sont solides académiquement mais restent en deçà de Claude ou GPT en qualité de génération sur du français clinique. Bons pour comprendre la mécanique, pour des POCs ou pour fine-tuner — à éviter pour produire des comptes-rendus livrés au patient sans relecture.
Les vidéos d'éditeurs montrent une consultation propre avec un patient qui parle clair. La réalité : accent, bruit, plusieurs personnes qui parlent, jargon métier. Teste 2 semaines en vrai avec tes patients avant d'industrialiser une stack.
Oui sur la transcription et l'anonymisation : Whisper + Presidio + medspaCy tournent en local, RGPD-natif. Sur la génération de compte-rendu, les LLMs santé open source (Meditron, BioMistral) restent en deçà de Claude ou ChatGPT en français clinique — donc en pratique, soit on accepte cette limite, soit on anonymise via Presidio avant d'appeler un LLM cloud.
Les outils open source self-hostés sont RGPD-conformes par construction : aucune donnée ne sort de ton infra. HDS est une certification d'hébergeur, pas du logiciel — héberge la stack chez un cloud certifié HDS (OVH, Outscale, Scaleway) et le tour est joué. Les LLMs cloud (Claude, ChatGPT) restent à proscrire sur données identifiantes, sauf à passer Presidio en amont.
L'IA structure et documente, elle ne diagnostique pas. Un ambient scribe écoute, propose un compte-rendu — le médecin valide, corrige, signe. La valeur est sur le temps gagné, pas sur l'autonomie. Les outils qui prétendent diagnostiquer en 2026 sortent du cadre médical légal en France.
Whisper en local pour transcrire tes dictées à la fin de chaque consult. C'est 0€, ça tourne sur un Mac M1, ça met 30 secondes pour 5 minutes d'audio. Tu mesures le gain de temps sur 2 semaines avant d'investir dans une stack plus complète (ajout de Presidio pour anonymiser, puis OpenScribe pour automatiser le compte-rendu).
Mes vrais workflows, mes vrais ratés, les outils que je teste, ce que j'ai appris en mission. Désinscription en un clic, pas de spam, pas de pub.