Google lance un modèle d'IA ouvert pour les développeurs du secteur de la santé
Selon ses développeurs, MedGemma 27B viendra compléter les modèles 4B Multimodal et 27B en mode texte, précédemment présentés dans le package MedGemma. 4B Multimodal est un service de vision par ordinateur. Plus tôt dans l'étude, un médecin américain certifié a jugé 81 % des rapports de radiographie thoracique préparés par 4B Multimodal suffisamment précis. Selon Google, qui s'appuie sur des évaluations internes, MedGemma 27B en mode texte figure parmi les « petits modèles ouverts les plus performants du référentiel de connaissances et de raisonnement médicaux MedQA [norme de comparaison des performances – Vademecum] ». MedQA est une base de données multilingue de questions d'examens d'autorisation d'exercer la médecine aux États-Unis. Le modèle linguistique de Google obtient un taux de réussite de 87,7 %.
MedGemma est une collection de modèles d'IA open source conçus pour être utilisés dans divers domaines médicaux. Cet ensemble de services est intégré au projet Health AI Developer Foundations (HAI-DEF), un vaste projet lancé en novembre 2024 pour aider les développeurs à créer et implémenter des services d'IA dans les systèmes de santé. Google développe de nombreux modèles intégrés à HAI-DEF à partir de sa famille d'IA légères Gemma. Une technologie similaire a été utilisée pour le développement de MedGemma 4B et MedSigLIP, ce qui permettra d'adapter les nouveaux modèles à un usage mobile. De plus, la préservation des capacités non médicales de Gemma permet aux nouveaux algorithmes de résoudre efficacement des problèmes combinant des informations spécialisées et non spécialisées, tout en conservant la capacité de suivre des instructions et de travailler dans des langues autres que l'anglais.
MedSigLIP est décrit par Google comme un codeur d'images léger contenant seulement 400 millions de paramètres. Le modèle a été optimisé pour plusieurs types d'imagerie médicale : radiographies thoraciques, résultats de tests épicutanés, images dermatologiques et images du fond d'œil. Les développeurs ont identifié trois principales utilisations de MedSigLIP : la création de modèles basés sur des services pour la classification d'images médicales, la classification d'images sans exemples d'apprentissage spécifiques et la recherche d'images visuellement ou sémantiquement similaires dans de grandes bases de données.
« Parce que la collection MedGemma est ouverte, ses modèles peuvent être téléchargés, complétés et personnalisés pour répondre aux besoins spécifiques des développeurs », a conclu Google.
En décembre 2024, Smart Engines, une entreprise russe spécialisée dans le développement de l'IA, a annoncé avoir obtenu un brevet aux États-Unis pour une technologie permettant de réduire la charge de radiation d'un patient lors d'une tomodensitométrie. Le document a été publié par l'Office américain des brevets et des marques le 17 décembre. Les employés de Smart Engines ont commencé à travailler sur le projet en 2018 ; une demande de brevet en Russie a été déposée en 2021, mais elle est toujours à l'étude. Selon les développeurs, l'IA permet une réduction moyenne de la charge de radiation de 15 %.
vademec