IA en Medicina: ¿Son 'ChatGPT' y 'Gemini' fiables para tu salud?

Compartir esto:

MADRID, 19 Jun. (Agencias) –

Un estudio internacional, con participación de la Universidad Rey Juan Carlos (URJC) de Madrid y del madrileño Hospital Universitario de Henares, en Coslada, ha concluido que el uso de la Inteligencia Artificial (IA) para ampliar información médica «es útil«, aunque «su fiabilidad es variable y siempre debe contrastarse con un profesional sanitario».

Según ha indicado el citado centro académico, este trabajo, desarrollado también por investigadores de los británicos King’s College y Universidad Solent de Londres, y publicado en la revista especializada ‘Artificial Intelligence in Medicine’, «ha evaluado cómo responden ‘ChatGPT’ o ‘Gemini’ a las preguntas de los ciudadanos sobre temas como la epidural».

Así, ha constatado que «para responder a este tipo de preguntas, el modelo con mejor rendimiento global sería ‘ChatGPT’, seguido de ‘Gemini'», ha señalado la URJC, que ha añadido que, «no obstante, la calidad de estos modelos depende de la métrica evaluada». «Pese a que ‘ChatGPT’ es el que demuestra mejores datos, dos modelos medianos, ‘OpenChat’ y ‘Phi-3’, consiguen resultados comparables, mejorando significativamente otros modelos de gran tamaño», ha sostenido la investigadora principal de este estudio, Marina del Barrio.

A juicio de esta última, ello «destaca la importancia de los datos con los que se entrenan frente al tamaño del modelo». Al respecto, esta universidad española ha apuntado que la investigación «también se ha centrado en distinguir entre las respuestas que pueden ser confiables de aquéllas que pueden confundir a los pacientes y, potencialmente, alterar su toma de decisiones».

«La dificultad de las preguntas también afecta a la calidad de las respuestas, siendo las más complejas o controvertidas las que obtienen peores resultados», ha continuado, para añadir que «esto hace que los modelos sean menos fiables al responder preguntas sensibles». «Para recabar toda la información, el equipo científico estableció 10 preguntas para planteárselas a los diferentes modelos de lenguaje, cada una reformulada de distintas maneras», ha explicado.

COMPROBAR LA HABILIDAD DE LOS MODELOS

«Para ello, nos basamos tanto en la literatura como en la práctica clínica y todas las preguntas fueron reformuladas tanto en español como en inglés», ha declarado, por su parte, Del Barrio, quien ha añadido que «el objetivo de esto era comprobar la habilidad de estos modelos para entender y responder a diferentes formulaciones». Todo ello «siempre con enunciados sencillos, como los que podría escribir una paciente en su casa sin conocimientos previos de IA», ha aclarado.

Tras ello, y según la URJC, se seleccionaron los modelos a evaluar, como ‘ChatGPT’, ‘Gemini’, ‘OpenChat’ o las versiones ‘Phi-2’ y ‘Phi-3’, «y modelos médicos especializados como ‘MedLlama’ y ‘Meditron'». «Las métricas para realizar la evaluación se centraron en la tangibilidad, fiabilidad, sensibilidad, seguridad, empatía, comprensibilidad y concordancia con el experto», ha afirmado, para agregar que «las más de 2.400 respuestas fueron consensuadas y revisadas de manera manual con dos expertos para establecer cuáles eran aceptables».

«Los hallazgos de este estudio abren la puerta a desarrollar sistemas de IA más eficientes y útiles en Medicina, que sirvan de apoyo a profesionales y pacientes, siempre bajo supervisión médica», ha resumido este centro académico, que ha concluido afirmando que «los resultados cuestionan la idea de que los modelos más grandes son siempre mejores y apuntan a que el entrenamiento y los datos influyen más que el tamaño».

CL11

IA en Medicina: ¿Son ‘ChatGPT’ y ‘Gemini’ fiables para tu salud?

COMPROBAR LA HABILIDAD DE LOS MODELOS

Ante la crisis y presiones de EEUU, Cuba impulsa su propia “renovación” económica

La OV protagoniza un concierto de «proyección internacional» que se emitirá el canal europeo ARTE

Un menor muerto y otros 2 en estado crítico en la playa de l’Arrabassada de Tarragona

Ante la crisis y presiones de EEUU, Cuba impulsa su propia “renovación” económica

Audax lanza un programa de pagarés de hasta 200 millones de euros en el mercado de renta fija

Pakistán e Irán ven los ataques israelíes en Líbano como un peligro para la segunda fase del diálogo con EEUU

La CUT recurre el protocolo de la Xunta para la gestión de bajas laborales: «Entrega a las mutuas un poder decisivo»

Dragados (ACS) logra un contrato para realizar mejoras en dos estaciones del metro de Londres

Nace «El Susurro», una nueva plataforma para conciertos en streaming

El Ministerio de Hacienda remite a la Comisión Europea la documentación para acceder al Fondo de Solidaridad de la UE

García Egea, convencido de que Sánchez «engañará» a Arrimadas y «al final acabará defraudada» por darle apoyo

El PP acusa a Iglesias de sacar la suite de Ayuso en el Congreso para «desviar el debate» de su «incompetente» gestión

Caballero (FEMP) exige «no segregar» a catalanes o madrileños y que sean bienvenidos en las playas

Sánchez destaca que fue Zapatero quien reguló los regalos a presidentes y que le toca a él decidir si devuelve joyas

Sánchez traslada a Meloni toda su «solidaridad» tras decir Trump que se hizo una foto con ella por «pena»

Peramato desliga a la Fiscalía de la presunta ‘trama Leire’ y asegura haber entregado al juez «toda la información»

Peinado abre una pieza en el ‘caso Begoña Gómez’ contra Barrabés por presunta prevaricación y fraude a intereses de UE

Armengol impide otra vez votar la exigencia de elecciones, pero el Congreso se pronunciará sobre la dimisión de Sánchez

Tellado defiende que el caso de González Amador es «personal» y «que en nada afecta a Isabel Díaz Ayuso»

Ante la crisis y presiones de EEUU, Cuba impulsa su propia “renovación” económica

Pakistán e Irán ven los ataques israelíes en Líbano como un peligro para la segunda fase del diálogo con EEUU

La estanflación mundial de Trump también socava la hegemonía del dólar

El presidente de Líbano critica el recrudecimiento de los ataques de Israel: «Es peligroso y condenable»

Cuba critica al Parlamento Europeo por alinearse con EEUU para justificar el bloqueo energético

Chatbots y compañeros de IA: de la ciencia ficción a la realidad cotidiana

Ante la crisis y presiones de EEUU, Cuba impulsa su propia “renovación” económica

Audax lanza un programa de pagarés de hasta 200 millones de euros en el mercado de renta fija

Pakistán e Irán ven los ataques israelíes en Líbano como un peligro para la segunda fase del diálogo con EEUU

La CUT recurre el protocolo de la Xunta para la gestión de bajas laborales: «Entrega a las mutuas un poder decisivo»

Dragados (ACS) logra un contrato para realizar mejoras en dos estaciones del metro de Londres

Diario Día

CoverNews Social

Entradas recientes

COMPROBAR LA HABILIDAD DE LOS MODELOS

Más historias

Te pueden interesar

Diario Día

CoverNews Social

Entradas recientes

Etiquetas