Evaluación comparativa de herramientas tecnológicas basadas en Inteligencia Artificial para el monitoreo de enfermedades

Comparative evaluation of technological tools based on Artificial Intelligence for disease monitoring.

Carrera de Tecnologías de la Información, Universidad Técnica de Machala, Machala, Ecuador.

* Autor para correspondencia

Comó citar el artículo:

Cárdenas Villavicencio, O. E., Valarezo Pardo, M. R., Jumbo Castillo, F. A. & Jaramillo Barreiro, J. A. (2024). Evaluación Comparativa de Herramientas Tecnológicas Basadas en Inteligencia Artificial para el Monitoreo de Enfermedades. Informática y Sistemas: Revista de Tecnologías de la Informática y las Comunicaciones, 8(1), 16–26. DOI: https://doi.org/10.33936/isrtic.v8i1.6325

Enviado: 09/01/2024

Aceptado: 05/03/2024

Publicado: 06/03/2024

Autores

*Oscar Efrén Cárdenas Villavicencio

Milton Rafael Valarezo Pardo

Freddy Aníbal Jumbo Castillo

Juan Andrés Jaramillo Barreiro

Resumen

La atención médica está experimentando una revolución sin precedentes gracias a los avances en informática, inteligencia artificial (IA) y telemedicina. En este contexto, los chatbots se han convertido en herramientas innovadoras que transforman las prácticas médicas tradicionales al ofrecer atención personalizada y orientación instantánea. Esto desafía el enfoque convencional de seguimiento de enfermedades, que solía depender históricamente de visitas médicas programadas y recopilación manual de datos. Este estudio se enfoca en evaluar comparativamente las herramientas tecnológicas basadas en IA diseñadas para el monitoreo de enfermedades. Adoptando el método PRISMA 2020, se llevó a cabo una revisión exhaustiva de la literatura y estudios pertinentes. Este enfoque metodológico permitió un análisis preciso de la eficacia, exactitud y viabilidad de chatbots específicos como GYANT, Babylon Health, EDAChatbot, Med-PaLM, Symptomate y Buoy Health. Los resultados obtenidos revelan el impacto positivo que estas tecnologías tienen en la mejora de la atención médica. Además, ofrecen una guía sólida para su desarrollo y adopción futura. Es fundamental destacar que la implementación de estas tecnologías debe llevarse a cabo sin descuidar principios éticos fundamentales, como la protección de la privacidad y la autonomía del paciente. En cuanto a los hallazgos específicos, se encontró que los chatbots EDAChatbot, Buoy Health y Symptomate sobresalen en varios aspectos críticos. Estos incluyen: respuestas rápidas e instantáneas, interfaz amigable y sencilla, adaptabilidad Lingüística, integración con Registros Médicos Electrónicos (EMR) y seguridad de Datos, garantizando la confidencialidad y protección de la información del paciente.

Palabras Claves: Salud, Tecnología, Inteligencia artificial, Enfermedad, Paciente.

Abstract

Healthcare is undergoing an unprecedented revolution thanks to advances in informatics, artificial intelligence (AI) and telemedicine. In this context, chatbots have become innovative tools that transform traditional medical practices by offering personalized care and instant guidance. This challenges the conventional approach to disease monitoring, which historically used to rely on scheduled medical visits and manual data collection. This study focuses on comparatively evaluating AI-based technology tools designed for disease monitoring. Adopting the PRISMA 2020 method, a comprehensive literature review and meta-analysis of relevant studies was conducted. This methodological approach enabled an accurate analysis of the efficacy, accuracy and feasibility of specific chatbots such as GYANT, Babylon Health, EDAChatbot, Med-PaLM, Symptomate and Buoy Health. The results obtained reveal the positive impact these technologies have on improving healthcare. They also provide a solid roadmap for their future development and adoption. It is essential to emphasize that the implementation of these technologies should be carried out without neglecting fundamental ethical principles, such as the protection of privacy and patient autonomy. In terms of specific findings, the EDAChatbot, Buoy Health and Symptomate chatbots were found to excel in several respects.

Keywords: Health, Technology, Artificial Intelligence, Disease, Patient

16

1. Introducción

Al comienzo del siglo XXI, la atención médica experimenta una transformación radical, impulsada por avances tecnológicos previamente inimaginables. La integración de la informática, la inteligencia artificial (IA) y la telemedicina marca el inicio de una era en la que la atención médica supera las barreras físicas tradicionales de clínicas y hospitales. En este contexto de cambio revolucionario, los chatbots se han posicionado como elementos fundamentales, brindando atención personalizada y asesoramiento médico inmediato, desafiando así los paradigmas establecidos en la prestación de cuidados de salud (R. Han et al., 2023).

Tradicionalmente, el monitoreo de enfermedades dependía de citas médicas programadas, pruebas de laboratorio y la recopilación manual de datos por los pacientes, prácticas que, a pesar de ser valiosas, presentan limitaciones considerables. Los intervalos prolongados entre visitas médicas pueden impedir la identificación temprana de cambios en el estado de salud, y la recopilación manual de datos a menudo resulta en información fragmentada y propensa a errores. Los chatbots ofrecen una alternativa avanzada, proporcionando un seguimiento constante y personalizado que supera estas limitaciones (Omarov et al., 2022).

La IA, que constituye el núcleo de los chatbots, ha logrado un nivel de desarrollo sin precedentes. Modelos como GPT-3 han evidenciado una habilidad extraordinaria para comprender y generar lenguaje natural, facilitando interacciones efectivas y coherentes entre humanos y máquinas. Esta capacidad es especialmente valiosa en el contexto de la atención médica, donde la precisión y claridad de la comunicación son cruciales (Imran et al., 2023).

El propósito de este artículo es llevar a cabo una evaluación comparativa rigurosa de herramientas tecnológicas impulsadas por Inteligencia Artificial, centradas específicamente en chatbots, para el monitoreo de enfermedades. Este estudio busca analizar de manera exhaustiva el impacto y la contribución de los chatbots en la transformación y mejora de la atención médica contemporánea, enfocándose en cómo estas herramientas tecnológicas pueden elevar la calidad de los cuidados de salud y fortalecer la autonomía del paciente. Mediante un análisis detallado de literatura científica reciente y utilizando el método PRISMA 2020 para una revisión de la literatura preliminar, este trabajo evaluará las funcionalidades de los chatbots médicos considerando aspectos críticos como la rapidez de respuesta, usabilidad, adaptabilidad lingüística, integración con sistemas de registros médicos electrónicos y la implementación de medidas para la protección de la privacidad de los datos. El estudio enfatiza el potencial de los chatbots como una intersección innovadora entre la tecnología y la medicina, proyectando la capacidad de estas herramientas para efectuar mejoras significativas en el sistema de atención médica y en el bienestar de pacientes a nivel global (Secinaro et al., 2021).

2. Materiales y Métodos

Las revisiones de la literatura juegan un papel crucial al proporcionar una síntesis exhaustiva del conocimiento en un campo específico. Estas no solo permiten identificar áreas de investigación futuras y abordar preguntas no resueltas por estudios individuales, sino que también señalan limitaciones en la investigación primaria y contribuyen al desarrollo y evaluación de teorías. Dado su valor para pacientes, profesionales de la salud, investigadores y responsables de políticas de salud, es esencial que se presenten de manera transparente y exhaustiva (Page et al., 2021).

La actualización de la guía PRISMA 2020 es un recurso invaluable para este fin, mejorando los estándares establecidos por PRISMA 2009 para reflejar avances recientes en metodología y tecnología. Esto es fundamental para el progreso continuo en la práctica de las revisiones de las literaturas (Page et al., 2021).

Para esta investigación, se seleccionaron etapas específicas del método PRISMA 2020, basándose en criterios derivados de una revisión bibliográfica exhaustiva. Esta selección se ilustra en la siguiente figura:

A continua se describe cada una de las etapas de la metodología:

Definición de Problema

En el entorno de la atención médica, el monitoreo efectivo de enfermedades se ha convertido en un pilar fundamental para proporcionar tratamientos precisos y mejorar la calidad de vida de los pacientes. Sin embargo, la diversidad de herramientas tecnológicas disponibles para llevar a cabo dicho monitoreo plantea un desafío significativo. El problema central que aborda esta investigación es la identificación de cuál de estas herramientas tecnológicas, en particular los chatbots, ofrece la solución más eficaz y adecuada para el monitoreo de enfermedades. Este problema se desglosa en una serie de interrogantes fundamentales:

• ¿Cuál es el potencial de los chatbots en comparación con otras herramientas tecnológicas utilizadas para el monitoreo de enfermedades?

• ¿Cuál es la eficacia de los chatbots en el monitoreo continuo de enfermedades en relación con los métodos de monitoreo tradicionales?

En la Figura 2, se aprecia cada uno de los procesos anteriormente descritos.

Definición de Problema

La búsqueda de literatura relevante para esta investigación se llevó a cabo mediante una estrategia meticulosa y de la literatura, empleando varias bases de datos académicas y científicas de renombre, incluidas PubMed, Embase y la Cochrane Library. Esta estrategia fue diseñada para garantizar una cobertura exhaustiva del cuerpo de conocimiento existente en áreas clave relacionadas con nuestro tema de estudio. Para maximizar la precisión y efectividad de nuestra búsqueda bibliográfica, adoptamos un enfoque estratégico en la selección de términos clave como “chatbots”, “herramientas tecnológicas para el monitoreo de enfermedades” y “eficacia de los chatbots en la atención médica”, junto con términos relacionados, tal como se puede apreciar en la Figura 3. Esta selección, cuidadosamente curada, se fundamentó en su relevancia específica para el propósito de nuestra investigación y su capacidad para abarcar una amplia gama de literatura significativa. Este método asegura una cobertura exhaustiva del tema, permitiéndonos acceder a un espectro amplio de conocimientos y perspectivas relevantes al ámbito de estudio.

Las bases de datos científicas citadas fueron cuidadosamente seleccionadas debido a que estas plataformas cuentan con una cobertura amplia en temas de la salud, ofreciendo una selección de estudios relacionados con el tema en cuestión. Además es importante recalcar que dichas bases de datos científicas son reconocidas por su confiabilidad y reputación en la catalogación de literatura científica revisada por pares en el ámbito biomédico

En el proceso de revisión, dimos prioridad a los estudios publicados en revistas sujetas a revisión por pares y con el fin de garantizar la inclusión de estudios relevantes y actualizados, la búsqueda de la literatura se llevo a cabo desde enero/2019 - diciembre/2023, reflejando nuestro compromiso con la calidad y la actualidad de la información. Este enfoque selectivo es fundamental en un campo tan dinámico como el de las tecnologías digitales y los chatbots en la salud, donde la evolución constante exige una actualización continua de conocimientos. Tal metodología nos permite fundamentar nuestras conclusiones en la evidencia más confiable y pertinente, garantizando que nuestra investigación se mantenga a la vanguardia de los avances científicos y tecnológicos.

Para llevar a cabo la revisión, se realizó una exhaustiva búsqueda bibliográfica en bases de datos especializadas y motores de búsqueda académicos. La cadena de búsqueda se diseñó considerando términos clave relacionados con la inteligencia artificial, el monitoreo de enfermedades, herramientas de salud digital y la privacidad de los datos del paciente. Se emplearon los siguientes operadores booleanos específicos para optimizar la búsqueda:

Términos relacionados con la inteligencia artificial y la salud: “inteligencia artificial” OR “IA” OR “chatbots” OR “herramientas tecnológicas”

Términos relacionados con el monitoreo de enfermedades y la telemedicina: “monitoreo de enfermedades” OR “seguimiento de enfermedades” OR “diagnóstico médico” OR “autodiagnóstico” OR “telemedicina” OR “salud digital”

Nombres de algunas herramientas y plataformas de salud digital conocidas: “GYANT” OR “Babylon Health” OR “EDAChatbot” OR “Med-PaLM” OR “Symptomate” OR “Buoy Health”

Aspectos éticos y de privacidad relacionados con la tecnología médica: “privacidad” OR “seguridad de datos” OR “protección de datos” OR “autonomía del paciente” OR “principios éticos”

Selección de estudio

En la Figura 4, se detalle el proceso para asegurar la relevancia y calidad de los documentos académicos incluidos en nuestra investigación.

Así mismo, se requiere establecer un conjunto de criterios de inclusión y exclusión. Estos criterios fueron diseñados para filtrar eficazmente la literatura y seleccionar aquellos estudios que proporcionan evidencia directa y actualizada sobre la aplicación y eficacia de los chatbots en el monitoreo de la salud. Los criterios específicos incluyeron:

1. Estudios publicados en revistas científicas revisadas por expertos: Este criterio es primordial ya que garantiza la calidad y credibilidad de la investigación. La revisión por pares es un proceso esencial para validar la metodología, los resultados y las conclusiones de un estudio, asegurando así su fiabilidad y su aporte al cuerpo de conocimiento existente, es decir, se priorizan los estudios publicados en revistas científicas revisadas por expertos y se descartan aquellas revistas que no tengan revisión por pares.

2. Estudios recientes (últimos 5 años): Dada la rápida evolución de las tecnologías digitales y su aplicación en la salud, se limita la búsqueda de estudios a los últimos 5 años para priorizar investigaciones recientes que aseguran los hallazgos y conclusiones relevantes y aplicables al contexto tecnológico y médico actual. Este criterio permite centrarse en las innovaciones más recientes y sus impactos en el monitoreo de salud mediante chatbots.

3. Trabajos enfocados directamente a la aplicación y evaluación de chatbots en tareas de monitoreo de salud: La especificidad del enfoque del estudio es crucial para asegurar que los documentos seleccionados aporten directamente a la comprensión de cómo los chatbots pueden ser utilizados eficazmente en el monitoreo de la salud. Este criterio garantiza la relevancia directa de los estudios con respecto a los objetivos de nuestra investigación.

4. Investigaciones en inglés y español por ser los idiomas con mayor producción en esta área: Aunque la inclusión de estudios en estos dos idiomas amplía el alcance de la búsqueda, este criterio se jerarquiza en último lugar debido a que la calidad y relevancia del contenido son más críticas que el idioma del estudio. No obstante, reconocer los idiomas predominantes en la producción científica del área permite abarcar una amplia gama de investigaciones relevantes.

Con el objetivo de garantizar una mayor claridad en el proceso de selección de estudios, se considera adecuado aplicar los siguientes criterios de exclusión:

1. Disponibilidad de textos completos: Acceder a toda la información de un estudio es de gran importancia ya que nos ayuda a revisar de manera exhaustiva. Por lo tanto, se excluirá aquellos documentos donde tengan limitada el acceso a la información o no se encuentre disponible en su totalidad.

2. Reputación de las revistas científicas y revisión por pares: Se excluirán los estudios que no hayan pasado por un proceso adecuado de revisión por pares o aquellos publicados en revistas científicas no indexadas. Esto garantiza la credibilidad y la calidad de la información recopilada.

3. Estudios que no aborden el tema del estudio: Es de gran importancia que los estudios seleccionados aborden directamente el tema de interés. Por lo tanto, se excluirán aquellos que no estén relacionados de manera significativa con el tema principal de la investigación.

Extracción de datos

Para asegurar una evaluación exhaustiva y objetiva de la eficacia de los chatbots en el ámbito de la atención médica, es crucial identificar y analizar meticulosamente un conjunto de variables clave. Estas variables no solo proporcionan una base para medir el rendimiento y la utilidad de los chatbots, sino que también ofrecen insights valiosos sobre áreas de mejora potencial. En la Figura 5, se muestra una optimización y argumentación de los procesos propuestas.

• Tiempo de Respuesta: Esta variable es fundamental para evaluar la eficiencia operativa de un chatbot en contextos de atención médica. Un tiempo de respuesta rápido es crucial, especialmente en situaciones que requieren atención inmediata. La medición precisa del tiempo que tarda el chatbot en proporcionar respuestas a las consultas de los usuarios permite evaluar su capacidad para satisfacer las necesidades de información en tiempo real de los pacientes. La eficiencia en el tiempo de respuesta no solo mejora la experiencia del usuario sino que también puede ser un factor determinante en situaciones de emergencia.

Facilidad de Uso: Esta variable evalúa la interfaz de usuario y la experiencia general al interactuar con el chatbot. Una alta facilidad de uso asegura que los pacientes y usuarios puedan navegar e interactuar con el sistema sin dificultades, lo cual es esencial para fomentar la adopción y el uso regular del chatbot. La medición de esta variable a través de encuestas de satisfacción del usuario proporciona feedback directo sobre cómo los usuarios perciben la usabilidad del chatbot y qué mejoras podrían incrementar su aceptación.

Adaptabilidad Lingüística: La capacidad de un chatbot para comunicarse efectivamente en múltiples idiomas o dialectos es vital en el contexto global de la atención médica, donde la diversidad lingüística de los pacientes puede ser un desafío significativo. Esta variable no solo subraya la importancia de la inclusividad y accesibilidad, sino que también refleja la capacidad del chatbot para servir a una base de usuarios más amplia y diversa. La adaptabilidad lingüística es, por lo tanto, un indicador crítico de la versatilidad y el alcance global del chatbot.

Integración con Registros Médicos Electrónicos (EMR): La capacidad de un chatbot para integrarse de manera efectiva con EMR es esencial para una atención médica coordinada y eficiente. Esta integración permite un acceso fluido a la información médica del paciente, facilitando así una atención personalizada y basada en datos. La evaluación de esta variable proporciona insights sobre cómo los chatbots pueden mejorar la coordinación entre pacientes y profesionales de la salud, optimizando el proceso de toma de decisiones clínicas.

Seguridad de Datos: Dado el carácter sensible de la información de salud, la seguridad de los datos es una variable de suma importancia. Esta variable evalúa la eficacia de las medidas de seguridad implementadas para proteger la privacidad y la integridad de los datos del paciente. Una robusta seguridad de datos no solo es crucial para cumplir con las normativas legales y éticas sino que también es fundamental para mantener la confianza del usuario en el uso de chatbots para asuntos de salud.

Análisis de datos

En la sección que sigue, se realiza un análisis detallado de una selección específica de chatbots en el ámbito de la salud: GYANT, Babylon Health, EDAChatbot, Symptomate, Med-PaLM y Buoy Health, como se indica en la Figura 6. Cada uno de estos sistemas se examina en función de sus características distintivas, fundamentación tecnológica y contribuciones específicas al campo de la salud digital. Esta selección se limitó únicamente a estos chatbots debido a la búsqueda restringida en el apartado “Búsqueda de Literatura”, lo que permitió comparar exclusivamente estos sistemas en el contexto del estudio.

GYANT

Fundado en 2018 por Stefan Behrens, ex ejecutivo de Google, GYANT surge como respuesta a las barreras en el acceso a la atención médica. Behrens vislumbró el potencial de la inteligencia artificial (IA) para transformar el acceso y la experiencia de atención médica. GYANT se fundamenta en un modelo de lenguaje grande (LLM), entrenado en un vasto conjunto de datos que comprende desde artículos médicos y libros de texto hasta registros médicos, permitiéndole procesar y responder a un amplio espectro de consultas de salud con precisión notable (Makasi et al., 2020).

BABYLON HEALTH

Desde su lanzamiento en el Reino Unido en 2013, Babylon Health ha marcado pauta en la provisión de servicios de salud digital, integrando plataformas de IA con operaciones clínicas virtuales. A pesar de haber alcanzado una expansión a 17 países y cubrir más de 20 millones de personas, la compañía enfrentó desafíos financieros significativos en 2023. No obstante, las operaciones en el Reino Unido fueron adquiridas por eMed Healthcare UK, asegurando la continuidad de sus servicios bajo una nueva marca. Babylon Health destaca por su uso de LLMs para facilitar consultas médicas virtuales, ofreciendo una interfaz innovadora para la interacción paciente-médico (Oliver, 2019).

EDA CHATBOT

EDAChatbot emerge como una herramienta gratuita enfocada en la detección temprana del cáncer de mama, fomentando el autocuidado y proporcionando información fiable sobre prevención y diagnóstico precoz. Este chatbot representa un avance significativo en la educación para la salud, alentando a las mujeres a adoptar prácticas de autocuidado informadas y contribuyendo a desmitificar esta enfermedad (EDA, 2016).

MED-PALM

Desarrollado a partir del modelo PaLM de Google AI, Med-PaLM es un modelo de lenguaje con aprendizaje profundo, entrenado con un compendio de texto y código médico. Su desarrollo representa un hito en la aplicación de IA en medicina, con la capacidad de interpretar y procesar información médica compleja, facilitando así la toma de decisiones clínicas basadas en evidencia (Galatzer-Levy et al., 2023).

SYMPTOMATE

Creado por un equipo de la Universidad de Varsovia bajo la dirección del Dr. Piotr Skowron, Symptomate es un chatbot de IA que emplea aprendizaje no supervisado para correlacionar síntomas con posibles enfermedades. Este enfoque innovador en el procesamiento del lenguaje natural y aprendizaje automático subraya la capacidad emergente de los chatbots para contribuir de manera significativa al diagnóstico preliminar y la orientación de los pacientes (Swick, 2021).

BUOY HEALTH

Buoy Health ofrece una herramienta de autodiagnóstico basada en IA, diseñada para guiar a los usuarios hacia la atención médica más adecuada según sus síntomas. Desarrollado con un modelo de aprendizaje automático avanzado, este chatbot se entrena con más de 10 millones de casos clínicos, abarcando una gama extensa de condiciones de salud. La precisión y el alcance de Buoy Health ilustran el potencial de la IA para mejorar la orientación de los pacientes y optimizar el acceso a servicios de salud pertinentes (Buoy Health, s. f.).

3. Resultados y Discusión

En la construcción de una escala de Likert diseñada para evaluar chatbots, el objetivo principal es abordar de manera integral la eficacia y eficiencia de estos sistemas. Se han identificado cinco atributos clave para una evaluación precisa: tiempo de respuesta, facilidad de uso, adaptabilidad lingüística, integración con EMR (Registros Médicos Electrónicos) y seguridad de datos. La importancia de una respuesta rápida radica en la necesidad de que un chatbot eficiente responda ágilmente para mantener la atención del usuario. Se destaca la esencialidad de la facilidad de uso para garantizar una experiencia de usuario positiva, esperando que el chatbot sea intuitivo y fácil de manejar. La adaptabilidad lingüística, considerada como un aspecto crucial, permite que el chatbot sea accesible para un público diverso, lo cual es especialmente relevante en un entorno globalizado. La integración con EMR se vuelve esencial, especialmente en el ámbito médico, facilitando la entrega de información precisa y personalizada. Finalmente, la seguridad de datos emerge como un pilar fundamental para mantener la confianza del usuario y cumplir con las regulaciones legales. Es imperativo que un chatbot garantice la seguridad integral de los datos del usuario. Cada uno de estos atributos se evalúa en una escala del 1 al 5, permitiendo así una evaluación cuantitativa exhaustiva de la eficacia de un chatbot. La escala de Likert se configura como una herramienta invaluable para los desarrolladores de chatbots, proporcionándoles la capacidad de identificar áreas de mejora y optimizar la eficacia de sus sistemas.

Según se muestra en la Tabla 3, presenta una escala de Likert para cada variable y se llevó a cabo un análisis exhaustivo de seis chatbots de salud prominentes, a saber, GYANT, Babylon Health, EDAChatbot, Med-PaLM, Symptomate y Buoy Health. Los datos recopilados durante esta evaluación se resumieron en un gráfico de columnas con el fin de proporcionar una representación visual clara de cómo estos chatbots se desempeñan en cada una de estas dimensiones clave.

En esta investigación, se analizaron 6 chatbots médicos. En base a los parámetros comparativos detallados en la Tabla 1 y el análisis gráfico de la Figura 7, tres chatbots sobresalieron, EDAChatbot, Buoy Health y Symptomate por cumplir de mejor manera criterios de versatilidad de uso, facilidad de uso y disponibilidad global. Estos hallazgos recalcan su potencial para mejorar y transformar el acceso a la atención médica en todo el mundo, brindando apoyo y orientación a personas de diversas comunidades. Estos tres chatbots destacaron como los más versátiles, dado su capacidad para realizar una amplia gama de tareas, incluyendo consultas médicas, servicio al cliente y funciones de entretenimiento. Asimismo, resultaron fáciles de usar y con acceso disponible para usuarios de todo el mundo. A continuación, se presenta una tabla comparativa de sus características:

Tiempo de respuesta

Para calcular el tiempo de respuesta de los 3 chatbots médicos, se les dio información de varios síntomas presentados por un paciente hipotético: dolor de cabeza, fiebre como parte de una enfermedad de menos de 3 días de evolución y con una temperatura de 37°C, intensidad del dolor de 5 en una escala del 1 al 10, sin enrojecimiento de ojos, sin dolor de garganta o problemas para oír, uso reciente de antibióticos, sin mordeduras previas de algún animal, dolores de cabeza intermitentes en los últimos 3 meses, comienzo rápido del problema actual de salud, sin cambios del dolor al moverse o por el estado de ánimo, sin dolor solo de un lado de la cabeza, y sin mencionar dolor facial o de oídos.

Se presentan tres chatbots: EDAChatbot, Symptomate y Buoy Health, lo cuales han mostrado un rendimiento notable en el proceso de interacción con los usuarios, con tiempos de respuesta promedio de 3,790 ms, 2,510 ms y 2,830 ms, respectivamente. Además, todos ellos han sido calificados con un puntaje de 4 en una escala de Likert que evalúa su desempeño. Estos chatbots utilizan tecnologías avanzadas, como el procesamiento de lenguaje natural (NLP), el aprendizaje automático y sistemas basados en reglas para proporcionar respuestas a los usuarios. A pesar de una pequeña variación los tres chatbots muestran tiempos de respuesta similares y han recibido altas calificaciones en la escala de Likert, lo que indica un rendimiento satisfactorio y ágil para atender las interacciones con los usuarios.

La mezcla de tiempos de respuesta y calificaciones altas en la escala de Likert indica que EDAChatbot, Symptomate y Buoy Health son chatbots eficaces y confiables para que los usuarios puedan interactuar en situaciones que requieran atención medica digital. Su capacidad para ofrecer respuestas precisas los posiciona como herramientas meritorias en el ámbito de la asistencia medica virtual y el soporte de decisiones relacionadas con la salud.

Los tiempos de respuesta de los chatbots varían, aunque todos obtienen una calificación satisfactoria de 4 puntos o superior. Symptomate sobresale como el más rápido, mientras EDAChatbot y Buoy Health presentan una velocidad más moderada. En cualquier caso, estos tiempos de respuesta apropiados son importantes para satisfacer a los usuarios que priorizan obtener información médica de forma ágil.

Facilidad de uso

Similarmente, los tres chatbots médicos alcanzan una puntuación de 4 puntos en la categoría de facilidad de uso desde la perspectiva del usuario. Dicha calificación es indicativa de que estas herramientas virtuales de salud resultan sencillas de aprender y utilizar para el público general, esta cualidad de interfaz amigable y comprensible es particularmente valiosa para aquellas personas con limitados conocimientos tecnológicos o poca experiencia previa interactuando con asistentes digitales.

La facilidad de uso de los chatbots médicos se traduce en una experiencia de usuario más satisfactoria e intuitiva. La capacidad de que el usuario pueda navegar sin mucho esfuerzo a través de las opciones, comprender las indicaciones y recibir respuestas claras contribuye significativamente a su utilidad y efectividad en el contexto de la atención médica digital.

El obtener una alta puntuación en la categoría de facilidad de uso no solo resalta la importancia de desarrollar y diseñar interfaces amigables e intuitivas en el ámbito de la salud digital, sino que también tiene un impacto positivo las personas debido a que facilita el acceso a recursos y servicios digitales de salud de manera efectiva y eficiente.

Adaptabilidad lingüística

En cuanto a la adaptabilidad lingüística, definida como la capacidad de funcionar en distintos idiomas, los tres chatbots también obtienen una alta puntuación de 4. Si bien no alcanzan la calificación perfecta de 5, esto demuestra su habilidad para comunicarse efectivamente independientemente del idioma utilizado por el usuario.

La adaptabilidad lingüística es un aspecto de gran importancia en el progreso de los chatbots, ya que permite que sean accesibles para una audiencia global diversa. Al ser capaces de comprender y responder en diferentes idiomas facilita la interacción y la comunicación fluida debido a que pueden atender las necesidades de usuarios de diversas regiones y culturas.

Integración con EMR

En el ámbito de la integración con los registros médicos electrónicos (EMR), se destaca que EDAChatbot, Symptamate y Buoy Health obtienen una calificación de 4, lo que refleja su capacidad para acceder y utilizar de manera segura los registros médicos electrónicos de los pacientes. Esta característica refleja la habilidad para acceder y emplear de manera segura a los registros médicos electrónicos de los pacientes y resulta esencial para los usuarios que necesitan acceder a información médica proporcionada por sus proveedores de atención médica. La capacidad de utilizar y acceder de forma segura a los registros médicos electrónicos también ayuda a fortalecer la confianza y de los pacientes en las plataformas de consulta médica digital.

Seguridad de datos

Por último, es importante destacar que los tres chatbots obtienen la calificación máxima de 5 en seguridad de datos. Esto denota que implementan estrictas medidas de seguridad para resguardar la información personal de los usuarios, logrando así una protección completa de los datos.

Discusión

Los chatbots médicos EDAChatbot, Symptomate y Buoy Health se destacan como soluciones de alta calidad en términos de facilidad de uso, personalización del idioma, integración con registros médicos electrónicos (EMR) y seguridad de datos. Un estudio realizado en EDAChatbot mostró que este chatbot puede ser efectivo en la educación de enfermería, aumentando el interés de los estudiantes en la educación y el aprendizaje autodirigido (Nißen et al., 2022). Symptomate ha demostrado ser eficaz en proporcionar respuestas de calidad y empáticas a las preguntas de los pacientes en un foro en línea (Reardon, 2023). Buoy Health ha demostrado ser eficaz en disminuir la incertidumbre entre los pacientes y en cambiar su nivel de atención previsto después de usar la tecnología (J.-W. Han et al., 2022).

Sin embargo, se observan notables discrepancias en sus tiempos de respuesta. Symptomate se destaca como el líder en velocidad, con un tiempo promedio de respuesta de 2510 ms, mientras que EDAChatbot y Buoy Health muestran tiempos de respuesta más prolongados, registrando 3790 ms y 2830 ms, respectivamente. Estos hallazgos son consistentes con la literatura existente que sugiere que los tiempos de respuesta pueden variar significativamente entre diferentes chatbots Estas variaciones en los tiempos de respuesta tienen el potencial de impactar la satisfacción del usuario, especialmente en situaciones médicas críticas. Por lo tanto, es esencial priorizar la mejora de los tiempos de respuesta en futuras iteraciones de estos chatbots, sin comprometer la excelencia en las otras dimensiones mencionadas anteriormente.

4. Conclusiones

En general, EDAChatbot, Symptomate y Buoy Health son chatbots médicos de alta calidad que ofrecen características y rendimiento similares. Si bien estos sistemas han demostrado ser eficaces en términos de tiempo de respuesta, facilidad de uso, capacidad de adaptación a varios idiomas y su integración con EMR, además de garantizar un alto nivel de seguridad de datos, es importante destacar que, a pesar de que los chatbots obtuvieron una calificación promedio de 4 en las demás dimensiones, existe una variación significativa en sus tiempos de respuesta, planteando una preocupación sobre la experiencia del usuario. Symptomate se destaca como el chatbot más rápido, con un tiempo promedio de respuesta de 2,510 ms, mientras que EDAChatbot y Buoy Health presentan tiempos de respuesta de 3,790 ms y 2,830 ms, respectivamente.

Esta discrepancia en los tiempos de respuesta podría tener un impacto significativo, especialmente en situaciones médicas donde la rapidez y la precisión de la información son esenciales. Aunque los chatbots pueden ser altamente efectivos en otras áreas, la lentitud en el tiempo de respuesta podría influir en la satisfacción del usuario y, posiblemente, en la confianza en la herramienta.

Los tres chatbots utilizan tecnologías de procesamiento de lenguaje natural (NLP) y aprendizaje automático, permitiendo la comprensión y el procesamiento de las consultas de los usuarios de manera más precisa. Symptomate se destaca debido a que utiliza un sistema basado en reglas, mientras que Buoy Health incluye una revisión de expertos médicos, lo que significa que, además de las capacidades NLP y aprendizaje automático cuenta con una validación de profesionales médicos, garantizando una mejor confiabilidad y precisión en las respuestas.

Por lo tanto, la tecnología cada vez cuenta con un papel más importante en el contexto de la atención médica digital, debido a que el tiempo de respuesta en los chatbot se considera como un factor critico, el cual influye en la eficacia del sistema y en la experiencia del usuario, se debe considerar en futuras evaluaciones y desarrollos de estos chatbots de salud digital, es esencial abordar y priorizar la mejora en el tiempo de respuesta, esto garantizará que la experiencia del usuario sea lo más eficiente y satisfactoria posible. Además, se debe equilibrar esta mejora con el mantenimiento de altos estándares en las otras dimensiones mencionadas, asegurando así una solución integral y efectiva en el campo de la atención médica digital, es decir, que al mejorar los tiempos de respuestas, la integridad y calidad que ofrecen actualmente los chatbots no se vean comprometidos.

Contribución de los autores

Oscar Efrén Cárdenas Villavicencio: Administración del proyecto, Investigación, Redacción-borrador. Milton Rafael Valarezo Pardo: Conceptualización, Investigación, revisión y edición del artículo. Freddy Aníbal Jumbo Castillo: Metodología, revisión y edición del artículo. Juan Andrés Jaramillo Barreiro: Investigación, Redacción-borrador.

Conflictos de interés

Los autores declaran no tener ningún conflicto de interés.

Referencias bibliográficas

Altamimi, I. A. (2023). Artificial Intelligence (AI) Chatbots in Medicine: A Supplement, Not a Substitute. Cureus. https://doi.org/10.7759/cureus.40922

Amisha, Malik, P., Pathania, M., & Rathaur, V. (2019). Overview of artificial intelligence in medicine. Journal of Family Medicine and Primary Care. https://doi.org/10.4103/jfmpc.jfmpc_440_19

Aranibar, E., Salinas, F., & Seguil, N. (2023). Exploring trends in the public sphere: scientometrics and systematic review. Universitas XXI. https://doi.org/10.17163/uni.n39.2023.05

Ćirković , A. (2020). Evaluation of Four Artificial Intelligence–Assisted Self-Diagnosis Apps on Three Diagnoses: Two-Year Follow-Up Study. J Med Internet Res. https://doi.org/10.2196/18097

Curioso, W., & Brunette, M. (2020). Inteligencia artificial e innovación para optimizar el proceso de diagnóstico de la tuberculosis. . Revista Peruana de Medicina Experimental y Salud Publica. https://doi.org/10.17843/rpmesp.2020.373.5585

Galatzer-Levy, I., McDuff, D., Natarajan, V., Karthikesalingam, A., & Malgaroli, M. (2023). The Capability of Large Language Models to Measure Psychiatric Functioning. arXiv preprint. https://doi.org/10.48550/arXiv.2308.01834

Galvani, A., Parpia, A., Foster, E., Singer, B., & Fitzpatrick, M. (2020). Improving the prognosis of health care in the USA. Lancet. https://doi.org/10.1016/S0140-6736(19)33019-3

García, J. (2016). Applications of Data Mining (DM) in Science and Engineering: State of the art and perspectives. arxiv. https://doi.org/10.48550/arXiv.1609.05401

Goktas, P., Karakaya, G., Kalyoncu, A., & Damadoglu, E. (2023). Artificial Intelligence Chatbots in Allergy and Immunology Practice: Where Have We Been and Where Are We Going? The Journal of Allergy and Clinical Immunology: In Practice. https://doi.org/10.1016/j.jaip.2023.05.042

Guizado, D., Távara, A., & Meneses, B. (2023). Virtual reality in communicative learning tools for children with autism spectrum disorders a systematic literature review. Salud, Ciencia y Tecnología – Serie de Conferencias. https://doi.org/10.56294/sctconf2023533

Han, J., Park, J., & & Lee, H. (2022). Analysis of the effect of an artificial intelligence chatbot educational program on non-face-to-face classes: a quasi-experimental study. BMC Med Educ. https://doi.org/10.1186/s12909-022-03898-3

Han, R., Todd, A., Wardak, S., Partridge, S., & Raeside, R. (2023). Feasibility and Acceptability of Chatbots for Nutrition and Physical Activity Health Promotion Among Adolescents: Systematic Scoping Review With Adolescent Consultation. JMIR Hum Factors, 10(e43227). https://doi.org/10.2196/43227

Imran, N., Hashmi, A., & Imran, A. (2023). Chat-GPT: Opportunities and Challenges in Child Mental Healthcare. Pakistan Journal of Medical Sciences, 1191-1193. https://doi.org/10.12669/pjms.39.4.8118

Lacobucci, G. (2020). Babylon Health holds talks with “significant” number of NHS trusts. BMJ. https://doi.org/10.1136/bmj.m266

Mahase, E. (2019). Birmingham trust and Babylon Health discuss pre-A&E triage app. BMJ. https://doi.org/10.1136/bmj.l2354

Makasi, T., Nili, A., Desouza, K., & & Tate, M. (2020). Chatbot-mediated public service delivery: A public service value-based framework. First Monday. https://doi.org/10.5210/fm.v25i12.10598

Murugaiyan, P., & Ramakrishnan, V. (2020). A methodology for structured literature network meta-analysis. Journal of Modelling in Management, 4-48. https://doi.org/10.1108/JM2-01-2020-0009

Nißen, M., Rüegger, D., Stieger, M., Flückiger, C., Allemand, M., V Wangenheim, F., & & Kowatsch, T. (2022). The Effects of Health Care Chatbot Personas With Different Social Roles on the Client-Chatbot Bond and Usage Intentions: Development of a Design Codebook and Web-Based Study. Journal of medical Internet research. https://doi.org/10.2196/32630

Oliver, D. (2019). David Oliver: Lessons from the Babylon Health saga. BMJ. https://doi.org/10.1136/bmj.l2387

Omarov, B., Narynov, S., & Zhumanov, Z. (2023). Artificial Intelligence-Enabled Chatbots in Mental Health: A Systematic Review. Cmc-Computers Materials & Continua, 5105-5122. https://doi.org/10.32604/cmc.2023.034655

Page, M., McKenzie, J., Bossuyt, P., Boutron, I., Hoffmann, T., Mulrow, C., . . . Moher, D. (2021). Declaración PRISMA 2020: una guía actualizada para la publicación de revisiones sistemáticas. Revista Española de Cardiología. https://doi.org/10.1016/j.recesp.2021.06.016

Salas, J., Barros, F., & Martinez, F. (2019). Deep Learning: Current State. IEEE Latin America. https://doi.org/10.1109/TLA.2019.9011537

Satheesh, K., Tanmai, M., Neelam , K., & Rodriquez, R. (2023). Artificial Intelligence and Knowledge Processing. CRC Press. https://doi.org/10.1201/9781003328414

Secinaro, S., Calandra, D., Secinaro, A., Muthurangu, V., & Biancone, P. (2021). The role of artifcial intelligence. BMC Med Inform Decis Mak. https://doi.org/10.1186/s12911-021-01488-9

Singhal, K., Tu, T., Gottweis, J., Sayres, R., Wulczyn, E., Clark, K., . . . Tomasev, N. (2023). Towards Expert-Level Medical Question Answering with Large Language Models. arXiv:2305.09617. https://doi.org/10.48550/arXiv.2305.09617

Sinha, S., Mandal, S., & Mondal, A. (2020). Question Answering System-Based Chatbot for Health care. Springer, Singapore. https://doi.org/10.1007/978-981-15-2188-1_6

17

Figura 1. Etapas seleccionadas del método PRISMA 2020.

Fuente: Los autores.

Figura 2. Procesos de la etapa definición de problema

Fuente: Los autores.

Figura 3. Procesos de la etapa búsqueda de literatura

Fuente: Los autores.

18

Figura 4. Procesos de la etapa selección de estudio.

Fuente: Los autores.

19

Figura 5. Procesos de la etapa extracción de datos

Fuente: Los autores.

Figura 6. Procesos de la etapa análisis de datos.

Fuente: Los autores.

20

Chatbots

Características distintivas

Fundamentación tecnológica

Contribuciones específicas al campo de la salud digital

Gyant

Conjunto de datos que comprende desde artículos médicos y libros de texto hasta registros médicos

Modelo de lenguaje grande (LLM)

Inteligencia artificial (IA) para transformar el acceso y la experiencia de atención médica

Babylon Health

Ha marcado pauta en la provisión de servicios de salud digital

Modelo de lenguaje grande (LLM). plataformas de IA con operaciones clínicas virtuales

Ofrece una interfaz innovadora para la interacción paciente-médico

Eda Chatbot

Herramienta gratuita, fomentando el autocuidado

Procesamiento del lenguaje natural (PLN) y en sistemas de aprendizaje automático.

Enfocada en la detección temprana del cáncer de mama

Med-Palm

Capacidad de interpretar y procesar información médica compleja

Desarrollado a partir del modelo PaLM de Google AI

Permite la interpretación de datos médicos complejos contribuyendo a decisiones clínicas

Symptomate

Emplea aprendizaje no supervisado para correlacionar síntomas con posibles enfermedades

Procesamiento del lenguaje natural (PLN) y aprendizaje automático

Permitir a los usuarios autoevaluar sus síntomas y obtener información relevante sobre su salud

Buoy Health

Herramienta de autodiagnóstico

Modelo de aprendizaje automático avanzado, se entrena con más de 10 millones de casos clínicos. Procesamiento del lenguaje natural (PLN)

Guía a los usuarios hacia la atención médica más adecuada según sus síntomas

Tabla 1. Resumen de los parámetros comparativos de los chatbots

Fuente: Los autores

Tabla 2. Escala de Likert para los Chatbots.

Fuente: Los autores

Atributo

Escala de Likert

Tiempo de respuesta

Facilidad de uso

Adaptabilidad lingüística

Integración con EMR

Seguridad de datos

1 = Muy lento, 2 = Lento, 3 = Medio, 4 = Rápido, 5 = Muy rápido

1 = Muy difícil, 2 = Difícil, 3 = Medio, 4 = Fácil, 5 = Muy fácil

1 = Muy limitado, 2 = Limitado, 3 = Medio, 4 = Amplio, 5 = Muy amplio

1 = No integrado, 2 = Parcialmente integrado, 3 = Integrado, 4 = Totalmente integrado

1 = Muy baja, 2 = Baja, 3 = Medio, 4 = Alta, 5 = Muy alta

21

Tabla 3. Comparación de las características de los chatbots médicos según la escala de Likert.

Fuente: Los autores

Chatbot

Tiempo de respuesta

Facilidad de uso

Adaptabilidad lingüística

Integración con EMR

Seguridad de datos

EDAChatbot

4

4

4

4

5

Symptomate

4

4

4

4

5

Buoy Health

4

4

4

4

5

Figura 7. Importancia de las características de los chatbots médicos según la escala de Likert.

Fuente: Los autores.

22

Tabla 4. Comparación del tiempo de respuesta de tres chatbots médicos.

Fuente: Los autores

Figura 8. Importancia del tiempo de respuesta en los chatbots médicos.

Fuente: Los autores.

23

Chatbot

Tiempo de respuesta

Escala de likert

Tecnologías

EDAChatbot

3,790 ms

4

NLP, aprendizaje automático

Symptomate

2,510 ms

4

NLP, aprendizaje automático, sistema basado en reglas

Buoy Health

2,830 ms

4

NLP, aprendizaje automático, sistema basado en reglas

Figura 9. Facilidad de uso de los chatbots médicos.

Fuente: Los autores.

Figura 10. Adaptabilidad lingüística de los chatbots médicos.Fuente: Los autores.

Figura 11. Integración con EMR de los chatbots médicos.Fuente: Los autores.

Figura 12. Seguridad de datos de los chatbots médicos.

Fuente: Los autores.

24

25

26