El análisis predictivo en el sector sanitario

#SICROMTeam Análisis Predictivo, Big Data, Innovación Útil, Transformación Digital

Big Data y Análisis Predictivo en el sector sanitario

El sector sanitario genera cada día una cantidad incalculable de datos relacionados con la salud humana. Esto, sumado al auge de la transformación digital, se traduce en un acercamiento e implantación de soluciones Big Data y del análisis avanzado de datos al sector sanitario con el objetivo de mejorar la toma de decisiones.

En medicina podemos encontrar un gran historial de datos almacenados en las diferentes bases de datos de la organización. Aplicar técnicas de minería de datos y análisis con pruebas estadísticas contribuye a optimizar diferentes puntos relacionados con la salud, como la  mejora de la asistencia sanitaria, alinear costos con los resultados esperados y, aunque parezca increíble, también podríamos salvar vidas.

A continuación, veremos cómo conocer qué medicamento debemos ofrecer a un paciente en función de sus síntomas o constantes vitales.

Aplicación del análisis predictivo con IBM SPSS Modeler

Imaginemos el caso de un investigador médico que está recopilando datos para un estudio. Los datos recopilados hacen referencia a un conjunto de pacientes, los cuales todos sufrieron la misma enfermedad. Durante el curso del tratamiento, cada paciente respondió positivamente a un medicamento determinado de un total de cinco (Medicamento A, Medicamento B, Medicamento C, Medicamento D y Medicamento E). Parte de su trabajo consiste en utilizar la minería de datos para averiguar qué medicamento es el adecuado para un futuro paciente con la misma enfermedad.

Con la herramienta de análisis predictivo IBM SPSS Modeler, es posible conocer y predecir qué medicamento es el más adecuado para un paciente en concreto.

Además, mediante el desarrollo de modelos predictivos se pueden conocer los patrones o características que implican que un paciente responda positivamente o no ante un medicamento.

En este caso, vamos a describir el proceso para predecir el medicamento con el que un paciente responderá positivamente mediante el uso de técnicas avanzadas de análisis de datos, con el objetivo de mejorar la toma de decisiones y decidir de la forma óptima.

Modelado para elección de medicamento con SPSS Modeler paso a paso

Análisis predictivo

Paso 1: Importación de datos

Mediante el nodo Origen podemos acceder y leer cualquier conjunto de datos en cualquier formato, como csv, txt o xlsx, entre otros. En este caso, hemos empleado un archivo .txt.

Paso 2: Lectura de datos

Una vez que hemos obtenido el conjunto de datos, pasamos a su lectura mediante el nodo Resultado. Las variables con las que contamos son la variable edad, sexo, nivel de presión sanguínea, nivel de colesterol, nivel de sodio, nivel de potasio y medicamento proporcionado.

Análisis predictivo

Paso 3: Transformación de variables

Tras realizar estudios previos para analizar las variables más significativas a la hora de predecir el medicamento más adecuado para cada paciente, hemos comprobado que las variables Niveles de Sodio y Niveles de Potasio presentan un mejor comportamiento, es decir, influyen de mejor manera para predecir el medicamento a proporcionar, si funcionan de forma conjunta, concretamente, si utilizamos el cociente entre Sodio y Potasio en lugar de cada variable por separado.

Esta operación la llevamos a cabo con el nodo Derivar de la paleta Operaciones con campos.

Análisis predictivo

Paso 4: Filtrado de variables

En este paso vamos a eliminar las variables Sodio y Potasio, ya que en el paso anterior hemos originado una nueva que hace referencia al cociente entre ambas variables.

Análisis predictivo

¿Quieres más información?
Déjanos tu teléfono y te llamamos:

 

5: Partición de los datos

Para el desarrollo del modelo predictivo, debemos dividir nuestro conjunto de datos en dos subconjuntos. El primero de ellos es el subconjunto de entrenamiento, el cual sirve para entrenar y construir el modelo. El segundo subconjunto recibe el nombre de subconjunto prueba o test, que tiene como función verificar la calidad del modelo y que las predicciones sean las correctas.

Mediante el nodo Partición de la paleta Operaciones con campos realizamos esta tarea.

Análisis predictivo

Paso 6: Definición del tipo de dato

Análisis predictivo

En este paso lo que hacemos es definir el tipo de dato para cada variable. Comprobamos que la medida sea la adecuada, estudiamos valores atípicos, analizamos posibles categorizaciones de variables y definimos el rol de cada variable. En este caso, la variable a predecir es la variable Medicamento, la cual tiene un rol destino. Las demás variables tienen el papel de variables predictoras, por lo que sus roles son de variables de entrada.

Paso 7: Desarrollo del algoritmo predictivo

Es aquí donde encontramos el verdadero valor de esta herramienta. SPSS Modeler trae implementado una infinidad de modelos y algoritmos de minería de datos, como por ejemplo redes neuronales, árboles de decisión, regresiones, series temporales, reglas de asociación, etc. Por lo que con esta herramienta podemos olvidarnos de programar extensos códigos o scripts para desarrollar los modelos manualmente. Además, para aquellas personas que no contengan conocimientos avanzados en estadística, encontramos la opción del clasificador automático y autonumérico, que nos permite conocer qué modelo es el que nos predice con una mayor precisión una variable objetivo en función de los datos con los que disponemos.

Análisis predictivo

Paso 8: Visualización de modelos con mayor ajuste

Tras ejecutar el paso anterior, pasamos a ver qué modelos son los que presentan un mayor ajuste. Esto lo vemos mediante el diamante resultante.

Análisis predictivo

Cómo se puede observar, obtenemos 3 modelos con una precisión del 100%, dos de ellos emplean 5 variables para predecir la variable Medicamento y uno emplea 4 variables, este modelo es el árbol C5, por lo que nos quedamos con este modelo, ya que explica igual de bien el modelo utilizando un menor número de variables.

Paso 9: Elección del algoritmo C5 para una óptima predicción

Una vez que conocemos cuál es el mejor algoritmo predictivo, pasamos a configurar los parámetros para obtener los mejores resultados.

Análisis predictivo

Paso 10: Visualización del modelo

Análisis predictivo

Cómo se puede observar en la imagen, la variable más importante a la hora de predecir qué medicamento es el más adecuado para un paciente, es el cociente entre los niveles de Sodio y Potasio. A continuación, veremos parte del árbol resultante.

Análisis predictivo

Cómo se puede observar, el primer punto de corte hace referencia a los niveles de Sodio y Potasio. A continuación el árbol se va ramificando y entrando en valor otras variables, cómo la presión sanguínea o la edad. Es aquí donde podemos observar cada ramificación e ir identificando qué producto es el más recomendado para cada paciente.

Paso 11: Evaluación del modelo

Una vez obtenido nuestro árbol de decisión, debemos comprobar si las conclusiones que podemos extraer a partir del árbol son fiables o no. Para ello evaluamos nuestro modelo generado, conectándolo a un nodo Análisis de la paleta Resultados. La salida es la siguiente:

Análisis predictivo

Cómo podemos observar, tanto para el subconjunto de entrenamiento como para el subconjunto test el modelo predice correctamente el 100% de los casos, por lo que las conclusiones que sacaremos a partir del modelo serán óptimas.

Paso 12: Vista de resultados

Análisis predictivo

Con el nodo Tabla podemos ver los resultados y predicciones obtenidos. Como se muestra en la imagen, las dos últimas columnas hacen referencia al medicamento pronosticado y su probabilidad de acierto, comprobándose de nuevo que el modelo acierta en todos los casos. Una vez que sabemos que nuestras predicciones van a ser fiables, solo tendríamos que incluir nuestros nuevos registros de pacientes y conocer qué medicamento es el más adecuado para uno.

Tras todo el proceso, podemos comprobar cómo con el uso de herramientas de minería de datos como IBM SPSS Modeler, podemos predecir diferentes objetivos como conocer el mejor medicamento para un paciente en función de sus síntomas o valores de sus constantes vitales.

Sin duda alguna, el utilizar software como SPSS Modeler orientados a la toma de decisiones, nos proporciona resultados inmejorables en un tiempo imposible de alcanzar por otros software de minería de datos.

¿Quieres más información?
Déjanos tu teléfono y te llamamos:

 

¿Quieres recibir más información?

Si deseas estar informado de las tendencias, recomendaciones y novedades del sectorinscríbete en nuestro boletín de noticias.

Si deseas ponerte en contacto con nosotros visita, por favor, el siguiente enlace.

Sicrom