Red de conocimientos turísticos - Información de alquiler - Tecnología de análisis | Construya un modelo de predicción y dibuje la curva ROC del modelo

Tecnología de análisis | Construya un modelo de predicción y dibuje la curva ROC del modelo

El 27 de mayo de 2020, un compañero de clase me pidió que construyera un modelo de predicción para su artículo sobre el análisis del gen Hub del tumor y que dibujara la curva ROC y el valor AUC del modelo para verificar la confiabilidad del gen Hub. Si los genes Hub son significativos, entonces un modelo de predicción construido con genes Hub como características debería poder clasificar eficazmente el tejido canceroso o el tejido normal.

La estructura de este artículo es la siguiente:

El primero es la limpieza de datos y la detección del gen Hub. En otras palabras, pueden omitir los datos directamente. etapas de limpieza e ingeniería de características.

1. ***10 genes clave se dividen en tres categorías: cáncer de alta malignidad (3), cáncer de baja malignidad (2) y tejido de control normal (1), respectivamente 9, 20, 20 muestras.

Primero cree dos archivos .txt para almacenar el contenido del valor de la característica y el contenido de la etiqueta de la Figura 2 respectivamente, a saber, características.txt y etiqueta_2.txt (por supuesto, también puede usar Pandas para leer la tabla directamente, preferencia personal), luego use Python para leer los datos.

He definido una función aquí. Debes usar la función principal para establecer what_class y elegir qué tipo de ROC dibujar.

Parte teórica de ROC, AUC, micro/macro. curva ROC promedio, esta sección explica brevemente los resultados del dibujo de ROC multiclase: