¿Qué es una máquina de vectores de soporte?
El algoritmo SVM es un mecanismo de aprendizaje propuesto por Vapnik, cuyo objetivo es mejorar los defectos teóricos de los métodos tradicionales de aprendizaje de redes neuronales. La red de máquinas de vectores de soporte se propuso por primera vez a partir del problema de superficie de clasificación óptima. El algoritmo de aprendizaje SVM busca el mejor compromiso entre la complejidad del modelo y la capacidad de aprendizaje basándose en información de muestra limitada para obtener la mejor capacidad de generalización. SVM tiene una forma similar a las redes feedforward multicapa y se ha utilizado en reconocimiento de patrones, análisis de regresión, minería de datos y otros campos.
Estas características de las máquinas de vectores de soporte están fuera del alcance de otros algoritmos de aprendizaje (como las redes neuronales artificiales). Para problemas de clasificación, una red directa de una sola capa puede resolver problemas de clasificación lineal y una red directa de múltiples capas puede resolver problemas de clasificación no lineal. Pero estas redes sólo pueden resolver el problema y no pueden garantizar el clasificador óptimo. El método de la máquina de vectores de soporte basado en la teoría del aprendizaje estadístico puede teóricamente lograr una clasificación óptima entre diferentes categorías y lograr la mejor capacidad de generalización al encontrar el peor vector, es decir, el vector de soporte.
En términos generales, SVM se puede dividir en SVM lineal y SVM no lineal. Linear SVM determina la estructura de partición en función de la distancia euclidiana entre muestras. Después de usar la función del núcleo de convolución para reemplazar el producto interno en SVM no lineal, es equivalente a definir una desviación generalizada del dedo del pie y usar esta distancia generalizada como base para la división.
Hay dos interpretaciones de las máquinas de vectores de soporte difuso: una es el posprocesamiento difuso para muestras multidefinidas o muestras faltantes; la otra es la introducción de factores difusos en el proceso de entrenamiento.
La aplicación de SVM en inversión cuantitativa es principalmente para predecir series de tiempo financieras. De acuerdo con el modelo de predicción de series de tiempo basado en la máquina de vectores de soporte, el modelo se entrena y mejora mediante muestras de entrenamiento, y luego se predicen los datos de la serie de tiempo y se generan los resultados de la predicción.
El primer caso presentado en este capítulo es un método complejo de predicción de series de tiempo de datos financieros basado en el método de mínimos cuadrados, que mejora en gran medida la velocidad de solución y la precisión de la convergencia. En comparación con el método de predicción de redes neuronales, este método tiene mejoras obvias en el tiempo de entrenamiento, los tiempos de entrenamiento y los errores de predicción al predecir una gran cantidad de series de tiempo de datos financieros, y también tiene buenos resultados de predicción para series de tiempo financieras complejas.
El segundo caso es utilizar SVM para determinar el punto de inflexión del mercado. Debido a que el error de utilizar un único indicador técnico para predecir el punto de reversión del precio de las acciones es grande, es especialmente necesario utilizar una combinación de múltiples indicadores técnicos para verificarse entre sí. Dado que SVM adopta el principio de minimización del riesgo estructural, puede resolver problemas no lineales y de alta dimensión con muestras pequeñas. Por lo tanto, al construir un punto de reversión que contenga múltiples combinaciones de indicadores técnicos para determinar la mejor dirección y utilizar SVM para extraer el vector de combinación de indicadores técnicos, se puede obtener un modelo de predicción del punto de reversión del precio de las acciones más preciso.
El concepto básico de máquina de vectores de soporte
El algoritmo SVM es un mecanismo de aprendizaje propuesto por Vapnik, cuyo objetivo es mejorar los defectos teóricos de los métodos tradicionales de aprendizaje de redes neuronales. La red de máquinas de vectores de soporte se propuso por primera vez a partir del problema de superficie de clasificación óptima.
El algoritmo de aprendizaje SVM busca el mejor compromiso entre la complejidad del modelo y la capacidad de aprendizaje basándose en información de muestra limitada para obtener la mejor capacidad de generalización. SVM tiene una forma similar a las redes feedforward multicapa y se ha utilizado en reconocimiento de patrones, análisis de regresión, minería de datos y otros campos. El método de la máquina de vectores de soporte puede superar las deficiencias inherentes de las redes directas multicapa y tiene las siguientes ventajas:
(1) Para el caso de muestras limitadas. De acuerdo con el principio de minimización del riesgo estructural, la capacidad de generalización de la máquina de aprendizaje debe mejorarse tanto como sea posible, es decir, se pueden obtener pequeños errores a partir de muestras de entrenamiento limitadas, para garantizar que aún se puedan mantener pequeños errores de forma independiente. conjuntos de prueba. El objetivo es obtener la solución óptima dada la información disponible, no solo el valor óptimo cuando el número de muestras se acerca al infinito.
(2) El algoritmo eventualmente se transformará en un problema de optimización cuadrática y, teóricamente, se puede obtener el óptimo global.
(3) El algoritmo transforma el problema real en un espacio de características de alta dimensión mediante una transformación no lineal, construye una función discriminante lineal en el espacio de alta dimensión y realiza la función discriminante no lineal en el espacio original. Esta propiedad especial puede garantizar que la máquina tenga una buena capacidad de generalización y, al mismo tiempo, resuelva inteligentemente el problema de la maldición de la dimensionalidad, haciendo que la complejidad de su algoritmo sea independiente de la dimensión de la muestra.