Red de conocimientos turísticos - Información sobre alquiler - ¿Quién puede ayudarme a traducir el resumen sobre el reconocimiento de voz? Gracias.

¿Quién puede ayudarme a traducir el resumen sobre el reconocimiento de voz? Gracias.

Resumen: Para mejorar el rendimiento del reconocimiento de voz en entornos ruidosos, se propone un algoritmo eficaz de detección de actividad del habla. El método se basa en la detección de diferencias de habla/no habla a través de algoritmos de filtrado estadístico secuencial (OSF) especiales que actúan sobre la energía logarítmica de las subbandas. Este algoritmo difiere de muchos otros algoritmos prescritos por reglas de decisión. En lugar de tomar decisiones basadas en el marco actual, utiliza OSF en energía logarítmica de subbanda, lo que le permite reducir significativamente la probabilidad de error al identificar voz y no voz a partir de señales ruidosas. La mejora significativa en la precisión del reconocimiento de voz y no voz demuestra la eficacia de este método. Esto muestra que el aumento de secuencias OSF conduce a una mejor separación de las distribuciones de voz y ruido y, por lo tanto, a un reconocimiento más eficiente con un equilibrio entre complejidad y rendimiento. El algoritmo también incluye la cooperación de bloques de reducción de ruido y VAD, y se ha mejorado aún más la precisión. El bloque de reducción de ruido anterior también mejora la precisión de la detección de voz y no voz. El análisis experimental se realiza en la base de datos AURORA y se compara con VAD estándar como ITU G.729, GSM AMR y ETSI AFE Distributed Speech Recognition (DSR), así como con otros VAD reportados recientemente, brindando evaluaciones de rendimiento exhaustivas.

Términos de índice: reducción de ruido, reconocimiento de voz sólido, detección de voz/no voz, filtrado estadístico secuencial de subbanda.