Red de conocimientos turísticos - Conocimientos sobre calendario chino - Cómo funciona el habla desde una perspectiva de programación

Cómo funciona el habla desde una perspectiva de programación

No entiendo tu pregunta. Déjame explicarte según tengo entendido. La voz de la computadora se divide en tres partes: una es la grabación de voz, la otra es la reproducción de voz y la tercera es la conversión de formato de archivo de voz.

El primero es la grabación. El micrófono convierte el sonido en corriente y el circuito interno convierte la corriente en voltaje. Luego, el voltaje se muestrea en la computadora y se convierte en código digital. en la tarjeta de sonido y se guarda en el formato de voz .wav más básico (otros formatos, como .mp3, se pueden volver a codificar a través de .wav). Esta es la grabación.

Reproducción: el software extrae el archivo de sonido en la memoria, lo decodifica mediante el software (cada formato de voz es un código) y lo transmite a la tarjeta de sonido después de la decodificación. La tarjeta de sonido convierte este código digital. en el voltaje correspondiente, luego se convierte en un voltaje analógico y luego se convierte en una corriente a través de un circuito, que fluye hacia el altavoz y luego produce sonido.

Entonces hablemos de conversión de formato. El formato de voz más básico es .wav. Otros formatos de voz se convierten básicamente a partir de este formato. Los principales parámetros involucrados en la reproducción de voz son el número de canales, mono o dos canales (estéreo), y la frecuencia, el nivel de cuantificación. todos afectan la calidad del sonido), formato de codificación, frecuencia de reproducción. El formato de codificación es muy importante y afectará el tamaño del archivo de voz, la velocidad de transmisión del archivo de voz (si la codificación es lenta, el chat de voz es una especie de tortura) y la frecuencia de reproducción. La frecuencia de reproducción determina la velocidad. de la reproducción del sonido, si la frecuencia es alta, será muy agudo, como el grito de una mujer, si la frecuencia es muy lenta, el sonido será muy lento, como el resurgimiento de una cinta, y se escuchará una frase. tomar mucho tiempo.

La codificación y decodificación de la voz se procesa mediante software informático. Otros archivos también tienen este formato de codificación y decodificación. Casi todos los archivos tienen su propio formato.

La conversión entre voz y corriente la realiza la tarjeta de sonido.

La situación específica depende del principio de la tarjeta de sonido.

上篇: ¿Por qué solo hay un archivo de imagen API28 en el Administrador de SDK de Android? 下篇: ¿Cuánto cuesta un banco de energía?