Todo sobre Apple, Android, Juegos Apks y Sitios de Peliculas

Tutorial del cambiador de voz SVC, modelos

SVC (Singing Voice Conversions) es un modelo de aprendizaje profundo que tiene como objetivo convertir una voz cantante en otra voz manteniendo intactas la letra y la música de la canción.

SVC funciona con los mismos principios y tecnología que el cambiador de voz AI, pero en lugar de voz, se convierte la voz cantada.

Si se pregunta cómo utilizar el cambiador de voz SVC, siga leyendo. Este artículo analizará el tutorial del cambiador de voz SVC.

¿Qué es el cambiador de voz SVC?

El cambiador de voz SVC es principalmente una conversión de una voz cantada a otra voz con la misma música. Este modelo es muy diferente al modelo VITS basado en conversiones de texto a voz.

El modelo VITS no es capaz de realizar tareas SVC. El modelo SVC utiliza un codificador de contenido SoftVC para convertir la parte del habla del audio principal.

Luego, el discurso extraído pasa por VITS sin necesidad de representación basada en texto. Por lo tanto, la música y el tono del audio original no se ven afectados.

Para cualquier conversión SVC, puede utilizar so-vits-svcdisponible en GitHub para descargar o en una versión de interfaz de usuario más mejorada llamada so-vits-svc-tenedor.

¿Cómo utilizar el cambiador de voz SVC?

So-vits-vc-fork es un software de código abierto disponible en GitHub que cualquiera puede utilizar para entrenar sus modelos de IA para conversiones de voz en cualquier idioma.

La versión improvisada admite conversiones de voz en tiempo real y tiene un proceso de instalación muy sencillo. Puedes usarlo con cualquier tarjeta gráfica con Linux o Microsoft Windows.

Para utilizar el cambiador de voz SVC, los siguientes son los pasos para so-vits-vc-fork, que tiene una interfaz de usuario más mejorada.

1. Para instalacion

Puede instalar so-vits-vc-fork desde pip o GitHub.

Para instalar usando pip, ejecute el siguiente comando:

Para instalar usando GitHub, ejecute el siguiente comando que clonará el repositorio para instalarlo manualmente.

Para obtener nuevas funciones y correcciones de errores, siga actualizando “pip install -U so-vits-svc-fork” en pip y para GitHub, ejecute el siguiente comando:

2. Utilice el software

Es muy fácil de usar so-vits-vc-fork y para realizar las conversiones de voz puede usar GUI o CLI.

Usando la GUI puede ejecutar el siguiente comando para abrir una ventana.

Cuando se abra la ventana, verá botones y controles deslizantes para controlar las conversiones de voz y también le permitirá hacer lo siguiente:

  • Cargue su altavoz fuente desde un archivo o utilice altavoces previamente entrenados.
  • Cargue su altavoz de destino desde un archivo o utilice altavoces de destino previamente entrenados.
  • Cambie el tono de la voz convertida usando el cambio de tono.
  • Modifique el volumen de la voz convertida utilizando la relación de energía.
  • Modifique la velocidad de la voz convertida utilizando el factor de relación de duración.
  • Utilice el botón de reproducción para escuchar la voz convertida.
  • Utilice el botón de conversión para convertir de la voz de origen a la voz de destino.
  • Utilice el botón de detener para detener la reproducción de la conversión.
  • Utilice el botón Guardar para guardar el audio final como un archivo WAV.

La GUI es una forma entretenida de convertir voces y también puedes usar tu voz para convertirla en la voz cantante de otra persona. Puedes jugar con diferentes configuraciones de control para crear una voz única con varios efectos.

Usando CLI, ejecute el siguiente comando que le permitirá realizar el cambio de voz usando argumentos y opciones.

El comando le ayudará a convertir el altavoz de origen en el altavoz de destino y finalmente guardarlo como un archivo WAV.

Para abrir la ayuda en CLI para varias entradas y opciones, utilice -h o – -help.

La opción CLI puede ser técnica y usarse para realizar conversiones de voz por lotes mediante comandos.

Sin embargo, si es nuevo en SVC, puede utilizar la GUI, que es una opción más fácil de usar para convertir la voz sin mucha asistencia técnica.

Modelos de cambiador de voz SVC

Existe una lista enorme de modelos previamente entrenados que puede utilizar para la conversión de voz en el software so-vits-vc-fork.

Puedes descargar los modelos desde abrazando la cara o CIVITAI.

Notas para el uso del software So-vits-vc-fork

Cuando se utiliza WSL (Windows Subsistemas para Linux), recuerde que requiere una configuración adicional del dispositivo de audio y la GUI no funcionará correctamente sin un dispositivo de audio.

Si encuentra algún ruido en la inferencia en tiempo real, HuBert reaccionará ante él. Es mejor utilizar aplicaciones de reducción de ruido en tiempo real como Voz RTX de Nvidia.

Al descargar los modelos previamente entrenados, asegúrese de que los modelos sean distintos a los 4.0v1 ya que no son compatibles.

Asegúrese de tener una interfaz GPU con 4 GB de VRAM y, si no, intente la inferencia de CPU.

Resumen del Contenido