✅ Этот проект заброшен и больше не будет обновляться
ПОЖАЛУЙСТА ПРОЧИТАЙТЕ ЭТОТ РАЗДЕЛ! ТУТ ВАЖНАЯ ИНФОРМАЦИЯ, ОТ КОТОРОЙ ЗАВИСИТ РАБОТА RVC!
это mangio_rvc-v2 с easygui, tensorboard, с тренировкой, realtime gui, и все это работает из коробки.
это строго для пользователей Nvidia серии 10xx и выше.
ВНИМАНИЕ! ПУТЬ К ПРОГРАММЕ ДОЛЖЕН БЫТЬ НА АНГЛИСКОМ ЯЗЫКЕ!! ИМЯ КОМПЬЮТЕРА ТОЖЕ СТРОГО НА АНГЛИЙСКОМ
А так же, не используйте поиск Windows для поиска файлов, иначе у вас могут быть непонятные ошибки.
Как это использовать
Зависит от того что вам требуется.
Замена голоса в аудиокомпозиции
Подмена голоса в реальном временем (Voice changer)
Исправление ошибок (траблшутинг)
Текст чуть выше кликакабельный.
Подготовка
- Скачиваем zip архив отсюда
- Распаковываем в папку (по возможности в корень диска C:)
- Запускаем !rvc_v2_preloader.exe и выбираем папку куда мы распаковали rvc.
- Нажимаем на кнопку "Запуск RVC EasyGUI"
- Ждем пару минут и у нас откроется браузер.
- Поздравляю. Если у вас в браузере что-то появилось, то всё работает.
- Вы можете добавить модели нажав сюда
Если что-то не так то жду вас в решение проблем
Добавляем голосовые модели в rvc
- Большинство моделей можно найти тут:AiHub (Discord)
- Заходим в канал voice-models
- Практически все модели подходят к нашей программе. Пишем в поиск нужную (Желательно по англиски) и скачиваем
- После того как скачали, в архиве должно быть 2 файла, это .pth и .index
- Перемещаем .pth в папку "weights". Эта та самая папка, куда вы распаковали саму rvc.
- Дальше, заходим в папку logs, создаем папку с названием модели которую мы скачали, и перемещаем туда .index
- Возвращаемся в браузер, убеждаемся что вы во вкладке "Inference", затем нажимаем "Refresh" которая находится у "1.Choose your Model."
- Модель появилась? Ура. Если не появилась, то нажмите сюда
- Не забудьте выбрать свой .index в "Index Settings" он должен совпадать по названию с ".pth", не обязательно слово в слово.
Заменяем голос в аудиокомпозиции
- Выполяем все шаги тут
Тренировка голосовых моделей на своем ПК
- Выполяем все шаги тут
- дальше мне лень писать
требования к нормальному датасету:
- отсутствие шумов, кликов мыши/клавиатуры, тишины и прочего
- примерная длина всех аудио от 1 до 30 минут, оптимальное от 3 до 10
- для удобства советую разделить на файлы, можно и произвольной длины
*датасет - набор данных для тренироки.
требования к тренировке:
- не допускать перетренировки
- не допускать слабого обучения
- смотреть на графики tensorboard, чтобы найти идеальное количество эпох
Изменяем голос в реальном времени
- Выполяем все шаги тут
- Скачиваем и устанавливаем VAC (Virtual Audio Cable) --> тут
- Открываем VBCABLE_Setup_x64.exe и устанавливаем.
- Нас попросят перезагрузить ПК, но мы не будем.
Исправление проблем
а
Структура папок/файлов модели RVC v2 выглядит следующим образом:
папка eval - используется для хранения оценок для tensorboard, если они поддерживаются в данном случае
файл fevents - это файл тензорборда / графика
некоторые файлы журналов .txt и config - журналы и конфигурации
G_xxxxx.pth файл ( генератор )
D_xxxxx.pth файл ( дискриминатор )
fea.npy (большой файл, содержащий характеристики модели / голоса)
trained index (файл, который мы больше не используем)