Elder Scrolls 5: Skyrim Special Edition
Die Elder Scrolls 5: Skyrim Special Edition ist eine Neuauflage des Rollenspiels im Fantasy-Genre mit offener Welt The Elder Scrolls 5: Skyrim Legendary Edition... Mehr erfahren
xVASynth 2 – SKVA Synth – Voiceover-Tool
-
www.nexusmods.comHerunterladenPasswort für das Archiv: vgtimes
xVASynth 2 – SKVA Synth.
xVASynth ist ein künstliches Intelligenztool zum Erstellen hochwertiger Voiceovers mit Stimmen aus Videospielen. Die App unterstützt Hunderte von Stimmen in Dutzenden von Spielen und ermöglicht die Kontrolle über Tonhöhe, Dauer und Energie bis zum Buchstaben.
Intro
xVASynth (oder [SK]VASynth, für Skyrim-Stimmen) ist eine Anwendung für künstliche Intelligenz, die Voiceover-Zeilen mit bestimmten Stimmen aus Videospielen generiert. Es kann Text in Sprache (TTS) von der Texteingabe oder Sprache in Sprache (S2S) von der Audioeingabe umwandeln. Die App verwendet FastPitch-Modelle [1,2], die Benutzern künstlerische Kontrolle über die Tonhöhe, Dauer und Energiewerte (nur Modelle v2+) für jeden Buchstaben im Audio geben. Sie ermöglichen Ihnen auch die Generierung von Audio mit expliziter Aussprache über die ARPAbet-Notation.
Die Verwendung neuronaler Sprachsynthese führt zu natürlich klingenden Stimmen, was mit traditionelleren Methoden, bei denen vorhandene Daten kombiniert werden, nur sehr schwer zu erreichen ist. Dadurch kann auch neues Vokabular generiert werden, das über das hinausgeht, was die Synchronsprecher bereits gelesen haben.
xVASynth 2 — SKVA Synth.
xVASynth — это инструмент искусственного интеллекта для создания высококачественных реплик озвучки с использованием голосов из видеоигр. Приложение поддерживает сотни голосов в десятках игр и обеспечивает управление высотой тона, продолжительностью и энергией с точностью до каждой буквы.
Вступление
xVASynth (или [SK]VASynth, для голосов Skyrim) — это приложение с искусственным интеллектом, которое генерирует реплики озвучки, используя определенные голоса из видеоигр. Он может преобразовывать текст в речь (TTS) из текстового ввода или речь в речь (S2S) из аудиовхода. Приложение использует модели FastPitch [1,2], которые дают пользователям художественный контроль над высотой тона, длительностью и значениями энергии (только модели v2+) для каждой буквы в аудио. Они также позволяют генерировать звук с явно заданным произношением через нотацию ARPAbet.
Использование нейронного синтеза речи приводит к естественному звучанию голоса, что очень сложно сделать с помощью более традиционных методов, включающих объединение существующих данных. Это также означает, что может быть сгенерирован новый словарный запас помимо того, что актеры озвучивания уже прочитали.
Nützliche Links: