Die Vox Occulta Anwendung
Vox Occulta steht eigentlich für eine ganze Familie von ITK-Anwendungen. Das Grundprinzip ist eine Stimmensynthese, die auf der Emulierung eines virtuellen menschlichen Kehlkopfes und seiner Resonanzkammern beruht. Vox-Occulta I beruhte noch auf einer elektromechanischen Lösung mit einem Chaosgenerator und mechanischen Komponenten wie Federn und Membranen um die Stimmbildung zu simulieren. Vox Occulta II war bereits eine reine Softwarelösung und die weiteren Revisionen wurden Mischungen aus beidem.
Diese Revision 6 stellt eine Variante der Rev.5 dar, welche ich auch auf dieser Webseite anbiete. Beide Varianten liefern gute Ergebnisse, ganz ohne zusätzliche Hardware. Die Software kann, wie bei meinen Applikationen gewohnt, direkt online im Browser verwendet werden. Ich biete sie allerdings auch zum Download an. Die Software ist mein geistiges Eigentum, ich stelle sie jedoch kostenlos zur Verfügung.
Bedienung der Vox Oculta VI Software
Wie auch die Rev.5 so hat auch Rev.6 eine Menge Einstellregler, welche das Klangbild, die Sprachgeschwindigkeit und die Wahrnehmnung des Experimentators beeinflussen. Der logische Fluß der Einstellungen beginnt links oben. In der folgenden Tabelle sind die Funktionen der Regler erklärt. Diese sind in Funktionsgruppen gegliedert.
Die erste Funktionsgruppe erzeugt drei Impulsfrequenzen und erweitert damit das Klangbild der Rev.5, welche mit nur zwei Frequenzen arbeitet. Diese entsprechen analog der Schwingfrequenz der menschlichen Stimmbänder und definieren damit die Tonhöhe der Stimme. Nach meinem Klangeindruckist es günstig, wenn die Frequenzen etwa 10Hz auseinanderliegen. Hier gibt es aber viel Spielraum, je nach dem welchen Klang der Experimentator bevorzugt.
Pulse Frequency 1 | Die Frequenzen der Basis Impulsquellen |
Volume | Die Gesamtlautstärke des resultierenden Signals |
Die zweite Funktionsgruppe moduliert beide Impulsquellen in der Frequenz über einen Zufallsgenerator. Der genaue Modulationsvorgang ist komplex und wurde von mir nach langen Forschungen ausgearbeitet.
FM-Range | Bestimmt den Hub der Modulation, also wie stark diese das Signal verändert. |
Die dritte Funktionsgruppe steuert den Rhythmus der Spracherzeugung.
Speech Speed | Dieser Wert steuert die Geschwindigkeit der erzeugten Sprache |
Die vierte Funktionsgruppe enthält verschiedene Parameter zur spektralen Ausgestaltung der Sprache. Hier sind insbesondere 4 Bandfilter enthalten, welche die Impulsfrequenzen überformen.
Filter Bandwidth | Diese Software verwendet steuerbare Bandfilter für die Sprachformung. Die Bandbreite dieser Filter kann hier verändert werden |
Filter Bandwidth | Die Bandbreite der verwendeten Filter kann hier eingestellt werden. Mit kleiner Bandbreite klingt das Signal härter und mit höherer Bandbreite weicher. | Amplitude BF1..BF4 | Die Ausgangswerte des jeweiligen Filters können hier in ihrer Stärke eingestellt werden. Diese Werte sind sehr wesentlich für das Klangbild. |
Consonant Injection | Konsonanten sind in der Sprachsynthese immer ein Problem. Dieser Regler führt dem Signal mehr Anteile zu, die in der Stimmenmanifestation zur Bildung von Konsonanten führen |
Pulse Harm. Mix | Mit diesem Regler kann das Verhältnis zwischen dem reinen Pulssignal und der spektralen Bearbeitung eingestellt werden. Der Regler hat einen sehr großen Einfluß auf das Klangbild. |
Die sechste Funktionsgruppe enthält verschiedene Parameter zur Konfiguration von Hall.
Delay | Die Verzögerung des Hallsignals wird mir diesem Regler eingestellt |
Decay | Mit diesem Regler wird der Nachhall eingestellt |
Wet/Dry Mix | Das Verhältnis von verhalltem zu unverhalltem Signal wird hier eingestellt |
Weiterhin gibt es eine Reihe von Buttons mit verschiedenen Funktionen. Die Buttons lösen verschiedene Funktionen aus und steuern den Programmablauf.
Start | Startet die Stimmensynthese mit den aktuell eingestellten Parametern |
Stop | Stoppt die laufende Stimmensynthese |
Save Setting | Alle Parameter werden als Datensatz lokal gespeichert. Es muss kein Dateiname vergeben werden. |
Load Setting | Falls ein vormals gespeicherter Parameter Datensatz vorhanden ist, so wird dieser durch Klicken auf diesen Button geladen. |
Symbol "REC" | Bei Klicken auf dieses Symbol startet der Aufnahmeprozes. Die Anzeige im Panel wechselt auf "RECORDING" und ein Bandzählwerk zeigt die Aufnahmezeit an. Weiterhin wird ein ablaufender Timer angezeigt, der die Aufnahme nach 600s automatisch beendet. Dieses dient dazu, dass die Aufnahmedatei nicht zu groß wird. |
Symbol "STOP" | Stoppt die laufende Aufnahme. Die Anzeige wechselt auf "STOPPED" und das Bandzählwerk hält an |
Symbol "DISKETTE" | Speichert die erzeugte Aufnahme. Diese wird mit dem Standardnamen "Vox-Occulta6.wav" in den Downloadbereich des Browsers heruntergeladen |
Die App bietet die Möglichkeit die synthetische Stimme über die PC Lautsprecher abzuspielen oder über die eingebaute Aufnahmefunktion. Nach meinem Eindruck bringt die erstere Methode etwas bessere Ergebnisse. Die optimale Einstellung aller Parameter ist durchaus komplex und jeder hört Stimmen anders. Sie müssen also selbst die optimalen Parameter finden. Das Programm startet mit den Parametern, die ich selbst als optimal empfinde.
Auch die Stimmen, welche dieses Programm erzeugt müssen noch nachbearbeitet werden, allerdings nicht viel. Ich verwende den Audio Editor Audacity und benutze darin die Kombination von Paulstretch (Dehnungsfaktor 1,2 und 0,01s Auflösung) und den Equalizer um die Höhen anzuheben. Danach höre ich die Aufnahme in Schleifen von 1s-3s Länge ab.
Wichtig: Das Programm hat einige Eigenarten, die ich selbst noch nicht ganz verstehe. Deshalb sollte man nach dem Start der Stimme einmal den Delay Regler verstellen. Die Stimmen werden dann lauter und deutlicher!
Hier geht es zur App