Die Vox Occulta Anwendung

Die Software-ITK Anwendung Vox Occulta V6.0

Vox Occulta steht eigentlich für eine ganze Familie von ITK-Anwendungen. Das Grundprinzip ist eine Stimmensynthese, die auf der Emulierung eines virtuellen menschlichen Kehlkopfes und seiner Resonanzkammern beruht. Vox-Occulta I beruhte noch auf einer elektromechanischen Lösung mit einem Chaosgenerator und mechanischen Komponenten wie Federn und Membranen um die Stimmbildung zu simulieren. Vox Occulta II war bereits eine reine Softwarelösung und die weiteren Revisionen wurden Mischungen aus beidem.

Diese Revision 6 stellt eine Variante der Rev.5 dar, welche ich auch auf dieser Webseite anbiete. Beide Varianten liefern gute Ergebnisse, ganz ohne zusätzliche Hardware. Die Software kann, wie bei meinen Applikationen gewohnt, direkt online im Browser verwendet werden. Ich biete sie allerdings auch zum Download an. Die Software ist mein geistiges Eigentum, ich stelle sie jedoch kostenlos zur Verfügung.

Bedienung der Vox Oculta VI Software

Wie auch die Rev.5 so hat auch Rev.6 eine Menge Einstellregler, welche das Klangbild, die Sprachgeschwindigkeit und die Wahrnehmnung des Experimentators beeinflussen. Der logische Fluß der Einstellungen beginnt links oben. In der folgenden Tabelle sind die Funktionen der Regler erklärt. Diese sind in Funktionsgruppen gegliedert.

Die erste Funktionsgruppe erzeugt drei Impulsfrequenzen und erweitert damit das Klangbild der Rev.5, welche mit nur zwei Frequenzen arbeitet. Diese entsprechen analog der Schwingfrequenz der menschlichen Stimmbänder und definieren damit die Tonhöhe der Stimme. Nach meinem Klangeindruckist es günstig, wenn die Frequenzen etwa 10Hz auseinanderliegen. Hier gibt es aber viel Spielraum, je nach dem welchen Klang der Experimentator bevorzugt.

Funktionsgruppe Basic Frequency Settings


Pulse Frequency 1	Die Frequenzen der Basis Impulsquellen
Volume	Die Gesamtlautstärke des resultierenden Signals

Die zweite Funktionsgruppe moduliert beide Impulsquellen in der Frequenz über einen Zufallsgenerator. Der genaue Modulationsvorgang ist komplex und wurde von mir nach langen Forschungen ausgearbeitet.

Funktionsgruppe Frequency Modulation Settings


FM-Range	Bestimmt den Hub der Modulation, also wie stark diese das Signal verändert.

Die dritte Funktionsgruppe steuert den Rhythmus der Spracherzeugung.

Funktionsgruppe Randomizer


Speech Speed	Dieser Wert steuert die Geschwindigkeit der erzeugten Sprache

Die vierte Funktionsgruppe enthält verschiedene Parameter zur spektralen Ausgestaltung der Sprache. Hier sind insbesondere 4 Bandfilter enthalten, welche die Impulsfrequenzen überformen.

Funktionsgruppe Spectral Processing


Filter Bandwidth	Diese Software verwendet steuerbare Bandfilter für die Sprachformung. Die Bandbreite dieser Filter kann hier verändert werden
Filter Bandwidth	Die Bandbreite der verwendeten Filter kann hier eingestellt werden. Mit kleiner Bandbreite klingt das Signal härter und mit höherer Bandbreite weicher.
Amplitude BF1..BF4	Die Ausgangswerte des jeweiligen Filters können hier in ihrer Stärke eingestellt werden. Diese Werte sind sehr wesentlich für das Klangbild.
Consonant Injection	Konsonanten sind in der Sprachsynthese immer ein Problem. Dieser Regler führt dem Signal mehr Anteile zu, die in der Stimmenmanifestation zur Bildung von Konsonanten führen
Pulse Harm. Mix	Mit diesem Regler kann das Verhältnis zwischen dem reinen Pulssignal und der spektralen Bearbeitung eingestellt werden. Der Regler hat einen sehr großen Einfluß auf das Klangbild.

Die sechste Funktionsgruppe enthält verschiedene Parameter zur Konfiguration von Hall.

Funktionsgruppe Reverb Settings


Delay	Die Verzögerung des Hallsignals wird mir diesem Regler eingestellt
Decay	Mit diesem Regler wird der Nachhall eingestellt
Wet/Dry Mix	Das Verhältnis von verhalltem zu unverhalltem Signal wird hier eingestellt

Weiterhin gibt es eine Reihe von Buttons mit verschiedenen Funktionen. Die Buttons lösen verschiedene Funktionen aus und steuern den Programmablauf.

Voice


Start	Startet die Stimmensynthese mit den aktuell eingestellten Parametern
Stop	Stoppt die laufende Stimmensynthese

Settings


Save Setting	Alle Parameter werden als Datensatz lokal gespeichert. Es muss kein Dateiname vergeben werden.
Load Setting	Falls ein vormals gespeicherter Parameter Datensatz vorhanden ist, so wird dieser durch Klicken auf diesen Button geladen.

Aufnahme Das Programm bietet die Möglichkeit das erzeugte Stimmensignal als WAVE Datei aufzuzeichnen, so dass keine Aufnahme mit dem Mikrofon erfolgen muss.


Symbol "REC"	Bei Klicken auf dieses Symbol startet der Aufnahmeprozes. Die Anzeige im Panel wechselt auf "RECORDING" und ein Bandzählwerk zeigt die Aufnahmezeit an. Weiterhin wird ein ablaufender Timer angezeigt, der die Aufnahme nach 600s automatisch beendet. Dieses dient dazu, dass die Aufnahmedatei nicht zu groß wird.
Symbol "STOP"	Stoppt die laufende Aufnahme. Die Anzeige wechselt auf "STOPPED" und das Bandzählwerk hält an
Symbol "DISKETTE"	Speichert die erzeugte Aufnahme. Diese wird mit dem Standardnamen "Vox-Occulta6.wav" in den Downloadbereich des Browsers heruntergeladen

Die App bietet die Möglichkeit die synthetische Stimme über die PC Lautsprecher abzuspielen oder über die eingebaute Aufnahmefunktion. Nach meinem Eindruck bringt die erstere Methode etwas bessere Ergebnisse. Die optimale Einstellung aller Parameter ist durchaus komplex und jeder hört Stimmen anders. Sie müssen also selbst die optimalen Parameter finden. Das Programm startet mit den Parametern, die ich selbst als optimal empfinde.

Auch die Stimmen, welche dieses Programm erzeugt müssen noch nachbearbeitet werden, allerdings nicht viel. Ich verwende den Audio Editor Audacity und benutze darin die Kombination von Paulstretch (Dehnungsfaktor 1,2 und 0,01s Auflösung) und den Equalizer um die Höhen anzuheben. Danach höre ich die Aufnahme in Schleifen von 1s-3s Länge ab.

Wichtig: Das Programm hat einige Eigenarten, die ich selbst noch nicht ganz verstehe. Deshalb sollte man nach dem Start der Stimme einmal den Delay Regler verstellen. Die Stimmen werden dann lauter und deutlicher!

Hier geht es zur App