? Ein Sprachsynthese -Server ist ein Computer im Netzwerk , die einen menschlichen Benutzer für die Eingabe mit Sprachansagen . Diese Server setzen auf viele komplexe zugrunde liegenden Technologien , wie Text -to-Speech , Sprachsynthese und Spracherkennung. Lernen über diese Technologien und wie sie zusammen arbeiten , kann Ihnen ein besseres Verständnis für das komplexe Innenleben der Sprachsynthese -Server. Sprachsynthese Server
Viele Call Center nutzen Sprachsynthese Servern zu routen Anrufer aus dem Hauptmenü, um einen menschlichen Bediener , die in einer bestimmten Abteilung arbeitet . Diese Server sind in der Regel in der Lage, Sprache sowie zu verstehen. Sprachsynthese -Server werden auch in Web -Anwendungen verwendet werden, um sie leichter zugänglich und interaktiv.
Sprachsynthese
Sprachsynthese-Engine akzeptiert Input in Form von vorprogrammierten Text oder Echtzeit- Befehle und Ausgänge erkennbar Rede. Sprachsynthese Motoren dieses Prozesses vorprogrammierten Text oft eine einzelne Aufgabe ausführen , wie Information der Besucher , dass ein bestimmter Bereich tabu ist . Sprachsynthese -Motoren , die Echtzeit- Befehle akzeptiert werden verwendet, um den Behinderten mit einem Mittel, um zu kommunizieren , und werden auch in der Telekommunikation eingesetzt. Die Stimme , die Sie hören von diesen Systemen ist eine Kombination aus menschlichen Stimme Proben und Algorithmen , die die Illusion von glatten Rede erstellen.
Voice Recognition
Spracherkennung Systeme arbeiten in der entgegengesetzten Richtung. Sie interpretieren eines Menschen Rede und wandeln sie in Text um. Spracherkennung Systeme verwenden eine Methode der Interpretation eines Menschen die Rede , die auf Wahrscheinlichkeiten beruht. Zum Beispiel , in einem einfachen Spracherkennungssystem , wo die einzig akzeptable Eingänge sind " ja" oder " nein", der Computer in der Lage, die Wahrscheinlichkeit, dass ein Benutzer sagt das eine oder andere zu berechnen ist . Dies ist möglich, weil das Spracherkennungssystem die phonetischen Laute für jeden Eingang mit einer Datenbank von Proben vergleichen. Das Prinzip ist das gleiche für Systeme mit vielen Eingängen , obwohl die Wahrscheinlichkeit für Fehler ist höher.
Text -to-Speech
Text -to-Speech ist eine Technologie, dass Menschen erkennbaren wandelt Text in seine phonetische Äquivalent , dann wandelt das in Sound mit Lautsprechern. Ein großer Teil dieses Prozesses ist mit der Interpretation des Textes und die Zerlegung in Stücke besorgt . Jedes Stück kann aus mehreren Wörtern zusammengesetzt werden , und stellt einzelne Formulierungen . Auf diese Weise kann der Text -to -Speech-Engine machen Rede , die natürlich für die menschliche Hörer klingt. Anspruchsvolle Text -to- Speech-Engines weiter brechen diese Einheiten in einzelne Silben , komplett mit Tonhöhe und Dauer Informationen .