| Vorwort |
S. XI |
| |
| 1. |
Einführung |
S. 1 |
| 1.1. |
Automatisches Erkennen und Verstehen von Sprache |
S. 1 |
| 1.2. |
Spracherkennungssysteme |
S. 3 |
| 1.3. |
Das Spracherkennungs- und Dialogsystem EVAR |
S. 7 |
| 1.4. |
Die Komponenten des Erkennungs- und Dialogsystem EVAR |
S. 9 |
| 1.5. |
Charakterisierung der Worterkennung im Spracherkennungssystem |
S. 14 |
| 1.6. |
Konzept der Arbeit |
S. 17 |
| 2. |
Ein flexibles Experimentiersystem zur Worterkennung |
S. 20 |
| 2.1. |
Anforderungen an ein Experimentiersystem zur Worterkennung |
S. 20 |
| 2.2. |
Aufbau des Experimentiersystems |
S. 21 |
| 2.3. |
Beispielkonfigurationen für verschiedene Aufgabenstellungen der Worterkennung |
S. 24 |
| 2.4. |
Beurteilungskriterien für Vergleichsverfahren |
S. 27 |
| 3. |
Erzeugen von Aussprachemodellen |
S. 32 |
| 3.1. |
Variation der Aussprache in kontinuierlich gesprochener deutscher Sprache |
S. 32 |
| 3.2. |
Definition von Regelsätzen für Aussprachevarianten |
S. 36 |
| 3.3. |
Repräsentation und Konstruktion von Aussprache-Referenzmodellen |
S. 39 |
| 3.4. |
Automatisches Erzeugen von Aussprachemodellen anhand eines Lexikons |
S. 43 |
| 3.5. |
Interaktives Erzeugen von Aussprachemodellen |
S. 45 |
| 3.6. |
Einbettung der lexikalischen Einheit in das Experimentiersystem |
S. 46 |
| 4. |
Hidden-Markov-Modelle |
S. 49 |
| 4.1. |
Einführung in die theoretischen Grundlagen |
S. 49 |
| 4.2. |
Das Vergleichsverfahren |
S. 53 |
| 4.3. |
Schätzung der Modellparameter |
S. 55 |
| 4.4. |
Berechnungsvorschriften für kantenorientierte Hidden-Markov-Modelle |
S. 58 |
| 4.5. |
Ersetzung der Kanten der Aussprachemodelle durch elementare Markov-Modelle |
S. 59 |
| 5. |
Klassifikation vorgegebener Zeitbereiche mit Hidden-Markov-Modellen anhand kleiner Modellinventare |
S. 64 |
| 5.1. |
Motivation der Aufgabenstellung |
S. 64 |
| 5.2. |
Konkretisierung der Parameterschätzung und des Vergleichsverfahrens für HMM mit kontinuierlichen Ausgabeverteilungen |
S. 67 |
| 5.3. |
Versuchsaufbau und Ergebnisse |
S. 71 |
| 6. |
Explizite Segmentierung in Wortuntereinheiten mit Hidden-Markov-Modellen |
S. 79 |
| 6.1. |
Struktur des Segmentierers |
S. 79 |
| 6.2. |
Bestimmung einer Initialsegmentierung und Suche der optimalen Zerlegung |
S. 82 |
| 6.3. |
Versuchsergebnisse |
S. 85 |
| 7. |
Positionieren von Aussprachemodellen mit Hidden-Markov-Modellen (großer Wortschatz) |
S. 93 |
| 7.1. |
Vergleichsverfahren und Parameterschätzung für Aussprachemodelle auf der Basis von Wortuntereinheiten |
S. 93 |
| 7.2. |
Positionieren von Aussprachemodellen durch ‘Vertikale Summation’ |
S. 103 |
| 7.3. |
Einflußgrößen zur Erzeugung und Normierung von Hypothesen |
S. 111 |
| 8. |
Verifizieren von Hypothesen mit Hidden-Markov-Modellen |
S. 121 |
| 8.1. |
Verschiedene Gründe für die Verifikation von Hypothesen |
S. 121 |
| 8.2. |
Verifizieren von Hypothesen auf Laut- und Lautkomponentenebene |
S. 122 |
| 8.3. |
Verifizieren von Worthypothesen bei Verwendung von Aussprachevarianten |
S. 127 |
| 9. |
Verifizieren von Hypothesen mit dynamischer Zeitverzerrung (DTW) |
S. 131 |
| 9.1. |
Funktionsprinzip |
S. 131 |
| 9.2. |
Abstandsmaße zur Berechnung der Ähnlichkeit |
S. 136 |
| 9.3. |
Globale Wegbeschränkung, Überführungsregeln und Bewertungsnormalisierung |
S. 139 |
| 10. |
Eine Suchstrategie zur kontextfreien Analyse von Wortkettenhypothesen unter Verwendung von Hidden-Markov-Modellen |
S. 143 |
| 10.1. |
Der A*Algorithmus zur Suche von Wortketten |
S. 143 |
| 10.2. |
Konkretisierung des Suchverfahrens zur kontextfreien Analyse von Wortketten |
S. 146 |
| 10.3. |
Versuchsergebnisse |
S. 154 |
| 11. |
Erwartungsgesteuerte Analyse von Wortketten |
S. 165 |
| 11.1. |
Einbettung der Worterkennung in eine erwartungsgesteuerte Analyseumgebung |
S. 165 |
| 11.2. |
Untersuchungen zur erwartungsgesteuerten syntaktischen Analyse von Konstituentenhypothesen |
S. 167 |
| 12. |
Zusammenfassung |
S. 171 |
| 13. |
Literatur |
S. 177 |
| 14. |
Anhang |
S. 186 |
| 14.1. |
Liste der erkennbaren Lautkomponenten des Akustik-Phonetik-Moduls in EVAR |
S. 186 |
| 14.2. |
Liste der vereinbarten Lautklassen des Akustik-Phonetik-Moduls in EVAR |
S. 187 |
| 14.3. |
Regelsatz für Aussprachevarianten |
S. 189 |
| 14.4. |
Liste der Wortarten, semantischen Klassen und pragmatischen Konzepte |
S. 191 |
| 14.5. |
Modellinventar zur Unterscheidung von 14 Lautoberklassen |
S. 194 |
| 14.6. |
Lauterkennungsraten für unterschiedliche Modellinventare |
S. 195 |
| 14.7. |
Klassifikationsergebnisse aufgeschlüsselt nach 36 Lautklassen |
S. 196 |
| 14.8. |
Regelsatz zur Transkription von Lauten nach Lautkomponenten |
S. 197 |
| 14.9. |
Stichprobe für die Verifikationsverfahren mit dynamischer Zeitnormierung |
S. 197 |
| 14.10. |
Sprachumfang der ATN-Grammatiken |
S. 198 |
| 14.11. |
Stichprobe für die Konstituenten- und Satzanalyse |
S. 200 |
| 14.12. |
Erkennungsraten bei einer lokalen Beschränkung des Suchraums |
S. 200 |