Vorwort |
S. XI |
|
1. |
Einführung |
S. 1 |
1.1. |
Automatisches Erkennen und Verstehen von Sprache |
S. 1 |
1.2. |
Spracherkennungssysteme |
S. 3 |
1.3. |
Das Spracherkennungs- und Dialogsystem EVAR |
S. 7 |
1.4. |
Die Komponenten des Erkennungs- und Dialogsystem EVAR |
S. 9 |
1.5. |
Charakterisierung der Worterkennung im Spracherkennungssystem |
S. 14 |
1.6. |
Konzept der Arbeit |
S. 17 |
2. |
Ein flexibles Experimentiersystem zur Worterkennung |
S. 20 |
2.1. |
Anforderungen an ein Experimentiersystem zur Worterkennung |
S. 20 |
2.2. |
Aufbau des Experimentiersystems |
S. 21 |
2.3. |
Beispielkonfigurationen für verschiedene Aufgabenstellungen der Worterkennung |
S. 24 |
2.4. |
Beurteilungskriterien für Vergleichsverfahren |
S. 27 |
3. |
Erzeugen von Aussprachemodellen |
S. 32 |
3.1. |
Variation der Aussprache in kontinuierlich gesprochener deutscher Sprache |
S. 32 |
3.2. |
Definition von Regelsätzen für Aussprachevarianten |
S. 36 |
3.3. |
Repräsentation und Konstruktion von Aussprache-Referenzmodellen |
S. 39 |
3.4. |
Automatisches Erzeugen von Aussprachemodellen anhand eines Lexikons |
S. 43 |
3.5. |
Interaktives Erzeugen von Aussprachemodellen |
S. 45 |
3.6. |
Einbettung der lexikalischen Einheit in das Experimentiersystem |
S. 46 |
4. |
Hidden-Markov-Modelle |
S. 49 |
4.1. |
Einführung in die theoretischen Grundlagen |
S. 49 |
4.2. |
Das Vergleichsverfahren |
S. 53 |
4.3. |
Schätzung der Modellparameter |
S. 55 |
4.4. |
Berechnungsvorschriften für kantenorientierte Hidden-Markov-Modelle |
S. 58 |
4.5. |
Ersetzung der Kanten der Aussprachemodelle durch elementare Markov-Modelle |
S. 59 |
5. |
Klassifikation vorgegebener Zeitbereiche mit Hidden-Markov-Modellen anhand kleiner Modellinventare |
S. 64 |
5.1. |
Motivation der Aufgabenstellung |
S. 64 |
5.2. |
Konkretisierung der Parameterschätzung und des Vergleichsverfahrens für HMM mit kontinuierlichen Ausgabeverteilungen |
S. 67 |
5.3. |
Versuchsaufbau und Ergebnisse |
S. 71 |
6. |
Explizite Segmentierung in Wortuntereinheiten mit Hidden-Markov-Modellen |
S. 79 |
6.1. |
Struktur des Segmentierers |
S. 79 |
6.2. |
Bestimmung einer Initialsegmentierung und Suche der optimalen Zerlegung |
S. 82 |
6.3. |
Versuchsergebnisse |
S. 85 |
7. |
Positionieren von Aussprachemodellen mit Hidden-Markov-Modellen (großer Wortschatz) |
S. 93 |
7.1. |
Vergleichsverfahren und Parameterschätzung für Aussprachemodelle auf der Basis von Wortuntereinheiten |
S. 93 |
7.2. |
Positionieren von Aussprachemodellen durch ‘Vertikale Summation’ |
S. 103 |
7.3. |
Einflußgrößen zur Erzeugung und Normierung von Hypothesen |
S. 111 |
8. |
Verifizieren von Hypothesen mit Hidden-Markov-Modellen |
S. 121 |
8.1. |
Verschiedene Gründe für die Verifikation von Hypothesen |
S. 121 |
8.2. |
Verifizieren von Hypothesen auf Laut- und Lautkomponentenebene |
S. 122 |
8.3. |
Verifizieren von Worthypothesen bei Verwendung von Aussprachevarianten |
S. 127 |
9. |
Verifizieren von Hypothesen mit dynamischer Zeitverzerrung (DTW) |
S. 131 |
9.1. |
Funktionsprinzip |
S. 131 |
9.2. |
Abstandsmaße zur Berechnung der Ähnlichkeit |
S. 136 |
9.3. |
Globale Wegbeschränkung, Überführungsregeln und Bewertungsnormalisierung |
S. 139 |
10. |
Eine Suchstrategie zur kontextfreien Analyse von Wortkettenhypothesen unter Verwendung von Hidden-Markov-Modellen |
S. 143 |
10.1. |
Der A*Algorithmus zur Suche von Wortketten |
S. 143 |
10.2. |
Konkretisierung des Suchverfahrens zur kontextfreien Analyse von Wortketten |
S. 146 |
10.3. |
Versuchsergebnisse |
S. 154 |
11. |
Erwartungsgesteuerte Analyse von Wortketten |
S. 165 |
11.1. |
Einbettung der Worterkennung in eine erwartungsgesteuerte Analyseumgebung |
S. 165 |
11.2. |
Untersuchungen zur erwartungsgesteuerten syntaktischen Analyse von Konstituentenhypothesen |
S. 167 |
12. |
Zusammenfassung |
S. 171 |
13. |
Literatur |
S. 177 |
14. |
Anhang |
S. 186 |
14.1. |
Liste der erkennbaren Lautkomponenten des Akustik-Phonetik-Moduls in EVAR |
S. 186 |
14.2. |
Liste der vereinbarten Lautklassen des Akustik-Phonetik-Moduls in EVAR |
S. 187 |
14.3. |
Regelsatz für Aussprachevarianten |
S. 189 |
14.4. |
Liste der Wortarten, semantischen Klassen und pragmatischen Konzepte |
S. 191 |
14.5. |
Modellinventar zur Unterscheidung von 14 Lautoberklassen |
S. 194 |
14.6. |
Lauterkennungsraten für unterschiedliche Modellinventare |
S. 195 |
14.7. |
Klassifikationsergebnisse aufgeschlüsselt nach 36 Lautklassen |
S. 196 |
14.8. |
Regelsatz zur Transkription von Lauten nach Lautkomponenten |
S. 197 |
14.9. |
Stichprobe für die Verifikationsverfahren mit dynamischer Zeitnormierung |
S. 197 |
14.10. |
Sprachumfang der ATN-Grammatiken |
S. 198 |
14.11. |
Stichprobe für die Konstituenten- und Satzanalyse |
S. 200 |
14.12. |
Erkennungsraten bei einer lokalen Beschränkung des Suchraums |
S. 200 |