22 | 0:00:00 Starten0:00:15 Qualität von Sprachmodellen0:04:22 Entropie einer Wortquelle0:09:36 Perplexität von Sprachmodellen0:17:42 Perpkexität und Akustik0:21:51 Adaption - Motivation0:30:51 Adaption des Akustischen Modells0:38:46 Adaption als Transformation0:40:45 Arten der Adaption0:50:50 Anweundung der Transformation0:54:11 Adaptionsmethoden0…
21 | 0:00:00 Starten0:01:04 Korrektives Training0:12:17 Transinformation/ Mutual information0:21:21 Erweiterte Baum-Welch Regeln0:31:00 MWE/MCE Training0:56:56 Herausforderung bei der OOV Detektion1:09:49 Lernen der neuen Wörter1:15:34 MotivationVon Dr. Sebastian Stüker
20 | 0:00:00 Starten0:01:10 Mehrpass Suchen0:03:15 beispiel: IBIS Single Pass Decoder0:10:01 Consensus Decoding0:13:08 Bsp: MAP vs. Wort-Posteriori-W‘keiten0:17:54 Minimierung des Wortfehlers0:21:23 Approximierung mit N-besten Listen0:25:09 WER Minimierung auf Wortgraphen0:33:50 Algiment als Äquivalenzrelation0:37:22 Intra-Wort-Clustern0:41:36 Conf…
19 | 0:00:00 Starten0:00:09 Start0:00:22 Kontinuierliche Suchräume, gleichverteiltes Sprachmodell0:07:31 Suchraum mit Tri-Grammen0:08:57 Viterbi Decoding0:13:15 A* mit Stack Decoder0:16:43 Heuristik für A*0:21:35 Fast Match0:25:21 Vor- und Nachteile Stackdecoder0:28:35 A* vs. Strahlsuche0:33:40 Vermeidung von Redundanzen0:36:53 Baumsuche0:39:27 Bau…
18 |0:00:00 Starten0:01:53 Chartparsing0:03:45 Probabilistische CFGs0:07:16 Suche0:10:24 Suche in der Spracherkennung0:24:59 Suche mit DP und Heuristik0:31:09 Explizite vs. Implizite Implementierung0:42:08 Suchstrategien0:44:13 Tiefensuche vs. Breitensuche0:49:34 Heuristische Graphsuche0:52:49 Zeitasynchrone Suche mit A*0:58:09 Zeitsynchrone Strahl…
14 | 0:00:00 Starten0:00:35 Polyphone - Datenmangel0:03:50 Polyphone0:10:07 Backoff für Polyphone0:13:27 Bottom-Up vs. Top-Down Clustering0:17:38 Distanzen für Polyphonecluster0:23:08 Diskrete Entropiedistanz0:29:30 Gewichtete Entropiedistanz0:32:27 Clustern von Polyphonen mit Entropiedistanz0:38:59 Clustern nach Kai-Fu Lee0:48:37 Clustering mit En…
12 | 0:00:00 Starten0:02:07 Expectation Maximization (EM)0:05:35 EM0:09:59 EM - Expectation Schritt0:14:39 EM für Mixtur-Gewichte0:23:40 EM für Mixturgewichte0:30:07 EM für Gaußmixturen0:52:19 EM für HMMs0:56:20 EM für HMMs Anfangswahrscheinlichkeiten0:58:23 EM für Übergangswahrscheinlichkeiten1:09:43 HMM Training für multiple Trainingssequenzen1:1…
11 | 0:00:00 Starten0:00:31 Die Fundamentalformel (Erinnerung)0:01:00 Hidden Markov Model Ansatz0:04:14 Münzen-Beispiel0:10:53 Urne Ball Modell0:12:02 HMM Definition0:14:06 HMM Beobachtungsgenerierung0:16:13 Die HMM Trellis0:17:05 Die drei Probleme der HMMs0:22:46 Forward Algorithmus0:39:03 Backward Algorithmus0:41:01 Das Decoding Problem0:43:10 Vi…
05 | 0:00:00 Starten0:00:31 Wortfehlerrate0:03:26 Minimale Editierdistanz0:09:36 Eigenschaften der WER0:14:07 Probleme mit der WER?0:18:00 WER in den DARPA Evaluationen0:28:50 Grundlagen der Signalverarbeitng0:29:25 Wozu Signal(vor)verarbeitung?0:32:29 Systeme0:35:19 Zeitinvariante System0:36:54 Dirac Distribution0:43:50 Faltung0:46:58 Impulsantwor…
04 | 0:00:00 Starten0:00:57 Schriftsysteme0:14:06 Verteilung der Schriftsysteme0:17:36 Mikrofone0:27:17 Überblick0:28:14 Wandlerprinzipien0:37:19 Richtcharakteristik0:45:29 Akustische Bauformen0:59:31 Pop- und Windschutz1:01:05 Geschichte der ASR1:11:48 Euphonia -Speech Organ (1846)1:15:10 Radio Rex1:16:24 Vocoder1:18:38 Harpy…
03 | 0:00:00 Starten0:00:19 Heute0:01:22 Stimmhafte Sprache0:01:48 Stimmlose Sprache0:02:09 Grundfrequenz/-ton0:03:39 Sprachlaute-Vokale und Konsonante0:07:03 Vokale0:09:50 Diphthonge0:11:50 Konsonanten0:15:22 Ort der Artikulation0:18:27 Art der Artikulation0:22:40 Internationale Phonetische Alphabet0:23:47 Beispielkonfigurationen0:24:42 IPA Konson…
02 | 0:00:00 Starten0:00:19 Heute0:01:24 Taxonomie von Sprache0:02:30 Taxonomie von Spracherkennungssystemen/-aufgaben0:12:48 Ist Spracherkennung schwierig?0:16:35 Warum ist ASR schwierig?0:21:49 Variabilität auf Signalebene0:25:37 Variabilität auf phonetischer Ebene0:30:00 Mehrdeutigkeit auf linguistischer Ebene0:33:17 Segmentierung0:36:13 Sprache…
01 | 0:00:00 Starten0:00:04 Übersicht0:01:14 Automatische Spracherkennung0:09:00 Sprache vs. Sprache0:12:35 Anwendungen von ASR0:47:21 Vorteile von ASR0:55:13 Nachteile von ASR1:02:14 Taxonomie von SpracheVon Dr. Sebastian Stüker
0:00:00 Starten0:00:16 Minimierung des Wortfehlers0:02:50 Approximierung mit N-besten Listen0:04:06 WER Minimierung auf Wortgraphen0:04:18 Multiple Alignment WER0:07:03 Finden des globalen Alignment0:08:21 Alignment als Äquivalenzrelation0:09:44 Finden einer angemessenen Äquivalenzrelation0:12:02 Intra-Wort-Clustern0:14:58 Pruning0:15:45 Confusions…
18 | 0:00:00 Starten0:01:22 Vor- und Nachteile eines Stackdecoders0:05:30 A* vs. Strahlsuche0:07:22 Vermeidung von Redundanzen0:09:23 Baumsuche0:12:11 Baumsuche mit Sprachmodell0:13:54 Delayed Bi-Grams0:21:15 Einsparung durch Baum-Lexica0:25:40 Kopien von Suchbäumen0:29:50 Suche mit kontextabhängigen Modellen0:32:24 Baumsuche mit kontextabhängigen …
17 | 0:00:00 Starten0:00:04 Suche0:01:31 Erinnerung: Fundamentalformel0:02:05 Suche in der Spracherkennung0:05:08 Erinnerung DTW und One-Stage-DP0:07:02 Suche im Allgemeinen0:09:33 Suche mit DP und Heuristik0:11:37 Kenngrößen für Suchprobleme0:14:42 Forward-/Backward-/bi-direktionale Suche0:16:34 Explizite vs. Implizite Implementierung0:18:15 Blind…
15 | 0:00:00 Starten0:00:05 Aussprachewörterbücher, Sprachmodelle0:00:41 Flexibles Trainingsalignment0:01:05 Aussprachen bestimmen für unüberwachtes Lernen0:05:18 Emotionserkennung mit Hilfe von Aussprachenvarianten0:06:27 Aussprachewörterbuch Entwicklung (nach Adda-Decker und Lamel)0:09:10 Multiworte0:12:05 Single Pronunciation Dictionaries0:15:06…
13 | 0:00:00 Starten0:00:06 EM Algorithm0:00:22 Literatur0:01:46 Baum-Welch Regeln0:03:41 Maximum-Likelihood Methode0:42:38 Expectation Maximization (EM)0:45:19 EM0:49:06 EM – Expectation Schritt0:54:25 EM für Mixtur-Gewichte1:05:41 EM für Gaußmixturen1:17:21 EM für HMMs1:20:05 EM für HMMs Anfangsw´keiten1:22:18 EM für HMMs Übergangsw´keiten1:24:26…
12 | 0:00:00 Starten0:00:11 EM Algorithmus Emissionsw'keiten GMM0:06:13 HMM Training für multiple Trainigssequenzen0:07:32 HMMs in ASR0:10:16 Wortfolge zu HMM0:13:56 HMM in ASR0:26:49 HMM Trainingszyklus0:36:21 Etikettierte Daten0:38:19 Initalisierung mit K-Mittelwerte Algorithmus0:47:19 Neural Gas Algorithmus0:49:20 Initilisierung der HMM Paramete…
11 | 0:00:00 Starten0:00:05 EM Algorithm0:00:19 Literatur0:01:55 Baum-Welch Regeln0:03:38 Maximum-Likelihood Methode0:42:31 Expectation Maximization EM)0:45:17 EM0:49:09 EM – Expectation Schritt0:54:05 EM für Mixtur-Gewichte1:00:55 EM für Mixturgewichte1:05:43 EM für Gaußmixturen1:17:48 EM für HMMs1:20:37 EM für HMMs Anfangsw´keiten1:22:50 EM für H…
09 | 0:00:00 Starten0:00:26 DTW für einzelne Wörter0:03:44 DTW für Sequenzen mehrere Wörter0:09:45 One Stage DP0:12:48 One Stage DP Implementierung0:17:29 One Stage DP Syntaktische Einschränkung0:20:34 Gaußverteilung (Normalverteilung)0:26:12 Multivariate Normalverteilung0:27:33 Kovarianzmatrix der Gaußverteilung0:34:24 Gauß-Mischverteilung0:35:16 …
05 | 0:00:00 Starten0:00:33 Grundlagen der Signalverarbeitung0:00:50 Wozu Signal(vor)verarbeitung?0:02:33 Systeme0:06:21 Zeitinvariante System0:09:58 Dirac Distribution0:18:18 Faltung0:20:35 Impulsantwort0:26:59 Quelle Filter Modell der Sprache0:30:42 Parametereigenschaften einer trigonometrischen Funktion0:32:31 Darstellungen der Fourierreihe0:38:…
02 | 0:00:00 Starten0:00:09 Einführung und Anwendungen0:01:08 Ist Spracherkennung Schwierig?0:02:00 Warum ist ASR schwierg?0:02:51 Variabilität auf Signalebene0:09:44 Variabilität auf phonetischer Ebene0:12:57 Mehrdeutigkeit auf linguistischer Ebene0:16:32 Segmentierung0:18:24 Sprache aus Sicht der Maschine0:19:15 Spracherkennung als Klassifikation…
04 | 0:00:00 Starten0:00:04 Inhalt: Mikrofone, Wortfehlerrate0:00:40 Mikrofone0:01:25 Wandlerprinzipien0:02:21 Richtcharakterristik0:05:56 Akustische Bauformen0:20:12 Pop- und Windschutz0:23:44 Geschichte der ASR0:39:56 Euphonia – Speech Organ (1846)0:41:03 Radio Rex (1922)0:43:11 Vocoder (1939)0:43:59 HARPY (1976)0:48:19 Wortfehlerrate0:50:19 Mini…
01 | 0:00:00 Starten0:00:55 Was ist Automatische Spracherkennung?0:05:14 Sprache vs. Sprache0:11:29 Anwendung von ASR0:32:10 Vorteile von ASR0:40:11 Aktuelles Beispiel0:42:51 Nachteile von ASR0:49:51 Taxonomie von Sprache1:05:32 Ist Spracherkennung schwierig?1:08:01 Warum ist ASR schwierig?Von Dr. Sebastian Stüker
22: Vorlesung |0:00:00 Starten0:00:43 Adaption0:08:52 Motivation0:13:40 Adaption des Akustischen Modells0:16:21 Mögliche Variationen0:18:24 Adaption als Transformation0:22:51 Arten der Adaption0:27:13 Batch vs. Inkrementell0:31:17 Überwachte und Unüberwachte Adaption0:32:18 Training vs. Normalisierung0:33:07 Merkmals vs. Modelladaption0:36:23 Anwen…
18: Vorlesung |0:00:00 Starten0:00:37 Graphembasierte Spracherkennung0:06:48 Eignung von Graphemen0:14:38 Verteilung von Schriften0:16:21 Verteilung der Schriftsysteme0:17:12 Eignung von Graphemen0:18:10 Beispiele für schlechte Korrespondenz0:19:32 Graphembasierte ASR für Arabisch0:20:19 Englisch, Deutsch, Russisch, Spanisch, Thai0:21:12 Kontextabh…
15: Vorlesung |0:00:00 Starten0:05:06 Fehler durch falsche Aussprachen0:08:07 Generierung von Aussprachewörterbüchern0:11:32 Verwendung von existierenden Wörterbüchern0:18:46 Lernen von Ausspracheregeln0:28:21 Inkrementelles Lernen0:30:07 Aussprachevarianten0:33:21 Finden von Aussprachevarianten0:35:28 Probleme mit Aussprachevarianten0:39:45 Typisc…
14: Vorlesung |0:00:00 Starten0:02:34 Polyphone0:03:32 Polyphone-Datenmangel0:04:32 Anzahl der Polyphone0:05:46 Häufigkeiten der Polyphone0:07:42 Backoff für Polyphone0:10:10 Gekoppelte Polyphone0:11:32 Bottom-Up vs. Top-Down Clustering0:13:15 Bottom-Up Clustering0:13:41 Top-Down Clustering0:14:30 Probleme beim Clustering0:15:48 Distanzen für Polyp…