Reconocedor de voz adaptado
Fecha
2005-07Autor
García Galván, María Antonieta
Asesor
ARECHIGA MARTINEZ, RENE OCTAVIOMetadatos
Mostrar el registro completo del ítemResumen
El presente trabajo consiste en el desarrollo de un sistema de reconocimiento de voz en base a Modelos Ocultos de Markov (Hidden Markov Models, HMMs) que identifica fonemas y palabras pronunciadas por un locutor hispano hablando en inglés (locutor no nativo). El sistema requiere de dos bases de datos, la de locutores nativos del inglés y la no nativa (locutores hispanos hablando inglés). Los sistemas de reconocimiento de voz en inglés realizados se entrenaron con hablantes nativos del idioma, y la mayoría de los errores de reconocimiento se atribuyen a la variedad de acentos extranjeros. Por esta razón es necesario adaptar los modelos para que adquieran los diferentes rasgos característicos de una población, en este caso de Hispanos. Las técnicas de Adaptación se aplican a un conjunto de Modelos Ocultos de Markov bien entrenados Independientes del hablante y resultan mejor opción respecto a entrenar modelos dependientes de los hablantes. En los resultados obtenidos se puede observar que utilizando solo una pequeña cantidad de datos de un nuevo hablante o un grupo de hablantes se puede adaptar un conjunto de sistemas de modelos independientes del hablante para compaginar las características del nuevo hablante o grupo de hablantes. En el presente trabajo la adaptación se realizó usando MLLR (Maximum Likelihood Linear Regression) y se hicieron algunos experimentos con la técnica MAP (Maximum A Posteriori). This work reports the development of a speech recognition system based on Hidden Markov Models (HMMs), capable of recognizing phonemes and words spoken in English by Hispanics (non-native Speakers). The system uses two different databases, one of natives speaking English and one of non-natives (Hispanics speaking English, Latin-American speech database). English speech recognition systems are trained with native speakers, and most of the recognition errors are attributed to the interference of foreign accents. This is why it is necessary to adapt the models to take into account the characteristic features of a given population; in this case Hispanics. Adaptation techniques are applied to a set of well trained speaker independent Hidden Markov Models. Rather than training speaker dependent models, adaptation techniques can be applied. By using only a small amount of data from a new speaker or group of speakers. A good speaker independent system model set can be adapted to better fit the characteristics of this new speaker or group of speakers. The adaptation technique employed was Maximum Likelihood Linear Regression (MLLR). Some experiments were tried with the MAP.