Autores
Calvo Castro Francisco Hiram
Gelbukh Alexander
Título An innovative two-stage WSD unsupervised method
Tipo Revista
Sub-tipo Tipo C
Descripción Procesamiento de Lenguaje Natural
Resumen Se propone un método no supervisado para la desambiguación de sentidos de palabra. El sentido de un vocablo ambiguo depende de los sentidos de otras palabras que aparecen en contextos similares en un corpus. El entrenamiento consiste en obtener una lista ponderada de sinónimos o palabras relacionadas (quasi-sinónimos) para cada vocablo del corpus tomando en cuenta la similitud de sus contextos. Adaptamos el algoritmo de McCarthy et al. 2004 para encontrar el mejor sentido de cada ocurrencia, en lugar de encontrar el sentido predominante de cada palabra en todo el corpus. Su algoritmo de maximización permite entonces que cada quasi-sinónimo acumule puntaje para cada sentido del vocablo ambiguo. El sentido con puntaje más alto es el seleccionado. Se obtuvo una precisión máxima de 69.86% usando el mismo corpus para entrenamiento y desambiguación. | An unsupervised method for word sense disambiguation is proposed. The sense of the word is chosen to be the most similar to the senses of other words that appear in the corpus in similar contexts. Training consists of building a weighted list of related words (quasi-synonyms) for each word; the weights are obtained by measuring similarity between the word’s contexts. We adapt the algorithm of McCarthy et al. 2004 for finding the best sense in each occurrence, instead of finding the predominant sense of each word in the entire corpus. Their maximization algorithm allows then each quasi-synonym to accumulate a score for each ambiguous w
Observaciones http://rua.ua.es/dspace/handle/10045/5041?locale=ca
Lugar
País Mexico
No. de páginas 99-105
Vol. / Cap. 40
Inicio 2008-04-01
Fin
ISBN/ISSN