Resumen |
Cuando se digitalizan documentos escritos a mano surgen diversos problemas, sobre todo en la etapa de preprocesamiento de imagenes. Uno de los problemas tiene que ver con la remoción de líneas horizontales que existen en las hojas, ya que muchas veces al traslaparse las líneas con las palabras se dificulta la extraccion de información escrita. Anteriormente ya se han propuesto e implementado distintos enfoques para tratar de resolver este problema con técnicas y algoritmos clásicos de preprocesamiento. Sin embargo, pensamos que es importante el poder aprovechar las ventajas que ofrecen los metodos que se basan en Redes Neuronales Convolucioneles (RNC), ya que estas tienen el potencial de mejorar significativamente la precisión y eficiencia en la eliminación de líneas. En este trabajo presentamos un método para remover líneas en textos manuscritos, sin afectar la información textual o la comprensión del mensaje escrito, implementando una red convolucional tipo U-Net. Para esto se llevaron a cabo experimentos utilizando conjuntos de imágenes especializados para tareas de remoción de pentagramas y para identificación de rasgos de personalidad, ya que no existen conjuntos de imágenes específicos para el problema de eliminación de líneas. |