Clasificación automática de opiniones
Prototipo para la clasificación automática de opiniones en diversos idiomas.
Esta herramienta realiza una clasificación automática basada en la opinión de documentos multilingües, para ello procesa el texto proporcionado determinando si expresa o no una opinión.
La clasificación de opinión asigna cada documento a una categoría predefinida de acuerdo a la polaridad de su información subjetiva, en este caso se emplean tres categorías distintas: Opinión Positiva, Opinión Negativa, No Opinión. Cuando se trata de las dos primeras categorías tambien se calcula para cada uno de los documentos analizados un valor porcentual que indica el grado de intensidad de la opinión.
Para llevar a cabo el procesamiento de los textos se utilizan diccionarios que contienen información semántica asociada a cada palabra o conjunto de palabras. De esta manera a cada término de un diccionario le corresponde un valor que indica si se trata de un término positivo o negativo y el grado de intensidad correspondiente. Además existirán términos cuyo valor únicamente modificará el grado de intensidad de otros términos o incluso su polaridad. A continuación se muestra un extracto del diccionario:
Esta herramienta está basada en la familia STILUS de productos de tecnología lingüística, que ofrece funcionalidad para la clasificación automática de opiniones, a partir de la información semántica del texto. El algoritmo de clasificación emplea un modelo basado en palabras clave, siguiendo los siguientes pasos:
Como resultado del proceso de clasificación se presenta, junto con el valor que indica el grado de intensidad de la opinión, una lista con los términos empleados y excluídos del análisis.
Prototipo para la clasificación automática de opiniones en diversos idiomas.