CLASIFICACIÓN AUTOMÁTICA DE OPINIONES

Esta herramienta realiza una clasificación automática basada en la opinión de documentos multilingües, para ello procesa el texto proporcionado determinando si expresa o no una opinión.

La clasificación de opinión asigna cada documento a una categoría predefinida de acuerdo a la polaridad de su información subjetiva, en este caso se emplean tres categorías distintas: Opinión Positiva, Opinión Negativa, No Opinión. Cuando se trata de las dos primeras categorías tambien se calcula para cada uno de los documentos analizados un valor porcentual que indica el grado de intensidad de la opinión.

Para llevar a cabo el procesamiento de los textos se utilizan diccionarios que contienen información semántica asociada a cada palabra o conjunto de palabras. De esta manera a cada término de un diccionario le corresponde un valor que indica si se trata de un término positivo o negativo y el grado de intensidad correspondiente. Además existirán términos cuyo valor únicamente modificará el grado de intensidad de otros términos o incluso su polaridad. A continuación se muestra un extracto del diccionario:

    abominable N+
    absoluto +
    absurdo N
    aceptable P-
    admirable P
    algo -
    apasionante P+
    apático N-
    carente *
Actualmente se emplean diccionarios para los siguientes idiomas: español (más de 11.000 términos), inglés, francés, catalán, euskera y gallego.

Esta herramienta está basada en la familia STILUS de productos de tecnología lingüística, que ofrece funcionalidad para la clasificación automática de opiniones, a partir de la información semántica del texto. El algoritmo de clasificación emplea un modelo basado en palabras clave, siguiendo los siguientes pasos:

  • Paso I: extracción de los indicadores de opinión y separación del texto en sintagmas para su posterior procesamiento.
  • Paso II: modificación del grado de intensidad de los indicadores para cada uno de los sintagmas.
  • Paso III: inversión de polaridad de los indicadores correspondientes mediante el uso de los marcadores de polaridad.
  • Paso IV: clasificación del texto en función de unos umbrales de decisión dependientes del idioma.

Como resultado del proceso de clasificación se presenta, junto con el valor que indica el grado de intensidad de la opinión, una lista con los términos empleados y excluídos del análisis.

Clasificación automática de opiniones


Pruébalo >>
Clasificación automática de opiniones (última actualización: 12/12/2011)
© 2011 Daedalus-Data, Decisions and Language, S. A.

Clasificación automática de opiniones

Prototipo para la clasificación automática de opiniones en diversos idiomas.

Pruébalo >>