Boletín Mensual de Fundación Unitec - nº33

Octubre de 2005 

:: Artículo | Volver al Boletín |

XERKA: La aplicación de novedosas tecnologías para el procesamiento de la información textual como apoyo a los Sistemas de Inteligencia Competitiva


 

Cuando hablamos de los procesos de análisis de información o de Vigilancia Tecnológica y de Mercado o más ampliamente de Inteligencia Competitiva en la empresa nos encontramos con la gran dificultad de tratamiento de la información textual. La búsqueda, localización y análisis de esta información tan importante para los procesos competitivos tiene sin embargo una gran dificultad debido a su falta de estructura y a la sociedad multilingüe en la que vivimos.

Las herramientas de búsqueda de información en la red suponen un elemento de uso imprescindible para la generación de conocimiento. En general los buscadores representan hoy en día uno de los principales soportes de búsqueda de información en la red. Sin embargo, estos motores de búsqueda tienen capacidades muy limitadas en cuanto a la determinación de la semántica de los documentos recuperados, y por ende presentan dificultades a la hora de valorar con exactitud el grado de proximidad semántica entre los documentos recuperados y las necesidades concretas de información del Usuario: ¿de qué temas trata el documento? ¿qué relevancia tiene cada uno de ellos? ¿cuál es el criterio adecuado de clasificación en mi BBDD?.

Xerka supone una importante contribución en las áreas de Information Retrieval y Text Mining, como modelo de interacción de técnicas de PLN (Procesamiento de Lenguaje Natural), con mecanismos de Indexación Multidimensional y Relacional, con objeto de presentar al Usuario toda la información accesible de acuerdo a sus propias necesidades, asistiendo a éste en el complicado proceso de Generación de Conocimiento.

Aplicación práctica como sistema de vigilancia en la empresa
Cuando los expertos enumeran las Fases del Proceso de Vigilancia e Inteligencia Competitiva, en general, coinciden en las siguientes:

  • Identificar y analizar las necesidades
  • Obtener la información
  • Analizar, procesar y valorizar la información
  • Difundir los resultados
  • Usar la información (decidir)
  • Proteger los resultados

En la empresa, una vez interiorizado el valor de la vigilancia y su necesidad, se plantea el paso de la teoría a la práctica. ¿Se puede sistematizar la explotación de información? ¿Se puede automatizar? En este momento, la respuesta es sí. El objetivo de Xerka, como herramienta de vigilancia, es automatizar las diferentes fases del proceso y proporcionar al usuario la información precisa para su explotación en los procesos de Inteligencia Competitiva. El siguiente cuadro resume las funcionalidades de Xerka vinculadas a las fases de búsqueda, análisis y difusión de la información relevante en un proceso de VT/IC.

Fases del proceso VT-IC Puntos clave de Xerka
Identificar y analizar las necesidades Definición de Espacios Temáticos por usuario o grupos de usuarios: trabajo base de consultoría en el que se estudian las necesidades de cada empresa y se generan los ejes temáticos de Xerka
Obtener la información Captación automática mediante robots que realizan una búsqueda inteligente de información. Xerka realiza una exploración multilingüe in-interrumpida en Internet, logrando una gran rapidez, cobertura y precisión en la obtención de resultados.
Analizar, procesar y valorizar la información Analiza la información por su contenido (Procesamiento del Lenguaje Natural) y la clasifica por múltiples criterios (indexación multidimensional) Revisión continua y automática de los cambios en los documentos y actualización continua de Nuevos Términos para describir los espacios temáticos de interés- Re-indexación automática.
Difundir los resultados Proporciona un acceso directo a la información a través de la interfaz "Rosa de los Temas" donde el usuario realiza sus consultas. Además, dispone de un módulo opcional para la generación de Alertas.

El ensamblaje de estas Fases hace de Xerka una herramienta capaz de explorar ininterrumpidamente las fuentes disponibles de información documental, filtrar, evaluar y clasificar los documentos encontrados dentro de un espacio multitemático adaptado a las necesidades del usuario, y finalmente proporcionar al usuario la agilidad de acceder a toda la información de manera inmediata (mediante indexación previa), por términos, conceptos o por intersección temática (multimodal), por similitud semántica (multidimensional) y en cuatro idiomas: español, inglés, euskera y francés (multilingüe).

Itziar Lasaosa Torrontegi
Directora de Marketing
ilasaosa@diana-tek.com

Si desea ponerse en contacto con la edición de este Servicio de Boletín envíenos un e-mail a avc@ikertia.net. Prohibida la reproducción total o parcial de este material sin previa autorización escrita.

[ Claúsula de Confidencialidad]

Fundación Unitec 2005
Colón de Larreategui 26 - 3A
48009 Bilbao (BIZKAIA)

Tel: 94 423 36 18
Fax: 94 423 82 63
www.ikertia.net · avc@ikertia.net