[RI-FIB] Recuperación de la Información

18May08

En el laboratorio de la asignatura de Recuperación de la Información (RI) de la carrera hemos estado trabajando con la API de Lucene.

Voy a compartir dos prácticas de laboratorio que hemos hecho y que creo que sin interesantes.

En la sesión 1 teníamos un cuerpo de documentos, de los cuales había la primera mitad que hablaban sobre temas científicos y la otra mitad eran artículos aleatorios. El laboratorio consistía en intentar hacer búsquedas para agrupar el máximo numero de documentos científicos (no subo la sesión porque no tuvimos que tocar código ni nada).

En la sesión 2 estuvimos modificando la API de Lucene para aplicar algunos filtros como la “Stemmización” y quitar las Stop Words para mejorar el resultado de las búsquedas dentro de nuestros documentos.

En la sesión 3 estuvimos también modificando la API de Lucene pero esta vez para calcular la relevancia i la precisión de una búsqueda y luego para aplicar “User relevance feedback“, una técnica utilizada para mejorar los resultados de una búsqueda en nuestro cuerpo de documentos.

Os dejo la página oficial de RI por si queréis echarle un vistazo a los enunciados de las sesiones o queréis ver de que va la teoría de la asignatura.

Nota: Esta mañana se ha celebrado el II Torneo Intercomunitario. Mi equipo ha consiguiendo el segundo puesto y yo he sido el pichici ^^! Luego de barbacoa y ahora … el síndrome del domingo por la tarde, ecs.

No comments yet.

Write a comment: