En semana santa tuve el privilegio de asistir a la conferencia ECIR 2012 que se celebró en Barcelona. Esta conferencia está considerada como un referente en la recuperación de información a nivel europeo y es un marco inmejorable para conocer los últimos avances en la materia de recuperación de información, ya sea en modelos teóricos, sistemas de evaluación o aplicaciones.

Se celebraron dos charlas invitadas que corrieron a cargo de Paolo Boldi y Yoelle Maarek. Paolo presentó sus trabajos sobre redes aplicadas a IR, mientras que Yoelle presentó trabajos de análisis del usuario en búsquedas web en función de LOGS y CLICKS, además de los modelos de transiciones entre interacciones.

Para finalizar la conferencia, se llevó a cabo un ‘Industry Day’, en el que empresas relevantes del sector presentaron sistemas comerciales o investigaciones propias.

Además de la conferencia, se celebraron conjuntamente una serie de workshops y tutoriales focalizados en temas particulares relacionados con IR. Los workshops fueron: (i) Information Retrieval Over Query Sessions (SIR2012), (ii) Task-Based and Aggregated Search (TBAS) y (iii) Searching 4 Fun!. Los tutoriales que tuvieron lugar fueron: (i) Question Answering Systems: History and Architecture, (ii) Quantum Information Access and Retrieval, (iii) Designing the Search Experience, (iv) Music Information Retrieval 2.0 y (v) From Expert Finding to Entity Search on the Web. Toda la información relacionada con los tutoriales se puede encontrar aquí.

El primer workshop de ‘Information Retrieval Over Query Sessions’ tenía pinta de ofrecer una visión de sesiones de búsqueda pero no cumplió mis expectativas y únicamente manejaba la consulta. Eso sí, en una sesión completa de búsqueda. La primera charla de este workshop correspondió a Mounia Lalmas que presentó un trabajo centrado en ‘User Engagement’. Esta área se centra en investigar cómo y porqué los usuarios están o dejan de estar implicados en el uso de una aplicación o sistema. El resto de las charlas se centraban en la reformulación de la consulta mediante el uso de contexto y el análisis de LOGS..

Además, asistí al workshop ‘Task-based and Agreggated Search (TBAS)’ con gran interés dado que está cercanamente relacionado con mis temas de investigación. Se centraba en la búsqueda de información en diferentes fuentes y las técnicas actuales de fusión (agregación) que se utilizan. Uno de los organizadores del workshop es Birger Larsen, profesor en la Royal School of Library and Information Science de Copenague.

La charla invitada fue llevada a cabo por Kalervo Järvelin, profesor titular de la universidad de Tampere. Hizo una presentación del estado actual del área de investigación, tanto de la búsqueda basada en tareas como de la búsqueda agregada. La búsqueda basada en tareas es una búsqueda que no persigue la satisfacción de una necesidad de información aislada sino que busca completar una tarea concreta. La búsqueda agregada persigue la fusión de diferentes tipos de documentos y la forma en la que se le muestran al usuario. Simplificándolo, se podría considerar que mi investigación está ubicada dentro del área de búsqueda agregada y por eso me parece todavía más interesante la frase que presentó Kalervo: ‘Information integration finding relevant information from various sources learning about it: contents, structures, semantics and heterogeneous factors of resources harmonizing information for presentation’. Esta frase simboliza perfectamente la búsqueda agregada.

El resto de las charlas presentaban sistemas diversos en lo que se podían encontrar desde un sistema de contextualización que considera los documentos de la colección como una red enlazada de la que obtiene información hasta un par de sistemas que hacen fusión de documentos (Agreggated Search) de la colección iSearch que utilizan la mayoría de los sistemas presentados al workshop. Esta colección es buena para el estudio de las interacciones de usuario, pero en lo que se refiere a mi ámbito de investigación no os suficiente, puesto que aun teniendo documentos de diferente tipo, no contempla documentos de diferente formato.

Me gustaría destacar el trabajo de Thomas Beckers y Norbert Fuhr, en el que se presenta una arquitectura teórica para sistemas de IR basada en niveles. Esta división en niveles es muy apropiada porque se aproxima a una posible arquitectura definida en mi investigación. El nivel funcional de la arquitectura es el que define la secuencia de actuación de los procesos para completar la ejecución. Beckers y Fuhr dividen este nivel en tres partes, una que se encarga de las funciones de búsqueda, organización y presentación de resultados, otra que maneja las sesiones de búsqueda y otra que se encarga de las tácticas y estrategias de búsqueda.

La principal conclusión que obtuve de la conferencia es que las colecciones de evaluaciones (por lo menos las considerablemente grandes) están en poder de las grandes empresas que las generan (Google, Yahoo! o Microsoft) y que todavía son reacias a distribuirlas libremente para investigación. Debido a esto, las investigaciones que necesitan de estas colecciones se ven perjudicadas en detrimento de estas empresas.

La segunda conclusión es que tanto las redes sociales como los dispositivos móviles adquieren cada vez más protagonismo en la investigación, tanto para desarrollar aplicaciones como para aplicar técnicas propias de ellos (tecnologías móviles y de redes sociales).


Julián Moreno Schneider es Ingeniero de Telecomunicaciones por la Universidad Carlos III de Madrid desde 2009. Actualmente Profesor de Ayuda al Máster del Área de Ciencias de la Computación e Inteligencia Artificial del Departamento de Informática de la Universidad Carlos III de Madrid y miembro del Grupo de Bases de Datos Avanzadas. Sus líneas de interés son la tecnologías del lenguaje humano (recuperación y extracción de información multilingüe en distintos dominios y búsqueda de respuestas), interacción hombre-máquina y tecnología domótica.

 

Tagged with:  
Share →