jueves, 2 de mayo de 2013

RECUPERACIÓN DE INFORMACIÓN


La Búsqueda y Recuperación de Información, llamada en inglés Information Search and Retrieval (ISR), es la ciencia de la búsqueda de información en documentos electrónicos y cualquier tipo de colección documental digital, encargada de la búsqueda dentro de éstos mismos, de forma relevante y pertinente.

Para conocer las técnicas y estrategias de recuperación de información,
primero debemos entender cómo funciona el proceso de búsqueda.


En primer lugar imaginemos que una persona tiene una necesidad de información, y la convierte en una consulta. El buscador, mediante un índice, genera una respuesta. Pero si analizamos esa respuesta, probablemente se de el caso de que la persona o:
  • Encuentra lo que busca.
  • Le falta recuperar aún más información.
  • Recupera información que no le sirve.



Para realizar esta consulta, esta persona ha tenido que realizar un proceso de recuperación de información que se lleva a cabo mediante consultas a la base de datos donde se almacena la información estructurada, mediante un lenguaje de interrogación adecuado.

Para realizar una búsqueda satisfactoria debemos saber cada una es diferente a las demás y que no existen pautas fijas que indiquen como hacerlas, de nosotros depende saber personalizarlas y elegir el método adecuado. Sin embargo, podemos seguir los distintos consejos:
  1. Definir claramente el objetivo de la búsqueda.
  2. Determinar el/los temas que verdaderamente interesan y los que se deben excluir de la búsqueda.
  3. Identificar cualquier relación del tema con otras disciplinas que ayuden a diferenciarlo y a evitar confusiones.
  4. Establecer criterios de búsqueda que permitan determinar su nivel y cobertura (Intervalo de años, idioma de los resultados, tipo de documentos: monografías, tesis, vídeos, patentes...)
  5. Formular una estrategia de búsqueda teniendo en cuenta:  
-> Los conceptos más significativos, eliminando los que tengan un      contenido vago o impreciso, que presenten aspectos secundarios o poco importantes.
-> Eliminar distintas expresiones de un mismo concepto, sinónimos, variantes gramaticales...
-> Seleccionar las herramientas de búsqueda (índices, motores de búsqueda...). Es recomendable usar más de uno.





Existen varias técnicas de recuperación de información, entre las más conocidas están por ejemplo: 
  • Técnica de ponderación de términos

En la búsqueda unos criterios tienen más valor que otros, dependiendo de los intereses del usuario.Los documentos se ordenan por orden de importancia. El documento más pertinente de búsqueda sería aquel que tenga representado todos los términos de búsqueda y, además, el que más valor tenga repetidos más veces.
  • Técnicas de clústering
Éstos agrupan muestras de entrada en una serie de grupos y en contraste con la indización manual, en la automática, es un algoritmo el que toma la posición del indizador y se aplica repetidamente a cada documento.  Las técnicas de análisis de clústers y los sistemas de información tienen un mismo objetivo: organizar temáticamente la información almacenada. Al principio este método estaba basado en la estadística, ahora se incluyen técnicas de procesamiento del lenguaje natural.
  • Técnicas de stremming
El streaming involucra el envío de información entre un servidor y un cliente a través de una red como Internet. El servidor rompe la información en paquetes que se envían a través de la red. Los paquetes son re-ensamblados por el cliente, que reproduce la información recibida al mismo tiempo.
El streaming se diferencia de una simple transferencia de ficheros en que el cliente reproduce la información mientras la está recibiendo en vez de esperar a recibirla completamente antes de reproducirla.



Se recomienda utilizar la técnica más utilizada o la que de mejores resultados, aunque debemos saber que su conocimiento es lo que mas importante. Como dijimos antes, la mayoría de estás técnicas son hechas o se utilizan para diferentes búsquedas por que debemos saber elegirlas y adecuarlas a nuestras necesidades.










1 comentario: