jueves, 2 de mayo de 2013

BUSINESS INTELLIGENCE

Como introducción, definiremos el concepto de Inteligencia empresarial. Se denomina así, inteligencia de negocios o BI (del inglés business intelligence) al conjunto de estrategias y herramientas enfocadas a la administración y creación de conocimiento mediante el análisis de datos existentes en una organización o empresa. Para aclarar, no tiene nada que ver con la inteligencia media de las personas en una empresa, sino con los datos y aplicaciones de un negocio, con la intención de entenderlos.

A menudo, el problema de las empresas no es la falta de información, sino tener demasiada. La BI surge como solución a este problema, pues por medio de esta información se pueden generar escenarios, reportes o pronósticos, que ayuden en la toma de decisiones. Puede ser aplicado en muchas áreas, como en marketing, ventas, finanzas...



Para ayudar a implementar estos sistemas inteligentes en las empresas, se han desarrollado varios proyectos software. Entre ellos destacan, por ejemplo:

  • SAGENT SOLUTION PLATTFORM: Este sistema integrado extrae, transforma, mueve, distribuye y presenta la información clave en un entorno homogéneo.
  • MICROSTRATEGY: 
    Provee soluciones a clientes de cualquier industria y/o área funcional con el fin de ayudarlos en la obtención de un mayor conocimiento sobre la información manejada en su empresa.
  • BUSINESS OBJECTS: 
    Suministra a los usuarios el poder acceder de forma sencilla a los datos, analizar la información almacenada y creación de informes 
  • COGNOS: Es un software que ofrece la funcionalidad de análisis y toma de decisiones. Cuenta con una herramienta especial para modelación o pronóstico  y simulación " what-if" o "que pasará si"  del negocio.





Todas las soluciones de BI tienen funciones parecidas, pero deben de reunir al menos los siguientes componentes:
  • Multidimensionalidad: Una herramienta de BI debe de ser capaz de reunir información dispersa en toda la empresa e incluso en diferentes fuentes, para así proporcionar a los departamentos la accesibilidad, poder y flexibilidad que necesitan para analizar la información.
  • Data Warehouse: Es la respuesta de la tecnología de información a la descentralización en la toma de decisiones. Coloca información de todas las áreas en manos de quien toma las decisiones.
  • Agentes: Los agentes son programas que "piensan". Pueden realizar tareas a un nivel muy básico sin necesidad de intervención humana, como por ejemplo, diagramas de flujos.
  • Data Mining: Estas pueden identificar tendencias y comportamientos, no sólo para extraer información, sino también para descubrir las relaciones en bases de datos que pueden identificar comportamientos no muy evidentes.

Son ya muchas las empresas que han implementado soluciones de BI y se han visto enormemente beneficiadas. Un ejemplo de éxito, y una de las primeras en implementar este tipo de estrategias, fue Jhon Deer, productor de maquinaria y útiles agrícolas.





RECUPERACIÓN DE INFORMACIÓN


La Búsqueda y Recuperación de Información, llamada en inglés Information Search and Retrieval (ISR), es la ciencia de la búsqueda de información en documentos electrónicos y cualquier tipo de colección documental digital, encargada de la búsqueda dentro de éstos mismos, de forma relevante y pertinente.

Para conocer las técnicas y estrategias de recuperación de información,
primero debemos entender cómo funciona el proceso de búsqueda.


En primer lugar imaginemos que una persona tiene una necesidad de información, y la convierte en una consulta. El buscador, mediante un índice, genera una respuesta. Pero si analizamos esa respuesta, probablemente se de el caso de que la persona o:
  • Encuentra lo que busca.
  • Le falta recuperar aún más información.
  • Recupera información que no le sirve.



Para realizar esta consulta, esta persona ha tenido que realizar un proceso de recuperación de información que se lleva a cabo mediante consultas a la base de datos donde se almacena la información estructurada, mediante un lenguaje de interrogación adecuado.

Para realizar una búsqueda satisfactoria debemos saber cada una es diferente a las demás y que no existen pautas fijas que indiquen como hacerlas, de nosotros depende saber personalizarlas y elegir el método adecuado. Sin embargo, podemos seguir los distintos consejos:
  1. Definir claramente el objetivo de la búsqueda.
  2. Determinar el/los temas que verdaderamente interesan y los que se deben excluir de la búsqueda.
  3. Identificar cualquier relación del tema con otras disciplinas que ayuden a diferenciarlo y a evitar confusiones.
  4. Establecer criterios de búsqueda que permitan determinar su nivel y cobertura (Intervalo de años, idioma de los resultados, tipo de documentos: monografías, tesis, vídeos, patentes...)
  5. Formular una estrategia de búsqueda teniendo en cuenta:  
-> Los conceptos más significativos, eliminando los que tengan un      contenido vago o impreciso, que presenten aspectos secundarios o poco importantes.
-> Eliminar distintas expresiones de un mismo concepto, sinónimos, variantes gramaticales...
-> Seleccionar las herramientas de búsqueda (índices, motores de búsqueda...). Es recomendable usar más de uno.





Existen varias técnicas de recuperación de información, entre las más conocidas están por ejemplo: 
  • Técnica de ponderación de términos

En la búsqueda unos criterios tienen más valor que otros, dependiendo de los intereses del usuario.Los documentos se ordenan por orden de importancia. El documento más pertinente de búsqueda sería aquel que tenga representado todos los términos de búsqueda y, además, el que más valor tenga repetidos más veces.
  • Técnicas de clústering
Éstos agrupan muestras de entrada en una serie de grupos y en contraste con la indización manual, en la automática, es un algoritmo el que toma la posición del indizador y se aplica repetidamente a cada documento.  Las técnicas de análisis de clústers y los sistemas de información tienen un mismo objetivo: organizar temáticamente la información almacenada. Al principio este método estaba basado en la estadística, ahora se incluyen técnicas de procesamiento del lenguaje natural.
  • Técnicas de stremming
El streaming involucra el envío de información entre un servidor y un cliente a través de una red como Internet. El servidor rompe la información en paquetes que se envían a través de la red. Los paquetes son re-ensamblados por el cliente, que reproduce la información recibida al mismo tiempo.
El streaming se diferencia de una simple transferencia de ficheros en que el cliente reproduce la información mientras la está recibiendo en vez de esperar a recibirla completamente antes de reproducirla.



Se recomienda utilizar la técnica más utilizada o la que de mejores resultados, aunque debemos saber que su conocimiento es lo que mas importante. Como dijimos antes, la mayoría de estás técnicas son hechas o se utilizan para diferentes búsquedas por que debemos saber elegirlas y adecuarlas a nuestras necesidades.