Entradas

NoSQL como soporte para el BigData.

Imagen
  Big data se aplica a la captura, gestión y procesamiento de conjuntos de datos que superan las capacidades del software habitual. Los tamaños de Big data están cambiando constantemente. Es importante porque es un concepto que engloba y se relaciona con otras tendencias como cloud computing, movilidad, Internet de las cosas, ciberseguridad, analytics, etc. La adopción de Big Data parece ser un hecho que tarde o temprano deben realizar las organizaciones.  Es de esperar que las oportunidades que esto brinde compensen la demanda económica y de especialistas requeridos para el análisis de estos grandes volúmenes de datos. Aparece, entonces, el perfil del científico de datos, que podría definirse como la evolución del analista de datos o de negocios en el contexto de Big Data. El científico de datos es una persona con habilidades diversas: ciencias de la computación, analítica, matemáticas, generación de modelos y estadística, además de buen comunicador.  Esas nuevas necesid...

contextos de aplicación

Imagen
  Las base de datos NoSQL han tenido un crecimiento exponencial en los últimos años, el uso acelerado por grandes empresas para escalar sus aplicaciones transaccionales muestran que este tipo de tecnología se esta convirtiendo en una excelente alternativa para almacenar información. Se puede decir que la aparición del término NoSQL aparece con la llegada de la web 2.0 ya que hasta ese momento sólo subían contenido a la red aquellas empresas que tenían un portal, pero con la llegada de aplicaciones como Facebook, Twitter o Youtube, cualquier usuario podía subir contenido, provocando así un crecimiento exponencial de los datos.  Es en este momento cuando empiezan a aparecer los primeros problemas de la gestión de toda esa información almacenada en bases de datos relacionales. En un principio, para solucionar estos problemas de accesibilidad, las empresas optaron por utilizar un mayor número de máquinas pero pronto se dieron cuenta de que esto no solucionaba el problema, además d...

Ventajas y beneficios del paradigma NoSQL.

Imagen
  Hay muchas formas de trabajar reportería con los datos cargados en una base de datos NoSQL, una de ellas es volcar a un RDBMS tradicional. Esta técnica no es atractiva para el analista que desea generar reportes, ya que representa doble trabajo, pero es ideal en muchos casos.  Se deberán crear procesos de ETL para obtener los datos de MongoDB y transferirlos a PostgreSQL, MySQL, Vertica, Teradata, Netezza, o cualquier base de datos 3 relacional. Desde allí se tiene una gran cantidad de herramientas para disponer de los datos de una forma relacional o para el diseño de informes.  Otra forma para generar informes es por medio de PHP, se puede crear consultas con código PHP hacia MongoDB, a través del conector MongoDB PHP.  Si se desea utilizar herramientas avanzadas para análisis de datos como los usados comúnmente en marketing o en BI, el mayor obstáculo es que las bases de datos grandes (incluyendo MongoDB) no son accesibles a través de métodos estándar como JDBC. ...

Principales motivaciones que han originado las BD NoSQL.

Imagen
  Principales bases de datos NoSQL.   Cassandra: Esta base de datos está basada en un modelo de almacenamiento clave – valor, de código abierto que está escrita en Java. Permite grandes volúmenes de datos en forma distribuida. Esta base la usan Twitter, Apple, Facebook, Netflix y Soundcloud, entre otros. La arquitectura de Cassandra está basada en una serie de nodos iguales que se comunican con un protocolo P2P. Está desarrollada por Apache Software Foundation.   MongoDB: Guarda estructuras de datos BSON con un esquema dinámico, haciendo la que la integración de los datos en ciertas aplicaciones sea más fácil y rápida. Es utilizada EA, Verizon, Ebay, Sega, Google y Adobe, entre otros.   CouchDB: Esta base se enfoca en la facilidad de su uso. Emplea JSON para almacenar datos, JavaScript como lenguaje de consulta por medio de MapReduce y HTTP como API. Una de sus características más peculiares es la facilidad con la que permite hacer replicaciones.   SimpleDB: Los...

Introducción a las bases de datos NoSQL

Imagen
  bases de datos NoSQL Actualmente el manejo de la información cada vez se está haciendo más complejo debido a las grandes cantidades de datos que hay que recopilar y tratar. En estos últimos años ha aumentado el interés de los sistemas de bases de datos NoSQL, ya que facilitan el manejo de la información, y las organizaciones cada vez almacenan una mayor cantidad de datos no estructurados. Las bases de datos relacionales han sido las más utilizadas hasta el momento, pero con el crecimiento de las aplicaciones Web, a las que acceden un gran número de usuarios simultáneamente, se ha dado paso a este nuevo concepto. Para aquellas aplicaciones para las que no sirve una base de datos relacional, ya que no realizan una buena gestión de los datos a gran escala, aparecen las bases de datos NoSQL.   Tipos de base de datos NoSQL Se han creado varias variedades de bases de datos NoSQL para soportar necesidades específicas y casos de uso.   Bases de datos de valores clave:  las...

principales retos de NoSQL

Imagen
  No hay duda de que los fabricantes de bases de datos NoSQL se han ganado el reconocimiento y prueba de ello es el hecho de que en el cuadrante Gartner de sistemas de gestión de bases de datos operacionales del pasado año ya se incluyeron 5 soluciones NoSQL (en particular alguna de ellas ya se ha convertido este año en uno de los referentes en soluciones de base de datos para data warehouse (DW)). Autenticación . La fortaleza de la autenticación es uno de los campos de batalla donde muchas implementaciones NoSQL muestran debilidad. Es común encontrar que la las bases de datos NoSQL incorporen credenciales por defecto, o incluso sin autenticación necesaria o deshabilitada (por ejemplo, Redis). En muchos casos se basan en entornos de confianza en lugar de autenticación de usuario. Dependiendo del software siempre será un punto fundamental a chequear. Integridad de los datos. Siguiendo una filosofía donde prima la disponibilidad y el rendimiento, se penaliza en la integridad de los d...