Comparativa base de datos en entornos Cloud

Después de trabajar muchos años con herramientas de diferentes cloud (Google, Amazon y recientemente con Azure) en este artículo preparo una comparativa de base de datos en los entornos Clouds más potentes, incluyendo Snowflake que desde hace unos años viene pisando muy fuerte con sus soluciones así como sus alianzas y capacidades de conexión entre todos los clouds.

Comparativa base de datos: Google BigQuery

Google BigQuery es un servicio de almacenamiento de datos gestionado en la nube. Se abstrae de las configuraciones y de los detalles de hardware y base de datos, es serverless y gestiona almacenamiento y recursos de forma dinámica.

Se denomina una base de datos “hands-off”, sin índices o restricciones por columnas.

Como principales puntos a favor para la comparativa de base de datos podemos mencionar que la configuración de este servicio es super sencilla y rápida.

Otros puntos destacados serían:

  • La ingesta de datos no tiene impacto directo en el rendimiento de las queries ya que los recursos computacionales se usan de forma individual para cargar o para llevar a cabo las extracciones de los usuarios.
  • Capacidad de exportar en diferentes formatos.
  • El modelo de princing, no se realiza por ingestas sino por procesamiento de datos.
  • Permite la ingesta de datos con esquemas desconocidos con la opción “sugerencia de ingesta”
  • No necesita gestión supervisada (fully-managed)

Como puntos en contra podemos mencionar que el usuario no puede definir nodos o capacidad de la instancia BigQuery.

Otros serían:

  • No posee soporte de almacenamiento de ficheros.
  • No permite que los resultados de las queries excedan los 128MB.
  • Servicio global (multi-región) que no cuenta con transparencia en cuanto a zonas de disponibilidad o regiones.
  • Soporte limitado de logging para gestión de cuentas, seguridad y aprovisionamiento.
Puntuación en las review de mercado de Garnet de 4.6

Comparativa base de datos: Microsoft Azure SQL Data Warehouse

Microsoft Azure SQL Warehouse es una base de datos  empresarial capaz de gestionar grandes cantidades de datos, tanto relacionales como no relacionales. La BBDD es ANSI-SQL y se basa en un modelo columnar de los datos.

Se integra con la familia de servicios de SQL Server y de Azure (Azure Data Lake Storage, Data Factory, HDInsight, Databricks, etc.)

Como principales puntos a favor para la comparativa de base de datos podemos destacar que es independiente de la unidad de almacenamiento, lo que permite escalar recursos computacionales y capacidad de almacenamiento de manera individual.

Otros puntos destacados son:

  • Tiene una interfaz muy friendly lo que facilita las tareas de configuración. Debido a la simplicidad de su interfaz la hace muy cómoda la experiencia de usuario.
  • Integrable con herramientas de BI como Datometry, Qlik, MicroStrategy, Informatica, Talend, Tableau, PowerBI, etc.
  • Permite exportar datos a ficheros locales y viceversa, de manera sencilla como se haría con SQL Server.
  • Soporta hasta 128 queries simultáneas.
Puntuación en las review de mercado de Garnet de 4.7

Como puntos en contra podemos mencionar que lleva mucho tiempo el mantenimiento y la adaptación de la infraestructura a nuevos releases de los servicios.

Otros puntos a mencionar serían:

  • Disponibilidad limitada por zonas
  • No cuenta con soporte de versiones
  • No ofrece distribución Linux
  • Necesita gestión supervisada

Comparativa base de datos: Amazon Redshift

Amazon Redshift es un servicio de almacén de datos a escala de petabytes totalmente administrado. Redshift está diseñado para cargas de trabajo analíticas y se conecta con clientes estándar basados en SQL y herramientas de inteligencia empresarial.

Según el sitio web de Amazon, Redshift ofrece un rápido rendimiento de consulta y E/S para conjuntos de datos de prácticamente cualquier tamaño mediante el uso de tecnología de almacenamiento en columnas y la paralelización y distribución de las consultas en múltiples nodos. La mayoría de las tareas administrativas comunes asociadas con el aprovisionamiento, la configuración, la supervisión, las copias de seguridad y la protección de un almacén de datos están automatizadas.

  • Amazon Redshift es un servicio de almacenamiento de datos gestionado y escalable en la nube.
  • Soportado por el ecosistema de Amazon Web Services (AWS) e integrable con sus servicios (Kinesis, SageMaker, EMR, Glue, DynamoDB, Athena, etc.).

Como principales puntos a favor para la comparativa de base de datos podemos mencionar que tiene un escalado simultáneo para mejorar el rendimiento de las consultas.

  • Copia de seguridad de datos almacenada en AWS S3
  • Virtualización de los datos que habilita un análisis de datos distribuidos entre diferentes plataformas dispares
  • No necesita gestión supervisada
  • Soporta la integración con MicroStrategy, Qlik, Tableau, IBM, Alteryx, etc.
  • El cálculo del precio mensual es sencillo y depende únicamente del uso y el número de clústeres contratados

Como puntos en contra se detectan algunos problemas de escalabilidad vertical así como:

  • No soporta textos largos en columnas (no más de 64K)
  • No permite el acceso por consola de máquina virtual.
Puntuación en las review de mercado de Garnet de 4.4

Comparativa base de datos: Snowflake Data Warehouse

La plataforma de datos en la nube Snowflake incluye un almacén de datos SQL puro. Diseñada con una nueva arquitectura patentada para manejar todos los aspectos de los datos y la analítica, combina alto rendimiento, alta concurrencia, simplicidad y económica a niveles que no son posibles con otros entornos de datos. Es una base de Datos exclusivamente en la nube y completamente gestionada.

  • Snowflake ofrece una clara separación entre computación y almacenamiento.
  • Ofrece la posibilidad de conectarse a AWS para almacenar los datos en S3 para ofrecer proximidad a los datos cuando se ejecuten las queries
  • Snowflake tiene básicamente dos niveles de configuración: según el tamaño del cluster y según la cantidad máxima de clusters permitidos para gestionar la computación actual.

Como principales puntos a favor para la comparativa de base de datos podemos destacar su fácil utilización y abstracción para el usuario.

  • La gestión de concurrencia se basa en máquinas stateless evitando problemas típicos de estos casos.
  • Se puede usar desde línea de comandos Linux para la carga y descarga de datos.
  • Compatibilidad con ANSI-SQL (aunque no es idéntica la sintaxis).
  • Integrable con IBM Cognos, Informatica, Power BI, Qlik, Apache Spark, Tableau, etc. y muy sencillo de conectar a otras BBDD.
  • No necesita gestión supervisada (modo fully-managed).

Como puntos en contra destacar que al necesitar recuperar datos de S3 los tiempos de ejecución de las querys pueden aumentar, considerablemente en algunos casos.

  • La falta de configurabilidad supone un impacto en el rendimiento ya que depende en gran medida del caché.
  • La opción multi-cluster tiene un precio elevado.
Puntuación en las review de mercado de Garnet de 4.8

Como saber el modelo de kindle

Para este tutorial vengo con una simple, pero muy solicitada cuestión: Cómo saber que modelo de Amazon Kindle tengo.

En algunas ocasiones, tendrás que actualizar el software o simplemente buscar algún accesorio o funda y tendrás que saber que modelo de Kindle tienes.  Esto es algo que me ha pasado a mi. Me he compré un Kindle hace tiempo (más de 4 años) y la verdad que ni recordaba que versión era.

También te recuerdo, que Amazon tiene el programa de Unlimited, con cientos de ebooks gratuitos (y de pago, claro), te dejo el enlace para que le eches un ojo –> Buscar en amazon ebooks gratis

Volviendo al número de modelo. La manera más sencilla es buscarlo por número de serie, te doy todos los detalles a continuación:

Obtener el número de serie:

  1. En el Kindle, presionar el botón Home > Listado de libros
  2. Presionar el botón Menu y elige la opción “Configuración”
  3. Buscar en el menú de “Información del dispositivo”
  4. Verás un número con 16 caracteres, ese es el número de serie.

Determinar el modelo a partir del número de serie

Del número de serie obtén los primeros  4 caracteres. A continuación del siguiente listado busca la referencia para obtener el modelo:

  • Kindle (2007): Booo
  • Kindle 2 (2009): B002, B003
  • Kindle DX (2010): B004, B005, B009
  • Kindle Keyboard (2010): B006, B008, B00A
  • Kindle 4 (2011): B00E, B023, 9023
  • Kindle 5 / Touch (2012): B00F, B010, B011, B012
  • Kindle Paperwhite (2012): B024, B01B, B01C, B01D, B01F, B020
  • Kindle Paperwhite 2 (2013): B0D4, 90D4, B0D5, 90D5, B0D6, 90D6, B0D7, 90D7, B0D8, 90D8, B0F2, 90F2, B017, 9017, B060, 9060, B062, 9062, B05F, 905F
  • Kindle 7 (2014): B001, B0C6, 90C6, B0DD, 90DD
  • Kindle Voyage (2014): B00I, B013, B053, B054
  • Kindle Paperwhite 3 (2015): G090
  • Kindle 8: B018
  • Kindle Oasis: G0B0G

Si te falta algún número de modelo no dudes en buscar en el listado completo en la fuente original.

Referencia oficial de Amazon Kindle: https://amzn.to/3rtWdMK

BONUS TRACK

Parecerá algo evidente, pero si o sí pon una funda a tu Kindle. Más de una me ha salvado el lector. Tienes cantidad de fundas, desde más baratas a más caras de piel originales de Amazon, eso ya es tu decisión, pero sin duda debes cubrirlo, te dejo el listado de las: fundas más relevantes del momento: https://amzn.to/3pTfu9X