Comparativa base de datos en entornos Cloud

Después de trabajar muchos años con herramientas de diferentes cloud (Google, Amazon y recientemente con Azure) en este artículo preparo una comparativa de base de datos en los entornos Clouds más potentes, incluyendo Snowflake que desde hace unos años viene pisando muy fuerte con sus soluciones así como sus alianzas y capacidades de conexión entre todos los clouds.

Comparativa base de datos: Google BigQuery

Google BigQuery es un servicio de almacenamiento de datos gestionado en la nube. Se abstrae de las configuraciones y de los detalles de hardware y base de datos, es serverless y gestiona almacenamiento y recursos de forma dinámica.

Se denomina una base de datos “hands-off”, sin índices o restricciones por columnas.

Como principales puntos a favor para la comparativa de base de datos podemos mencionar que la configuración de este servicio es super sencilla y rápida.

Otros puntos destacados serían:

  • La ingesta de datos no tiene impacto directo en el rendimiento de las queries ya que los recursos computacionales se usan de forma individual para cargar o para llevar a cabo las extracciones de los usuarios.
  • Capacidad de exportar en diferentes formatos.
  • El modelo de princing, no se realiza por ingestas sino por procesamiento de datos.
  • Permite la ingesta de datos con esquemas desconocidos con la opción “sugerencia de ingesta”
  • No necesita gestión supervisada (fully-managed)

Como puntos en contra podemos mencionar que el usuario no puede definir nodos o capacidad de la instancia BigQuery.

Otros serían:

  • No posee soporte de almacenamiento de ficheros.
  • No permite que los resultados de las queries excedan los 128MB.
  • Servicio global (multi-región) que no cuenta con transparencia en cuanto a zonas de disponibilidad o regiones.
  • Soporte limitado de logging para gestión de cuentas, seguridad y aprovisionamiento.
Puntuación en las review de mercado de Garnet de 4.6

Comparativa base de datos: Microsoft Azure SQL Data Warehouse

Microsoft Azure SQL Warehouse es una base de datos  empresarial capaz de gestionar grandes cantidades de datos, tanto relacionales como no relacionales. La BBDD es ANSI-SQL y se basa en un modelo columnar de los datos.

Se integra con la familia de servicios de SQL Server y de Azure (Azure Data Lake Storage, Data Factory, HDInsight, Databricks, etc.)

Como principales puntos a favor para la comparativa de base de datos podemos destacar que es independiente de la unidad de almacenamiento, lo que permite escalar recursos computacionales y capacidad de almacenamiento de manera individual.

Otros puntos destacados son:

  • Tiene una interfaz muy friendly lo que facilita las tareas de configuración. Debido a la simplicidad de su interfaz la hace muy cómoda la experiencia de usuario.
  • Integrable con herramientas de BI como Datometry, Qlik, MicroStrategy, Informatica, Talend, Tableau, PowerBI, etc.
  • Permite exportar datos a ficheros locales y viceversa, de manera sencilla como se haría con SQL Server.
  • Soporta hasta 128 queries simultáneas.
Puntuación en las review de mercado de Garnet de 4.7

Como puntos en contra podemos mencionar que lleva mucho tiempo el mantenimiento y la adaptación de la infraestructura a nuevos releases de los servicios.

Otros puntos a mencionar serían:

  • Disponibilidad limitada por zonas
  • No cuenta con soporte de versiones
  • No ofrece distribución Linux
  • Necesita gestión supervisada

Comparativa base de datos: Amazon Redshift

Amazon Redshift es un servicio de almacén de datos a escala de petabytes totalmente administrado. Redshift está diseñado para cargas de trabajo analíticas y se conecta con clientes estándar basados en SQL y herramientas de inteligencia empresarial.

Según el sitio web de Amazon, Redshift ofrece un rápido rendimiento de consulta y E/S para conjuntos de datos de prácticamente cualquier tamaño mediante el uso de tecnología de almacenamiento en columnas y la paralelización y distribución de las consultas en múltiples nodos. La mayoría de las tareas administrativas comunes asociadas con el aprovisionamiento, la configuración, la supervisión, las copias de seguridad y la protección de un almacén de datos están automatizadas.

  • Amazon Redshift es un servicio de almacenamiento de datos gestionado y escalable en la nube.
  • Soportado por el ecosistema de Amazon Web Services (AWS) e integrable con sus servicios (Kinesis, SageMaker, EMR, Glue, DynamoDB, Athena, etc.).

Como principales puntos a favor para la comparativa de base de datos podemos mencionar que tiene un escalado simultáneo para mejorar el rendimiento de las consultas.

  • Copia de seguridad de datos almacenada en AWS S3
  • Virtualización de los datos que habilita un análisis de datos distribuidos entre diferentes plataformas dispares
  • No necesita gestión supervisada
  • Soporta la integración con MicroStrategy, Qlik, Tableau, IBM, Alteryx, etc.
  • El cálculo del precio mensual es sencillo y depende únicamente del uso y el número de clústeres contratados

Como puntos en contra se detectan algunos problemas de escalabilidad vertical así como:

  • No soporta textos largos en columnas (no más de 64K)
  • No permite el acceso por consola de máquina virtual.
Puntuación en las review de mercado de Garnet de 4.4

Comparativa base de datos: Snowflake Data Warehouse

La plataforma de datos en la nube Snowflake incluye un almacén de datos SQL puro. Diseñada con una nueva arquitectura patentada para manejar todos los aspectos de los datos y la analítica, combina alto rendimiento, alta concurrencia, simplicidad y económica a niveles que no son posibles con otros entornos de datos. Es una base de Datos exclusivamente en la nube y completamente gestionada.

  • Snowflake ofrece una clara separación entre computación y almacenamiento.
  • Ofrece la posibilidad de conectarse a AWS para almacenar los datos en S3 para ofrecer proximidad a los datos cuando se ejecuten las queries
  • Snowflake tiene básicamente dos niveles de configuración: según el tamaño del cluster y según la cantidad máxima de clusters permitidos para gestionar la computación actual.

Como principales puntos a favor para la comparativa de base de datos podemos destacar su fácil utilización y abstracción para el usuario.

  • La gestión de concurrencia se basa en máquinas stateless evitando problemas típicos de estos casos.
  • Se puede usar desde línea de comandos Linux para la carga y descarga de datos.
  • Compatibilidad con ANSI-SQL (aunque no es idéntica la sintaxis).
  • Integrable con IBM Cognos, Informatica, Power BI, Qlik, Apache Spark, Tableau, etc. y muy sencillo de conectar a otras BBDD.
  • No necesita gestión supervisada (modo fully-managed).

Como puntos en contra destacar que al necesitar recuperar datos de S3 los tiempos de ejecución de las querys pueden aumentar, considerablemente en algunos casos.

  • La falta de configurabilidad supone un impacto en el rendimiento ya que depende en gran medida del caché.
  • La opción multi-cluster tiene un precio elevado.
Puntuación en las review de mercado de Garnet de 4.8

Analítica Federada: Ciencia de datos en colaboración sin recopilación de datos

En una entrada de blog de ayer, Google expuso el concepto de análisis federado, una práctica para aplicar métodos de ciencia de datos al análisis de datos en bruto que se almacenan localmente en los dispositivos. Como explica el gigante tecnológico, funciona ejecutando cálculos locales sobre los datos de un dispositivo y poniendo a disposición de los ingenieros autorizados sólo los resultados agregados, no los datos del dispositivo en particular.

Mientras que la analítica federada está estrechamente relacionada con el aprendizaje federado, una técnica de IA que entrena un algoritmo a través de múltiples dispositivos que contienen muestras locales, sólo apoya las necesidades básicas de la ciencia de los datos. Es «aprendizaje federado ligero (lite)» – la analítica federada permite a las empresas analizar el comportamiento de los usuarios de forma segura y preservando la privacidad, lo que podría conducir a mejores productos. Google, por su parte, utiliza técnicas federadas para potenciar las sugerencias de palabras de Gboard y la función de respuesta inteligente de los mensajes de Android.

«La primera exploración de la analítica federada fue en apoyo del aprendizaje federado: ¿cómo pueden los ingenieros medir la calidad de los modelos de aprendizaje federado con datos del mundo real cuando esos datos no están disponibles en un centro de datos? La respuesta fue reutilizar la infraestructura del aprendizaje federado pero sin la parte del aprendizaje», dijeron en un comunicado el científico investigador de Google Daniel Ramage y el ingeniero de software Stefano Mazzocchi. «En el aprendizaje federado, la definición del modelo puede incluir no sólo la función de pérdida que debe ser optimizada, sino también el código para computar las métricas que indican la calidad de las predicciones del modelo. Podríamos usar este código para evaluar directamente la calidad del modelo en los datos de los teléfonos».

Por ejemplo, en un estudio de usuarios, los ingenieros de Gboard midieron la calidad general de los modelos de predicción de palabras con datos brutos de mecanografía conservados en los teléfonos. Los teléfonos participantes descargaron un modelo candidato, calcularon localmente una métrica de cuán bien las predicciones del modelo coincidían con las palabras que realmente se habían tecleado, y luego cargaron la métrica sin ningún ajuste en el propio modelo o ningún cambio en la experiencia de tecleo de Gboard. Al promediar las métricas cargadas por muchos teléfonos, los ingenieros aprendieron un resumen del rendimiento del modelo a nivel de la población.

Gboard de Google

En un estudio separado, los ingenieros de Gboard querían descubrir las palabras comúnmente escritas por los usuarios y añadirlas a los diccionarios para revisar la ortografía y hacer sugerencias de escritura. Entrenaron una red neuronal recurrente a nivel de personajes en los teléfonos, usando sólo las palabras escritas en estos teléfonos que no estaban ya en el diccionario global. Ninguna palabra tecleada salió de los teléfonos, pero el modelo resultante pudo ser utilizado en el centro de datos para generar muestras de secuencias de caracteres tecleados con frecuencia, es decir, las nuevas palabras.

Más allá de la evaluación del modelo, Google utiliza análisis federados para apoyar la función «Now Playing» en sus teléfonos Pixel, que muestra qué canción podría estar sonando cerca. «Bajo el capó», Now Playing utiliza una base de datos de huellas dactilares de canciones en el dispositivo para identificar la música que se encuentra cerca de un teléfono sin necesidad de una conexión de red activa.

Cuando reconoce una canción, Now Playing graba el nombre de la pista en el historial del dispositivo, y cuando el teléfono está inactivo y cargándose mientras está conectado a Wi-Fi, el servidor de aprendizaje y análisis federado de Google a veces lo invita a unirse a una «ronda» de cómputo con cientos de teléfonos. Cada teléfono de la ronda calcula la tasa de reconocimiento de las canciones de su historial de Now Playing y utiliza un protocolo de agregación seguro para cifrar los resultados. Las tasas cifradas se envían al servidor de análisis federado, que no tiene las claves para descifrarlas individualmente; cuando se combinan con los recuentos cifrados de los otros teléfonos de la ronda, el servidor puede descifrar el recuento final de todos los recuentos de canciones.

El resultado permite a los ingenieros de Google mejorar la base de datos de canciones sin que ningún teléfono revele qué canciones se escucharon, por ejemplo, asegurándose de que la base de datos contiene canciones verdaderamente populares. Google afirma que en su primera iteración de mejora, la analítica federada dio como resultado un aumento del 5% en el reconocimiento general de canciones en todos los teléfonos Pixel a nivel mundial.

«También estamos desarrollando técnicas para responder a preguntas aún más ambiguas sobre conjuntos de datos descentralizados como ‘¿qué patrones en los datos son difíciles de reconocer para mi modelo?’ mediante la formación de modelos generativos federados. Y estamos explorando formas de aplicar el entrenamiento de modelos privados diferenciales a nivel de usuario para asegurarnos de que estos modelos no codifiquen información exclusiva de ningún usuario», escribieron Ramage y Mazzocchi. «Todavía es pronto para el enfoque de la analítica federada y se necesita más progreso para responder con buena precisión a muchas preguntas comunes de la ciencia de los datos… La analítica federada nos permite pensar en la ciencia de los datos de forma diferente, con datos descentralizados y agregación de preservación de la privacidad en un papel central».

Mi reflexión: Esto presenta un panorama en la que nuestros dispositivos no sólo sirven información sino que además están generando valor a los productos de Google, a los contenidos que manejan utilizando el proceso computacional de los dispositivos personales o componentes externos que posen sus sistemas operativos o servicios.

Como todo, tendrá sus pros y cons

Presentación proyecto SEE en Conferencia Big Things 2019

2019 fue el año que presenté en la conferencia de Big Things el proyecto que desarrollamos en PRISA un año antes junto con la colaboración a nivel técnico de Minsait.

SEE, Safety Experience Engine es en resumen un proyecto para cualificar el contenido editorial en base a KPIs de polaridad y sentimientos para generar nuevo producto publicitario.

En el siguiente video podrás ver la conferencia.

SEE es un proyecto patrocinado por PBS desarrollado por Prisa Tecnología cuyo objetivo es comercializar una plataforma desarrollada de forma transversal para todas la unidades de negocio de grupo.

SEE es una plataforma de certificación de contenidos Brand Safety y campañas publicitarias seguras que trabaja para ofrecer una experiencia de consumo seguro al usuario y establece un nuevo contexto para las marcas basados en parámetros de Brand Safety, polaridad y sentimientos que infieren los contenidos con el objetivo de incrementar la inversión publicitaria o mejora de cuota en los activos de Prisa.

PUBLICIDAD COMO MODELO DE NEGOCIO

  • Necesidades y mejoras del negocio:
    • BrandSafety
      • Adfraud
      • Viewability
      • Contextual
    • Segmentación por perfiles de audiencia
    • Segmentación contextual: SEE

Referencia de la ponencia: https://www.bigthingsconference.com/2019/speakers/pedro-ventura/

Trucos y consejos para buscar en Google «like a PRO»

Como usuarios de Google solemos hacer una simple búsqueda y quedarnos con la primera información que nos lanza Google, pero se puede hacer mucho más.  En este artículo quiero recopilar algunos modificadores que suelo incluir en las búsquedas y otros que aunque no uso tanto, es obligatorio mencionar.

Son modificadores muy sencillos pero que nos ayudarán a filtrar y encontrar lo que buscamos con más precisión.

 Modificadores mediante símbolos y signos de puntuación.

Comillas («») Palabras exactas

Usa las comillas para buscar un grupo de palabras como resultado exacto. Puede ser útil para buscar el texto concreto de una noticia, artículo de un blog, una cita o letras de canciones.

Ejemplo:

«ingresos apple»

 

Guión (-) Sin esta palabra

Pon un guión antes de la palabra que quieres excluir de tu búsqueda.

Ejemplo:

jaguar -animal

Los resultados que aparecen son principalmente páginas web y  anuncios de ésta conocida marca de coches.

Asterisco (*) Palabra comodín

Incluye un asterisco en una frase a modo de palabra comodín. Esta búsqueda es especialmente potente cuando la combinas con las comillas.

Ejemplo:

«nuevo * de apple»

Si os fijáis en los resultados aparecen como palabras comodín, términos como: vídeo, ID, reloj, dispositivo, MacBook, etc..

Doble punto (..) Intervalo

Usa dos puntos seguidos entre dos numeros para expresar el rango deseado ya sea de fechas, medidas o precios.

Ejemplos:

tarjetas micro sd por 25 euros..30 euros

películas 1990..2000

Modificadores con operadores

Con los operadores de búsqueda puedes filtrar restringiendo los resultados.

site:

Uno de los modificadores más utilizados, quizá el más popular. Se utiliza, para en primera instancia, saber cuantas páginas tiene indexada una web. Es una herramienta básica pero ofrece una visión rápida y genérica del estado de indexación de una página.

Ejemplo: site:as.com

Puedes hacer búsquedas en un sitio web determinado.

Ejemplo: site:stackoverflow.com parse csv

link:

Con este modificador puedes buscar páginas que dirijan o apunten a tu sitio web.

Ejemplo: link:as.com

related:

Busca sitios similares al que incluyes en el modificador.

Ejemplo: related:as.com

Existen algunos más pero he mencionado los 3 principales.

No te preocupes si se te olvidan o no los recuerdas, para ello usa el buscador avanzado de Google: http://www.google.es/advanced_search

Puedes leer más sobre los operadores de búsquedas en la documentación de Google: Los signos de puntuación, los símbolos y los operadores en la búsqueda

La calculadora de Google

Si tienes una operación que no puedes hacer rápido de cabeza, para que vas a sacar la calculadora del móvil? (el celular para mis lectores de América latina 😉 ), o la calculadora de tu sistema operativo?? Hazla en Google!

Ejemplo: «437*128»

 

La calculadora de Google también te permite cálculos aritméticos, funciones, sacar gráficas de funciones trigonométricas, también convierte unidades de temperatura, longitud, masa, velocidad, etc..

También puedes ver el estado del dolar y el euro, es decir, puedes ver el estado de las divisas, Ejemplo: euro dolar

En la documentación de Google puedes encontrar más ejemplos sobre el uso de la calculadores y conversor de unidades.

Extra

Búsquedas que pueden dar lugar a problemas de seguridad. Google Hacking.

Existe un tipo de búsqueda para localizar ficheros. Se realiza con el operador «filetype:» seguido de la extensión de fichero que quieres buscar.

Como el resto de modificadores, puedes concatenar y agregar más términos, por ejemplo buscar la tabla «wp_comments» que es la que incluye por defecto el software de WordPress. De esta manera puedes sacar dumps de bases de datos de páginas que usan este open source.

Ejemplos:

filetype:txt wp_comments

intitle:”index of” “Index of /” password.txt

Indexa el contenido de tu app Android en Google

Habrás escuchado que ahora Google puede indexar contenido de una aplicación móvil y proponer éste contenido en los resultados de búsqueda. Me ha parecido algo tan relevante, que merece un artículo.

Esto significa que se abre un nuevo frente para los que trabajamos en el sector, pudiendo derivar visitas hacia las aplicaciones móviles. No cabe decir, que el usuario puede tener una mejor experiencia, obteniendo resultados más relevantes de su búsqueda, y usar la app que tiene instalada, y en algunos casos olvidada.

 

 

Conecta tu sitio web con tu app móvil

Para poder llegar al objetivo de mostrar el contenido de tu app en los resultados de Google, se tienen que llevar a cabo varios pasos, tal como nos comentan en la documentación oficial:

  1. Admite e incluye los enlaces profundos en tu aplicación: Como añadir enlaces profundos a tu aplicación
  2. Vincula tu sitio y tu aplicación móvil: Como conectar tu aplicación a tu sitio web

Google también ha preparado una herramienta en Webmaster Tools para hacer debugin y gestionar los posibles errores en la indexación.

 

De la web al móvil

La vinculación de las páginas de tu web a las partes relevantes de la aplicación móvil es un nuevo paso para ofrecer al usuario la alternativa de visualizar el contenido en la app, donde se supone la experiencia del usuario será mejor. Como dueños de producto conseguimos potenciar el uso de la aplicación móvil, que como ya sabemos, es donde está ahora el mercado y hacia donde ha evolucionado el consumo de información,  uso de las redes sociales, herramientas que ofrecen servicios y cada vez más y más gaming.

 

Cita del anuncio que hizo Google meses atrás:

Whether you’re searching for a movie, an apartment, restaurant, shoes, news article, book, recipe, or even a job, you can now go directly to the relevant content within apps that you’ve installed on your phone.

Como personalizar url acortada con tu propio dominio usando bitly

Hace mucho tiempo que no escribo nada en el blog pero hoy vengo con un interesante artículo para personalizar url acortada con tu propio dominio usando el propio servicio de bitly, y la verdad que es algo que no he visto mucho. Además para aquellos que no tienen muchos conocimientos de tecnología o programación con este artículo están de suerte porque es bastante sencillo ya que no lleva ningún desarrollo, ni hay que programar nada, tan sólo hay que llevar a cabo unos cuantos pasos.

 

Requisitos para crear acortador url

Que necesitamos antes de empezar.

  • Como el artículo indica, vamos a personalizar nuestro propio dominio para acortar la url, como es obvio tendréis que tener contratado y disponible un dominio. Proveedores de dominio hay muchísimos: Godaddy, PiensaSolutions, Arsys, Hostalia, etc… existen muchísimos el que más os guste. Es interesante que el dominio sea lo más corto posible y/o se identifique con vuestra marca o dominio principal.
    Para mi caso, he escogido el dominio pedroventura.es. Es cierto que el dominio no es corto pero mi objetivo es crear identidad cuando se comparten los artículos del blog en redes sociales.
  • Crear una cuenta en https://bitly.com/. Esta es la parte más interesante. Toda la gestión del acortador de url y estadísticas nos la proveerá el servicio de bitly. Esto es algo que ya hace por sí mismo con los enlaces de bitly, pero lo bueno es que podemos configurar para que use nuestro dominio. Esto es genial porque no tendremos que hacer ningún desarrollo, ni descargar ningún open source para luego instalarlo en un servidor, … nada. No haremos nada más que usar el servicio de bitly personalizando nuestro dominio. Es fantástico!

Objetivo: url acortada y personalizada

  • Tener una url acortada y personalizada con tu propio dominio, por ejemplo: http://pedroventura.es/186DSGd
  • Esto servirá para generar marca e identidad en los enlaces que se compartan en redes sociales de tu blog, web o portal.

Paso a paso. 

A priori os parecerá un poco denso y pesado, con muchos pasos pero la verdad que lo haréis en 2 minutos.

  • Voy a omitir el paso que tendréis que hacer para daros de alta en bitly, porque esto es un formulario de registro y esto es algo trivial, daros de alta, verificar vuestro email y seguir los pasos que os indiquen.
  • Una vez dentro, en la parte superior donde aparece el nombre de usuario con el que os habéis registrado pinchar en settings.
  • Pinchar en la pestaña «Advanced» y luego en la sección «Custom Short Domain» pinchar en «Personal».
    Si eres una empresa deberás pinchar en «Business» y supongo que tendrás que seguir otros pasos porque a lo mejor tiene algún tipo de servicio diferente para empresas  o simplemente es de pago.
  • Cuando pinches en «Personal» Te llevará al siguiente formulario.

    Introduce el nombre de dominio que has contratado anteriormente. Al pinchar en «Add», te llevará a la siguiente pantalla. Todavía no le deis a verificar, aunque bueno si le dais tampoco va a pasar nada.
  • Aquí tendremos que hacer un paso fuera de bitly, es el paso de agregar el registro DNS en nuestro proveedor de dominio.Bitly nos está diciendo que apuntemos el dominio a una ip determinada. En mi caso me está mostrando esto.
  • Pues bien, iréis al panel de control de nuestro proveedor de dominio, y aquí como cada uno tendrá el suyo pues tendréis que buscar la forma de hacerlo. La finalidad es la misma, los pasos para hacerlo pueden ser diferentes en cada web de vuestro proveedor de dominio.
    La clave es agregar un registro DNS de tipo A, que apunte vuestro dominio a la ip que os diga bitly.  No es nada complejo, seguir los pasos que tengáis que hacer o sino tenéis ni idea enviar un email a soporte de vuestro proveedor de dominio y que os ayuden. Después de agregar el registro DNS a mi me ha quedado de la siguiente manera:
  • Tras agregar el registro DNS, volvemos a bitly y pulsamos el botón «Verify» que habíamos dejado en el formulario anterior, aunque si le habéis pulsado antes tampoco pasa nada.
  • Esto tardará unas horas en ser verificado, pero cuando todo esté ok tendréis que ver algo similar a esto:

    En la pantalla principal de la pestaña de «Advanced» aparece esto:
  • En la sección «Custom Short Domain Root Redirect» tendréis que indicar donde queréis que redirija el dominio base del acortador. En mi caso el dominio base para acortar redirige a este blog.
  • Listo!! Ya tendréis vuestro acortador de urls personalizado con vuestro dominio 🙂

Estadísticas

Además de lo bueno de tener tu propio dominio personalizado, tienes Estadísticas! Dentro de tu cuenta de bitly pincha en la opción «Your stuff», te aparecerá un submenú, pincha en «stats». Voila!  Sin nada de esfuerzo, ni desarrollos complejos, tenemos un sistema para trackear las urls que se comparten de nuestro proyecto web, y encima con nuestro dominio personalizado.

Un truco para ver las estadísticas de un enlace de bitly es agregar (el símbolo mas) al final de la url acortada, por ejemplo: http://pedroventura.es/186DSGd+

 

Espero que os haga gustado. No olvidéis compartirlo, como no cuando lo hagáis aparecerá mi url acortada de este artículo 🙂

 

La gran hostia de las páginas de contenido

En los últimos meses he estado chequeando una serie de blogs de contenido con un tráfico más que relevante y en todos el tráfico está cayendo de manera asombrosa. Intuyo que la principal causa es o son los cambios que está haciendo Google en su algoritmo, ya sabemos que salió Penguin 2.0 en Mayo, pero es posible que anteriormente Google haya estado haciendo otros cambios que no ha anunciado, porque la caída de tráfico es considerable desde meses atrás. También tengo la experiencia de que el tráfico de este blog también lleva cayendo desde hace tiempo, mucho antes de Penguin 2.0.

La caída de tráfico en un blog personal como el mio, puede tener un impacto relativamente pequeño comparado con blogs mas importantes, en los cuales ésta caída influye directamente en la monetización y supervivencia de la web, así como de toda la gente que trabaja alrededor: redactores, técnicos, gente de negocio, etc… Adicionalmente los ingresos que se pueden conseguir a día de hoy con la publicidad display son menores que los de hace unos años atrás, incluso teniendo en cuenta que la mayoría de esos sitios serán partners de Google Adsense, por lo que tener menos ingresos en un momento de crisis como está siendo ésta perdida de tráfico puede ser algo preocupante, sin lugar a duda algo que tendrán ya en cuenta.

A continuación añado las gráficas donde se ve la caída que han tenido algunos blogs que suelo leer. Es cierto que alexa no es una herramienta muy fiable pero puede dar una visión general o indicios de como está tendiendo el tráfico y otras analíticas en una web.

Bitelia.com

Fuente: Ver en alexa

Genbeta.com

Fuente: Ver en alexa

ALT1040.com


Fuente: Ver en alexa

xataka.com

Fuente: Ver en alexa

Cuantocabron
También se dieron una buena caída en SEO pero parece que se han sabido recuperar rápido y su gráfica ya tiene indicios de crecimiento.

Fuente: Ver en alexa

Blog en inglés
Wired.com
Portales tan importantes como wired han sufrido una caída significativa en su tráfico

Fuente: Ver en alexa

net.tutsplus.com

Fuente: Ver en alexa

tutorialzine.com

Fuente: Ver en alexa

smashingmagazine.com

Fuente: Ver en alexa

Designm.ag

Fuente: Ver en alexa

yoast.com


Fuente: Ver en alexa

el blog de Matt Cutts


Fuente: Ver en alexa

Hay una crisis en los blogs de contenidos? O es un «corralito» que esta haciendo Google para potenciar otras páginas que le interesen? Quizá esta ya teniendo mucho peso el contenido relacionado en la red social de Google: Google+? La verdad que estoy bastante desconcertado y me tiene preocupado por el posicionamiento y la caída que está sufriendo mi blog. Me imagino que el resto estará igual o peor.

Historial de búsqueda de Google: ¿Es más útil para ti o para Google?

Desde hace un tiempo que vengo observando, en las consultas que realizo en Google, la palabra «Eliminar» al lado de la búsqueda. Por Ejemplo:

Esto tiene que ver porque las búsquedas que realizas se van guardando, en caso de estar logueado, en el «Historial web» de Google, y en el momento de volver a realizar una nueva búsqueda, Google pre-carga consultas que ya has hecho que tienen que ver con lo que estás escribiendo. Esta funcionalidad me parece útil pero es mayor el escozor que me produce.

Por un lado está el histórico web que va almacenando Google con lo que tu estás buscando y por otro lado está el auto-complementador con las búsquedas sugeridas, y como digo esta funcionalidad me parece útil. Es cierto que para tener lo segundo, implícitamente necesitas tener lo primero.¿Pero hasta que punto compensa que guarden todo lo que buscas, para que lo único que vas a ganar, sea unos segundos completando una palabra o recordando algo que has visitado?

A parte, para que quieres tener tu historial de navegación web en Google, si ya lo puedes tener en el propio navegador?

Este histórico de Google no es algo nuevo, se lanzó en Abril del 2005: From lost to found. Si es la primera vez que lees sobre el histórico de Google, comprueba que es lo que tienen guardado en la url https://history.google.com/history/, sino también.

Comprobando mis búsquedas en el historial web, la última referencia es de Diciembre de 2009, y tenía búsquedas más antiguas pero las borré.

Lo que también me ha llamado la atención es que tengo varios registros guardados como «Búsqueda con cámara».

Esto es porque posiblemente he realizado varias pruebas de la aplicación: Google goggles, con la que a través de una foto o con la cámara de móvil, puedes enfocar a un objeto, texto, etc y se realiza una búsqueda en Google para recibir información sobre eso que quieres.

Nuestros datos

Ya sabemos el control, y desgraciadamente poder, que tiene Google sobre nosotros y los negocios online y no voy a entrar en la típica discusión de privacidad, cesión de datos que hacemos a Google cuando nos registramos, etc.. así como la necesidad de la mayoría de las empresas online, por estar y aparecer en Google. Un problema con el SEO puede suponer pérdidas económicas, la desaparición de una empresa o el triunfo de otra.

La realidad, y hay que tener muy claro, es que Google trabaja para conocer y tracker a sus usuarios, para así luego ofrecer servicios a empresas. El principal objetivo que argumentan es ofrecer servicios y funcionalidades para ayudarnos, cierto es que tanto su buscador, Gmail, Drive, Google apps, Android, etc.. son herramientas excepcionales, pero tenemos que ser conscientes de que trabajan para conocernos. El miedo es, para que más usarán esa información, y el hecho de que ya son el «Gran hermano» digital, y ya no solo digo web, sino también en dispositivos móviles. Y ya ni hablo de las Google Glass.

Cómo desactivar historial web Google

Volviendo al hilo principal de este artículo, voy a comentar lo que hay que hacer para desactivar el historial de búsqueda. Mi consejo es que lo desactivéis, creo que no merece tanto la pena lo que vas a conseguir comparado con toda la información, de más, que se está dando.

  • Lo más obvio y fácil es: no loguearte en Google. Parece una tontería, pero sino te logueas no se guarda nada en el historial.
  • En caso de que estés logueado o vayas a estarlo, tienes que ir a https://history.google.com, pincha en el icono de la muesca dentada que aparece en la parte de la derecha, se desplegará un menú y pincha en configuración. Verás algo como lo que aparece en la siguiente captura de pantalla.

  • Pincha en desactivar

Si te ha gustado el artículo o te ha resultado útil compártelo!

También puedes dejar tu opinión sobre el tema

¿Por qué usar comunidades de Google+?

Si bien Google+ no ha logrado alcanzar la popularidad de Facebook o Twitter, se encuentra allí golpeando fuerte y batallando para ocupar los primeros puestos. Cuando de Social Media hablamos, tener un perfil y actividad activa en dicha red es fundamental, siendo que está bajo el ala del motor de búsqueda que define el éxito o no de cualquier campaña SEO. Google+ nos ofrece una enorme cantidad de herramientas o utilidades que pueden ayudarnos a captar la atención de la gente y así hacer crecer cualquier proyecto que tengamos entre manos. A continuación, veremos algunas de ellas en detalle.

¿Por qué debo usar Google+?

Cuando estamos por comenzar a usar una red social nueva, o con cualquier aspecto de la vida si queremos ser mas amplios  siempre nos preguntamos por qué deberíamos usarlo, cuales son las ventajas que nos dan. En el caso de Google+, son bastantes, y tiene muchas características nuevas que la diferencian de otras redes ya mencionadas como Twitter o Facebook.

Los círculos  Creo que esta es una de las más llamativas ventajas, los círculos de Google+. Para aquel que nunca los haya oído nombrar, son básicamente grupo de contactos que nosotros mismos podemos armar. Por ejemplo, uno que englobe a nuestra «familia», otro a nuestros «amigos» y otro a los «compañeros de trabajo». Así, podremos elegir quién puede ver nuestras publicaciones, manteniendo la privacidad y segmentando de manera exacta todo el contenido que coloquemos en nuestro perfil.

Hangouts. Nuevamente, esta herramienta de Google+ resulta extremadamente fantástica. ¿Qué son los Hangouts? Son como videochats que pueden realizarse entre varias personas del circulo al mismo tiempo, y tiene una dinámica muy divertida. Se ve en la pantalla principal a quien esté hablando en ese momento, y abajo en pequeños círculos  los demás participantes. Cuando otro toma la palabra, la red social lo capta y hace que se muestre a esa persona en primer plano. Puede usarse para todo, desde hablar con amigos hasta mantener reuniones laborales. Interesante, ¿verdad? Y tiene algunos aspectos extra como la posibilidad e poner caritas, dibujos, y sombreros, todos efectos inteligentes que van acompañando la conversación. Los animo a probarlo.

SEO. Como les dije anteriormente al comienzo del articulo, pertenecer a Google+ es fundamental, si consideramos que Google es el motor de busqueda que define el SEO y el posicionamiento de nuestros sitios. A través del signo «+1» que funciona como un «Me gusta» de Facebook, podremos compartir el contenido con otros usuarios e incluso esto mismo afectará a nuestros resultados en posicionamiento, según algunos expertos que han probado la teoría.

Celulares. Finalmente, es una red social ideal para aquellos que se manejen con smart phones la mayor parte del tiempo, porque su aplicación móvil es excelente. Intuitiva, fácil de usar y con muchas herramientas que harán de la experiencia algo positivo y productivo además. Por otro lado es también muy rápida  y si utilizan Iphone le podrán sacar mucho más provecho que a cualquier otra red.

¿Qué hay de las comunidades Google+?

Otra buena manera de hacer crecer nuestra red, y de interactuar con otras personas es a través de las comunidades que nos ofrece Google+. Funcionan de manera similar a las «paginas» de Facebook, y ya existen muchas comunidades de temas diferentes por lo que podemos acceder a información interesante y de importancia sobre los temas que nos interesen. Por ejemplo, si quisiéramos encontrar información sobre «social media», simplemente buscaríamos una comunidad que haga referencia a esto y podremos acceder a artículos con cosas muy valiosas.

Finalmente, las comunidades son muy buenas para conocer nuevos perfiles y generar interacciones con otras personas. También lograremos generar más trafico, precisamente a través de la interacción y publicando contenidos.

Mejoras SEO para ofrecer un contenido en multi-idioma etiqueta hreflang

Desde el blog de webmaster, Google nos propone una mejora para optimizar los sites que ofrecen el mismo contenido en diferentes idiomas. Con lo que podremos mejorar la gestión del contenido en varios idiomas.

Ahora bien esto se aplica en dos casos:

  • En sitios web que se orienten a varias regiones y que usen prácticamente el mismo contenido (por ejemplo, páginas web en inglés que se orienten a Australia, a Canadá y a EE.UU. y que solo se diferencien en los precios)
  • En sitios web orientados a varias regiones que incluyan contenido completamente traducido o que muestren un contenido monolingüe con diferencias notables enfocado a varias regiones (por ejemplo, la página web de un producto en alemán, en francés y en inglés).

Para indicar el idioma y la ubicación hay que agregar el atributo hreflang al elemento de enlace rel=»alternate» de la etiqueta html </link>

Ejemplos:

[code]

<link rel="alternate" hreflang="es" href="http://www.dominio.com/" />
<link rel="alternate" hreflang="es-ES" href="http://es-es.dominio.com/" />
<link rel="alternate" hreflang="es-MX" href="http://es-mx.dominio.com/" />
<link rel="alternate" hreflang="en" href="http://en.dominio.com/" />
[/code]

El atributo hreflang permite especificar el idioma o el país, y la URL asociada. Éstas URLs asociadas o alternativas nos permiten consolidar los indicadores de estas páginas y ofrecer la URL adecuada a los usuarios que hagan una búsqueda. Estas URL pueden pertenecer al mismo sitio o a otro dominio.

Para páginas que su contenido es prácticamente el mismo, cosa que está mal valorada por Google y que perjudica en el posicionamiento, también habrá que incluir la etiqueta rel=»canonical», de esta manera en la búsqueda siempre se indica una url o un site como predefinido (al que quieres darle más prioridad) y al que apuntan el resto de páginas con contenido similar.

[code]

<link rel="canonical" hreflang="es" href="http://www.dominio.com/" />
<link rel="alternate" hreflang="es-ES" href="http://es-es.dominio.com/" />
<link rel="alternate" hreflang="es-MX" href="http://es-mx.dominio.com/" />
[/code]

Nota de Google

Cuando Google detecte un grupo de páginas con una única URL canónica, nuestros algoritmos mostrarán el título y un fragmento de la versión canónica en los resultados de búsqueda. Por tanto, te recomendamos que no incluyas contenido específico de una región en el título ni en las etiquetas de metadescripción de la URL canónica. Por ejemplo, utiliza «Example Widget Inc» en lugar de «Example Widget USA Inc» o «Example Widget UK».

Valores que puede tomar el atributo «hreflang»

El valor del atributo hreflang identifica el idioma y, opcionalmente, la región de una URL alternativa. Por ejemplo:

es: contenido en español, independientemente de la región
es-MX: contenido en español para usuarios mexicanos
es-ES: contenido en español para usuarios españoles

Referencia de interés.

http://googlewebmaster-es.blogspot.com/2011/12/nuevo-marcado-para-contenido.html

http://support.google.com/webmasters/bin/answer.py?hl=es&answer=189077