Analice la distribución de datos con mayor precisión con series de tiempo

El uso de una capa de series de tiempo para histogramas y visualizaciones de diagramas de caja y bigotes puede agregar un verdadero valor de diagnóstico. Esta es la tercera parte de una serie de tres partes sobre las herramientas de distribución de datos de Bing.

Bienvenido de nuevo a esta serie sobre distribuciones de datos, como parte de una iniciativa más amplia para desarrollar sus análisis con Bing Analytics Group. Antes de pasar al uso de distribuciones para comprender los cambios en sus datos a lo largo del tiempo, recapitulemos lo que aprendimos en la parte uno y en la parte dos.

En la primera parte de esta serie, explicamos por qué tomar promedios al pie de la letra puede ser engañoso y dejarnos con una comprensión incompleta de lo que sucede en una cuenta. Establecimos que el uso de distribuciones de datos es una forma efectiva de controlar esa posibilidad, y luego cubrimos cómo analizar una distribución de datos utilizando un histograma como ayuda visual.

En la segunda parte de esta serie, examinamos el mismo conjunto de datos utilizando un diagrama de caja y bigotes.

Y lo dejamos con la declaración de que un graduado de las dos primeras partes de esta serie debería poder identificar la relación entre estas dos visualizaciones de los mismos datos.

Con este conocimiento básico firmemente metido en nuestro cinturón, pasamos al ámbito del uso de distribuciones de datos como series de tiempo. Si bien existen algunas formas excelentes de incorporar histogramas y series de tiempo, ninguna está disponible de inmediato en Microsoft Excel.

Lo primero es lo primero, para obtener la comprensión más detallada posible de nuestra distribución, hemos estado segmentando nuestros informes de rendimiento por palabra clave y por día, pero ahora vamos a agregar otra capa al grano de tiempo: mes.

Antes de entrar de nuevo en las vistas de distribución, veamos un ejemplo de inteligencia empresarial convencional sobre CPC durante un período de seis meses.

Un análisis probable de una opinión como esta sería algo como: «Hubo CPC relativamente estables entre noviembre y febrero, antes de encontrar volatilidad en los precios en marzo y abril». Eso está muy bien, pero estamos dejando mucha información sobre la mesa usando promedios en lugar de distribuciones.

Así que convierta estos resúmenes en distribuciones.

De un vistazo, una cosa salta a la vista de inmediato, y ese es el comportamiento de los CPC atípicos en abril de 2018. En los cinco meses anteriores a eso, el comportamiento atípico fue bastante consistente, con un umbral superior de alrededor de $ 50. En abril, este anunciante vio repentinamente varios casos de una palabra clave con CPC superiores a $ 60 y que van hasta $ 100, lo que sin duda es un elemento de interés para la optimización.

Sin embargo, la presencia de valores atípicos está sesgando el eje y y dificultando la determinación de las tendencias dentro de los cuartiles. Para dilucidar los cuartiles un poco mejor, elimine la visualización de los valores atípicos. Esto se hace fácil en Excel. Haga clic con el botón derecho en su gráfico, seleccione «formatear serie de datos» y luego desmarque la casilla «Mostrar puntos atípicos».

Estos son los mismos datos, los valores atípicos eliminados. Tenga en cuenta que la parte superior del eje y ahora tiene un límite de 20, donde antes variaba a 120.

Podemos ver inmediatamente que el rango del cuarto cuartil es el más esporádico de un mes a otro, y el rango del tercer cuartil también es más volátil que el rango del primer o segundo cuartil. Es importante destacar que el CPC mediano es constantemente más bajo que el CPC medio, lo que se debe a la influencia del rango del cuarto cuartil y los valores atípicos. Además, recordando que la «x» representa el CPC promedio, el umbral superior del rango del cuarto cuartil parece tener una relación clara con el CPC promedio.

Este es un buen ejemplo de cómo la observación de las distribuciones proporciona al anunciante más información que tiene un valor de diagnóstico real que la media resumida.

En nombre de Bing Analytics Group, esperamos que sienta que ha mejorado sus análisis con esta serie. ¡Mira lo lejos que has llegado!


Las opiniones expresadas en este artículo pertenecen al autor invitado y no necesariamente a El Blog informatico. Los autores del personal se enumeran aquí.


Deja un comentario