¿Cómo es un análisis de datos exitoso?

Varias definiciones han sido propuestas en cuanto al análisis exitoso de datos. Muchos analistas creen que un análisis es de éxito cuando los resultados son correctos. Sin embargo, se ha propuesto que muchos otros factores entran en esta ecuación.

Por ejemplo, la definición dada por el experto del “Data Science” Roger Peng: “Un análisis de datos es exitoso si la audiencia a la que se presenta acepta los resultados”, va en contra de las creencias de muchos “estadistas puros”, ya que sugiere que la interrelación con los seres humanos para lograr una aceptación de los resultados es tan importante como la veracidad de los mismos.

En esta edición, los datatips están enfocados en base a esta definición.

Aceptación

La aceptación de un análisis implica el análisis en sí mismo: los datos, los métodos aplicados y la comunicación de los resultados. Por otro lado, creer en los resultados depende del análisis sumado a muchos otros factores incluyendo los análisis previos, la literatura existente y el estado de la ciencia. Una audiencia responsable puede aceptar un análisis sin necesariamente creer sus principales afirmaciones, pero estos dos conceptos probablemente estén correlacionados. Por lo tanto, la aceptación de los métodos, tanto en un contexto metodológico como humano son necesarios para lograr una aprobación de la audiencia.

Validez

Un análisis de datos es exitoso si las afirmaciones son verdaderas. Si analizo los datos sobre los hábitos de fumar y las tasas de mortalidad y concluyo que fumar causa cáncer de pulmón, entonces mi análisis es exitoso si esa afirmación es cierta. Esta definición tiene la ventaja que elimina el elemento subjetivo de aceptación, que depende de la audiencia a la que se presenta el análisis. Aunque la validez es altamente complicada (y en algunos casos costosa) de cumplir, es importante desgastar esfuerzos en pos de contar con datos válidos y replicables.

Audiencia

Todos los análisis de datos tienen una audiencia, incluso si ese público eres tú. En última instancia, la audiencia puede aceptar los resultados de un análisis o puede que no lo acepten. El hecho de que el éxito de un analista pueda depender de una persona diferente del analista puede parecerle algo incómodo, pero reconocer que la naturaleza humana juega un papel clave en la determinación del éxito del análisis de datos explica una serie de aspectos clave de lo que podríamos considerar buenos o malos análisis.

La narrativa

Se supone que el análisis de datos tiene que ver con los datos, ¿verdad? ¿Solo los hechos? En su mayor parte lo es, hasta el punto en que necesita comunicar sus hallazgos a una audiencia. El problema es que en cualquier análisis de datos que sea significativo para los demás, hay demasiados resultados para presentar, por lo que se deben tomar decisiones. Dependiendo de quién sea la audiencia o de quién esté compuesta la audiencia, el analista tendrá que sintonizar su presentación para que esta acepte el análisis. Cuando un público se molesta por un análisis de datos, generalmente están molestos con la narración elegida, no con los hechos per se.

Creatividad

La creatividad del analista no solo es importante para presentar elementos de visualización cómo gráficas o ilustraciones. La creatividad es necesaria en parte porque un analista debe hacer una evaluación razonable de las necesidades, antecedentes y preferencias de la audiencia para recibir los resultados.  También debe hacer preguntas sobre la mejor forma de presentar los resultados. De lo contrario, se deben hacer suposiciones razonables o se pueden preparar imprevistos (por ejemplo, diapositivas de respaldo, apéndices) para la presentación en sí misma. De esta manera, diferentes audiencias reciben una presentación diferente aunque los resultados sean los mismos.

Resumen

Esta definición propuesta de un análisis de datos exitoso es desafiante porque sugiere que los analistas son responsables de cosas que están fuera de los datos. En particular, deben comprender el contexto en el que se recopilan los datos y la audiencia a la que se presentarán los resultados. Cuando consideramos el análisis de datos utilizando los criterios tradicionales desarrollados por los estadísticos, nos cuesta explicar por qué algunas personas son mejores analistas que otras y por qué algunos análisis son mejores que otros.

Esta definición también sugiere que la naturaleza humana juega un papel importante y que gran parte del éxito es esencialmente una negociación exitosa de las relaciones humanas. La buena comunicación con un público a menudo puede jugar un papel mucho más importante en el éxito que si usara un modelo lineal o un modelo cuadrático. La confianza entre un analista y la audiencia es crítica cuando un analista debe tomar decisiones sobre qué presentar y qué omitir. Admitir que la naturaleza humana desempeña un papel en el éxito del análisis de datos es difícil porque los humanos son altamente subjetivos, inconsistentes y difíciles de cuantificar. Sin embargo, al hacerlo, podemos comprender mejor cómo juzgar la calidad del análisis de datos y cómo mejorarlos en el futuro.

Referencias

Simply Statistics, (2018). https://simplystatistics.org/2018/04/17/what-is-a-successful-data-analysis/

Not so Standar Deviations, (2018). http://nssdeviations.com/

Credits

Roger D. Peng PhD

http://www.biostat.jhsph.edu/~rpeng/

 


Deja un comentario