Correlações Espúrias: a perigosa confusão entre correlação e causalidade

A análise de dados é uma ferramenta importantíssima para entender padrões e comportamentos em diferentes áreas. Porém, é comum que muitas pessoas cometam o erro de confundir dois conceitos: correlação com causalidade. Essa confusão pode levar a decisões precipitadas e perigosas, e é conhecida como correlações espúrias.

O que são Correlações Espúrias?

Correlações espúrias são relações entre variáveis que parecem estar correlacionadas, mas que na verdade não têm relação de causa e efeito. Quer um exemplo?

Observe o gráfico abaixo:

Esse exemplo foi retirado do site Spurious Correlations, que mostra diversos casos de correlações espúrias. Nesse caso, vemos que há uma correlação alta (66%) entre o número de pessoas afogadas por cair em uma piscina com o número de filmes em que Nicolas Cage aparece.

Então quer dizer que quanto maior o número de filmes em que Nicolas Cage aparece, maior a chance de pessoas de afogarem? É óbvio que não né, mas é muito comum pessoas analisarem os dados de seus negócios e chegar a conclusões tão absurdas como essa.

Outro exemplo famoso de correlação espúria é a relação entre a taxa de divórcio nos EUA e o consumo per capita de margarina.

Essas duas variáveis têm uma correlação positiva surpreendentemente forte (99%), mas é nítido que essa conclusão não tem o menor sentido, afinal consumir mais margarina não causa problemas conjugais, pode no máximo, causar algum problema de saúde em quem abusa na quantidade, rs.

O que é uma correlação?

Mas vamos voltar um pouco no assunto. Afinal o que é uma correlação?

A correlação é uma medida estatística que descreve a relação entre duas variáveis. Quando duas variáveis estão correlacionadas, elas tendem a variar juntas de alguma forma. Existem diferentes tipos de correlação, como a correlação positiva, negativa e ausência de correlação.

Por exemplo, uma correlação positiva seria a relação entre a idade de uma pessoa e sua renda. Em geral, quanto maior a idade, maior a renda. Já uma correlação negativa seria a relação entre o tempo de estudo e o número de faltas em uma aula. Em geral, quanto mais tempo de estudo, menos faltas.

O que é causalidade?

Já a causalidade é a relação entre duas variáveis em que uma variável influencia diretamente na outra. Ou seja, há uma relação de causa e efeito entre elas.

Para confirmar a causalidade entre duas variáveis, é necessário realizar estudos controlados, onde uma variável é manipulada para observar se a mudança na variável realmente causa uma mudança na outra. Por isso, é importante ressaltar que, para estabelecer a causalidade, é necessário descartar todas as outras possíveis explicações, não basta apenas que seja observada uma correlação (positiva ou negativa) entre as variáveis para afirmar que há também uma relação de causalidade.

Por que essa confusão é prejudicial?

A confusão entre correlação e causalidade pode levar a decisões precipitadas e perigosas. Por exemplo, vamos supor que em um estudo recente, foi observado que pessoas que bebem café têm menos chance de desenvolver câncer de pele. Isso não significa que beber café previne o câncer de pele. Pode haver diversos outros fatores envolvidos e essa correlação pode ser apenas uma coincidência. Assumir que essa relação é também uma relação de causalidade poderia implicar em conclusões precipitadas e diversos erros na condução de tratamentos e saúde pública.

E os exemplos não param por aí, vamos supor que um evento externo e desconhecido por você afeta as vendas do seu mercado justamente no momento em que você implementou uma nova estratégia de marketing. Quando você analisa os dados, percebe a correlação e conclui que a sua nova estratégia foi um fracasso e desiste imediatamente dela. E se essa fosse a estratégia responsável por “virar o seu jogo” e você a deixou escapar por um erro de análise e interpretação de dados?

Esses são apenas alguns exemplos, mas essa confusão pode levar a diversos erros em estudos, pesquisas científicas, estratégias de negócios e etc.

Como evitar esse tipo de confusão?

Para evitar cair nesse viés, é importante ter em mente que correlação não implica causalidade. É preciso realizar uma análise mais aprofundada dos dados, considerando outras possíveis explicações para a correlação observada. É importante também buscar por estudos controlados que possam estabelecer a causalidade entre as variáveis.

Além disso, é importante questionar as correlações observadas e buscar por possíveis explicações alternativas. Se durante o seu processo de análise, você identificou uma correlação entre duas variáveis, questione todas as alternativas possíveis antes de chegar a uma conclusão. Será que é uma sazonalidade de mercado? Uma flutuação econômica? Algum evento que está acontecendo?

Caso ainda esteja em dúvida, procure realizar testes para verificar como as variáveis se comportam quando alteradas. É claro que executar testes “by the book” como manda a estatística de forma extremamente controlada é quase impossível no mundo real se você não for um pesquisador (mesmo se você for um será difícil), mas procure levantar hipóteses e validá-las antes de sair mudando toda sua estratégia de marketing.

Conclusão

A confusão entre correlação e causalidade é um erro comum na análise de dados e pode levar a decisões perigosas. É importante entender que correlação não implica causalidade e buscar por explicações alternativas antes de tirar conclusões precipitadas. Por isso, é fundamental fazer uma análise mais aprofundada dos dados, levantar hipóteses e realizar testes com frequência para uma tomada de decisão mais assertiva.

Quer aprender a implementar uma gestão data driven nos seus processos de marketing digital? Então clica aqui e conheça o meu método Marketeiro Data Driven, com ele você vai aprender o passo a passo, desde a coleta de dados à realização de testes para não cair mais nessa confusão e ter uma tomada de decisão realmente data driven nos seus processos de marketing digital.

Está gostando? Compartilhe!

// Gostou do conteúdo?

Aqui estão outros conteúdos que você também pode gostar.

Participe das minhas aulas ao vivo e aprenda sobre trackeamento avançado, análise de dados, dashboards e muito mais para escalar seus resultados no digital.

Todas as segundas-feiras, às 18h00, no YouTube

*Não utilizamos suas informações de contato para enviar qualquer tipo de SPAM.

**As aulas ficam disponíveis gratuitamente por 7 dias após a transmissão e depois saem do ar.

DOMINE AS ESTRATÉGIAS DE TRACKEAMENTO AVANÇADO E ANÁLISE DE DADOS

Aprenda a traquear suas vendas do jeito certo, tenha campanhas extremamente inteligentes e escale os seus resultados no digital.

Inscrições abertas para o curso Marketeiro Data Driven