quinta-feira, 8 de outubro de 2009

Análises Quantitativas [2]

Estava lendo algumas coisas, e vi esse comentário: "O sucesso do Atlético-MG está no baixo número de passes errados. É o time que errou menos passes".

De fato, não é difícil aceitar que quem erra menos passes vai melhor. Quer dizer, passes errados são quase como erros não-forçados no tênis: você tem a bola e a entrega de graça para o oponente. E também sabemos que, quanto mais posse de bola, menos chance de tomar gol, já que a bola está com seu time.

Tudo parece bem plausível, mas para perder um tempo, fiz uma tabela relacionando a posição na tabela de pontuação do Campeonato Brasileiro com a posição na tabela de passes errados. A idéia é simples: se houver uma relação entre as duas coisas, deveremos esperar uma linha crescente (ou uma "nuvem", como gostam de chamar os estatísticos, já que é impossível - e não é necessário - haver uma linha perfeita).

Para fazer o gráfico, usei essa tabela, do GloboEsporte.com:

Número de passes errados no Brasileirão 2009

01 Santos - 1.003 vezes
02 Internacional - 989 vezes
03 Botafogo - 982 vezes
04 São Paulo - 980 vezes
05 Palmeiras - 959 vezes
06 Fluminense - 958 vezes
07 Corinthians - 956 vezes
08 Flamengo - 938 vezes
09 Coritiba - 927 vezes
10 Grêmio - 883 vezes
11 Vitória - 869 vezes
12 Cruzeiro - 856 vezes
13 Santo André - 844 vezes
14 Atlético-PR - 826 vezes
15 Barueri - 803 vezes
16 Goiás - 797 vezes
17 Sport - 795 vezes
18 Naútico - 768 vezes
19 Avaí - 716 vezes
20 Atlético-MG - 697 vezes


Como imaginamos que é melhor errar menos passes, e quem erra menos passes está melhor na tabela, eu inverti a posição dos times nesta tabela (utilizei os números na ordem crescente). Assim, o Atlético-MG seria o primeiro, e o Santos o último. Se não fizesse isso, uma possível relação apareceria no sentido decrescente no gráfico, o que no fundo é o mesmo resultado, mas escrito de forma errada (é padrão que o sentido crescente é o que prova a teoria).

Aqui o gráfico (que leva em conta os pontos e os passes errados até a 27a. rodada):



Como já era previsível só vendo a tabela de passes errados, não há nenhuma relação entre o número de passes errados e a posição no Campeonato. Nenhuma mesmo, pois os pontos estão totalmente dispersos no gráfico. Mas não encontrar relação também é encontrar algo (e não só que seu amigo estava errado). Essa tabela elimina uma possibilidade, pare que possa se focar em outras possibilidades.

Discutindo essa tabela, descobri o erro que pode atrapalhar o resultado: "a tabela não leva em conta o percentual dos passes errados, pois quem passa mais erra mais". De fato, outro argumento plausível, mas que deveria que ser duplamente testado: primeiro, se os times que passam mais erram mais, e segundo, se quem tem maior percentual de passes certos está melhor na tabela. E aí o problema não é o trabalho, são os dados, difíceis de encontrar.

De fato, esse exercício é o mais básico de estatística, mas não é porque é básico que está errado. De fato, é o jeito mais fácil de relacionar duas variáveis e ver se existe alguma relação. Além disso, ele é mais confiável quando não dá certo (desde que tenhamos informações precisas) do que quando existe a relação, pois é preciso usar variáveis de controle e fazer outros testes.

Seria bem legal que um estatístico de verdade fizesse essas relações de forma mais precisa, com mais variáveis. Talvez não façam porque, como eu, acreditam que futebol se explica no futebol.

Nenhum comentário: