Aviso
Este post funciona como um adendo ao anterior, portanto recomendo o ler antes de prosseguir com a leitura.
Assim que eu publiquei o último post, percebi que perdi a oportunidade de analisar o quão diferente são as distribuições dos salários nos estados brasileiros e não só nas regiões. Voltando ao nosso dataset, que dessa vez carrego apenas as colunas de salários e UFs:
Quais são, então, os estados com as maiores assimetria e curtoses em sua distribuição de salário?
Do gráfico de cima tiramos duas conclusões:
- A disparidade do Amapá e, principalmente, de Roraima em relação aos outros estados é colossal.
- Existe uma correlação linear entre assimetria e curtose, algo que eu não esperava muito. Podemos checar este dado:
Realmente, a correlação é muito alta.
Voltando aos estados, nada melhor do que plotar uma comparação entre os estados mais díspares e os que a distribuição mais se aproxima do normal (SP e DF):
Agora fica tudo muito claro: Existe uma concentração estranhamente grande de pessoas que ganham cerca de R$5000,00 mensais em comparação com o resto dos servidores do estado.
A presença de outliers que ganha mais de 25000 reais distorce o gráfico, então vale a pena olhar para a mesma distribuição sem eles:
Temos agora ainda mais evidência de um fenômeno muito interessante: os salários em RR e AP são muito mais distribuídos. Na verdade, o que acontece é que a grande maioria dos servidores roraimenses e amapaenses ganham até R$5000,00 e muito poucos ganham mais de R$15000,00.