Censo da Educação Superior (2): Como plotar o movimento migratório universitário no Brasil em um mapa
Posted on June 8, 2016
No primeiro post sobre os microdados do Censo da Educação Superior, falei sobre as cidades e estados que mais atraem universitários de fora. Neste segundo post, discutirei mais a fundo este movimento migratório universitário, incluindo a elaboração de um rebusco mapa de fluxo migratório.
Importação dos dados
Para plotar em um mapa os universitários que estudam em uma cidade diferente da que nasceram, precisamos de dois tipos de dados:
Dados de universitários que estudam em uma cidade diferente da que nasceram;
Dados espaciais
Para poder localizar os municípios brasileiros em um mapa, precisamos de dados sobre suas latitudes e longitudes. Em minhas pesquisas, a melhor fonte que eu encontrei foi neste site, que fornece o link para baixar um arquivo KML contendo os dados que precisamos. Para fazer a conversão de KML para um formato tratável pelo R, usei comandos em linux, como indicado pelo próprio site.
ATENÇÃO: Eu baixei o KML descrito acima em 08/06/2016, mas no momento que escrevo este post, o ftp do IBGE para baixar esse arquivo está fora do ar. Por isso, eu disponibilizei os arquivos KML e CSV no meu Github.
Dados de universitários
O DM_ALUNO.csv, tratado no post anterior, e filtrado para os casos em que o município de nascimento não é o mesmo do município da IES:
nome_mun_aluno
nome_mun_ies
qtd
Aracaju (SE)
Săo Cristóvăo (SE)
17574
Contagem (MG)
Belo Horizonte (MG)
11023
Niterói (RJ)
Rio de Janeiro (RJ)
16817
Rio de Janeiro (RJ)
Duque de Caxias (RJ)
12676
Rio de Janeiro (RJ)
Săo Gonçalo (RJ)
11029
São Bernardo do Campo (SP)
Săo Paulo (SP)
10811
São Paulo (SP)
Guarulhos (SP)
14762
São Paulo (SP)
Săo Bernardo do Campo (SP)
15408
Porto Alegre (RS)
Indaial (SC)
11902
Porto Alegre (RS)
Canoas (RS)
12571
Uma curiosidade sobre o primeiro lugar da lista: o fluxo Aracaju > São Cristóvão é devido ao fato de a única universidade pública de Sergipe, a Universidade Federal de Sergipe (UFS), estar localizado em São Cristóvão, mas como a UFS é muito próxima a Sergipe, os universitários aracajuanos vão à UFS e voltam para casa no mesmo dia.
Finalmente, vamos o código para plotar o mapa. O código abaixo foi “inspirado” deste post do Flowing Data, um ótimo blog sobre visualização de dados. Adaptar o código do artigo não foi tão direto como eu imaginava, por isso fiz questão de documentar todos os passos e explicar o que eles fazem.