Como baixar dados do IBGE pelo SIDRA: um guia simples com python
Desvendando o SIDRA: Como utilizar dados do IBGE para previsões econômicas no Python
O SIDRA, ou Sistema IBGE de Recuperação Automática, é uma verdadeira mina de ouro para quem trabalha com análises econômicas, planejamento estratégico ou mesmo curiosidades sobre a economia brasileira. Se você é economista, pesquisador, estudante ou desenvolvedor que gosta de explorar dados para tomar decisões mais fundamentadas, essa ferramenta pode ser extremamente útil.
Aqui, vou te mostrar como baixar séries temporais mensais do SIDRA que podem ajudar em análises econômicas mais avançadas. No exemplo, estamos baixando indicadores mensais que podem ser utilizados para explicar variações do PIB brasileiro, como índices de produção industrial e indicadores de preços, gravando-os em uma planilha Excel. Além disso, você poderá expandir o script para incluir outros dados que achar relevantes. As séries podem ser exploradas no site https://sidra.ibge.gov.br/ 🚀
Por que usar os dados do SIDRA?
Os dados do SIDRA são:
Confiáveis: Atualizados e fornecidos diretamente pelo IBGE.
Granulares: Cobrem diferentes setores e períodos, ideais para análises específicas.
Acessíveis: Gratuitos e disponíveis para todos.
Se você está modelando o PIB, precisa entender como a produção industrial, o consumo, e os preços estão se comportando ao longo do tempo. Os indicadores que vamos extrair, como produção da indústria de transformação e IPCA, são peças-chave para quem busca prever tendências econômicas.
O que vamos fazer?
Neste artigo, você vai aprender a:
Configurar um script para acessar o SIDRA.
Baixar séries temporais relevantes.
Consolidar essas séries em um único arquivo para análise.
E o melhor: todo o processo será explicado passo a passo! 🌟
O código completo está em exemplo_sidra.py.
Passo 1: Configurando o ambiente
Primeiro, precisamos instalar os pacotes necessários. Execute os comandos abaixo no seu terminal:
sidrapy: Interface para buscar dados diretamente no SIDRA.
pandas: Para manipular as séries temporais.
openpyxl: Para salvar os dados em um arquivo Excel.
Passo 2: Limpando e formatando os dados
Os dados do SIDRA vêm brutos, então precisamos organizá-los antes de usá-los. Aqui está a função que faz isso:
Por que essa função é importante?
Remove linhas desnecessárias.
Formata as datas para que possamos fazer análises temporais.
Organiza os valores para que possam ser integrados a outros indicadores.
Passo 3: Buscando séries no SIDRA
Com os dados formatados, criamos uma função que busca uma série específica do SIDRA com base no código da tabela, variável e classificações:
Exemplo de uso
Queremos os dados de produção da indústria de transformação. Para isso, usamos:
table_code = '8888'
variable = '12606'
classifications = {'544': '129316'}
Passo 4: Consolidando múltiplas séries
Agora, combinamos várias séries em um único DataFrame:
Passo 5: Rodando o script e salvando os dados
Finalmente, definimos as séries que queremos baixar e executamos tudo:
E agora?
Esse script gera um arquivo Excel contendo indicadores econômicos mensais como:
Produção da indústria de transformação.
Produção da indústria extrativa.
Índice Nacional de Preços ao Consumidor Amplo (IPCA).
Com isso, você já tem uma base para começar suas análises ou modelos preditivos de PIB ou mais o que previsar! Se quiser adicionar mais séries, basta incluir novos itens na lista sidra_list
.
Dúvidas ou sugestões? Deixe nos comentários! 😊