01. Introdução
O estudo de séries temporais constitui um pilar fundamental da análise de dados, sendo aplicado para investigar qualquer variável de interesse observada em múltiplos instantes ao longo do tempo. Sua força reside na capacidade de decodificar o comportamento de uma variável no passado, e, sobretudo, desenvolver modelos de previsão para subsidiar decisões mais estratégicas e informadas.
02. Metodologia (Box-Jenkins)
Para a modelagem preditiva, adotou-se a clássica metodologia de Box-Jenkins, focando em modelos ARIMA (AutoRegressive Integrated Moving Average) e SARIMA. O método segue uma abordagem iterativa:
- Identificação: Verificação de estacionariedade e análise das funções de Autocorrelação (ACF e PACF).
- Estimação: Ajuste dos parâmetros (p, d, q, P, D, Q) através de máxima verossimilhança.
- Diagnóstico (Verificação): Teste rigoroso nos resíduos do modelo para garantir comportamento de "ruído branco" (Ljung-Box e Shapiro-Wilk).
- Previsão (Forecast): Projeções Out-of-Sample contrastando o SARIMA contra métodos de Suavização Exponencial (Holt-Winters).
03. Análise Exploratória
A pergunta central deste estudo explora: "Existe um Ciclo Anual estável na Produção de Petróleo no Brasil?" A inspeção visual primária nos dá pistas valiosas da não-estacionariedade da série, marcada por uma clara tendência de crescimento e flutuações sazonais repetitivas.
Observamos um crescimento acentuado entre 2019 e 2020, seguido de oscilações (reflexo da pandemia global) e outro avanço expressivo advindo da expansão em campos do pré-sal. A fim de validar essas impressões com rigor estatístico, executamos baterias de testes formais (ADF e KPSS) para comprovar a presença de raiz unitária.
A sazonalidade também foi confirmada formalmente usando o Teste QS (Quadratic Spectral), cujo valor-p atingiu 0, atestando uma ciclicidade determinística intransponível no estado bruto da série.
04. Decomposição & Pré-Processamento
A magnitude das flutuações sazonais aparenta crescer conforme o patamar de produção se eleva, o que dita a escolha de um modelo multiplicativo para a decomposição clássica. Isso nos permite isolar de forma clara a Tendência de longo prazo do Sinal Sazonal.
Para satisfazer a premissa fundamental de Box-Jenkins (estacionariedade na variância e na média), combinamos duas técnicas poderosas: aplicamos a transformação logarítmica (estabilizando a variância heteroscedástica) sucedida de uma diferenciação. Como resultado, os testes pós-transformação rejeitaram fortemente a presença de raiz unitária, garantindo a estabilidade necessária.
05. Forecast Competitivo (Out-of-Sample)
Tendo a série transformada, diagnosticamos as funções de autocorrelação para construir o modelo campeão. Dividimos os dados: Treino (Jan/2001 - Abr/2021) e Teste (Mai/2021 - Mai/2025). Essa separação testou o algoritmo no período mais desafiador e volátil.
Após avaliação das funções ACF e PACF e o rigoroso teste de resíduos Ljung-Box, o modelo SARIMA(2,1,3)(0,1,1)₁₂ se destacou capturando a complexidade dos dados. Colocamos o SARIMA contra o método de Suavização Exponencial (Holt-Winters Aditivo) para comparação.
Mergulhe na Pesquisa Completa
Tenha acesso aos resultados, scripts e à formatação acadêmica oficial nas versões abaixo.