ESTUDO DE CASO ANALÍTICO

Produção de Petróleo
no Brasil

Uma investigação estatística rigorosa (2001-2025) aplicando modelagem Box-Jenkins (SARIMA) e Suavização Exponencial.

Orientação: Prof. Drª Jeniffer Johana Duarte Sanchez (UFC)

01. Introdução

O estudo de séries temporais constitui um pilar fundamental da análise de dados, sendo aplicado para investigar qualquer variável de interesse observada em múltiplos instantes ao longo do tempo. Sua força reside na capacidade de decodificar o comportamento de uma variável no passado, e, sobretudo, desenvolver modelos de previsão para subsidiar decisões mais estratégicas e informadas.

O presente trabalho analisa a dinâmica da produção mensal de petróleo (em m³) no Brasil (Jan/2001 a Mai/2025), buscando identificar padrões, tendências e sazonalidades num dos setores mais estratégicos da economia nacional.

02. Metodologia (Box-Jenkins)

Para a modelagem preditiva, adotou-se a clássica metodologia de Box-Jenkins, focando em modelos ARIMA (AutoRegressive Integrated Moving Average) e SARIMA. O método segue uma abordagem iterativa:

  • Identificação: Verificação de estacionariedade e análise das funções de Autocorrelação (ACF e PACF).
  • Estimação: Ajuste dos parâmetros (p, d, q, P, D, Q) através de máxima verossimilhança.
  • Diagnóstico (Verificação): Teste rigoroso nos resíduos do modelo para garantir comportamento de "ruído branco" (Ljung-Box e Shapiro-Wilk).
  • Previsão (Forecast): Projeções Out-of-Sample contrastando o SARIMA contra métodos de Suavização Exponencial (Holt-Winters).

03. Análise Exploratória

A pergunta central deste estudo explora: "Existe um Ciclo Anual estável na Produção de Petróleo no Brasil?" A inspeção visual primária nos dá pistas valiosas da não-estacionariedade da série, marcada por uma clara tendência de crescimento e flutuações sazonais repetitivas.

Observamos um crescimento acentuado entre 2019 e 2020, seguido de oscilações (reflexo da pandemia global) e outro avanço expressivo advindo da expansão em campos do pré-sal. A fim de validar essas impressões com rigor estatístico, executamos baterias de testes formais (ADF e KPSS) para comprovar a presença de raiz unitária.

>_ R Console // Testes de Estacionariedade na Série Bruta [ ADF & KPSS ]
> adf.test(serie_petroleo) Augmented Dickey-Fuller Test data: serie_petroleo Dickey-Fuller = -3.0453, Lag order = 6, p-value = 0.1357 # Falha em rejeitar H0: A série possui raiz unitária (Não Estacionária). > kpss.test(serie_petroleo) KPSS Test for Level Stationarity data: serie_petroleo KPSS Level = 4.7847, Truncation lag parameter = 5, p-value = 0.01 # Rejeita H0: A série não é estacionária em torno da média.

A sazonalidade também foi confirmada formalmente usando o Teste QS (Quadratic Spectral), cujo valor-p atingiu 0, atestando uma ciclicidade determinística intransponível no estado bruto da série.

04. Decomposição & Pré-Processamento

A magnitude das flutuações sazonais aparenta crescer conforme o patamar de produção se eleva, o que dita a escolha de um modelo multiplicativo para a decomposição clássica. Isso nos permite isolar de forma clara a Tendência de longo prazo do Sinal Sazonal.

Para satisfazer a premissa fundamental de Box-Jenkins (estacionariedade na variância e na média), combinamos duas técnicas poderosas: aplicamos a transformação logarítmica (estabilizando a variância heteroscedástica) sucedida de uma diferenciação. Como resultado, os testes pós-transformação rejeitaram fortemente a presença de raiz unitária, garantindo a estabilidade necessária.

>_ R Console // Testes de Estacionariedade Pós-Transformação [ Sucesso ]
> adf.test(diff(log(treino))) Dickey-Fuller = -7.2502, Lag order = 6, p-value = 0.01 # Sucesso: Rejeita H0. A série transformada é estacionária!

05. Forecast Competitivo (Out-of-Sample)

Tendo a série transformada, diagnosticamos as funções de autocorrelação para construir o modelo campeão. Dividimos os dados: Treino (Jan/2001 - Abr/2021) e Teste (Mai/2021 - Mai/2025). Essa separação testou o algoritmo no período mais desafiador e volátil.

Após avaliação das funções ACF e PACF e o rigoroso teste de resíduos Ljung-Box, o modelo SARIMA(2,1,3)(0,1,1)₁₂ se destacou capturando a complexidade dos dados. Colocamos o SARIMA contra o método de Suavização Exponencial (Holt-Winters Aditivo) para comparação.

O modelo SARIMA superou as expectativas mantendo o menor Root Mean Square Error (RMSE) durante a janela de previsão. Conclui-se que o comportamento histórico não é um ruído aleatório, mas uma orquestra predizível de flutuações macroeconômicas.

Mergulhe na Pesquisa Completa

Tenha acesso aos resultados, scripts e à formatação acadêmica oficial nas versões abaixo.

Slides de Apresentação Relatório Técnico