Econometria de séries de tempo — Estudando a partir de aplicações em ambientes controlados (parte 1)

Econometria não costuma ser um assunto muito convidativo. A grande maioria dos profissionais e pesquisadores com quem converso que fazem uso dela parecem fazê-lo como se pisassem em ovos, seguindo uma receita de bolo cuja razão das instruções eles não entendem muito bem. Acredito que essa insegurança seja colocada em parte pelo fato de muita gente nao se lembrar do que existe por trás das premissas que tornam um modelo econométrico “aplicável” para a finalidade desejada.

Boa parte dessa insegurança pode ser facilmente ultrapassada se os exercícios em econometria fossem aplicados em ambientes controlados, onde o próprio estudante cria suas séries temporais, condicionando as relações entre elas, usando da econometria para observar nos resultados de uma regressão aquilo que ele mesmo criou manualmente através de uma simulação de computador.

Vamos pensar em um exemplo para um exercício desta natureza. Um problema prático, para tornar o propósito da análise mais ilustrativo e (com sorte) mais didático.

Suponhamos dois países, Atlântida e Conchinchina, que dividem uma enorme fronteira geográfica e, portanto, comercial. Atlântida é um país globalizado, aberto ao comércio internacional, com pauta de exportações diversificada e infraestrutura consistente. Conchinchina, por outro lado, não é exatamente assim. Seu setor externo é bastante dependente do seu comércio com o vizinho geográfico e sua economia doméstica nao tão dinâmica assim, o que torna sua economia bastante dependente do desempenho de Atlântida. Assim, o volume do produto na Conchinchina possui forte relação de longo prazo com o volume do produto de Atlântida.

Em jargão de economista, dizemos que Conchinchina tem um relacionamento exógeno com Atlântida, uma vez que mudanças na economia de Atlântida afetam Conchinchina fortemente, mas o oposto não se verifica. Visualmente, poderíamos ilustrar essas duas economias conforme segue abaixo:

Ambas as economias foram simuladas “em laboratório”, onde assumi uma distribuição de probabilidade para as taxas de crescimento de ambos os países e impus uma relação entre os dados, que será desvendada pelos exercícios econométricos a seguir.

Como podemos ver pelo conjunto de gráficos acima, há uma relação bastante notável entre os níveis de produto de Conchinchina e Atlântida, além de uma natural relação entre os próprios ciclos econômicos de cada um dos dois países. Ao se observar Atlântida, podemos inferir sobre o que vai acontecer com Conchinchina. Vamos portanto começar a explorar os modelos que nos permitam separar o que existe de sinal e ruído nestes dados.

O primeiro modelo que vamos usar é uma regressão simples. Vamos, num primeiro momento, seguir o protocolo padrão de livro-texto e estimar um coeficiente angular (β1) mais um intercepto (β0) para a relação das variaões do PIB de Atlântida (x) nas variações do PIB da Conchinchina (y).

Com um primeiro modelo de regressão simples, podemos encontrar uma relação linear entre as variações percentuais trimestrais do PIB de Atlântida para as mesmas variações trimestrais do PIB da Conchinchina, e assim obter uma estimativa do segundo país a partir dos dados observados do primeiro.

Para os que não entendem muito bem como funciona o protocolo de estimação de uma regressão econométrica, ela se baseia na minimização da soma dos resíduos (ε) elevados ao quadrado. Matematicamente, significa fazer isto:

Por se tratar de um procedimento matemático de minimização da soma dos quadrados dos erros de uma equação linear, chamamos este processo de estimação de “Mínimos Quadrados Ordinários” ou MQO.

Dessa forma, obtemos os betas que melhor aproximam x de y ao longo de todos os períodos usados para a estimação. Analisando os dados diretamente desta forma, obtemos os seguintes resultados:

Aqui, temos um modelo que se apresenta perfeitamente defensável para ilustrar a relação entre as duas economias. O resíduo mostra uma média próxima de zero, sem tendência, frequente troca de sinais (evidência de baixa autocorrelação) e um desvio-padrão relativamente constante, indo de -2% a 2% na variacao trimestral.

Idealmente, quando buscamos um modelo para aproximar dados observados, esperamos que tudo aquilo que é desconsiderado deste modelo (o resíduo, ε) se comporte como algo perfeitamente aleatório, isto é, como se nao houvesse nenhuma informação útil a ser extraída dele. Na prática, define-se que um resíduo é perfeitamente aleatório quando este atende algumas condições práticas: nao possuir uma tendência (o que chamamos de estacionariedade, propriedade de reversão a uma média igual a zero), suas inovações forem não-correlacionadas com seus valores passados (ausência de autocorrelação), e sua variância convergir para um valor constante (homocedasticidade).

Quando estas condições sao atendidas, podemos considerar que os estimadores (β1 e β0) são coeficientes consistentes (nao possuem viés) e eficientes (possuem a mínima variância possível), ou seja, são coeficientes que vencem qualquer outra combinação de coeficientes para atender a mesma necessidade de “se encaixar” aos dados.

A análise destes dados criados poderia muito bem terminar por aqui, uma vez que criamos os dados e estabelecemos uma relação bem fundamentada entre eles através de um modelo simples. Porém, há mais história por trás destes dados que mesmo um modelo econométrico aparentemente bem-especificado pode deixar escapar. Quando criamos as economias de Atlântida e Conchinchina, mostramos que ambos os países possuíam uma relação comercial bastante forte, onde o PIB da Conchinchina poderia ser determinado pelo crescimento de Atlântida, e que os volumes dos mesmos possuíam uma relação de longo prazo. Quando extrapolamos o modelo especificado no longo prazo, notamos que a característica de relação ao nível de volume de tais países já nao mais se verifica.

Se assumirmos uma trajetória para o PIB de Atlantida até 2050 e extrapolarmos a relação estabelecida pelo modelo econométrico inicial, notamos uma tendência crescente na diferença percentual entre as duas economias. Em poucas palavras, por mais que este modelo esteja econometricamente bem especificado, ele falha em capturar características entre as séries de tempo que desejamos manter.

Aqui, notamos que a diferença percentual entre os volumes dos PIBs de Atlântida e Conchinchina aumentam ao longo do tempo na projeção do modelo MQO, o que falha em atender a característica de longo prazo que definimos para as séries.

Ou seja, mesmo um modelo econométrico bem especificado pode falhar em atender uma finalidade específica, do conhecimento do macroeconomista/econometrista.

Gostaria, agora, de introduzir um modelo que é bastante tradicional no framework econométrico de equação-única, isto é, para modelos onde a variável em questão possui relação exclusivamente exógena com as demais variáveis explicativas envolvidas.

Apesar de pouco mencionado na grande maioria dos livros-texto de econometria popularizados pelos cursos de graduação e pós em economia, os modelos chamados ARDL (Auto Regressive Distributed Lag) ganharam popularidade nos anos 90, sobretudo após a vasta literatura de Pesaran e Shin. A principal vantagem destes modelos é exatamente permitir explorar as relações de longo prazo entre as variáveis modeladas, em um contexto onde as suas tendências geram ao menos uma combinação linear cujo resíduo é estacionário (sem tendência). Em outras palavras, quando ao menos uma variável do lado direito da equação cointegra com a variável dependente do lado esquerdo.

A especificação geral de um modelo ARDL(n,p) pode ser denotada na seguinte forma funcional matemática:

Nesta formulação geral, o modelo comporta um intercepto (α0), um coeficiente de tendência linear (α1, que multiplica a tendencia t), e uma sequência finita de coeficientes para n observações passadas da variável dependente (y), além dos possíveis regressores (x) que podem ser contemporâneos ou com p-1 defasagens.

Modelos ARDL tendem a ser uma referência prática para análises econométricas de equação única onde é do interesse do econometrista: 1) avaliar a relação dinâmica de curto e longo prazo das séries; 2) associar elasticidades de curto e longo prazo para variáveis explicativas; 3) usar das defasagens como um controle para “tratar” o possível viés de variável omitida na estimação dos coeficientes (apesar de haver formas mais “educadas” para isso na literatura); e 4) permitir ao analista misturar em uma mesma regressão de equação única variáveis com e sem tendência linear (variáveis I(1) e I(0)). Sua principal vantagem também é a simplicidade de permitir modelos estimáveis em apenas um único estágio, algo que ficará mais claro quando falarmos do próximo modelo no texto seguinte.

Como sei que ficar apenas na notação matemática e na citação de literatura acadêmica deixa as coisas ainda muito abstratas, vamos voltar para o exemplo prático que criamos. Vamos especificar um ARDL(1,1) para a relação entre Conchinchina e Atlântida:

Lembrando que aqui temos y como o PIB da Conchinchina sendo explicado pelos x’s que sao o PIB de Atlântida. Dessa vez, usamos uma defasagem de y também no lado direito da equação. Note que as variáveis estao em nível, diferentemente de como havíamos modelado anteriormente.

Com esta especificação e os mesmos dados, obtemos agora os seguintes resultados:

O modelo se adequa bem aos dados quando usamos o modelo em uma estimativa condicionada às variáveis observadas. O resíduo, apesar de aqui estar denotado em uma unidade diferente do primeiro modelo, segue o mesmo princípio de estacionariedade, autocorrelação e homocedasticidade.

Nas figuras acima, notamos como o comportamento do resíduo garante que as estatísticas-teste das variáveis sejam todas significantes (p-valor < 5%), e críveis, uma vez que o modelo não apresenta evidência de autocorrelação residual e nem heterocedasticidade. O único impasse, neste caso, é o fato de estarmos lidando com variáveis em nível, o que significa que a tendência entre elas pode ser a única razão por trás das estatísticas-teste resultarem como significantes. Idealmente, um modelo econométrico onde se estima variáveis em nível com tendência precisa ser guiado por explicações de teoria econômica para suplementar tal dificuldade. Engle & Granger, nos anos 80, entretanto, demonstraram que na presença de cointegração os coeficientes tendem a ser consistentes (e o viés desaparece na medida em que aumentamos a amostra).

Em posse de estimativas consistentes para as elasticidades (α0, φ1, β0 e β1) e do nosso modelo, podemos deduzir a sua dinâmica de curto e longo prazo para inovações de x em y no tempo t:

Notamos o decaimento para uma inovacao de x=1 em y, que atinge 0.87 de variação no pico, com decaimento gradual para 0 em 10 períodos.

Já a dinâmica de longo prazo pode ser deduzida através de um modelo derivado com pouca álgebra. Comecemos da especificação original:

Os símbolos I(1) indicam que ambas as variáveis, y e x, possuem uma tendência linear, ou seja, de ordem um.

Por se tratar de variáveis I(1) somente, podemos aproximar a expectativa futura de E[X_t]=E[X_{t-1}]=E[X] para y e x, da seguinte forma:

Teríamos problemas para fazer esta aproximação do modelo caso as variáveis fossem I(2) ou mais. Uma vez que, mesmo no limite, inovações em x e y teriam caráter de uma ordem acima das inovações anteriores, fato que não ocorre em séries I(1).

Assim, podemos resolver para E[y] e desaparecer com o resíduo E[v], uma vez que este é igual a zero. Teremos:

Aqui, encontramos uma forma funcional de longo prazo para y usando x, estimada pelo modelo ARDL(1,1).

A relação (β0+β1)/(1-φ1) dá, portanto, a dinâmica de longo prazo das inovações de x em y. Usando os parâmetros obtidos na estimação, ficamos com:

Assim, se esperarmos uma mudança de 1 unidade em x, teremos um incremento esperado de 1.16 em y no longo prazo.

Dessa forma, conseguimos descrever, de forma compreensível, as relações de curto e longo prazo deduzidas a partir de um modelo ARDL. Na segunda parte apresentarei um modelo final, que incorpora as vantagens do modelo ARDL e dá uma forma funcional de equação única para dinâmicas de curto e longo prazo explícitas para descrever corretamente o relacionamento entre os dois países em questão. Por hoje é isso.

Publicado originalmente aqui e aqui.

Leia também: Econometria de séries de tempo — Estudando a partir de aplicações em ambientes controlados (parte 2)

Deixe um comentário

Seu endereço de e-mail não ficará público