Econometria não costuma ser um assunto muito convidativo. A grande maioria dos profissionais e pesquisadores com quem converso que fazem uso dela parecem fazê-lo como se pisassem em ovos, seguindo uma receita de bolo cuja razão das instruções eles não entendem muito bem. Acredito que essa insegurança seja colocada em parte pelo fato de muita gente nao se lembrar do que existe por trás das premissas que tornam um modelo econométrico “aplicável” para a finalidade desejada.
Boa parte dessa insegurança pode ser facilmente ultrapassada se os exercícios em econometria fossem aplicados em ambientes controlados, onde o próprio estudante cria suas séries temporais, condicionando as relações entre elas, usando da econometria para observar nos resultados de uma regressão aquilo que ele mesmo criou manualmente através de uma simulação de computador.
Vamos pensar em um exemplo para um exercício desta natureza. Um problema prático, para tornar o propósito da análise mais ilustrativo e (com sorte) mais didático.
Suponhamos dois países, Atlântida e Conchinchina, que dividem uma enorme fronteira geográfica e, portanto, comercial. Atlântida é um país globalizado, aberto ao comércio internacional, com pauta de exportações diversificada e infraestrutura consistente. Conchinchina, por outro lado, não é exatamente assim. Seu setor externo é bastante dependente do seu comércio com o vizinho geográfico e sua economia doméstica nao tão dinâmica assim, o que torna sua economia bastante dependente do desempenho de Atlântida. Assim, o volume do produto na Conchinchina possui forte relação de longo prazo com o volume do produto de Atlântida.
Em jargão de economista, dizemos que Conchinchina tem um relacionamento exógeno com Atlântida, uma vez que mudanças na economia de Atlântida afetam Conchinchina fortemente, mas o oposto não se verifica. Visualmente, poderíamos ilustrar essas duas economias conforme segue abaixo:

Como podemos ver pelo conjunto de gráficos acima, há uma relação bastante notável entre os níveis de produto de Conchinchina e Atlântida, além de uma natural relação entre os próprios ciclos econômicos de cada um dos dois países. Ao se observar Atlântida, podemos inferir sobre o que vai acontecer com Conchinchina. Vamos portanto começar a explorar os modelos que nos permitam separar o que existe de sinal e ruído nestes dados.
O primeiro modelo que vamos usar é uma regressão simples. Vamos, num primeiro momento, seguir o protocolo padrão de livro-texto e estimar um coeficiente angular (β1) mais um intercepto (β0) para a relação das variaões do PIB de Atlântida (x) nas variações do PIB da Conchinchina (y).

Para os que não entendem muito bem como funciona o protocolo de estimação de uma regressão econométrica, ela se baseia na minimização da soma dos resíduos (ε) elevados ao quadrado. Matematicamente, significa fazer isto:

Dessa forma, obtemos os betas que melhor aproximam x de y ao longo de todos os períodos usados para a estimação. Analisando os dados diretamente desta forma, obtemos os seguintes resultados:

Idealmente, quando buscamos um modelo para aproximar dados observados, esperamos que tudo aquilo que é desconsiderado deste modelo (o resíduo, ε) se comporte como algo perfeitamente aleatório, isto é, como se nao houvesse nenhuma informação útil a ser extraída dele. Na prática, define-se que um resíduo é perfeitamente aleatório quando este atende algumas condições práticas: nao possuir uma tendência (o que chamamos de estacionariedade, propriedade de reversão a uma média igual a zero), suas inovações forem não-correlacionadas com seus valores passados (ausência de autocorrelação), e sua variância convergir para um valor constante (homocedasticidade).
Quando estas condições sao atendidas, podemos considerar que os estimadores (β1 e β0) são coeficientes consistentes (nao possuem viés) e eficientes (possuem a mínima variância possível), ou seja, são coeficientes que vencem qualquer outra combinação de coeficientes para atender a mesma necessidade de “se encaixar” aos dados.
A análise destes dados criados poderia muito bem terminar por aqui, uma vez que criamos os dados e estabelecemos uma relação bem fundamentada entre eles através de um modelo simples. Porém, há mais história por trás destes dados que mesmo um modelo econométrico aparentemente bem-especificado pode deixar escapar. Quando criamos as economias de Atlântida e Conchinchina, mostramos que ambos os países possuíam uma relação comercial bastante forte, onde o PIB da Conchinchina poderia ser determinado pelo crescimento de Atlântida, e que os volumes dos mesmos possuíam uma relação de longo prazo. Quando extrapolamos o modelo especificado no longo prazo, notamos que a característica de relação ao nível de volume de tais países já nao mais se verifica.
Se assumirmos uma trajetória para o PIB de Atlantida até 2050 e extrapolarmos a relação estabelecida pelo modelo econométrico inicial, notamos uma tendência crescente na diferença percentual entre as duas economias. Em poucas palavras, por mais que este modelo esteja econometricamente bem especificado, ele falha em capturar características entre as séries de tempo que desejamos manter.

Ou seja, mesmo um modelo econométrico bem especificado pode falhar em atender uma finalidade específica, do conhecimento do macroeconomista/econometrista.
Gostaria, agora, de introduzir um modelo que é bastante tradicional no framework econométrico de equação-única, isto é, para modelos onde a variável em questão possui relação exclusivamente exógena com as demais variáveis explicativas envolvidas.
Apesar de pouco mencionado na grande maioria dos livros-texto de econometria popularizados pelos cursos de graduação e pós em economia, os modelos chamados ARDL (Auto Regressive Distributed Lag) ganharam popularidade nos anos 90, sobretudo após a vasta literatura de Pesaran e Shin. A principal vantagem destes modelos é exatamente permitir explorar as relações de longo prazo entre as variáveis modeladas, em um contexto onde as suas tendências geram ao menos uma combinação linear cujo resíduo é estacionário (sem tendência). Em outras palavras, quando ao menos uma variável do lado direito da equação cointegra com a variável dependente do lado esquerdo.
A especificação geral de um modelo ARDL(n,p) pode ser denotada na seguinte forma funcional matemática:

Modelos ARDL tendem a ser uma referência prática para análises econométricas de equação única onde é do interesse do econometrista: 1) avaliar a relação dinâmica de curto e longo prazo das séries; 2) associar elasticidades de curto e longo prazo para variáveis explicativas; 3) usar das defasagens como um controle para “tratar” o possível viés de variável omitida na estimação dos coeficientes (apesar de haver formas mais “educadas” para isso na literatura); e 4) permitir ao analista misturar em uma mesma regressão de equação única variáveis com e sem tendência linear (variáveis I(1) e I(0)). Sua principal vantagem também é a simplicidade de permitir modelos estimáveis em apenas um único estágio, algo que ficará mais claro quando falarmos do próximo modelo no texto seguinte.
Como sei que ficar apenas na notação matemática e na citação de literatura acadêmica deixa as coisas ainda muito abstratas, vamos voltar para o exemplo prático que criamos. Vamos especificar um ARDL(1,1) para a relação entre Conchinchina e Atlântida:

Com esta especificação e os mesmos dados, obtemos agora os seguintes resultados:


Nas figuras acima, notamos como o comportamento do resíduo garante que as estatísticas-teste das variáveis sejam todas significantes (p-valor < 5%), e críveis, uma vez que o modelo não apresenta evidência de autocorrelação residual e nem heterocedasticidade. O único impasse, neste caso, é o fato de estarmos lidando com variáveis em nível, o que significa que a tendência entre elas pode ser a única razão por trás das estatísticas-teste resultarem como significantes. Idealmente, um modelo econométrico onde se estima variáveis em nível com tendência precisa ser guiado por explicações de teoria econômica para suplementar tal dificuldade. Engle & Granger, nos anos 80, entretanto, demonstraram que na presença de cointegração os coeficientes tendem a ser consistentes (e o viés desaparece na medida em que aumentamos a amostra).
Em posse de estimativas consistentes para as elasticidades (α0, φ1, β0 e β1) e do nosso modelo, podemos deduzir a sua dinâmica de curto e longo prazo para inovações de x em y no tempo t:

Já a dinâmica de longo prazo pode ser deduzida através de um modelo derivado com pouca álgebra. Comecemos da especificação original:

Por se tratar de variáveis I(1) somente, podemos aproximar a expectativa futura de E[X_t]=E[X_{t-1}]=E[X] para y e x, da seguinte forma:

Assim, podemos resolver para E[y] e desaparecer com o resíduo E[v], uma vez que este é igual a zero. Teremos:

A relação (β0+β1)/(1-φ1) dá, portanto, a dinâmica de longo prazo das inovações de x em y. Usando os parâmetros obtidos na estimação, ficamos com:

Dessa forma, conseguimos descrever, de forma compreensível, as relações de curto e longo prazo deduzidas a partir de um modelo ARDL. Na segunda parte apresentarei um modelo final, que incorpora as vantagens do modelo ARDL e dá uma forma funcional de equação única para dinâmicas de curto e longo prazo explícitas para descrever corretamente o relacionamento entre os dois países em questão. Por hoje é isso.
.
Publicado originalmente aqui e aqui.
Leia também:
Econometria de séries de tempo — Estudando a partir de aplicações em ambientes controlados (parte 2)
Seriam as expectativas de inflação do mercado racionais?
Calibragem em macroeconomia
Macroeconomia e expectativas – o porquê, o para quê e o como
Deixe um comentário