Econometria de séries de tempo — estudando a partir de aplicacoes em ambientes controlados (parte 2)
Esta entrada no blog é uma continuacao da parte 1, postada aqui poucos dias atrás. Se voce está chegando agora e perdeu a primeira parte, provavelmente nao vai conseguir acompanhar a linha que foi desenvolvida até aqui. Recomendo a leitura anterior neste link.
Nesta postagem, continuo de onde parei na discussao anterior, onde tento encontrar um modelo econométrico que guarda as caracteristicas que inventei para dois países criados em uma simulacao de computador. Para relembrar, tratávamos de Atlantida e Conchinchina, dois países que dividiam uma enorme fronteira geográfica e comercial, que determinava o desempenho da economia da Conchinchina mas nao necessariamente determinava o desempenho economico de Atlantida, um país muito mais globalizado e aberto ao comércio internacional.
Na primeira parte, seguimos o protocolo padrao do livro-texto de econometria, e obtivemos um modelo a primeira vista bem especificado da relacao que parecia mais óbvia entre os dois países. Regredimos o PIB da Conchinchina contra o PIB de Atlantida em primeira diferenca e encontramos um coeficiente angular significante que explicava parte nao-desprezivel da variacao do PIB da Conchinchina.
Entretanto, notamos que essa especificacao gerava desvios crescentes entre as duas economias no longo prazo, caracteristica que vai de encontro com a estrutura que estabelecemos a priori para as duas economias. Conchinchina deve crescer junto com Atlantida, nao desviar-se dela eternamente. Para capturar este relacionamento de longo prazo, portanto, entendemos que mesmo um modelo econometricamente bem especificado, com resíduos coerentes, nao é suficiente para garantir tal condicao.
Nesta parte dessa série de posts, portanto, gostaria de introduzir um modelo que é bastante tradicional no framework econométrico de equacao-única, isto é, para modelos onde a variável em questao possui relacao exclusivamente exógena com as demais variáveis explicativas envolvidas.
Apesar de pouco mencionado na grande maioria dos livros-texto de econometria popularizados pelos cursos de graduacao e pós em economia, os modelos chamados ARDL (AutoRegressive Distributed Lag) ganharam popularidade nos anos 90, sobretudo após a vasta literatura de Pesaran e Shin. A principal vantagem destes modelos é exatamente permitir explorar as relacoes de longo prazo entre as variáveis modeladas, em um contexto onde as suas tendencias geram ao menos uma combinacao linear cujo resíduo é estacionário (sem tendencia). Em outras palavras, quando ao menos uma variável do lado direito da equacao cointegra com a variável dependente do lado esquerdo.
A especificacao geral de um modelo ARDL(n,p) pode ser denotada na seguinte forma funcional matemática:.
Modelos ARDL tendem a ser uma referencia prática para análises econométricas de equacao única onde é do interesse do econometrista avaliar 1) a relacao dinamica de curto e longo prazo das séries; 2) associar elasticidades de curto e longo prazo para variáveis explicativas; 3) usar das defasagens como um controle para “tratar” o possível viés de variável omitida na estimacao dos coeficientes (apesar de haver formas mais “educadas” para isso na literatura); e 4) permitir o analista de misturar em uma mesma regressao de equacao única variáveis com e sem tendencia linear (variáveis I(1) e I(0)). Sua principal vantagem também é a simplicidade de permitir modelos estimáveis em apenas um único estágio, algo que ficará mais claro quando falarmos do próximo modelo no texto seguinte.
Como sei que ficar apenas na notacao matemática e na citacao de literatura academica deixa as coisas ainda muito abstratas, vamos voltar para o exemplo prático que criamos. Vamos especificar um ARDL(1,1) para a relacao entre Conchinchina e Atlantida:
Com esta especificacao e os mesmos dados, obtemos os seguintes resultados:
Nestas figuras, notamos como o comportamento do resíduo garante que as estatisticas teste das variáveis sao todas significantes (p-valor < 5%), e críveis, uma vez que o modelo nao apresenta evidencia de autocorrelacao residual nem heterocedasticidade. O único impasse, neste caso, é o fato de estarmos lidando com variáveis em nível, o que significa que a tendencia entre elas pode ser a única razao por trás das estatisticas teste resultarem como significantes. Idealmente, um modelo econométrico onde se estima variáveis em nível com tendencia precisa ser guiado por explicacoes de teoria economica para suplementar tal dificuldade. Engle & Granger, nos anos 80, entretanto, demonstram que na presenca de cointegracao os coeficientes tendem a ser consistentes (e o viés desaparece na medida em que aumentamos a amostra).
Em posse de estimativas consistentes para as elasticidades (α0, φ1, β0 e β1) e do nosso modelo, podemos deduzir a sua dinamica de curto e longo prazo para inovacoes de x em y no tempo t:
Já a dinamica de longo prazo pode ser deduzida através de um modelo derivado com pouca álgebra. Comecemos da especificacao original:
Por se tratar de variáveis I(1) somente, podemos aproximar a expectativa futura de E[Xt]=E[Xt-1]=E[X] para y e x, da seguinte forma:
Assim, podemos resolver para E[y] e desaparecer com o resíduo E[v], uma vez que este é igual a zero. Teremos:
A relacao (β0+β1)/(1-φ1 ) dá, portanto, a dinamica de longo prazo das inovacoes de x em y. Usando os parametros obtidos na estimacao, ficamos com:
Assim, conseguimos descrever, de forma compreensível, as relacoes de curto e longo prazo deduzidas a partir de um modelo ARDL. Na próxima e última parte desta série de textos, apresentarei um modelo final, que incorpora as vantagens do modelo ARDL e dá uma forma funcional de equacao única para dinamicas de curto e longo prazo explícitas para descrever corretamente o relacionamento entre os dois países em questao. Por hoje é isso.