Categoria:Regressão Espacial

De Wiki da Pelli Sistemas Engenharia
Ir para navegação Ir para pesquisar

REGRESSÃO ESPACIAL

INTRODUÇÃO

O valor de mercado de imóveis urbanos pode ser estimado pelo modelo clássico de regressão linear (MCRL)e uma das premissas básica é admitir-se a independência espacial das informações extraídas do mercado. Em outras palavras, seria dizer que uma informação de mercado não influencia as informações na vizinhança. Contudo, dados associados à posição que ocupam no espaço urbano, considerando suas coordenardas geográficas x, y e z, associadas às cidades, regiões homogêneas, bairros, pólos valorizantes e desvalorizantes, estão caracterizados pela dependência ou heterogeneidade espacial (Anselin, 1988).

A questão principal é que as observações levantadas no mercado apresentam indexação no espaço, tendo como característica a continuidade, com uma variação gradual de valores na vizinhança. Na presença destes efeitos, os resultados obtidos pelo MCRL não são capazes de explicar com fidelidade o comportamento do mercado imobiliário, podendo gerar avaliações tendenciosas, inconsistentes ou ineficientes.

Para corrigir estas anomalias recomenda-se a aplicação da metodologia denominada Econometria Espacial, que usa como ferramenta estatística a Inferência Espacial. Esta metodologia foi desenvolvida inicialmente por Matheron (1965) e recebeu grande impulso nas ampliações realizadas por Anselin (1988), principalmente na parte aplicada, com o desenvolvimento da ferramenta computacional denominada SpaceStat (Anselin, 1990).

A literatura internacional tem dado relativa importância da questão espacial na avaliação de imóveis e tem tratado o problema de diversas formas, e em muitos casos com a utilização de variogramas, que são úteis para testar os efeitos de dependência espacial.

No Brasil, o primeiro trabalho com uso da metodologia definida por Anselin (1998) foi elaborado por Dantas et al (2001), representando a incorporação da questão espacial à avaliação de imóveis. Tal estudo estimou um modelo espacial para uma região da cidade do Recife, com uma amostra de apartamentos situados em 59 edifícios residenciais, distribuídos em quatro bairros e encontra indicações de autocorrelação espacial. Em expansões deste trabalho, Dantas et al (2002a), Dantas et al (2002b) e Magalhães e Dantas (2002), com ampliação da amostra e do número de bairros, encontram resultados mais consistentes, que reforçam a presença de efeitos de dependência espacial em dados imobiliários na cidade do Recife. Nos MCRL usualmente empregados nas avaliações de imóveis é comum a inclusão de variáveis indicativas da macrolocalização dos imóveis, tais como a distância a pólos de influência e a definição de regiões homogêneas de valores. Contudo, a microlocalização, que leva em conta a interação espacial entre os dados, normalmente não tem sido considerada. Quando os dados estão distribuídos espacialmente, como é o caso de imóveis no mercado habitacional, podem existir erros de medidas em relação à exata localização do imóvel, como também efeitos de interações espaciais (González 2003). Por estas razões deve ser considerado um fator adicional ao modelo tradicionalmente adotado, que é a autocorrelação ou dependência espacial. A não consideração deste efeito, como vem ocorrendo rotineiramente na análise do comportamento do mercado imobiliário, pode gerar problemas de estimação, pois, na presença de autocorrelação espacial nos resíduos, os parâmetros estimados por (3.2) são ineficientes (Dantas 2001). Neste caso, testes de hipóteses e os intervalos de confiança inferidos, não são mais válidos e as decisões tomadas com base neles podem ser enganosas. Assim, a dependência espacial dos preços observados em relação aos preços dos imóveis vizinhos provocará estimações tendenciosas e inconsistentes para os parâmetros, em virtude de um erro de especificação no modelo, pela não inclusão de uma variável dependente espacialmente defasada no modelo (3.1). Em ambos os casos, o MCRL mostra-se inadequado, devendo ser substituído pelos Modelos Espaciais, estimados por uma nova metodologia denominada Modelagem por Econometria Espacial.


MODELAGEM POR ECONOMETRIA ESPACIAL

Anselin (1998) afirma que existem dois tipos de efeitos que podem ser encontrados nos dados distribuídos espacialmente: o efeito de heterogeneidade espacial e o efeito de autocorrelação ou dependência espacial. O primeiro diz respeito à instabilidade dos parâmetros em relação à macro região em que se situam os dados e, na ausência de dependência espacial, podem ser tratados pela metodologia tradicional ou pelas RNAs; o segundo efeito diz respeito a uma interação espacial entre os dados, que pode afetar o termo de erro, a variável dependente ou ambos. Neste caso, a econometria espacial é capaz de realizar estimações seguras dos parâmetros do modelo. Os efeitos de autocorrelação espacial no termo erro devem ser tratados pelos Modelos de Erros Espaciais, através da inclusão de um fator de defasagem espacial nos erros aleatórios do modelo (3.1) e que será apresentado na seção 3.3.3, enquanto que os efeitos de dependência entre os preços de cada imóvel e os preços dos imóveis vizinhos devem ser tratados pelos Modelos de Defasagem Espacial, onde se inclui uma variável dependente espacialmente defasada, como variável explicativa no modelo (3.1), que será mostrado na seção 3.3.4. Existem duas maneiras de se diagnosticar a presença de efeitos de dependência espacial em uma amostra: pela análise gráfica do variograma ou utilizando-se testes estatísticos específicos como os testes de Moran I e os testes LM Robusto (erro) e LM Robusto (defasagem). No primeiro caso, a inferência espacial é realizada pelo processo denominado de Krigeagem , desenvolvido por Matheron (1965); no segundo caso, a modelagem espacial é realizada conforme a metodologia desenvolvida por Anselin (1988), que é apresentada a seguir e utilizada no estudo de caso desenvolvido no capítulo 4.


MODELAGEM PELA METODOLOGIA DESENVOLVIDA POR ANSELIN

Para diagnosticar a presença de efeitos de dependência espacial, bem como introduzir estes efeitos no modelo (3.1), pela metodologia desenvolvida por Anselin, é necessário definir, previamente, uma matriz de pesos espaciais, conhecida como W. No caso mais simples, W é uma matriz simétrica em que cada elemento wij, é igual a 1(um) se i e j são vizinhos e igual a zero no caso contrário. Por convenção, os elementos diagonais são iguais a zero, ou seja, wii = 0. Outras matrizes, como as propostas por (Cliff e Ord, 1981) e (Case et al, 1993), consideram a importância dos vizinhos através de uma ponderação correspondente ao inverso da distância ou ao inverso do quadrado da distância entre eles. Normalmente, esta distância é calculada com base nas coordenadas geográficas dos imóveis que compõe a amostra. Cuidado especial deve ser dado quando existirem, na amostra, imóveis localizados em um mesmo edifício. Nesta circunstância, a distância calculada utilizando as coordenadas geográficas será igual a zero, o que contradiz a lógica de mercado. Apartamentos situados em um mesmo edifício possuem uma alta correlação espacial e a distância entre estes imóveis deve ser medida na vertical. Em geral, a matriz W é padronizada por linha, assumindo a nomenclatura Ws (Dantas 2001). Neste caso, cada elemento de Ws, representado por Wsij, é obtido dividindo-se Wij pela soma dos elementos da linha i a que pertence, ou seja WW.jpg . Nesta matriz, os elementos das linhas somam 1. Este procedimento, além de facilitar a interpretação dos pesos, como uma média ponderada dos valores dos vizinhos, assegura a compatibilidade entre os modelos (Anselin e Bera, 1998). O argumento principal a favor do uso de uma matriz de peso espacial é que esta associa uma variável em certo ponto do espaço (preço dos imóveis para o mercado de habitação) às observações da mesma variável em outros lugares do espaço. Neste trabalho será utilizada, por simplicidade, a notação W para a matriz de pesos espaciais ponderada por linha, calculada com base no inverso da distância entre os imóveis. Os principais testes utilizados para detectar a autocorrelação espacial são Moran I, LM Robusto (erro) e LM Robusto (defasagem). O teste de Moran I é o mais usado nos estudos de dados de corte transversal de unidades geográficas. O problema deste teste é que ele não identifica o tipo de efeito (erro ou defasagem espacial). Por isso, serão utilizados testes mais específicos: o LM (erro) Robusto, para detectar efeitos de autocorrelação espacial no termo de erro; e o LM (defasagem) Robusto, para verificar a presença de efeitos de defasagem espacial na variável dependente. A seguir, estes testes serão apresentados de maneira resumida. Maiores detalhes podem ser encontrados em Anselin (1988a). É importante frisar que a validade destes testes exige a aceitação das hipóteses de normalidade e homocedasticidade dos resíduos de MQO, obtidos pelo modelo (3.1).

Teste LM Robusto (erro)

O teste LM (erro) Robusto é assintótico realizado a partir da estatística (3.3), que tem distribuição Qui-quadrado com um grau de liberdade, sob a hipótese nula de não existência de autocorrelação espacial no termo erro. A estatística de teste é dada por:

LM (erro) = R esp 3.jpg

onde e é o vetor de resíduos de MQO, W a matriz de pesos espaciais, s2 = e’e/n a estimativa de máxima verossimilhança da variância do modelo (3.1), n o número de dados da amostra e tr o operador denominado traço da matriz. Assim, se a estatística de teste for superior ao ponto crítico da distribuição Qui-quadrado, com um grau de liberdade, rejeita-se a hipótese de não autocorrelação espacial nos resíduos do modelo clássico de regressão.

Teste LM Robusto (Defasagem)

O teste LM (defasagem) Robusto é também assintótico, realizado a partir da estatística (3.4), que tem distribuição Qui-quadrado com um grau de liberdade, sob a hipótese nula de não existência de defasagem espacial na variável dependente. A estatística de teste é dada por LM (defasagem) = 3.4.jpg

onde e é o vetor de resíduos de MQO, W a matriz de pesos espaciais, y o vetor de observações na variável dependente, s2 = e’e/n a estimativa de máxima verossimilhança da variância do modelo (3.1), X a matriz das variáveis independentes, b o vetor de parâmetros estimados via MQO; n o número de dados da amostra M=I-X(X'X)-1 X' e tr o operador denominado traço da matriz. A hipótese de não autocorrelação espacial na variável dependente do modelo clássico de regressão será rejeitada se a estatística de teste for superior ao ponto crítico da distribuição Qui-quadrado com um grau de liberdade. Uma vez detectada a presença de autocorrelação espacial nos dados, faz-se necessário introduzir extensões no modelo tradicional representado na equação (3.1), considerando-se os efeitos da autocorrelação espacial nos erros, pelo Modelo de Erro Espacial, e os efeitos ocasionados pelas interações entre os preços, pelo Modelo de Defasagem Espacial, como será mostrado a seguir.


O MODELO DE ERRO ESPACIAL

A autocorrelação espacial no termo de erro está relacionada a erros de medida ocasionados pelas divisões artificiais das unidades geográficas, como os limites estabelecidos para os bairros ou regiões consideradas homogêneas de uma cidade, que não necessariamente coincidem com a realidade estudada. Isto é, na prática, o consumidor não tem o conhecimento exato dos limites que dividem os bairros ou regiões. No mercado habitacional há uma tendência de efeito de transbordamento de um bairro de maior importância sobre os seus vizinhos. Por exemplo, o bairro de Floresta, em Belo Horizonte, devido à sua importância no contexto urbano e à grande demanda por habitação, foi se estendendo sobre os bairros Santa Tereza e Colégio Batista. Outro fator que pode gerar a autocorrelação espacial nos erros é a omissão de variáveis locacionais relevantes, notadamente as variáveis de microlocalização. Para tratar adequadamente este tipo de efeito espacial nos dados, a primeira modificação com relação à equação (3.1) será considerar o processo espacial autoregressivo no termo de erro,da seguinte forma: 3.5.jpg

onde representa o coeficiente de autocorrelação espacial do termo erro; u é normalmente distribuído com média zero e variância constante; I é a matriz identidade e W a matriz de pesos espaciais ponderada.Substituindo (3.5) em (3.1) resulta no seguinte modelo de erro espacial: 3.6.jpg

Para estimações eficientes dos parâmetros do modelo (3.6) é necessário usar o estimador de verossimilhança , que consiste em maximizar a função de log-verossimilhança dada por (3.7), utilizando-se de técnicas de otimização não linear. 3.7.jpg

Onde n representa o número de dados da amostra, ln o símbolo do logaritmo natural, 2 a variância do modelo e as demais variáveis têm a mesma definição da equação (3.4). Como comentado na seção 3.3.3, quando os erros são autocorrelacionados espacialmente, os parâmetros estimados pelo modelo (3.1) são não eficientes, isto é, os desvios padrões que se encontram associados a eles são tendenciosos. Assim, os testes de hipóteses e os intervalos de confiança construídos não são mais válidos e os resultados obtidos a partir deles são enganosos.

O MODELO DE DEFASAGEM ESPACIAL

O efeito de defasagem espacial é ocasionado pela dependência espacial criada como conseqüência da interação espacial entre os preços dos imóveis, conhecido como “efeito de vizinhança” (Dantas 2001). Quando um comprador e um vendedor realizam a transação de um imóvel, eles não somente levam em consideração as suas características estruturais e locacionais, mas também são influenciados pelos preços dos imóveis vizinhos. Neste caso, esta influência é medida pela inclusão de uma variável adicional no modelo (3.1), dada por W × Y, sendo W a matriz de pesos espaciais e Y o vetor de preços dos imóveis, que é a variável dependente espacialmente defasada (Anselin 1998). Cada elemento WYi, do vetor WY é formado por uma ponderação dos preços dos imóveis vizinhos. Esta variável serve também para captar os efeitos de dependência espacial não considerados explicitamente nas variáveis locacionais comumente utilizadas, como questões ligadas à segurança, saúde e educação (Dantas 2001). A introdução do termo de defasagem espacial, como variável explicativa, serve como “proxy” para as variáveis independentes omitidas que estão correlacionadas com as características locacionais (Pace, Barry e Sirmams, 1998). Com a incorporação desta variável, o modelo passa a ser 3.8.jpg

onde é o coeficiente de autocorrelação espacial da variável WY,  é uma variável aleatória independente e identicamente distribuída. Tendo em vista que a variável WY é aleatória, a estimação por MQO não é adequada, porque viola um dos pressupostos básicos do MCRL . Observe-se também que, ao comparar os modelos com , constata-se no primeiro a falta da variável WY, o que gera um grave erro de especificação . Neste caso, são tendenciosas e inconsistentes. Da mesma forma que no modelo, a estimação deve ser realizada pelo método da máxima verossimilhança, que consiste na maximização da função utilizando técnicas de otimização não linear.

                                                           3.9.jpg 


ESCOLHA DE MODELOS

Uma maneira de escolher o modelo a adotar – o Modelo de Erro espacial ou o Modelo de Defasagem Espacial - pode ser feita pela comparação do valor absoluto das estatísticas. Assim, quanto maior for o valor encontrado na estatística de teste, maior será o efeito espacial correspondente a esta estatística, conforme argumento de Anselin e Rey (1991).

No momento, esta categoria não possui nenhuma página ou arquivo multimídia.