Colegas, bom dia. Na pesquisa de dados para avaliação de um apartamento em São Paulo, deparo-me com as situações a seguir:
1) Há um imóvel com características semelhantes sendo anunciado por mais de uma corretora e cada anúncio possui um valor distinto. Que dado incluir no modelo? Maior, menor, ambos?
2) Há mais de um imóvel semelhante em um mesmo edifício, remanescentes da construtora e digamos que idênticos entre si, sendo anunciados pelo mesmo valor. Inclui-se apenas um deles no modelo? Ou todos?
Quais as práticas mais adequadas para lidar com redundâncias como essas em uma regressão linear?
Dados de mercado redundantes
Re: Dados de mercado redundantes
1) Há um imóvel com características semelhantes sendo anunciado por mais de uma corretora e cada anúncio possui um valor distinto. Que dado incluir no modelo? Maior, menor, ambos? Se é uma oferta, então o menor preço provavelmente. O que ocorre é que as imobiliárias começam com preços mais altos, para ter margem de negociação, e vão diminuindo os preços, gradativamente, até venderem. Assim, provavelmente o menor preço é o último anuncio.
2) Há mais de um imóvel semelhante em um mesmo edifício, remanescentes da construtora e digamos que idênticos entre si, sendo anunciados pelo mesmo valor. Inclui-se apenas um deles no modelo? Ou todos? Se os imóveis são de um mesmo proprietário, então é redundantes. Inclui apenas um.
2) Há mais de um imóvel semelhante em um mesmo edifício, remanescentes da construtora e digamos que idênticos entre si, sendo anunciados pelo mesmo valor. Inclui-se apenas um deles no modelo? Ou todos? Se os imóveis são de um mesmo proprietário, então é redundantes. Inclui apenas um.