Descrição do modelo:
Este é um modelo de regressão linear treinado no conjunto de dados de habitação da Califórnia. O modelo foi treinado para prever o valor mediano das casas em um determinado bairro na Califórnia com base em várias características do bairro, como a renda média, a idade média da casa, o número médio de quartos, o número médio de ocupantes por casa, a latitude e a longitude.
O modelo foi avaliado usando várias métricas de erro, incluindo o Erro Quadrático Médio (MSE), o Erro Absoluto Médio (MAE) e o Coeficiente de Determinação (R^2). Além disso, a validação cruzada foi usada para obter uma estimativa mais robusta do desempenho do modelo.
Os coeficientes do modelo fornecem uma indicação da importância relativa de cada característica na previsão do valor mediano das casas. Por exemplo, um coeficiente positivo para a renda média sugere que bairros com maior renda média tendem a ter casas mais caras, enquanto um coeficiente negativo para a latitude sugere que bairros mais ao norte tendem a ter casas menos caras.
Este modelo é um exemplo de um modelo de aprendizado de máquina simples e interpretable que pode ser usado como um ponto de partida para tarefas de previsão mais complexas.
Métricas de avaliação:
Erro Quadrático Médio: 0.5558915986952441
Erro Absoluto Médio: 0.5332001304956565
Coeficiente de Determinação (R^2): 0.575787706032451
Erro Quadrático Médio Médio da Validação Cruzada: 0.5582901717686553
MedInc 0.852382
HouseAge 0.122382
AveRooms -0.305116
AveBedrms 0.371132
Population -0.002298
AveOccup -0.036624
Latitude -0.896635
Longitude -0.868927
Análise dos resultados:
Erro Quadrático Médio (MSE): O MSE é uma medida comum de erro de previsão que penaliza grandes erros mais do que pequenos erros. Seu valor é 0.5558915986952441, o que significa que, em média, as previsões do seu modelo estão cerca de 0.56 unidades distantes do valor real.
Erro Absoluto Médio (MAE): O MAE é outra medida de erro de previsão que é menos sensível a grandes erros do que o MSE. Seu valor é 0.5332001304956565, o que significa que, em média, as previsões do seu modelo estão cerca de 0.53 unidades distantes do valor real.
Coeficiente de Determinação (R^2): O R^2 é uma medida de quão bem as previsões do seu modelo se ajustam aos dados reais. Seu valor é 0.575787706032451, o que significa que seu modelo explica cerca de 57.6% da variância na variável alvo.
Erro Quadrático Médio Médio da Validação Cruzada: Este é o MSE médio calculado através da validação cruzada. Seu valor é 0.5582901717686553, o que é ligeiramente maior do que o MSE calculado no conjunto de teste. Isso sugere que seu modelo pode estar um pouco sobreajustado aos dados de treinamento.
Coeficientes do Modelo: Os coeficientes do modelo de regressão linear representam a relação entre as características (ou variáveis independentes) e a variável alvo. Por exemplo, um coeficiente de 0.852382 para ‘MedInc’ sugere que um aumento de uma unidade em ‘MedInc’ está associado a um aumento de 0.852382 na variável alvo. Isso sugere que a renda média é um forte preditor positivo da variável alvo. Da mesma forma, um coeficiente de -0.305116 para ‘AveRooms’ sugere que um aumento de uma unidade em ‘AveRooms’ está associado a uma diminuição de 0.305116 na variável alvo, indicando uma relação negativa.
- Downloads last month
- 0