Price Prediction for Used Cars : A Comparison of Machine Learning Regression Models

University essay from Mittuniversitetet/Institutionen för informationssystem och –teknologi

Abstract: Bilar av ett visst märke, modell, år och uppsättning funktioner börjar med ett pris som fastställs av tillverkaren. När de åldras och säljs vidare som de används, är de föremål för prissättning av utbud och efterfrågan för deras speciella uppsättning funktioner, utöver deras unika historia. Ju mer detta skiljer dem från jämförbara bilar, desto svårare blir de att utvärdera med traditionella metoder. Genom att använda maskininlärning algoritmer för att bättre utnyttja data om alla mindre vanliga egenskaper hos en bil kan man mer exakt bedöma ett fordons värde. Denna studie jämför prestandan för algoritmer för Linjär Regression, Ridge Regression, Lasso Regression och Random Forest Regression när det gäller att förutsäga priset på begagnade bilar. En viktig kvalifikation för ett prisförutsägelseverktyg är att avskrivningar kan representeras för att bättre utnyttja tidigare data för aktuell prisförutsägelse. Denna studie jämför därför även den skattade prisavtagningen hos algoritmerna. Studien har genomförts med en stor offentlig datauppsättning av begagnade bilar. Resultaten visar att Random Forest Regression visar den högsta prisförutsägelseprestanda för alla mätvärden som används. Den kunde också representera den genomsnittliga avskrivningen mycket närmare verkligheten än de andra algoritmerna, med 13,7 % förutspådd årlig geometrisk prisavtagning för datasetet oberoende av fordonets ålder.

  AT THIS PAGE YOU CAN DOWNLOAD THE WHOLE ESSAY. (follow the link to the next page)