Questo è il primo progetto in assoluto relativo al data mining o machine learning. Il dataset utilizzato è stato Carvana, un’azienda che si occupa della rivendita di veicoli usati negli Stati Uniti.
Quindi sono state effettuate analisi esplorative del dataset, data cleaning e data preparation.
Sono stati applicati diversi algoritmi di clustering, come il K-means, DBSCAN e clustering gerarchico.
Sono state analizzate le principali association rules che possono essere individuate all’interno del dataset e le applicazioni di esse per la determinazione e la sostituzione dei Missing Values e nella classificazione
dell’attributo target dell’analisi.
Infine sono stati applicati algoritmi di classificazione, come Decision Tree, Random Forest, KNN, seguiti da un’interpretazione dei risultati ottenuti.
Download del documento
Se vuoi avere informazioni e dettagli sulle prove eseguite con i diversi algoritmi, scarica il documento qui sotto.