Le notebook de rendu est "spanish_wine.ipynb"
Le dossier "data_explorer" contient des fonctions tests facilitant les différentes étapes du processus de prédiction dans le but de créer un package
Trouver un dataset sur kaggle permettant d'illustrer la régression linéaire multivariée
Certification RNCP Développeur.se en intelligence artificielle
Nous avont fait une série d'atelier introduisant gradullement la régression linéaire. Le repo Github est proposé en pièce jointe. Suite à cette série d'atelier, il est demandé aux apprenants de trouver sur la plateforme Kaggle un dataset prmettant d'illustrer la régression linéaire.
Le projet se fera par groupe de 3 dans un délais de 1 mois
Il devront produire dossier hébergé sur Github. Celui-ci devra contenir le dataset au format CSV et un notebook. Comme dans le dernier attelier, le notebook devra lui même contenir : - une partir de récupération et de cleaning de données - une partie découpage de données en deux dataset: un de training et un de testing. - une partie d'entrainement d'un modèle de régression linéaire faisant appelle à Scikit learn - une partie d'évaluation du modèle (sur le train et sur le test) - une proposition d'amélioration de ce score