| Les deux révisions précédentesRévision précédenteProchaine révision | Révision précédente |
| nsi:projets:data:start [2022/02/12 17:33] – goupillwiki | nsi:projets:data:start [2025/03/05 16:51] (Version actuelle) – [Quoi faire ?] goupillwiki |
|---|
| - [[nsi:premiere:fichier_texte|Fichier texte]] | - [[nsi:premiere:fichier_texte|Fichier texte]] |
| - [[nsi:langages:python:dictionnaire|Dictionnaires]] | - [[nsi:langages:python:dictionnaire|Dictionnaires]] |
| - [[nsi:premiere:modules_csv_et_pandas|Modules csv et pandas]] | - [[nsi:premiere:csv:modules_csv_et_pandas|Modules csv et pandas]] |
| |
| ===== Quoi faire ? ===== | ===== Quoi faire ? ===== |
| Nous disposons de [[nsi:datasets:start|jeux de données]], notre but est de les utiliser. Je vous propose de choisir un jeu de données et de faire un traitement dessus. Par exemple, vous pourrez produire des graphiques avec [[nsi:modules:matplolib_pyplot|Matplotlib]]. | Nous disposons de [[nsi:datasets:start|jeux de données]], notre but est de les utiliser. Je vous propose de choisir un jeu de données et de faire un traitement dessus. Par exemple, vous pourrez produire des graphiques avec [[nsi:modules:matplolib_pyplot|Matplotlib]]. |
| |
| * [[nsi:datasets:income|Revenus]] : il s'agit de déterminer, suivant plusieurs facteurs, si une personne à des revenus supérieur à 50k$ | * [[nsi:datasets:income|Revenus]] : Représenter dans un diagramme en barres le nombre d'individus par type de profession |
| * [[nsi:datasets:chess|Échecs]] : collection de parties d'échecs entre des joueurs d'un site internet. | * [[nsi:datasets:chess|Échecs]] : Représenter dans un diagramme en barres le nombre de partie jouées par type d'ouverture |
| * [[nsi:datasets:ormeaux|Ormeaux]] : il s'agit de coquillage. On essaie de prédire leur age en fonction de mesures physiques. | * [[nsi:datasets:ormeaux|Ormeaux]] : Représenter un nuage de points avec le poids total en abscisses et l'age en ordonnées. Vous ferez un nuage de couleur différente pour les mâles et les femelles. |
| * [[nsi:datasets:iris|Iris]] : grand classique de l'algorithme KNN. En fonction des tailles des pétales, on devine la variété d'Iris. | * [[nsi:datasets:titanic|Titanic]] : Représenter sur un diagramme en barres le pourcentage de survivants par tranche d'âge |
| * [[nsi:datasets:titanic|Titanic]] : c'est une liste de passagers du voyage du Titanic. À partir d'informations détaillées sur tous les passages, on essaie de deviner s'ils ont survécu. | * [[nsi:datasets:cac40|cac40]] : Représenter l'évolution du cours d'une entreprise sur la période couverte par le jeu de données |
| * [[nsi:datasets:wine|Qualité du vin]] : à partir de mesures objectives sur des vins (PH...) on essaie de deviner la note de qualité qu'ils obtiendraient à un test. | * [[nsi:datasets:stations_meteo|Stations Météo-France]] : Représenter sur un graphique les points correspondant aux stations. Il est possible de placer une carte de France en fond. [Pour mettre les points sur la carte, regardez [[nsi:modules:points_sur_une_carte|ici]].) |
| * [[nsi:datasets:cac40|cac40]] : données de l'indice boursier cac40 | |
| * [[nsi:datasets:stations_meteo|Stations Météo-France]] : données de géolocalisation de stations météorologiques. | |
| * [[nsi:datasets:villes|Villes du monde]] : données concernant les plus grandes villes du monde | |
| |
| |