3. Gràfics de dispersió
Gràfics de dispersió¶
En este exercici treballem per a un important productor de dolços i el nostre objectiu és escriure un informe que la vostra empresa puga utilitzar per guiar el disseny del seu proper producte. Disposem d'un conjunt de dades molt interessant que conté resultats d'una enquesta per obtindre caramels més del gust dels consumidors.
import pandas as pd
pd.plotting.register_matplotlib_converters()
import matplotlib.pyplot as plt
%matplotlib inline
import seaborn as sns
candy_filepath = "data/candy.csv"
candy_data = pd.read_csv(candy_filepath, index_col="id")
candy_data.head()
| competitorname | chocolate | fruity | caramel | peanutyalmondy | nougat | crispedricewafer | hard | bar | pluribus | sugarpercent | pricepercent | winpercent | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| id | |||||||||||||
| 0 | 100 Grand | Yes | No | Yes | No | No | Yes | No | Yes | No | 0.732 | 0.860 | 66.971725 |
| 1 | 3 Musketeers | Yes | No | No | No | Yes | No | No | Yes | No | 0.604 | 0.511 | 67.602936 |
| 2 | Air Heads | No | Yes | No | No | No | No | No | No | No | 0.906 | 0.511 | 52.341465 |
| 3 | Almond Joy | Yes | No | No | Yes | No | No | No | Yes | No | 0.465 | 0.767 | 50.347546 |
| 4 | Baby Ruth | Yes | No | Yes | Yes | Yes | No | No | Yes | No | 0.604 | 0.767 | 56.914547 |
- 'competitorname': conté el nom del dolç
- les 9 columnes següents (des de 'chocolate' fins a 'pluribus') descriuen el dolç. Per exemple, les files amb dolços de xocolate tenen "Sí" a la columna "chocolate" (i els dolços sense xocolate tenen "No" a la mateixa columna).
- 'sugarpercent' indica la quantitat de sucre.
- 'pricepercent' mostra el preu per unitat, en relació amb els altres caramels del conjunt de dades.
- 'winpercent' es calcula a partir dels resultats de l'enquesta; valors més alts indiquen que el caramel és més popular entre els enquestats.
Pregunta 1¶
Quins dolços són més populars entre els enquestats: '3 Musketeers' o 'Almond Joy'?
Quins dolços tenen més contingut de sucre: "3 Musketeers" o 'Almond Joy'?
Fes un gràfic de barres per demostrar-ho.
Pregunta 2¶
Veus alguna relació entre el nivell de sucre i la popularitat dels productes anteriors? Justifica la resposta.
Pregunta 3¶
Creeu un gràfic de dispersió que mostre la relació entre el percentatge de sucre (a l'eix x horitzontal) i la popularitat winpercent (a l'eix y vertical).
Pregunta 4¶
El diagrama de dispersió mostra una forta correlació entre les dues variables?
Pregunta 5¶
Afegeix una línia de regressió al gràfic anterior. Que ens indica?
Pregunta 6¶
Creeu un gràfic de dispersió per mostrar la relació entre el preu (a l'eix x horitzontal) i la popularitat (a l'eix vertical de les y). Es veu una relació clara entre el preu i la popularitat?
Pregunta 7¶
Utilitzeu la columna "chocolate" per codificar els punts amb colors i creeu dues línies de regressió segons tinguen xocolate o no.
Pregunta 8¶
Comenta el gràfic anterior.
Pregunta 9¶
Creeu un diagrama de dispersió categòric per destacar la relació entre "xocolate" i "popularitat". Posa "chocolate" a l'eix x (horitzontal) i "winpercent" a l'eix y (vertical).
Pregunta 10¶
Decidiu dedicar una secció del vostre informe al fet que els dolços de xocolate solen ser més populars que els dolços sense xocolate. Quin gràfic és més adequat per explicar aquest fenòmen.