Introducció¶
En aquests exercicis, aplicarem l'anàlisi grupal al nostre conjunt de dades.
Executeu la cel·la de codi següent per carregar les dades abans d'executar els exercicis.
import pandas as pd
reviews = pd.read_csv("../../data/winemag-data-130k-v2.csv", index_col=0)
Exercisis¶
1.¶
Quins són els revisors de vins més habituals al conjunt de dades?
Creeu una Serie l'índex de la qual siga la categoria taster_twitter_handle del conjunt de dades i els valors de la qual compten quantes ressenyes ha escrit cada persona.
2.¶
Quin és el millor vi que puc comprar per una quantitat determinada de diners?
Creeu una Serie l'índex de la qual siga els preus del vi i els valors de la qual siguen el nombre màxim de punts que es va donar a un vi que costa tant en una revisió.
Ordena els valors per preu, de manera ascendent.
3.¶
Quins són els preus mínims i màxims per a cada variety de vi?
Creeu un DataFrame l'índex del qual és la categoria variety del conjunt de dades i els valors del qual són els valors min i max.
4.¶
Quines són les varietats de vi més cares?
Creeu una variable sorted_varieties que continga una còpia del DataFrame de la pregunta anterior on les varietats s'ordenen en ordre descendent en funció del preu mínim i després del preu màxim.
5.¶
Creeu una Serie l'índex de la qual siguen els revisors i els valors de la qual siguen la puntuació mitjana de la revisió donada per aquest revisor.
Hi ha diferències significatives en les puntuacions mitjanes assignades pels diferents revisors?
Justifica la resposta.
6.¶
Quina combinació de països i varietats és més habitual?
Creeu una Serie l'índex de la qual siga un MultiIndex de parells de {país, varietat}.
Per exemple, un pinot noir produït als EUA hauria de mapar a {"US", "Pinot Noir"}.
Ordena els valors de la Serie en ordre descendent en funció del recompte de vins.