In [1]:
Copied!
import pandas as pd
reviews = pd.read_csv("../../data/winemag-data-130k-v2.csv", index_col=0)
import pandas as pd
reviews = pd.read_csv("../../data/winemag-data-130k-v2.csv", index_col=0)
Exercisis¶
1.¶
Quin és el tipus de dades de la columna points del conjunt de dades?
In [ ]:
Copied!
2.¶
Creeu una sèrie a partir de les entrades de la columna punts, però convertiu les entrades en cadenes.
In [ ]:
Copied!
3.¶
De vegades, la columna de preus és nul·la. Quantes ressenyes del conjunt de dades no tenen un preu?
In [ ]:
Copied!
4.¶
Quines són les regions productores de vi més habituals?
Creeu una sèrie que compta el nombre de vegades que apareix cada valor al camp "regió_1".
Sovint, en aquest camp falten dades, així que substituïu els valors que falten per "Desconegut". Ordena en ordre descendent.
La vostra sortida hauria de semblar a això:
Unknown 21247
Napa Valley 4480
...
Bardolino Superiore 1
Primitivo del Tarantino 1
Name: region_1, Length: 1230, dtype: int64
In [ ]:
Copied!