# 구간을 설정하여, 해당 구간에 포함되는 데이터가 몇개인지(갯수)
# 세는 차트를 히스토그램이라고 한다.
# 구간을, bin 이라고 부른다.
# 구간이 여러개니까, bins 라고 부른다.
# 히스토그램은, 똑같은 데이터를 가지고,
# bin을 어떻게 잡느냐에 따라서, 차트 모양이 달라져서,
# 해석을 다르게 할 수 도있다.
df['speed'].describe()
count 807.000000
mean 65.830235
std 27.736838
min 5.000000
25% 45.000000
50% 65.000000
75% 85.000000
max 160.000000
Name: speed, dtype: float64
plt.hist(data = df, x = 'speed')
plt.show()
# bins 의 갯수는 기본이 10개(디폴트값)
plt.hist(data = df, x = 'speed', rwidth= 0.8)
plt.show()
# bins 의 갯수를 변경하는 방법
plt.hist(data = df, x = 'speed', rwidth= 0.8, bins = 30)
plt.show()