Python/데이터 시각화
Python - [시각화] regplot, histplot, boxplot, swarmplot, countplot
GinaKim
2024. 1. 8. 22:14
728x90
1. regplot : 회귀 그래프
fit_reg = True : 회귀선 표시
fit_reg = False : 회귀선 표시 x
fig, ax=plt.subplots(1, 2, figsize=(15, 5))
sns.regplot(x="total_bill", y="tip", data=tips, ax=ax[0], fit_reg=True)
ax[0].set_title('with linear regression line')
sns.regplot(x="total_bill", y="tip", data=tips, ax=ax[1], fit_reg=False)
ax[1].set_title('without linear regression line')
plt.show()
2. histplot : 히스토그램
* 막대그래프 vs 히스토그램
- 막대그래프 : 카테고리로 구분되는 데이터를 표현
- 히스토그램 : 측정된 연속적인 값 (ex. 몸무게 or 성적)으로 표시되는 데이터를 표현하는데 사용
fig, ax = plt.subplots()
sns.histplot(x = 'tip', ax = ax, data = tips)
plt.show()
3. boxplot : 박스플롯에 대한 설명
4. swarmplot : 데이터 포인트 수와 함께 각 데이터의 분포도 제공
alpha는 투명도를 나타내며, 0~1 사이의 값으로 지정 (0에 가까울수록 투명)
fig, ax = plt.subplots(nrows = 1, ncols = 2, figsize=(10, 5))
sns.boxplot(x = 'sex', y = 'tip', ax = ax[0], data = tips)
sns.swarmplot(x = 'sex', y = 'tip', ax = ax[0], data = tips, alpha=0.25)
sns.scatterplot(x = 'total_bill', y = 'tip', hue = 'sex', ax = ax[1], data = tips)
plt.show()
5. countplot : 범주형 변수의 발생 횟수를 셈
정렬을 위한 order 파라미터 추가
value_count로 집계한 다음, index를 불러와 그 기준으로 x축 라벨을 정렬
sns.countplot(x = 'day', data = tips, order = tips['day'].value_counts().index)
plt.show()
728x90