Python/데이터 시각화

Python - [시각화] regplot, histplot, boxplot, swarmplot, countplot

GinaKim 2024. 1. 8. 22:14
728x90

1. regplot : 회귀 그래프

fit_reg = True : 회귀선 표시

fit_reg = False : 회귀선 표시 x  

fig, ax=plt.subplots(1, 2, figsize=(15, 5))

sns.regplot(x="total_bill", y="tip", data=tips, ax=ax[0], fit_reg=True)
ax[0].set_title('with linear regression line')

sns.regplot(x="total_bill", y="tip", data=tips, ax=ax[1], fit_reg=False)
ax[1].set_title('without linear regression line')

plt.show()

 

2. histplot : 히스토그램

* 막대그래프 vs 히스토그램 

   - 막대그래프 : 카테고리로 구분되는 데이터를 표현

   - 히스토그램 : 측정된 연속적인 값 (ex. 몸무게 or 성적)으로 표시되는 데이터를 표현하는데 사용

fig, ax = plt.subplots()
sns.histplot(x = 'tip', ax = ax, data = tips)
plt.show()

 

3. boxplot : 박스플롯에 대한 설명

4. swarmplot : 데이터 포인트 수와 함께 각 데이터의 분포도 제공

alpha는 투명도를 나타내며, 0~1 사이의 값으로 지정 (0에 가까울수록 투명)

fig, ax = plt.subplots(nrows = 1, ncols = 2, figsize=(10, 5))

sns.boxplot(x = 'sex', y = 'tip', ax = ax[0], data = tips)
sns.swarmplot(x = 'sex', y = 'tip', ax = ax[0], data = tips, alpha=0.25)
sns.scatterplot(x = 'total_bill', y = 'tip', hue = 'sex', ax = ax[1], data = tips)
plt.show()

 

5. countplot : 범주형 변수의 발생 횟수를 셈

정렬을 위한 order 파라미터 추가

value_count로 집계한 다음, index를 불러와 그 기준으로 x축 라벨을 정렬

sns.countplot(x = 'day', data = tips, order = tips['day'].value_counts().index)
plt.show()

728x90