Home [BoostCamp AI Tech / Level 1 - Data Viz] Day12 - Seaborn
Post
Cancel

[BoostCamp AI Tech / Level 1 - Data Viz] Day12 - Seaborn

Data Viz : Seaborn


Seaborn

  • Seabornmatplotlib에 확장성을 부여해준 라이브러리입니다.
  • 개인적으로는 단순히 matplotlib만 쓰는 것보다는 seaborn을 위주로 많이 사용하는 편입니다.
  • seabornmatplotlib에서보다 좀 더 디테일한 option을 부여해서 그래프와 같은 데이터 시각화가 가능하기 때문입니다.
1
import seaborn as sns
  • seaborn은 일반적으로 alias를 sns로 선언합니다.

여러가지 plot

Basic plot

1
2
3
4
5
6
7
8
9
10
11
12
fig, axes = plt.subplots(1, 3, figsize=(18, 4))
plots = [sns.countplot, sns.lineplot, sns.scatterplot]
kws = [
    {'x':'gender', 'data':student},
    {'data':flights_wide},
    {'x':'math score', 'y':'reading score', 'data':student, 'hue':'race/ethnicity',}
]

for idx, ax in enumerate(axes.flatten()):
    plots[idx](**kws[idx], ax=ax)
    
plt.show()
  • seaborn은 기존의 matplotlib과 같이 barplot, lineplot, scatterplot과 같은 기능들도 지원하지만 seaborn의 가장 좋은 기능은 통계적 시각화가 가능하다는 것입니다.

Statistical Plot

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
fig, axes = plt.subplots(2, 4, figsize=(24, 8))
plots = [sns.countplot, sns.boxplot, sns.violinplot, sns.histplot, sns.kdeplot, sns.ecdfplot, sns.rugplot]

kws = [
    {'x':'gender', 'hue':'race/ethnicity', 'hue_order':sorted(student['race/ethnicity'].unique()) },
    {'x':'writing score'},
    {'x':'race/ethnicity', 'y':'math score', 'hue':'gender', 'order':sorted(student['race/ethnicity'].unique())},
    {'x':'writing score'},
    {'x':'writing score'},
    {'x':'writing score'},
    {'x':'writing score'}
]

for idx, ax in enumerate(axes.flatten()):
    if idx == 7:
        continue
    
    plots[idx](data=student, ax=ax, **kws[idx])

axes.flatten()[-1].axis('off')
plt.show()
  • seaborncountplot, boxplot, violinplot, histplot, kdeplot, ecdfplot, rugplot 등 다양한 종류의 통계적 지표를 표현해주는 시각화 메서드들이 있습니다.

Heatmap

1
2
3
4
5
6
fig, ax = plt.subplots(1,1 ,figsize=(7, 7))
sns.heatmap(heart.corr(), ax=ax,
           vmin=-1, vmax=1, center=0,
            cmap='coolwarm'
           )
plt.show()
  • seabornheatmap입니다. 대체로 데이터 feature의 상관관계를 분석할 때 많이 사용합니다.
  • 기본 heatmap은 시각적 효과가 좋지 않아서 약간의 수정을 진행하고 coolwarm을 사용하는 것이 좋습니다.
This post is licensed under CC BY 4.0 by the author.

[BoostCamp AI Tech / Level 1 - Data Viz] Day12 - Matplotlib Details

[BoostCamp AI Tech] Day12

Comments powered by Disqus.