본문 바로가기
빅데이터 부트캠프/데이터 시각화 메소드

빅데이터 부트캠프 15일차

by Mecodata 2022. 7. 22.

matplotlib

- 파이썬의 대표적인 과학 계산용 그래프 라이브러리 (논문에 주로 쓰임)

- import matplotlib as mpl  = 기본 설정 만지는 용도
- import matplotlib.pyplot as plt  = 그래프 그리는 용도 (plt를 주로 사용)
- import matplotlib.font_manager as fm  = 폰트 관련 용도

plt 기본 메서드

- plt.plot(x,y) = 그래프 출력 (뒤에 ;입력시 그래프만 출력)

※ plot()안에 그래프 관련 여러 설정 가능

- linestyle = 선스타일 설정

- color = 색깔 설정(앞글자만, 풀네임, RGB 중 하나 입력)

- marker = 마커 모양 설정

- label = 그래프 이름 설정

- 각각의 요소를 적어주지 않고 '--g^' 식으로 단순히 합친 상태로 입력해서 설정 적용 가능

 

- xlim(최소, 최대) = x축의 범위 설정

- xlabel() = x축 제목 설정

- xticks() = x축 간격 및 글자 설정

(y축도 마찬가지)

 

※ 그래프의 텍스트 관련 설정

- color = 색깔, alpha : 투명도, rotation : 회전각,  family : 글꼴,  size : 크기, weight : 굵기

 

- axis([x최소,x최대,y최소,y최대]) = x축과 y축 범위 설정

- legend() = 범례 출력 (loc=을 통해 범례의 위치 설정, frameon=False : 범례 테두리 제거)

 

- font의 설정과 관련된 딕셔너리를 만들어 fontdict를 통해 해당 설정을 적용할 수 있음

ex) font1 = {'family': 'NanumBarunGothic', 'size': 24, 'color' : 'green'}
      plt.title('제목', fontdict=font1)

 

- show() = 그래프 출력

seaborn

- matplotlib을 기반으로 다양한 색상 테마와 통계용 차트 등의 기능을 추가한 시각화 패키지

- import seaborn as sns를 통해 sns로 사용

- 확률 그래프는 seaborn!!

sns 기본 메서드

- sns.Implot() = 분포도 + 회귀선 그래프 출력 (I = i 대문자)

- sns.set_style() = 그래프의 전반적인 스타일 설정 (배경색, 그리드, 테두리)

- sns.despine = 그래프 테두리 설정 (기본값은 왼쪽과 아래쪽만 출력)

ex) sns.despine(left=True) -> 그래프 테두리 왼쪽 제거로 아래쪽만 출력

 

- sns.barplot() = 막대 그래프 생성

- 그래프.axhilne(y축 기준 위치,색깔) = 그래프 내에 수평선 출력

 

- sns.lineplot() = 그래프 생성

- sns.boxplot() = 상자 그림 그래프 생성 

- sns.swarmplot() = 산점도 그래프 생성

sns.heatmap()

- 색깔의 진함의 정도에 따라 연관성 표시

- annot = 그림에 숫자 출력 (기본값 False) 

-> 절대값이 1에 가까울수록 연관성이 높고, 절대값이 0에 가까울수록 연관성이 낮음

- cbar = 옆에 색깔 그래프 출력여부 설정 (기본값 True)

- 숫자 데이터가 아닌 명목형 데이터의 경우에는 heatmap으로 연관성을 판단하기 어려움

 

()안에 그래프 관련 여러 설정 가능

hue = 지정한 컬럼 기준으로 데이터 색깔 구분, col_wrap = 한 줄에 몇개의 그래프를 그릴지 설정,

palette = 색깔 , ci = 신뢰구간 (None이면 제거), height = 전체 그래프 높이

scatter_kws =의 색깔, 투명도 등 속성 설정 

ex) scatter_kws={"s":100, "alpha":0.7} = 점 사이즈("s") 100, 점 투명도("alpha") 0.7

 

댓글