matplotlib
- 파이썬의 대표적인 과학 계산용 그래프 라이브러리 (논문에 주로 쓰임)
- import matplotlib as mpl = 기본 설정 만지는 용도
- import matplotlib.pyplot as plt = 그래프 그리는 용도 (plt를 주로 사용)
- import matplotlib.font_manager as fm = 폰트 관련 용도
plt 기본 메서드
- plt.plot(x,y) = 선그래프 출력 (뒤에 ;입력시 그래프만 출력)
※ plot()안에 그래프 관련 여러 설정 가능
- linestyle = 선스타일 설정
- color = 색깔 설정(앞글자만, 풀네임, RGB 중 하나 입력)
- marker = 마커 모양 설정
- label = 그래프 이름 설정
- 각각의 요소를 적어주지 않고 '--g^' 식으로 단순히 합친 상태로 입력해서 설정 적용 가능
- xlim(최소, 최대) = x축의 범위 설정
- xlabel() = x축 제목 설정
- xticks() = x축 간격 및 글자 설정
(y축도 마찬가지)
※ 그래프의 텍스트 관련 설정
- color = 색깔, alpha : 투명도, rotation : 회전각, family : 글꼴, size : 크기, weight : 굵기
- axis([x최소,x최대,y최소,y최대]) = x축과 y축 범위 설정
- legend() = 범례 출력 (loc=을 통해 범례의 위치 설정, frameon=False : 범례 테두리 제거)
- font의 설정과 관련된 딕셔너리를 만들어 fontdict를 통해 해당 설정을 적용할 수 있음
ex) font1 = {'family': 'NanumBarunGothic', 'size': 24, 'color' : 'green'}
plt.title('제목', fontdict=font1)
- show() = 그래프 출력
seaborn
- matplotlib을 기반으로 다양한 색상 테마와 통계용 차트 등의 기능을 추가한 시각화 패키지
- import seaborn as sns를 통해 sns로 사용
- 확률 그래프는 seaborn!!
sns 기본 메서드
- sns.Implot() = 분포도 + 회귀선 그래프 출력 (I = i 대문자)
- sns.set_style() = 그래프의 전반적인 스타일 설정 (배경색, 그리드, 테두리)
- sns.despine = 그래프 테두리 설정 (기본값은 왼쪽과 아래쪽만 출력)
ex) sns.despine(left=True) -> 그래프 테두리 왼쪽 제거로 아래쪽만 출력
- sns.barplot() = 막대 그래프 생성
- 그래프.axhilne(y축 기준 위치,색깔) = 그래프 내에 수평선 출력
- sns.lineplot() = 선 그래프 생성
- sns.boxplot() = 상자 그림 그래프 생성
- sns.swarmplot() = 산점도 그래프 생성
sns.heatmap()
- 색깔의 진함의 정도에 따라 연관성 표시
- annot = 그림에 숫자 출력 (기본값 False)
-> 절대값이 1에 가까울수록 연관성이 높고, 절대값이 0에 가까울수록 연관성이 낮음
- cbar = 옆에 색깔 그래프 출력여부 설정 (기본값 True)
- 숫자 데이터가 아닌 명목형 데이터의 경우에는 heatmap으로 연관성을 판단하기 어려움
※ ()안에 그래프 관련 여러 설정 가능
hue = 지정한 컬럼 기준으로 데이터 색깔 구분, col_wrap = 한 줄에 몇개의 그래프를 그릴지 설정,
palette = 색깔 , ci = 신뢰구간 (None이면 제거), height = 전체 그래프 높이
scatter_kws = 점의 색깔, 투명도 등 속성 설정
ex) scatter_kws={"s":100, "alpha":0.7} = 점 사이즈("s") 100, 점 투명도("alpha") 0.7
'빅데이터 부트캠프 > 데이터 시각화 메소드' 카테고리의 다른 글
빅데이터 부트캠프 18일차 (0) | 2022.07.27 |
---|---|
빅데이터 부트캠프 16일차 (0) | 2022.07.25 |
댓글