전체 글323 주피터 노트북 Pandas (나도코딩) 2 파일 저장 및 열기 - df.to_파일형식 = 지정한 파일 형식으로 파일 저장(csv, txt, excel) - 저장 시 한글이 깨질 경우에는 df.to('파일명.파일형식', encoding='utf-8-sig' ) 필수! - txt 파일로 저장하거나 txt 파일을 열 경우에는 보기 편하기 위해 sep='\t' 적용 - df1 = pd.read_파일형식('파일명.파일형식') = 해당 파일 열기 - 파일을 열때 skiprow : 지정된 갯수만큼의 row 건너뜀, nrow : 지정된 갯수 만큼의 row만 가져옴 index_col : 해당 column을 index로 변경 DataFrame 확인 함수 - describe = 계산 가능한 데이터에 대해 Column별로 데이터의 갯수, 평균, 표준편차, 최소/최대값.. 2022. 7. 10. 주피터 노트북 Pandas (나도코딩) 1 정의 - 파이썬에서 사용하는 데이터 분석 라이브러리 중 하나이며 파이썬으로 작성된 데이터를 분석 및 조작하기 위해 사용 - 주로 import pandas as pd로 적용하여 pd로 사용 - 함수 입력시 PascalCase로 입력 Series - 1차원 데이터 (정수. 실수, 문자열 등) - A = pd.Series([]) 꼴로 리스트 형식의 데이터 객체 생성 - A = pd.Series([1, 2, 3], index=['ㄱ','ㄴ','ㄷ']) 꼴로 각 데이터에 인덱스를 지정하여 데이터를 생성할 수 있음 - dic의 key:value와 같은 방식으로 index:value라 생각하면 편리 ex) A 출력시 ㄱ 1 ㄴ 2 ㄷ 3 DataFrame 기초 - 2차원 데이터로 Series들의 모음 - DataFr.. 2022. 7. 10. 빅데이터 부트캠프 4&5일차 반복문 for while = 언제 끝날지 모를때 주로 사용 for = 얼마만에 끝날지 예상 가능할때 주로 사용 for문에서 in 다음에 입력되는 데이터 타입이 dic인 경우 key-value에서 key로 출력됨 ex) dic = {'음식':'피자', '음료':'콜라'}에서 for A in dic -> A = dic의 key인 '음식'과 '음료'를 출력 ※ set는 데이터의 순서가 없으므로 for문 사용시 range 적용 불가 하지만 set에 sorted를 적용하면 set가 list로 변환되어 range 적용 가능해짐 startswith = 지정한 텍스트가 해당 문자로 시작하는지 판별 endswith = 지정한 텍스트가 해당 문자로 끝나는지 판별 비교 연산자 ,=,==,!= : 값 자체를 비교 is, is.. 2022. 7. 7. 빅데이터 부트캠프 3일차 문자열 판별 숫자 decimal(일반 십진법 숫자) 참 ()안에 or를 사용하면 맨 앞 텍스트만 인식하지만 그 텍스트가 0이면 다음 텍스트로 넘어감 그래서 두번째 경우에는 2 in arr로 인식 -> 거.. 2022. 7. 6. 빅데이터 부트캠프 2일차 딕셔너리(Dictionary) dic = {key:value} 형식으로 생성 (Json 형식 = key:value) - {} 중괄호 사용!! dic[] = ' ' 형식으로 딕셔너리 내에서의 데이터 추가 및 변경 del dic[] = dic.pop() = 딕셔너리에서 해당 원소 삭제 dic.get(key, False일 때의 값) = 해당 키에 대한 value 존재하면 value 출력, 없으면 설정한 False값 출력 dic.setdefault(key, value) = 해당 키에 대한 value 존재하면 value 출력, 없으면 설정한 키-value 추가 dic.keys() = 딕셔너리의 키 값만 리스트 형식으로 출력 dic.values() = 딕셔너리의 value 값만 리스트 형식으로 출력 dic.item.. 2022. 7. 5. 빅데이터 부트캠프 1일차 용어 정리 프로그래밍 - 프로그램을 작성하는 일 코딩 - 주어진 데이터를 컴퓨터가 이해할 수 있는 형태로 바꾸는 것 (코딩은 프로그래밍의 일부) 인터프리터 언어 - 프로그래밍 언어로 작성된 프로그램을 한 줄 단위로 번역 및 실행시키는 언어 오픈 소스 - 소스코드(프로그래밍 언어로 작성된 명령어)가 공개된 소프트웨어 GPU - 그래픽 처리 장치, 컴퓨터 시스템에서 그래픽 연산을 빠르게 처리하여 결과값을 모니터에 출력하는 연산 장치 (그래픽 카드) 텍스트 데이터 - 문자 데이터 바이너리 데이터 - 텍스트 데이터 이외의 이미지, 영상 등 네이밍 컨벤션 (Naming Convention) 통일성을 갖기 위해서는 사람들이 공유하는 코딩 스타일 가이드 파이썬에서는 주로 Snake_case(공백 _ 사용) 사용하지만.. 2022. 7. 4. 반복문에서의 변수 입력 반복문을 통해 입력받을 때는 input() 사용을 지양하고 sys.stdin.readline()을 사용해야 처리 시간을 줄일 수 있음 input()과 sys.stdin.readline()은 서로 같은 입력 기능이지만 후자가 더 속도가 빠름 (후자 입력시 import sys 필수) input() 시간복잡도 = O() sys.stdin.readline() 시간복잡도 = O() 2022. 6. 1. 주피터 노트북 연습 명령모드 = 파란색(Esc), 편집 모드 = 초록색(Enter) shift+Enter = Run(실행) & 밑에 셀이 없으면 셀 추가 Alt+Enter = 실행 & 밑에 셀이 있어도 셀 추가 Ctrl+Enter = 현재 셀만 실행 & 밑에 셀 추가 X 명령 모드에서 A = 현재 셀 위로 셀 추가, B = 현재 셀 아래로 셀 추가, DD = 해당 셀 삭제, II = 인터럽트(중단) M = Markdown 모드로 전환, Y = Code 모드(기본)로 전환 입력 순서에 상관없이 셀 옆에 있는 In[] 숫자 순으로 명령이 실행됨 Markdown 사용시 1. #의 갯수로 제목 글자의 크기를 조절할 수가 있음 2. > 을 통하여 인용구처럼 출력 가능 3. Fn+Prt scr = 화면 캡쳐 ※ 화면 캡쳐 후 바로 M.. 2022. 5. 23. 파이썬 독학 (나도코딩) 8 모듈 = 함수나 변수, 클래스 등을 모아서 작성한 하나의 파이썬(.py) 파일 패키지 = 하나의 디렉토리에 여러 모듈 파일들을 저장한 것 import theater_module theater_module.price(3) # 일반 관객 3명 theater_module.price_moring(4) # 조조 관객 4명 theater_module.price_soldier(5) # 군인 관객 5명 import theater_module as mv mv.price(3) mv.price_moring(4) mv.price_soldier(5) from theater_module import * price(3) price_moring(4) price_soldier(5) from theater_module import pr.. 2022. 5. 22. 파이썬 독학 (나도코딩) 7 try:~except:를 이용하여 에러 발생시의 출력값 설정이 가능함 에러의 종류에 따라 except에 입력하는 명령어가 달라짐 명령어 없이 그냥 except만 입력시 에러의 종류에 상관없이 모든 에러 발생시의 출력값 설정 가능 (단, 따로 명령어가 설정되어 있을 경우에는 그 명령어를 제외한 모든 에러에 적용) ex) ValueError = 숫자를 입력해야 하는데 문자를 입력한 경우 (다른 종류의 가치값 입력) ZeroDivisionError = 0으로 다른 숫자를 나누려하는 경우 Exception as 를 이용하여 오류의 종류를 파악할 수 있음 if문에서 raise를 이용하여 조건 만족시 고의적으로 에러를 발생 시킬 수 있음 class 에러이름(Exception)를 이용하여 사용자가 새로운 에러를 정의.. 2022. 5. 22. 파이썬 독학 (나도코딩) 6 객체 = 속성과 기능을 가지고 있는 자료 class = 객체를 만들기 위한 일종의 틀 ex) 붕어빵 틀 instance(인스턴스) = class로 만들어낸 객체 ex) 여러 종류의 붕어빵 field(필드) = class 속의 변수로 표현되는 객체의 속성 method(메서드) = 객체의 기능, 행동을 클래스 속의 함수로 표현하는 것 __init__ = 생성자 함수 = 생성할 객체의 필드의 초기값 설정 ※ __init__ 설정시 첫 매개변수는 반드시 self로 입력해야함 ex) def __init__(self,....) (인스턴스이름.변수) 형식으로 class의 변수를 사용할 수 있음 -Unit class 정의- 클래스 = Unit 인스턴스 = class로부터 생성된 것 ex) marine, tank 값을 .. 2022. 5. 19. 파이썬 독학 (나도코딩) 5 sep를 설정함으로써 설정값 사이사이에 텍스트를 출력할 수 있음 end = ""는 줄바꿈이지만 end = "?"처럼 "" 안에 텍스트를 입력하면 맨 마지막 부분에 출력되는 값을 지정할 수 있음(줄바꿈은 X) stdout = 표준출력, stderr = 표준에러(에러처리) items으로 키-value 설정 ljust(8) : 8칸 간격으로 왼쪽정렬, rjust(4) : 4칸 간격으로 오른쪽 정렬 zfill(3) = 세글자의 텍스트가 되도록 나머지 글자를 0으로 채우는 것 (1->001, 15->015) input을 통하여 텍스트를 입력할 때는 str을 사용할 필요없이 숫자도 문자열로 인식되어 문제 없이 출력됨 score.txt라는 파일을 새로 만들어 "수학 : 0, 영어 : 50"이라는 텍스트를 입력한 후 .. 2022. 5. 19. 파이썬 독학 (나도코딩) 4 def = 함수 정의 ex) 실행하면 "새로운 계좌가 생성되었습니다"라는 문자를 출력하는 open_account 함수 정의 return = 함수의 결과값(반환값) 정의 함수를 정의할 때 미리 기본값을 설정하여 출력가능 정의된 함수의 키 순서에 무관하게 키워드에 해당하는 값을 = 형식으로 입력해도 정상적으로 출력됨 print 입력 시 end=" "를 입력하면 다음줄과 구분되지 않고 이어서 출력함 *을 통해 정의를 하면 해당 키값의 수가 다양해도 출력가능 지역변수 = 한 공간에서만 사용, 전역변수 = 전 공간에서 사용 gun = gun - soliders에서 gun은 첫줄 gun = 10의 gun과 별개로 checkpoint라는 함수 내에서만 정의된 gun(지역변수) 그렇기 때문에 checkpoint 함수 .. 2022. 5. 18. 파이썬 독학 (나도코딩) 3 if = 조건 설정, elif = 조건 추가, else = 어떠한 조건도 만족하지 않을 경우 ※ 조건 설정시 마지막에 : 꼭 입력해야함! map = (함수, 변수에 적용할 요소)의 형식으로 각 변수마다 일일이 적용할 필요없이 여러 변수에 한꺼번에 적용 가능 ex) a, b = map(int, input().split()) -> a, b 모두 정수로 형식을 변경하고 입력시에 서로 찢어지게 설정 input(A) = 실행창에 A를 출력함과 동시에 A의 옆에 값을 입력할 수 있도록 해줌 ex) 비 or 눈 입력 -> 우산을 챙기세요 input 창에 입력한 값을 숫자로 인식할 수도록 가능하게 하려면 앞에 int를 설정해야함 숫자 크기 조건은 and를 사용해도 되고 앞조건과 뒷조건을 같이 입력해도 됨 같은 문장을 .. 2022. 5. 10. 파이썬 독학 (나도코딩) 2 자료구조의 종류 1. 리스트 - []이용 (단순 나열 or 키-값) 2. 튜플 - () 이용 3. 세트 - {} 이용 append = 리스트의 맨 마지막에 특정 단어 추가 insert = 특정 순서에 특정 단어 추가 (순서는 1이 아닌 0부터) pop = 리스트의 맨 마지막 단어 지우기 index = 특정 단어의 위치 (순서는 1이 아닌 0부터) sort = 문자 정렬, reverse = 순서 뒤집기, clear = 리스트 내용 모두 삭제, extend = 리스트 확장(합체) in = 해당 키가 리스트에 있나 판정 지정한 키에 해당된 값 출력 방법 1. [] = 오류시 작동 멈춤 2. get() = 오류시 NONE 처리 후 다음 줄 코딩 작동 (index와 find 관계와 유사) del = 지정한 키 삭.. 2022. 5. 10. 이전 1 ··· 18 19 20 21 22 다음