본문 바로가기
CS/컴퓨터 구조

문자 표현

by Mecodata 2022. 10. 23.

정보 단위

비트(Bit)

- 0과 1을 표현하는 가장 작은 정보 단위

- n비트로 2^n가지 정보 표현 가능

- 1byte = 8bit, 1kB = 1000byte

워드(Word)

- CPU가 한 번에 처리할 수 있는 정보의 크기 단위

 

인코딩

- 인코딩(Encoding) = 문자를 0과 1로 이루어진 문자 코드로 변환하는 과정 (사람의 언어를 컴퓨터 언어로)

- 디코딩(Decoding) = 0과 1로 이루어진 문자 코드를 문자로 변환하는 과정 (컴퓨터 언어를 사람 언어로)

- 아스키(ASCII) 코드 = 7비트(8비트 중 1비트는 오류 검출에 사용)로 하나의 문자를 표현하는 방식 -> 128가지 문자

- 영어는 알파벳을 이어 쓰면 단어가 되는 조합형 인코딩이지만 한글초성, 중성, 종성이 조합되어 완성된 상태가 되어야 단어가 되는 완성형 인코딩

 

EUC-KR

- [b***] 형식으로 2300여개의 한글 표현 가능

- 다음 사이트에서 euc-kr로 설정후 한글을 입력한뒤 Decoding의 Hex String을 보면 한글이 euc-kr로 어떻게 인코딩 되는지 확인 가능 

https://dencode.com/

 

Encoding & Decoding Online Tools - DenCode

Encoding and Decoding site. e.g. HTML Escape / URL Encoding / Base64 / MD5 / SHA-1 / CRC32 / and many other String, Number, DateTime, Color, Hash formats!

dencode.com

UTF-8

- UTF(Unicode Transformation Format) = 유니코드 인코딩 방식

- 입력값에 따라 인코딩 결과값이 1~4바이트로 표현됨

- 입력한 문자가 UTF-8로 인코딩된 결과값을 확인 할 수 있는 사이트 

https://onlineutf8tools.com/convert-utf8-to-binary

 

Convert UTF8 to Binary Bits - Online UTF8 Tools

World's simplest online utility that converts UTF8 to binary. Free, quick, and powerful. Import UTF8 – get binary bits.

onlineutf8tools.com

- 유니코드 = 통일된 문자 집합 (다양한 나라의 언어, 특수 문자들을 표현 가능)

- 유니코드로 표현가능한 문자를 찾아볼 수 있는 사이트

https://unicode-table.com/en/blocks/

 

Unicode

Unicode web service for character search. Find, copy and paste your favorite characters: 😎 Emoji, ❤ Hearts, 💲 Currencies, → Arrows, ★ Stars and many others 🚩

unicode-table.com

 

'CS > 컴퓨터 구조' 카테고리의 다른 글

컴퓨터 기본 구조  (0) 2022.10.23

댓글