시작하기 전에

입력하는 문자에는 한글, 영어, 특수 문자 등이 있다. 그러면 컴퓨터는 키보드로 입력한 문자들을 실시간으로 모니터에 띄워 줍니다. 컴퓨터는 0과 1만 이해할 수 있다고 했는데

필자가 입력한 문자를 어떻게 이해하고 모니터에 출력하는 걸까요?

이번 절에서는 0과 1로 문자를 표현하는 방법, 즉 컴퓨터가 문자를 이해하고 표현하는 다양한 방법에 대해 알아보겠다.

문자 집합과 인코딩

0과 1로 문자를 표현하는 방법에 대해 알아보기 전에 알아야 할 세 가지 용어가 있다

문자 집합, 인코딩, 디코딩 이다.

문자 집합(Character Set)

컴퓨터가 인식하고 표현할 수 있는 문자의 모음을 말한다. 컴퓨터는 문자 집합에 속해 있는 문자를 이해할 수 있고, 반대로 문자 집합에 속해 있지 않은 문자는 이해할 수 없다.

ex) 문자 집합이 {a, b, c, d, e}인 경우 컴퓨터는 이 다섯 개의 문자는 이해할 수 있고, f 나 g 같은 문자는 이해하지 못한다.

문자 인코딩(Character Encoding)

문자 집합에 속한 문자라고 해서 컴퓨터가 그대로 이해할 수 있는 것은 아니다. 문자를 0과 1로 변환해야 비로소 컴퓨터가 이해할 수 있는데 이런 변환 과정을 **문자 인코딩**이라고 한다. 인코딩 후 0과 1로 이루어진 결과값이 문자 코드가 된다. 같은 무자 집합에 대해서도 다양한 인코딩 방법이 있을 수 있다.

💻 <—— 🤵🏼‍♂️

문자 디코딩(Character Decoding)

인코딩의 반대 과정, 즉 0과 1로 이루어진 문자 코드를 사람이 이해할 수 있는 문자로 변환하는 과정을 문자 디코딩 이라고 한다.