데이터 표현 단위
컴퓨터는 단순히 0과 1로 표현되는 데이터들을 읽고 해석할 뿐이지만,
우리가 의미있는 데이터, 혹은 데이터들의 집합을 표현하기 위해서는 적절한 용어가 필요합니다.
예를 들어, ‘25,165,824 bit의 이미지를 표현하기 위한 데이터’이라고 표현하는 것보다는 ‘3MB의 이미지 파일’이라고 표현하는 것이 더 단순하고 의미 전달도 확실하기 때문이죠.
이처럼, 컴퓨터의 데이터를 효율적으로 표현하기 위한 단위는 아래와 같이 다양하게 존재합니다.
데이터 표현 단위표
용어 | 설명 |
---|---|
비트 (bit) | 데이터의 가장 작은 단위. 0 또는 1의 값을 가짐. |
니블 (nibble) | 4bit로 구성된 데이터 단위. |
바이트 (byte) | 컴퓨터가 조작하는 정보의 최소 처리 단위이며 문자 하나를 저장할 수 있는 크기. 일반적으로 8bit로 구성. |
워드 (word, full-word) | CPU가 한 번에 처리할 수 있는 데이터의 크기. CPU 아키텍처에 따라 다름. |
하프 워드 (half-word) | 워드의 절반 크기. (예: 32bit 시스템에서는 16bit) |
더블 워드 (double-word) | 워드의 두 배 크기. |
쿼드 워드 (quad-word) | 워드의 네 배 크기. |
킬로바이트 (Kilobyte, KB) | 1,024 byte (2^10 byte) |
메가바이트 (Megabyte, MB) | 1,024 KB (2^20 byte) |
기가바이트 (Gigabyte, GB) | 1,024 MB (2^30 byte) |
테라바이트 (Terabyte, TB) | 1,024 GB (2^40 byte) |
페타바이트 (Petabyte, PB) | 1,024 TB (2^50 byte) |
엑사바이트 (Exabyte, EB) | 1,024 PB (2^60 byte) |
제타바이트 (Zettabyte, ZB) | 1,024 EB (2^70 byte) |
요타바이트 (Yottabyte, YB) | 1,024 ZB (2^80 byte) |
필드 (field) | 파일 구성의 최소 단위. (의미 있는 정보를 표현하는 최소 단위) |
레코드 (record) | 자료 처리의 기본 단위. (관련 필드들의 집합) |
파일 (file) | 프로그램 구성의 기본 단위. (여러 레코드들의 집합으로, 하나의 주제나 목적에 따라 데이터를 저장하는 단위) |
데이터베이스 (database) | 관련있는 파일들의 집합. |
다양한 표현 단위
비트 (bit)
Binary Digit의 약자로 데이터의 가장 작은 단위입니다.
비트는 0 또는 1 두 가지 상태를 가질 수 있으며, 이를 2진법으로 표기합니다.
컴퓨터 용량이나 프로그램 처리능력의 최소 단위로 사용되며, 모든 디지털 정보는 비트의 조합으로 표현됩니다.
예를 들어, 1bit는 0 또는 1의 값을 가지며, 8bit는 00000000부터 11111111까지 256개의 다른 값을 표현할 수 있습니다.
니블 (nibble)
니블(nibble)은 4bit로 구성된 데이터 단위입니다.
즉, 하나의 니블은 16가지(2^4)의 다른 값을 가질 수 있는데, 이는 16진법을 표현할 수 있는 단위가 됩니다.
10진법의 관점에서 보아도 최소 4bit는 있어야 10진수를 전부 표현할 수 있기 때문에, 상당히 의미있는 정보 단위라고 볼 수 있습니다.
2진법 | 0000 | 0001 | 0010 | 0011 | 0100 | 0101 | 0110 | 0111 | 1000 | 1001 | 1010 | 1011 | 1100 | 1101 | 1110 | 1111 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
10진법 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 |
16진법 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F |
바이트 (byte)
바이트(byte)는 8bit로 구성된 데이터 단위로, 컴퓨터가 조작하는 정보의 최소 처리 단위입니다.
대부분의 컴퓨터가 바이트를 기본 데이터 단위로 사용하며, 메모리 주소도 바이트 단위로 지정됩니다.
8bit는 총 256가지(2^8)의 다른 값을 가질 수 있는데, 이 때문에 숫자와 영문자를 모두 포함하여 하나의 문자(character)를 저장할 수 있는 단위가 되기도 합니다.
예를 들어 ASCII 코드에서 하나의 문자(예: ‘A’, ‘B’, ‘C’)는 하나의 바이트로 표현됩니다.
워드 (word)
워드(word)는 CPU가 한 번에 처리할 수 있는 데이터의 크기를 나타내는 단위입니다.
보통 32bit(4byte)를 1word로 하는 경우가 많지만, 워드의 크기는 컴퓨터의 아키텍처에 따라 다르며, 일반적으로 16 bit, 32 bit, 64 bit로 구성될 수 있습니다.