5. 글씨 압축하기

1데이터 압축 알아보기

앞에서 우리는 컴퓨터에 저장되는 정보 중 그림은 픽셀로 저장되고, 이 픽셀들이 합쳐져서 하나의 그림으로 보인다는 것을 알 수 있었다.

이러한 정보의 저장은 그림뿐만 아니라 글씨 역시 마찬가지로 이진수의 형태로 저장되고, 0과 1로 표시되기 때문에 컴퓨터는 데이터를 압축했다가 다시 풀어쓰기를 반복하며, 데이터 저장 공간을 효율적으로 사용한다. 이 과정에서 데이터의 정보는 달라지지 않는다는 것을 활용하여 글씨 역시 압축을 해서 저장 공간을 효율적으로 사용한다.

아래의 그림은 우리가 알고 있는 동요를 압축하여 데이터로 표시하면 아래와 같이 용량을 줄일 수 있다.


이미지. 동요 가사 '꼬부랑 할머니가 꼬부랑 고갯길을 꼬부랑 꼬부랑 넘어가고 있네'를 압축하면 '꼬부랑 할머니가 고갯길을 넘어가고 있네'가 되고 전체 글자 26개 중에서 중복된 글자를 지우고 압축된 글자는 17개인 것을 설명

위의 데이터를 압축하면 26개의 글자를 17개의 글자로 압축해서 나타낼 수 있다.

이렇게 글자를 압축하면 글자의 수는 줄어들지만 줄어든 글자만으로도 원래의 노래를 표현할 수 있다. 이렇게 압축을 하면 저장할 수 있는 공간이 늘어나기 때문에, 데이터 저장용량을 확대할 수 있고, 정보의 전송을 간편하게 해줄 수 있는 장점이 있다.

2글씨 압축하기

[활동목표]
글씨를 신속하고 정확하게 압축을 해보자.
[활동안내]
이미지. 가사를 압축하는 동영상의 스크린샷
[활동]
이미지. 두 명의 학생이 가사를 압축하는 모습의 그림
[준비물]
활동지, 필기구
[활동팁]
1.학생들의 수준에 따라 노래의 길이를 조절한다. (노래 중 1절만 압축한다. 아주 짧은 노래를 선택해서 압축한다.)
2.학년 음악 교과서에 나오는 노래를 선택해서 활동해도 좋다.
3.노래 이외에 동시, 동화 등 학생들이 흥미를 느낄 수 있는 내용을 선택해서 활동을 한다.

3보조활동

[활동목표]
글자를 압축할 수 있다.
[보조활동]
이미지. '나비야 나비야 이리 날아 오너라. 호랑나비 흰나비 춤을추며 오너라.' 가사를 압축하면 '나비야 이리 날아 오너라. 호랑 춤을추며'가 되는 것을 설명
1.글자를 읽는다.
2.같은 글자를 지운다.
3.활동이 익숙해질 때까지 천천히 정확하게 압축한다.
4.전체 글씨 중 몇 개로 압축되었는지 알아보자.
[준비물]
활동지, 필기구
[활동팁]
노래를 알지 못하는 학생은 노래 대신 교과서에 나오는 동시나, 동화책을 활용한다.

5-1
글자 압축하기

글자를 압축해 보자.

<보기>
이미지. '꼬부랑 할머니가 꼬부랑 고갯길을 꼬부랑 꼬부랑 넘어가고 있네' 가사를 압축하면 '꼬부랑 할머니가 고갯길을 넘어가고 있네'가 되는 것을 설명

이미지. '우리 집에 왜 왔니 왜 왔니 왜 왔니 꽃 찾으러 왔단다 왔단다 왔단다 무슨 꽃을 찾으로 왔느냐 왔느냐 예쁜 꽃을 찾으러 왔단다 왔단다' 가사를 압축하여 보자

이미지. '반짝반짝 작은 별 아름답게 비치네 동쪽 하늘에서도 서쪽 하늘에서도' 가사를 압축하여 보자

더 알아보기

1압축은 비 손실 압축과 손실 압축 2가지 유형이 있다.

데이터를 압축하는 유형에는 비 손실 압축과 손실 압축이 있다. 먼저 비 손실 압축(Lossless Compression)은 압축 과정에서 원래 데이터의 내용을 분실하지 않는다. 즉, 압축 해제를 통해 얻은 데이터가 압축 이전의 데이터와 완전히 동일하다. [그림 b]처럼 비 손실 압축 알고리즘을 사용해 압축한 데이터를 해제하면 원래 데이터를 복원할 수 있다. [그림 b]에서 원 데이터와 복원 데이터는 완전히 동일하다.

대표적인 비 손실 압축파일로는 Zip파일이 있다.

이에 반해 손실 압축(Lossy Compression)은 압축 해제한 데이터가 원래 데이터와 동일하지 않다. 데이터 손실 정도는 응용 환경에 따라 허용 범위가 다를 수 있다. 예를 들어, 화상 정보나 음성 정보처럼 사람들이 감각적으로 느끼는 정보는 사용자 환경에 따라 손실 범위를 조절할 수 있다. 원래 데이터의 손실을 허용하면서 압축을 하는 이유는 압축 효율을 높이기 위함이다. [그림 a]처럼 손실 압축 과정을 거친 압축 데이터는 압축 해제가 되었을 때, 원래 데이터를 완전히 복원할 수 없다.

이미지. (그림 a) 손실 압축 과정과 (그림 b) 비손실 압축 과정의 순서도. (그림 a)의 손실압축은 원데이터를 압축 후 압축 해제를 하면 복원 데이터가 원 데이터와 동일하지 않으며 (그림 b)의 비손실 압축은 원데이터를 압축 후 압축 해제를 해도 복원 데이터와 원 데이터가 동일하다.

대표적인 손실 압축파일로는 MP3, MP4, JPG 등이 있다.


출처 - [네이버 지식백과] 데이터 압축 (데이터 통신과 컴퓨터 네트워크, 2013. 9. 10., 한빛아카데미(주))