4. 사운드 용어에서의 샘플링 레이트(sampling rate)와 비트(bit depth)

 

사운드 영역에서의 비트도 그래픽과 같이 비트 농도(bit depth)의 개념에서 출발한다. 다만 비트 하나만으로 사운드의 퀄리티가 결정적으로 좌우되는 것이 아니기에, 또 하나의 축인 샘플링 레이트(sampling rate)를 함께 들여다 볼 필요가 있다.


현재 CD 포맷이라 불리는 사운드의 음질은 44.1kHz/16bit, DVD 포맷은 48kHz/16bit로 규격화되어 있다. 44.1kHz의 샘플링 레이트는 주파수의 영역이므로 음높이(pitch), 16 bit의 비트 농도는 음량(amplitude)에 직접적으로 관련된 요소다. 44,100Hz이란 값의 샘플링 레이트는 입력된 아날로그 데이터를 1초동안 44,100번 슬라이스로 세분화하여 디지털 신호로 샘플링했다는 의미다.  이것을 실제 주파수의 개념으로 접근해 보자. 인간의 표준 가청주파수는 20hz~20kHz이며, 스웨덴 전자공학자 나이퀴스트(Harry Nyquist)의 샘플링 이론에 따르면 44.1kHz란 샘플링 레이트(sampling rate)는 인간이 그 절반에 해당하는 22.05kHz를 초과하는 초고음역은 청각적으로 인지할 수 없음을 의미한다.

 

그렇다면 인간의 실제 가청주파수가 20kHz까지인데 왜 컴팩트 디스크는 40kHz로 샘플링 레이트를 만들지 않고 굳이 44.1kHz로 설정해 놓았을까? 그것은 초창기 디지털 오디오가 비디오 미디어상에 맞춰져 정리되었기 때문이다. 비디오의 리코딩은 TV 표준에 맞추기 위해 525줄 구현이 가능한 60Hz 비디오, 625줄 구현이 가능한 50Hz 비디오 2가지로 나뉘어져 있었다. 525줄은 35개의 빈 줄(blanked lines)을 제외하면 프레임당 490, 즉 필드당 245줄이므로, 60Hz * 필드당 245 * 3차원 = 44,100Hz의 샘플링 레이트를 요구한 셈이다. 마찬가지로 625줄이라면 37개의 빈 줄을 제외하고 프레임당 588, 필드당 294줄이 되어 50Hz * 필드당 294 * 3차원 = 44,100Hz이 요구된다.

 

디지털 음악의 탄생이 비디오의 제약 안에서 이루어진 사실은 비단 샘플링 레이트 뿐만은 아니다. 3세대 게임기의 전성 시대를 이룩한 80년대 8비트 게임의 롬 카트리지 용량 제한은 40~400KB 정도였고 PSG 등의 별도 사운드 칩을 안에 넣어 음악과 사운드를 구현할 수 있는 공간은 많이 할애해 봤자 게임 전체 용량의 10% 수준(4~40KB)에 불과했다. 주어진 용량의 한계를 극복하기 위해 사운드 칩들은 제각기 다른 비트 기반의 다양한 컨트롤러들을 섞어야 했고 디튠(detune: 음원의 튜닝이 일정하지 않고 조금씩 어긋나 있는 것)을 알게 모르게 조금씩 갖고 있는 각 오디오 채널들은 최종 하나의 모노 아웃풋으로 다운믹스(downmix)되었다.



록맨(Mega Man)3 Spark Man Theme. 패미컴(NES)의 칩튠은 5채널 8비트 샘플 playback 기반이지만 볼륨 컨트롤은 4비트 기반이다.


 

칩튠의 비트(bit) 판별과 디지털 음악의 비트(bit) 정의와의 괴리

 

디지털 오디오의 비트(bit depth)는 음량의 다이내믹 레벨(dynamic range)을 정의한다. 2진수로 계산되는 비트의 속성을 통해 이는 사운드의 해상력(binary bit resolution)을 결정하게 된다. 현재의 CD 포맷인 16bit는 각 오디오 샘플의 음량이 변화할 때 시작과 끝의 음량 사이의 측정 값으로 65,536(216)가지 다이내믹 레벨이 적용된다는 의미다따라서 64(28)가지 레벨의 8비트 농도는 위의 16비트에 비해 음량의 셈여림(dynamics)이 투박하게-계단식으로-들릴 수 밖에 없다.


문제는 여기서부터다. 메가드라이브, 슈퍼패미콤(SNES)과 같은 16비트 컬러 게임기의 이른바 '16비트 사운드'가 현재의 CD 포맷의 16비트 규격과 동일하다고 여겨지기는 어렵다. 시중에 있는 CD 음원을 8비트로 컨버팅했을 때 패미콤 사운드의 음질이 느껴지는 것도 아니다.


사운드 칩의 내부에는 전체 다이내믹 레벨을 관장하는 볼륨 컨트롤(volume control), 음역의 폭을 다루는 주파수 컨트롤(frequency control), 개별 샘플의 앰플리튜드 엔벨로프(amplitude envelope: 신호의 발생 직후부터 소멸까지의 음량의 레벨 변화)을 관리하는 파형 컨트롤(waveform control)이 있다. 여기에, 몇 개 채널이 쓰였느냐는 별개의 문제이다. 8비트 패미콤 음악으로 흔히 분류되는 위의 록맨(Mega Man)3 테마 음악을 예로 살펴 보면, PSG 사운드 칩 계통으로 내장 5개 채널(즉 악기 수, 동시 발음 수가 5)이 사용되었는데 각 채널당 할당된 단일 파형(waveform)의 형태는 채널별로 2개의 펄스 웨이브(pulse waves), 1개의 트라이앵글 웨이브(triangle wave), 노이즈(a noise)이며, 별도로 1개의 샘플 채널(포르타멘토 portamento: 두 음 사이의 매끄러운 연결) 연출을 위해 주파수 쓸림(sweep) 기능을 통해 UFO, 레이저 빔, 신스 스네어와 같은 사운드 이펙트 담당)이 존재한다.





파형 컨트롤: 단일 사인 파형(sine waveform) 4비트 형태. 자세히 보면 0부터 15까지 16개 다이내믹 레벨()로 구성돼 있다.

 


미키마우스 환상의 세계 스테이지1 음악. 16비트 샘플 playback, 6채널, 8비트 볼륨 컨트롤 기반.

 

록맨3 음악과 같은 패미콤 사운드는 채널별 단일 파형(waveform)에서는 8비트 형태로서 0부터 63까지 총 64개의 다이내믹 레벨(28)을 볼륨상으로 표현할 수 있지만(샘플 채널은 예외. 1비트부터 7비트까지 다양한 사운드 이펙트가 활용), 게임상에서 들리는 모노 아웃풋으로 다운믹스된 결과물은 총 16개의 다이내믹 레벨로서 4비트 체계를 따른다. , 개별 샘플에 해당하는 파형 컨트롤은 8비트인데 전체 오디오에 해당하는 볼륨 컨트롤은 4비트인 것이다. 디지털 음악이 실제 정의하는 사운드 파일의 다이내믹 레벨은 사운드 칩 상에서 파형 컨트롤보다 볼륨 컨트롤에 개념상 부합하는데, 패미콤의 칩튠은 현실에서 4비트라 불리지 않고 8비트라 불리고 있다. 16비트 음악이라 불리는 메가드라이브의 칩튠이 16비트 개별 샘플 playback을 기반으로 하지만 최종 아웃풋의 볼륨 컨트롤이 8비트 기반인 것과 마찬가지다. 오늘날 보편화된 24비트 샘플로 음반 작업을 하여 CD 포맷을 위해 16비트로 마스터링을 끝냈다면 그것은 24비트 음악인가, 16비트 음악인가? 8비트 컬러와 컴퓨터 사양을 지닌 8비트 게임의 음악이기에 전세계인들은 너무도 쉽게 거기 속한 음악 또한 오롯이 8비트일 거라 여겨 왔던 것인지도 모른다. 별도의 마스터링이 필요하지 않고 파형 컨트롤과 볼륨 컨트롤을 다른 비트 기반으로 관리하는 사운드 칩의 특성을 감안하지 못해 편의적으로 명칭이 불려지면서 굳어진 결론이다.


 

칩튠을 위한 독자적 관점 필요

 

디지털 음악과 칩튠의 비트(bit depth)에 대한 관점에 괴리가 있다고 해서 개념의 강제적 통일을 위해 이제 와서 8비트 칩튠을 4비트로, 16비트 칩튠을 8비트로 부를 수 만도 없는 노릇이다. 보다 깔끔한 해결책은 디지털 음악의 비트와는 다른 개별 샘플 중심의 시각에서, 혹은 게임의 부속물이라고만 여겨졌던 칩튠의 그 자체의 특성을 독자적으로 존중하는 것이다. 극도의 제약적 환경에서 일구어낸 칩튠의 음악적 예술미와 사운드의 개성은, 기술의 제약이 사라져 가는 현재의 음악 테크놀로지 환경에서 나오는 음악보다 더 심미적일 때가 많다. 기술적 제약이 오히려 작곡의 창의성을 극대화하도록 동기부여한 것이다. 그래서 이제 일부 예술가들은 자발적으로 그때의 제약을 다시 되새김하며 칩튠을 파고들기도 한다(이를 비트 코어(bit core)라 부르기도 한다). 40KB의 칩튠이 40MB wav 음원보다 1,000배 작다고 해서 칩튠의 독창적 음악 세계가 무시될 수는 없는 일이다.| 윤규 surinmusic@gmail.com