ART insight

아트인사이트에게
문화예술은 '소통'입니다.

칼럼·에세이

 

 

우리가 눈을 감고도 공간을 느낄 수 있는 이유 중 하나는 바로 청각이다. 소리는 방향과 거리, 반사 등을 통해 우리에게 공간의 정보를 전달한다. 예를 들어 누군가 내 이름을 부르거나 갑자기 큰 소리가 나면, 우리는 소리가 들려오는 방향으로 자연스럽게 고개를 돌린다. 이는 두 귀 사이에 도달하는 소리의 시간차와 강도 차이를 통해 소리의 방향과 위치를 인식하기 때문이다.

 

소리, 즉 음원이 생기고 음파가 진동하며 여러 곳에 부딪혀 생긴 반향음(reverberation)은 공간의 크기나 형태까지 짐작하게 만든다. 그래서 어떠한 공간을 인식할 때, 청각은 단순히 ‘듣기’를 넘어 시각과 더불어 상상하고 지각하는 역할에 도움을 준다.

 

기존의 영화, 유튜브, 음악 스트리밍에서 더 나아가 VR, AR 시장으로 디지털 매체가 확장됨에 따라 대사, 배경음악, 효과음 등 소리의 현장감 구현이 더욱 중요해지고 있다. 그래서 관객을 작품 속으로 끌어들이기 위해, 음향 기술은 점점 더 사실적이고 정교하게 진화해 왔다.

 

이 글에서는 우리가 일상 속에서도 손쉽게 마주할 수 있는 대표적인 기술들, 돌비 애트모스(Dolby Atmos)공간음향(Spatial Audio)을 통해, 청각이 어떻게 감각의 문을 확장해 주는지를 함께 들여다보고자 한다.

 

 

 

평면에서 입체로 - 사운드가 공간을 갖게 되다


 

본문에 들어가기에 앞서 채널(Channel)에 대해 알아보자. 채널은 서로 다른 역할을 하는 소리의 출력 경로 수를 의미한다. 따라서 소리를 나누는 스피커의 개수가 많아질수록 채널의 수도 증가하게 되는 것이다. 채널 수가 증가할수록 엔지니어가 소리를 더욱 정교하게 조절할 수 있는 경우의 수가 많아지는 것이므로 점점 현실감 있게 소리를 전달할 수 있게 된다.

 

가장 초창기의 기본적인 음향 방식은 하나의 채널만 사용하는 모노(Mono)였지만, 곧 좌우 두 채널을 사용하는 스테레오(Stereo) 방식이 보편화되었다. 이후 더 깊은 몰입감을 위해 채널의 수를 늘려 5.1채널, 7.1채널로 세분화되었고 소리는 점점 더 입체적으로 우리에게 들려오기 시작했다.

 


음향 채널의 차이

 

모노스테레오.jpg

- 모노(Mono): 하나의 스피커에서 모든 소리를 출력

- 스테레오(Stereo): 좌우 두 개의 채널에서 소리를 출력해 방향감을 표현

 

 

IMG_3712.jpg

- 5.1채널: 앞쪽 채널 3(좌/중앙/우) + 뒤쪽 채널 2(좌/우) + 저음을 위한 서브우퍼(0.1)

- 7.1채널: 5.1 채널의 스피커 구성에 좌우 측면 스피커 2개를 추가해 더 넓은 공간감 구현

 *서브우퍼는 방향성이 거의 없는 저음을 출력하기 때문에 0.1로 친다.

 

 

자동차가 화면을 가로질러 달릴 때, 실제로 귀 옆을 스쳐 지나가는 것처럼 느껴지는 이유가 바로 여기에 있다. 스피커가 하나씩 추가됨에 따라 방향과 거리, 공간감이 정교하게 배치되어 우리가 보는 장면의 몰입도를 증가시키기 때문이다. 우리는 언제부터인지, 눈보다 먼저 귀로 공간을 살아가고 있었는지도 모른다.

 

 

 

기술은 어떻게 진화했을까? - 돌비 애트모스의 객체 기반 오디오와 공간음향의 헤드 트래킹


 

우리가 소리를 통해 공간을 인식하듯, 기술도 점점 더 정밀하게 '공간을 설계'하기 시작했다. 5.1채널, 7.1채널이 소리를 방향별로 배치해 몰입감을 높였다면, 돌비 애트모스(Dolby Atmos)는 객체 기반 오디오(Object-Based Audio)를 통해 그보다 더 유연하고 섬세한 방식으로 소리 그 자체로서 공간의 역할을 부여한다.

 

기존 오디오는 정해진 채널에 소리를 넣는 방식이었다면 객체 기반 오디오는 각 소리를 독립된 ‘객체(object)로 인식하고, 3D 좌표(x, y, z) 내 위치를 지정해 좌표값을 부여한다. 그리고 이 객체들은 청취자의 위치나 극장 구조에 따라 실시간으로 렌더링(rendering) 되어, 더 자연스럽고 몰입도 높은 공간감을 만들어내는 것이다.

 


객체 기반 오디오란?

 좌표.jpg

- 소리를 ‘객체’ 단위로 분리

- 객체는 좌표값 (x, y, z)를 통해 위치를 갖고 시간에 따라 이동

- 실시간으로 스피커에 분배되어 공간에 맞게 조정

 

 

예를 들어 영화관에 앉아 있다고 상상해 보자. 영화 속 헬리콥터 소리가 왼쪽 위, 뒤쪽, 높이 2m라는 위치를 갖고 재생됐다. 그리고 헬리콥터가 왼쪽에서 오른쪽으로 움직임에 따라 3차원 좌표가 바뀌면, 소리의 좌표 또한 바뀌게 되면서 우리는 그 헬리콥터가 ‘내 뒤에서 지나간다’는 걸 귀로 인식할 수 있게 되는 것이다.

 

이러한 감상은 손바닥 안에서도 즐길 수 있다. 애플(Apple)의 공간음향(Spatial Audio)은 에어팟과 아이폰, 아이패드, 맥북 등 모바일 기기에서도 가상 3D 사운드를 구현한다. 놀라운 점은 별도의 장비 없이 기기 자체의 스테레오 스피커만으로도 입체 음향을 만들어낸다는 것이다. 애플은 여기에 헤드 트래킹(Head Tracking) 기술을 결합해, 에어팟, 에어팟 맥스 등 자사 헤드폰을 사용할 시 사용자의 머리 움직임에 따라 소리의 방향을 실시간으로 조정해 공간감을 부여한다.

 

 

헤드 트래킹이란?


헤드트래킹완.jpg

이미지 출처: 한국정보통신기술협회 정보통신용어사전

- 사용자의 머리 움직임을 감지해 소리의 방향을 자동 조정

- 실제로 특정 소리가 ‘공간 속에 고정된’ 듯한 청각적 착각을 유도함

- 애플 기기에서는 에어팟에 내장된 자이로센서 를 이용해 구현함

* 자이로센서: 기기의 회전 방향이나 움직임을 감지하는 센서

 

 

에어팟을 끼고 연주곡을 듣고 있다가 재생하는 기기 본체를 기준으로 몸을 오른쪽으로 돌리면, 실제 공연장에서처럼 왼쪽 이어폰의 음량은 키우고, 오른쪽 이어폰의 음량은 줄여 사운드를 조정하게 된다. 이 기능은 넷플릭스, 디즈니플러스, 애플 TV 등 다양한 스트리밍 서비스와 호환되어, 어디서든 몰입감 있는 감상을 가능하게 한다. 이어폰 하나만으로 펼쳐지는 공간의 깊이. 공간을 포함한 소리는 점점 더 개인의 일상 속으로 들어오고 있다.

 

 

 

감각을 더욱 열게 해주는 음향


 

입체 음향은 결국, 우리에게 ‘장면을 듣게’ 한다. 화면을 바라보는 것이 아니라, 그 장면 안으로 들어가는 감각을 느끼게 해주는 것이다. 봉준호 감독은 미키17 무대인사를 하며 돌비 시네마관(영상에는 돌비 비전이, 음향으로는 돌비 애트모스를 적용한 특별관) 방문 당시 “저희 팀이 녹음하고, 사운드를 디자인한 모든 것, 의도들이 가장 정확하게 최고의 사운드 상태에서 들으실 수 있는 상영이 되겠습니다.”라고 말했다.


그래서 영화를 열렬히 사랑하는 관객은 감독의 모든 연출을 온전히 느끼기 위해 돌비 시네마관에서 봐야 한다고 말하는 사람도 있다. 왜냐하면 감독이 말하고자 하는 이야기를 온전히 다 체험할 수 있기 때문이다.

 

우리는 이제 눈으로만 영화를 보는 시대를 지나, 귀와 함께 서사를 읽어내는 시대를 살고 있다. 화면 속에서 들려오는 숨결, 천장 위에서 울리는 효과음, 등을 타고 흐르는 배경 음악은 이야기의 분위기를 완성하는 가장 섬세한 장치가 된다. 그리고 그 안에서 관객은 단순한 감상의 위치를 넘어, 서사의 일부로 들어가는 감각을 경험하게 된다. 따라서 같은 장면을 보고도 다른 느낌을 받을 수 있듯, 입체적인 음향은 관객 각자의 감각에 따라 더욱 깊은 몰입과 감동을 가능하게 한다.

 

그리고 그 몰입은, 단지 더 좋은 사운드 퀄리티에 머물지 않는다. 그것은 관객이 작품과 더 가까워지는 일이며, 창작자가 의도한 감정과 분위기를 오롯이 전달받는 경험이다. 기술은 점점 더 조용한 방식으로, 그러나 가장 깊이 있는 방식으로 예술에 다가간다.

 

 

<저작권자 ⓒ아트인사이트 & www.artinsight.co.kr 무단전재-재배포금지.>