이산화탄소의 발원지인 피부 위에 정착한다는 단일한 목표 아래 어둠 속에서 무작위적으로 움직이는 모기의 위치를 확인하기 위해, 우리는 짜증과 함께 형광등을 켠다. 앵앵거리는 소리만으로는 정확한 위치를 식별하기 어렵기 때문으로, 시각적 단서와 결합함으로써 위치 파악을 용이하게 하기 위함이다. 그 소리는 인간의 귀로 충분히 식별 가능한 4~600Hz 대역에서 들려오고 있지만, 어째서인지 누워있는 우리의 머리 위에서, 왼쪽에서, 오른쪽에서, 그리고 턱 아래서 순간 이동하듯 그 위치를 바꾸어가며 들려오는 것만 같았다. 모기를 살생하려는 우리의 손뼉은 목표물의 위치를 정확하게 파악하고 행해지는 것이라기보다는, 그곳에 있을 가능성이 높은 곳에서 일종의 확률게임처럼 행해진다. 이로써 때아닌 밤 우리는 참가한 적 없는 게임에서 실패를 거듭한다. 모기가 선사하는 것은 가려움이 아니라 패배감이다.
소리의 발원지가 어디인지 파악하는 청각적 국소화(localization) 능력에는 두 가지 잘 알려진 척도가 관여한다. 양이 도착 시간차(Interaural Time Delay 혹은 Interaural Time Difference, 이하 ITD)와 와 양이간 강도 차이(Interaural Loudness Differnece 혹은 Interaural Level Difference, 이하 ILD)가 그것이다. 두가지는 청취자의 얼굴에서 코의 방향을 기준으로 소리가 좌우의 어느쪽에서 들려오는가를 기준으로 하는 시간적, 음량적 차이에 관한 척도다.
소리가 얼굴의 정면에서 들려올때를 0°, 오른쪽 귀에서 들려올때를 90°, 왼쪽 귀에서 들려오는 경우를 270°라고 한다. 머리의 지름에 따라 다르지만, 일반적으로 두 귀 사이의 거리가 20cm라고 했을 때 소리가 들려오는 방향에 위치한 귀는 반대편 귀보다 약 600ms가량 빠르게 듣는다(ITD).
또한 주파수 범위에 따라 소리가 들려오는쪽의 음량은 최대 20db까지 크게 들릴 수 있는데, 반대쪽 귀에 소리가 도달하는 과정에서 회절로 인한 감쇠가 일어나기 때문이다(ILD). 이 회절의 정도는 주파수 대역에 따라 다르다. 더 긴 파장을 갖는 1,500hz 미만의 소리는 머리의 너비보다 길기 때문에 머리의 존재가 파장을 크게 방해하지 않는다. 반면 높은 주파수를 갖는 소리일수록 머리에 의해 파동이 차단되거나 반사되는데, 이를 두영효과(head shadow effect)라고 부른다. 두영효과는 ILD의 작동 메커니즘에 핵심적이다.
그런데 우리의 귓구멍에서 뻗어나오는 가상의 선을 중심으로 넓어지는 원뿔을 그렸을 때, 원추의 밑면 내에서 소리의 국소화가 어려워지는 구역이 존재한다. 이 영역을 혼돈의 원뿔(Cone of Confusion)이라고 부른다. 혼동의 원뿔은 소리의 국소화, 특히 측분별(lateralization)과 관련된 식별의 어려움에서 발생한다. 측분별은 특정 각도에서 들려온 소리가 어느 방위(azimuth)에서 발생하고 있는지, 그리고 어느정도의 고도(altitude)에서 발생하고 있는지를 판가름하는 능력이다. 그런데 혼돈의 원뿔 구역 내에서 발생하는 소리는 각기 다른 지점에서 발원했다고 하더라도 동일한 ITD와 ILD를 가질 수 있고, 이에 따라 우리는 전방 45도에서 들려오는 소리를 후방 45도에서 들려오는 소리로 착각할 수 있다. 두 방향에서 발생하는 ITD 및 ILD가 동일하기 때문이다.
보통의 경우 가볍게 머리를 흔듦으로써 ITD 및 ILD에 동적 큐를 주고, 이를 통해 혼돈의 뿔에서 벗어날 수 있다. 그러나 머리를 돌리는 데에는 약 0.5초가량이 소요되는데, 이 시간은 신경 수준에서는 상당히 긴 시간이다. 또, ITD는 1500Hz보다 낮은 소리에서 가장 큰 민감도를 보이는 반면 2~4,000Hz 사이의 주파수 대역에서는 떨어진다. 같은 혼동의 원뿔에 위치한 소리라도 그 대역이 3,000Hz 언저리의 주파수 대역을 갖고 있다면 혼동의 원뿔은 더 심해질 것이다. 흥미롭게도, ITD의 민감도가 떨어지는 대역은 인간이 듣는 소리의 주관적 라우드니스를 표현하는 등청감곡선(Equal Loudness Contour)에서 가장 민감한 대역이기도 하다.
나의 질문은 다음과 같다.