CD가 왜 44.1Khz인 이유

정신개조 2007. 10. 15. 00:32

Explanation of 44.1 kHz CD sampling rate
The CD sampling rate has to be larger than about 40 kHz to fulfill the Nyquist criterion that requires sampling at twice the maximum analog frequency, which is about 20 kHz for audio. The sampling frequency is chosen somewhat higher than the Nyquist rate since practical filters neede to prevent aliasing have a finite slope. Digital audio tapes (DATs) use a sampling rate of 48 kHz. It has been claimed that thier sampling rate differs from that of CDs to make digital copying from one to the other more difficult. 48 kHz is, in principle, a better rate since it is a multiple of the other standard sampling rates, namely 8 and 16 kHz for telephone-quality audio. Sampling rate conversion is simplified if rates are integer multiples of each other.

From John Watkinson, The Art of Digital Audio, 2nd edition, pg. 104:

In the early days of digital audio research, the necessary bandwidth of about 1 Mbps per audio channel was difficult to store. Disk drives had the bandwidth but not the capacity for long recording time, so attention turned to video recorders. These were adapted to store audio samples by creating a pseudo-video waveform which would convey binary as black and white levels. The sampling rate of such a system is constrained to relate simply to the field rate and field structure of the television standard used, so that an integer number of samples can be stored on each usable TV line in the field. Such a recording can be made on a monochrome recorder, and these recording are made in two standards, 525 lines at 60 Hz and 625 lines at 50 Hz. Thus it is possible to find a frequency which is a common multiple of the two and is also suitable for use as a sampling rate.

The allowable sampling rates in a pseudo-video system can be deduced by multiplying the field rate by the number of active lines in a field (blanking lines cannot be used) and again by the number of samples in a line. By careful choice of parameters it is possible to use either 525/60 or 625/50 video with a sampling rate of 44.1KHz.

In 60 Hz video, there are 35 blanked lines, leaving 490 lines per frame or 245 lines per field, so the sampling rate is given by :

60 X 245 X 3 = 44.1 KHz

In 50 Hz video, there are 37 lines of blanking, leaving 588 active lines per frame, or 294 per field, so the same sampling rate is given by

50 X 294 X3 = 44.1 Khz.

The sampling rate of 44.1 KHz came to be that of the Compact Disc. Even though CD has no video circuitry, the equipment used to make CD masters is video based and determines the sampling rate.

(Reference kindly provided by Kavitha Parthasarathy.)
Also, David Singer noted that 44,100 can be factored as 2^2 * 3^2 * 5^2 * 7^2, i.e., the product of the squares of the first four prime numbers.


Sony와 Philips에서 CD를 공동 개발한 것은 누구나 아는 상식일 겁니다.
가청주파수가 20KHz인데 44.1KHz로 샘플링하는 이유는
샘플링을 할 때 샘플링 컨버터 전단계에서 20KHz 이후를
짤라버리는 필터링을 거치게 되는데 20Khz에서 짤라버리면
들리지 않는 주파수라도 없어지는 느낌이 확나게 되기때문에
서서히 페이드 아웃 시키는 식으로 필터링을 하게되고 그 지점이
22.05Khz라는 것입니다.
그리고 왜 하필 22.05이냐? 하는 의문점이 다시 남게 됩니다.
Sony가 A/V시스템의 굴지적인 선두자역활을 90년도에서 2000년대
까지 하고 있다는 것을 아실겁니다.
그리고 Sony는 A/V시스템과의 호환성을 염두에 둔 것 같습니다.
TV는 60Hz로 동작합니다. 이유는 지금 현재 220V에 60Hz로 전원이
공급되는 것과 연관이 있는 걸로 알고 있구요.
그리고 사람이 움직이는 사물로 느끼기 위해서는 60Hz로 화면이
바뀌어야지, 즉 60 프레임으로 되어야지 아주 자연스러운 동영상으로
현재 30Hz,즉 30프레임으로 된 동영상들이 거의 대부분이지만
이상적으로 생각하는 프레임은 60프레임입니다.
왜냐하면 눈이 일초에 60번정도 인식하는 것으로 알고 있습니다.
현재 유명한 TV표준은 NTSC와 PAL, SECAM이 있습니다.
주파수는 배수가 될수록 변환이 쉽습니다.
이 말은 내부에 발진기를 통해서 주파수를 내보내는 장치의
배수로 내부 주파수가 변환되기 때문에 회로적으로 간단하게
구현할 수 있다는 것입니다.
Sony가 내놓고 있던 비디오 녹화기에서 가상비디오 정현파를 내놓음으로써
그 주파수로 오디오신호를 흘려보낼 생각을 하고 CD의 표준 규격을 내놓은
것입니다. 당시는 흑백 비디오 녹화기를 쓰고 있었는데
앞서 말한 것처럼 525수직화면선, 60Hz의 NTSC와 625수직화면선, 50Hz의 PAL
이 거의 전세계에서 쓰였습니다.
그리고 이 주파수들의 배수이면 더욱 더 주파수 표본을 만들기가 쉽습니다.
60Hz인 NTSC에는 35줄의 쓰이지 않는 여백이 있고, 비월주사(interleave)방식이기
때문에 그 절반인 (525-35)/2 = 245.
그 배수를 찾으면
60*245*3= 44.1KHz이고
50Hz의 PAL에는 37의 여백과, 비월주사(interleave)방식이기 때문에 그 절반인
(625-37)/2 = 294.
그 배수를 찾으면
50*294*3= 44.1Khz입니다.
Video System과의 호환성 때문에 44.1Khz로 결정된 것은 CD가 Video System과
관계가 없어 보여도 결국 함께 쓰이는 경우가 많기 때문에 호환성을 위해서
결정된 것으로 보입니다.