윈디하나의 누리사랑방. 이런 저런 얘기

글쓴시간
분류 문화,취미/Hi-Fi,PC-Fi
삼성 오디오 잭 어댑터(USB-C to 3.5 mm) - PC에 연결

2019년 경에 구매해서 잘 쓰고 있었는데, 한번 PC에 연결해보면 어떨까 하고 생각해 봤다. 생각보다는 좋아서 글을 남긴다.

2019년에 올렸던 구매 후기: 삼성 오디오 잭 어댑터 (USB-C To 3.5 mm)

우선 인식은 정상적으로 잘 된다. "Samsung Type-C to 3.5pi gender adapter" 으로 인식되었다.

사용자 삽입 이미지

속성에서 지원되는 수준을 보고는 놀랬다. 스펙과는 다르게, 32 비트도 지원되는것으로 나와있기 때문이다.

사용자 삽입 이미지

당장 foobar 2000으로 설정해 봤다. "WASAPI (event)" 방식으로는 잡음이 섞이고, (지원 안하는듯) PUSH 방식으로는 정상적으로 32bit 으로 플레이 된다.

사용자 삽입 이미지

음질은 PC나 다른거나 거기서 거기다. (다를 이유가 없다) 하지만 32bit, 384000Hz 를 지원한다는거에 대해 놀랬다.

----

2022.01.26 추가

PC에서는 볼륨이 상당히 높게 올라간다. 스마트폰에 연결했을때가 15 정도까지 올릴 수 있다면 PC에 연결하면 100 까지 올라간다. 생각보다는 괜찮아서 또한번 더 놀랬다.
글쓴시간
분류 문화,취미/Hi-Fi,PC-Fi
라인레벨, 라인아웃, 스피커아웃, 단자이름

음향기기 뒷면을 보면 흔히 라인아웃(Line-Out), 라인인(Line-In), 스피커아웃(Speaker-Out)과 같은 이름이 정해져 있는 단자를 볼 수 있다. 이 단자들에 대해 설명한다.

사용자 삽입 이미지

티악 AI-503-A 의 후면. Line-In, Pre-Out, Speaker-Out 단자가 보인다.


※ 라인레벨, 라인아웃

사용자 삽입 이미지

- 라인아웃을 설명하기 전에 라인레벨을 먼저 설명해야 한다. 라인레벨(Line-Level)이란, 음향기기간 신호를 전달시 사용하는 오디오 신호의 강도를 정한 규격이다. 이 규격은 프로용 기기와 소비자용 기기가 스펙(=오디오 신호의 강도)이 다르다. 오디오 신호의 강도는 V(Volts, 전압)으로 나타낸다. 초등학교 다닐때 배운 전압 그거 맞다.

프로용 음향기기: 최대 1.228Vrms
소비자용 음향기기: 최대 0.316Vrms

오디오 신호는 교류성분이기 때문에, Vrms (실효 전압)이라는 단위를 사용한다. 예를들어 가정용 전압인 220V 도 실효전압 값이다. 소비자용 기기가(가정용 기기) 프로용 기기보다 최대 전압이 더 낮은 이유는 기기의 가격을 낮추기 위함이다. 여기서는 소비자용 기기는 최대 0.316Vrms 라고 생각하면 된다.

- 라인아웃단자는 라인레벨로 출력하는 단자이고 라인인단자는 라인레벨로 입력 받는 단자다. 즉 실효 전압이 최대 0.316V으로 출력/입력 한다는 의미다. 임피던스는 100Ω ~ 600Ω을 가정하기 때문에 소비전력은 0.003W 정도로 매우 낮다. 즉 라인레벨 단자에 연결된 회로는 0.003W 정도를 출력할 수 있다.

- 따라서 라인아웃단자에는 이어폰(16Ω ~ 32Ω)을 구동할 수 없으며, 스피커(4Ω ~ 8Ω)는 라인아웃 단자에 사용하면 쇼트 수준이라 회로에 무리가 가기 때문에 사용하면 안된다. (정말 회로가 타버리니 절대 연결하면 안된다) 그래서 라인아웃단자로부터 선을 이어서 파워앰프에 연결해 패시브 스피커를 사용해야 한다. 라인아웃단자에 패시브 스피커 연결하면 기기가 고장난다.

※ 다른 단자

- 프리아웃(PRE OUT): 프리앰프를 거쳐나온 라인레벨로 출력하는 단자. 라인아웃과 다른 점은 라인아웃은 출력하는 최대 전압이 고정되어있지만 프리아웃은 프리앰프에서 볼륨 조절기을 사용해서 최대전압이 가변적이다. 쉽게 말하면 프리아웃은 볼륨조절이 되도록 설계되어있다. 어쨌든 라인아웃과 스펙이 같기 때문에 라인아웃이라 생각해도 된다.

- 스피커아웃/오디오아웃(SPEAKER OUT/AUDIO OUT): 스피커 레벨로 출력하는 단자. 보통 4옴~8옴 사이의 스피커를 구동시킬 수 있다. 라인레벨을 스피커레벨로 증폭해 출력하는 앰프가 바로 파워앰프다. 스피커 레벨은 규격이 정해져 있는건 아니다. 예를 들어 500W 출력인 앰프에 8Ω 스피커를 연결한경우, 최대 66.33V 이 출력된다. (이 정도면 감전에 주의해야 한다)

- 헤드폰아웃(HEADPHONE OUT): 헤드폰레벨로 출력하는 단자. 보통 이런기기는 라인레벨 입력받아 헤드폰레벨로 증폭해 출력한다. 헤드폰을 연결할 수 있는 단자로 보통 16Ω 이상의 임피던스를 가진 기기를 연결한다. 이어폰은 보통 16Ω~32Ω 사이의 임피던스를 가진다. 헤드폰아웃에서 600Ω 이상의 헤드폰도 구동시킬 수 있는 경우가 있는데 이런건 별도로 스펙이 표시되어있을 것이다.

- 옥스아웃(AUX OUT): 옥스는 Auxiliary (보조의, 추가의) 라는 의미다. 출력 단자외에, 추가로 더 달려있는 단자다. 이 출력단자를 사용할 수 있는 기기는 매뉴얼을 참고해야 한다. 스피커를 구동시킬 수 있기도 하고 라인아웃과 같은 스펙을 가지기도 한다.

※ 연결 단자 예시

- LINE OUT(각종 소스기기) -> LINE IN(프리앰프, 인티앰프), REC IN(보통 녹음기기)
- PRE OUT(프리앰프) -> PRE IN(파워앰프)
- SPEAKER OUT(파워앰프,인티앰프) -> SPEAKER(스피커)
- HEADPHONE OUT(앰프기기) -> SPEAKER(저항값이 큰 스피커)
- AUX OUT -> 기타 주변기기에 연결할 수 있는 출력 단자다. 스피커도 포함된다. 매뉴얼에 스펙(저항값)을 반드시 확인하고 사용하자.
글쓴시간
분류 문화,취미/Hi-Fi,PC-Fi
Hi-Fi - 턴테이블

사용자 삽입 이미지

야마하 턴테이블 TT-S303



LP판, 레코드 판을 재생할 수 있는 기기. 턴테이블에서 나오는 단자는 일반적으로 Phono-Out 으로 Line-Out 과는 다른 스펙이다. 소비자용 기기에서 LineOut 은 0.316 V이지만, Phono-Out 은 MM카트리지를 쓴경우 0.005V, MC카트리지를 사용한 경우 0.0005V 으로 매우 낮다. 또한 Bass 가 줄어드는 효과를 가지기 때문에 이를 증폭시켜야 한다. (RIAA equalized 찾아보자)

Phono-Out 을 Line-Out 레벨로 증폭시켜주고 Bass 를 강화시켜주는게 포노앰프다. 요즘 나오는 턴테이블에는 별도의 포노앰프가 필요 없도록 내장되어있는 경우가 많다. 보통 Phono 용 이퀄라이저까지 같이 내장한다. 흔히 Bass, Treble 영역을 증폭하는 단자가 이쪽에 있었다.

사용자 삽입 이미지

TT-S303 의 후면단자. Phono-Out 단자 및 왼편에 PhonoEQ 단자가 보인다. PhonoEQ 를 켜면 Phono-Out 이 Line-Out 스펙에 맞춰진다.

포노 카트리지(LP의 굴곡을 읽어내는 부속품) 는 MM(Moving Magnet) 방식과 MC(Moving Coil) 방식이 있는데, 요즘엔 MM 방식이 대세다. MM 방식은 MC방식에 비해 카트리지가 무겁고 이에 LP판에 손상을 더 줄 수 있다는 단점이 있었지만 고급 기기를 사용하면 이 문제는 해결된 것으로 본다. 이런 경우에는 MC 방식의 약한 출력이 더 문제라고 한다.

필자는 LP를 다루지 않기 때문에 조사차원에서 써 놓는다. ^^
글쓴시간
분류 문화,취미/Hi-Fi,PC-Fi
S/PDIF

Sony/Philips Digital Interface. 디지털 오디오 데이터를 전송하기 위한 일반 소비자용 규격이다. 전문가용 기기에서 디지털 데이터를 전송하기 위한 규격인 AES3 규격과 거의 같고 호환도 된다. "IEC 60958 type II"으로 정의되어있다. (앞서말한 AES3 가 "IEC 60958 type I"이다)

다시 S/PDIF 규격은 RCA 단자를 사용하는 75 Ω Coaxial 규격과, TOSLINK 단자를 사용하는 Optical Fibre규격이 있다. 스펙은 동일하다.

사용자 삽입 이미지

야마하 TSS-20의 후면 입력단이다. ① 과 ② 가 Optical, ③ 이 Coaxial 단자다. ④는 RCA 아날로그 단자인데, ③과 ④는 색상만 다를뿐 단자 규격은 동일하다는걸 알 수 있다.



S/PDIF 규격은 단방향으로만 전송 가능하기 때문에, 프로토콜 협상과 같은 기능이 없다. 출력에서 세팅한대로 입력에서 받아줘야 한다. 2021년 요즘 나오는 기기는 보통 24bit/96kHz PCM 스테레오 음원까지 전송 가능하고, 고급 기기라면 24/192 까지 전송 가능하다.

필자는 PC와 외장 DAC를 연결할때 사용하며 가급적 광케이블로 연결하려 한다. 광케이블을 사용하면 PC와 앰프가 전기적으로 완전히 분리되기 때문이다. 즉 광케이블을 사용하면 그라운드 루프와 전자기 간섭 이슈에서 자유롭다. 이런거에 신경안쓰고 기기를 구성할 수 있는건 꽤 많은 이점을 준다. 그리고 '광'이라 멋있기도 하다. 단점이라면 케이블을 구부리는게 제한이 있어 설치할때 조심해야 한다는 거다.
글쓴시간
분류 문화,취미/Hi-Fi,PC-Fi
Hi-Fi, PC-Fi 구성

PC-Fi를 이해하려면 먼저 Hi-Fi 를 알아야 한다. Hi-Fi 는 High Fidelity의 약어로 높은 충실도라는 의미다. 음향에서는 "원음에 충실한 재현"을 의미한다. 원음이라는건 작곡자가 연주한 음악을 의미하는데, 이런 용어가 나왔다는것 자체가 일반적인 방법으로는 원음과 동일하게 재생되지 않았다는 의미다. 쉽게 말하면 음악을 녹음할 때 들은 소리와, 지금 내 스피커로 들은 소리가 다르기 때문에 최대한 원음에 충실하자는 의미다.

- Hi-Fi 라는 건 1920년대 말에 나온 말이긴 하다. 소리 재생에 대한 주파수 범위를 늘이고 스피커의 주파수그래프가 가능한 직선이 되어야 한다고 했다. 당시 음향시스템은 요즘 나오는 천원대 스피커만도 못한 소리였다.

※ Hi-Fi 를 구현하는데에는 아래와 같은 3가지 요소가 있다고 한다.

ⓐ 소스
ⓑ 앰프
ⓒ 스피커

※ 이 포스트에서는 각각에 대해 간단히 설명하고 조만간 더 자세히 쓸 생각이다.

ⓐ 소스

음원을 재생하는 장치를 말한다. 턴테이블, 카세트 플레이어, CD 플레이어, MP3 재생기, 블루투스 수신기, 네트워크 플레이어등이 있다. 이런 장치는 보통 Line-Out 단자를 가지고 있다. 디지털 소스를 재생하는 경우 DAC도 이 기기에 있다. 턴테이블과 카세트 플레이어는 아날로그 기기이고, CD플레이어나 MP3재생기, 블루투스 수신기, 네트워크 플레이어는 디지털 기기다.

사용자 삽입 이미지

티악 CD/FM 튜너 PD-301-X 전면

사용자 삽입 이미지

티악 CD/FM 튜너 PD-301-X 후면. Line-Out 단자가 있다


ⓑ 앰프

소스의 신호는 스피커를 구동하기에는 매우 약하다. 이를 증폭시키는 장치다. 보통 Line-In 단자에서 소스를 받아, Speaker-Out 단자로 출력한다. 앰프는 다시 프리앰프와 파워앰프로 나뉘는데, 이에 대한 설명은 여기서는 생략하겠다. 요즘엔 프리앰프와 파워앰프를 하나로 만든 인티앰프가 많이 사용된다.

사용자 삽입 이미지

티악 인티앰프 AX-505 전면. 입력을 선택하고 볼륨을 조절한다.

사용자 삽입 이미지

티악 인티앰프 AX-505 후면. 입력단이 4가지, 출력단이 1곳으로 되어있다. 다양한 소스에서 입력받아 스피커로 내보내는 역할을 한다.

사용자 삽입 이미지

티악 인티앰프 AX-505 리모콘



ⓒ 스피커

교류 신호를 받아 사람이 들을 수 있는 음향를 낸다. 보통 Speaker-In 단자를 가지고 있다. Hi-Fi 에서 말하는 스피커는 Passive 방식의 스피커를 의미한다.

사용자 삽입 이미지

야마하 스피커 NS-BP401



위 3가지를 기본으로 다양하게 구성을 할 수 있다. 구성할 수 있는 방법이 너무 많아 오히려 혼동이 될 수 있는데 어차피 저 3가지 요소에 다 포함된다.

※ PC-Fi 구성

PC를 사용한 Hi-Fi 시스템을 PC-Fi 라고 부른다. 우리나라에서만 사용하는 말이다. 스타일오디오라는 회사에서 처음 사용한 말로 알려져 있다. 쉽게 말하면 PC를 소스로 사용해 HiFi 를 구현했다는 정도로 이해하면 된다.

① PC
② DAC
③ 앰프
④ 스피커

의 구성으로 사용하곤 한다.

- PC-Fi 에서는 PC의 마더보드 내장형 사운드카드가 아닌 별도의 DAC를 사용해 소스기기로 활용한다. 특히 ① 과 ② 의 연결이 디지털로 이루어지도록 만든다. 디지털 연결은 USB, S/PDIF, Network, BlueTooth 를 사용할 수 있다. 필자는 TOSLINK 방식의 S/PDIF 로 연결하는걸 가장 선호한다. DAC를 소스로 사용하고 이후는 Hi-Fi 와 동일하게 구성한다.

사용자 삽입 이미지

스타일오디오의 DAC인 CARAT-SAPPHIRE LE 전면

사용자 삽입 이미지

스타일오디오의 DAC인 CARAT-SAPPHIRE LE 후면



S/PDIF

- 보통 ②와 ③ 이 통합된 기기를 사용해 구성한다.

- PC-Fi 는 Hi-Fi 구성과는 달리 PC의 모니터앞에 스피커를 놓고 가까운 거리에서 오디오를 감상하는걸 가정하기 때문에, 스피커의 출력이 클 필요 없다는 점을 염두해 두어야 한다. 그리고 이어폰이나 헤드폰을 사용해 듣는 경우가 많기 때문에 헤드폰 단자도 신경써야 하며, 장소가 비좁기 때문에 통합된 기기를 사용하는걸 고려해야 한다.

사용자 삽입 이미지

TEAC HR-S101 (AI-101DA(USB DAC) + LS-101(스피커) 구성, 50.0만, 현재 단종). 이거 사고 그냥 USB케이블로 PC와 연결만 하면 된다.

글쓴시간
분류 문화,취미/Hi-Fi,PC-Fi
오디오 리샘플링 품질

- PC나 노트북에 내장되어있는 사운드기기들은, 다양한 오디오 스펙을 지원하지 않는다. 보통 스펙은 16bit 또는 24bit 에 48kHz 샘플링레이트를 지원하는데, 이런 기기로는 CD음질(16bit, 44.1kHz)를 재생할 수 없다. 이런 사운드 기기들을 가진 경우 내부적으로(윈도 또는 H/W에서) 샘플링 레이트와 비트깊이를 변환 해서 출력한다.

- 또한 몇몇 사운드기기는 다양한 샘플링레이트를 지원한다고 되어있지만, 내부적으로 하드웨어에서 샘플링레이트 변환이 이루어져 출력되었던 전례가 있다.

- 윈도에서 사운드 기기의 출력 스펙을 확인하는 가장 간단한 방법은 "스피커/헤드폰 속성"("소리" 제어판을 열고 (mmsys.cpl 실행)스피커를 더블클릭한다)의 고급 탭을 보는 것이다. 아래 화면에서는 16/48 과 24/48 만 지원하는 경우다.

사용자 삽입 이미지

윈도에서 스피커/헤드폰 속성 을 보았을때, 위와 같이 나오면 48kHz 만 지원하는 기기다



사용자 삽입 이미지

지원되는 형식 탭에서도 확인해볼 수 있다.



- 비트깊이를 높여 출력하는건 일반적으로 문제 없지만, 샘플링레이트를 변환해 출력하는 것은 원음을 왜곡하기 때문에 문제가 될 수 있다. 물론 샘플링 레이트를 변환해 출력해도 일반적으로는 사람의 귀에서는 잘 느껴지지 않지만, 좋은 스피커를 가지고 조용한 곳에서 다른 기기로는 많이 들어본 음악이라면 미묘한 차이가 느껴지기도 한다. 샘플링레이트를 변환하면 사운드가 왜곡되어 나오는데 이게 DAC가 좋지 않을수록 차이가 심해지기 때문이다.

  (DAC가 좋은거면 샘플링 레이트가 내부적으로 변환되어서 출력되도 사람 귀로는 구분 못한다. 항상 저가형 DAC가 문제다. 변환 알고리즘이 좋지 않아 왜곡이 심하기 때문이다)

- 이런경우를 위해 좋은 오디오 플레이어에서는 자체 샘플링 레이트 변환기능을 지원한다. H/W나 OS단에서 해주는 샘플링레이트 변환보다 더 좋은 알고리즘을 써서 더 음질을 좋게 만들어주기 위함이다.

- foobar2000 에서도 리샘플러가 2개 있는데, ssrc 와 pphs 가 그것이다. ssrc가 더 좋다고 하지만 CPU소비가 많고 변환이 조금 느리다.

- 보통 foobar2000을 사용하면, ① WASAPI Output 이나 ② Resampler + Limiter + WASAPI Output 조합을 많이 사용할 것이다.

① DAC에서 다양한 입력 포맷을 지원해주는 경우 WASAPI Output 만 사용하자.

(foobar2000에서 WASAPI를 지원하려면 별도의 플러그인( https://www.foobar2000.org/components )을 설치해야 한다)

사용자 삽입 이미지


② 그게 아닌 경우 Resampler + Limiter + WASAPI Output 을 사용하자.

사용자 삽입 이미지

SSRC Resampler 와 Advanced Limiter 를 사용한 모습.


Active SDPs에서 SSRC 를 더블클릭하면 샘플링레이트를 지정하는 패널이 나온다. 여기에 H/W 에서 지원하는 스펙(48kHz의 경우 48000) 으로 적으면 된다.

사용자 삽입 이미지

48000 으로 세팅했다.

글쓴시간
분류 문화,취미/Hi-Fi,PC-Fi
비트 퍼펙트(Bit Perfect)

- 음원의 비트깊이/샘플링레이트와 출력하는 기기(사운드 카드 또는 DAC)의 비트깊이/샘플링레이트가 동일하도록 재생하는 기법을 비트 퍼팩트(Bit Perfect)라고 부른다. 음악 감상에 있어, 음질을 향상시키기 위해 사용하는 기법중 하나다.

- 현재 시판되는 음원은 CD의 비트깊이/샘플링레이트인 16bit/44.1kHz (줄여서 44/16 이라 함)이라는 스펙을 가지고 있다. 오디오 플레이어 프로그램에서 이런 사양의 음원을 재생하면, 44/16 스펙으로 OS(예를 들어 윈도10)를 통해 출력기기(=사운드 카드)에 전달하고, 출력기기는 이를 아날로그로 변환해 스피커로 출력한다.

사용자 삽입 이미지

ASUS 홈페이지에 설명된 BitPerfect 도식. 두개의 그림중 위 그림이 비트퍼팩트다.



- 당연해 보이지만 이걸 이야기 하는건 OS로 음원 데이터가 전달될 때 암묵적으로 비트깊이나 샘플링레이트가 "변환"되곤하기 때문이다.

- 출력기기의 비트깊이/샘플링레이트는 사운드 카드 및 운영체제마다 다르다. 윈도10이나 리눅스 운영체제의 최신 버전은 사운드카드의 스펙을 그대로 사용할 수 있으며, 안드로이드 운영체제도 5.0 이후부터는 외장 DAC를 사용해 비트 퍼팩트 재생을 할 수 있다. 바꿔 말하면 출력되는 비트깊이/샘플링레이트는 사운드카드의 스펙 뿐만 아니라 OS의 기능에도 영향을 받는다는 의미다.

- 안드로이드에서의 비트 퍼펙트는 후술하기로 하고 여기서는 윈도만 다룬다.

- 기본적으로 윈도 OS는 "커널 믹서"를 통해 오디오를 출력한다. 믹서라는걸 만든 이유는 여러가지 애플리케이션에서 동시에 음악을 출력하기 위함이다. 예를 들면 팟 플레이어로 음악을 틀고, 크롬 브라우저로 유튜브에 접속해 영상을 플레이하면, 두개의 음악이 섞여서 동시에 나온다. 하지만 기술적으로 하나의 사운드카드는 하나의 스펙으로 데이터를 받아 스피커로 출력할 수 있다. 그렇기 때문에, 두개 이상의 앱에서 동시에 오디오를 출력하려는 경우, 소프트웨어적으로 두개 이상의 음악 데이터를 받아 하나로 합한 후(이걸 믹싱Mixing이라 한다) 합한 데이터를 사운드카드로 보내 출력한다. 이렇게 되면 사용자는 두개의 소리가 동시에 나는 것 처럼 들리게 된다.

- 하나로 합하려면 각각의 음악 스펙이 동일해야 한다. 예를 들어 16bit/44.1kHz 음원과 24bit/48kHz 음원은 하나로 합할 수 없다. 한쪽을 다른쪽 스펙으로 변환시켜야 한다. 어떤 스펙의 음원을 사용할지 알 수 없는 상황이기 때문에, 윈도OS에서는 사용할 스펙을 사용자가 정해 놓을 수 있다. 기본값은 16bit/48kHz 다. 따라서 설정을 건드리지 않으면 모든 음악이 16bit/48kHz 으로 변환되서 재생되게 된다.

사용자 삽입 이미지

윈도10의 믹서 컨트롤 패널. PotPlayer 와 Chrome 에서 오디오를 출력중이다.


- 보통은 샘플링레이트 변환이나 비트 깊이 변환 작업이 크게 문제가 되지 않지만 좋은 스피커를 사용하다 보면 음이 뭔가 이상하다는 것을 서서히 느낄 수 있다. 특히 좋아하는 곡(=많이 들어본 곡)을 좋은 스피커로 (좋은 스피커가 비싼 스피커라는건 아니지만 보통 시중에서 판매되는 20만원 이상의 스피커)로 계속 듣다보면 음이 뭉개지는 듯한 느낌이 들기도 한다. 이는 믹싱 과정에서 미세한 잡음이 포함되기 때문이기도 하고, 특히 믹서에서 합해야 하는 음원의 비트깊이/샘플링레이트가 서로 다른 경우, 동일한 비트깊이/샘플링레이트가 되도록 변환한 후 믹싱해야 하는데, 비트깊이/샘플링레이트 변환 과정에서 손실이 발생하기 때문이다. 전에 쓴 글에서 비트깊이의 변환은 큰 문제 없지만 샘플링레이트의 변환은 문제의 소지가 많다고 쓴 걸 기억하자.

- 즉 FLAC나 MP3같은 손실/비손실 음원이 문제가 아니라는 거다. 비트 퍼팩트가 아니면 재생할 때 변환하느라고 손실이 발생한다. 그것도 운영체제 단에서 말이다. 필자는 MP3 코덱으로 인한 손실보다 믹싱으로 인한 손실이 더 크다고 생각한다. OS에서 제공하는 기본 변환소프트웨어는 성능을 중요시했기 때문에 음질이 좋지 않다.

- 그래서 이런걸 변환하지 말고, 즉 "커널 믹서"를 거치지 않고 사운드 카드를 오디오 플레이어에서 독점적으로 (믹서를 사용하지 않기 때문에 동시에 2개 이상의 프로그램에서 사운드 카드를 사용할 수 없다) 사용해 음악 파일의 음원 데이터를 직접 써주도록 하는게 비트 퍼펙트다. 만약 음원이 24bit/48kHz 라면, 사운드카드도 24bit/48kHz 를 지원하는 경우 이 스펙대로 사운드 카드에 직접 전달하고 스피커로 출력하는 것이다. 그렇게 되면 손실 및 변환되지 않은 음악을 들을 수 있게 된다.

- 반대로 음원이 24bit/48kHz 인데, 사운드 카드가 이 스펙을 지원하지 못하면 플레이가 안된다. 이런 경우는 비트 퍼팩트로 플레이 할 수 없고 믹서를 거쳐야 한다. 즉 음원의 비트깊이/샘플링레이트를 사운드 카드가 지원해야 한다.

- 윈도 10 에서 비트 퍼펙트를 사용하려면, 이를 지원하는 오디오 플레이어를 사용하면 된다. 윈도의 "ASIO" 나 "WASAPI 독점 모드"를 사용할 수 있는 플레이어가 바로 비트퍼팩트 지원 플레이어다.

- "푸바2000"이란 프로그램을 을 사용하고 있다면 아래와 같이 세팅한다.

사용자 삽입 이미지

푸바2000의 WASAPI 설정


1. https://www.foobar2000.org/download 에서 foobar2000 을 받아 설치
2. https://www.foobar2000.org/components 에서 "WASAPI output support"을 클릭해 다운로드. 다운로드된 것을 더블클릭하면 foobar2000 의 플러그인으로써 설치됨
3. foobar200 을 실행한 후 Preference - Output 에서 Device 패널의 드롭다운 버튼을 클릭하면 WASAPI(event) 가 있으며 이중에서 원하는 장치를 선택. Output format 은 장치가 지원하는 최대 비트수로 설정. Apply 를 클릭해 적용한다.
4. 음원 재생해본다. 좋은 스피커에서 자꾸 듣다보면 뭔가 달라졌다는게 느껴질 것이다.

- 현재 장치가 지원하는 최대 스펙은 아래와 같이 "오디오 기본 형식" 설정 창을 통해 확인할 수 있다.

1. 윈도10의 제어판-검색에서 "소리"를 입력후 검색된 아이콘에서 소리 선택
2. 재생 탭에서 원하는 장치를 더블 클릭
3. 고급 탭에 보면 기본 형식을 선택할 수 있음. 여기 나오는 스펙들이 현재 사운드 카드에서 지원되는 스펙임
4. 하단의 단독모드 체크박스를 모두 선택하고 확인 버튼 선택
-> 굉장히 많은 내장 음악카드에서 44.1kHz 출력 지원하지 않는다. 보통 16bit/48kHz 를 지원한다.
-> 필자의 PC의 경우 아래와 같이 지원된다.

사용자 삽입 이미지

----

2023.09.28 업데이트

foobar 2000 최신 버전에는 아래와 같이 장치별로 exclusive 드라이버를 지원한다. 따라서 위에서 소개한 WASAPI output support 플러그인을 설치할 필요 없이 [exclusive] 장치를 선택하면 된다.

사용자 삽입 이미지
글쓴시간
분류 문화,취미/Hi-Fi,PC-Fi
가청 주파수 대역

- 사람의 가청 주파수 대역은 일반적으로 20~20,000Hz 으로 알려져 있다. 맞는 이야기이긴 하지만, 생각하는 것과 다른 점이 하나 있다. 사람의 경우 나이가 들면 점점 가청 대역이 줄어든다는 사실이다. 20kHz 를 듣는 건 아기들이나 가능하다. 나이가 들면 들수록 점점 낮아진다. 20세인 경우 약 16kHz 까지, 30세인 경우 14kHz 정도까지, 그리고 그 이후에는 12kHz 정도다. 나이를 더 먹으면 최대 8kHz 정도까지 듣는다.

- 8kHz 라고 하니 매우 낮은 음일 것 같지만 엄청 높은 음이다.

- 피아노가 내는 가장 낮은 음의 주파수가 27.5Hz (0 옥타브 라, A0), 높은 음이 4186.01Hz (8 옥타브 도, C8) 이다. 20kHz 는 10옥타브에 해당된다.

- 소프라노 가수가 내는 목소리의 최대 주파수가 1.2kHz 정도, 베이스 가수가 내는 최저 주파수가 87Hz 정도다.

- 하지만 기본주파수가 이렇다는 거고, 배음(하모닉스)을 감안하면 더 높은 음이 나온다.  보통 기준이 되는 주파수에 2배에서 4배정도 한다. 따라서 피아노의 C8음은 배음이 16kHz 까지 나올 수 있다는 이야기다. 물론 더 높은 음도 나오지만 어차피 우리는 듣지 못하기 때문에 그 음이 있던 없던 상관 없다.

- 20kHz 이상의 영역은 듣는게 아니라 느낀다는 설도 있지만 아직 정론으로 받아들여진건 아닌걸로 알고 있다. 당분간(그리고 아마 앞으로도)

- 자신의 가청 대역은 http://www.ultrasonic-ringtones.com/ 에서 확인해볼 수 있다.

사용자 삽입 이미지

http://www.ultrasonic-ringtones.com/



높은음을 못 듣는다고 문제될건 없다. 14kHz 까지만 들어도 음악 감상, 심지어는 클래식 음악 감상에 차이 없으니깐. 중요한건 높은음, 낮은음을 들을 수 있느냐가 아니라, 작은음을 들을 수 있느냐다. 작은음을 잘 못 들으면 빨리 병원 가야 한다.
글쓴시간
분류 문화,취미/Hi-Fi,PC-Fi
샘플링레이트(Sampling Rate), 비트깊이(Bit Depth)

※ 디지털 오디오 음원인 CD는 16bit-44.1kHz 이라는 규격을 가지고 있다. 이 규격은 디지털 오디오에서 상당한 고음질을 낼 수 있는 스펙이다. 여기서 44.1kHz 는 샘플링레이트, 16bit 는 비트깊이다.

- 비트깊이는 다이내믹레인지(Dynamic Range, 이하 DR으로 표기, 소리의 최대크기와 최소크기의 비율)와 관련있다. 이론적으로 비트당 6dB 의 다이내믹 레인지를 표현가능하다고 한다. 따라서 16bit 는 이론상 96dB 의 다이내믹 레인지를 가진다. 초고가 아날로그 녹음기의 다이내믹 레인지가 80dB 안팍인걸 고려하면 굉장히 높은 다이내믹 레인지다.

- 샘플링레이트는 소리의 주파수와 관련있다. 사람의 일반적인 가청주파수는 20Hz ~ 18kHz 정도로 잡는다. 소리를 키우면 20kHz까지 듣는 아이들도 있지만 일반적인 가청 주파수는 저정도이고(가청 주파수는 나이가 들면 더 떨어진다. 20세 성인인 경우 개인차가 있겠지만 좋은 경우 250 ~ 16kHz 정도다) 따라서 CD의 44.1kHz 라는 샘플링 레이트는 "나이키스트-섀넌 표본화 정리"(신호의 완전한 재구성은 표본화 주파수가 표본화된 신호의 최대 주파수의 두 배보다 더 커야 한다는 정리)에 의해 이론상 22.05kHz 주파수까지 커버 가능하므로 인간의 가청 영역을 모두 담을 수 있다.

※ 왜 고음질 디지털 오디오에서 24bit-48kHz 를 사용하나?

- 16bit 비트깊이는 이론상 훌륭한 다이나믹 레인지를 제공하긴 하지만, 실질적으로 ADC(아나로그-디지털 컨버터, 디지털 녹음기의 핵심 부품)가 오디오를 디지털로 담을때 1~2bit 정도의 다이내믹 레인지 손실이 발생한다. 또한 헤드룸(Headroom, Crest factor, 피크를 제대로 표현하기 위해 남겨두는 여유 공간)에 최소 3bit (~20dB) 정도를 할당하게 되는데, 이를 다 합하면 5비트 손실이 되고, 16-5=11 해서 11비트(=66dB)정도의 다이내믹 레인지가 된다. 아무리 좋은 ADC를 사용해도 다이내믹 레인지가 줄어드는 문제는 피해갈 수 없다.

- ADC로 변환한 디지털 오디오 소스를 가지고, 믹싱하고 음향효과를 주고, 컴프레싱작업을 하는 등의 마스터링을 하면 다이내믹 레인지는 더 떨어진다. 이렇게 점점 다이내믹 레인지가 떨어지다 보면 최종 소비자에게 제공되는 음원의 다이내믹 레인지는 처음 녹음했던 것 보다 더 떨어지게 된다. 물론 마스터링 작업을 하고나면 보통 사람이 듣기엔 더 좋아지지만, 전문가의 입장에서는 마냥 좋아할 수는 없는 셈이다. 그냥 이론상 다이내믹 레인지가 떨어지니 말이다. (특히 다이내믹 레인지가 떨어지면 웅장하고 섬세한 느낌의 음악을 만들기 어려워진다) 그래서 라이브 공연 시장이 남아있는 것이다. CD로 듣는 음악과 라이브로 듣는 음악이 그래서 다르다.

- 16bit 대신 24bit 를 사용하면 5비트 정도 손해를 봐도 다이내믹 레인지에 문제 없고 더 많은 헤드룸 영역을 할당해도 다이내믹 레인지에 여유가 생긴다. 16 비트로는 이론상으로나 실제로나 한계가 명확하기 때문에, 24bit 를 사용하는 것이다.

- 이왕하는거 32bit 로 하는건 어때? 라고 생각할지 모르겠지만 16 -> 24bit 만 해도 음원 데이터의 양이 50% 가 늘어나며 그만큼 연산양도 50%가 늘어난다. 이는 소비자들이 사용하는 재생기(오디오 플레이어)의 성능이 50% 좋아야 한다는걸 의미하고 성능이 좋은 만큼 기기의 배터리도 더 빨리 닳게 되며, 기기의 가격도 더 비싸진다는걸 의미한다. 그래서 데이터 양을 마냥 높일수만은 없다. 결정적으로 24bit 만 되어도 충분한 다이나믹 레인지를 얻을 수 있기 때문에 굳이 32비트로 높일 필요가 없다.

- 44.1 kHz 은 가청주파수를 담을 수 있는 40kHz 이상의 샘플링레이트에서, 당시 기술로 알리아스 제거를 위한 로우패스 필터를 개발하기 쉬운 샘플링레이트를 찾은게 44.1kHz 다. 게다가 44100 이라는 숫자는 처음 4개의 소수(2,3,5,7)를 각각 제곱승한걸 곱한값이다. 2^2*3^2*5^2*7^2 =44100 즉 뭔가 있어 보인다. 그냥 쉽게말하면 40kHz 이상 되는 숫자에서 괜찮아보이는 숫자를 선택한것이다. 44.1 이라는 숫자에 큰 의미를 둘 필요는 없다.

- 48kHz 는 뭔가요? 이건 비디오 스트리밍 규격때문에 나온거다. 30프레임, 60프레임, 720p, 1080p 등 비디오 전송 양을 자유롭게 조절하는 실시간 비디오 스트리밍 시장에서, 음원 전송 양도 줄일 수 있는 기능을 담아야 하는데, 어쩌다보니 48kHz, 16bit 로 전송하면 딱 맞는 비트레이트가 되었기 때문이다. 또한 12의 배수라 정수로 나누기 쉽다는 장점도 있다. 음향학적인 이유가 있어서 그런게 아니다. 하지만 현재 이 시장을 무시할 수 있는건 아닌데다 44.1 kHz 나 48kHz 나 데이터 양에 큰 차이가 없고 따라서 기기 가격도 차이 없기 때문에 그냥 48kHz 쓴다.

- 96kHz 를 사용하면 더 좋지 않나요? 맞다. 더 좋다. 문제는 이걸 만족시키려면 많은 비용이 들어간다는 거다. 위에서 말한 배터리및 플레이어의 성능 문제 말이다. 또한 96kHz 를 사용하면 48kHz 까지 음향이 담긴다. 이 대역은 잡음이 많은 대역이다. (정확하게 말하자면 인간이 들을 수 있는 20kHz까지는 말 그대로 인간이 들을 수 있기 때문에 잡음이나 소음에 대한 규제가 있어 사실상 깨끗한 대역이다. 인간이 못 듣는 대역을 녹음해 분석해보면 훨씬 많은 잡음이 있다) 따라서 96kHz 이상으로 샘플링 하려면 방음시설이 좋아야 하고, 음향 시설이 좋아야 하고, 녹음시설도 좋아야 한다. 열악한 녹음 환경에서 96kHz 으로 녹음하면 환경의 열악함만을 확인할 수 있을 뿐이다. 더 결정적인건 48kHz 나 96kHz나 일반인은 물론 전문가가 들어도 유의미한 차이가 없다는 거다. 대부분의 디지털 악기는 48kHz 로 출력하고 앞으로도 그럴것이다. 그래서 현실적으로 스튜디오를 96kHz를 구성해도 큰 차이가 나질 않는다. 세계의 메이저급 스튜디오도 96kHz 레코딩 시설을 갖춘 경우가 별로 없다.

-> 그래서 48kHz, 24bit 가 산업계 표준이 되었다.

※ 비트깊이, 샘플링 레이트 변환

- 비트깊이의 변환은 자유로운 편이다. 비트깊이를 다운시키면 음질의 손실이 생기긴 하겠지만 그리 큰 차이 없다. 높이는 것도 그냥 의미없는 값으로 (0으로) 채워넣으면 되기 때문에 (대신 디지털상 음질은 당연히 똑같다) 문제 없다. 하지만 같은 24비트를 지원하는 DAC을 채용한 기기에서, 16bit 와 24bit 의 출력 회로가 다르게 구성되는 경우가 많기 때문에, 소프트웨어적으로라도 이를 업 스케일링(16bit 음원을 24bit 음원으로 비트깊이를 높이는 것)하면 음질 향상에 효과가 있는 경우가 많다.

- 하지만 샘플링 레이트의 변환은 전혀 다른 문제다. 어렵다. 이론상 없던 음이 생기고 실제로도 없는 음이 생기니까 말이다. 노이즈, 앨리어스라고 표현하는게 그거다. (이런 잡음을 들을수 있고 느낄 수 있느냐는 다른 문제다) 특히 배수로 변환(예를 들어 96kHz <-> 48kHz로 샘플링 레이트를 1/2 으로 줄이거나 2배로 늘이는것)하는건 그나마 덜 생기지만 48kHz -> 44.1kHz 등으로 변환하는건 훨씬 많이 생기기 때문에 사실상 안된다고 봐야 한다. 이런 경우는 48kHz 를 스피커로 출력한후 다시 마이크로 받아 44.1kHz으로 디지털 작업하는게 나은 경우도 있다. (이렇게 써 놓으니 실제로 못 들을것 처럼 써 놓았는데 그건 아니다. 필자도 구형 MP3 기기를 사용하기 위해서 샘플링 레이트를 변환해서 듣고 있다. 잡음이 유독 심하게 들어가는 극히 일부 음원(필자가 변환해본 음원의 1% 정도)을 제외하고는 유의미한 차이는 없다. 잡음이 들어간것도 3분짜리 곡에서 1개의 음이 그렇다는 것일 뿐이다. 물론 이게 상당히 거슬리긴 하기 때문에 아예 구형 기기에서는 안듣는다)
글쓴시간
분류 문화,취미/Hi-Fi,PC-Fi
하이 레졸루션 오디오

사용자 삽입 이미지


※ 하이 레졸루션 오디오(High-Resolution Audio, HRA, 고 해상도 음악) 란 CD보다 높은 스펙의 디지털 음원을 말한다.

CD 음원 기록 형식: 16bit, 44.1 kHz
HRA: CD음원보다 높은 스펙의 음원

- 16비트로는 0~65535 까지의 숫자를 나타낼 수 있다. 마이크에서 들어올 수 있는 입력(음압)에서, 가장 낮은 음압을 0, 가장 높은 음압을 65535 로 정한 후, 음압의 크기를 측정한 후 저장한다. 저장하는걸 1초에 44100 번 저장하면 16bit, 44.1 kHz 스펙이 된다.

- 사람의 가청 주파수는 ~ 20kHz 으로 알려져 있으며, 이를 제대로 디지털화 하기 위해서는 가청 주파수의 2배이상인 40kHz이상으로 샘플링해야 한다. 16bit 으로 정한건 실제 들어보니 16bit 로 하면 충분하더라 해서 나온 값이다. 이렇게 해서 CD의 스펙인 16비트 44.1kHz 가 나왔다. (44.1kHz 는 특별한 의미가 없다. 그냥 40kHz 이상되는 것중에 고른거다)

- 16bit, 44.1 kHz 스펙에서 16bit 대신 24bit, 32bit 를 사용하고, 샘플링 레이트를 44.1kHz 에서 48kHz 나 96kHz, 192kHz, 384kHz 까지 높여 더욱 세세하게 저장한 것이 바로 HRA용 음원이다. 재미있는건 96kHz 으로 샘플링을 하면 가청대역을 2배 상회하는 48,000 Hz 대역까지 저장된다는 점이다. 물론 이 대역은 사람의 귀로는 듣을 수가 없다. 샘플링 레이트를 높이기 위한 디지털 프로세싱에서 발생하는 어쩔 수 없이 나오는 현상일 뿐이다.

- 디지털에서는 음원의 스펙에 따라 디지털 파형 차이가 많이 난다. 디지털 정보만을 가지고 다이어그램을 그리면 아래 그래프 처럼 계단 현상이 나타나게 된다. (물론 아래 그래프는 차이가 과장되어있다) 높은 스펙을 가질 수록 디지털 단에서는 원음에 가깝게 표현할 수 있다.

사용자 삽입 이미지

출처: http://www.technics.com/us/high-res-audio/what-is-high-resolution-audio.html


- 하지만 DAC를 통해 아날로그화 되는 결과물은 유사하다. 아니 사람이 듣기엔 같다. DAC를 거쳐서 스피커로 출력될 때에는 굴곡이 없어지고 상상 이상으로 부드럽게 아날로그화 된다.

※ 그럼 무슨 차이가 있는 거죠? 하이 레졸루션 오디오 써야 할 필요가 있나요?

- 그럼 무슨 차이가 있나? 이부분에 대해서는 사람마다 의견이 다르다. 차이가 없다는 의견, 차이가 미미하다는 의견, 차이가 있고 사람이 감지할 수 있다는 의견이다.

- 필자의 생각은 이렇다. 현실적으로 16bit vs 24bit, 44.1kHz vs 96kHz 를 사람이 구분할 수는 없다. 필자도 구분 못한다. 동일한 곡을 16bit, 44.1 kHz 으로 듣던 24bit 96kHz 으로 듣던 구분 못한다는 의미다.

- 단지, 요즘은 시대가 발전하고 사용자의 인식이 바뀜에 따라, 예전과 다른 음원을 만들 수 있게 되었다. 예를 들어 예전엔 사용자의 열악한 오디오 기기를 감안해 원음에 일부러 강한 음장 효과를 주었지만, 지금은 그런 효과를 주지 않아도 될 정도로 일반 사용자들의 오디오 기기 수준이 높아졌다. HRA용 음원들은 이런 상황을 감안해 가능한 원음(스튜디오에서 녹음했을때 프로듀서가 들은 그 원음)에 가깝게 작업해 준다. 물론 비 HRA 음원보다 좋다는 인식을 주기 위해 HRA 틱한 듣기 좋은 음향 효과는 추가한다. 즉! 일반 음원과 HRA 음원이 같은 곡을 스펙만 다르게 해서 녹음한게 아니라, 그냥 미묘하게 다른 곡 이라는 의미다. 그러니 곡이 다르다고 느끼는건 당연하다.

- 필자가 좋아하는 곡이 일반음원으로도 나오고 HRA용 음원으로 출시되었다면, 이 곡으로 블라인드 테스트하면, 두 음원이 차이가 있다는 것을 감지할 자신이 있다. 하지만 어떤게 HRA 음원인지는 구분 못한다. 왜냐하면 스튜디오에서 녹음한 원음을 듣지 못했기 때문에, 어떤게 원래 음색인지 구분이 안되기 때문이다. 그리고 어떤게 원래 음색인지 구분할 필요도 없다. 음악은 취향이기 때문이다.

- 단지 내 취향에 맞는 음원을 고르다 보면 HRA음원이 더 많다. (물론 아닌 경우도 있다) 이게 내가 HRA음원을 사용하는 이유다. "내 취향에 맞는다" 한마디면 되는 것이다. 안 맞으면 안들으면 된다. 그뿐이다.

※ HRA를 즐길려면

1. 24bit, 44.1kHz 이상 스펙을 가진 무손실 음원이 있어야 한다. .mp3 파일은 압축률을 위해 고음역대를 자르고 인코딩 하는 경우가 많아 HRA를 즐길 수가 없다, .flac 파일이나, .dsd 파일 중에 24bit, 44kHz 이상의 스펙을 가진 음원 파일이 있어야 한다. 주의해야할 것이, 스펙만 보는게 아니라 소스가 어떤건지도 봐야 한다. 예를 들어 .mp3 파일을 .flac 24bit 48kHz 으로 변환한 경우, HRA 라고 할 수 없다. (실제 이런 파일이 많으니 주의하자. 믿을 수 있는 곳에서 고음질 소스를 구매해야 한다)

- 대부분 24bit 48kHz스펙을 가진 HRA음원이 많고, 24bit 96kHz 스펙으로 출시되는 경우도 더러 있다. 192kHz 음원이나 32bit 음원은 보지 못했다.

2. 24bit, 44kHz 이상을 입력 받고 출력할 수 있는 DAC 를 가진 하드웨어가 있어야 한다. HRA음원 표준이 24bit, 48kHz 임을 상기하자.

3. 응답 주파수가 40 kHz이상인 스피커가 있으면 좋고 없어도 상관 없다고 본다. 단 40kHz 를 지원하는 스피커라면 웬만큼 튜닝이 된 스피커라는 말이 되기 때문에 음질에 대해서는 이것만 보고 골라도 된다. (물론 가격대비 성능은 차치하고서라도 말이다) 그냥 HRA를 지원하는 이어폰이나 헤드폰을 사용하는게 쉽다.

4. 블루투스 헤드셋을 사용하는 경우 블루투스 헤드셋이 고음질 전송 또는 HRA를 지원하는지 확인해봐야 한다. 이건 반드시 필요한데, aptX-HD 나 LDAC 를 지원해야 한다. 코덱이 압축을 덜해 왜곡현상이 덜 나타난다. (문제는 이것도 음원 별로 다르다)