음향 무용담. MP3 포맷은 어떻게 만들어 졌습니까?

1987 년, 독일 프라운호퍼 연구소 (Fraunhofer Institut für Integrierte Schaltungen에 대하여)는 디지털 오디오 코딩 문제에 대한 포괄적 인 연구를 시작했습니다. 이 연구소는 MP3 기술에 대한 특허를 소유하고 있습니다. 이 형식의 "아버지"는 Karl-Heinz Brandenburg칼 하인츠 브란덴부르크), 수학자 및 1977 년부터 압축 방법을 연구 한 전자 전문가. 1989 년에 형식에 대한 특허가 획득되었을 때, 사실상 하나의 MP3 파일이 존재하지 않았습니다. 1993 년에 MP3 파일은 국제 표준에 부합하는 것으로 인식되었습니다. MPEG-1.

디지털 오디오를이 형식으로 인코딩하기위한 기본 원칙은 무엇입니까? 원본 사운드 파일은 프레임으로 나뉩니다. 프레임 - 프레임)의 지속 시간이 0.05 초이다. 모두들. 그런 다음 각 프레임의 분석이 수행됩니다. 이 경우, 인간의 귀의 지각 범위를 벗어나는 소리의 모든 주파수는 폐기됩니다. 또한 진폭 값이 너무 높거나 낮은 진동은 무시됩니다. 알려진 바와 같이 인간의 인식 한계는 96dB입니다. 지각의 하한은 소리의 주파수에 크게 의존합니다. 높고 낮은 주파수는 진폭 인식 임계 값이 더 높습니다.

첫 번째 단계에서 각 프레임의 신호는 다양한 진폭과 주파수의 사인파의 합으로 수학적 푸리에 변환으로 표현됩니다 (그래픽으로 모든 주파수의 사운드는 정확히 사인 곡선입니다). 결과 공식에 포함 된 진폭 및 주파수의 값이 메모리에 기록됩니다.

처리의 두 번째 단계는 인간의 귀에 의한 소리 인식의 심리 음향 모델 사용에 기반합니다. 예를 들어 사운드 주파수의 미세한 연속적인 변경은 폐기됩니다 (주파수가 5000 Hz 인 신호와 그 뒤의 5100 Hz 신호는 주파수가 5000 Hz이고 결합 된 지속 시간이있는 신호로 기록됩니다). 귀의 또 다른 특징은 주파수 마스킹의 효과로 이어집니다. 특정 주파수의 사운드는 빈도가 거의 다른 다른 사운드를 마스크하지만 더 작은 진폭은 무시됩니다. 소리에 대한 귀의 관성은 큰 소리를 낸 후에 얼마 동안은 고주파와 저 진폭의 소리가 단순히 들리지 않는다는 사실로 이어진다. 이러한 사운드는 필터에 의해 버려집니다.

세 번째 단계는 알려진 수학적 방법으로 처리 된 신호를 압축하는 단계입니다. MP3에서의 데이터 압축은 Huffman 알고리즘의 약간 수정 된 버전에서 수행됩니다 (허프만), PKZIP, LHA, ZOO, ARJ 형식의 아카이브를 작성할 때 사용됩니다.

세 가지 변형의 결과로 원본 사운드 파일에 포함 된 정보가 여러 번 압축됩니다. 현대 코더의 압축 정도는 킬로 비트 / 초로 측정됩니다 (kbps), 사용자가 설정할 수 있습니다. 동시에 압축률이 증가함에 따라 파일 크기를 줄이는 것이 끊임없이 요구됨에 따라 사운드 프로세싱의 두 번째 단계 (즉, 특별한 제한없이 규제 됨)가 더욱 공격적이라는 사실을 기억해야합니다. "칼 밑에서"소리는 인간의 귀가 구별되기 시작합니다.

그것의 가공 도중 허용되는 소리 압축의 최소한도에 명확한 의견이 없다. 어떤 사람들은 128 kbps (압축 비율은 약 10 : 1)로 충분하다고 말하고, 다른 사람들은 두 배 더 큰 것을 선호합니다. 오늘날 대부분의 플레이어와 코더는 상한선이 320kbps이므로 전문가를 만족시킬 수 있습니다.

마지막으로 MP3의 오디오 코딩은 손실 (소리 정보가 손실됩니다). 관련 메서드 입력 무손실"psychoacoustic knife"의 두 번째 단계가 제외되고 압축은 수학적 방법만을 기반으로하며 최종 압축 파일에 원본 정보를 완전히 유지합니다.

Loading...

귀하의 코멘트를 남겨