MPEG-1 Audio Layer II

MPEG-1 Audio Layer II ou MPEG-2 Audio Layer II (MP2, às vezes incorretamente chamado de Musicam ou MUSICAM)[6] é um formato de compressão de áudio com perdas definido pela ISO/IEC 11172-3 juntamente com MPEG-1 Audio Layer I e MPEG-1 Audio Layer III (MP3). Embora o MP3 seja muito mais popular para aplicações de PC e Internet, o MP2 continua sendo um padrão dominante para transmissão de áudio.[7]

MPEG-1 ou MPEG-2 Audio Layer II
Extensão do arquivo .mp2
MIME audio/mpeg,[1] audio/MPA[2]
Desenvolvido por MPEG
Lançamento 6 dezembro 1991; há 32 anos[3]
Última versão ISO/IEC 13818-3:1998 (abril de 1998; há 26 anos)
Tipo de formato áudio com perda
Arquivado por MPEG-ES
Padronização ISO/IEC 11172-3,[4] ISO/IEC 13818-3[5]

História do desenvolvimento do MP2 para o MP3

editar

MUSICAM

editar

A codificação MPEG-1 Audio Layer 2 foi derivada do codec de áudio MUSICAM (Masking pattern adaptation Universal Subband Integrated Coding And Multiplexing), desenvolvido pelo Centre commun d'études de télévision et télécommunications (CCETT), Philips e o Institut für Rundfunktechnik (IRT) em 1989 como parte da iniciativa pan-europeia de pesquisa e desenvolvimento intergovernamental EUREKA 147 para o desenvolvimento de um sistema para transmissão de áudio e dados para receptores fixos, portáteis ou móveis (estabelecida em 1987).

Tudo começou como o projeto Digital Audio Broadcast (DAB) gerenciado por Egon Meier-Engelen do Instituto Alemão de Pesquisa e Experimental para Aeroespacial (mais tarde denominado Deutsches Zentrum für Luft- undRaum, Centro Aeroespacial Alemão) na Alemanha. A Comunidade Europeia financiou este projecto, vulgarmente conhecido como EU-147, de 1987 a 1994 como parte do programa de investigação EUREKA.

O sistema Eureka 147 compreendia três elementos principais: codificação de áudio MUSICAM (padrão de máscara, codificação e multiplexação integrada de sub-banda universal), codificação e multiplexação de transmissão e modulação COFDM.[8]

O MUSICAM foi um dos poucos codecs capazes de atingir alta qualidade de áudio em taxas de bits na faixa de 64 a 192 kbit/s por canal monofônico. Ele foi projetado para atender aos requisitos técnicos da maioria das aplicações (no campo da transmissão, telecomunicações e gravação em mídia de armazenamento digital) — baixo atraso, baixa complexidade, robustez a erros, unidades de acesso curto, etc.[9][10]

Como um predecessor do formato e tecnologia MP3, o codec perceptual MUSICAM é baseado em aritmética inteira de 32 subbandas transformadas, conduzidas por um modelo psicoacústico. Ele foi projetado principalmente para Digital Audio Broadcasting e TV digital, e divulgado pela CCETT (França) e IRT (Alemanha) em Atlanta durante uma conferência IEEE-ICASSP.[11] Este codec incorporado a um sistema de transmissão usando modulação COFDM foi demonstrado no ar e em campo[12] junto com a Rádio Canadá e a CRC Canadá durante o show da NAB (Las Vegas) em 1991. A implementação da parte de áudio deste sistema de transmissão foi baseada em um codificador de dois chips (um para a transformação de subbanda, um para o modelo psicoacústico projetado pela equipe de G. Stoll (IRT Alemanha), mais tarde conhecido como modelo psicoacústico I no padrão de áudio ISO MPEG) e um decodificador em tempo real usando um chip DSP Motorola 56001 executando um software de aritmética inteira projetado pela equipe de YF Dehery (CCETT, França). A simplicidade do decodificador correspondente, juntamente com a alta qualidade de áudio deste codec, usando pela primeira vez uma frequência de amostragem de 48 kHz e um formato de entrada de 20 bits/amostra (o mais alto padrão de amostragem disponível em 1991, compatível com o padrão de estúdio de entrada digital profissional AES/EBU), foram os principais motivos para adotar posteriormente as características do MUSICAM como recursos básicos para um codec avançado de compressão de música digital, como o MP3.

O algoritmo de codificação de áudio usado pelo sistema Eureka 147 Digital Audio Broadcasting (DAB) foi submetido ao processo de padronização dentro do ISO/Moving Pictures Expert Group (MPEG) em 1989-94.[13][14] A codificação de áudio MUSICAM foi usada como base para alguns esquemas de codificação de áudio MPEG-1 e MPEG-2.[15] A maioria dos principais recursos do áudio MPEG-1 foram herdados diretamente do MUSICAM, incluindo o banco de filtros, processamento de domínio de tempo, tamanhos de quadros de áudio, etc. No entanto, melhorias foram feitas e o algoritmo MUSICAM real não foi usado no padrão final MPEG-1 Audio Layer II.

Desde a finalização do MPEG-1 Audio e MPEG-2 Audio (em 1992 e 1994), o algoritmo MUSICAM original não é mais usado.[6][16] O nome MUSICAM é frequentemente usado erroneamente quando se refere ao MPEG-1 Audio Layer II. Isso pode causar alguma confusão, porque o nome MUSICAM é uma marca registrada de diferentes empresas em diferentes regiões do mundo.[6][16][17] (Musicam é o nome usado para MP2 em algumas especificações para Astra Digital Radio, bem como nos documentos DAB da BBC.)

O Projeto Eureka 147 resultou na publicação do Padrão Europeu, ETS 300 401 em 1995, para DAB que agora tem aceitação mundial. O padrão DAB usa o MPEG-1 Audio Layer II (ISO/IEC 11172-3) para frequência de amostragem de 48 kHz e o MPEG-2 Audio Layer II (ISO/IEC 13818-3) para frequência de amostragem de 24 kHz.[18]

MPEG Audio

editar

No final da década de 1980, o Moving Picture Experts Group (MPEG) da ISO iniciou um esforço para padronizar a codificação digital de áudio e vídeo, que deveria ter uma ampla gama de aplicações em transmissão de rádio e TV digital (mais tarde DAB, DMB, DVB) e uso em CD-ROM (mais tarde Video CD).[19] A codificação de áudio MUSICAM foi uma das 14 propostas para o padrão de áudio MPEG-1 que foram enviadas à ISO em 1989.[10][15]

O padrão de áudio MPEG-1 foi baseado nos formatos de áudio MUSICAM e ASPEC existentes.[20] O padrão de áudio MPEG-1 incluía as três "camadas" de áudio (técnicas de codificação) agora conhecidas como Layer I (MP1), Layer II (MP2) e Layer III (MP3). Todos os algoritmos para MPEG-1 Audio Layer I, II e III foram aprovados em 1991 como o rascunho do comitê ISO-11172[21][22][23] e finalizados em 1992[24] como parte do MPEG-1, o primeiro conjunto de padrões do MPEG, que resultou no padrão internacional ISO/IEC 11172-3 (também conhecido como MPEG-1 Audio ou MPEG-1 Parte 3), publicado em 1993.[4] Trabalhos posteriores sobre áudio MPEG[25] foram finalizados em 1994 como parte do segundo conjunto de padrões MPEG, MPEG-2, mais formalmente conhecido como padrão internacional ISO/IEC 13818-3 (também conhecido como MPEG-2 Parte 3 ou MPEG-2 Audio compatível com versões anteriores ou MPEG-2 Audio BC[26]), publicado originalmente em 1995.[5][27] O MPEG-2 Parte 3 (ISO/IEC 13818-3) definiu taxas de bits e taxas de amostragem adicionais para MPEG-1 Audio Layer I, II e III. As novas taxas de amostragem são exatamente metade daquelas definidas originalmente para MPEG-1 Audio. O MPEG-2 Parte 3 também aprimorou o áudio do MPEG-1 ao permitir a codificação de programas de áudio com mais de dois canais, até 5.1 multicanal.[25]

O componente Layer III (MP3) usa um algoritmo de compressão com perdas que foi projetado para reduzir bastante a quantidade de dados necessária para representar uma gravação de áudio e soar como uma reprodução decente do áudio original não compactado para a maioria dos ouvintes.

Prêmio Emmy de Engenharia

editar

CCETT (França), IRT (Alemanha) e Philips (Holanda) ganharam um prêmio Emmy de Engenharia 2000 pelo desenvolvimento de um sistema de compressão de áudio digital de dois canais conhecido como Musicam ou MPEG Audio Layer II.[28][29]

Especificações técnicas

editar

A camada de áudio MPEG-1 II é definida na ISO/IEC 11172-3 (MPEG-1 Parte 3)

Uma extensão foi fornecida na Camada de Áudio MPEG-2 II e é definida na ISO/IEC 13818-3 (MPEG-2 Parte 3)[30][31]

  • Taxas de amostragem adicionais: 16, 22,05 e 24 kHz
  • Taxas de bits adicionais: 8, 16, 24, 40 e 144 kbit/s
  • Suporte multicanal - até 5 canais de áudio de gama completa e um canal LFE (canal de aprimoramento de baixa frequência)

O formato é baseado em quadros digitais sucessivos de 1152 intervalos de amostragem com quatro formatos possíveis:

  • formato mono
  • formato estéreo
  • formato estéreo conjunto codificado em intensidade (irrelevância estéreo)
  • formato de canal duplo (não correlacionado)

Taxa de bits variável

editar

O áudio MPEG pode ter taxa de bits variável (VBR), mas não é amplamente suportado. A camada II pode usar um método chamado comutação de taxa de bits. Cada quadro pode ser criado com uma taxa de bits diferente.[31][32] De acordo com a ISO/IEC 11172-3:1993, Seção 2.4.2.3: Para fornecer o menor atraso e complexidade possíveis, o decodificador (áudio MPEG) não é obrigado a suportar uma taxa de bits continuamente variável quando na Layer I ou II.[33]

Como funciona o formato MP2

editar
  • MP2 é um codificador de áudio de sub-banda, o que significa que a compressão ocorre no domínio do tempo com um banco de filtros de baixo atraso produzindo 32 componentes de domínio de frequência. Em comparação, MP3 é um codificador de áudio de transformação com banco de filtros híbrido, o que significa que a compressão ocorre no domínio da frequência após uma transformação híbrida (dupla) do domínio do tempo.
  • MPEG Audio Layer II é o algoritmo central dos padrões MP3. Todas as características psicoacústicas e estruturas de formato de quadro do formato MP3 são derivadas do algoritmo e formato básicos do MP2.
  • O codificador MP2 pode explorar redundâncias entre canais usando codificação de intensidade "estéreo conjunta" opcional.
  • Assim como o MP3, o MP2 é um formato de codificação perceptual, o que significa que ele remove informações que o sistema auditivo humano não será capaz de perceber facilmente. Para escolher quais informações remover, o sinal de áudio é analisado de acordo com um modelo psicoacústico, que leva em consideração os parâmetros do sistema auditivo humano. Pesquisas em psicoacústica mostraram que se houver um sinal forte em uma determinada frequência, então sinais mais fracos em frequências próximas à frequência do sinal forte não podem ser percebidos pelo sistema auditivo humano. Isso é chamado de mascaramento de frequência. Codecs de áudio perceptuais aproveitam esse mascaramento de frequência ignorando informações em frequências que são consideradas imperceptíveis, permitindo assim que mais dados sejam alocados para a reprodução de frequências perceptíveis.
  • O MP2 divide o sinal de áudio de entrada em 32 sub-bandas, e se o áudio em uma sub-banda for considerado imperceptível, então essa sub-banda não é transmitida. O MP3, por outro lado, transforma o sinal de áudio de entrada para o domínio de frequência em 576 componentes de frequência. Portanto, o MP3 tem uma resolução de frequência maior do que o MP2, o que permite que o modelo psicoacústico seja aplicado de forma mais seletiva do que para o MP2. Então o MP3 tem maior escopo para reduzir a taxa de bits.
  • O uso de uma ferramenta de codificação de entropia adicional e maior precisão de frequência (devido ao maior número de subbandas de frequência usadas pelo MP3) explica por que o MP3 não precisa de uma taxa de bits tão alta quanto o MP2 para obter uma qualidade de áudio aceitável. Por outro lado, o MP2 mostra um comportamento melhor do que o MP3 no domínio do tempo, devido à sua resolução de frequência mais baixa. Isso implica em menos atraso de tempo do codec — o que pode tornar a edição de áudio mais simples — bem como "robustez" e resistência a erros que podem ocorrer durante o processo de gravação digital ou durante erros de transmissão.
  • O banco de filtros de sub-banda MP2 também fornece um recurso inerente de "ocultação transitória", devido ao efeito de mascaramento temporal específico de seu filtro-mãe. Essa característica única da família de áudio MPEG-1 implica uma qualidade de som muito boa em sinais de áudio com mudanças rápidas de energia, como sons percussivos. Como os formatos MP2 e MP3 usam o mesmo banco de filtros de sub-banda básico, ambos se beneficiam dessa característica.

Aplicações do MP2

editar

Parte dos padrões de rádio digital DAB e televisão digital DVB.

O MPEG-1 Audio Layer II é comumente usado na indústria de transmissão para distribuir áudio ao vivo por satélite, ISDN e conexões de rede IP, bem como para armazenamento de áudio em sistemas de reprodução digital. Um exemplo é o sistema de distribuição de programação PRSS Content Depot da NPR. O Content Depot distribui áudio MPEG-1 L2 em um wrapper Broadcast Wave File. O MPEG2 com cabeçalhos RIFF (usado em .wav) é especificado nos padrões RIFF/WAV. Como resultado, o Windows Media Player reproduzirá diretamente os arquivos do Content Depot, no entanto, os players .wav menos inteligentes geralmente não o fazem. Como o processo de codificação e decodificação teria sido um dreno significativo nos recursos da CPU nas primeiras gerações de sistemas de transmissão de transmissão, os sistemas de transmissão de transmissão profissionais geralmente implementam o codec em hardware, como delegando a tarefa de codificação e decodificação a uma placa de som compatível em vez da CPU do sistema.

MPEG-1 Audio Layer II é o formato de áudio usado em Digital Audio Broadcast (DAB), um padrão de rádio digital para transmissão de serviços de rádio de áudio digital em muitos países ao redor do mundo. O departamento de Pesquisa e Desenvolvimento da BBC afirma que pelo menos 192 kbit/s são necessários para uma transmissão estéreo de alta fidelidade:

Um valor de 256 kbit/s foi julgado para fornecer um sinal de transmissão estéreo de alta qualidade. No entanto, uma pequena redução, para 224 kbit/s, é frequentemente adequada e, em alguns casos, pode ser possível aceitar uma redução adicional para 192 kbit/s, especialmente se a redundância no sinal estéreo for explorada por um processo de codificação 'estéreo conjunto' (ou seja, alguns sons que aparecem no centro da imagem estéreo não precisam ser enviados duas vezes). A 192 kbit/s, é relativamente fácil ouvir imperfeições em material de áudio crítico.
— BBC R&D White Paper WHP 061 June 2003[34]

Todos os reprodutores de DVD-Vídeo em países PAL contêm decodificadores MP2 estéreo, tornando o MP2 um possível concorrente do Dolby Digital nesses mercados. Os reprodutores de DVD-Vídeo em países NTSC não são obrigados a decodificar áudio MP2, embora a maioria o faça. Enquanto alguns gravadores de DVD armazenam áudio em MP2 e muitos DVDs de autoria do consumidor usam o formato, DVDs comerciais com trilhas sonoras MP2 são raros.

MPEG-1 Audio Layer II é o formato de áudio padrão usado nos formatos Video CD e Super Video CD (VCD e SVCD também suportam taxa de bits variável e MPEG Multichannel, conforme adicionado pelo MPEG-2).

MPEG-1 Audio Layer II é o formato de áudio padrão usado no padrão MHP para decodificadores.

MPEG-1 Audio Layer II é o formato de áudio usado em filmadoras HDV.

Arquivos MP2 são compatíveis com alguns reprodutores de áudio portáteis.

Nomenclatura e extensões

editar

O termo MP2 e a extensão do nome do arquivo .mp2 geralmente se referem a dados MPEG-1 Audio Layer II, mas também podem se referir a MPEG-2 Audio Layer II, uma extensão compatível principalmente com versões anteriores que adiciona suporte para áudio multicanal, codificação de taxa de bits variável e taxas de amostragem adicionais, definidas na ISO/IEC 13818-3. A abreviação MP2 também é às vezes erroneamente aplicada a vídeo MPEG-2 ou áudio MPEG-2 AAC.

Ver também

editar

Referências

  1. Nilsson, Martin (Novembro de 2000). «The audio/mpeg Media Type - RFC 3003». IETF. Consultado em 3 de setembro de 2024 
  2. Hoschka, Philipp; Casner, Stephen L. (Julho de 2003). «MIME Type Registration of RTP Payload Formats – RFC 3555». IETF. Consultado em 3 de setembro de 2024 
  3. Patel K, Smith BC, Rowe LA (1 de setembro de 1993). «Performance of a software MPEG video decoder». Proceedings of the first ACM international conference on Multimedia - MULTIMEDIA '93. Col: ACM Multimedia. New York City: Association for Computing Machinery. pp. 75–82. ISBN 978-0-89791-596-0. doi:10.1145/166266.166274  Reference 3 in the paper is to Committee Draft of Standard ISO/IEC 11172, December 6, 1991.
  4. a b «ISO/IEC 11172-3:1993 – Information technology — Coding of moving pictures and associated audio for digital storage media at up to about 1,5 Mbit/s — Part 3: Audio». ISO. 1993. Consultado em 3 de setembro de 2024 
  5. a b «ISO/IEC 13818-3:1995 – Information technology — Generic coding of moving pictures and associated audio information — Part 3: Audio». ISO. 1995. Consultado em 3 de setembro de 2024 
  6. a b c «MPEG Audio FAQ Version 9». 1998. Consultado em 22 de agosto de 2010. Cópia arquivada em 18 de fevereiro de 2010 
  7. Techopedia (16 de fevereiro de 2015). «MPEG-1 Audio Layer II (MP2)». techopedia.com. Consultado em 3 de setembro de 2024 
  8. A J Bower (1998). «Digital Radio — The Eureka 147 DAB System». UK: BBC. Consultado em 22 de agosto de 2010. Cópia arquivada em 2 de janeiro de 2007 
  9. Dehery, Y.F.; Lever, M.; Urcun, P. (1991). «A MUSICAM source codec for digital audio broadcasting and storage». [Proceedings] ICASSP 91: 1991 International Conference on Acoustics, Speech, and Signal Processing. [S.l.: s.n.] pp. 3605–3608 vol.5. ISBN 0-7803-0003-3. doi:10.1109/ICASSP.1991.151054 
  10. a b «AES E-Library – Musicam Source Coding». 1991. Consultado em 3 de setembro de 2024 
  11. Dehery, Y.F.; Lever, M.; Urcun, P. (Maio de 1991). A MUSICAM source codec for Digital Audio Broadcasting and storage. [Proceedings] ICASSP 91: 1991 International Conference on Acoustics, Speech, and Signal Processing. pp. 3605–3608. ISBN 0-7803-0003-3. doi:10.1109/ICASSP.1991.151054 
  12. Box, Alan (15 de abril de 1991). «A DAB commentary from Alan Box, EZ communication and chairman NAB DAB task force» (PDF). Broadcasting. 150 (15). 26 páginas 
  13. Digital Audio Broadcasting (DAB); DAB to mobile, portable and fixed receivers – Details of 'DE/JTC-DAB' Work Item – ETS 300 401, 15 de fevereiro de 1995, consultado em 3 de setembro de 2024 
  14. DAB – Service planning for terrestrial Digital Audio Broadcasting (PDF), 1992, consultado em 3 de setembro de 2024, arquivado do original (PDF) em 4 de maio de 2005 
  15. a b «Status report of ISO MPEG – September 1990». 1990. Consultado em 3 de setembro de 2024. Arquivado do original em 14 de fevereiro de 2010 
  16. a b Telos Systems. «Facts about MPEG compression». Consultado em 3 de setembro de 2024. Arquivado do original em 8 de maio de 2001 
  17. MUSICAM USA. «MUSICAM USA Frequently Asked Questions – Isn't MUSICAM simply your implementation of ISO/MPEG Layer 2?». Consultado em 3 de setembro de 2024. Cópia arquivada em 16 de junho de 2007 
  18. Radio Broadcasting Systems; Digital Audio Broadcasting (DAB) to mobile, portable and fixed receivers – Details of 'REN/JTC-DAB-36' Work Item – EN 300 401, 15 de junho de 2006, consultado em 3 de setembro de 2024 
  19. Chiariglione, Leonardo (Outubro de 1989). «MPEG Press Release». Kurihama: Moving Picture Experts Group. Cópia arquivada em 5 de agosto de 2010 
  20. Digital Video and Audio Broadcasting Technology: A Practical Engineering Guide (Signals and Communication Technology) ISBN 3-540-76357-0 p. 144: "In the year 1988, the MASCAM method was developed at the Institut für Rundfunktechnik (IRT) in Munich in preparation for the digital audio broadcasting (DAB) system. From MASCAM, the MUSICAM (masking pattern universal subband integrated coding and multiplexing) method was developed in 1989 in cooperation with CCETT, Philips and Matsushita."
  21. Chiariglione, Leonardo (Novembro de 1991). «MPEG Press Release». Kurihama: Moving Picture Experts Group. Consultado em 4 de setembro de 2024. Arquivado do original em 3 de maio de 2011 
  22. ISO (Novembro de 1991). «CD 11172-3 - Coding of Moving Pictures and Associated Audio for Digital Storage Media at up to About 1.5 MBit/s Part 3 Audio» (DOC). neuron2.net. Consultado em 4 de setembro de 2024. Cópia arquivada em 11 de junho de 2010 
  23. Patel, Ketan; Smith, Brian C.; Rowe, Lawrence A. Performance of a Software MPEG Video Decoder (PDF). ACM Multimedia 1993 Conference  Article's reference 3 is: 'ISO/IEC JTC/SC29, "Coded Representation of Picture, Audio and Multimedia/Hypermedia Information", Committee Draft of Standard ISO/IEC 11172, December 6, 1991'.
  24. ISO (6 de novembro de 1992). «MPEG Press Release, London, 6 November 1992». Chiariglione.org. Consultado em 4 de setembro de 2024. Arquivado do original em 12 de agosto de 2010 
  25. a b «Press Release - Adopted at 22nd WG11 meeting» (Nota de imprensa). International Organization for Standardization. 2 de abril de 1993. Consultado em 4 de setembro de 2024. Arquivado do original em 6 de agosto de 2010 
  26. ISO (Outubro de 1998). «MPEG Audio FAQ Version 9 - MPEG-1 and MPEG-2 BC». ISO. Consultado em 4 de setembro de 2024. Cópia arquivada em 4 de maio de 2010 
  27. Brandenburg, Karlheinz; Bosi, Marina (Fevereiro de 1997). «Overview of MPEG Audio: Current and Future Standards for Low-Bit-Rate Audio Coding». Journal of the Audio Engineering Society. 45 (1/2): 4–21. Consultado em 4 de setembro de 2024 
  28. National Academey of Television Arts and Sciences, Outstanding Achievement in Technical/Engineering Development Awards (PDF), consultado em 4 de setembro de 2024, arquivado do original (PDF) em 14 de abril de 2010 
  29. «CCETT - DAB : Digital Audio Broadcasting (archived website)». 11 de fevereiro de 2001. Consultado em 4 de setembro de 2024. Cópia arquivada em 11 de fevereiro de 2001 
  30. Werner Oomen, Leon van de Kerkhof. «MPEG-2 Audio Layer I/II». chiariglione.org. Consultado em 4 de setembro de 2024. Cópia arquivada em 30 de abril de 2010 
  31. a b Predrag Supurovic (Setembro de 1998). «MPEG Audio Frame Header». Consultado em 4 de setembro de 2024 
  32. ISO MPEG Audio Subgroup, MPEG Audio FAQ Version 9, MPEG-1 and MPEG-2 BC, retrieved on 2009-07-11. Arquivado em 2010-02-18 no Wayback Machine
  33. TwoLAME: MPEG Audio Layer II VBR, retrieved on 2009-07-11.
  34. «BBC R&D White Paper WHP 061 June 2003, DAB:An introduction to the EUREKA DAB System and a guide to how it works» (PDF). BBC.co.uk. Consultado em 4 de setembro de 2024. Cópia arquivada (PDF) em 4 de março de 2009 

Ligações externas

editar