Share to: share facebook share twitter share wa share telegram print page

Modifizierte diskrete Kosinustransformation

Die modifizierte diskrete Kosinustransformation (englisch modified discrete cosine transform, kurz: MDCT) ist eine reellwertige, diskrete, lineare, orthogonale Transformation, die zu der Gruppe der diskreten Fouriertransformationen (DFT) zählt und eine Modifikation der namensgebenden diskreten Kosinustransformation (DCT) ist.

Die MDCT wurde in den Jahren 1986, 1987 von John P. Princen, A. W. Johnson und Alan B. Bradley entwickelt.[1][2]

Die MDCT ist die zentrale Transformation der Audiodatenkompressionsverfahren Advanced Audio Coding (AAC),[3] Dolby Digital (AC-3), Ogg Vorbis, aber auch MPEG Audio Layer 3 (MP3), Opus Windows Media Audio (WMA), ATRAC, Cook, LDAC, High-Definition Coding (HDC),[4] Dolby AC-4,[5] MPEG-H 3D Audio,[6] ATRAC benutzen u. a. die MDCT als Spektraltransformation. Weiterhin wird sie in den Sprachkomprimierer AAC-LD (LD-MDCT),[7] G.722.1,[8] G.729.1,[9] CELT[10] und Opus[11][12] verwendet.

Daneben existiert die ähnlich aufgebaute modifizierte diskrete Sinustransformation (MDST), die auf der diskreten Sinustransformation basiert, die aber im Bereich der digitalen Signalverarbeitung keine wesentliche Bedeutung hat.

Motivation

Die MDCT basiert auf dem Typ IV der diskreten Kosinustransformation, auch als DCT-IV bezeichnet, und verwendet am Anfang der zu transformierenden Eingangssignalfolge, beispielsweise ist dies eine endliche Anzahl von Abtastwerten eines Audiosignals, eine gerade Fortsetzung und am Ende der Signalfolge eine ungerade Fortsetzung. Das Eingangssignal wird in aufeinander folgende Blöcke unterteilt, wobei jeder Block getrennt der Transformation unterworfen wird. Bei der MDCT werden die Signalfolgen zur Bildung der einzelnen Blöcke teilweise miteinander überlappt, um die geraden bzw. ungeraden Fortsetzungen der Blockbildung zu kompensieren. In der meist englischsprachigen Fachliteratur wird dies als time-domain aliasing cancellation (TDAC) bezeichnet. Ähnliche Verfahren finden im Rahmen der DFT beim Overlap-Add-Verfahren und dem Overlap-Save-Verfahren Anwendung, um die dort periodische Fortsetzung der DFT in die aperiodische Faltungsoperation zu überführen.

Die MDCT vermeidet das, was bei der DCT der JPEG-Kompression als Blockartefakte bekannt ist: Sprünge zwischen Abtastwerten benachbarter Transformationsblöcken. Das menschliche Gehör reagiert auf diese Form von Störungen noch wesentlich empfindlicher als das Auge, sodass ein Verfahren gefunden werden musste, das zwischen benachbarten Blöcken nicht schlagartig, sondern allmählich wechselt. Dies erfolgt durch eine Vergrößerung der in eine Transformation eingehenden Abtastwerte unter Verwendung einer Fensterfunktion. Dabei besteht aber das Problem, dass damit normalerweise die Datenmenge vergrößert würde, da Abtastwerte in Berechnungen mehrfach eingehen und redundant abgespeichert würden. Dieses Problem umgeht die MDCT, indem zwar Abtastwerte als Ausgangswerte in die Transformation eingehen, aber nur Spektralwerte entstehen. Normalerweise wäre so eine Transformation hochgradig verlustbehaftet, allerdings löschen sich diese Fehler bei der Rücktransformation und beim Addieren von benachbarten rücktransformierten Blöcken unter gewissen Bedingungen wieder aus.

So besteht die Möglichkeit, eine Spektraltransformation mit Fensterfunktion durchzuführen, ohne dass sich die Anzahl der Werte vergrößert. Diese Fensterfunktion führt zu einer besseren Spektralauflösung bei der MDCT und zu weniger Artefakten bei der IMDCT.

Definition

Transformation

Durch die Überlappung ist bei der MDCT und im Unterschied zu symmetrischen Frequenztransformationen die Menge der Eingangssamples aus dem Zeitbereich doppelt so groß wie die daraus gebildeten spektralen Ausgangsdaten. Formal werden bei der Transformation reelle Zahlen auf reelle Zahlen nach folgender Beziehung abgebildet:

mit

In der Literatur werden manchmal, in nicht einheitlicher Form und zur Normierung, in dieser Beziehung zusätzliche konstante Faktoren eingebracht, welche aber die Transformation nicht grundsätzlich verändern.

Inverse Transformation

Die inverse MDCT, abgekürzt IMDCT, stellt die Umkehrung zur obigen Transformation dar. Da die Eingangs- bzw. Ausgangsfolge eine unterschiedliche Anzahl umfassen, ist zur Umkehrung eine Addition im Zeitbereich der aufeinander folgenden Blöcke und der zeitlich überlappenden Bereiche im Rahmen der time-domain aliasing cancellation (TDAC) nötig.

Formal werden bei der IMDCT reelle Zahlen in reelle Zahlen übergeführt:

mit

Wie bei der DCT-IV, als eine Form von orthogonaler Transformation, ist die Rücktransformation bis auf einen Faktor identisch zu der Vorwärtstransformation.

Verwendung

Mehrere überlappende TDAC-MDCTs für Frequenzgang y(t) = cos (ct³)

Die MDCT ist die Basisoperation moderner Audiokompressionsverfahren. Dazu wird das Eingangssignal in sich zur Hälfte überlappende Blöcke der Länge geteilt, die jeweils vom Abtastwert reichen.

Die Transformation wird blockweise jeweils für jeden Block unter Verwendung einer Fensterfunktion (die gewisse Eigenschaften haben muss) durchgeführt:

mit

Die Rücktransformation erfolgt für ein Sample mit und

MDCT Fensterfunktionen
blau: Kosinus, rot: Sinus-Kosinus,
grün/d'grün: modifizierte Kaiser-Bessel mit α=6 bzw. 4
Leakage der MDCT Fensterfunktionen
blau: Kosinus, rot: Sinus-Kosinus,
grün/d'grün: modifizierte Kaiser-Bessel mit α=6 bzw. 4

Die Fenster-Funktion muss folgende Eigenschaften haben:

  • Für die Analyse wie die Synthese eines Blocks ist die gleiche Funktion zu verwenden. Sonst funktioniert das TDAC nicht.
  • Für jeden Abtastwert wird die Fensterfunktion sowohl bei der Analyse wie bei der Synthese je 2-mal angewendet. Diese beiden Werte müssen ohne Beschränkung der Allgemeinheit die Gleichung erfüllen. Die Bedingung nennt sich Princen-Bradley-Bedingung. Ein Nebeneffekt dieser Bedingung erzwingt, dass die Funktionen bei und ihrer Fensterbreite den Wert annehmen.
  • sollte eine möglich glatte Funktion sein, um den Leck-Effekt gering zu halten, der
    • bei der Analyse die Konzentration dominierender Signalkomponenten verringern würde und
    • bei der Synthese Störsignale entfernt von dominierenden Signalkomponenten erzeugen würde (DC-Anteile würden z. B. durch Sprünge an Blockgrenzen ein Knattern verursachen).

Durch die zweite Bedingung unterscheidet sich die Fensterfunktion erheblich von den normalerweise üblichen Fensterfunktionen. Im Wesentlichen finden folgende drei Fensterfunktionen Anwendung:

  • Kosinusfenster (MPEG Layer-3, AAC)
  • modifizierte Kaiser-Bessel-Fenster (AAC, AC-3)
  • Sinus-Kosinus-Fenster (Ogg Vorbis)

Berechnungsaufwand

Die direkte Berechnung der MDCT nach obiger Formel benötigt Operationen. Ähnlich wie bei der schnellen Fourier-Transformation (FFT), als eine Form der effizienten Berechnung der DFT, existieren auch bei der MDCT-Algorithmen die ähnlich wie der Radix-2-Algorithmus aufgebaut sind, um die Anzahl der Rechenoperationen auf O(N log N) zu reduzieren.

Zudem lässt sich die MDCT mittels Pre- und Postprocessing und einer FFT berechnen.

Literatur

  • Henrique S. Malvar: Signal Processing with Lapped Transforms. Artech House, 1992, ISBN 0-89006-467-9.

Einzelnachweise

  1. John P. Princen, Alan B. Bradley: Analysis/Synthesis filter bank design based on time domain aliasing cancellation. In: IEEE Transactions on Acoustics, Speech and Signal Processing. Band 34, Nr. 5, Oktober 1986, S. 1153–1161, doi:10.1109/TASSP.1986.1164954.
  2. J. Princen, A. Johnson, A. Bradley: Subband/Transform coding using filter bank designs based on time domain aliasing cancellation. In: Acoustics, Speech, and Signal Processing, IEEE International Conference on ICASSP ’87. Band 12, 1987, S. 2161–2164, doi:10.1109/ICASSP.1987.1169405 (Erstmalige Erwähnung des Begriffes MDCT).
  3. Fa-Long Luo: Mobile Multimedia Broadcasting Standards: Technology and Practice. Springer Science & Business Media, 2008, ISBN 978-0-387-78263-8, S. 590 (google.com).
  4. Graham A. Jones, David H. Layer, Thomas G. Osenkowsky: National Association of Broadcasters Engineering Handbook: NAB Engineering Handbook. Taylor & Francis, 2013, ISBN 978-1-136-03410-7, S. 558-9 (google.com).
  5. Dolby AC-4: Audio Delivery for Next-Generation Entertainment Services. In: Dolby Laboratories. Juni 2015, abgerufen am 11. November 2019.
  6. R. L. Bleidt, D. Sen, A. Niedermeier, B. Czelhan, S. Füg et al.: Development of the MPEG-H TV Audio System for ATSC 3.0. In: IEEE Transactions on Broadcasting. 63. Jahrgang, Nr. 1, 2017, S. 202–236, doi:10.1109/TBC.2017.2661258 (fraunhofer.de [PDF]).
  7. Markus Schnell, Markus Schmidt, Manuel Schmidt, Tobias Albert, Ralf Geiger, Vesa Ruoppila, Per Ekstrand, Grill Bernhard: MPEG-4 Enhanced Low Delay AAC - A New Standard for High Quality Communication. 125th AES Convention. Audio Engineering Society, Oktober 2008 (englisch, fraunhofer.de [PDF; abgerufen am 20. Oktober 2019]).
  8. Manfred Lutzky, Gerald Schuller, Marc Schuller, Ulrich Krämer, Stefan Wabnik: A guideline to audio codec delay. 116th AES Convention. Audio Engineering Society, Mai 2004 (englisch, fraunhofer.de [PDF; abgerufen am 24. Oktober 2019]).
  9. Sivannarayana Nagireddi: VoIP Voice and Fax Signal Processing. John Wiley & Sons, 2008, ISBN 978-0-470-37786-4, S. 69 (google.com).
  10. Presentation of the CELT codec (Memento vom 7. August 2011 im Internet Archive) by Timothy B. Terriberry (65 minutes of video, see also presentation slides in PDF)
  11. Opus Codec. In: Opus. Xiph.org Foundation, abgerufen am 31. Juli 2012.
  12. Peter Bright: Newly standardized Opus audio codec fills every role from online chat to music. In: Ars Technica. 12. September 2012, abgerufen am 28. Mai 2014.

Read other articles:

The Second Confession AuthorRex StoutCover artistBill EnglishCountryUnited StatesLanguageEnglishSeriesNero WolfeGenreDetective fictionPublisherViking PressPublication dateSeptember 6, 1949Media typePrint (Hardcover)Pages245 pp. (first edition)OCLC1468849Preceded byTrouble in Triplicate Followed byThree Doors to Death  The Second Confession is a Nero Wolfe detective novel by Rex Stout, first published by the Viking Press in 1949. The story was also collected in ot...

 

Laos Artikel ini adalah bagian dari seri Politik dan KetatanegaraanRepublik Demokratik Rakyat Laos Ideologi Kepemimpinan bersama Marxisme–Leninisme Konstitusi Partai Revolusioner Rakyat Kongres (ke-10) Komite Pusat Sekretaris Jenderal: B. Vorachith Politbiro (ke-10) Komite Eksekutif Sekretaris Eksekutif: P. Viphavanh Komisi Inspeksi Ketua: B. Chitmany Legislatif Majelis Nasional Komite Tetap Ketua: Pany Yathotou Eksekutif Presiden Bounnhang Vorachith Wakil Presiden Phankham Viphavanh Perdan...

 

Variety of grape Madeleine RoyaleGrape (Vitis)Handbuch der Tafeltraubenkultur, Berlin, Paul Parey, 1894SpeciesVitis viniferaAlso calledKönigliche Magdalenentraube (more)OriginFranceNotable winesTable/ornamental grapeVIVC number7068 Madeleine Royale is a variety of white grape. It is mostly grown for table grapes or ornamental purposes, but is notable as a parent of Müller-Thurgau and Madeleine Angevine. It ripens extremely early, in some cases by the 22 July, the feast day of Mary Magdalene...

Селада — термін, який має кілька значень. Ця сторінка значень містить посилання на статті про кожне з них.Якщо ви потрапили сюди за внутрішнім посиланням, будь ласка, поверніться та виправте його так, щоб воно вказувало безпосередньо на потрібну статтю.@ пошук посилань сам

 

Nam-gu남구 Distrito Nam-guLocalización de Nam-gu en Corea del Sur Coordenadas 35°51′N 128°36′E / 35.85, 128.6Idioma oficial CoreanoEntidad Distrito • País  Corea del Sur • Provincia Gyeongsang del Norte • Ciudad DaeguSuperficie   • Total 17.44 km²Población (2006)   • Total 180 547 hab. • Densidad 10 hab/km²Huso horario UTC + 9 Sitio web oficial [editar datos en Wikidata] Nam-gu es un...

 

Ambrona entidad local menor y entidad singular de población AmbronaUbicación de Ambrona en España. AmbronaUbicación de Ambrona en la provincia de Soria.País  España• Com. autónoma  Castilla y León• Provincia  Soria• Comarca Comarca de Arcos de Jalón• Partido judicial Almazán• Municipio Miño de MedinaceliUbicación 41°09′57″N 2°30′31″O / 41.165766666667, -2.5086638888889•&...

Anugerah Musik IndonesiaDeskripsiPencapaian terbaik dalam industri musik IndonesiaLokasiJakarta, IndonesiaNegara IndonesiaDipersembahkan olehYayasan Anugerah Musik IndonesiaNama sebelumnyaBASF Awards dan HDX Awards(1985–1996)Diberikan perdana1985; 37 tahun lalu (1985)Situs webami-awards.comSiaran televisi/radioSaluranIndosiar (1997–1999)RCTI (2000–2022)SCTV (2003)TPI (2006)Global TV (2006)TVRI (2006)Indonesiana TV (2023-sekarang) Anugerah Musik Indonesia (sering pula disebut d...

 

1940 American filmMusic in My HeartDirected byJoseph SantleyWritten byJames Edward GrantProduced byIrving StarrStarring Tony Martin Rita Hayworth Edith Fellows Alan Mowbray CinematographyJohn StumarEdited byOtto MeyerMusic by Chet Forrest Bob Wright Ary Barroso Charles Henderson(vocal arranger) Morris Stoloff(musical director) Distributed byColumbia PicturesRelease date January 10, 1940 (1940-01-10) Running time70 minutesCountryUnited StatesLanguageEnglish Music in My Heart is ...

 

American college football season 1875 Harvard Crimson footballTufts vs. Harvard at College Hill, October 1875National champion (NCF)Co-national champion (Davis)ConferenceIndependentRecord4–0Head coachNoneCaptainWilliam A. WhitingSeasons← 18741876 → 1875 college football records vte Conf Overall Team W   L   T W   L   T Harvard   –   4 – 0 – 0 Princeton   –   2 – 0 – 0 Columbia   ̵...

While the Vikings are perhaps best known for accumulating wealth by plunder, tribute, and conquest, they were also skilled and successful traders. The Vikings developed several trading centres both in Scandinavia and abroad as well as a series of long-distance trading routes during the Viking Age (c. 8th Century AD to 11th Century AD). Viking trading centres and trade routes would bring tremendous wealth and plenty of exotic goods such as Arab coins, Chinese Silks, and Indian Gems.[1]...

 

Lady's Character adalah sebuah seri drama Tiongkok tahun 2023. Seri tersebut tayang sejak 6 Februari 2023 dan berakhir pada 2 Maret 2023. Seri tersebut terdiri dari 40 episode. Seri tersebut menampilkan Wan Qian, Liu Mintao dan Xing Fei. Seri tersebut diproduksi Hunan TV dan Mango TV.[1] Sinopsis Seorang wanita memiliki jabatan sebagai direktur di sebuah perusahaan. Menjadi gila kerja, dia begitu fokus pada KPI sehingga dia tidak menyadari hubungannya dengan suaminya menjadi renggang....

 

Зв'язокфр. LiaisonТип телесеріалТелеканал(и) Apple TV+Жанр шпигунський телесеріалd і трилерСценарист Virginie BracdРежисер Стівен ГопкінсУ головних ролях Венсан Кассель (Gabriel Delage)Ева Ґрін (Alison Rowdy)Пітер Малланd (Richard Banks)Жерар Ланвен (Dumas)Daniel Francisd (Albert Onwori)Станіслас Мерхар (Didier Taraud)Th...

United KingdomOffice of the Permanent Secretary of the AdmiraltyRoyal Arms as used by Her Majesty's GovernmentFlag of the Secretary of the AdmiraltySir Henry V. Markham, Permanent Secretary, 1940–1946Admiralty DepartmentStyleThe Right Honourable(Formal prefix)Second Secretary to the AdmiraltyMember ofBritish CabinetBoard of AdmiraltySeatWestminster, LondonAppointerThe British Monarchon advice of the Prime MinisterTerm lengthNo fixed termFormation1702-1964First holderGeorge ClarkeFinal holde...

 

German infantry division Not to be confused with the contemporary paramilitary formations known as the Walloon Guard. Walloon LegionSleeve insignia of the Walloon LegionActive1941–1945Allegiance Nazi GermanyBranch Wehrmacht (1941–1943) Waffen-SS (1943–1945)TypeInfantrySize2,000 men (maximum strength)7,000–8,000 men (total, 1941–1945)Battalion, brigade and later division, though never larger than brigade-strength.Engagements Eastern Front (World War II) Anti-Partisan operations in Uk...

 

French-American animated television series Chip 'n' Dale: Park LifePromotional posterGenreComedySlapstickBased onChip 'n' Daleby Bill JusticeDirected by Jean Cayrol (season 1 and 2) Frédéric Martin (season 2) Khalil Ben Namaane (season 2) Voices of Matthew Géczy Kaycie Chase Cindy Lee Delong Bill Farmer Sylvain Caruso David Gasman ComposerVincent ArtaudCountry of originUnited StatesFranceNo. of seasons2No. of episodes24 (list of episodes)ProductionExecutive producerMarc du PontaviceProduce...

2021 soundtrack album by S. ThamanYuvarathnaaSoundtrack album by S. ThamanReleased19 March 2021 (2021-03-19)Recorded2020–2021GenreFeature film soundtrackLanguageKannadaLabelHombale MusicProducerS. ThamanS. Thaman chronology Wild Dog(2021) Yuvarathnaa(2021) Vakeel Saab(2021) Singles from Yuvarathnaa Power Of YouthReleased: 29 November 2020 Neenaade NaaReleased: 25 December 2020 Oorigobba RajaReleased: 22 February 2021 PaathshaalaReleased: 3 March 2021 Feel The PowerRel...

 

Land redevelopment in cities For other uses, see Urban renewal (disambiguation). This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Urban renewal – news · newspapers · books · scholar · JSTOR (March 2018) (Learn how and when to remove this template message) Melbourne Docklands urban renewal project, a transform...

 

Орден Трудового Червоного Прапора РСР Грузіїгруз. საქართველოს სსრ–ის შრომის წითელი დროშის ორდენიрос. Орден «Трудового Красного Знамени ССР Грузии» Девіз груз. პროლეტარებო ყველა ქვეყნისა, შეერთდით!(укр. Пролетарі всіх країн, єднай�...

Defunct Greek airline (2008-2019) Astra Airlines IATA ICAO Callsign A2[1] AZI[2] GREEK STAR[2] Founded2008 (2008)Commenced operationsJuly 5, 2008 (2008-07-05)AOC #GR-028[3]HubsThessaloniki International AirportFocus citiesAthens International AirportFleet size4Destinations37HeadquartersThessaloniki, GreeceKey peopleIoannis Zlatanis (Chairman)Websiteastra-airlines.gr Astra Airlines was a Greek regional airline headquartered in Thessaloni...

 

ستانلي لين بول (بالإنجليزية: Stanley Lane-Poole)‏  معلومات شخصية اسم الولادة (بالإنجليزية: Stanley Lane-Poole)‏  الميلاد 18 ديسمبر 1854(1854-12-18)لندن الوفاة 29 ديسمبر 1931 (77 سنة)لندن  مواطنة المملكة المتحدة المملكة المتحدة لبريطانيا العظمى وأيرلندا (–12 أبريل 1927)  الحياة العملية المدرسة ا�...

 
Kembali kehalaman sebelumnya