Videos schrumpfen
Know How: MPEG-Grundlagen
Burkhard Müller
4:4:4-Abtastung wird von den Filmstudios verwendet, um ein verlustfreies Postprocessing zu gewährleisten. 4:2:0 wird für DVD-Video als ausreichend erachtet.
Bei der MPG-Komprimierung werden die drei Komponentensignale als Flächen nacheinander verarbeitet. Unter Fläche ist dabei ein 8x8 Pixel größer Block zu verstehen.
Zuerst wird der Y-Anteil komprimiert, danach die Cb und Cr-Anteile. 4:2:0 ist ein planarer Farbraum, RGB dagegen ist "interleaved": Zuerst wird der Rotanteil des ersten Bildpunktes übertragen, danach seine G- und B-Werte. Dann folgt der R-Wert des zweiten Pixels, danach seine G- und B-Werte und so weiter. Informationen in planaren Farbräume lassen sich besser komprimieren.
MPG-Kompression
Die Komprimierung MPG-codierter Filme beruht auf dem verwendeten Farbmodell, vor allem aber auf der speziellen Komprimierung der Einzelbilder. I-Frames werden wie JPEG-Bilder komprimiert - die folgenden Abschnitte enthalten eine nicht sehr exakte mathematische Beschreibung dieser Kompression.
Diskrete Consinus-Transformation
Die diskrete Cosinus-Transformation (DCT) stellt zusammen mit der Quantisierung das Herzstück der MPEG-Kompression dar. Die Kompression erfolgt im YCbCr-Farbraum auf Basis von 8x8 Pixel großen Blöcken. Jede der drei Farbebenen wird in Blöcke dieser Größe ausgeteilt und einzeln komprimiert. Ist die Auflösung nicht durch 8 teilbar, werden entsprechend viele Nullpixel hinzugefügt. Die folgenden Erläuterungen beziehen sich auf die 4:2:0-Abtastung, gelten aber sind gemäß für alle anderen Varianten.
Aufgrund der Eigenschaft der 4:2:0-Abtastung werden immer vier Y-Bildpunkte gleichzeitig komprimiert, dazu kommen zwei Ebenen mit Chrominanz-Informationen zu je einem Block:
Die drei Ebenen der 4:2.0-Abtastung.
Die DCT überführt Bildpunkte vom Ortsraum in den Frequenzraum. Dort lassen sie sich leicht manipulieren, das heißt es werden nur "wichtige" Frequenzen beibehalten, alle "unwichtigen" werden entfernt. Schließlich werden sie wieder mittels inverser DCT (iDCT) in den Ortsraum zurück transformiert und ergeben dort wieder das Bild - allerdings nun erheblich kleiner und je nach Quantisierung mehr oder weniger stark verlustbehaftet.
Die Transformation in den Frequenzraum ist ein Trick, der das Auge überlisten soll: Feine Strukturen löst das Auge zum Beispiel nicht so gut auf. Solche Strukturen entsprechen höheren Frequenzen, die man zum Beispiel einfach weglässt oder zu Null quantisiert. Dadurch verringert sich zwar die Datenmenge, diese Art der Transformation ist aber verlustbehaftet - aus dem transformierten Bild lässt sich das Original-Bild nicht mehr zurückgewinnen.
Zunächst die Formel für die eindimensionale DCT. Angenommen man hat eine Folge von 8 Bildpunkten, dann errechnen sich daraus die 8 DCT-Koeffizienten mit folgender Formel:
Die Formel für die eindimensionale DCT.
Diese Gleichung berechnet jeden der 8 DCT-Koeffizienten, wobei in jeden Koeffizienten jeder der 8 Bildpunkte eingeht: Der DCT-Koeffizient für einen Bildpunkt wird durch benachbarte Punkte beeinflusst oder anders herum ausgedrückt: Alle 8 Bildpunkte gehen in die Berechnung eines jeden DCT-Koeffizienten ein.
« zurück 5 | 6 | 7 | 8 | 9 weiter »
Mehr über: Software, Videosoftware, Hintergrundwissen, MPEG
-
How To: MPEG4-Filme mit Nero Recode 2 komprimieren
Schnellster MPEG4-Encoder -
Anleitung: Analoges Capturing
Von VHS auf DVD -
H.264: Das Videoformat für höchste Ansprüche
Das Format für Blu-ray, HD DVD und HDTV
Know How: MPEG-Grundlagen von netzwelt.de steht unter einer Creative Commons-Lizenz. Sie dürfen die Texte für nicht-kommerzielle Zwecke nutzen, bei Angabe und Verlinkung der Quelle "netzwelt.de".
Klicken Sie hier für weitere Informationen
nach oben











