Prinzip von MP3 und Grundlagen
Wie lassen sich große Datenmengen von Video- und Audiodateien im MP3-Format platzsparend speichern?
Grundlagen
MP3 ist eine Abkürzung von MPEG Audio Layer 3, wobei MPEG für Moving Picture Experts Group steht, die 1988 gegründet wurde, um einen Standard für die effiziente Kodierungvon Videocodes zu entwickeln. MP3 basiert auf dem Prinzip, dass nur der Anteil von einem Musikstück gespeichert werden muss, den das menschliche Ohr auch hören kann. Dies mag auf den ersten Blick ein wenig überraschend klingen. Hören wir denn nicht alles, was in einem Musikstück enthalten ist? Tatsächlich ist das menschliche Ohr nicht in der Lage, alle Details, die in einem Musikstück enthalten sind, wahrzunehmen.
Einführung
Zur Einführung in das Thema eignet sich das Zeigen der Audio-Video-Datei audio_video_kompression.avi. Hier wird gleichzeitig an einem visuellen und auditiven Beispiel demonstriert, wie sich die Qualität von Bildern und Musik verändert, wenn man die zugehörigen Dateien immer weiter komprimiert. Bei der Datenkompression bleibt die Qualität für die menschliche Wahrnehmung zunächst erhalten und man spart große Mengen Speicherplatz. Irgendwann werden jedoch die Qualitätsverluste bemerkbar. Komprimiert man dann immer noch weiter, so verschlechtert sich die Qualität dramatisch.
Download
- audio_video_kompression.avi
Die Datei zeigt die Qualitätsveränderung von Musik und Bildern bei fortschreitender Datenkompression. Die Ladezeiten können aufgrund der Dateigröße etwas dauern.
Im Classroom-Manager speichern
Schall
Wieso können wir überhaupt das hören, was jemand sagt, der einige Meter von uns entfernt ist? Der Grund hierfür ist das physikalische Phänomen des Schalls. Schall entsteht, weil die Moleküle eines Mediums (zum Beispiel Luft) zum Schwingen gebracht werden. Dadurch stoßen sie an benachbarte Moleküle, bringen auch diese ins Schwingen und so weiter. Abb. 1 (bitte anklicken) zeigt eine Animation der Molekülbewegungen.
Solch eine (mechanische) Schwingung breitet sich in festen, flüssigen oder gasförmigen Stoffen wellenförmig aus. Schall breitet sich als sogenannte Longitudinalwellen aus, also immer parallel zur Ausbreitungsrichtung. Die Animation in Abb. 2 (bitte anklicken) verdeutlicht dies.
Tonhöhe
Entsteht ein Ton dadurch, dass eine Gruppe von Molekülen ganz regelmäßig hin und her schwingt, beispielsweise 400 mal pro Sekunde, so sagen wir auch, der Ton hat eine Frequenz von 400 Hertz, das heisst die Schwingung erfolgt 400 mal pro Sekunde. Das menschliche Ohr kann nur Töne wahrnehmen, die zwischen etwa 16 und 20.000 Hertz liegen.
Wellenlänge, Frequenz und Schallgeschwindigkeit
Ist c die Schallgeschwindigkeit in einem Medium, f die Frequenz einer Schallwelle (das heißt einer sich wellenförmig ausbreitenden Schwingung) und λ (sprich lambda) die Wellenlänge, so gilt
c = λ * f
Sind zwei dieser drei Größen bekannt, so kann man die dritte hiermit berechnen.
Lautstärke
Je weiter die Moleküle in der Luft hin und her schwingen, desto lauter ist der Ton. Die Lautstärke beschreibt also den Unterschied zwischen Berg und Tal der Schwingung.
Geräusche
Geräusche haben keine exakt bestimmbare Tonhöhe mehr. Sie sind nichtperiodische
Schallereignisse, die durch Überlagerungen vieler Schwingungen unterschiedlicher
Frequenz mit rasch wechselnder Amplitude entstehen. Mit anderen Worten: "Der Unterschied von Ton/Klang zu Geräusch ist in der Regelmäßigkeit der Schwingung zu finden. Bei einem Geräusch ist die Schwingbewegung der Luft sehr ungleichmäßig, bei Tönen dagegen handelt es sich um immer wiederkehrende gleichförmige Luftbewegungen".
Weiterlesen
- Was hört das menschliche Ohr - und was nicht?
Die Grenzen des menschlichen Gehörs und welche Rolle dabei der verdeckende Schall und der verdeckte Schall spielen.
- Prinzip der Multiskalenanalyse
Zerlegt man musikalische Töne in ihre Einzelfrequenzen, müssen ganz unterschiedliche Frequenz-Skalen betrachtet werden.
- Multiskalenanalyse mithilfe von Rechteckschwingungen
Tonsignale lassen sich auch in Rechteckschwingungen zerlegen, deren Skala zunehmend gröber wird.
- Huffman-Codierung
Um in MP3 die verbliebenen Informationen effizient abzuspeichern, nutzt man die Huffman-Codierung.