Was die Abtastrate über digitale Musik und ihre Soundqualität sagt
15.2.2022
Auf den ersten Blick ist die Abtastrate nur eine technische Angabe im Audio-Bereich. Doch wenn du ihre Funktionsweise verstehst, ändert sich deine Vorstellung davon, was digitale Musik überhaupt ist.
Ein Beitrag über die Abtastrate – das klingt langweilig. Auf den ersten Blick ist sie nichts weiter als eine trockene technische Angabe. Doch bei der Frage, wie sich die Abtastrate auf die Soundqualität auswirkt, habe ich bei mir selbst und anderen einiges an Halbwissen und Missverständnissen ausgemacht. Damit hängt auch eine falsche Vorstellung über das Wesen digitaler Musik zusammen: Dass digitale Musik zerstückelt ist und auch so klingt.
Die Basics
Was ist die Abtastrate überhaupt? Schauen wir uns die grafische Darstellung einer Schallwelle an. Die horizontale X-Achse ist die Zeit. Die vertikale Y-Achse ist die Amplitude – also wie laut das Signal ist. Die Tonhöhe ergibt sich aus der Wellenlänge: Bei einem hohen Ton liegen die Wellen enger beisammen. Mit anderen Worten: Beim höheren Ton wiederholt sich die Schwingung häufiger, er hat also eine höhere Frequenz.
Auch die Abtastrate wird als Frequenz angegeben. Denn sie bezeichnet die Häufigkeit, mit der auf der X-Achse die Amplitude gemessen wird. Oder anders gesagt: Mit der ein Audio-Sample genommen wird. Auf Englisch heisst die Abtastrate darum sample rate.
Die Abtastrate ist das deutlichste Unterscheidungsmerkmal zwischen analoger und digitaler Musik. Denn analoge Medien speichern ein kontinuierliches Signal, es gibt somit keine Abtastrate. Digitale Aufnahmeverfahren zeichnen in bestimmten Zeitabständen auf.
Das Missverständnis
Das klingt, als ob die analoge Musik der digitalen prinzipiell überlegen sei. Als ob die digitale Musik immer nur eine Annäherung an das analoge Original sei und daher niemals so gut werden könne. Das ist aber ein Fehlschluss.
Zum einen vergleichen wir hier nicht bloss analog und digital, sondern Originalton und Aufzeichnung. Natürlich übertrifft nichts den Originalton, und jede Aufzeichnung ist höchstens gleich gut wie das Original. Das ist aber auch bei der analogen Aufzeichnung so. Auch dort können Qualitätsverluste wie Rauschen und Verzerrungen entstehen. Prinzipiell überlegen ist nur die direkte Schallübermittlung ohne Medium – also zum Beispiel, ein live gespieltes Instrument zu hören.
Das Missverständnis entsteht wohl dadurch, dass Schallwellen analog sind. Streng genommen gibt es keine digitale Musik, nur digital gespeicherte Musik. Bei der Aufzeichnung braucht es einen Analog-Digital-Konverter, der aus den analogen Schallwellen digitale Daten erzeugt. Und bei der Wiedergabe ein Digital-Analog-Konverter, der das Umgekehrte tut.
Das Tonsignal muss immer umgewandelt werden – auch bei einer analogen Aufzeichnung. Und bei der Wiedergabe muss aus dem gespeicherten Medium wieder Ton entstehen. Ein Lautsprecher wandelt ein elektrisches Signal in mechanische Bewegung um.
Hinzu kommt, dass die Tonstudios schon Ende der 70er-Jahre angefangen haben, digital aufzunehmen. Das bedeutet, dass auch beim Kauf einer Schallplatte eine Umwandlung von analog zu digital und wieder zurück zu analog stattgefunden hat.
Es gibt aber noch eine viel häufigere Fehlannahme über digitale Musik. Und auch die hat mit der Abtastrate zu tun.
Digital bedeutet nicht Treppenstufen
Durch die Messung in regelmässigen Abständen entstehen also einzelne Punkte im Schallkurven-Diagramm. Daraus muss beim Abspielen eine echte Schallkurve erzeugt werden. Hier nehmen viele Analog-Fans fälschlicherweise an, dass diese Schallkurve so aussieht:
Oder gar so:
Doch das ist nicht der Fall. Die aus den digitalen Daten erzeugte Schallkurve sieht ungefähr so aus. Eine aus digitalen Daten erzeugte Schallkurve ist genauso rund wie eine analoge.
Anders ausgedrückt: Die Zerstückelung in digitale Einzeldaten lässt sich bei der Umwandlung in reale Schallwellen vollständig rückgängig machen. Magie? Nein, eher Mathematik. Kurven sind mathematische Funktionen. Es braucht dafür jedoch eine Mindestmenge an Messpunkten, also eine minimale Abtastrate. Und hier kommt das Nyquist-Shannon-Theorem ins Spiel.
Das Nyquist-Shannon-Theorem
Das Theorem besagt, dass sich bei einer genug hohen Abtastrate eine Schallkurve rekonstruieren lässt, die mit dem analogen Original vollkommen identisch ist. Und es sagt auch, wie hoch die Abtastrate sein muss: Nämlich doppelt so hoch wie die höchste Frequenz, die gesampelt werden soll.
Das bekannteste Beispiel dazu: Die Audio-CD hat eine Abtastrate von 44100 Hz, also 44,1 kHz. Es liegen für jede Sekunde 44 100 Samples vor. Damit können laut dem Nyquist-Theorem Frequenzen bis 22 050 Hz perfekt rekonstruiert werden. Das würde locker ausreichen, denn kein Mensch hört höhere Frequenzen – die meisten Erwachsenen hören schon bei über 15 000 Hz nichts mehr.
Das Theorem gilt aber nur unter einer wichtigen Einschränkung: Nämlich, dass alle Frequenzen über 22 050 Hz herausgefiltert werden. Das siehst du in der folgenden Grafik. Die schwarzen Punkte sind die Samples. Durch diese Samples verlaufen zwei Kurven mit unterschiedlichen Frequenzen. Da die Samples für beide Kurven passen, ist zunächst unklar, welches die korrekte Frequenz ist.
Doch die rote Kurve hat eine höhere Frequenz als die gestrichelte schwarze. Wenn die Frequenz der roten Kurve über der Hälfte der Abtastrate liegt, wird sie herausgefiltert, und wir haben Eindeutigkeit.
Das ist kein Zufall. Es ist nicht möglich, eine passende Kurve in die Punkte zu zeichnen, die eine tiefere Frequenz hat als die der roten Kurve. Genau das sagt das Nyquist-Shannon-Theorem.
Überabtastung
Das Nyquist-Theorem selbst gilt als unstrittig. Trotzdem gibt es Digital-Analog-Konverter, die ein Vielfaches der CD-Abtastrate aufweisen. Ist das unnötig? Rattenfängerei gar?
Nicht unbedingt. Der Punkt ist: Das Nyquist-Theorem sagt nur, dass die hohen Frequenzen herausgefiltert werden müssen. Es sagt aber nicht, wie das geschehen soll. Tatsächlich ist es bis heute nicht möglich, alles ab einer bestimmten Frequenz perfekt herauszufiltern.
Bei einer Abtastrate von 44,1 kHz braucht es einen Tiefpassfilter, der bis 20 kHz möglichst gar nichts filtert, ab 22,05 kHz jedoch alles. Es steht also nur ein schmaler Frequenzbereich als Übergang zur Verfügung. Wird das Signal nicht perfekt gefiltert, kann es passieren, dass die Schallwelle nach links gespiegelt wird – es entsteht eine Art Pre-Echo.
Mit einer hohen Abtastrate vergrössert sich dieser Übergangsbereich und der Effekt lässt sich besser vermeiden. Im Tonstudio sind hohe Abtastraten schon lange üblich. Bei der Wiedergabe sind sie dagegen relativ neu.
Fazit
Dass digitale Musik aus einzelnen Samples anstelle einer kontinuierlichen Speicherung besteht, ist kein Nachteil. Aus den Samples lassen sich Schallwellen rekonstruieren, die vom Original nicht zu unterscheiden sind. In der Theorie reicht dafür eine doppelt so hohe Abtastrate wie die höchste Frequenz aus. In der Praxis ist die Rekonstruktion damit nicht perfekt, weil es keine perfekten Tiefpassfilter gibt. Mit einer höheren Abtastrate können Aufnahme- und Wiedergabegeräte noch besser filtern.
Die Frage ist, ob diese Verbesserungen überhaupt nötig sind, sprich, ob der Unterschied hörbar ist. Selbst unter Experten gehen da die Meinungen auseinander. Klar ist, dass auch 44,1 kHz und 48 kHz eine gute Qualität liefern. Wenn es schlecht klingt, kann das an allem Möglichen liegen, von der Aufnahme bis zu den Lautsprechern. Die Abtastrate stellt hier höchstens ein Problem dar, wenn alles andere auf absolutem Top-Level ist.
David Lee
Senior Editor
David.Lee@digitecgalaxus.chDurch Interesse an IT und Schreiben bin ich schon früh (2000) im Tech-Journalismus gelandet. Mich interessiert, wie man Technik benutzen kann, ohne selbst benutzt zu werden. Meine Freizeit ver(sch)wende ich am liebsten fürs Musikmachen, wo ich mässiges Talent mit übermässiger Begeisterung kompensiere.