Töne sind Vibrationen der Luft, also eine Folge von Luftdruckwellen, die höher oder niedriger sind als ein durchschnittlicher Wert, der Luftdruck. Um diese Tatsache zu veranschaulichen, genügt es, ein lärmendes Objekt (ein Wecker zum Beispiel) unter eine Vakuumglocke zu stellen, dann wird man feststellen, dass das Objekt keinen Ton mehr von sich gibt, sobald es nicht mehr von Luft umgeben ist !
Die einfachste Art, Ton zu erzeugen besteht darin, ein Objekt zum schwingen zu bringen. So erzeugt eine Violine einen Ton, sobald der Bogen die Saiten in Schwingung versetzt, und ein Klavier, wenn man in die Tasten schlägt, da ein Hammer auf die Saite trifft und sie so in Schwingung versetzt.
Zur Tonwiedergabe werden in der Regel Lautsprecher verwendet. Es handelt sich dabei um eine Membran, die an einen Elektromagneten angeschlossen ist, welcher sich durch elektrische Wechselspannung sehr schnell vor und zurück bewegt und so die Luft vor ihm in Schwingung versetzt, also Ton erzeugt !
So werden Schallwellen erzeugt, die graphisch als Änderungen des Luftdrucks im Zeitablauf (oder des Stroms im Elektromagneten) dargestellt werden können. Dann erhält man eine Darstellung in der folgenden Form :
Diese Darstellung des Tons nennt man das Spektrum der Amplitudenmodulation (Modulation der Tonamplitude im Laufe der Zeit). Das Sonogramm hingegen stellt die Frequenzvariation des Tons im Laufe der Zeit dar. Anmerkung : ein Sonogramm stellt eine Grundfrequenz dar, die von höheren, harmonisch genannten Frequenzen, überlagert wird.
So lassen sich verschiedene Tonquellen unterscheiden : tiefe Töne haben niedrige Frequenzen, hohe Töne haben höhrere Frequenzen.
Um Ton am Computer verwendbar zu machen, muss man ihn in digitale Werte umwandeln, da dieser nur mit solchen Werten umgehen kann. Es geht also darum, kleine Bereiche (Samples) dieses Tons einzulesen (also die Druckunterschiede), und zwar in bestimmten Zeitintervallen. Diesen Vorgang nennt man Sampling oder die Digitalisierung des Tons. Die Zeitintervalle zwischen zwei Samples heißt Samplingrate. Um einen Ton wiederzugeben, der für das menschliche Ohr durchgehend klingt, sind Samples alle paar 100 000stel Sekunden nötig, also ist es praktischer, sich nach der Sample-Anzahl pro Sekunde zu richten, diese wird in Hertz (Hz) angegeben. Hier nun einige Beispiele für Samplingraten und die zugehörige Tonqualität :
| Samplingrate | Tonqualität |
|---|---|
| 44 100 Hz | CD-Qualität |
| 22 000 Hz | Radio-Qualität |
| 8 000 Hz | Telefon-Qualität |
Der Wert der Samplingrate, beispielsweise für eine Audio-CD, ist nicht rein willlkürlich, sondern ergibt sich aus dem Shannon-Theorem. Die Samplingfrequenz muss ausreichend groß sein, um die Form des Signals zu erhalten. Das Nyquist-Shannon Theorem besagt, dass die Samplingfrequenz mindestens so groß sein muss wie die doppelte Maximalfrequenz, die im jeweiligen Signal vorkommt. Unser Ohr nimmt Töne bis ca. 20 000 Hz wahr, also ist eine Samplingfrequenz von mindestens 40 000 Hz nötig, um eine zufriedenstellende Qualität zu erreichen Es gibt einige Standard-Samplingfrequenzen :
Jedem Sample (das einem Zeitintervall entspricht) wird ein Wert zugeordnet, der den Luftdruck zu diesem Zeitpunkt bestimmt, Ton wird also nicht mehr als kontinuierliche Kurve mit Variationen dargestellt, sondern als Wertfolge für jedes Zeitintervall :
Der Computer arbeitet mit bits, es gilt also, die Anzahl der Werte zu bestimmen, die ein Sample haben kann, dies geschieht dadurch, indem man die Anzahl der Bit festlegt, auf denen die Werte der Samples Kodiert werden.
Wählt man die zweite Darstellungsform, ist die Tonqualität erheblich besser, aber der benötigte Speicherplatz weit größer.
Weiters benötigt Sound in Stereo zwei Kanäle, auf denen individuell Ton aufgezeichnet wird, der vom linken Lautsprecher ausgegeben wird, und Ton, der vom rechten Lautsprecher ausgegeben wird.
In der Informatik wird Ton wird also von mehreren Parametern dargestellt :
Es ist einfach, die Größe einer nicht komprimierten Tonsequenz zu berechnen. Wenn man die Bitanzahl kennt, auf der ein Sample kodiert ist, kennt man auch dessen Größe (die Samplegröße entspricht der Bitanzahl...).
Um die Größe eines Kanals festzustellen, benötigt man lediglich die Samplingrate, diese liefert die
Anzahl der Samples pro Sekunde, also die Größe, die eine Sekunde Musik ausmacht. Diese
entspricht :
Samplingrate x Bitanzahl
Um also den benötigten Speicherplatz für eine Sound-Sequenz von mehreren Sekunden
festzustellen, muss man lediglich den obigen Wert mit der Sekundenanzahl multiplizieren :
Samplingrate x Bitanzahl x Sekundenanzahl
Ablschließend muss man die endgültige Größe der Sequenz mit der Anzahl der Kanäle multiplizieren
(in stereo ist sie dann doppelt so groß wie in mono...).
Die Bitgröße einer Sound-Sequenz wird also folgendermaßen berechnet :
Samplingrate x Bitanzahl x Sekundenanzahl x Anzahl der Kanäle