Die harmonische Abmischung des Soundtracks ist eine diffizile Sache. Er soll gut klingen, Sprache und Dialoge gut verständlich sein, Geräusche, Atmosphäre und manchmal auch dramatische Effekte vermitteln. Die Dynamik muss sinnvoll eingesetzt sein - das zarte Zwitschern eines Vogels sollte sich in der Lautstärke vom Donnerschlag eines Gewitters deutlich unterscheiden. Leider gibt es genügend Beispiele, bei denen Lautstärke und Dynamik fragwürdig gestaltet sind. Ein häufiges Ärgernis ist der TV-Ton, der zwischen den Sendern und insbesondere zwischen TV-Programm und Werbung erhebliche Unterschiede in der Lautstärke aufweist, frei nach dem Motto "laut gewinnt". Oder vielleicht kennen Sie die Situation, wenn Sie eigene, unkomprimierte Aufnahmen mit Musik von der Konserve mischen möchten - die eigenen Aufnahmen sind viel zu leise, obwohl sie schon auf null dB und damit maximal ausgesteuert sind.
Mit Hilfe des K-Systems bekommen Sie solche Probleme in den Griff und erhalten außerdem die Möglichkeit, die Dynamik Ihres Soundtracks maßgeschneidert zu gestalten. Das K-System bietet Ihnen folgende Vorteile:
Die lautheitsbezogene Messung des Audiopegels (RMS, 600 ms Zeitfenster) hilft bei der harmonischen Aussteuerung des Soundtracks.
Eine große Aussteuerungsreserve (Headroom) bietet viel Freiraum zur Gestaltung der Dynamik.
Die definierte Abhörlautstärke ermöglicht eine klanglich reproduzierbare Beurteilung des Soundtracks.
Wenn AV-Shows nach dem K-System abgemischt sind, gibt es bei der Präsentation verschiedener Shows praktisch keine Lautstärkesprünge mehr.
Das K-System wurde im Jahr 2000 vom amerikanischen Toningenieur Bob Katz vorgestellt. Seine Ideen sind inzwischen in die Norm ITU-R BS.1770 zur Lautheitsmessung eingeflossen. Die Website von Bob Katz finden Sie unter http://www.digido.com.
Um das K-System zu verstehen, schauen wir uns in diesem Thema einige Grundlagen an:
Der Einsatzzweck einer AV-Show bzw. der Ort der Vorführung mit seinen Umgebungsgeräuschen hat Einfluss auf die mögliche Dynamik. Beispielsweise können wir im Kino eine viel größere Dynamik realisieren als bei einem Unterhaltungsprogramm im Auto oder Flugzeug, weil die Umgebungsgeräusche im Kino viel geringer sind. Auch die Raumgröße spielt bei der Wiedergabe dynamischer Audioprogramme eine Rolle. Die linke Grafik zeigt, welche Dynamik die Zuschauer in unterschiedlichen Hörsituationen wahrnehmen können bzw. welche Dynamik als angenehm akzeptiert wird.
Wird der Spitzenpegel der unterschiedlichen Audioprogramme auf null dB FS (Full Scale) normalisiert, also die höchst mögliche Aussteuerung, ergibt sich bei Audioprogrammen mit geringer Dynamik eine höhere Lautstärke als bei Audioprogrammen mit größerer Dynamik, was in der rechten Grafik deutlich wird. Dies ist auch der Grund, warum extrem komprimierte Werbung so laut und eine unbearbeitete Sprachaufnahme so leise ist. Die Aufnahmen besitzen eine unterschiedliche Lautheit, die bisher bei der Aussteuerung nach dem Spitzenpegel unberücksichtigt blieb.
Hinweis: Aus der obenstehenden Grafik geht nicht hervor, dass die Lautstärketoleranz nicht nur von der Hörsituation, sondern auch vom Alter der Rezipienten abhängig ist. Bei Menschen ab etwa 50 Jahren wird sie zunehmend geringer. Ein Soundtrack mit sehr großer Dynamik bereitet älteren Zuschauern also Probleme, weil sie leise Dialoge nicht verstehen und laute Effekte als unangenehm und teilweise sogar als schmerzhaft empfinden.
Im K-System gibt es drei verschiedene Skalen für die Pegelmessung, die einen unterschiedlichen Headroom vorsehen:
K-20 ...mit 20 dB Headroom für hohe Dynamik im großen Kino, 0 dB K-Skala entspricht -20 dB FS
K-14 ...mit 14 dB Headroom für Heimkino und Wohnzimmer, 0 dB K-Skala entspricht -14 dB FS
K-12 ...mit 12 dB Headroom für Rundfunk und lautere Umgebungen wie Kaufhäuser, Messen etc., 0 dB K-Skala entspricht -12 dB FS
Die Null-dB-Marke ist in den Skalen des K-Systems also verschoben, so dass sich der entsprechende Headroom ergibt. Außerdem erfolgt die Aussteuerung nicht anhand des Spitzenpegels, sondern anhand des RMS-Pegels. Der RMS-Pegel im K-System ist der Durchschnittswert eines Zeitfensters von 600 Millisekunden mit definierten An- und Abstiegszeiten der Anzeige, wodurch er einen sehr engen Bezug zur empfundenen Lautstärke hat. Der Peak-Level ist nur noch dann wichtig, wenn er null dB FS überschreitet, und daher reicht eine Übersteuerungsanzeige aus (Overload). Sie steuern Ihren Soundtrack im K-System lautheitsbezogen aus, was Lautstärkesprünge vermeidet, und haben durch den Headroom viel Spielraum für akzentuierte Effekte.
Das K-System geht von kontrollierten Wiedergabe- und Abhörbedingungen aus. Die Abhörlautstärke bei null dB in der K-Skala ist mit 83 dBC SPL (Sound Pressure Level, Bewertung C)) definiert. Der Grund ist die lautstärkeabhängige Wahrnehmung unterschiedlicher Frequenzen durch den Menschen. Wir hören tiefe und hohe Frequenzen weniger laut als mittlere Frequenzen. Diese Tendenz ist bei geringen Schalldruckpegeln stärker ausgeprägt als bei hohen, wie das Diagramm "Hörkurven gleicher Lautheit" unten verdeutlicht. Die Kurven zeigen, wie hoch der Schalldruck bei jeweiligen Frequenz sein muss, um die gleiche Lautheit wie bei 1000 Hz zu empfinden.
In mehreren Studien hat man anhand verschiedenster Audiobeispiele untersucht, bei welchem Schalldruck wir die unterschiedlichen Frequenzen am ausgewogensten wahrnehmen können. Die Mehrzahl der Probanden konnte dies bei 85 dB SPL. Um möglichst einheitliche und ausgewogene Abhörbedingungen zu schaffen, wurde daher die Abhörlautstärke beim K-System folgendermaßen definiert:
83 dBC SPL = 0 dB RMS in der K-Skala
Bei der Kalibration der Lautstärke am Abhörplatz wird Rosa Rauschen mit einem Pegel von null dB RMS in der K-Skala über einen Lautsprecher wiedergegeben. Mit einem Schallpegelmesser, bei dem die Bewertung auf "C" und die Anzeigeberuhigung auf "Slow" eingestellt sind, wird der Schallpegel gemessen. Am Mixer oder Verstärker stellt man die Lautstärke am Hörplatz so ein, dass der Schallpegelmesser 83 dBC SPL anzeigt. Diese Messung wird für alle Lautsprecher wiederholt. Es gibt für Wings Vioso RX das Projekt K-System kalibrieren, mit dem Sie die Kalibration Ihres Wiedergabesystems vornehmen können. An Ihrem Mixer oder Verstärker sollten Sie den Lautstärkeregler mit Markierungen für K-20, K-14 und K-12 versehen, siehe Abhöranlage für K-System kalibrieren.
Hinweis: Neben dem definierten Abhörpegel spielen die Qualität der Abhöranlage und des Abhörraums eine außerordentlich wichtige Rolle. Die Audioanlage sollte neutral klingen und pegelfest sein. Der Raum sollte für Stereo mindestens 30 m² und für Surround mindestens 40 m² groß sein und akustisch bestimmten Anforderungen entsprechen. Abhörräume im Kinobereich sind Dolby- oder THX-zertifiziert und oft über hundert Quadratmeter groß. Der VDT (Verband Deutscher Tonmeister) hat alle Aspekte der Abhörbedingungen im PDF „Hörbedingungen und Wiedergabeanordnungen für Mehrkanal-Stereofonie in Studio und Heim“ zusammengefasst, siehe www.tonmeister.de.
Das sogenannte Nahfeldmonitoring reduziert die Raumeinflüsse und ist zur Analyse von diffizilen Fehlern gut geeignet, aber zur Beurteilung von Dynamik und Lautheit eines Soundtracks ist es eher eine Notlösung, wenn der verfügbare Raum akustisch Probleme bereitet. Es ist jedoch denkbar, den Soundtrack zunächst unter weniger idealen Bedingungen vorzubereiten und dann in einem zertifizierten Abhörraum final abzumischen.
Sie können das K-System in den Globalen Optionen unter Audio-Pegel aktivieren und haben die Wahl zwischen K-12, K-14 und K-20. Daraufhin werden folgende Dinge in Wings Vioso RX geändert:
In der Aussteuerungsanzeige erscheinen zusätzliche Balken für den RMS-Pegel, die entsprechend der gewählten K-Skala beschriftet sind.
Die Anzeige des Spitzenpegels (Peak) ist weiterhin vorhanden, wird aber grau dargestellt. Wenn 0 dB FS überschritten wird, erscheint eine Übersteuerungswarnung in Form von gelben Balken.
Wenn Audiodateien vom Media-Pool in die Timeline gezogen werden, wird der Lautstärkepegel der Objekte entsprechend der gewählten K-Skala um 12 dB, 14 dB oder 20 dB abgesenkt. Diese Voreinstellung sorgt dafür, dass der Ton beim ersten Abspielen nicht zu laut wiedergegeben wird.
Die Lautstärke für das Vorhören über die Registerkarte Preview und beim Importieren von Musikstücken einer Audio-CD ist ebenfalls entsprechend der gewählten K-Skala um 12 dB, 14 dB oder 20 dB abgesenkt, weil sie sonst viel zu laut wäre.
Bei der Anwendung des K-Systems sollten Sie folgenden Hinweise beachten:
Wenn Sie Wings Vioso RX auf das K-System eingestellt haben und Ihr Abhörsystem kalibrieren wollen, achten Sie darauf, dass die Lautstärkeregler in Windows oder in relevanten Dialogen der Soundkarte auf volle Lautstärke eingestellt sind. Nach der Kalibration müssen die Lautstärkeregler so bleiben. Auch die Eingangsverstärkung am Mischpult darf nach dem Kalibrieren nicht mehr verstellt werden.
Die Aussteuerung mit Hilfe des RMS-Pegels und der K-Skala in Wings Vioso RX ist bereits ein gutes Maß für die Lautheit und zur Orientierung sehr hilfreich. Die letzte Instanz für die Beurteilung des Soundtracks in Bezug auf Lautstärke und Dynamik ist jedoch Ihr Gehör.
Beim RMS-Pegel wird ein größeres Zeitfenster bewertet, das vor dem Locator liegt. Daher schlägt die RMS-Pegelanzeige schon vor einem Tonobjekt aus, was in diesem Zusammenhang völlig normal ist.
Folgende Empfehlungen für die Aussteuerung der verschiedener Elemente eines Soundtracks können Sie als Anhaltspunkte betrachten:
Sprache ... -18 dB bis -12 dB RMS
leise Musik ... -20 dB bis -12 dB RMS
laute Musik ... -10 dB bis +2 dB RMS
laute Soundeffekte ... 0 dB bis +14 dB RMS
Wenn Sie künftig Ihre Shows als Video oder Exe-Präsentation exportieren, kennzeichnen Sie im Namen der Datei die Verwendung des K-Systems, also z. B. Abenteuer Brasilien K-14.wmv. Bei der Wiedergabe auf einer Veranstaltung weiß der Vorführer dann sofort, welche Lautstärke er einstellen muss.
Der definierte Abhörpegel von 83 dB SPL ergibt bei Stereo je nach Korrelation der Signale 86 dB SPL oder mehr. Nach den Vorschriften des Gesetzgebers ist der Abhörplatz bei diesem Schalldruck schon ein Lärmarbeitsplatz. Abmischen in dieser Lautstärke sollten Sie nur zwei bis drei Stunden und sich dann eine längere Pause gönnen.
Wenn der Abhörraum zu klein ist oder Ihnen 83 dB SPL auf Dauer zu laut sind, sollten Sie sich für eine andere Abhörlautstärke entscheiden. Die gefundene Lautstärkeeinstellung sollten Sie am Verstärker oder Mixer markieren. Messen Sie mit einem Schallpegelmesser auch, um wie viel Ihre Referenzlautstärke von 83 dB SPL abweicht, damit Sie diese Lautstärke künftig reproduzierbar einstellen und kontrollieren können. Sie sollten in solchen Fällen den Soundtrack final in einem größeren, zertifizierten Abhörraum kontrollieren und ggf. korrigieren. Bei Festinstallationen empfiehlt es sich, den Soundtrack vor Ort zu optimieren.
Wenn Sie beispielsweise mit K-20 arbeiten, können Pegelspitzen mit bis zu 103 dB SPL auftreten (83 dB + 20 dB Headroom). Ihre Lautsprecheranlage sollte solche Pegel verzerrungsfrei wiedergeben können. Da der Schallpegel von Lautsprechern bei einem Meter Abstand gemessen wird, müssen die angegebenen Werte des möglichen Spitzenpegels für die Wiedergabe in großen Sälen deutlich über 103 dB SPL liegen.
Bei der Wahl von beispielsweise K-20 und einer Abhörlautstärke von 83 dB SPL werden leider Brummen und Rauschen schlechter oder fehlerhafter Anlagen deutlicher hörbar.
Da bei einem großen Headroom das Quantisierungsraster nicht so gut ausgenutzt wird, sollten Sie für die Ausgabe möglichst 24 Bit wählen, sofern Ihre Soundkarte dies unterstützt. Rein theoretisch gewinnen Sie bei 24 Bit Ausgabe 48 dB gegenüber 16 Bit, denn 0 dB FS bei 16 Bit entsprechen minus 48 dB FS bei 24 Bit Quantisierung. Allerdings schaffen selbst gute 24-Bit DA-Wandler "nur" einen Geräuschspannungsabstand von etwa 115 bis 120 dB A , was aber immerhin einen Gewinn von 20 bis 25 dB gegenüber guten 16 Bit DA-Wandlern bedeutet.