Nachgesprochene oder zusätzliche Stimmen über Bildton — im Mix mehrere Spuren übereinander für Kommentar, Gedanken oder Ambient Voices. Erfordert saubere Isolation im Studio.
Beim Übersprechen stapelst du mehrere Ton-Layer übereinander — eine Technik, die im Schnitt und im finalen Mix entscheidend wird. Du hast da nicht einfach eine Stimme über dem Bild, sondern mehrere gleichzeitig: Gedankentext eines Charakters, dokumentarischer Kommentar, Ambient Voices aus einer Menschenmenge, die separat aufgenommen wurden. Jede Spur läuft isoliert, wird einzeln gemischt und dann im finalen Stem zusammengefasst. Das funktioniert nur, wenn jede Stimme sauber aufgenommen ist — ohne Raum-Überträge, ohne Störgeräusche, die sich überlagern.
Die größte Herausforderung liegt im Studio-Setup. Du brauchst eine völlig trockene Akustik für jede Aufnahme, damit sich später keine diffusen Raumtöne addieren und zu matschiger Suppe werden. Viele Projekte machen hier den Fehler: Sie nehmen alle Stimmen nacheinander in dasselbe Studio auf und wundern sich, warum der Mix später klingt wie ein Cocktailparty-Effekt. Besser: mehrere Tage mit verschiedenen Sprechern in unterschiedlichen Räumen arbeiten, oder zumindest die Abstände zur Wand variieren. So bekommst du akustische Unterschiedlichkeit, die nachher Tiefe ins Gesamtbild bringt. Im Mix vermeidest du dann, dass alles flach und verschwommen wirkt.
Praktisch heißt das im Schnitt: Jede Voice-over-Spur bekommt ihren eigenen Track. Du schneidest sie unabhängig, positionierst Pausen, variierst die Lautstärke-Envelope für Dramatik oder Fokus. Bei einem Gedankenstrom-Layer etwa: leiser setzen, wenn visuelle Action dominiert; hochfahren, wenn Bild-Ruhe Zeit für Innerlichkeit schafft. Der dokumentarische Kommentar sitzt oft höher im Mix, weil er primär Information trägt. Ambient Voices — eine gemurmelnd Menschenmasse hinter einer Szene — legst du subtil unten, als Präsenz-Layer. Im finalen Stem-Mix werden alle Spuren dann zu einer Voice-over-Stem zusammengefasst, die der Dub-Mix eins-zu-eins übernimmt.
Ein Beispiel aus der Praxis: Eine Dokumentation über einen Detektiv. Du hast seinen Gedanken-Voice-over, den Erzähler-Kommentar einer dritten Person, und im Hintergrund leise Funktion-Geräusche aus einem Polizei-Office — alle drei Schichten übereinander. Jede hat ihre Räumlichkeit, ihre Tiefe, aber keine konkurriert mit der anderen um Platz. Das erreichst du nur durch konsequente Isolation beim Sprechen und intelligente Panning-, Reverb- und EQ-Gestaltung im Dub. Faule Aufnahmen ohne Raum-Kontrolle sorgen dafür, dass drei Stimmen später wie eine dreckige, unverständliche Suppe klingen.