Sünden beim Audio-Einsatz – und wieso KI (noch) hinkt

Als E-Learning-Anbieterin aus der Schweiz ist Qualität unser oberstes Gebot. Dazu zählt auch der gezielte Einsatz von Audios in unseren Lernangeboten. Erzählstimmen machen Web-based Trainings (WBT) lebendiger und abwechslungsreicher. Weitere Gründe, die für den Einsatz von Audios sprechen, haben wir in diesem Beitrag genannt. Will man ihren methodischen Nutzen ausschöpfen, muss der Einsatz gezielt und überlegt sein. Wie man es (nicht) machen sollte, erfahren Sie in diesem Beitrag.

somedia learning rene oberholzer

Autor: René Oberholzer; Konzepter, Autor, Projektleiter
Datum: 5. Februar 2024
Lesedauer: 4 Minuten

Audios in WBT: so besser nicht!

Man kann die Vorteile von Tonspuren in WBTs auch leichtfertig verschenken. Schauen wir uns einige klassische Fehler an:

Möglichst viel vertonen

Wenn Audio so nachvollziehbare Vorteile hat: wieso nicht so viel wie möglich davon? Stellen Sie sich ein Web-based Training vor, in dem jeglicher Text auditiv vermittelt wird. Es würde innert kürzester Zeit langweilig und ermüdend – wir vergeben dadurch das Potenzial als Aufmerksamkeitsfänger.

Geschriebenen Text vorlesen lassen

Eins der Prinzipien des Lernens mit Multimedia besagt: Präsentiere denselben Text nicht gleichzeitig in schriftlicher und gesprochener Form. Warum? Die meisten Menschen lesen entweder schneller oder langsamer als der Sprechtext. Lernende müssen dann entscheiden, worauf sie sich konzentrieren wollen: Schrift oder Ton. Den anderen Kanal müssen sie aktiv ignorieren. Das zieht kognitive Ressourcen ab und stört bei der Aufnahme des Inhalts. Deshalb: wenn schon Schrift zum Sprechtext, dann nur in Form von Stichworten.

Probieren Sie es aus: Starten Sie den Audio-Clip und lesen Sie gleichzeitig den obigen Absatz in Ihrer normalen Lesegeschwindigkeit:

Deshalb: wenn schon Schrift zum Sprechtext, dann nur in Form von Stichworten.

Natürlich spricht im Sinne der Barrierefreiheit nichts dagegen, Sprechtext auch in schriftlicher Form anzubieten – fakultativ zuschaltbar.

Komplizierte Fachsprache

Einfache Sprache ist oft die am schwierigsten durchzusetzende Anforderung, wenn wir Texte von Kundinnen oder Kunden erhalten. Warum ist sie insbesondere bei Audiospuren so wichtig? Bei schriftlichen Texten können unsere Augen in Sekundenbruchteilen zu früheren Textstellen zurückspringen, wenn wir den Faden verloren oder etwas nicht verstanden haben. Bei Tonspuren ist das deutlich umständlicher.

Deshalb: Wenn gesprochener Text, dann in leicht verständlicher und natürlicher Sprache. Ein No-Go sind beispielsweise Klammerausdrücke.

Aufdringliche Hintergrundmusik

Wir kennen das von schlechten YouTube-Videos: unpassender Techno-Beat zur Produktvorstellung oder Zumba-Sound zum Info-Clip über Burnout-Prävention.

In Erklärvideos kommt oft Hintergrundmusik zum Einsatz, doch sie sollte dem Inhalt angemesssen sein und ihre Lautstärke während des Sprechtextes ausreichend zurückgenommen werden.

In WBTs kann man aber getrost auf das Hintergrundgedöns verzichten.

Ist Künstliche Intelligenz für Vertonungen eine Option?

Zugegeben: Eine professionelle Vertonung kostet etwas. Sie trägt aber ganz wesentlich dazu bei, dass die Nutzer:innen das Angebot als seriös empfinden.

Maschinenstimmen waren bis vor Kurzem selten eine Lösung, denn sie hatten ihren Namen verdient. Kann Künstliche Intelligenz hier unterdessen bessere Resultate liefern? Unsere Erfahrung: Ja, aber …  

Bei einfachen, informativen Texten ohne fremdsprachige Einschübe liefern KI-basierte Programme recht ansprechende Resultate. An ihre Grenzen stossen sie in folgenden Fällen:

Wenn besondere Modulation oder Emotionen gefordert sind:
KI versteht und empfindet den Text nicht, den sie vertont. Zwar bieten die meisten KI-Dienste grundlegende Einflussmöglichkeiten auf Sprechgeschwindigkeit, Lautstärke oder Tonhöhe. Nur wenige sehen aber spezifische Emotionen vor, und diese Plattformen sind keine Gratisangebote.

Wenn Sprachen gemischt werden:
KI-Stimmen beherrschen – abgesehen von Englisch als «Zweitsprache» – meist nur die gewählte Sprache. Ein Satz wie «Als Aufsichtsbehörde wirkt die französische Autorité de Contrôle Prudentiel et de la Résolution.» wird aktuell noch zum sprachlichen Debakel.

Ein Beispiel für Betonungen, die leicht neben der Spur liegen, bietet übrigens das Audio zur Grafik im ersten Teil dieses Blog-Artikels. Bestimmt würden Sie an der einen oder anderen Stelle eine etwas andere Betonung erwarten.

Sechs Tipps, wie Sie Audio gekonnt einsetzen

  1. Gezielt & dosiert: bei Begrüssung und Verabschiedung der User, Kapitel-Einleitungen, Einleitungen von Fallbeispielen und Szenarios, als erläuternder Kommentar beim Aufbau komplexer Grafiken.
  2. Natürliche Sprache: gut verständliche, einfache und natürliche Sprache (insbesondere keine Schachtelsätze oder Klammereinschübe).
  3. Text nicht 1:1 vorlesen: geschriebenen Text auf Stichworte beschränken.
  4. Navigationsmöglichkeiten: Pause- und Replay-Funktion vorsehen, wenn Infos nicht auf der Seite ersichtlich sind.
  5. Barrierefreiheit: Bieten Sie Untertitel oder den Sprechtext als Transkript an – aber nur fakultativ zuschaltbar.
  6. Aufforderung: Bauen Sie in WBTs am Anfang einen Hinweis ein, dass es vertonte Elemente gibt und die Nutzer:innen einen Kopfhörer aufsetzen sollen.

Ein Schmöker-Tipp zum Abschluss

Der amerikanische Multimedia-Forscher Richard Mayer hat mehrere einfache Prinzipien zum Umgang mit Text, Bild und Audio formuliert. Vor allem das sog. Redundanz-Prinzip bezieht sich spezifisch auf den Einsatz von Audio. Mayers Theorie und Prinzipien finden Sie hier in kurzer und verständlicher Form.

Kontakt

somedia learning simone pauli

Teilen Sie diesen Beitrag!

Lust auf mehr?

Lust auf mehr?

6 Gründe, wieso Sie Audios in WBTs einsetzen sollten

Als E-Learning-Anbieterin aus der Schweiz ist Qualität unser oberstes Gebot. Dazu zählt auch der gezielte Einsatz von Audios in unseren digitalen Lernangeboten. Erzählstimmen machen Web-based Trainings (WBTs) lebendiger und abwechslungsreicher – und es gibt noch viel mehr Gründe, Sprechtext auch ausserhalb von Videos einzusetzen. In diesem Beitrag erfahren Sie mehr über die Vorteile der Verwendung von Audios in WBTs.

Somedia Learning: E-Learning aus der Schweiz

Das 12-köpfige Team Somedia Learning macht aus dem Lernen ein Erlebnis, das bleibt. Welche Dienstleistungen wir erbringen, wieso die Zusammenarbeit mit uns Spass macht und wieso auch Sie auf E-Learning aus der Schweiz setzen sollten, lesen Sie in diesem Beitrag.