Wie Technik zur Gleichberechtigung in Meetings beiträgt

Felix Alpstäg | 14.08.2023 Wie Technik zur Gleichberechtigung in Meetings beiträgt

Seien wir ehrlich: Die besten Meetings finden im echten Leben statt, von Mensch zu Mensch, an einem Ort. Doch es gibt eine entscheidende Hürde – die räumliche Entfernung. Der Einsatz von Video- und Audio-Technologien in virtuellen Meetings dient eigentlich nur dem einen Zweck, diese Hürde zu überwinden. Je zuverlässiger und reibungsloser die Konferenztechnik funktioniert, desto wohler fühlen wir uns im Digitalen, desto produktiver verläuft die Besprechung. Also ein nicht zu unterschätzender Erfolgsfaktor unseres digitalen Geschäftsalltags.  

Wie uns unzureichende Technik beeinträchtigt

Dazu gehört, dass niemand benachteiligt wird. Für eine gleichberechtigte Teilnahme an Meetings sorgt nicht nur, wie man vielleicht oft noch denkt, eine achtsame Moderation im zwischenmenschlichen Bereich. Genauso wichtig sind die technischen Voraussetzungen. Häufig sitzen Teilnehmer:innen zu Hause am Laptop, während andere sich in einem Konferenzraum befinden. Nur wer unabhängig von seinem Standort klar und deutlich gehört und gesehen wird, kann seinen Teil zum erfolgreichen Austausch beitragen. Oft sind es schon kleine Störungen, die am Ende für Unzufriedenheit sorgen. Etwa wenn die Mitarbeiterin, die einen Einwand hat, schlechter verstanden wird als die Führungskraft, die den Platz am Mikrofon in Anspruch nimmt. Selbst bei aufwendigeren Systemen ist oft das Problem der Fokussierung nicht gut gelöst, wenn zwei Personen beim so genannten „Doubletalk“ gleichzeitig reden. Dann „springen“ Bild und Ton zu der Person, die lauter spricht, und der Rest der Beiträge wird ausgeblendet.

So wichtig ist der gute Ton

ProAV Integrator:innen wissen, dass die Qualität der technologischen Lösung für den Erfolg oder den Misserfolg eines Meetings verantwortlich ist – und dass Audio dabei eine erstaunlich große Rolle spielt.  Nach meiner persönlichen Erfahrung bestehen über 90 Prozent des Inhalts in Konferenzen aus dem gesprochenen Wort. Von daher ist die Bezeichnung „Videokonferenz“ eigentlich irreführend, besser passen würde wohl „Audiokonferenz mit Bewegtbild“. Die Benchmark bildet in diesem Bereich die Sprachqualität in den Hauptnachrichten der großen TV-Sender. Sie ermöglicht eine so exakte Wiedergabe, dass den Zuschauenden zuhause keine Nuance in der Stimme entgeht. Eine Videokonferenz auf diesem akustischen Qualitätsniveau verläuft nahezu ohne Einschränkung, selbst wenn die Bedingungen fürs Auge etwa wegen unzureichender Ausleuchtung einmal nicht perfekt sein sollten. Doch der Ton leistet mehr als nur als eine gute Verständlichkeit und einen stressfreien Verlauf. In integrierten Konferenzsystemen ist Audio zunehmend die Grundlage für die gesamte Steuerung der Besprechung.

Im Homeoffice ist die Einrichtung einer guten Konferenzsituation noch relativ einfach, da sich die Gegebenheiten nicht verändern – eine Person vor einem Mikrofon und einer Kamera. Mit einem professionellen Mikrofon, einer guten Kamera und einer flexiblen Beleuchtung kann kaum etwas schiefgehen. Komplexer wird es in Konferenzräumen, in denen zwei oder mehr Personen abgenommen werden müssen, plus einem Sprecher, der sich möglicherweise auch noch durch den Raum bewegt. Das Shure Decken-Mikrofonarray MXA920 kann mehrere Personen parallel sowie getrennt voneinander erfassen, im Raum lokalisieren und verfolgen.

Ein gutes Mikrofonsystem lohnt sich langfristig

Dank unserer Technologiepartnerschaften mit Anbietern von Videokonferenzdiensten wie etwa Zoom, Cisco oder Microsoft fließen all diese Audioinformatio-nen in die Lösungen ein und stellen in der Regel die hochwertigsten Signale in der gesamten Übertragungskette dar. Anders gesagt: Der Einsatz eines guten Mikrofons ist hochgradig investitionssicher, da dieses hilft, die Konferenzteilnehmer:innen in der bestmöglichen Qualität an die weiteren Komponenten der Signalkette zu übertragen. Videokonferenz-Codecs sowie auch limitierte Bandbreite von Internetverbindungen haben so ein leichteres Spiel.  Wenn sich diese Faktoren durch zukünftigen Technologiefortschritt weiter verbessen, liefern unsere Mikrofone von heute auch in Zukunft den bestmöglichen Input für erfolgreiche Meetings. 

Wie Audio die Kameras mitsteuert

Detailreiche Audiosignale in Kombination mit fortschrittlicher Kameratechnik sorgen dafür, dass die Sprecher im Raum noch besser verfolgt und im Videobild korrekt erfasst werden können. Das MXA920 Decken-Mikrofonarray liefert nicht nur herausragende Klangqualität, sondern stellt auch präzise Positionsdaten sprechender Personen für das Kameratracking bereit. Es erfasst die Positionen mehrerer sprechender Personen gleichzeitig und sendet diese Daten binnen 100 Millisekunden an das Kamerasystem. Mit dem Einsatz mehrerer Kameras, die zoom- und schwenkbar sind, werden nachteilige Raumsituationen ausgeglichen. Dann werden nicht mehr nur drei Personen nebeneinander in einem Bildformat von 16:9 oder 4:3 wiedergegeben, sondern jede Person wird separat geschnitten und in einem eigenen Bildfenster viel detaillierter abgebildet. Das Audiosignal liefert somit die Daten für die bestmögliche, flexible Abbildung der Situation in Ton und Bild. In den modernsten Lösungen übernimmt dann die KI die automatisierte Video-Regie der Konferenz, insbesondere die Auswahl und Variation der Kamerabilder. Als nächsten konkreten Entwicklungsschritt bringen uns Konferenzanbieter wie Microsoft mit „Spatial Audio“ zusätzlich richtungsbezogenes Audio, so dass wie bei der Stereo-Wiedergabe der Ton auch tatsächlich aus der Richtung wahrgenommen wird, in der sich die sprechende Person befindet. Shure Microflex Ecosysteme werden auch diesen nächsten Technologieschritt begleiten.

Speech-to-Text erweitert die Möglichkeiten rasant

Die hohe Audioqualität ist auch die Grundlage für weitere, neuere Funktionen etwa im Bereich Speech-to-Text, dessen Technologie sich derzeit rasant entwickelt. Automatisiert eingeblendete Untertitel, Übersetzungen oder die automatisierte Generierung von Metadaten für die Kategorisierung und Archivierung von Bild- und Ton Aufzeichnungen sind auf akkuraten Audio-Input angewiesen. Neue Dienste bringen einen großen Fortschritt für die Weiterentwicklung des Videokonferenzerlebnisses. Es gibt sogar schon Dienstleister, die auf die „Übersetzung“ von Dialekten ins Hochdeutsche spezialisiert sind – so leistet etwa recapp eine automatische Transkription mit Mundart-Erkennung des Schweizerdeutschen.

All diese Aspekte einer gleichberechtigten Meeting-Teilnahme lassen sich mit dem Microflex Ecosystem von Shure, welches für den Einsatz in den anspruchsvollsten Räumen entwickelt wurde, perfekt realisieren. In diesen vernetzten Audiolösungen arbeiten Mikrofon-Arrays, Kameras, DSPs und Lautsprecher optimal zusammen. Auch kleinere Räume lassen sich mit geringerem Aufwand durch das Stem Ecosystem von Shure, das flexibel und im Handumdrehen einsetzbar ist, den Anforderungen entsprechend kostengünstig auszustatten. In einem solchen Umfeld ist die Hürde, die die räumliche Entfernung für uns in Besprechungen darstellt, minimiert. Die Wahrscheinlichkeit, dass ein virtuelles Meeting für alle Teilnehmer:innen zum Erfolg wird, kann durch technologische Lösungen kaum noch mehr gesteigert werden – zumindest nicht, solange wir uns nicht alle im Metaverse treffen. Aber auch da wird Audio ein entscheidender Faktor bleiben.

Felix Alpstäg

Felix is based in Shure Switzerland and is a Senior Manager, Market Development.