„Maxine“ – Bessere Video-Telefonie mit stabilerer Verbindung dank KI

Schlüsselpunkte: Das sorgt künftig für kleine Datenströme
Schlüsselpunkte: Das sorgt künftig für kleine Datenströme

Das US-amerikanische Unternehmen Nvidia hat die Künstliche-Intelligenz-Plattform „Maxine“ entwickelt, mit welcher eine stabilere Videotelefonie mit lediglich einem Zehntel der Bandbreite möglich ist. Schlechte oder unscharfe Bilder während einer Video-Konferenz sollen mit der Plattform in Zukunft der Vergangenheit angehören.

Weshalb wurde „Maxine“ entwickelt?

Laut Aussage des Unternehmens werden täglich rund 30 Millionen Videokonferenzen abgehalten. Seit der immer noch andauernden Corona-Pandemie ist die Video-Telefonie für viele Menschen die einzige Möglichkeit geworden mit Freunden, Familien und Kollegen auch visuell in Kontakt bleiben zu können. Umso ärgerlicher ist es, wenn die Verbindung ständig abbricht oder der Gegenüber nur verpixelt zu erkennen ist. Darüber hinaus ist es bei einem herkömmlichen Video-Telefonat nicht möglich, dass sich beide Teilnehmer direkt in die Augen blicken. Mit der KI-Plattform „Maxine“ will Nvidia allen nun ein besseres Videokommunikationserlebnis ermöglichen, bei welchem es so aussieht, als würden die Nutzer wirklich direkt in die Kamera schauen. Zudem sollen auch Personen, denen lediglich eine geringe Bandbreite zur Verfügung steht, die Möglichkeit bekommen die Videotelefonie zu nutzen. Bisher kommt „Maxine“ ausschließlich bei Avaya zum Einsatz.

Wie funktioniert die KI-Plattform?

An die Stelle der klassischen Video-Codecs, bei denen es sich um Algorithmenpaare handelt, die für die Kodierung und Dekodierung von digitalen Videos verantwortlich sind, tritt eine Kompression mithilfe neuronaler Netze. „Maxine“ sendet keine vollen Bilder, sondern lediglich einen kompakten Datenstrom. Dieser Datenstrom umfasst ausschließlich bestimmte Schlüsselbereiche des Gesichts. Die Schlüsselbereiche befinden sich nahe dem Munde, der Nase und der Augen. Auf dem Gerät des Bildempfängers kommt nun ein sogenanntes Generative Adversarial Network, kurz GAN, zum Einsatz. Hierbei handelt es sich um ein System, dessen Aufgabe es ist, basierend auf einer Reihe von realen Beispieldaten eigene Kreationen zu erstellen. Konkret bedeutet dies, dass nur die wichtigsten Punkte eines Gesichts übertragen werden, der Rest wird dann von der Künstlichen-Intelligenz-Plattform reanimiert. Aus dem ersten Bild und den folgenden Schlüsseldatenpunkten werden weitere Bilder ideal nachgebildet. Um dies umzusetzen, genügt die Rechenleistung des Grafikprozessors des Empfängers.

Welche Vorteile bietet „Maxine“?

Das Unternehmen gibt an, hierfür lediglich ein Zehntel der Bandbreite zu benötigen, die für ein normales Video-Telefonat nötig ist. Die benötigte Bandbreite könnte darüber hinaus in Zukunft noch geringer ausfallen. Steht die gleiche Bandbreite wie bei einer normalen Video-Telefonie zur Verfügung, wirkt das Maxine-Video deutlich schärfer. Die KI-Plattform ist demnach für alle geeignet, die Datenvolumen sparen und darüber hinaus ein besseres Video-Erlebnis haben möchten. „Maxine“ funktioniert selbst dann, wenn der Nutzer beispielsweise eine Mund-Nase-Maske oder Sonnenbrille trägt. Die Blickrichtung sowie die Kopfhaltung werden automatisch auf die Bildmitte ausgerichtet. Der andere Teilnehmer hat demnach immer den Eindruck, dass er direkt angeschaut wird. Wer sich nicht selbst bei der Video-Telefonie zeigen möchte, hat außerdem die Möglichkeit einen Avatar-Kopf mit den eigenen Gesichtszügen zu erstellen.

Vorstellung bei YouTube

Bildquelle: nvidia.com

Hinterlasse jetzt einen Kommentar

Kommentar hinterlassen

E-Mail Adresse wird nicht veröffentlicht.


*


neun − 5 =

Die aktuellsten telespiegel Nachrichten
Gesetzesänderung - Geheimdienste sollen in Messengern mitlesen dürfen

Gesetzesänderung

Geheimdienste sollen in Messengern mitlesen dürfen

Es ist eine Gesetzesänderung geplant, die den deutschen Geheimdiensten erlaubt, in Nachrichtendiensten wie WhatsApp mitlesen zu dürfen. Auch die Hürden für die Überwachung von Einzelpersonen sollen gesenkt werden. In der Politik gibt es sowohl Zuspruch als auch Kritik für den Entwurf des Bundesministeriums. […]

WhatsApp Web – Neue Funktionen für die Desktop-Variante des Messengers

WhatsApp Web

Neue Funktionen für die Desktop-Variante des Messengers

WhatsApp Web ermöglicht die Nutzung des beliebten Messenger-Dienstes auf dem Laptop oder Computer. Bisher ist der Funktionsumfang im Vergleich zu der mobilen App eher gering. Es ist jedoch davon auszugehen, dass bereits in wenigen Wochen Sprach- und Videotelefonie auch mit WhatsApp Web möglich ist. […]

Mobilfunk aus der Stratosphäre – Telekom testet fliegende Basisstationen

Mobilfunk aus der Stratosphäre

Telekom testet fliegende Basisstationen

Die Deutsche Telekom will das die Lücken des Mobilfunknetzes am Boden mit hochfliegenden Mobilfunkbasisstationen schließen. Erste Tests wurden Anfang Oktober gemeinsam mit dem britischen Technologiepartner Stratospheric Platforms Limited in Bayern durchgeführt. […]

iPhone 12, Mini, Pro & Pro Max – Apple stellt seine neuen Modelle vor

iPhone 12, Mini, Pro & Pro Max

Apple stellt seine neuen Modelle vor

Apple hat am Dienstagabend die Modelle der iPhone-12-Familie vorgestellt. Zum ersten Mal gibt es vier verschiedene Geräte: das iPhone 12 Mini, das iPhone 12, das iPhone 12 Pro sowie das iPhone 12 Pro Max. Die ersten Smartphones können bereits ab morgen vorbestellt werden. […]

Drittanbieter-Leistungen – Anbieter Nutzen weiterhin die Grauzonen aus

Drittanbieter-Leistungen

Anbieter Nutzen weiterhin die Grauzonen aus

Obwohl seit Februar dieses Jahres neue Regelungen gelten, die Verbraucher vor ungewollten Leistungen von Drittanbietern schützen sollen, gehen immer noch zahlreiche Beschwerden bei der Stiftung Warentest ein. Es werden Grauzonen ausgenutzt, um weiterhin Geld mit Drittanbieter-Leistungen zu verdienen. […]