Spanish English French German Italian Portuguese
Soziales Marketing
HomeRecycelbare TechnologieKünstliche IntelligenzOpenAI führt die Whisper-API für die Sprache-zu-Text-Transkription ein

OpenAI führt die Whisper-API für die Sprache-zu-Text-Transkription ein

Zeitgleich mit der Veröffentlichung der ChatGPT-API hat OpenAI heute die Whisper-API veröffentlicht, eine gehostete Version des Open-Source-Sprache-zu-Text-Modells Whisper, das das Unternehmen im September herausgebracht hat.

Whisper kostet 0.006 US-Dollar pro Minute und ist ein automatisches Spracherkennungssystem, das laut OpenAI eine „robuste“ Transkription in mehreren Sprachen sowie die Übersetzung dieser Sprachen ins Englische ermöglicht. Erfassen Sie Dateien in einer Vielzahl von Formaten, einschließlich M4A, MP3, MP4, MPEG, MPGA, WAV und WEBM.

Unzählige Organisationen haben hochleistungsfähige Spracherkennungssysteme entwickelt, die den Kern der Software und Dienste von Technologiegiganten wie Google, Amazon und Meta bilden. Was Whisper jedoch anders macht, ist, dass es laut Greg Brockman, Vorsitzender und Präsident von OpenAI, mit 680.000 Stunden mehrsprachiger und „Multitasking“-Daten aus dem Internet trainiert wurde, was zu einer besseren Erkennung einzigartiger Akzente, Hintergrundgeräusche und Fachjargon führte.

„Wir haben ein Modell veröffentlicht, aber das war nicht wirklich genug für das gesamte Entwickler-Ökosystem, um darauf aufzubauen“, sagte Brockman. „Die Whisper-API ist das gleiche großartige Modell, das Sie von Open Source bekommen können, aber wir haben es extrem optimiert. Es ist viel, viel schneller und extrem bequem."

Laut Brockman gibt es viele Hindernisse, wenn es darum geht, dass Unternehmen Sprachtranskriptionstechnologie einführen. Laut Statista in a Umfrage Ab 2020 nennen Unternehmen Genauigkeit, akzent- oder dialektbedingte Erkennungsprobleme und Kosten als die Hauptgründe, warum sie keine Technologie wie Sprachtechnologie eingeführt haben.

Whisper hat jedoch seine Grenzen, insbesondere im Bereich der „nächsten Wort“-Vorhersage. Da das System mit einer großen Menge verrauschter Daten trainiert wurde, warnt OpenAI, dass Whisper Wörter in Ihre Transkriptionen aufnehmen könnte, die nicht wirklich gesprochen wurden, möglicherweise weil es versucht, das nächste Wort in Audio vorherzusagen und die Audioaufnahme zu transkribieren. Außerdem schneidet Whisper nicht in allen Sprachen gleich gut ab, da es unter einer höheren Fehlerquote leidet, wenn es um Sprecher von Sprachen geht, die in den Trainingsdaten nicht gut vertreten sind.

Leider ist dieser letzte Teil nichts Neues in der Welt der Spracherkennung. Vorurteile haben lange selbst die besten Systeme geplagt, in a Studio Die Stanford-Ergebnisse 2020 auf Systemen von Amazon, Apple, Google, IBM und Microsoft machten bei weißen Benutzern deutlich weniger Fehler (ca. 19 %) als bei schwarzen Benutzern.

Trotzdem ist OpenAI der Ansicht, dass die Transkriptionsfunktionen von Whisper zur Verbesserung bestehender Anwendungen, Dienste, Produkte und Tools verwendet werden. Die KI-gestützte Sprachlern-App Speak nutzt bereits die Whisper-API, um einen neuen virtuellen Sprachpartner in der App zu betreiben.

Wenn OpenAI in großem Umfang in den Speech-to-Text-Markt eintreten kann, könnte dies für das von Microsoft unterstützte Unternehmen recht profitabel sein. Laut der Meldung, könnte das Segment bis 5,4 einen Wert von 2026 Milliarden US-Dollar haben, gegenüber 2,2 Milliarden US-Dollar im Jahr 2021.

„Unser Image ist, dass wir wirklich diese universelle Intelligenz sein wollen“, sagte Brockman. „Wir möchten wirklich, sehr flexibel, in der Lage sein, jede Art von Daten, die Sie haben, zu übernehmen, welche Art von Aufgabe Sie erledigen möchten, und in dieser Pflege ein Kraftmultiplikator zu sein.“

VERBUNDEN

Lassen Sie eine Antwort

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein

Die Kommentarmoderation ist aktiviert. Es kann einige Zeit dauern, bis Ihr Kommentar erscheint.

Diese Seite verwendet Akismet, um Spam zu reduzieren. Erfahren Sie, wie Ihre Kommentardaten verarbeitet werden.

ABONNIEREN SIE TRPLANE.COM

Veröffentlichen Sie auf TRPlane.com

Wenn Sie eine interessante Geschichte über Transformation, IT, Digital usw. mit einem Platz in TRPlane.com haben, senden Sie sie uns bitte und wir werden sie mit der gesamten Community teilen.

WEITERE PUBLIKATIONEN

Benachrichtigungen aktivieren OK Nein danke