Zum Hauptinhalt springen

Audiominer

Dienst zur automatisierten Transkription von Audio- und Videodateien über Web-UI oder Dateisystemanbindung

Die Anwendung besteht aus mehreren lose gekoppelten Diensten, die gemeinsam eine skalierbare und flexible Transkriptionslösung für Audio- und Videodateien bereitstellen. Der ASR Service übernimmt die automatische Spracherkennung. Er nimmt Transkriptionsanfragen entgegen, erkennt selbstständig die verwendete Sprache und transkribiert die Inhalte mithilfe des Whisper-Modells. Zusätzlich wird eine Sprecherdiarisierung durchgeführt, sodass unterschiedliche Sprecher im Transkript eindeutig getrennt werden können. Für eine performante Verarbeitung, insbesondere bei größeren Dateien oder hoher Auslastung, wird der Einsatz von GPU-beschleunigter Hardware empfohlen.

Der FS Watcher dient der Anbindung an bestehende Dateisysteme. Er überwacht ein konfigurierbares, geteiltes Verzeichnis und erkennt neu hinzugefügte Audio- oder Videodateien automatisch. Sobald eine neue Datei erkannt wird, stößt der Dienst die Verarbeitung an und stellt sicher, dass das fertige Transkript nach Abschluss wieder am ursprünglichen Speicherort abgelegt wird. Dadurch ist eine nahtlose Integration in bestehende Arbeitsabläufe ohne manuelle Uploads möglich.

Der Web Service stellt die zentrale Benutzeroberfläche bereit. Über diese können Dateien hochgeladen, der Verarbeitungsfortschritt eingesehen und die fertigen Transkripte heruntergeladen werden. Zusätzlich ermöglicht die Weboberfläche die Konfiguration optionaler Benachrichtigungen, die über den Notify Service abgewickelt werden.

Der Notify Service ist für die Benachrichtigung der Nutzer zuständig. Sobald eine Transkription abgeschlossen ist, versendet er optional eine E-Mail mit dem Ergebnis als Anhang. Die Zustellung erfolgt nur dann, wenn der Nutzer in der Weboberfläche eine E-Mail-Adresse hinterlegt hat.

Durch diese serviceorientierte Architektur lässt sich das System flexibel betreiben, erweitern und an unterschiedliche Einsatzszenarien anpassen.

Software-Details

Erstellt am

06.02.26

Letzte Aktualisierung

13.02.26

Status

beta

Plattform
  • web
  • linux
Software-Version

2.1.1

Lizenz

MIT

Letzte Aktualisierung