Skip to content

Latest commit

 

History

History
52 lines (32 loc) · 2.31 KB

README.md

File metadata and controls

52 lines (32 loc) · 2.31 KB

News Summarizer

Übersicht

Dieses Projekt kombiniert Spracherkennung, maschinelle Übersetzung und Textzusammenfassung, um Nachrichtensendungen in Echtzeit zu transkribieren, zu übersetzen und zusammenzufassen. Es nutzt whisper.cpp für die Spracherkennung, madlad400 für die Übersetzung und Llama3.1 für die Zusammenfassung.

Das Projekt wurde mit Hilfe von LLM-Werkzugen wie claude.ai erstellt.

Funktionen

  • Echtzeit-Transkription von Sprache aus einem Videostream
  • Übersetzung der transkribierten Texte ins Englische
  • Generierung von Zusammenfassungen alle 30 Sekunden
  • Ausgabe der Zusammenfassungen in eine Datei und auf den Bildschirm

Voraussetzungen

Installation

Einschränkungen und bekannte Probleme

  • Die Genauigkeit hängt stark von der Qualität der Spracherkennung ab.
  • Übersetzungs- und Zusammenfassungsfehler können sich verstärken.
  • Das System kann Schwierigkeiten haben, den Kontext in Interviewsituationen zu erfassen.
  • Gelegentliche Fehlinterpretationen von Namen und Begriffen können auftreten.

Lizenz

Dieses Projekt wird unter der CC0 1.0 Universell (CC0 1.0) Public Domain Dedication veröffentlicht. Das bedeutet, dass Sie das Werk kopieren, modifizieren, verbreiten und aufführen können, auch für kommerzielle Zwecke, ohne um Erlaubnis zu bitten.

Für mehr Informationen siehe: https://creativecommons.org/publicdomain/zero/1.0/

Danksagungen

Dieses Projekt wäre nicht möglich ohne die folgenden Projekte und -Modelle:

Ich danke allen Entwicklern und Organisationen, die diese Tools und Modelle der Öffentlichkeit zur Verfügung stellen.