Diktieren und Transkribieren am Mac: FluidVoice erhält Update

26. Jan. 2026 13:00 Uhr - Redaktion

Der Entwickler Prachi Modi hat FluidVoice in der Version 1.5.5 mit mehreren Neuerungen und Verbesserungen herausgegeben. Das Open-Source-Programm ermöglicht Diktate in fast jedes Programm und das Transkribieren von Audiodateien basierend auf dem Nvidia-Spracherkennungsmodell Parakeet TDT v3 (Apple-Silicon-Macs) bzw. Whisper (Intel-Macs).

Modi zu den Neuerungen der Version 1.5.5: "Die verbesserte Transkriptions-Engine kann nun Audiodateien mit einer Länge von mehr als 5 Stunden verarbeiten. Die Leistung wurde auf das 160-fache der Echtzeitgeschwindigkeit verbessert, sodass 5 Stunden Audio in etwa 2 Minuten transkribiert werden können.

Automatische Medienwiedergabesteuerung (Start/Stopp) während des Diktierens und der Transkription implementiert [derzeit nur für Apple Silicon Macs]. Die Begrenzung der Transkriptionshistorie wurde aufgehoben und von 1000 Einträgen auf unbegrenzt erhöht. Die gesamte Seitenleiste 'KI-Einstellungen' wurde neu gestaltet und umfasst nun die Tabs 'Voice Engine' und 'KI-Verbesserungen' Unterstützung für das kommende vollständig lokale Modell Fluid-1 wurde hinzugefügt."

Das ab macOS Monterey 12 lauffähige FluidVoice arbeitet vollständig lokal und offline. Die Versionsanmerkungen mit allen Änderungen sind, mitsamt Downloads und Quellcode, auf GitHub zu finden. Auch Apples Spracherkennungsmodell (benötigt macOS Tahoe 26) wird unterstützt.

 
FluidVoice
 
FluidVoice: Freie Mac-Diktiersoftware nutzt Nvidia-Spracherkennungsmodell.
Bild: Prachi Modi.

 

"Auf Apple Silicon Macs nutzt FluidVoice CoreML für die Beschleunigung neuronaler Netzwerke und Metal für GPU-Computing. Dies ermöglicht eine Transkription mit extrem geringer Latenz (unter 100 ms), minimalem Batterieverbrauch und Echtzeitverarbeitung ohne Cloud-Abhängigkeit", erläutert der Autor. Es handelt sich dabei um ein junges Projekt, das erst im vergangenen Herbst startete.

FluidVoice bietet eine optionale KI-Nachbearbeitung, ermöglicht auch das Steuern des Rechners und lässt sich über ein anpassbares Tastaturkürzel global aufrufen, außerdem steht ein systemweites Menü zur Verfügung. Es werden mehr als 25 Sprachen unterstützt, wie zum Beispiel Chinesisch, Deutsch, Englisch, Französisch, Italienisch, Japanisch, Portugiesisch und Spanisch. Anwender können via GitHub wie gewohnt Problemberichte und Verbesserungsvorschläge für FluidVoice veröffentlichen.

"Fluid ist für immer völlig kostenlos, ohne Abonnementgebühren. Im Gegensatz zu anderen Sprach-zu-Text-Apps, die monatliche Gebühren erheben, verarbeitet Fluid alles lokal auf Ihrem Mac, ohne dass laufende Kosten anfallen. Fluid verarbeitet alle Spracherkennungen lokal auf Ihrem Mac mithilfe des Parakeet-Modells von Nvidia. Es ist keine Internetverbindung erforderlich, sodass auch ohne WLAN vollständige Privatsphäre und Zuverlässigkeit gewährleistet sind", so der Entwickler weiter.