Update für FluidVoice: Diktieren und Transkribieren mit dem Mac

08. Jan. 2026 09:00 Uhr - Redaktion

Der Entwickler Prachi Modi hat über die Feiertage intensiv an FluidVoice gearbeitet. Die kostenfreie, quelloffene Anwendung ermöglicht Diktate in fast jedes Programm und das Transkribieren von Audiodateien basierend auf dem Nvidia-Spracherkennungsmodell Parakeet TDT v3 (Apple Silicon) bzw. Whisper (Intel-Macs). Außerdem wird seit kurzem Apples Spracherkennungsmodell (benötigt macOS Tahoe 26) unterstützt.

Das ab macOS Monterey 12 lauffähige FluidVoice arbeitet vollständig lokal und offline. "Auf Apple Silicon Macs nutzt FluidVoice CoreML für die Beschleunigung neuronaler Netzwerke und Metal für GPU-Computing. Dies ermöglicht eine Transkription mit extrem geringer Latenz (unter 100 ms), minimalem Batterieverbrauch und Echtzeitverarbeitung ohne Cloud-Abhängigkeit", erläutert der Autor. Es handelt sich dabei um ein junges Projekt, das erst im vergangenen Herbst startete.

In den letzten Wochen hat der Entwickler unter anderem Unterstützung für Intel-Macs ergänzt, umfangreiche Optimierungen für Leistung, Stabilität und Zuverlässigkeit vorgenommen, die Audio-Engine überarbeitet, Verbesserungen für Benutzeroberfläche und Aufnahme-Overlay implementiert, weitere Einstellungsoptionen ergänzt und Problembehebungen vorgenommen. Aktuell ist die Version 1.5.4.

FluidVoice bietet eine optionale KI-Nachbearbeitung, ermöglicht auch das Steuern des Rechners und lässt sich über ein anpassbares Tastaturkürzel global aufrufen, außerdem steht ein systemweites Menü zur Verfügung. Das Projekt mitsamt Quellcode und Versionsanmerkungen ist auf GitHub zu finden.

 
FluidVoice
 
FluidVoice: Freie Mac-Diktiersoftware nutzt Nvidia-Spracherkennungsmodell.
Bild: Prachi Modi.

 

"Fluid ist für immer völlig kostenlos, ohne Abonnementgebühren. Im Gegensatz zu anderen Sprach-zu-Text-Apps, die monatliche Gebühren erheben, verarbeitet Fluid alles lokal auf Ihrem Mac, ohne dass laufende Kosten anfallen. Fluid verarbeitet alle Spracherkennungen lokal auf Ihrem Mac mithilfe des Parakeet-Modells von Nvidia. Es ist keine Internetverbindung erforderlich, sodass auch ohne WLAN vollständige Privatsphäre und Zuverlässigkeit gewährleistet sind", erläutert der Entwickler.

Es werden mehr als 25 Sprachen unterstützt, wie zum Beispiel Chinesisch, Deutsch, Englisch, Französisch, Italienisch, Japanisch, Portugiesisch und Spanisch. Weitere Sprachen sollen ergänzt werden. Anwender können via GitHub Problemberichte und Verbesserungsvorschläge für FluidVoice veröffentlichen.