Die kostenfreie Mac-Software FluidVoice, die Diktate und das Transkribieren von Audiodateien basierend auf einem Nvidia-Spracherkennungsmodell ermöglicht, liegt seit kurzem in der Version 1.5.1 vor. Das Update verbessert die Stabilität, die Unterstützung für Audio-Geräte sowie die Benutzeroberfläche, ergänzt weitere Einstellungsoptionen und enthält verschiedene Optimierungen und Problembehebungen.
Auch auf Intel-Macs lässt sich FluidVoice nun nutzen, dazu wird OpenAI Whisper verwendet. Auf Apple-Silicon-Rechnern kommt weiterhin das mit CoreML und Metal beschleunigte Nvidia-Sprachmodell Parakeet TDT v3 zum Einsatz. Benötigt wird mindestens macOS Sonoma 14.
FluidVoice bietet eine optionale KI-Nachbearbeitung, ermöglicht auch das Steuern des Rechners und lässt sich über ein anpassbares Tastaturkürzel global aufrufen, außerdem steht ein systemweites Menü zur Verfügung. Das Projekt mitsamt Quellcode und Versionsanmerkungen ist auf GitHub zu finden.

Bild: Prachi Modi.
"Fluid ist für immer völlig kostenlos, ohne Abonnementgebühren. Im Gegensatz zu anderen Sprach-zu-Text-Apps, die monatliche Gebühren erheben, verarbeitet Fluid alles lokal auf Ihrem Mac, ohne dass laufende Kosten anfallen. Fluid verarbeitet alle Spracherkennungen lokal auf Ihrem Mac mithilfe des Parakeet-Modells von Nvidia. Es ist keine Internetverbindung erforderlich, sodass auch ohne WLAN vollständige Privatsphäre und Zuverlässigkeit gewährleistet sind", erläutert der Entwickler Prachi Modi.
Es werden mehr als 25 Sprachen unterstützt, wie zum Beispiel Chinesisch, Deutsch, Englisch, Französisch, Italienisch, Japanisch, Portugiesisch und Spanisch. Weitere Sprachen sollen ergänzt werden. Anwender können via GitHub Problemberichte und Verbesserungsvorschläge für FluidVoice veröffentlichen.
