Der Entwickler Prachi Modi hat FluidVoice in der Version 1.5.9 mit mehreren Optimierungen und Verbesserungen veröffentlicht. Das quelloffene, kostenlose FluidVoice ermöglicht Diktate in fast jedes Programm und das Transkribieren von Audiodateien basierend auf dem Nvidia-Spracherkennungsmodell Parakeet TDT v3 (Apple-Silicon-Macs) bzw. Whisper (Intel-Macs).
Zu den Neuerungen teilte Modi mit: "Diese Version konzentriert sich auf Geschwindigkeitsverbesserungen, Stabilität, optische Verbesserungen und Fehlerbehebungen. FluidVoice Parakeet ist jetzt noch schneller – die Diktatgeschwindigkeit wurde von ca. 300 ms auf unter 100 ms reduziert! Es wurde eine neue Einstellung für den Texteinfügemodus mit 'Reliable Paste' hinzugefügt, um die Einfügung von Diktattexten in verschiedenen Browsern und Desktop-Anwendungen zuverlässiger zu gestalten. Es wurde ein neuer Onboarding-Prozess für FluidVoice für neue Benutzer hinzugefügt."
Das ab macOS Monterey 12 lauffähige FluidVoice arbeitet vollständig lokal und offline. Die Versionsanmerkungen mit allen Änderungen sind, mitsamt Downloads und Quellcode, auf GitHub zu finden. Auch Apples Spracherkennungsmodell (benötigt macOS Tahoe 26) wird unterstützt.

Bild: Prachi Modi.
"Auf Apple Silicon Macs nutzt FluidVoice CoreML für die Beschleunigung neuronaler Netzwerke und Metal für GPU-Computing. Dies ermöglicht eine Transkription mit extrem geringer Latenz (unter 100 ms), minimalem Batterieverbrauch und Echtzeitverarbeitung ohne Cloud-Abhängigkeit", erläutert der Autor. Es handelt sich dabei um ein junges Projekt, das erst im vergangenen Herbst startete.
FluidVoice bietet eine optionale KI-Nachbearbeitung, ermöglicht auch das Steuern des Rechners und lässt sich über ein anpassbares Tastaturkürzel global aufrufen, außerdem steht ein systemweites Menü zur Verfügung. Es werden mehr als 25 Sprachen unterstützt, wie zum Beispiel Chinesisch, Deutsch, Englisch, Französisch, Italienisch, Japanisch, Portugiesisch und Spanisch. Anwender können via GitHub wie gewohnt Problemberichte und Verbesserungsvorschläge für FluidVoice veröffentlichen.
"Fluid ist für immer völlig kostenlos, ohne Abonnementgebühren. Im Gegensatz zu anderen Sprach-zu-Text-Apps, die monatliche Gebühren erheben, verarbeitet Fluid alles lokal auf Ihrem Mac, ohne dass laufende Kosten anfallen. Fluid verarbeitet alle Spracherkennungen lokal auf Ihrem Mac mithilfe des Parakeet-Modells von Nvidia. Es ist keine Internetverbindung erforderlich, sodass auch ohne WLAN vollständige Privatsphäre und Zuverlässigkeit gewährleistet sind", so der Entwickler weiter.
