TRex: Kostenlose OCR-Texterkennung für den Mac nutzt Tesseract

07. Nov. 2025 12:00 Uhr - Redaktion

TRex ist eine quelloffene, kostenlose Texterkennungssoftware für macOS zur Extrahierung von Text aus Bildern, die komplett lokal (und offline) auf dem Rechner läuft. Sie nutzt dazu auch die freie OCR-Engine Tesseract, die über 100 Sprachen erkennt und deren Ursprünge bis in die 1980er Jahre bei Hewlett-Packard zurückreichen (und weiter aktiv entwickelt wird).

TRex setzt einen Apple-Prozessor und macOS Ventura 13 oder neuer voraus und liegt seit wenigen Tagen in der Version 1.9.1 vor. Bedient wird das Programm über ein systemweites Menü und anpassbare Tastasturkürzel, ein Dock-Icon gibt es nicht. Zuvor nutzte TRex lediglich Apples Vision-Framework, das in puncto Sprachunterstützung sehr beschränkt ist. Tesseract muss in TRex in den Einstellungen erst aktiviert werden, anschließend können die benötigten Sprachpakete heruntergeladen werden.

 
TRex
 
TRex: Kostenlose OCR-Texterkennung für den Mac nutzt Tesseract.
Bild: GitHub.

 

Der Entwickler beschreibt TRex wie folgt: "TRex erfasst jeden Text direkt in Ihrer Zwischenablage mit der Magie von OCR. Aber was ist OCR überhaupt? Stellen Sie sich vor, Sie haben eine PDF-Datei oder eine Webseite, auf der Sie den Text nicht auswählen können, ein Bild mit Text oder sogar ein YouTube-Video. Vergessen Sie das manuelle Abtippen; mit TRex können Sie Text von überall extrahieren, und das ist so einfach wie das Erstellen eines Screenshots. TRex befindet sich in der Menüleiste und ist genau dort verfügbar, wo Sie es am meisten brauchen."

Das Projekt ist mitsamt Quellcode auf GitHub zu finden, dort können Anwender wie gewohnt Problemberichte und Verbesserungsvorschläge einreichen. Das Programm an sich liegt nur auf Englisch vor, es gibt eine optionale Integration in Workflow-Tools wie Alfred und Raycast. Zur Geschichte von Tesseract heißt es:

"Tesseract wurde ursprünglich zwischen 1985 und 1994 in den Hewlett-Packard Laboratories in Bristol (Großbritannien) und bei Hewlett-Packard Co in Greeley (Colorado, USA) entwickelt, wobei 1996 einige weitere Änderungen für die Portierung auf Windows vorgenommen und 1998 einige C++-Anpassungen vorgenommen wurden. Im Jahr 2005 wurde Tesseract von HP als Open Source veröffentlicht. Von 2006 bis November 2018 wurde es von Google weiterentwickelt."

Seit dem Jahr 2018 ist Google an dem Projekt nicht mehr beteiligt, getragen wird es seitdem von einzelnen Entwicklern, mit Beiträgen auch von der Universitätsbibliothek Mannheim im Rahmen eines Digitalisierungsprojekts.