✅ WEB- und WordPress-Nachrichten, Themen, Plugins. Hier teilen wir Tipps und beste Website-Lösungen.

So lesen Sie Text aus einem Bild in PHP

624

Möchten Sie eine Lösung, die Text aus einem Bild in PHP liest? Es gibt einige Fälle, in denen Sie Text programmgesteuert lesen möchten. Wahrscheinlich möchten Sie überprüfen, ob Text auf einem Bild missbräuchlich ist, Sie möchten das Bild aus Text erkennen usw. In diesem Artikel untersuchen wir, wie man in PHP Text aus einem Bild liest.

Tesseract OCR ist eine Open-Source-OCR-Engine, mit der wir Text in Bildern erkennen können. Der Benutzer kann die Tesseract OCR-Engine auf Betriebssystemen wie Windows, macOS, Linux installieren. Die Installationsanleitung erhalten Sie in deren Dokumentation.

Installation der Tesseract OCR Engine

Wie oben erwähnt, unterstützt Tesseract OCR alle wichtigen Betriebssysteme. Für dieses Tutorial gehe ich davon aus, dass Sie ein Windows-Betriebssystem verwenden. Es gibt 2 Möglichkeiten, Tesseract OCR auf Windows-Rechnern zu installieren. Einer verwendet das Installationsprogramm und ein anderer verwendet Chocolatey. Der Chocolatey ist ein Paketmanager für Windows und benutzerfreundlich für Entwickler.

In der ersten Art und Weise, Laden Sie das Installationsprogramm für Windows. Wählen Sie das Installationsprogramm für 32-Bit- oder 64-Bit-Systeme basierend auf Ihrer Maschinenkonfiguration. Schließen Sie den Installationsvorgang ab.

Wenn Sie es mit Chocolatey installieren möchten, führen Sie einfach den folgenden Befehl in der Windows Powershell aus. Stellen Sie sicher, dass Sie einen Befehl als Administrator ausführen.

choco install capture2text --version 3.9

Nachdem Sie Tesseract OCR auf Ihrem Windows-Betriebssystem installiert haben, legen Sie diesen Pfad C:Program FilesTesseract-OCRin Ihrer Umgebungsvariablen fest. Nachdem Sie den Pfad in einer Umgebungsvariablen festgelegt haben, wird empfohlen, Ihr System neu zu starten. Manchmal wird es erst wirksam, wenn Sie das System neu starten.

Installieren Sie als Nächstes die Tesseract OCR-Bibliothek in Ihrem PHP-Projekt. Führen Sie dazu den folgenden Befehl aus Ihrem Projekt-Root-Verzeichnis aus.

composer require thiagoalessio/tesseract_ocr

Text aus Bild in PHP lesen

Mit der Tesseract OCR-Software und -Bibliothek sind Sie bereit. Jetzt können Sie Text im Bild leicht erkennen. Es erfordert nur ein paar Zeilen PHP-Code. Angenommen, Sie möchten den Inhalt des folgenden Bildes lesen.

So lesen Sie Text aus einem Bild in PHP

Legen Sie das Bild in das ‘images’-Verzeichnis Ihres Projekts ab. In der PHP-Datei sieht Ihr Code wie folgt aus:

<?php
require_once "vendor/autoload.php";
 
use thiagoalessioTesseractOCRTesseractOCR;
 
echo (new TesseractOCR('images/text.png'))
    ->run();

Die endgültige Ausgabe sollten Sie wie folgt erhalten:

The quick brown fox jumps over the lazy dog.

Mit Tesseract OCR können Sie den Text verschiedener Sprachen lesen. Sie müssen lediglich die erforderliche Sprachdatei von diesem Speicherort herunterladen. Angenommen, Sie möchten einen in deutscher Sprache verfassten Text lesen. Laden Sie die deu.traineddataDatei herunter und bewahren Sie sie darin auf C:/Program Files/Tesseract-OCR/tessdata.

Übergeben Sie danach die Sprache ‘deu’ im Code wie unten gezeigt.

echo (new TesseractOCR('IMAGE_PATH'))
    ->lang('deu')
    ->run();

Das ist es! So einfach ist das. Ich hoffe, Sie haben gelernt, wie man Text aus dem Bild in PHP liest. Ich würde gerne Ihre Gedanken und Vorschläge im Kommentarbereich unten hören.

Zum Thema passende Artikel

Aufnahmequelle: artisansweb.net

Diese Website verwendet Cookies, um Ihre Erfahrung zu verbessern. Wir gehen davon aus, dass Sie damit einverstanden sind, Sie können sich jedoch abmelden, wenn Sie möchten. Annehmen Weiterlesen