Comment lire du texte à partir d’une image en PHP
Voulez-vous une solution qui lit le texte d’une image en PHP ? Dans certains cas, vous souhaitez lire du texte par programmation. Vous voulez probablement vérifier si le texte sur une image est abusif, vous pouvez vouloir reconnaître l’image à partir du texte, etc. Dans cet article, nous étudions comment lire le texte d’une image en PHP.
Tesseract OCR est un moteur OCR open source qui nous permet de détecter du texte dans une image. L’utilisateur peut installer le moteur OCR Tesseract sur un système d’exploitation tel que Windows, macOS, Linux. Vous obtiendrez les instructions d’installation sur leur documentation.
Installation du moteur OCR Tesseract
Comme indiqué ci-dessus, Tesseract OCR prend en charge tous les principaux systèmes d’exploitation. Pour ce tutoriel, je suppose que vous utilisez le système d’exploitation Windows. Il existe 2 façons d’installer Tesseract OCR sur des machines Windows. L’un utilise le programme d’installation et un autre utilise Chocolatey. The Chocolatey est un gestionnaire de packages pour Windows et convivial pour les développeurs.
Dans un premier temps, téléchargez le programme d’installation pour Windows. Choisissez le programme d’installation pour le système 32 bits ou 64 bits en fonction de la configuration de votre machine. Terminez le processus d’installation.
Si vous souhaitez l’installer à l’aide de Chocolatey, exécutez simplement la commande ci-dessous dans Windows Powershell. Assurez-vous que vous exécutez une commande en tant qu’administrateur.
choco install capture2text --version 3.9
Une fois que vous avez installé Tesseract OCR sur votre système d’exploitation Windows, définissez ce chemin C:Program FilesTesseract-OCR
dans votre variable d’environnement. Après avoir défini le chemin dans une variable d’environnement, il est recommandé de redémarrer votre système. Parfois, il ne prend effet que lorsque vous redémarrez le système.
Ensuite, installez la bibliothèque Tesseract OCR dans votre projet PHP. Pour cela, exécutez la commande ci-dessous depuis le répertoire racine de votre projet.
composer require thiagoalessio/tesseract_ocr
Lire le texte à partir d’une image en PHP
Vous êtes prêt avec le logiciel et la bibliothèque Tesseract OCR. Maintenant, vous pouvez facilement détecter le texte dans l’image. Il ne nécessite que quelques lignes de code PHP. Disons que vous voulez lire le contenu de l’image ci-dessous.
Placez l’image dans le répertoire ‘images’ de votre projet. Dans le fichier PHP votre code sera le suivant :
<?php
require_once "vendor/autoload.php";
use thiagoalessioTesseractOCRTesseractOCR;
echo (new TesseractOCR('images/text.png'))
->run();
La sortie finale que vous devriez obtenir est la suivante :
The quick brown fox jumps over the lazy dog.
En utilisant Tesseract OCR, vous pouvez lire le texte de plusieurs langues. Tout ce que vous avez à faire est de télécharger le fichier de langue requis à partir de cet emplacement. Disons que vous voulez lire un texte écrit en allemand. Téléchargez le deu.traineddata
fichier et conservez-le à l’intérieur C:/Program Files/Tesseract-OCR/tessdata
.
Après cela, transmettez la langue ‘deu’ dans le code comme indiqué ci-dessous.
echo (new TesseractOCR('IMAGE_PATH'))
->lang('deu')
->run();
C’est ça! C’est aussi simple que cela. J’espère que vous avez appris à lire le texte de l’image en PHP. J’aimerais entendre vos pensées et suggestions dans la section des commentaires ci-dessous.
Articles Liés
- Speech-To-Text à l’aide d’Amazon Transcribe en PHP
- Intégration de la passerelle de paiement PayPal dans PHP à l’aide de l’API REST PayPal
- Comment détecter un appareil mobile en PHP