Come leggere il testo dall’immagine in PHP
Vuoi una soluzione che legga il testo da un’immagine in PHP? Esistono alcuni casi in cui si desidera leggere il testo a livello di codice. Probabilmente vuoi verificare se il testo su un’immagine è offensivo, potresti voler riconoscere l’immagine dal testo, ecc. In questo articolo, studiamo come leggere il testo da un’immagine in PHP.
Tesseract OCR è un motore OCR open source che ci consente di rilevare il testo nell’immagine. L’utente può installare il motore OCR Tesseract su sistemi operativi come Windows, macOS, Linux. Riceverai le istruzioni di installazione sulla loro documentazione.
Installazione del motore Tesseract OCR
Come detto sopra, Tesseract OCR fornisce supporto a tutti i principali sistemi operativi. Per questo tutorial, presumo che tu stia utilizzando il sistema operativo Windows. Esistono 2 modi per installare Tesseract OCR su macchine Windows. Uno sta usando il programma di installazione e un altro sta usando Chocolatey. Chocolatey è un gestore di pacchetti per Windows e facile da usare per gli sviluppatori.
Nel primo modo, scarica il programma di installazione per Windows. Scegli il programma di installazione per il sistema a 32 bit o 64 bit in base alla configurazione della tua macchina. Completa il processo di installazione.
Se desideri installarlo utilizzando Chocolatey, esegui semplicemente il comando seguente in Windows Powershell. Assicurati di eseguire un comando come amministratore.
choco install capture2text --version 3.9
Dopo aver installato Tesseract OCR sul tuo sistema operativo Windows, imposta questo percorso C:Program FilesTesseract-OCR
nella variabile di ambiente. Dopo aver impostato il percorso in una variabile d’ambiente, si consiglia di riavviare il sistema. A volte non ha effetto finché non si riavvia il sistema.
Successivamente, installa la libreria Tesseract OCR nel tuo progetto PHP. Per questo, esegui il comando seguente dalla directory principale del tuo progetto.
composer require thiagoalessio/tesseract_ocr
Leggi il testo dall’immagine in PHP
Sei pronto con il software e la libreria Tesseract OCR. Ora puoi facilmente rilevare il testo nell’immagine. Richiede solo poche righe di codice PHP. Supponiamo che tu voglia leggere il contenuto dell’immagine sottostante.
Posiziona l’immagine nella directory "immagini" del tuo progetto. Nel file PHP il tuo codice sarà il seguente:
<?php
require_once "vendor/autoload.php";
use thiagoalessioTesseractOCRTesseractOCR;
echo (new TesseractOCR('images/text.png'))
->run();
L’output finale che dovresti ottenere come segue:
The quick brown fox jumps over the lazy dog.
Usando Tesseract OCR, puoi leggere il testo di varie lingue. Tutto quello che devi fare è scaricare il file della lingua richiesto da questa posizione. Supponiamo che tu voglia leggere il testo scritto in lingua tedesca. Scarica il deu.traineddata
file e conservalo all’interno C:/Program Files/Tesseract-OCR/tessdata
.
Successivamente, passa la lingua ‘deu’ nel codice come mostrato di seguito.
echo (new TesseractOCR('IMAGE_PATH'))
->lang('deu')
->run();
Questo è tutto! È così semplice. Spero che tu sappia come leggere il testo dall’immagine in PHP. Mi piacerebbe sentire i tuoi pensieri e suggerimenti nella sezione commenti qui sotto.
articoli Correlati
- Speech-to-Text utilizzando Amazon Transcribe in PHP
- Integrazione del gateway di pagamento PayPal in PHP utilizzando l’API REST di PayPal
- Come rilevare un dispositivo mobile in PHP