✅ WEB ja WordPressi uudised, teemad, pistikprogrammid. Siin jagame näpunäiteid ja parimaid veebisaidi lahendusi.

Kuidas lugeda pilti teksti PHP-s

19

Kas soovite lahendust, mis loeb teksti PHP-st pildilt? Mõnel juhul soovite teksti programmiliselt lugeda. Tõenäoliselt soovite kontrollida, kas pildil olev tekst on kuritahtlik, võiksite pildi teksti järgi ära tunda jne. Selles artiklis uurime, kuidas lugeda pilti teksti PHP-s.

Tesseract OCR on avatud lähtekoodiga OCR-mootor, mis võimaldab meil tuvastada pildil olevat teksti. Kasutaja saab installida Tesseract OCR-i mootori operatsioonisüsteemi nagu Windows, macOS, Linux. Installimisjuhised leiate nende dokumentatsioonist.

Tesseract OCR mootori paigaldamine

Nagu eespool öeldud, pakub Tesseract OCR tuge kõigile peamistele operatsioonisüsteemidele. Selle õpetuse jaoks eeldan, et kasutate Windows OS-i. Tesseract OCR-i installimiseks Windowsi masinatesse on kaks võimalust. Üks kasutab installerit ja teine Chocolateyt. Chocolatey on Windowsi paketihaldur ja kasutajasõbralik arendajatele.

Esimesel viisil laadige Windowsi jaoks alla installiprogramm. Valige oma arvuti konfiguratsioonist lähtuvalt 32- või 64-bitise süsteemi installer. Viige installiprotsess lõpule.

Kui soovite selle installida Chocolatey abil, käivitage lihtsalt Windowsi Powershellis allolev käsk. Veenduge, et kasutate käsku administraatorina.

choco install capture2text --version 3.9

Kui olete installinud Tesseract OCR-i oma Windows OS-i, määrake see tee C:Program FilesTesseract-OCRoma keskkonnamuutujaks. Pärast muutuja Keskkond tee määramist on soovitatav süsteem taaskäivitada. Mõnikord ei jõua see enne süsteemi taaskäivitamist.

Järgmisena installige Tesseract OCR-i teek oma PHP-projekti. Selleks käivitage projekti juurkataloogist allpool olev käsk.

composer require thiagoalessio/tesseract_ocr

Loe teksti pildilt PHP-s

Olete valmis Tesseract OCR tarkvara ja teegiga. Nüüd saate hõlpsalt pildil teksti tuvastada. See nõuab lihtsalt mõnda rida PHP-koodi. Oletame, et soovite lugeda alloleva pildi sisu.

Kuidas lugeda pilti teksti PHP-s

Pange pilt oma projekti kataloogi ‘images’. PHP-failis on teie kood järgmine:

<?php
require_once "vendor/autoload.php";
 
use thiagoalessioTesseractOCRTesseractOCR;
 
echo (new TesseractOCR('images/text.png'))
    ->run();

Lõplik väljund, mille peaksite saama, on järgmine:

The quick brown fox jumps over the lazy dog.

Tesseract OCR-i abil saate lugeda mitmesuguste keelte teksti. Kõik, mida peate tegema, on vajaliku keelefaili allalaadimine sellest asukohast. Oletame, et soovite lugeda saksa keeles kirjutatud teksti. Laadige deu.traineddatafail alla ja hoidke seda sees C:/Program Files/Tesseract-OCR/tessdata.

Pärast seda edastage koodis deu keel, nagu allpool näidatud.

echo (new TesseractOCR('IMAGE_PATH'))
    ->lang('deu')
    ->run();

See selleks! Nii lihtne see ongi. Loodetavasti õppisite PHP-s pildilt teksti lugema. Tahaksin kuulda teie mõtteid ja ettepanekuid allpool olevas kommentaaride jaotises.

seotud artiklid

See veebisait kasutab teie kasutuskogemuse parandamiseks küpsiseid. Eeldame, et olete sellega rahul, kuid saate soovi korral loobuda. Nõustu Loe rohkem