Kuinka lukea tekstiä kuvasta PHP: ssä
Haluatko ratkaisun, joka lukee tekstiä PHP: n kuvasta? Joissakin tapauksissa haluat lukea tekstiä ohjelmallisesti. Luultavasti haluat tarkistaa, onko kuvan teksti väärinkäyttäjä, voit tunnistaa kuvan tekstistä jne. Tässä artikkelissa tutkitaan, miten luetaan tekstiä kuvasta PHP: ssä.
Tesseract OCR on avoimen lähdekoodin OCR-moottori, jonka avulla voimme havaita tekstin kuvassa. Käyttäjä voi asentaa Tesseract OCR -moottorin käyttöjärjestelmään, kuten Windows, macOS, Linux. Saat asennusohjeet heidän asiakirjoistaan.
Tesseract OCR -moottorin asennus
Kuten edellä todettiin, Tesseract OCR tarjoaa tukea kaikille tärkeimmille käyttöjärjestelmille. Oletan, että käytät tätä opetusohjelmaa Windows-käyttöjärjestelmällä. On kaksi tapaa asentaa Tesseract OCR Windows-koneisiin. Yksi käyttää asennusohjelmaa ja toinen Chocolatey-ohjelmaa. Chocolatey on Windows-paketinhallinta ja käyttäjäystävällinen kehittäjille.
Ensinnäkin, lataa asennusohjelma Windowsille. Valitse 32- tai 64-bittisen järjestelmän asennusohjelma koneesi kokoonpanon perusteella. Suorita asennus loppuun.
Jos haluat asentaa sen Chocolateyn avulla, suorita alla oleva komento Windows Powershellissä. Varmista, että käytät komentoa järjestelmänvalvojana.
choco install capture2text --version 3.9
Kun olet asentanut Tesseract OCR: n Windows-käyttöjärjestelmään, aseta tämä polku C:Program FilesTesseract-OCR
ympäristömuuttujaasi. Kun polku on asetettu ympäristömuuttujaan, on suositeltavaa käynnistää järjestelmä uudelleen. Joskus se ei tule voimaan ennen kuin käynnistät järjestelmän uudelleen.
Asenna seuraavaksi Tesseract OCR -kirjasto PHP-projektiisi. Suorita tätä varten alla oleva komento projektin juurihakemistosta.
composer require thiagoalessio/tesseract_ocr
Lue tekstiä kuvasta PHP: ssä
Olet valmis Tesseract OCR -ohjelmistoon ja kirjastoon. Nyt voit helposti tunnistaa kuvan tekstistä. Se vaatii vain muutaman rivin PHP-koodia. Oletetaan, että haluat lukea alla olevan kuvan sisällön.
Sijoita kuva projektisi "images" -hakemistoon. PHP-tiedostossa koodisi on seuraava:
<?php
require_once "vendor/autoload.php";
use thiagoalessioTesseractOCRTesseractOCR;
echo (new TesseractOCR('images/text.png'))
->run();
Lopputulos, jonka sinun pitäisi saada, on seuraava:
The quick brown fox jumps over the lazy dog.
Tesseract OCR: n avulla voit lukea eri kielien tekstiä. Sinun tarvitsee vain ladata vaadittu kielitiedosto tästä sijainnista. Oletetaan, että haluat lukea saksaksi kirjoitettua tekstiä. Lataa deu.traineddata
tiedosto ja pidä se sisällä C:/Program Files/Tesseract-OCR/tessdata
.
Tämän jälkeen välitä ‘deu’ -kieli koodissa alla olevan kuvan mukaisesti.
echo (new TesseractOCR('IMAGE_PATH'))
->lang('deu')
->run();
Se siitä! Se on niin yksinkertaista. Toivon, että sait tietää kuinka lukea tekstiä kuvasta PHP: ssä. Haluaisin kuulla ajatuksesi ja ehdotuksesi alla olevassa kommenttiosassa.