Як читати текст із зображення в PHP
Хочете рішення, яке зчитує текст із зображення в PHP? Є деякі випадки, коли ви хочете читати текст програмно. Можливо, ви хочете перевірити, чи є текст на зображенні образливим, можливо, ви захочете розпізнати зображення з тексту тощо. У цій статті ми вивчаємо, як читати текст із зображення в PHP.
Tesseract OCR – це механізм OCR з відкритим кодом, який дозволяє виявляти текст на зображенні. Користувач може встановити механізм розпізнавання Tesseract на такі ОС, як Windows, macOS, Linux. Ви отримаєте інструкцію з монтажу в їх документації.
Встановлення Tesseract OCR Engine
Як вже було сказано вище, Tesseract OCR забезпечує підтримку всіх основних ОС. У цьому посібнику я припускаю, що ви використовуєте ОС Windows. Існує 2 способи встановити Tesseract OCR на машини Windows. Один використовує інсталятор, а інший – Chocolatey. Chocolatey – це менеджер пакетів для Windows та зручний для розробників.
Спочатку завантажте інсталятор для Windows. Виберіть інсталятор для 32-розрядної або 64-розрядної системи залежно від конфігурації вашої машини. Завершіть процес встановлення.
Якщо ви хочете встановити його за допомогою Chocolatey, просто запустіть команду нижче в Windows Powershell. Переконайтесь, що ви виконуєте команду як адміністратор.
choco install capture2text --version 3.9
Після встановлення Tesseract OCR на ОС Windows встановіть цей шлях C:Program FilesTesseract-OCR
у змінній середовища. Після встановлення шляху у змінній середовища рекомендується перезапустити систему. Іноді це не набуває чинності, поки ви не перезапустите систему.
Далі встановіть бібліотеку Tesseract OCR у своєму PHP-проекті. Для цього виконайте наведену нижче команду з кореневого каталогу проекту.
composer require thiagoalessio/tesseract_ocr
Читання тексту із зображення в PHP
Ви готові до використання програмного забезпечення та бібліотеки Tesseract OCR. Тепер ви можете легко виявити текст на зображенні. Для цього потрібно лише кілька рядків PHP-коду. Скажімо, ви хочете прочитати зміст зображення нижче.
Помістіть зображення в каталог «images» вашого проекту. У файлі PHP ваш код буде таким:
<?php
require_once "vendor/autoload.php";
use thiagoalessioTesseractOCRTesseractOCR;
echo (new TesseractOCR('images/text.png'))
->run();
Остаточний результат ви повинні отримати таким:
The quick brown fox jumps over the lazy dog.
Використовуючи Tesseract OCR, ви можете читати текст різними мовами. Все, що вам потрібно зробити, – це завантажити потрібний мовний файл з цього місця. Скажімо, ви хочете прочитати текст, написаний німецькою мовою. Завантажте deu.traineddata
файл і зберігайте його всередині C:/Program Files/Tesseract-OCR/tessdata
.
Після цього передайте мову ‘deu’ в код, як показано нижче.
echo (new TesseractOCR('IMAGE_PATH'))
->lang('deu')
->run();
Це воно! Це все так просто. Сподіваюсь, ви знали, як читати текст із зображення в PHP. Я хотів би почути ваші думки та пропозиції у розділі коментарів нижче.
Пов’язані статті
- Мова до тексту за допомогою Amazon Transcribe у PHP
- Інтеграція PayPal Payment Gateway у PHP за допомогою API REST PayPal
- Як виявити мобільний пристрій у PHP