Как читать текст с изображения в PHP
Вам нужно решение, которое считывает текст с изображения на PHP? В некоторых случаях вы хотите читать текст программно. Возможно, вы хотите проверить, является ли текст на изображении оскорбительным, вы можете захотеть распознать изображение по тексту и т.д. В этой статье мы изучаем, как читать текст с изображения в PHP.
Tesseract OCR – это движок OCR с открытым исходным кодом, который позволяет нам обнаруживать текст на изображении. Пользователь может установить движок Tesseract OCR на такие ОС, как Windows, macOS, Linux. Вы получите инструкцию по установке в их документации.
Установка Tesseract OCR Engine
Как было сказано выше, Tesseract OCR поддерживает все основные ОС. В этом руководстве я предполагаю, что вы используете ОС Windows. Есть 2 способа установить Tesseract OCR на машины с Windows. Один использует установщик, а другой – Chocolatey. Chocolatey – это менеджер пакетов для Windows, удобный для разработчиков.
Первым способом Скачайте установщик для Windows. Выберите установщик для 32-битной или 64-битной системы в зависимости от конфигурации вашего компьютера. Завершите процесс установки.
Если вы хотите установить его с помощью Chocolatey, просто выполните приведенную ниже команду в Windows Powershell. Убедитесь, что вы запускаете команду от имени администратора.
choco install capture2text --version 3.9
После установки Tesseract OCR в ОС Windows укажите этот путь C:Program FilesTesseract-OCR
в переменной среды. После установки пути в переменной среды рекомендуется перезагрузить систему. Иногда это не вступает в силу, пока вы не перезапустите систему.
Затем установите библиотеку Tesseract OCR в свой проект PHP. Для этого выполните приведенную ниже команду из корневого каталога вашего проекта.
composer require thiagoalessio/tesseract_ocr
Чтение текста из изображения в PHP
Вы готовы с программным обеспечением и библиотекой Tesseract OCR. Теперь вы можете легко обнаружить текст на изображении. Для этого требуется всего несколько строк кода PHP. Допустим, вы хотите прочитать содержимое изображения ниже.
Поместите изображение в каталог images вашего проекта. В файле PHP ваш код будет следующим:
<?php
require_once "vendor/autoload.php";
use thiagoalessioTesseractOCRTesseractOCR;
echo (new TesseractOCR('images/text.png'))
->run();
Окончательный результат должен получиться следующим образом:
The quick brown fox jumps over the lazy dog.
Используя Tesseract OCR, вы можете читать текст на разных языках. Все, что вам нужно сделать, это загрузить нужный языковой файл из этого места. Допустим, вы хотите прочитать текст, написанный на немецком языке. Загрузите deu.traineddata
файл и храните его внутри C:/Program Files/Tesseract-OCR/tessdata
.
После этого передайте в коде язык deu, как показано ниже.
echo (new TesseractOCR('IMAGE_PATH'))
->lang('deu')
->run();
Это оно! Это так просто. Надеюсь, вы научились читать текст с изображения в PHP. Я хотел бы услышать ваши мысли и предложения в разделе комментариев ниже.
Статьи по Теме
- Преобразование речи в текст с использованием Amazon Transcribe на PHP
- Интеграция PayPal Payment Gateway в PHP с использованием PayPal REST API
- Как определить мобильное устройство в PHP