...
WEB и WordPress новости, темы, плагины. Здесь мы делимся советами и лучшими решениями для сайтов.

Как читать текст с изображения в PHP

169

Вам нужно решение, которое считывает текст с изображения на PHP? В некоторых случаях вы хотите читать текст программно. Возможно, вы хотите проверить, является ли текст на изображении оскорбительным, вы можете захотеть распознать изображение по тексту и т.д. В этой статье мы изучаем, как читать текст с изображения в PHP.

Tesseract OCR – это движок OCR с открытым исходным кодом, который позволяет нам обнаруживать текст на изображении. Пользователь может установить движок Tesseract OCR на такие ОС, как Windows, macOS, Linux. Вы получите инструкцию по установке в их документации.

Установка Tesseract OCR Engine

Как было сказано выше, Tesseract OCR поддерживает все основные ОС. В этом руководстве я предполагаю, что вы используете ОС Windows. Есть 2 способа установить Tesseract OCR на машины с Windows. Один использует установщик, а другой – Chocolatey. Chocolatey – это менеджер пакетов для Windows, удобный для разработчиков.

Первым способом Скачайте установщик для Windows. Выберите установщик для 32-битной или 64-битной системы в зависимости от конфигурации вашего компьютера. Завершите процесс установки.

Если вы хотите установить его с помощью Chocolatey, просто выполните приведенную ниже команду в Windows Powershell. Убедитесь, что вы запускаете команду от имени администратора.

choco install capture2text --version 3.9

После установки Tesseract OCR в ОС Windows укажите этот путь C:Program FilesTesseract-OCRв переменной среды. После установки пути в переменной среды рекомендуется перезагрузить систему. Иногда это не вступает в силу, пока вы не перезапустите систему.

Затем установите библиотеку Tesseract OCR в свой проект PHP. Для этого выполните приведенную ниже команду из корневого каталога вашего проекта.

composer require thiagoalessio/tesseract_ocr

Чтение текста из изображения в PHP

Вы готовы с программным обеспечением и библиотекой Tesseract OCR. Теперь вы можете легко обнаружить текст на изображении. Для этого требуется всего несколько строк кода PHP. Допустим, вы хотите прочитать содержимое изображения ниже.

Как читать текст с изображения в PHP

Поместите изображение в каталог images вашего проекта. В файле PHP ваш код будет следующим:

<?php
require_once "vendor/autoload.php";
 
use thiagoalessioTesseractOCRTesseractOCR;
 
echo (new TesseractOCR('images/text.png'))
    ->run();

Окончательный результат должен получиться следующим образом:

The quick brown fox jumps over the lazy dog.

Используя Tesseract OCR, вы можете читать текст на разных языках. Все, что вам нужно сделать, это загрузить нужный языковой файл из этого места. Допустим, вы хотите прочитать текст, написанный на немецком языке. Загрузите deu.traineddataфайл и храните его внутри C:/Program Files/Tesseract-OCR/tessdata.

После этого передайте в коде язык deu, как показано ниже.

echo (new TesseractOCR('IMAGE_PATH'))
    ->lang('deu')
    ->run();

Это оно! Это так просто. Надеюсь, вы научились читать текст с изображения в PHP. Я хотел бы услышать ваши мысли и предложения в разделе комментариев ниже.

Статьи по Теме

Источник записи: artisansweb.net

Этот веб-сайт использует файлы cookie для улучшения вашего опыта. Мы предполагаем, что вы согласны с этим, но вы можете отказаться, если хотите. Принимаю Подробнее