✅ Notícias, temas e plug-ins da WEB e do WordPress. Aqui compartilhamos dicas e as melhores soluções para sites.

Como ler texto de imagem em PHP

510

Você quer uma solução que leia texto de uma imagem em PHP? Existem alguns casos em que você deseja ler texto programaticamente. Provavelmente, você deseja verificar se o texto em uma imagem é abusivo, você pode querer reconhecer a imagem do texto, etc. Neste artigo, estudamos como ler o texto de uma imagem em PHP.

O Tesseract OCR é um mecanismo de OCR de código aberto que nos permite detectar texto na imagem. O usuário pode instalar o mecanismo de OCR Tesseract em sistemas operacionais como Windows, macOS, Linux. Você obterá as instruções de instalação em sua documentação.

Instalação do Tesseract OCR Engine

Como dito acima, o Tesseract OCR está fornecendo suporte para todos os principais sistemas operacionais. Para este tutorial, presumo que você esteja usando o sistema operacional Windows. Existem 2 maneiras de instalar o Tesseract OCR em máquinas Windows. Um está usando o instalador e outro está usando Chocolatey. O Chocolatey é um gerenciador de pacotes para Windows e fácil de usar para desenvolvedores.

Na primeira forma, baixe o instalador para Windows. Escolha o instalador para o sistema de 32 ou 64 bits com base na configuração da sua máquina. Conclua o processo de instalação.

Se você deseja instalá-lo usando o Chocolatey, basta executar o comando abaixo no Windows Powershell. Certifique-se de estar executando um comando como administrador.

choco install capture2text --version 3.9

Depois de instalar o Tesseract OCR em seu sistema operacional Windows, defina este caminho C:Program FilesTesseract-OCRem sua variável de ambiente. Depois de definir o caminho em uma variável de ambiente, é recomendável reiniciar o sistema. Às vezes, ele não tem efeito até que você reinicie o sistema.

Em seguida, instale a biblioteca Tesseract OCR em seu projeto PHP. Para isso, execute o comando abaixo a partir do diretório raiz do seu projeto.

composer require thiagoalessio/tesseract_ocr

Leia o texto da imagem em PHP

Você está pronto com o software e a biblioteca Tesseract OCR. Agora, você pode detectar facilmente o texto na imagem. Requer apenas algumas linhas de código PHP. Digamos que você queira ler o conteúdo da imagem abaixo.

Como ler texto de imagem em PHP

Coloque a imagem no diretório ‘imagens’ do seu projeto. No arquivo PHP, seu código será o seguinte:

<?php
require_once "vendor/autoload.php";
 
use thiagoalessioTesseractOCRTesseractOCR;
 
echo (new TesseractOCR('images/text.png'))
    ->run();

O resultado final que você deve obter da seguinte maneira:

The quick brown fox jumps over the lazy dog.

Usando o Tesseract OCR, você pode ler o texto em vários idiomas. Tudo que você precisa fazer é baixar o arquivo de idioma necessário deste local. Digamos que você queira ler um texto escrito em alemão. Baixe o deu.traineddataarquivo e mantenha-o dentro C:/Program Files/Tesseract-OCR/tessdata.

Após isso, passe a linguagem ‘deu’ no código conforme mostrado abaixo.

echo (new TesseractOCR('IMAGE_PATH'))
    ->lang('deu')
    ->run();

É isso! É simples assim. Espero que você saiba como ler o texto da imagem em PHP. Eu gostaria de ouvir seus pensamentos e sugestões na seção de comentários abaixo.

Artigos relacionados

Fonte de gravação: artisansweb.net

Este site usa cookies para melhorar sua experiência. Presumiremos que você está ok com isso, mas você pode cancelar, se desejar. Aceitar Consulte Mais informação