Jak používat Tesseract OCR v Javě

Autor: Robert Simon
Datum Vytvoření: 19 Červen 2021
Datum Aktualizace: 1 Prosinec 2024
Anonim
Jak používat Tesseract OCR v Javě - Články
Jak používat Tesseract OCR v Javě - Články

Obsah

Knihovny Tesseract pro optické rozpoznávání znaků nabízejí vývojářům způsob skenování dokumentů a textu do obrazu. Používají se k ukládání obrázků dokumentů, které již nepotřebujete na papíře. Můžete je použít v jazyce Java vytvořením řídicích smyček pro každý znak a zápisem do souboru. Chcete-li používat knihovny Tesseract, musíte pro funkce OCR zahrnout "obor názvů Java".


Pokyny

Knihovny Tesseract umožňují uživatelům skenovat dokumenty (John Foxx / Stockbyte / Getty Images)
  1. Klepněte pravým tlačítkem myši na soubor Java, který chcete použít k vytvoření dokumentu OCR. Klikněte na "Otevřít v" a vyberte Java editor podle svého výběru.

  2. V horní části souboru přidejte obor názvů knihovny OCR. Zkopírujte a vložte následující kód do zdrojového souboru:

    com.touch.robot.imagecomparison.tesseractocr

  3. Vytvořte kód zodpovědný za skenování znaků pro soubor. Následující kód například vytvoří smyčky přes každý znak v souboru a zapíše je do obrazového souboru:

    (I = 1; {i} <{řádky} +1; i = {i}) je množina hodnot, které jsou definovány jako: +1) {Typeline "{_TOCR_LINE {i}}"}


  4. Klikněte na tlačítko "Uložit" editoru a klikněte na "Spustit" pro spuštění kódu v kompilátoru Java.