Tesseract
Зовнішній вигляд
Тип | OCR |
---|---|
Розробник | Hewlett-Packard, Google |
Стабільний випуск | 3.02 (28 жовтня 2012) |
Операційна система | Windows, Linux, Mac OS X |
Мова програмування | C C++ |
Ліцензія | Apache 2.0 |
Онлайн-документація | tesseract-ocr.github.io(англ.) |
Репозиторій | github.com/tesseract-ocr/tesseract.git |
Вебсайт | tesseract-ocr.googlecode.com |
Tesseract — вільна програма для розпізнавання текстів, розроблялася Hewlett-Packard з 1985 до 1994 року, а в наступне десятиріччя залишалася практично без змін. Не так давно Google купив[джерело?] її та відкрив початковий код під ліцензією Apache 2.0 у 2006 році.[2] для продовження розробки. У цей час програма вже працює з UTF-8, розпізнає багато мов, серед яких і українська.
Tesseract був використаний, зокрема, Міжнародним консорціумом журналістів-розслідувачів для дослідження інформації у так званих «панамських документах»[3].
- ↑ http://www.isri.unlv.edu/ISRI/Software#Experimental_Open_Source_OCR
- ↑ Vincent, Luc (August 2006). Announcing Tesseract OCR. Архів оригіналу за 18 березня 2012. Процитовано 26 червня 2008.
- ↑ Mar Cabra, Erin Kissane (11 квітня 2016). The People and Tech Behind the Panama Papers. opennews.org. An OpenNews project. Архів оригіналу за 11 квітня 2016. Процитовано 18 квітня 2016.
- Сторінка завантажень (компіляції, мовні пакети, вихідні коди) [Архівовано 18 березня 2012 у WebCite]
- Керівництво з навчання програми мові [Архівовано 5 березня 2009 у Wayback Machine.] (рос.)
Це незавершена стаття про програмне забезпечення. Ви можете допомогти проєкту, виправивши або дописавши її. |