[B! OCR] drumscoのブックマーク

drumsco id:drumsco

OCRに関するdrumscoのブックマーク (11)

Zinnia: 機械学習ベースのポータブルな手書き文字認識エンジン
Zinnia: 機械学習ベースのポータブルなオンライン手書き文字認識エンジン [日本語][英語] Zinniaは機械学習アルゴリズム SVM を用いたポータブルで汎用的なオンライン手書き文字認識エンジンです。Zinniaは組み込みの容易さと汎用性を高めるために、文字のレンダリング機能は持っていません。Zinniaは文字のストローク情報を座標の連続として受け取り、確からしい順にスコア付きでN文字の認識結果を返すだけに機能を限定しています。また、認識エンジンは完全に機械学習ベースであるために、文字のみならずユーザの任意のマウス・ペンストロークに対して任意の文字列をマッピングするような認識エンジンを小コスト作成することができます。主な特徴機械学習アルゴリズムSVMによる高い認識精度ポータブルでコンパクトな設計 -- POSIX/Windows (C++ STLのみに依存) リエント
drumsco 2012/06/15
OCR

C++

STL

OSS

BSD
リンク
手書きの数式を自動認識してLaTeXやMathMLにする「Web Equation」
指定された領域にマウスで式を書けば、大体1秒ぐらいで自動的に認識して解析、LaTeXやMathMLに変換して出力してくれる無料サービスがこの「Web Equation」です。 Web Equation https://webdemo.myscript.com/#/demo/equation これが初期画面、ここに数式をマウスで書けば自動的に認識してくれます右上の国旗から日本を選ぶとこうなります。「ここにお書き」と言われたので書いてみます。このような複雑な式も変換OK 「MathML」のタブをクリックすればこのような感じで出力されます多少汚くても認識してくれる模様矢印も認識できました、なかなか便利で優秀です
drumsco 2012/02/03
math

OCR

web-service

TeX

MathML
リンク
エバーノートでの名刺管理が便利すぎる件
ペーパーレス化の一環として、名刺も電子化しています。名刺管理ソフトを利用しなくても、名刺をスキャンしてエバーノートに取り込めば、かなりの精度でOCR変換してくれて、後からキーワード検索で探すことが可能です。無料アカウントで、これだけ出来るとは…。エバーノートは恐るべしサービスです。名刺管理ソフトが役立たず当初は、あまり良く考えずに、Scansnap S1300に付属していた名刺管理ソフトを利用して、名刺データを取り込んでいました。はっきりいってOCRが使い物にならず、「単にスキャンしているだけ」の状態でした。本来なら住所や名前を完全にテキスト化して、後に年賀状やレターの送付に利用できるはずなのでしょうけど、現時点の性能だと結局目視チェックが必要なので、最初から自分で入力したほうが速いし正確です。高価な名刺管理ソフトを購入すれば良いのかもしれませんが、そこまでする必要はないかなと。せ
drumsco 2011/10/27
lifehack

Evernote

OCR
リンク
Tesseract OCRをGUIから手軽に利用。画像やPDFをOCR処理する·gImageReader MOONGIFT
gImageReaderはTesseract OCRのWindows/Linux用GUI フロントエンド。PDFや画像をOCR処理する。 gImageReaderはWindows/Linux用のオープンソース・ソフトウェア。リアルとデジタルを繋ぐ技術は常に人気が高い。地図、写真、位置情報、交通機関の情報などリアルに関係するものはみんなが必要としている。疎sの一つ、リアルの情報を取り込む技術として知られるのがOCRだ。 PDFや画像を開く名刺の読み取りを行うソフトウェアは何年経っても人気がある。スマートフォンが登場してさらに人気が高まっている。オープンソースのOCRであるTesseract OCRをGUIで扱うのがgImageReaderだ。 gImageReaderはPDFや画像ファイルを読み込んで、指定された言語に基準としてOCR処理を行うTesseract OCRフロントエンドだ。Te
drumsco 2011/06/22
OCR

Windows
リンク
きまぐれ日記: Zinnia: 機械学習ベースのポータブルなオンライン手書き文字認識エンジン
オンライン手書き文字認識エンジンZinniaを公開しました。 http://zinnia.sourceforge.net/index-ja.html Zinniaは機械学習アルゴリズム SVM を用いたポータブルで汎用的なオンライン手書き文字認識エンジンです。Zinniaは組み込みの容易さと汎用性を高めるために、文字のレンダリング機能は持っていません。Zinniaは文字のストローク情報を座標の連続として受け取り、確からしい順にスコア付きでN文字の認識結果を返すだけに機能を限定しています。また、認識エンジンは完全に機械学習ベースであるために、文字のみならずユーザの任意のマウス・ペンストロークに対して任意の文字列をマッピングするような認識エンジンを小コスト作成することができます。 2年前に、Ajax手書き文字認識と言うものを作ったのですが、その認識エンジンをスクラッチからポータブルでつ
drumsco 2008/09/30
SVMって、機械学習アルゴリズムのことなのか。

library

SVM

OCR
リンク
WeOCR Project Home
Since Feb. 2005 / Last update: Sep. 15, 2019 End of Services Thank you very much for using the WeOCR services for more than twelve years. As we can see a lot of nice online OCR systems today, I have decided to close our services. The servers will be shutdown gradually, although some will rem ain working only for demonstration purposes. When I started developing "Online OCR service" in 2004, there w
drumsco 2008/09/12
WebベースのOCRサーバー

OCR

*web
リンク
NHocr: 日本語文字認識プログラムプロジェクト日本語トップページ - OSDN
NHocrはオープンソースの日本語文字認識(OCR)プログラムです。Google Codeに置かれていたリポジトリは、NHocr 0.22以降、SourceForge.JPに移行しました。 SourceForge.JPの本プロジェクトでは、パッケージの提供に加えて、NHocrに関する日本語による文書提供などのユーザサポートを行います。以下のサービスやアプリケーションでNHocrを試してみることができます。 * 日本語文字認識 (WeOCRサービス) * Capture2Text
drumsco 2008/09/12
OCR

日本語
リンク
日本語文字認識
日本語文字認識 - beta >> English page Since: Oct. 1, 2008 Updated: Jan 13, 2010 このサーバは OCRopusと NHocrを使って文書画像中の日本語文字を認識します。文字の周囲にゴミや罫線があると認識に失敗します。横書きの印刷文字のみに対応しています。認識精度はまだ低いので、ご了承ください。機密・秘密の画像は絶対に送信しないでください。 (BMP, JPEG, PBM/PGM/PPM, およびそれらのgzipで圧縮されたファイルが読めます。) server spec | other OCR servers Powered by WeOCR, OCRopus, and NHocr. 日本語文字行認識 - beta このサーバは NHocrを使って文字行画像中の日本語文字を認識します。一行だけの文字列のイメージを
drumsco 2008/09/12
OCR

日本語

web-service
リンク
Ocrad - GNU Project - Free Software Foundation (FSF)
Ocrad - The GNU OCR [ English | Español ] Introduction GNU Ocrad is an OCR (Optical Character Recognition) program and library based on a feature extraction method. It reads images in png or pnm formats and produces text in byte (8-bit) or UTF-8 formats. The formats pbm (bit map), pgm (greyscale), and ppm (color) are collectively known as pnm. Ocrad includes a layout analyser able to separate the c
drumsco 2007/06/23
OCR
リンク
Tesseract OCR
A commercial quality OCR engine originally developed at HP between 1985 and 1995. In 1995, this engine was among the top 3 evaluated by UNLV. It was open-sourced by HP and UNLV in 2005. (NOTE: We're migrating to code.google.com. Please see the forums.)
drumsco 2007/06/23
Google

OCR
リンク
http://recaptcha.net/
drumsco 2007/05/25
解読が困難な紙媒体をOCRで読み取り、CAPTCHAとして提供。正解となった結果を集計してたくさんの判別不能だった単語を拾うことにつなげられる

captcha

web-service

OCR
リンク
1