[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

タグ

OCRに関するdrumscoのブックマーク (11)

  • Zinnia: 機械学習ベースのポータブルな手書き文字認識エンジン

    Zinnia: 機械学習ベースのポータブルなオンライン手書き文字認識エンジン [日語][英語] Zinniaは機械学習アルゴリズム SVM を用いたポータブルで汎用的な オンライン手書き文字認識エンジンです。Zinniaは組み込みの容易さと汎用性を高めるために、 文字のレンダリング機能は持っていません。Zinniaは文字のストローク情報を座標の連続として受け取り、 確からしい順にスコア付きでN文字の認識結果を返すだけに機能を限定しています。 また、認識エンジンは完全に機械学習ベースであるために、文字のみならずユーザの任意のマウス・ペンストロークに対して任意の文字列をマッピングするような認識エンジンを小コスト作成することができます。 主な特徴 機械学習アルゴリズムSVMによる高い認識精度 ポータブルでコンパクトな設計 -- POSIX/Windows (C++ STLのみに依存) リエント

  • 手書きの数式を自動認識してLaTeXやMathMLにする「Web Equation」

    指定された領域にマウスで式を書けば、大体1秒ぐらいで自動的に認識して解析、LaTeXやMathMLに変換して出力してくれる無料サービスがこの「Web Equation」です。 Web Equation https://webdemo.myscript.com/#/demo/equation これが初期画面、ここに数式をマウスで書けば自動的に認識してくれます 右上の国旗から日を選ぶとこうなります。「ここにお書き」と言われたので書いてみます。 このような複雑な式も変換OK 「MathML」のタブをクリックすればこのような感じで出力されます 多少汚くても認識してくれる模様 矢印も認識できました、なかなか便利で優秀です

    手書きの数式を自動認識してLaTeXやMathMLにする「Web Equation」
  • エバーノートでの名刺管理が便利すぎる件

    ペーパーレス化の一環として、名刺も電子化しています。名刺管理ソフトを利用しなくても、名刺をスキャンしてエバーノートに取り込めば、かなりの精度でOCR変換してくれて、後からキーワード検索で探すことが可能です。 無料アカウントで、これだけ出来るとは…。エバーノートは恐るべしサービスです。 名刺管理ソフトが役立たず 当初は、あまり良く考えずに、Scansnap S1300に付属していた名刺管理ソフトを利用して、名刺データを取り込んでいました。はっきりいってOCRが使い物にならず、「単にスキャンしているだけ」の状態でした。来なら住所や名前を完全にテキスト化して、後に年賀状やレターの送付に利用できるはずなのでしょうけど、現時点の性能だと結局目視チェックが必要なので、最初から自分で入力したほうが速いし正確です。 高価な名刺管理ソフトを購入すれば良いのかもしれませんが、そこまでする必要はないかなと。せ

    エバーノートでの名刺管理が便利すぎる件
  • Tesseract OCRをGUIから手軽に利用。画像やPDFをOCR処理する·gImageReader MOONGIFT

    gImageReaderはTesseract OCRのWindows/LinuxGUIフロントエンドPDFや画像をOCR処理する。 gImageReaderはWindows/Linux用のオープンソース・ソフトウェア。リアルとデジタルを繋ぐ技術は常に人気が高い。地図、写真、位置情報、交通機関の情報などリアルに関係するものはみんなが必要としている。疎sの一つ、リアルの情報を取り込む技術として知られるのがOCRだ。 PDFや画像を開く 名刺の読み取りを行うソフトウェアは何年経っても人気がある。スマートフォンが登場してさらに人気が高まっている。オープンソースのOCRであるTesseract OCRをGUIで扱うのがgImageReaderだ。 gImageReaderはPDFや画像ファイルを読み込んで、指定された言語に基準としてOCR処理を行うTesseract OCRフロントエンドだ。Te

  • きまぐれ日記: Zinnia: 機械学習ベースのポータブルなオンライン手書き文字認識エンジン

    オンライン手書き文字認識エンジンZinniaを公開しました。 http://zinnia.sourceforge.net/index-ja.html Zinniaは機械学習アルゴリズム SVM を用いたポータブルで汎用的な オンライン手書き文字認識エンジンです。Zinniaは組み込みの容易さと汎用性を高めるために、 文字のレンダリング機能は持っていません。Zinniaは文字のストローク情報を座標の連続として受け取り、 確からしい順にスコア付きでN文字の認識結果を返すだけに機能を限定しています。 また、認識エンジンは完全に機械学習ベースであるために、文字のみならずユーザの任意のマウス・ペンストロークに対して任意の文字列をマッピングするような認識エンジンを小コスト作成することができます。 2年前に、Ajax手書き文字認識と言うものを作ったのですが、その認識エンジンをスクラッチからポータブルでつ

    drumsco
    drumsco 2008/09/30
    SVMって、機械学習アルゴリズムのことなのか。
  • WeOCR Project Home

    Since Feb. 2005 / Last update: Sep. 15, 2019 End of Services Thank you very much for using the WeOCR services for more than twelve years. As we can see a lot of nice online OCR systems today, I have decided to close our services. The servers will be shutdown gradually, although some will remain working only for demonstration purposes. When I started developing "Online OCR service" in 2004, there w

    drumsco
    drumsco 2008/09/12
    WebベースのOCRサーバー
  • NHocr: 日本語文字認識プログラム プロジェクト日本語トップページ - OSDN

    NHocrはオープンソースの日語文字認識(OCR)プログラムです。Google Codeに置かれていたリポジトリは、NHocr 0.22以降、SourceForge.JPに移行しました。 SourceForge.JPのプロジェクトでは、パッケージの提供に加えて、NHocrに関する日語による文書提供などのユーザサポートを行います。 以下のサービスやアプリケーションでNHocrを試してみることができます。 * 日語文字認識 (WeOCRサービス) * Capture2Text

    NHocr: 日本語文字認識プログラム プロジェクト日本語トップページ - OSDN
  • 日本語文字認識

    語文字認識 - beta >> English page Since: Oct. 1, 2008 Updated: Jan 13, 2010 このサーバは OCRopusと NHocrを使って 文書画像中の日語文字を認識します。 文字の周囲にゴミや罫線があると認識に失敗します。 横書きの印刷文字のみに対応しています。 認識精度はまだ低いので、ご了承ください。 機密・秘密の画像は絶対に送信しないでください。 (BMP, JPEG, PBM/PGM/PPM, およびそれらのgzipで圧縮されたファイルが読めます。) server spec  | other OCR servers Powered by WeOCR, OCRopus, and NHocr. 日語文字行認識 - beta このサーバは NHocrを使って 文字行画像中の日語文字を認識します。 一行だけの文字列のイメージを

  • Ocrad - GNU Project - Free Software Foundation (FSF)

    Ocrad - The GNU OCR [ English | Español ] Introduction GNU Ocrad is an OCR (Optical Character Recognition) program and library based on a feature extraction method. It reads images in png or pnm formats and produces text in byte (8-bit) or UTF-8 formats. The formats pbm (bitmap), pgm (greyscale), and ppm (color) are collectively known as pnm. Ocrad includes a layout analyser able to separate the c

    drumsco
    drumsco 2007/06/23
  • Tesseract OCR

    A commercial quality OCR engine originally developed at HP between 1985 and 1995. In 1995, this engine was among the top 3 evaluated by UNLV. It was open-sourced by HP and UNLV in 2005. (NOTE: We're migrating to code.google.com. Please see the forums.)

  • http://recaptcha.net/

    drumsco
    drumsco 2007/05/25
    解読が困難な紙媒体をOCRで読み取り、CAPTCHAとして提供。正解となった結果を集計してたくさんの判別不能だった単語を拾うことにつなげられる
  • 1