[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

タグ

ocrに関するproto_jpのブックマーク (4)

  • Mokuro(Manga-OCR)漫画画像の文字認識・HTML出力を試す Windowsで動かす方法解説

    これらをインストール&パスの通った状態にします。 仮想環境作成 適当なフォルダを作成し、フォルダ内で右クリック→「ターミナルで開く」を選択。 フォルダ内にPyhtonの仮想環境を構築します。 以下のコマンドをコピペして実行しましょう。 python -m venv venv venv\Scripts\activate.ps1 警告は気にせず貼り付けてください。 これで仮想環境が作成できました。 必要なモジュールをインストール ターミナルに以下のコマンドを入力してください。 pip3 install mokuro 2,Mokuroを動かす方法&実力を実演してみる Mokuroを動かす方法 ターミナルに以下のように、漫画の画像が何枚も入っているフォルダを指定したコマンドを打ちます。 mokuro D:\test\manga-image-pass こんな感じです。 あとはフォルダ内を1つのHTM

  • Google DocsのOCR変換機能が日本語に対応

    PDFファイルやスキャナで読み込んだ文書の画像ファイルをGoogle Docsにアップロードすると、編集可能なテキストファイルに変換できる機能が横書きの日語に対応した。 米Googleは2月28日(現地時間)、昨年6月にGoogle Docsに追加したOCR(光学式文字認識)機能を、新たに日語を含む29カ国語に対応させたと発表した。日語のPDFやスキャナやデジカメで取り込んだ文字を含む画像をGoogle Docsにアップロードすると、ファイルがテキストデータに変換される。 使い方は、Google Docsの「アップロード」の画面で変換オプションを以下のように設定し、「アップロードを開始」をクリックする。変換が可能なファイル容量の上限は2Mバイトだ。 実際にやってみたところ、PDFではほぼ問題なくテキストに変換されたが、デジカメで撮影した画像からの変換の精度はまだ高いとはいえないようだ

    Google DocsのOCR変換機能が日本語に対応
  • ニュース: NHocrのソースコードを初公開 (ver 0.16(beta)) - NHocr: 日本語文字認識プログラム - OSDN

    語文字認識プログラムNHocrのソースコードを初公開しました (ver 0.16(beta))。Solaris SPARC/x86, Linux (x86_64)上で動作確認済みです。OCRopusからの呼び出しが可能です。文字行認識部がライブラリ化されており、自作プログラムからの利用も容易です。

    ニュース: NHocrのソースコードを初公開 (ver 0.16(beta)) - NHocr: 日本語文字認識プログラム - OSDN
    proto_jp
    proto_jp 2009/05/26
    日本語文字認識プログラムNHocrのソースコードを初公開しました
  • 日本語文字認識

    語文字認識 - beta >> English page Since: Oct. 1, 2008 Updated: Jan 13, 2010 このサーバは OCRopusと NHocrを使って 文書画像中の日語文字を認識します。 文字の周囲にゴミや罫線があると認識に失敗します。 横書きの印刷文字のみに対応しています。 認識精度はまだ低いので、ご了承ください。 機密・秘密の画像は絶対に送信しないでください。 (BMP, JPEG, PBM/PGM/PPM, およびそれらのgzipで圧縮されたファイルが読めます。) server spec  | other OCR servers Powered by WeOCR, OCRopus, and NHocr. 日語文字行認識 - beta このサーバは NHocrを使って 文字行画像中の日語文字を認識します。 一行だけの文字列のイメージを

  • 1