[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

タグ

aiに関するNetPenguinのブックマーク (3)

  • はじめての自然言語処理 Sentence BERT による類似文章検索の検証 | オブジェクトの広場

    今回は初心に帰って類似文章検索です。連載の第1回で扱ったネタですが、 BERT を用いて再挑戦してみましょう。BERT のモデルは Hagging Face Transformers の事前学習済みモデルを用いるので、お手軽に試せるかと思います。手法としては Sentence BERT を用い、おまけとして Poor Man's BERT についても紹介します。 (記事公開後に公開されたデータセットで再検証しています。最新情報は 第18回 をご覧ください。 2021.12.21 追記) 1. はじめに 記事では Sentence BERT 1による類似文章検索について、学習や推論のコード例と実験結果を交えてご紹介します。前々から Sentence BERT を試したいと考えていたものの、教師あり学習に必要な日語の類似文データが用意できずにいました。その後、画像キャプションのデータセッ

    はじめての自然言語処理 Sentence BERT による類似文章検索の検証 | オブジェクトの広場
  • Faissの概要 | Hakky Handbook

    Hakkyでは「データでプロダクトを価値あるものにする」というミッションの元、大規模言語モデルを積極的に活用して記事執筆しております。ビジネスにおけるAI活用のため、Handbookをお役立ていただきましたら幸いです。 概要​ 記事では近似最近傍探索ライブラリの Faiss について解説します。 Faiss とは​ Faiss とは、Meta(Facebook)製の近似最近傍探索ライブラリであり、類似の画像やテキストを検索するためのインデックスを作成するツールです。Faiss は C ++で記述されていますが、Python ラッパーを使用して Python で高速な学習が可能です。 他の近似最近傍探索ライブラリ​ Faiss の他に、有名な近似最近傍探索ライブラリとして、FLANN、Annoy、NMSLIB、NGT などがあります。ライブラリの比較は以下の記事が参考になります。 近似最近

  • BERTを使った類似したテキストメッセージの検索

    自然言語処理(NLP技術であるBERT(Bidirectional Encoder Representations from Transformers)を使い、入力された文章と似た意味をもつレコードをデータベースから取得するアプリケーションを作ってみました。 自然言語処理が未経験の状態から、完成までにかかった期間、結果の評価、今後に向けた反省をまとめています。 類似テキスト検索の原理 自然言語処理には、埋め込み(Embedding)という技術があります。これは、テキストメッセージの意味をベクトル表現(具体的には実数の配列)に変換する技術です。 ベクトル表現への変換は、コンピュータが文章の意味を計算可能な形式にするために行われます。 二次元平面上にある点Aと点Bは、それぞれの座標がわかれば距離を計算できますが、ベクトル表現に変換された文章同士も距離(意味の近さ)を計算することができます。こ

    BERTを使った類似したテキストメッセージの検索
  • 1