[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

タグ

bertに関するNetPenguinのブックマーク (2)

  • はじめての自然言語処理 Sentence BERT による類似文章検索の検証 | オブジェクトの広場

    今回は初心に帰って類似文章検索です。連載の第1回で扱ったネタですが、 BERT を用いて再挑戦してみましょう。BERT のモデルは Hagging Face Transformers の事前学習済みモデルを用いるので、お手軽に試せるかと思います。手法としては Sentence BERT を用い、おまけとして Poor Man's BERT についても紹介します。 (記事公開後に公開されたデータセットで再検証しています。最新情報は 第18回 をご覧ください。 2021.12.21 追記) 1. はじめに 記事では Sentence BERT 1による類似文章検索について、学習や推論のコード例と実験結果を交えてご紹介します。前々から Sentence BERT を試したいと考えていたものの、教師あり学習に必要な日語の類似文データが用意できずにいました。その後、画像キャプションのデータセッ

    はじめての自然言語処理 Sentence BERT による類似文章検索の検証 | オブジェクトの広場
  • BERTを使った類似したテキストメッセージの検索

    自然言語処理(NLP技術であるBERT(Bidirectional Encoder Representations from Transformers)を使い、入力された文章と似た意味をもつレコードをデータベースから取得するアプリケーションを作ってみました。 自然言語処理が未経験の状態から、完成までにかかった期間、結果の評価、今後に向けた反省をまとめています。 類似テキスト検索の原理 自然言語処理には、埋め込み(Embedding)という技術があります。これは、テキストメッセージの意味をベクトル表現(具体的には実数の配列)に変換する技術です。 ベクトル表現への変換は、コンピュータが文章の意味を計算可能な形式にするために行われます。 二次元平面上にある点Aと点Bは、それぞれの座標がわかれば距離を計算できますが、ベクトル表現に変換された文章同士も距離(意味の近さ)を計算することができます。こ

    BERTを使った類似したテキストメッセージの検索
  • 1