JP2019101149A - Question automatic generation program and question automatic generator - Google Patents
Question automatic generation program and question automatic generator Download PDFInfo
- Publication number
- JP2019101149A JP2019101149A JP2017230233A JP2017230233A JP2019101149A JP 2019101149 A JP2019101149 A JP 2019101149A JP 2017230233 A JP2017230233 A JP 2017230233A JP 2017230233 A JP2017230233 A JP 2017230233A JP 2019101149 A JP2019101149 A JP 2019101149A
- Authority
- JP
- Japan
- Prior art keywords
- logical structure
- question
- text data
- function
- sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
- Electrically Operated Instructional Devices (AREA)
Abstract
Description
本発明は、読み込んだ文章の内容に関する設問を自動で生成する技術に関する。 The present invention relates to a technology for automatically generating a question regarding the content of a read sentence.
従来、教育現場において、教科書、参考書、専門書などに基づいてテストで出題する設問を作成する作業は、教職員一人ひとりに任されていることも多く、テストの設問作成作業が教職員の負担となっている場合があった。また、個人毎に設問作成を行っていると、教職員間の共有や年度を跨いでのデータの蓄積、引き継ぎ等が上手く行われないという問題があった。 In the past, it has often been up to each faculty member to carry out the task of creating a question in a test based on a textbook, reference book, technical book, etc. in an educational setting, and the task of creating a test question becomes a burden on the staff. There was a case. In addition, there is a problem that sharing questions among teachers and staff, accumulation of data across fiscal years, and handover can not be performed well if questions are prepared for each individual.
以上の現状から、設問を自動で生成してくれるシステムが望まれていた。自動で問題を作成するものとしては、例えば、特許文献1が挙げられる。この特許文献1は、インターネット上に存在する所定の書式で記載されたコンテンツから自動で問題文を生成する問題自動生成装置が開示されている。 From the above situation, a system that can automatically generate questions was desired. As what produces a problem automatically, patent document 1 is mentioned, for example. This patent document 1 discloses an automatic problem generation apparatus for automatically generating a problem sentence from content described in a predetermined format existing on the Internet.
前記特許文献1は、所定の書式で記載されたコンテンツから自動で問題文を生成する機能を有している。しかし、定まった書式から外れた文章からは問題文を生成できないため、問題文を生成可能な文書が制限されるという問題があった。 The patent document 1 has a function of automatically generating a problem sentence from content described in a predetermined format. However, since the problem sentences can not be generated from the sentences out of the fixed format, there is a problem that the documents which can generate the problem sentences are limited.
本発明は、上記問題点に鑑みなされたものであり、様々な文章から設問を自動で生成することができる設問自動生成プログラム及び設問自動生成装置を提供することを課題とする。 The present invention has been made in view of the above problems, and an object of the present invention is to provide a question automatic generation program and a question automatic generation device capable of automatically generating questions from various sentences.
本発明に係る設問自動生成プログラムは、読み込んだ文章の内容に関する設問を自動で生成する処理をコンピュータに実現させるための設問自動生成プログラムであって、前記コンピュータに、設問生成対象の文章のテキストデータを取得するテキストデータ取得機能と、取得したテキストデータに含まれる専門用語を抽出し、かつ複数の専門用語間の論理構造を抽出する論理構造抽出機能と、前記論理構造を用いて専門用語に関する設問を生成する設問生成機能とを実現させることを特徴とする。 The question automatic generation program according to the present invention is a question automatic generation program for causing a computer to realize a process of automatically generating a question regarding the content of a read sentence, and the computer is provided with the text data of the sentence to be generated. A text data acquisition function for acquiring a logical term, a logical structure extraction function for extracting a technical term included in the acquired text data and extracting a logical structure among a plurality of technical terms, and a question regarding the technical term using the logical structure And generating a question generation function for generating
また、前記論理構造抽出機能は、複数の専門用語間の論理構造の関係性について、定義、対置、包含、付随性質などを含む論理構造分類によって分類する機能を含み、前記設問生成機能は、前記論理構造分類に応じたアルゴリズムに基づいて設問を生成する機能を含むことを特徴とする。 In addition, the logical structure extraction function includes a function of classifying logical structure relationships among a plurality of technical terms by logical structure classification including definition, substitution, inclusion, incidental property, etc., and the question generation function It is characterized by including a function of generating a question based on an algorithm according to the logical structure classification.
また、前記論理構造抽出機能は、抽出した論理構造に基づいて当該論理構造の逆向きの論理構造を自動生成する機能を含むことを特徴とする。 Further, the logical structure extraction function is characterized by including a function of automatically generating a reverse logical structure of the logical structure based on the extracted logical structure.
また、前記テキストデータ取得機能は、設問生成対象の文章の画像データについて、目次、本文、図表、索引などの所定の分類に従って画像を領域毎に分類する画像領域分類機能と、分類後の領域毎に光学的文字認識によってテキストデータ化して所定の分類のタグ情報を付したテキストデータを取得する画像テキスト化機能とを含むことを特徴とする。 The text data acquisition function also includes an image area classification function of classifying an image into areas according to predetermined classifications such as a table of contents, a text, a diagram, and an index for image data of sentences for which questions are to be generated; And an image text conversion function of acquiring text data converted into text data by optical character recognition and having tag information of a predetermined classification.
また、前記論理構造抽出機能における専門用語の抽出は、専門用語データベースを用いて行われることを特徴とする。 Further, the extraction of the technical terms in the logical structure extraction function is characterized by being performed using a technical term database.
また、前記専門用語データベースは、設問生成対象の文章のテキストデータを含む書籍の索引部分に関するテキストデータを少なくとも一部に利用したものであることを特徴とする。 Further, the technical term database is characterized in that text data on an index portion of a book including text data of a sentence for question generation is used at least in part.
また、前記論理構造抽出機能は、論理構造に対応した所定のキーワードに基づいて、テキストデータに含まれる専門用語間の論理構造を抽出するようにしたことを特徴とする。 Further, the logical structure extraction function is characterized in that the logical structure between the technical terms included in the text data is extracted based on a predetermined keyword corresponding to the logical structure.
また、前記論理構造抽出機能は、取得したテキストデータを一文ごとに分解して、一文ごとに論理構造の抽出を行うようにしたことを特徴とする。 Further, the logical structure extraction function is characterized in that the acquired text data is decomposed for each sentence, and the logical structure is extracted for each sentence.
また、前記論理構造抽出機能は、取得した図表に関するテキストデータ部分から論理構造の抽出を行う機能を含むことを特徴とする。 Further, the logical structure extraction function is characterized by including a function of extracting a logical structure from a text data portion related to the acquired chart.
また、前記コンピュータに、前記論理構造抽出機能で抽出した論理構造によって表現される専門用語間の論理構造の関係性を表形式にして出力する論理構造表出力機能を実現させることを特徴とする。 Further, the computer is characterized by realizing a logical structure table output function of outputting the relationship of the logical structure between the technical terms represented by the logical structure extracted by the logical structure extraction function in the form of a table.
本発明に係る設問自動生成装置は、読み込んだ文章の内容に関する設問を自動で生成する設問自動生成装置であって、設問生成対象の文章のテキストデータを取得するテキストデータ取得部と、取得したテキストデータに含まれる専門用語を抽出し、かつ複数の専門用語間の論理構造を抽出する論理構造抽出部と、前記論理構造を用いて専門用語に関する設問を生成する設問生成部とを備えることを特徴とする。 The automatic question generation apparatus according to the present invention is an automatic question generation apparatus for automatically generating a question related to the content of a read sentence, and a text data acquisition unit for acquiring text data of a sentence for question generation, and the acquired text A logical structure extraction unit that extracts a technical term included in data and extracts a logical structure among a plurality of technical terms, and a question generation unit that generates a question regarding the technical term using the logical structure I assume.
本発明に係る設問自動生成装置によれば、設問生成対象の文章のテキストデータを取得し、取得したテキストデータに含まれる専門用語を抽出し、かつ複数の専門用語間の論理構造を抽出し、論理構造を用いて専門用語に関する設問を生成するようにしたので、教科書、専門書、参考書などのテキストデータから自動で設問を生成することができるため、教職員の負担を軽減することが可能となり、また、生成した設問を記憶させてデータベース化すれば、教職員間の共有や年度を跨いでのデータの蓄積、引き継ぎ等に役立てることが可能となる。さらに、設問の生成に利用した論理構造の関係性を表した論理構造表を出力可能としたので、論理構造表を教科書等の理解の補助教材としたり、テスト後の再学習用の資料としたりすることが可能となる。 According to the apparatus for automatically generating questions according to the present invention, the text data of the sentence for question generation is acquired, the technical terms included in the acquired text data are extracted, and the logical structure between the plural technical terms is extracted. Since the logical structure is used to generate questions about technical terms, questions can be generated automatically from text data such as textbooks, technical books, and reference books, which makes it possible to reduce the burden on faculty members. Also, if the generated questions are stored in a database, it can be used for sharing among faculty and staff, accumulation of data across fiscal years, and handover. Furthermore, because it is possible to output a logical structure table that expresses the relationship of the logical structure used to generate the question, the logical structure table is used as an auxiliary teaching material for understanding textbooks, etc., or as a material for relearning after testing. It is possible to
以下、図面を参照しながら、実施の形態に係る設問自動生成装置の例について説明する。図1は、本発明に係る設問自動生成装置10の構成を表したブロック図である。なお、設問自動生成装置10は、専用マシンとして設計した装置であってもよいが、一般的なコンピュータによって実現可能なものであるものとする。この場合に、設問自動生成装置10は、一般的なコンピュータが通常備えているであろうCPU(Central Processing Unit:中央演算処理装置)、GPU(Graphics Processing Unit:画像処理装置)、メモリ、ハードディスクドライブ等のストレージを具備しているものとする(図示省略)。また、これらの一般的なコンピュータを本例の設問自動生成装置10として機能させるためにプログラムよって各種処理が実行されることは言うまでもない。また、以下に説明する設問自動生成装置10の構成要素を全て設問自動生成装置10自身が備えている必要はなく、一部構成を他の装置に備えさせる、例えば、通信ネットワークを介して接続可能なサーバ装置に一部の構成を備えさせるようにして、設問自動生成装置10が通信を行いながらサーバ装置に備えられた構成を利用するものであってもよい。
Hereinafter, an example of the question automatic generation device according to the embodiment will be described with reference to the drawings. FIG. 1 is a block diagram showing the configuration of an automatic
図1に示すように、設問自動生成装置10は、テキストデータ取得部11と、論理構造抽出部12と、設問生成部13と、論理構造表出力部14と、記憶部15とを少なくとも備えている。また、本例では、テキストデータ取得部11は、画像領域分類部111と、画像テキスト化部112とを備えている。
As shown in FIG. 1, the automatic
テキストデータ取得部11は、設問生成対象の文章のテキストデータを取得する機能を有する。教科書、参考書、専門書などの設問を生成したい内容を含む文章のテキストデータを取得するための構成であり、既にテキスト化されたものを設問自動生成装置10に取り込む機能の他、教科書、参考書、専門書などをイメージスキャナによって画像データ化して、その画像データに含まれる文章の内容を以下の画像領域分類部111及び画像テキスト化部112においてテキスト化する処理を実行する機能も備えている。取得したテキストデータは、複数の文が連続的に記載された状態のままであってもよいが、本例では、後述の論理構造抽出部12において一文ずつ処理を実行するようにするために、テキストデータ取得部11において、取得したテキストデータを一文ずつに分解して記憶させておくようにする。その際、表形式のデータにおいて一文ずつセルを分けて記憶させるようにしてもよい。
The text data acquisition unit 11 has a function of acquiring text data of a sentence for which a question is to be generated. It is a configuration for acquiring the text data of the sentence including the contents for which you want to generate questions such as textbooks, reference books, technical books, etc., in addition to the function of importing the texts into the question
画像領域分類部111は、設問生成対象の文章の画像データについて、目次、本文、図表、索引などの所定の分類に従って画像を領域毎に分類する機能を有する。教科書などの書籍の中には目次、本文、図表、索引など内容が異なる記載部分が存在するため、これを分類するようにする。分類の方法は、記載内容から自動的に判別するアルゴリズム(機械学習による判別であってもよい)を採用してもよいし、ユーザが領域毎に分類を指定するようにしてもよい。 The image region classification unit 111 has a function of classifying images into regions according to a predetermined classification such as a table of contents, a text, a diagram, and an index, for image data of sentences for which question generation is to be performed. In books such as textbooks, there are written parts with different contents such as table of contents, text, figures, indexes, etc., so these should be classified. As a method of classification, an algorithm (may be discrimination by machine learning) for automatically judging from the written content may be adopted, or the user may designate the classification for each area.
画像テキスト化部112は、画像領域分類部111において領域毎に分類の指定が行われた画像データについて、分類後の領域毎に光学的文字認識(OCR)によってテキストデータ化して所定の分類のタグ情報を付したテキストデータを取得する機能を有する。本文に分類された領域については本文のテキストデータとして取得し、図表に分類された領域については図表のテキストデータとして取得するといったように、各分類のタグ情報を付したテキストデータとして取得する。また、索引に分類された領域についてのテキストデータは、後述する専門用語データベースとして利用するようにしてもよい。
The image
論理構造抽出部12は、取得したテキストデータに含まれる専門用語を抽出し、かつ複数の専門用語間の論理構造を抽出する機能を有する。専門用語の抽出を行う理由は、専門用語に関連した部分について論理構造を抽出するために、含まれる単語が専門用語であるか否かを判別する必要があるからである。専門用語の抽出のためには、例えば、専門用語データベースを利用してもよい。専門用語データベースは、予め作成して記憶させておいた文章に関する専門用語データベースであってもよい。また、索引に分類された領域について読み取ったテキストデータを、専門用語が含まれている可能性が高いテキストであるものとして、そのまま専門用語データベースとして利用するようにしてもよい。
The logical
論理構造の抽出処理は、専門用語を含む単語間の関係性を表す論理構造として抽出する処理であり、具体的には、論理構造に対応した所定のキーワードに基づいて、テキストデータに含まれる専門用語間の論理構造を抽出する。例えば、「Aは、BとCに分類される。」という一文については、A,B,Cが専門用語である場合、この一文からは、「A→(含む)→B,C」という論理構造と、「B→(対置)→C」という論理構造を抽出することができる。これは、「〜は、〜と〜に分類される」というキーワードを含む場合、包含の論理構造と、対置の論理構造を抽出できる可能性が高いという規則性を予め記憶させておく。そして、「分類される」というキーワードを発見した場合には、包含の論理構造と対置の論理構造を抽出する処理を実行することになる。その他にも、「〜には、〜がある」、「〜には、〜が含まれる」といった包含の論理構造を抽出するためのキーワードや、「〜が存在しない〜」、「〜が存在する〜」といった存在、非存在の関係性を定める論理構造を抽出するためのキーワードなど、様々なキーワードに基づいて専門用語間の論理構造を抽出する。この論理構造の抽出は、論理関係を抽出する対象の単語が全て専門用語である場合に限らず、一方のみが専門用語である場合においても論理構造を抽出するようにしてもよい。また、言葉の定義などについては、単語間の論理構造抽出のみならず定義部分全体を論理構造として抽出してもよい。例えば、「〜とは、〜である。」というキーワードを定義の論理構造抽出の条件とする場合には、単語ではなく定義の説明箇所全体を抽出するようにしてもよい。なお、2以上の専門用語が登場する一文は、例外はあるものの大抵の場合には、何らかの論理構造を抽出することができる可能性が高い。よって、2以上の専門用語間の関係性を表現するキーワードとして可能性のある表現を可能な限り論理構造抽出用のキーワードとして設定しておくことが望ましい。 The extraction process of the logical structure is a process of extracting as a logical structure representing the relationship between the words including the technical term, and specifically, the specialization included in the text data based on a predetermined keyword corresponding to the logical structure Extract the logical structure between terms. For example, for a sentence "A is classified into B and C", when A, B and C are technical terms, from this sentence, the logic "A → (including) → B, C" It is possible to extract the structure and the logical structure “B → (opposition) → C”. This includes in advance the logical structure of inclusion and the regularity that there is a high possibility of being able to extract the logical structure of the opposite when the keywords “are classified into and” are stored in advance. Then, when the keyword "classified" is found, processing for extracting the logical structure of inclusion and the logical structure of substitution is executed. In addition, keywords for extracting the logical structure of inclusion, such as "There is ~," "includes ~," "Does not exist," "is present The logical structure among the technical terms is extracted based on various keywords, such as a keyword for extracting a logical structure that defines the existence or non-existence relationship such as “~”. The extraction of the logical structure is not limited to the case where all the words for which the logical relationship is extracted are technical terms, and the logical structure may be extracted even when only one of the words is a technical term. In addition, as to the definition of words, not only the logical structure extraction between words but also the entire definition part may be extracted as a logical structure. For example, in the case where the keyword "is a ..." is used as the condition for extracting the logical structure of the definition, not the word but the entire explanation of the definition may be extracted. It should be noted that in one sentence where two or more technical terms appear, in most cases with some exceptions, it is likely that some logical structure can be extracted. Therefore, it is desirable to set a possible expression as a keyword expressing the relationship between two or more technical terms as a keyword for extracting the logical structure as much as possible.
また、論理構造抽出部12において抽出した論理構造のそれぞれについて、逆方向の論理構造を生成するようにする。逆方向の論理構造とは、論理構造を逆向きに表現可能な場合の関係性を表した論理構造のことをいう。具体的には、例えば、「A→(含む)→B,C」という論理構造から、「B→(含まれる)→A」と「C→(含まれる)→A」の逆方向の論理構造を抽出することをいう。逆方向の論理構造を抽出しておくことで、設問生成に用いる論理構造の選択肢が増すという効果がある。
In addition, for each of the logical structures extracted in the logical
設問生成部13は、論理構造を用いて専門用語に関する設問を生成する機能を有する。より詳しくは、論理構造の種類に応じて生成する設問の内容が決定される。例えば、「B→(含む)→D,E」という論理構造からは、「BはDを含む概念である。〇か×か?」という設問を生成可能である。また、「B→(含む)→D,E」と、「C→(含む)→F,G」と、「B→(対置)→C」という3つの論理構造がある場合、これら3つの論理構造を全て用いると、「Bに含まれるものを選択せよ。正解選択肢:D,E、不正解選択肢:F,G」という設問を生成することができる。また、定義に関する論理構造を複数ピックアップして、設問として問いたい定義の内容の要素を正解選択肢とし、他の定義の内容を不正解選択肢とする設問の生成方法も考えられる。これらはあくまで一例であり、様々な論理構造の関係性を利用して自動で種々の設問を生成することが可能となる。なお、設問の生成数については、ユーザが希望する設問数を指定するものであってもよいし、論理構造から生成可能な設問を重複のない範囲で全て生成するものであってもよい。
The
論理構造表出力部14は、論理構造抽出部12において抽出した論理構造によって表現される専門用語間の論理構造の関係性を表形式にして出力する機能を有する。論理構造に基づいて、設問生成部13において設問を生成してテストで出題するのみならず、専門用語間の論理構造の関係性を表した表を出力することで、例えば、テスト後の再学習用の資料として論理構造表を利用することが可能となる。
The logical structure table output unit 14 has a function of outputting the relationship of the logical structure between the technical terms expressed by the logical structure extracted by the logical
記憶部15は、各部の処理に必要な各種データや、各部における処理の結果として得られたデータを記憶させる機能を有する。例えば、テキストデータ取得部11で取得したテキストデータ、論理構造抽出部12で抽出した論理構造、設問生成部13で生成した設問、論理構造表出力部14で生成した表、専門用語データベースなどは、この記憶部16に記憶させておくようにしてもよい。
The
次に、設問自動生成装置10における設問自動生成処理の流れについて説明を行う。図2は、設問自動生成装置10における設問自動生成処理の流れを示したフローチャート図である。この図2において、先ず、設問自動生成装置10は、テキストデータの取得を行う(S101)。テキストデータの取得は、どのような方法であってもよいが、例えば、画像データに含まれる文章を光学的文字認識処理(OCR処理)によってテキストデータ化するものであってもよい。そして、設問自動生成装置10は、テキストデータについて、見出し、本文、図表、索引等の所定の分類に従って取得したテキストデータを分類する(S102)。なお、OCR処理によってテキスト化する場合には、画像データの段階で分類を行って、分類後にテキスト化するようにしてもよい。そして、取得して分類されたテキストデータについて、複数の分が連結して文章を構成している箇所、特に本文について、一文ずつに分解する処理を行う(S103)。論理構造の抽出処理を一文単位で実行するためである。
Next, the flow of the question automatic generation process in the question
次に、設問自動生成装置10は、一文ずつ論理構造の抽出処理を実行する(S104)。論理構造の抽出は、本文のみならず可能であれば図表からも論理構造の抽出を試みる。また、設問自動生成装置10は、抽出した論理構造について逆方向の論理構造の生成を行う(S105)。設問自動生成装置10は、順方向と逆方向の両方の論理構造に基づいて、設問を所定数だけ自動生成する(S106)。そして、設問自動生成装置10は、生成した設問を出力する(S107)。出力は、表示画面に表示して確認させるものであってもよいし、紙などにプリントアウトするものであってもよい。また、当然ながら、記憶部16に記憶させる処理も実行する。また、必要があれば、論理構造の関係性を表した論理構造表を併せて出力して(S108)、処理を終了する。
Next, the automatic
次に、より具体的な例を用いて設問自動生成装置10の動作について説明を行う。図3は、設問生成を行いたい内容を含む教科書の一例を表した説明図である。図3に示すように、教科書には、見出し部分、本文部分、図表部分などが含まれている。また、この図3は、教科書をイメージスキャナで画像データ化したものであるとする。その場合、この図3の画像に含まれる内容を領域毎に分類する処理を実行する。分類処理は、記載内容から自動的に判別するアルゴリズムによって分類してもよいし、ユーザが領域毎に分類を指定する手法であってもよい。分類後、OCR処理によって、領域毎にテキストデータ化する。
Next, the operation of the automatic
図4は、図3に示す教科書のページをテキストデータ化した内容を表した説明図である。この図4に示すように、見出し部分と、本文として抽出した抽出文とが区別されてテキスト化されている。また、テキスト化した際に、複数の分が連結して文章となっていたものを一文ずつに分解して管理している。この際のデータは、図4に示すような表形式のデータの異なるセルに一文ずつ格納するものであってもよい。 FIG. 4 is an explanatory view showing the contents of the page of the textbook shown in FIG. 3 converted into text data. As shown in FIG. 4, the heading portion and the extracted sentence extracted as the main text are distinguished and textified. In addition, when it is converted into text, a plurality of parts are linked and the sentences are divided into sentences and managed. The data in this case may be stored one sentence at a time in different cells of tabular data as shown in FIG.
図5は、図4に示す抽出文のそれぞれについて論理構造の抽出を行った際の抽出結果を表した説明図である。この図5に示すように、一文目からは、「確率的影響→(対置)→確定的影響」という論理構造を含む4つの論理構造が抽出されている。二文目からは、「確率的影響→(含む)→発がん,遺伝的影響」という論理構造が抽出されている。三文目からは、「確定的影響→(含む)→白内障,皮膚の炎症」という論理構造が抽出されている。 FIG. 5 is an explanatory view showing the extraction result when the logical structure is extracted for each of the extracted sentences shown in FIG. As shown in FIG. 5, from the first sentence, four logical structures including a logical structure of “probabilistic influence → (opposition) → determinate influence” are extracted. From the second sentence, the logical structure "Probabilistic effect → (including) → carcinogenesis, genetic effect" is extracted. From the third sentence, the logical structure "determinate effect → (including) → cataract, skin inflammation" is extracted.
図6は、逆方向の論理構造の生成の一例を表した説明図である。順方向の論理構造として、「確率的影響→(含む)→(影響)→発がん,遺伝的影響」という論理構造が抽出された場合に、逆方向の論理構造として、「発がん→(含まれる)→(影響の分類)→確率的影響」と、「遺伝的影響→(含まれる)→(影響の分類)→確率的影響」という2つの逆方向の論理構造が生成される。このような逆方向の論理構造も設問生成に利用される。 FIG. 6 is an explanatory view showing an example of generation of a logical structure in the reverse direction. When a logical structure of “probabilistic effect → (include) → (impact) → carcinogenesis, genetic effect” is extracted as a logical structure in the forward direction, “carcinogenic → (included)” as a logical structure in the reverse direction. → (Classification of Impact) → Stochastic Impact and “Genetic Impact → (Included) → (Classification of Impact) → Stochastic Impact” Two opposite logical structures are generated. Such a backward logic structure is also used for question generation.
図7は、論理構造に基づいて自動で生成される設問の一例を表した説明図である。例えば、複数の選択肢の中から正解の選択肢を選択する設問を自動生成する際の処理ロジックは、(1)対置の論理構造を選択、(2)対置の論理構造のそれぞれが含む要素を自動収集する、(3)正解を答えさせたい対置に含まれる要素を正解選択肢、対置の残りに含まれる要素を不正解選択肢として設問を作成、という流れで設問を生成する。この処理ロジックに従って、図5で抽出した論理構造から設問を生成すると、例えば、例1又は例2の設問を生成することができる。なお、例1と例2は正解選択肢と不正解選択肢の関係性を逆にしただけの設問であり、この例1と例2の作成に利用した論理構造は全く同じものである。 FIG. 7 is an explanatory view showing an example of questions automatically generated based on the logical structure. For example, the processing logic for automatically generating a question for selecting the correct choice from among a plurality of options includes: (1) selecting a logical structure of a constellation; (2) automatically collecting elements included in each of the logical structures of a constellation (3) Create a question in the following sequence: the element included in the substitution for which you want to answer the correct answer is the correct choice, and the element included in the remainder of the substitution is the incorrect choice. If a question is generated from the logical structure extracted in FIG. 5 according to this processing logic, for example, the question of Example 1 or Example 2 can be generated. In addition, Example 1 and Example 2 are the questions which only reversed the relationship between the correct choice and the incorrect choice, and the logical structure used to create this Example 1 and Example 2 is completely the same.
図8は、論理構造の関係性を表した論理構造表の一例を表した説明図である。図7の説明において前述した設問自動生成の処理ロジックを実行すると、その設問生成に利用する論考構造の関係性が抽出される。この抽出された論理構造の関係性を利用して設問を生成しているが、この論理構造の関係性を図8に示すようにそのまま論理構造表として出力すれば、学習者の理解を助けるための補助教材とすることが可能となる。この論理構造表は、設問生成時に合わせて作成することができるため、テスト後の復習用教材として配布して利用してもよい。 FIG. 8 is an explanatory diagram showing an example of a logical structure table showing the relationships of logical structures. When the processing logic of the question automatic generation described above in the explanation of FIG. 7 is executed, the relationship of the discussion structure used for the question generation is extracted. The questions are generated using the relationship of the extracted logical structure, but if the relationship of the logical structure is output as a logical structure table as it is as shown in FIG. 8, it will help the learner to understand It will be possible to use as a supplementary teaching material for Since this logical structure table can be created in accordance with the question generation time, it may be distributed and used as a review material after the test.
図9は、教科書等に含まれる図表の一例を表した説明図である。図9は、放射線の影響の分類に確率的影響と確定的影響が含まれることと、確率的影響の具体例として発がん,遺伝的影響が含まれることと、確定的影響の具体例として白内障,皮膚の炎症が含まれることが読み取れる。この図9に示す図表が例えば、図3の図表領域に示されていて、本文にはこの内容が含まれていない場合には、この図9の図表から論理構造を抽出して、図8に示すような論理構造表を作成することができれば、図表のみに含まれる内容からも論理構造を抽出して設問生成が可能となる。この図9の例でいえば、図表の左のセルと右のセルの間には包含の論理構造が存在すると解釈することが最も自然であると判定して、包含の論理構造を抽出している。また、縦軸に並列に記載される項目が対置の関係であるという論理構造も抽出することができる。このように、文章の場合に比較して推定によって論理構造を抽出することになる可能性が増えるが、図表からも論理構造を抽出することができる。 FIG. 9 is an explanatory view showing an example of a chart included in a textbook or the like. Fig. 9 shows that classification of radiation effects includes probabilistic effects and deterministic effects, carcinogenesis as specific examples of probabilistic effects, and genetic effects, and cataracts as specific examples of deterministic effects, It can be read that skin inflammation is included. If the diagram shown in FIG. 9 is shown, for example, in the diagram area of FIG. 3 and the text does not include the contents, the logical structure is extracted from the diagram of FIG. If a logical structure table as shown can be created, the logical structure can be extracted from the contents included only in the diagram and the question can be generated. In the example of FIG. 9, the logical structure of inclusion is extracted by determining that it is most natural to interpret that the logical structure of inclusion exists between the cell on the left and the cell on the right of the diagram. There is. Also, it is possible to extract a logical structure in which the items described in parallel on the vertical axis are in a relation of arrangement. Thus, although the possibility of extracting the logical structure by estimation increases as compared to the case of the sentence, the logical structure can also be extracted from the diagram.
10 設問自動生成装置
11 テキストデータ取得部
111 画像領域分類部
112 画像テキスト化部
12 論理構造抽出部
13 設問生成部
14 論理構造表出力部
15 記憶部
DESCRIPTION OF
Claims (11)
前記コンピュータに、
設問生成対象の文章のテキストデータを取得するテキストデータ取得機能と、
取得したテキストデータに含まれる専門用語を抽出し、かつ複数の専門用語間の論理構造を抽出する論理構造抽出機能と、
前記論理構造を用いて専門用語に関する設問を生成する設問生成機能と
を実現させる設問自動生成プログラム。 A question automatic generation program for causing a computer to realize a process of automatically generating a question regarding the content of a read sentence,
On the computer
A text data acquisition function for acquiring text data of a sentence for which a question is to be generated;
A logical structure extraction function of extracting a technical term included in acquired text data and extracting a logical structure among a plurality of technical terms;
A question automatic generation program for realizing a question generation function of generating a question regarding a technical term using the logical structure.
前記設問生成機能は、前記論理構造分類に応じたアルゴリズムに基づいて設問を生成する機能を含む
請求項1記載の設問自動生成プログラム。 The logical structure extraction function includes a function of classifying logical structure relationships among a plurality of technical terms by logical structure classification including definition, substitution, inclusion, incidental property, etc.,
The question automatic generation program according to claim 1, wherein the question generation function includes a function of generating a question based on an algorithm according to the logical structure classification.
請求項1又は請求項2に記載の設問自動生成プログラム。 The question automatic generation program according to claim 1 or 2, wherein the logical structure extraction function includes a function of automatically generating a reverse logical structure of the logical structure based on the extracted logical structure.
請求項1から請求項3の何れかに記載の設問自動生成プログラム。 The text data acquisition function is an image area classification function of classifying images into areas according to predetermined classifications such as a table of contents, text, figures, indexes, etc. for image data of sentences for which questions are to be generated; The question automatic generation program according to any one of claims 1 to 3, further comprising: an image text conversion function of acquiring text data converted into text data by dynamic character recognition and attached with tag information of a predetermined classification.
請求項1から請求項4の何れかに記載の設問自動生成プログラム。 The automatic question generation program according to any one of claims 1 to 4, wherein the extraction of technical terms in the logical structure extraction function is performed using a technical term database.
請求項5記載の設問自動生成プログラム。 The automatic question generation program according to claim 5, wherein the technical term database uses, at least in part, text data on an index portion of a book including text data of a sentence for which a question is to be generated.
請求項1から請求項6の何れかに記載の設問自動生成プログラム。 The question according to any one of claims 1 to 6, wherein the logical structure extraction function extracts the logical structure between the technical terms included in the text data based on a predetermined keyword corresponding to the logical structure. Automatic generation program.
請求項1から請求項7の何れかに記載の設問自動生成プログラム。 The automatic question generation program according to any one of claims 1 to 7, wherein the logical structure extraction function decomposes the acquired text data for each sentence and performs extraction of the logical structure for each sentence.
請求項1から請求項8の何れかに記載の設問自動生成プログラム。 The question automatic generation program according to any one of claims 1 to 8, wherein the logical structure extraction function includes a function of extracting a logical structure from a text data portion related to the acquired chart.
前記論理構造抽出機能で抽出した論理構造によって表現される専門用語間の論理構造の関係性を表形式にして出力する論理構造表出力機能を実現させる
請求項1から請求項9の何れかに記載の設問自動生成プログラム。 On the computer
The logical structure table output function is realized, which outputs the logical structure relationship between the technical terms expressed by the logical structure extracted by the logical structure extraction function in the form of a table. Question auto-generation program.
設問生成対象の文章のテキストデータを取得するテキストデータ取得部と、
取得したテキストデータに含まれる専門用語を抽出し、かつ複数の専門用語間の論理構造を抽出する論理構造抽出部と、
前記論理構造を用いて専門用語に関する設問を生成する設問生成部と
を備える設問自動生成装置。 It is a question automatic generation device that automatically generates a question regarding the content of the read sentence.
A text data acquisition unit that acquires text data of a sentence for which a question is to be generated;
A logical structure extraction unit that extracts technical terms included in the acquired text data and extracts a logical structure among a plurality of technical terms;
An automatic question generation apparatus comprising: a question generation unit that generates a question regarding a technical term using the logical structure;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017230233A JP7082333B2 (en) | 2017-11-30 | 2017-11-30 | Question automatic generation program and question automatic generation device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017230233A JP7082333B2 (en) | 2017-11-30 | 2017-11-30 | Question automatic generation program and question automatic generation device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019101149A true JP2019101149A (en) | 2019-06-24 |
JP7082333B2 JP7082333B2 (en) | 2022-06-08 |
Family
ID=66973572
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017230233A Active JP7082333B2 (en) | 2017-11-30 | 2017-11-30 | Question automatic generation program and question automatic generation device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7082333B2 (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11030913B2 (en) * | 2018-06-07 | 2021-06-08 | Thinkster Learning, Inc. | Intelligent and contextual system for knowledge progression and quiz management |
JP2021149956A (en) * | 2019-11-01 | 2021-09-27 | ボイン アイティー カンパニー リミテッド | Problem item Automatic generation method and system |
JP7440966B1 (en) | 2023-01-01 | 2024-02-29 | 優介 宮澤 | Theoretical structure modeling methods, programs, and systems |
US11928984B2 (en) | 2018-06-07 | 2024-03-12 | Thinkster Learning Inc. | Intelligent and contextual system for test management |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6417152A (en) * | 1987-07-13 | 1989-01-20 | Nippon Telegraph & Telephone | Analyzing method for modified proposition |
JPH03127169A (en) * | 1989-10-13 | 1991-05-30 | Hitachi Ltd | Multi-media document structuralizing system |
JP2009146311A (en) * | 2007-12-17 | 2009-07-02 | Fuji Xerox Co Ltd | Document analyzer, document analyzing method, and computer program |
JP2012018300A (en) * | 2010-07-08 | 2012-01-26 | Manabing Kk | Question automatic generation method and question automatic generation system |
JP2013206388A (en) * | 2012-03-29 | 2013-10-07 | Dainippon Printing Co Ltd | Book information retrieval device, book information retrieval system, book information retrieval method and program |
JP2016218853A (en) * | 2015-05-22 | 2016-12-22 | ソニー株式会社 | Information processor, information processing method, and program |
JP2017022471A (en) * | 2015-07-07 | 2017-01-26 | 京セラドキュメントソリューションズ株式会社 | Image formation apparatus, image formation method, and control program |
-
2017
- 2017-11-30 JP JP2017230233A patent/JP7082333B2/en active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6417152A (en) * | 1987-07-13 | 1989-01-20 | Nippon Telegraph & Telephone | Analyzing method for modified proposition |
JPH03127169A (en) * | 1989-10-13 | 1991-05-30 | Hitachi Ltd | Multi-media document structuralizing system |
JP2009146311A (en) * | 2007-12-17 | 2009-07-02 | Fuji Xerox Co Ltd | Document analyzer, document analyzing method, and computer program |
JP2012018300A (en) * | 2010-07-08 | 2012-01-26 | Manabing Kk | Question automatic generation method and question automatic generation system |
JP2013206388A (en) * | 2012-03-29 | 2013-10-07 | Dainippon Printing Co Ltd | Book information retrieval device, book information retrieval system, book information retrieval method and program |
JP2016218853A (en) * | 2015-05-22 | 2016-12-22 | ソニー株式会社 | Information processor, information processing method, and program |
JP2017022471A (en) * | 2015-07-07 | 2017-01-26 | 京セラドキュメントソリューションズ株式会社 | Image formation apparatus, image formation method, and control program |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11030913B2 (en) * | 2018-06-07 | 2021-06-08 | Thinkster Learning, Inc. | Intelligent and contextual system for knowledge progression and quiz management |
US11928984B2 (en) | 2018-06-07 | 2024-03-12 | Thinkster Learning Inc. | Intelligent and contextual system for test management |
JP2021149956A (en) * | 2019-11-01 | 2021-09-27 | ボイン アイティー カンパニー リミテッド | Problem item Automatic generation method and system |
JP7179886B2 (en) | 2019-11-01 | 2022-11-29 | ボイン アイティー カンパニー リミテッド | Question item automatic generation method and system |
JP7440966B1 (en) | 2023-01-01 | 2024-02-29 | 優介 宮澤 | Theoretical structure modeling methods, programs, and systems |
Also Published As
Publication number | Publication date |
---|---|
JP7082333B2 (en) | 2022-06-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Choi et al. | Visualizing for the non‐visual: Enabling the visually impaired to use visualization | |
Jung et al. | Communicating visualizations without visuals: Investigation of visualization alternative text for people with visual impairments | |
Karasneh et al. | Extracting UML models from images | |
Anthony | Visualisation in corpus-based discourse studies | |
JP2019101149A (en) | Question automatic generation program and question automatic generator | |
CN117501283A (en) | Text-to-question model system | |
Prescher et al. | Production of accessible tactile graphics | |
Parodi | University genres and multisemiotic features: Accessing specialized knowledge through disciplinarity | |
Kestemont et al. | Weigh your words—memory-based lemmatization for Middle Dutch | |
McLean Davies et al. | Reading in the (post) digital age: Large databases and the future of literature in secondary English classrooms | |
JP2023153407A (en) | Structured document processing device, structured document processing method, and program | |
JP6717387B2 (en) | Text evaluation device, text evaluation method and recording medium | |
US20240086452A1 (en) | Tracking concepts within content in content management systems and adaptive learning systems | |
Murphy et al. | Corpus types and uses | |
Oyama et al. | Visual clarity analysis and improvement support for presentation slides | |
Balk et al. | IMPACT: working together to address the challenges involving mass digitization of historical printed text | |
CN112257400B (en) | Table data extraction method, apparatus, computer device and storage medium | |
CN115828856A (en) | Test paper generation method, device, equipment and storage medium | |
KR20200069797A (en) | System for converting hangeul word file on the web | |
CN116306506A (en) | Intelligent mail template method based on content identification | |
US12106048B2 (en) | Structured text processing learning apparatus, structured text processing apparatus, structured text processing learning method, structured text processing method and program | |
CN114331932A (en) | Target image generation method and device, computing equipment and computer storage medium | |
CN113901793A (en) | Event extraction method and device combining RPA and AI | |
McLean Davies et al. | Reading in the (post) digital age: Large digital databases and the future of literature in secondary classrooms. | |
CN110866084A (en) | Data processing method and device for family tree character and electronic equipment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201116 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210929 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211026 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211216 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220510 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220517 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7082333 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |