[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP6364086B2 - 自己産出的情報処理システムおよび方法 - Google Patents

自己産出的情報処理システムおよび方法 Download PDF

Info

Publication number
JP6364086B2
JP6364086B2 JP2016543780A JP2016543780A JP6364086B2 JP 6364086 B2 JP6364086 B2 JP 6364086B2 JP 2016543780 A JP2016543780 A JP 2016543780A JP 2016543780 A JP2016543780 A JP 2016543780A JP 6364086 B2 JP6364086 B2 JP 6364086B2
Authority
JP
Japan
Prior art keywords
information
self
new
processing system
vertex
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016543780A
Other languages
English (en)
Other versions
JPWO2016027372A1 (ja
Inventor
加藤 猛
猛 加藤
水野 弘之
弘之 水野
泰幸 工藤
泰幸 工藤
山岡 雅直
雅直 山岡
純一 宮越
純一 宮越
幸二 福田
幸二 福田
朝 康博
康博 朝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Publication of JPWO2016027372A1 publication Critical patent/JPWO2016027372A1/ja
Application granted granted Critical
Publication of JP6364086B2 publication Critical patent/JP6364086B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/904Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9038Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/06Arrangements for sorting, selecting, merging, or comparing data on individual record carriers
    • G06F7/14Merging, i.e. combining at least two sets of record carriers each arranged in the same ordered sequence to produce a single set having the same ordered sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は情報を収集して出力する情報処理システムおよび方法に関する。
人間社会に大きな変革をもたらした第一の農業革命、第二の産業革命、第三の情報革命に続いて第四の心の革命が起きつつある。情報革命は知識経済をもたらしたが、心の革命は人の感性や直観や創造性を喚起するような経験経済を発展させるだろう。
この流れに沿うように、脳の機能を実現しようとする人工知能や、社会と繋がるソーシャルコンピューティングなどの研究が盛んである。人工知能の父と呼ばれるミンスキーは思考素(ソース)の集団のインタラクションが心を生み出すモデルを唱え(非特許文献1)、計算機科学者のミルナーはアクティブなエージェントによる継続的なプロセスによるインタラクティブコンピュテーションを唱えている(非特許文献2)。
大規模かつ複雑で刻々と変化する人間社会において直観や創造性を喚起するには、従来のようにユーザが設定した問題に対して決まった手順で情報を回答する情報処理システムではなく、人工知能やインタラクティブコンピュテーションの考え方を推し進めて、ユーザへ自ら新たな情報を継続的に提供し続ける情報処理システムが必要になる。
従来のデータベースシステムや検索システムなどの情報処理システムでは、ユーザへ情報を効率よく提供するために、特開2005−100392号公報(特許文献1)や特表2013−535729号公報(特許文献2)に記載の技術がある。
特許文献1には「元のクエリには含まれていないデータ属性に関する新しい述語をクエリに追加して、処理効率を向上させることができる」という記載がある。特許文献2には「クエリ提案は、検索を改善するためまたは検索の方針を改善するために使用可能な提案されるデータであり、追加的なクエリとして使用されることが多い」という記載がある。
M. Minsky. The Emotion Machine: Commonsense Thinking, Artificial Intelligence, and the Future of the Human Mind. Simon & Schuster, 2007, 400 p.(http://web.media.mit.edu/~minsky/eb7.html) R. Milner. "Turing, Computing and Communication". Interactive Computation The New Paradigm. D. Goldin, S. Smolka and P. Wegner ed. Springer Berlin Heidelberg, 2006, p. 1-8.(http://www.fairdene.com/picalculus/milner-infomatics.pdf)
特開2005−100392 特表2013−535729
特許文献1や特許文献2では追加クエリによってユーザが求める情報ニーズを満たすことを支援するが、特許文献1では追加クエリはデータ属性の範囲に限られ、特許文献2ではクエリログの内容に限られるため、例えばクエリの追加を繰り返したとしてもユーザへ提供される情報は次第に同じ内容に留まる。
そこで本発明では、ユーザの直観や創造性を喚起して気づきや発見に繋がるような新たな情報を継続的に提供し続けることを目的とする。
上記課題を解決するために、代表的な本発明の自己産出的情報処理システムの一つは、ユーザの入力に関連する情報を収集し、この収集情報から選択した情報を新たな入力として情報を収集し、この新たに収集した情報と既に収集した情報を所定の比率で併合し、この併合情報から選択した情報を再び新たな入力として回帰的に作動するものである。
本発明の他の側面は、情報を収集して出力する情報処理システムであって、第一の情報を入力する手段と、第一の情報に関連する第二の情報を収集する手段と、第二の情報から第三の情報を選択する手段と、第三の情報を新たな第一の情報として新たな第二の情報を収集する手段と、第二の情報と新たな第二の情報を所定の比率で併合する手段と、併合した第二の情報から新たな第三の情報を選択する手段とを備え、新たな第三の情報を最新の第一の情報として、回帰的に作動する自己産出的情報処理システムである。
このとき、第二の情報から第一の情報に対して関係性の高い前記第三の情報を選択することができる。また、第二の情報から第三の情報を偶有的に選択することもできる。選択手法を変更したり、選択の割合を調整したりすることで、傾向の異なった結果を得ることが期待できる。
なお、第二の情報から第三の情報を選択する手段と、併合した第二の情報から新たな第三の情報を選択する手段は、物理的に同一の手段を用いてもよいことはいうまでもない。
本発明の他の側面は、情報を収集して出力する情報処理システムであって、第一の情報を入力する手段と、第一の情報に関連する第二の情報を収集する手段と、第二の情報から第一の法則に基づいて、第一の情報に対して関係性の高い第三の情報を選択する手段と、第二の情報から第一の法則とは異なる第二の法則に基づいて、第四の情報を選択する手段と、第三の情報または第四の情報を新たな第一の情報として、回帰的に新たな第二の情報を収集する手段とを備え、第三の情報から第一の情報への回帰と、第四の情報から第一の情報への回帰を所定の比率で行うことを特徴とする自己産出的情報処理システムである。
本発明のさらに他の側面は、情報を収集して出力する情報処理方法であって、第一の情報を入力するステップと、第一の情報に関連する第二の情報を収集するステップと、第二の情報から、第一のルールに基づいて第三の情報を選択するステップと、第二の情報から、第一のルールと異なる第二のルールに基づいて第四の情報を選択するステップと、第三の情報または前記第四の情報を新たな第一の情報として新たな第二の情報を収集するステップと、既にある第二の情報と新たな第二の情報を所定の比率で併合するステップと、併合した第二の情報から、第一のルールに基づいて新たな第三の情報を選択するステップと、併合した第二の情報から、第二のルールに基づいて新たな第四の情報を選択するステップとを備え、回帰的に行われる自己産出的情報処理方法である。
このように異なる法則やルールにより情報を抽出し、回帰的に情報を収集することにより、発展性や意外性のある結果の抽出が期待できる。
上記の各情報は、データベースまたは検索エンジンに対するクエリ、時系列データに対する事象などが適用できる。また、上記のシステムの動作中あるいは方法の実行中、あるいは実行後、これらの情報を表示装置に表示させることにより、ユーザは処理の状態を容易に把握することができる。
本発明によれば、ユーザの入力に対して収集情報の内容が更新され続け、ユーザが当初想定していなかったような派生的や飛躍的な情報を継続的に提供することができる。
上記以外の課題、構成、効果は、以下の実施形態の説明により明らかにされる。
本発明による実施例1の自己産出的情報処理システムの構成図。 実施例1の自己産出的情報処理プロセスを説明するフローチャート。 実施例1の操作や表示を行うためのユーザインタフェースの構成図。 実施例1の収集情報の併合処理の例を示す表図。 実施例1のユーザインタフェースの表示例を示す概念図。 実施例2の自己産出的情報処理プロセスを説明するフローチャート。 実施例2の情報系列の生成処理の例を示す概念図。 実施例3の情報空間から見た自己産出的情報処理の例を示すベン図。 実施例4の自己産出的情報処理システムの構成概念図。
以下、本発明による実施例を図面と共に説明する。ただし、本発明は以下に示す実施の形態の記載内容に限定して解釈されるものではない。本発明の思想ないし趣旨から逸脱しない範囲で、その具体的構成を変更し得ることは当業者であれば容易に理解される。
以下に説明する発明の構成において、同一部分又は同様な機能を有する部分には同一の符号を異なる図面間で共通して用い、重複する説明は省略することがある。
本明細書等における「第一」、「第二」、「第三」などの表記は、構成要素を識別するために付するものであり、必ずしも、数または順序を限定するものではない。構成要素の識別のための番号は文脈毎に用いられ、一つの文脈で用いた番号が、他の文脈で必ずしも同一の構成を示すとは限らない。また、ある番号で識別された構成要素が、他の番号で識別された構成要素の機能を兼ねることを必ずしも妨げるものではない。
図1は、本発明による実施例1の自己産出的情報処理システムの構成図である。自己産出的情報処理システム100はコンピュータ110、ネットワーク180、データベース191〜193から成る。
コンピュータ110はプロセッサ120、メモリ130、ネットワークインタフェース150、ストレージ160、ユーザインタフェース170から成る。メモリ130はコンピュータ110(プロセッサ120)に情報処理を行わせるためのプログラム140を載せ、第一の情報の入力プログラム141、第二の情報の収集プログラム142、第二の情報の併合プログラム143、第三または第四の情報の選択プログラム144、第二、第三または第四の情報の出力プログラム145を備える。
コンピュータ110は、プログラム140に従って、ユーザインタフェース170から入力を受け、ネットワークインタフェース150とネットワーク180を介してデータベース191〜193から情報を収集し、メモリ130またはストレージ160に格納し、その情報の併合や選択などの処理を行い、ユーザインタフェース170に出力する。
以上の構成は、単体のコンピュータ110で構成してもよいし、あるいは、任意の部分が、ネットワークで接続された他のコンピュータの全部または一部で構成されてもよい。発明の思想としては等価であり、変わるところがない。
データベース191〜193は、いわゆるデータベースシステムの他に、例えばインターネット、ソーシャルメディア、センサーネットワークなどの情報源である場合があり、データベースエンジンや検索エンジンなどの情報収集エンジン190を備える場合がある。
図2は、実施例1の自己産出的情報処理プロセスを説明するフローチャートである。フローチャート200はステップ201から始まり、ステップ202ではプログラム141によりユーザインタフェース170へ第一の情報を入力する。第一の情報は例えばデータベースや検索エンジンに対するクエリ、時系列データに対する事象などであり、その他に操作や表示に関する情報を含んでもよい。ステップ203では第一の情報が停止を示す情報であればステップ209へ移行して終了し、そうで無ければステップ204へ移行する。
ステップ204ではプログラム142によりデータベース191〜193から第一の情報に関連する第二の情報を収集する。第二の情報は例えば用途に応じてグラフ、テーブル、リストなどのデータ構造を備える。ステップ204が初回である場合、ステップ205ではステップ204で収集した第二の情報のままステップ206、207へ移行する。
ステップ206ではプログラム144により入力である第一の情報に対して重要性や関係性の高い第三の情報を第二の情報から選択する。第二の情報が例えばグラフ構造データであれば、第一の情報の頂点(オブジェクトや事象など)の近傍にあって頂点の重み(重要性)や辺の重み(関係性)の大きい頂点を第三の情報として選択する。例えば他のデータ構造であれば、特許文献1や特許文献2のように第二の情報に対して関係性の高いデータ属性やクエリ提案を選択する。例えば、重要性や関係性等の評価項目を数値化し、所定閾値を用いて閾値以上の数値を持つ情報を特定し、その中から第三の情報を選択することができる。あるいは、数値化した評価項目をソートし、上位から所定個数の情報を抽出し、その中から第三の情報を選択してもよい。あるいは、単純に最も数値の高いものひとつを選択してもよい。
ステップ207ではプログラム144により第二の情報の中から偶有的に第四の情報を選択する。第二の情報が例えばグラフ構造データであれば、第二の情報の頂点の中から第四の情報の頂点をランダムに選択するか、第一の情報の頂点から他の頂点への距離で重み付けした上で第四の情報の頂点をランダムに選択する。例えば他のデータ構造であれば、補助的なデータ属性やクエリ候補の中からランダムに選択する。また、第二の情報の頂点の重要性や関係性のランクに揺らぎやノイズやシャッフルなどを加えた後に上位ランクにある第二の情報を第四の頂点として選択する法則などを用いてもよい。
ステップ206、207で選択した第三の情報または第四の情報は、ステップ202へ回帰して新たな第一の情報の入力となる。ステップ203を通って、ステップ204では新たな第一の情報に関連する第二の情報を収集する。ステップ205ではプログラム143により既にある前回の第二の情報と新たな今回の第二の情報を所定の比率(α:β)で併合する。第二の情報が例えばグラフ構造データであれば、前回と今回の頂点や辺の重みを所定の比率で足し合わせる。すなわち前回のグラフ構造データの頂点や辺の重みを比率に応じて減退させ、今回のグラフ構造データの頂点や辺の重みを比率に応じて増進する。例えば他のデータ構造であれば、追加したデータ属性やクエリによるデータを追記し、古いデータを削除する。
ステップ205を経て、ステップ206、207では再び第三の情報または第四の情報を選択し、それらがステップ202へ戻って第一の情報となり、ステップ204では第二の情報が収集され、ステップ205では前回と今回の第二の情報が併合され、回帰的に循環する。ステップ206からステップ202への回帰とステップ207からステップ202への回帰は所定の比率(μ:ν)で行い、例えば用途に応じて関係的な選択と偶有的な選択が一方ずつまたは同時に回帰する。なお、回帰的な循環の途中に割り込んでユーザインタフェース170へ第一の情報を入力してもよい。ステップ208ではプログラム145によりユーザインタフェース170へステップ205で併合した第二の情報、ステップ206、207で選択した第三の情報、第四の情報を出力する。ステップ202からステップ206、207の回帰的な循環プロセスにより自己産出的に新たな第二、第三、第四の情報が生まれ、ユーザインタフェース170へ継続的に出力される。
図3は、実施例1の操作や表示を行うためのユーザインタフェースである。ユーザインタフェース170はディスプレイ210の中に情報表示ウィンドウ211、212、入力ウィンドウ213、設定スライダ214、215、操作ボタン216を備える。
情報表示ウィンドウ211、212では第二の情報、第三の情報または第四の情報を表示する。第二の情報が例えばグラフ構造データであれば、ウィンドウ211に頂点(A、Bなど)の重みを円の大きさ、辺(A−B、A−Cなど)の重みを線の太さで表したグラフ217を図示し、ウィンドウ212に頂点の重みの値と辺の重みの値を表示する。第二の情報から選択した第三の情報または第四の情報(例えば頂点B)は、第二の情報のグラフ217の上に点線の円218により図示する。
入力ウィンドウ213ではユーザが第一の情報(クエリ、事象など)すなわち情報収集条件を入力する。情報処理プロセスの途中でウィンドウ213から入力したり、マウス操作によりポインタで頂点219を選択したりして、第一の情報を入力することが可能であり、ユーザと情報処理とのインタラクションを図れる。
設定スライダ214、215では情報処理条件を設定する。スライダ214では第二の情報の併合比率(α:β)を設定し、ノブを左にスライドするとαが大きくなり、右にスライドするとβが大きくなる。αを大きくすると既にある第二の情報の割合が大きくなり、βを大きくすると新たな第二の情報の割合が大きくなる。新たな第二の情報の割合が大きくなるということは、例えば新しいクエリに置き換わる部分が大きくなることに相当する。
スライダ215では第三の情報と第四の情報の回帰比率(μ:ν)を設定し、ノブを左にスライドするとμが大きくなり、右にスライドするとνが大きくなる。μを大きくすると第三の情報(関係的)が選択される割合が増え、νを大きくすると第四の情報(偶有的)が選択される割合が増える。第三の情報(関係的)が選択される割合が増えると、ユーザが想定した情報に関連する情報が収集されやすくなることが期待される。また、第四の情報(偶有的)が選択される割合が増えると、ユーザの想定外の情報が収集されやすくなり、意外性のある結果が得られることが期待される。
情報処理プロセスの途中で併合比率や回帰比率を変更することが可能であり、ユーザとのインタラクションを行える。
操作ボタン216では情報処理プロセスの自動実行、コマ送り実行、一旦停止、停止を操作する。自動実行を押すとプロセスの回帰的な循環が継続的に進み、コマ送り実行を押すとフローチャート200に示すプロセスが一つずつ進み、一旦停止を押すとプロセスの途中で一旦止まり、停止を押すとプロセスが終了する。
図4は、実施例1の収集情報の併合処理の例である。回帰的な循環プロセスにおいて既にある前回の第二の情報220と、選択した第三の情報または第四の情報を第一の情報として収集した新たな今回の第二の情報221から、併合した第二の情報222を算出する。例えば前回の第二の情報220の頂点Cの値c、辺A−Cの値Xacと、今回の第二の情報221の頂点Cの値c’、辺A−Cの値Xac’を所定の比率(α:β)で足して、併合した第二の情報222の頂点Cの値α・c+β・c’、辺A−Cの値α・Xac+β・Xac’を得る。αとβは整数または実数であり、確率的に正規化する場合はβ=1−αである。
図5は、実施例1のユーザインタフェースの表示例である。情報処理の実行時間すなわち回帰的な循環プロセスの回帰回数に伴って、ユーザインタフェースの表示がグラフ230からグラフ231、232へ変化する。グラフ230は頂点Aを第一の情報として第二の情報を収集した結果であり、第三の情報または第四の情報として頂点Bが選択される。それが回帰して、頂点Bを新たな第一の情報として第二の情報を収集した結果が、グラフ231となって頂点Kが選択される。それが回帰して、頂点Kを新たな第一の情報として第二の情報を収集した結果が、グラフ232となって頂点Pが選択される。このような循環により新たなグラフが継続的に表示され続ける。
実施例1の自己産出的情報処理システムによれば、回帰的な循環プロセスを介してユーザへ新たな情報を継続的に提供し続けることができる。また、第三の情報または第四の情報の選択により、ユーザが当初想定していなかった関係的(派生的)や偶有的(飛躍的)な情報によりユーザの直観や創造性を喚起して気づきや発見に繋げることができる。
実施例1のシステムは、自らの境界(関係性を有する情報の全体性)を維持しつつも、自らの履歴(収集した情報)に言及して淘汰しながら偶有的な生成変化を伴って自らの境界を変えていくという意味で、自己産出的システムであると言える。実施例1の第二の情報の併合処理(回帰前の古い情報の減衰と回帰後の新しい情報の増進)は記憶の忘却と創造の関係に通じ、第三の情報(関係的な選択)と第四の情報(偶有的な選択)を交えた回帰処理は意思決定プロセスにおける活用戦略と探索戦略のバランスに通じる。
実施例1は自ら情報処理を継続的に行うため、ユーザ自身が様々な入力を試行してその度に情報処理を行う場合に比べて処理効率が向上する効果がある。また、第二の情報の併合処理は、古い情報と新しい情報を保持し続ける場合に比べてメモリ容量を効率的に利用できる効果がある。
実施例1では主にグラフ構造データを例にとって説明したが、グラフは意味ネットワーク、共起ネットワーク、事象ネットワーク、ソーシャルネットワーク、確率過程グラフ、離散データグラフなど多岐に渡り、無向グラフに限らず有向グラフでもよい。データベースや情報源として、グラフデータベースの他に、リレーショナルデータベース、NoSQLのオブジェクトデータベース、キーバリューストアなどにも広範に適用できる。
実施例1では情報処理が自動的に進行するが、ストレージにログを保存しておいて一旦巻き戻して途中から再実行し、ユーザ入力、関係的な選択、偶有的な選択を変えて情報処理を進行させる機能を加えてもよい。実施例1では関係的な選択と偶有的な選択の双方を備えるが、用途に応じて一方のみでもよく、例えば関係性の高い所定の範囲でランダムに選択する方法などを採用してもよい。
実施例1では古い第一の情報を新しい第一の情報へ更新して古い第二の情報と新しい第二の情報を併合するが、他の実施例として古い第一の情報に新しい第一の情報を付け加えつつ古い第一の情報を回帰回数に応じて削除しながら第二の情報を収集する方法も考え得る(見方を変えれば実施例1と異なる併合処理とも言える)。ただし、この方法は実施例1に比べて第二の情報の内容(例えばグラフの形状)がより非連続的に変化するため、この特性に配慮して実施してもよい。
図6は、実施例2の自己産出的情報処理プロセスを説明するフローチャートである。フローチャート300において、ステップ301では第一の情報を入力する。ステップ302では第一の情報に関連する第二の情報を収集し、ステップ303では回帰的な循環において既にある第二の情報と新しい第二の情報を所定の比率(α:β)で併合する(例えば頂点A、Bなどとそれを結ぶ辺A−B、B−Kなどから成るグラフ)。ステップ304では第二の情報から第一の情報に対して関係性の高い第三の情報を選択し(例えば頂点K)、それを新たな第一の情報としてステップ301へ所定の比率(μ)で回帰する。
ステップ305では第二の情報の関係性から情報系列(例えばグラフの頂点の系列K−B−A−D−H、L−B−A−C−Iなど)を生成し、ステップ306では生成した情報系列の関係性(例えばK−B−A−D−H、L−B−A−C−Iなどを頂点とした場合の頂点の重みや辺の重み)を導出する。ステップ307では情報系列の中から第四の情報を偶有的に選択し(例えばL−K−N−以下略)、それを新たな第一の情報としてステップ301へ所定の比率(ν)で回帰する。
ステップ208では第二の情報、第三の情報、第四の情報を出力する(例えば第二の情報のグラフ、第三の情報の頂点K、情報系列のグラフ、第四の情報のL−K−N−以下略)。ステップ302からステップ303、304を経てステップ301への回帰とステップ305からステップ306、307を経てステップ301への回帰により、自己産出的に第二、第三、第四の情報が生成され、それらの新たな情報がステップ208で継続的に出力される。
図7は、実施例2の情報系列の生成処理の例である。ステップ303で併合した第二の情報から、ステップ305では例えばK−B−A−D−H、L−B−A−C−Iなどの頂点の系列を生成する。ステップ306ではK−B−A−D−H、L−B−A−C−Iなどの発生率を計算して頂点の重みとし、(K,B,A,D,H)と(L,B,A,C,I)などの類似度を計算して辺の重みとする。例えば情報系列K−B−A−D−Hの発生率は頂点Kの重み(生起確率)とK−B、B−A、A−D、D−Hの辺の重さ(遷移確率)から求め、(K,B,A,D,H)と(L,B,A,C,I)の類似度はコサイン類似度、ピアソンの相関係数、ジャッカード係数などから求める。
実施例2の自己産出的情報処理プロセスによれば、回帰的な循環プロセスを介してユーザへ新たな情報を継続的に提供し続けると共に、第二の情報(ソースターム、思考素や事象)と情報系列(シナリオ、思考や事象の繋がり)を合わせて提供することができる。実施例2では情報系列の発生率や類似度を提供するため、ユーザ自身が第二の情報の中から様々な情報系列の組み合わせを考える必要がなく、ユーザの便宜が向上すると共にユーザとのインタラクションに要する時間が短縮されて情報処理効率が向上する。
ユーザの入力に応じた関係的なソースの選択は言わば無意識における反射的や類推的な活動であり、偶有的なシナリオの選択は無意識から生じる意識における投機的や発見的な活動であり、両者を合わせることにより活用戦略と探索戦略のバランスが取れた情報をユーザへ提供することができる。
ユーザすなわち人間はマジカルナンバー7±2というサイズの意味を持った情報の塊により短期記憶や因果関係の検出を行っているため、実施例2では情報系列のサイズを5に設定したが、その他のサイズを採用してもよい。また、情報系列は思考や事象のシナリオであるため、自動作文機能を介して第四の情報の系列を文としてユーザへ提示することも可能である。
図8は、実施例3の情報空間から見た自己産出的情報処理の例である。情報空間400において、ユーザが当初想定しているだろう情報の範囲をユーザ空間401、ユーザの関心に対して意味を持つだろう情報のカテゴリを意味空間402、自己産出的情報処理がユーザへ提示する情報の範囲を情報処理空間403として考える。ユーザ空間401、意味空間402、情報処理空間403の情報エントロピーをそれぞれH(X)、H(Y)、H(Z)とする。
自己産出的情報処理において、ユーザの入力に対して関係性の高い情報を選択する循環406はユーザ空間401の中にあるだろう情報を情報処理空間403から抽出しようとするプロセスであり、それは相互情報量I(X;Y;Z)404が表す空間での作動に相当する。一方で情報を偶有的に選択する循環407はユーザ空間(想定内)401の外にあって意味空間(カテゴリ)402の中にあるだろう情報を情報処理空間403から抽出しようとするプロセスであり、それは相互情報量I(Y;Z|X)405が表す空間での作動に相当する。
意味空間402の外にある情報はユーザにとって価値がないため、偶有的循環407では相互情報量I(Y;Z|X)405を重み付け指標として情報を選択することができる。相互情報量は関係性を持ちながらも希少である情報を拾う働きがあり、ユーザが当初想定していなかった情報を提供して気づきや発見に繋げることができる。例えば情報検索や文書情報などを扱う場合は、相互情報量の代わりにtf−idfなどの指標を使ってもよい。意味空間402としてカテゴリ、コーパス、データベースなどを予め設定できない場合は、ユーザとのインタラクションを通じて次第に意味空間を絞り込む機能を設けてもよい。
本実施例においても、ハードウエアやソフトウエア構成は、基本的に図1、図2の構成と同様に実現できる。図1、図2で説明した第四の情報を選択する際に、第一の情報に関するカテゴリと第二の情報との相互情報量を重み付け指標として第四の情報を偶有的に選択すればよい。
図9は、実施例4の自己産出的情報処理システムの構成概念図である。自己産出的情報処理システム500は、人や社会のシステム510から情報の入力(人や社会の出力)501を受け、人や社会のシステム510へ情報の出力(人や社会の力)507を行い、人や社会とインタラクションを行う。入力501を受けた関連情報の収集502と併合503と選択504の循環は無意識的プロセス、収集502と併合503と情報系列の生成505と選択506の循環は意識的プロセスと捉えられ、人の心と同じように無意識と意識から成る自己産出的システムを構成している。このような概念を実現する情報処理システム500は、図1、図2で代表されるハードウエアとソフトウエアによって実現され、人間の精神活動を模した情報処理を可能とする。
人や社会のシステム510は、環境512とインタラクション(構造的カップリング)を行いつつ回帰的な循環により自らの境界を定める自己産出的システム511である。人や社会のシステム510にとって情報処理システム500は環境512であり、逆に情報処理システム500にとって人や社会のシステム510は環境であり、両者は互いにインタラクションを行いながら自己の境界を変成し続け、共進化することができる。実施例4の観点から見ると、本発明は心や意識を持った情報処理システムの一つの形態を提供していると言える。
本実施例中、ソフトウエアで構成した機能と同等の機能は、FPGA(Field Programmable Gate Array)、ASIC(Application Specific Integrated Circuit)などのハードウエアでも実現できる。そのような態様も本願発明の範囲に含まれる。
本発明は上記した実施形態に限定されるものではなく、様々な変形例が含まれる。例えば、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることが可能である。また、各実施例の構成の一部について、他の実施例の構成の追加・削除・置換をすることが可能である。
本発明は情報を収集して出力する情報処理システムおよび方法に利用可能である。
100…自己産出的情報処理システム、110…コンピュータ、120…プロセッサ、130…メモリ、140…プログラム、141…第一の情報の入力、142…第二の情報の収集、143…第二の情報の併合、144…第三、第四の情報の選択、145…第二、第三、第四の情報の出力、150…ネットワークインタフェース、160…ストレージ、170…ユーザインタフェース、180…ネットワーク、190…情報収集エンジン、191〜193…データベース。

Claims (15)

  1. 情報を収集して出力する自己産出的情報処理システムであって、
    第一の情報を入力する手段と、
    前記第一の情報に関連する第二の情報を収集する手段と、
    前記第二の情報から第三の情報を選択する手段と、
    前記第三の情報を新たな第一の情報として新たな第二の情報を収集する手段と、
    前記第二の情報と前記新たな第二の情報を所定の比率で併合する手段と、
    前記併合した第二の情報から新たな第三の情報を選択する手段とを備え、
    前記新たな第三の情報を最新の第一の情報として、回帰的に作動する自己産出的情報処理システム。
  2. 請求項1において、前記第二の情報から前記第一の情報に対して関係性の高い前記第三の情報を選択し、前記新たな第一の情報として回帰することを特徴とする自己産出的情報処理システム。
  3. 請求項1において、前記第二の情報から前記第三の情報を偶有的に選択し、前記新たな第一の情報として回帰することを特徴とする自己産出的情報処理システム。
  4. 請求項1において、前記第二の情報がグラフ構造データであり、前記第一の情報と前記第三の情報がグラフの頂点を指定するデータであることを特徴とする自己産出的情報処理システム。
  5. 請求項4において、前記第二の情報のグラフから前記第一の情報の頂点の近傍にあって頂点の重みや辺の重みが大きい頂点を前記第三の情報として選択し、前記新たな第一の情報の頂点として回帰することを特徴とする自己産出的情報処理システム。
  6. 請求項4において、前記第二の情報のグラフの頂点の中から、前記第三の情報の頂点をランダムに選択し、前記新たな第一の情報の頂点として回帰することを特徴とする自己産出的情報処理システム。
  7. 請求項4において、前記第二の情報のグラフの頂点の中から、前記第一の情報の頂点に対する他の頂点への距離で重み付けした上で前記第三の情報の頂点をランダムに選択し、前記新たな第一の情報の頂点として回帰することを特徴とする自己産出的情報処理システム。
  8. 請求項4において、既にある前記第二の情報のグラフの頂点と辺の重みと、前記新たな第二の情報のグラフの頂点と辺の重みを、それぞれ所定の併合比率で足し合わせることを特徴とする自己産出的情報処理システム。
  9. 請求項1において、前記第一の情報と前記第三の情報がデータベースまたは検索エンジンに対するクエリであることを特徴とする自己産出的情報処理システム。
  10. 請求項1において、前記第一の情報と前記第三の情報が時系列データに対する事象であることを特徴とする自己産出的情報処理システム。
  11. 情報を収集して出力する自己産出的情報処理システムであって、
    第一の情報を入力する手段と、
    前記第一の情報に関連する第二の情報を収集する手段と、
    前記第二の情報から第一の法則に基づいて、前記第一の情報に対して関係性の高い第三の情報を選択する手段と、
    前記第二の情報から前記第一の法則とは異なる第二の法則に基づいて、第四の情報を選択する手段と、
    前記第三の情報または前記第四の情報を新たな第一の情報として、回帰的に新たな第二の情報を収集する手段とを備え、
    前記第三の情報から前記第一の情報への回帰と、前記第四の情報から前記第一の情報への回帰を所定の比率で行うことを特徴とする自己産出的情報処理システム。
  12. 請求項11において、既にある前記第二の情報と前記新たな第二の情報を所定の比率で併合する手段を備え、併合された第二の情報から、前記第三の情報と前記第四の情報を選択することを特徴とする自己産出的情報処理システム。
  13. 請求項11において、収集した第二の情報の関係性から情報系列を生成し、情報系列の関係性を導出し、情報系列の中から第四の情報を偶有的に選択することを特徴とする自己産出的情報処理システム。
  14. 請求項11において、第一の情報に関するカテゴリと第二の情報との相互情報量を重み付け指標として第四の情報を偶有的に選択することを特徴とする自己産出的情報処理システム。
  15. プロセッサ、メモリ、ユーザインタフェース、およびデータベースをアクセスするためのネットワークインタフェースを備えるコンピュータが実行する、情報を収集して出力する自己産出的情報処理方法であって、
    前記プロセッサが前記メモリに格納されるプログラムを実行することにより実行され、
    前記ユーザインタフェースにより第一の情報を入力するステップと、
    前記ネットワークインタフェースにより前記データベースから前記第一の情報に関連する第二の情報を収集するステップと、
    前記第二の情報から、第一のルールに基づいて第三の情報を選択するステップと、
    前記第二の情報から、前記第一のルールと異なる第二のルールに基づいて第四の情報を選択するステップと、
    前記第三の情報または前記第四の情報を新たな第一の情報として新たな第二の情報を収集するステップと、
    既にある前記第二の情報と前記新たな第二の情報を所定の比率で併合するステップと、
    前記併合した第二の情報から、前記第一のルールに基づいて新たな第三の情報を選択するステップと、
    前記併合した第二の情報から、前記第二のルールに基づいて新たな第四の情報を選択するステップとを備え、
    回帰的に行われる自己産出的情報処理方法。
JP2016543780A 2014-08-22 2014-08-22 自己産出的情報処理システムおよび方法 Active JP6364086B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2014/072015 WO2016027372A1 (ja) 2014-08-22 2014-08-22 自己産出的情報処理システムおよび方法

Publications (2)

Publication Number Publication Date
JPWO2016027372A1 JPWO2016027372A1 (ja) 2017-06-01
JP6364086B2 true JP6364086B2 (ja) 2018-07-25

Family

ID=55350349

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016543780A Active JP6364086B2 (ja) 2014-08-22 2014-08-22 自己産出的情報処理システムおよび方法

Country Status (3)

Country Link
US (1) US10452721B2 (ja)
JP (1) JP6364086B2 (ja)
WO (1) WO2016027372A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6987003B2 (ja) * 2018-03-20 2021-12-22 株式会社Screenホールディングス テキストマイニング方法、テキストマイニングプログラム、および、テキストマイニング装置
CN111339394B (zh) * 2020-02-19 2023-08-22 北京百度网讯科技有限公司 用于获取信息的方法及装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9946779B2 (en) * 2003-05-28 2018-04-17 Oracle International Corporation Pipleline merge operations using source data and multiple destination data structures
US7587394B2 (en) 2003-09-23 2009-09-08 International Business Machines Corporation Methods and apparatus for query rewrite with auxiliary attributes in query processing operations
JP2009015589A (ja) * 2007-07-04 2009-01-22 Nomura Research Institute Ltd 関連文書提示システム及びプログラム
JP4678546B2 (ja) * 2008-09-08 2011-04-27 ソニー株式会社 推薦装置および方法、プログラム、並びに記録媒体
US8560562B2 (en) 2010-07-22 2013-10-15 Google Inc. Predictive query suggestion caching
JP5585489B2 (ja) * 2011-02-17 2014-09-10 富士通株式会社 検索支援装置、プログラム及び方法
JP5730798B2 (ja) * 2012-02-22 2015-06-10 株式会社デンソーアイティーラボラトリ 情報検索装置、情報検索方法、およびプログラム
US10019493B2 (en) * 2012-11-05 2018-07-10 Nec Corporation Related information presentation device, and related information presentation method

Also Published As

Publication number Publication date
US10452721B2 (en) 2019-10-22
JPWO2016027372A1 (ja) 2017-06-01
US20170270223A1 (en) 2017-09-21
WO2016027372A1 (ja) 2016-02-25

Similar Documents

Publication Publication Date Title
Sadeque et al. Measuring the latency of depression detection in social media
US20220188337A1 (en) Organizing survey text responses
Gheisari et al. Data mining techniques for web mining: a survey
US9015080B2 (en) Systems and methods for semantic inference and reasoning
US8244766B2 (en) Applying a model of a persona to search results
KR101897080B1 (ko) 의료 기록 문서에서의 의료 단어의 연관 규칙 생성 방법 및 그 장치
KR102106684B1 (ko) 동적인 피쳐 획득과 분류를 위한 공동 학습 프레임워크
Niu et al. Understanding faceted search from data science and human factor perspectives
Sisodia et al. Fast prediction of web user browsing behaviours using most interesting patterns
US10579734B2 (en) Web-based influence system and method
Maia et al. Context-aware food recommendation system
Tran et al. The forgotten needle in my collections: Task-aware ranking of documents in semantic information space
US9152705B2 (en) Automatic taxonomy merge
JP6364086B2 (ja) 自己産出的情報処理システムおよび方法
US20140280216A1 (en) Automated ranking of contributors to a knowledge base
WO2016088212A1 (ja) データ収集装置、及びデータ収集方法
Patel et al. Web page classification using data mining
Adeniyi et al. Risk factors analysis and death prediction in some life-threatening ailments using chi-square case-based reasoning (χ 2 CBR) Model
Raja et al. An entropy-based hybrid feature selection approach for medical datasets
US11942226B2 (en) Providing clinical practical guidelines
JP6103766B2 (ja) 行動プロセス抽出方法及び行動プロセス抽出装置
JP2023550510A (ja) 推薦方法、装置、電子機器及び記憶媒体
Fiarni Design of Knowledge Management System for Diabetic Complication Diseases
Shan et al. WebPut: A web-aided data imputation system for the general type of missing string attribute values
Turkoglu et al. Improving Retweet Prediction via Tweet Features

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170216

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170216

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180417

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180607

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180619

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180629

R150 Certificate of patent or registration of utility model

Ref document number: 6364086

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150