[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP3298516B2 - Internet information search system and method - Google Patents

Internet information search system and method

Info

Publication number
JP3298516B2
JP3298516B2 JP24323698A JP24323698A JP3298516B2 JP 3298516 B2 JP3298516 B2 JP 3298516B2 JP 24323698 A JP24323698 A JP 24323698A JP 24323698 A JP24323698 A JP 24323698A JP 3298516 B2 JP3298516 B2 JP 3298516B2
Authority
JP
Japan
Prior art keywords
robot
url
time
management means
connection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP24323698A
Other languages
Japanese (ja)
Other versions
JP2000076264A (en
Inventor
祐希子 荒木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP24323698A priority Critical patent/JP3298516B2/en
Publication of JP2000076264A publication Critical patent/JP2000076264A/en
Application granted granted Critical
Publication of JP3298516B2 publication Critical patent/JP3298516B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Multi Processors (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明はインターネット情報
探索システムに関し、特にインターネット経由で参照で
きる多数の文書やデータを検索する検索エンジンに必要
なデータベースを作成するために、文書とURL(Un
iform Resource Location)を
取得するインターネット情報探索システムに関する。
[0001] 1. Field of the Invention [0002] The present invention relates to an Internet information search system, and more particularly, to creating a database necessary for a search engine that searches a large number of documents and data that can be referred to via the Internet, by using documents and URLs (Uns
The present invention relates to an Internet information search system that acquires an iform resource location.

【0002】[0002]

【従来の技術】従来、インターネット情報探索システム
はインターネット上の情報から自分の求めている情報を
すぐに探し出せるように、あらかじめ広範囲にわたって
URLの情報を取得するために用いられている。しか
し、実際にURLを探索してデータを取得するプログラ
ムをロボットというが、各ロボットのURL情報の取得
間隔が一定であり、他に起動されているロボットのこと
を何ら考慮していないため、ロボットが目標とするサー
バにURL情報を取得しにいくタイミングが悪いとCP
Uやネットワークに負荷をかけることがある。
2. Description of the Related Art Conventionally, an Internet information search system has been used to acquire URL information over a wide area in advance so that the information desired by the user can be immediately searched from information on the Internet. However, a program for actually searching for a URL and acquiring data is called a robot. However, since the acquisition interval of URL information of each robot is constant and no consideration is given to other activated robots, a robot is used. If the timing to get URL information to the target server is bad, the CP
U or the network may be overloaded.

【0003】[0003]

【発明が解決しようとする課題】上述した従来のインタ
ーネット情報探索システムは、第1の問題点は、ロボッ
トが目標とするサーバにURL情報を取得しにいくタイ
ミングが悪いとCPUやネットワークに負荷をかけるこ
とがあるということである。
The first problem with the conventional Internet information search system described above is that if the timing at which the robot obtains the URL information from the target server is bad, the load on the CPU and the network is increased. That is to say,

【0004】その理由は、各ロボットのURL情報の取
得間隔が一定であり、他に起動されているロボットのこ
とを何ら考慮していないためである。
[0004] The reason is that the URL information acquisition interval of each robot is constant, and no consideration is given to other activated robots.

【0005】本発明の目的は、URL取得対象のサーバ
の負荷を考え、同じサーバのURLを取得する時はある
一定の時間をおくこととして、この動作をある範囲まで
繰り返し、データベースを作成していくインターネット
情報探索システムにおいて、ロボットの起動時間、起動
したロボットが次のURLにアクセスに行く時間を、他
のロボットの状況によって調節する機能をもつインター
ネット情報探索システムを提供することにある。
[0005] An object of the present invention is to consider the load of a server from which a URL is to be obtained, and to obtain a URL of the same server at a certain time interval, repeat this operation to a certain extent, and create a database. An object of the present invention is to provide an Internet information search system having a function of adjusting the activation time of a robot and the time for the activated robot to access the next URL according to the status of another robot.

【0006】[0006]

【課題を解決するための手段】本発明のインターネット
情報探索システムは、データ処理装置と情報を記憶する
記憶装置とを含み、記憶装置はロボット情報記憶部とU
RL情報記憶部とを備え、ロボット情報記憶部は、ロボ
ットを見分けるためのIDとそのロボットの起動時間、
接続に要する時間を記憶し、URL情報記憶部は、取得
したWWWサーバの情報及びURLの最終取得時間を含
む情報を記憶し、データ処理装置はロボット管理手段と
ロボットとURL管理手段とを備え、ロボット管理手段
はURL管理手段より未取得のWWWサーバを取得し、
1つのWWWサーバに対して1つのロボットを起動し、
ロボット情報記憶部を参照して次のロボットの立ち上げ
時間を調節し、ロボットはロボット管理手段によって起
動され、目的のURLを取得し、本URLの取得時間を
ロボット管理手段に通知し、取得したURLをURL管
理手段に通知し、起動された後はURL管理手段に次の
URLを問い合わせたのち、ロボット管理手段に次回起
動時間を問い合わせ、その時間によりアクセスし、UR
L管理手段はロボット管理手段から次のWWWサーバリ
ストの要求をうけ、また、ロボットからの次に探索すべ
きURLの要求を受けつけURL情報記憶部を検索し、
結果をロボット管理手段およびロボットに渡し、ロボッ
トからのURLの通知を受け取り、URL情報記憶部の
更新、または登録を行うことにより構成されている。
SUMMARY OF THE INVENTION An Internet information search system according to the present invention includes a data processing device and a storage device for storing information.
An RL information storage unit, wherein the robot information storage unit includes an ID for identifying the robot, a startup time of the robot,
The time required for connection is stored, the URL information storage unit stores the acquired information of the WWW server and the information including the final acquisition time of the URL, and the data processing device includes a robot management unit, a robot and a URL management unit, The robot management means acquires an unacquired WWW server from the URL management means,
Activate one robot for one WWW server,
The start-up time of the next robot is adjusted by referring to the robot information storage unit, the robot is started by the robot management unit, acquires the target URL, notifies the robot management unit of the acquisition time of the URL, and acquires the acquired URL. After notifying the URL to the URL management means, and after being started, the URL management means is inquired about the next URL, and then the robot management means is inquired about the next start time, and access is made based on the time.
The L management means receives a request for the next WWW server list from the robot management means, receives a request for the next URL to be searched from the robot, and searches the URL information storage unit.
The result is passed to the robot management unit and the robot, a URL notification is received from the robot, and the URL information storage unit is updated or registered.

【0007】[0007]

【発明の実施の形態】次に、本発明の実施の形態につい
て図面を参照して説明する。
Next, embodiments of the present invention will be described with reference to the drawings.

【0008】図1は本発明のインターネット情報探索シ
ステムの一実施の形態を示す概略図である。
FIG. 1 is a schematic diagram showing an embodiment of the Internet information search system of the present invention.

【0009】本発明の実施の形態は、図1に示すよう
に、インターネット経由で参照できる多数の文書やデー
タを検索する検索エンジン(例としてYahooやGo
oなどが実在する)に必要なデータベースを作成するた
めに、文書とURL(Uniform Resourc
e Location)を取得するインターネット情報
探索システムについての機能である。ここでいう文書と
はHTML(HyperText Markup La
nguage)で記述された文書、およびその文書から
リンクをはられた文書、データとする。実際にURLを
探索してデータを取得するプログラムをロボットとい
う。インターネット情報探索システムで最初に収集する
URLを指定すると、指定したURLが存在するサーバ
用のロボットが起動され、このURL(図1ではhtt
p://server1/index.html)を取
得しデータベースに登録する。またそのURLの内容を
解読してリンク情報を抜き出し(図1ではhttp:/
/server2/index2.html)、新たな
URLとして取得するという作業を行う。新しいURL
が違うサーバにある場合、新しいサーバ用にまたロボッ
トが起動される(つまり1サーバにつき1つのロボット
が起動される)。取得対象のサーバの負荷を考え、同じ
サーバのURLを取得する時はある一定の時間をおくこ
ととしている。この動作をある範囲まで繰り返し、デー
タベースを作成していくインターネット情報探索システ
ムにおいて、ロボットの起動時間、起動したロボットが
次のURLにアクセスに行く時間を、他のロボットの状
況によって調節する機能を提供するものである。
As shown in FIG. 1, an embodiment of the present invention employs a search engine (for example, Yahoo or Go) for searching a large number of documents and data that can be referred to via the Internet.
Documents and URLs (Uniform Resource) to create a database required for
e Location) is a function of the Internet information search system that acquires e-Location. The document referred to here is HTML (HyperText Markup Lap).
nguage), and a document and data linked from the document. A program that actually searches for a URL and acquires data is called a robot. When the first URL to be collected by the Internet information search system is designated, the robot for the server in which the designated URL exists is started, and the URL (http in FIG. 1) is used.
p /// server1 / index. html) and register it in the database. Also, the contents of the URL are decrypted to extract link information (http: // in FIG. 1).
/ Server2 / index2. html) to obtain a new URL. New URL
If is on a different server, the robot is started again for the new server (ie, one robot is started per server). Considering the load of the server to be acquired, a certain period of time is set when acquiring the URL of the same server. In the Internet information search system that repeats this operation to a certain extent and creates a database, a function to adjust the start time of the robot and the time for the started robot to access the next URL according to the status of other robots is provided. Is what you do.

【0010】図2は本発明のインターネット情報探索シ
ステムの一実施の形態を示すブロック図である。図2を
参照すると、本実施の形態は、プログラム制御により動
作するデータ処理装置1と情報を記憶する記憶装置2と
を含む。
FIG. 2 is a block diagram showing an embodiment of the Internet information search system according to the present invention. Referring to FIG. 2, the present embodiment includes a data processing device 1 that operates under program control and a storage device 2 that stores information.

【0011】記憶装置2はロボット情報記憶部21とU
RL情報記憶部22とを備えている。
The storage device 2 includes a robot information storage unit 21 and a U
The RL information storage unit 22 is provided.

【0012】図6は本発明のインターネット情報探索シ
ステムの一実施の形態の動作を示す構成図である。図6
を参照すると、ロボット情報記憶部21は、ロボットを
見分けるためのIDとそのロボットの起動時間、接続に
要する時間が記憶されている。URL情報記憶部22
は、今までに取得したWWWサーバの情報及びURLの
情報が記憶されている。URLの情報には最終取得時間
が含まれている。
FIG. 6 is a block diagram showing the operation of an embodiment of the Internet information search system according to the present invention. FIG.
, The robot information storage unit 21 stores an ID for identifying a robot, a startup time of the robot, and a time required for connection. URL information storage unit 22
Stores the information of the WWW server and the information of the URL that have been acquired so far. The URL information includes the last acquisition time.

【0013】データ処理装置1はロボット管理手段11
とロボット12とURL管理手段13とを備えている。
The data processing device 1 includes a robot management unit 11
, A robot 12 and a URL management means 13.

【0014】ロボット管理手段11はURL管理手段1
3より未取得のWWWサーバを取得し、1つのWWWサ
ーバに対して1つのロボットを起動する。この時、ロボ
ット情報記憶部21を参照して次のロボット12を立ち
上げる時間を調節する。
The robot management means 11 is a URL management means 1
3. An unacquired WWW server is acquired from 3 and one robot is activated for one WWW server. At this time, the time for starting the next robot 12 is adjusted with reference to the robot information storage unit 21.

【0015】ロボット12はロボット管理手段11によ
って起動され、目的のURLを取得する。この時にかか
る時間をロボット管理手段11に通知し、取得したUR
LはURL管理手段13に通知する。起動された後はU
RL管理手段13に次のURLを問い合わせたのち、ロ
ボット管理手段11に次回起動時間を問い合わせ、その
時間通りにアクセスする。
The robot 12 is started by the robot management means 11 and acquires a target URL. The time required at this time is notified to the robot management means 11, and the obtained UR
L notifies the URL management means 13. After activated, U
After inquiring the RL management means 13 about the next URL, the robot management means 11 is inquired about the next start time, and access is made according to the time.

【0016】URL管理手段13はロボット管理手段1
1から次のWWWサーバリストの要求をうけ、また、ロ
ボット12からの次に探索すべきURLの要求を受けつ
けURL情報記憶部22を検索し、結果をそれぞれに渡
す。またロボット12からのURLの通知を受け取り、
URL情報記憶部22の更新、もしくは登録を行う。
The URL management means 13 is a robot management means 1
In response to a request for the next WWW server list from 1, a request for the next URL to be searched from the robot 12 is received, the URL information storage unit 22 is searched, and the result is passed to each. Also, it receives a URL notification from the robot 12,
The URL information storage unit 22 is updated or registered.

【0017】次に、本発明の実施の形態の動作につい
て、図3から図7を参照して詳細に説明する。
Next, the operation of the embodiment of the present invention will be described in detail with reference to FIGS.

【0018】図3は本発明のインターネット情報探索シ
ステムのロボット起動時の動作を示す流れ図である。
FIG. 3 is a flowchart showing the operation of the Internet information search system according to the present invention when the robot is started.

【0019】図4は本発明のインターネット情報探索シ
ステムの次のURLに接続する時の動作を示す流れ図で
ある。
FIG. 4 is a flowchart showing the operation of the Internet information search system of the present invention when connecting to the next URL.

【0020】図5は従来のロボットと本発明でのロボッ
トの動作を示すシーケンスチャートである。
FIG. 5 is a sequence chart showing the operation of the conventional robot and the robot of the present invention.

【0021】図6は本発明のインターネット情報探索シ
ステムの一実施の形態の動作を示す構成図である。
FIG. 6 is a block diagram showing the operation of an embodiment of the Internet information search system according to the present invention.

【0022】図7は本発明のインターネット情報探索シ
ステムの一実施の形態の単位時間当たりのロボット起動
数算出方法を示すシーケンスチャートである。
FIG. 7 is a sequence chart showing a method of calculating the number of activated robots per unit time according to an embodiment of the Internet information search system of the present invention.

【0023】ロボット12が接続時間を調整するのはロ
ボット管理手段11がロボット12を起動する時とロボ
ット12が次のURLに接続に行こうとする時の2パタ
ーンである。
The robot 12 adjusts the connection time in two patterns: when the robot management means 11 starts the robot 12, and when the robot 12 tries to connect to the next URL.

【0024】それぞれ図3、図4で説明する。図3のロ
ボット起動時の動作を示す流れ図で、まずロボット管理
手段11がURL管理手段13に次に探索すべきWWW
サーバ名を問い合わせる(ステップA1)。ここでUR
L管理手段13はURL情報記憶部22にアクセスし、
探索する範囲のWWWサーバについてすべて処理が終わ
っているかどうか判断する(ステップA2)。この結
果、次に探索すべきWWWサーバが存在しない場合は現
在動作しているロボット12が終了するのを待つ。ロボ
ット管理手段11はロボット情報記憶部21にアクセス
し、他のロボット12の次回接続時間と接続に要する時
間を取得し、接続するタイミングが重ならないかチェッ
クする(ステップA3)。重なる場合は平均に接続でき
るようなタイミングを計算して、次回時間を調節する
(ステップA4)。次にロボット管理手段11はロボッ
ト12を起動する(ステップA5)。その後ロボット1
2はWWWサーバに接続し(ステップA6)この際にか
かった時間をロボット管理手段11に伝える(ステップ
A7)。
3 and 4, respectively. FIG. 3 is a flowchart showing the operation at the time of starting the robot in FIG. 3. First, the robot management unit 11 makes the URL management unit 13 search WWW to be searched next.
Inquire about the server name (step A1). Where UR
The L management unit 13 accesses the URL information storage unit 22,
It is determined whether or not processing has been completed for all WWW servers in the search range (step A2). As a result, if there is no WWW server to be searched next, it waits for the currently operating robot 12 to end. The robot management means 11 accesses the robot information storage unit 21, acquires the next connection time of the other robot 12 and the time required for connection, and checks whether the connection timing does not overlap (step A3). If they overlap, calculate the timing so that they can be connected to the average, and adjust the next time (step A4). Next, the robot management means 11 starts the robot 12 (step A5). Then robot 1
2 connects to the WWW server (step A6) and reports the time taken at this time to the robot management means 11 (step A7).

【0025】図4は図3の流れで起動されたロボット1
2が次のURLに接続に行こうとする時の流れであり、
ロボット管理手段11がURL管理手段13に次に探索
すべきURLを問い合わせる(ステップB1)。ここで
URL管理手段13はURL情報記憶部22にアクセス
し、探索する範囲のURLについてすべて処理が終わっ
ているかどうか判断する(ステップB2)。この結果、
次に探索すべきURLが存在しない場合は現在動作して
いるロボット12が終了するのを待つ。URLが存在す
る場合、最終取得時間を取得し、取得間隔が経過してる
かどうかを判断する(ステップB3)。まだ取得間隔を
過ぎていなかった場合、ロボット管理手段11は次に探
索すべきURLをURL管理手段13に問い合わせる。
過ぎていた場合、ロボット管理手段11はロボット情報
記憶部21にアクセスし、他のロボット12の次回接続
時間と接続に要する時間を取得し、接続するタイミング
が重ならないかチェックする(ステップB4)。重なる
場合は平均に接続できるようなタイミングを計算して、
次回時間を調節する(ステップB5)。次にロボット管
理手段11はロボットを起動する(ステップB6)。そ
の後ロボット12はWWWサーバに接続し(ステップB
7)この際にかかった時間をロボット管理手段11に伝
える(ステップB8)。この流れを探索すべきURLが
なくなるまで行う。
FIG. 4 shows the robot 1 started in the flow of FIG.
2 is the flow when trying to connect to the next URL,
The robot management means 11 inquires of the URL management means 13 about the next URL to be searched (step B1). Here, the URL management unit 13 accesses the URL information storage unit 22 and determines whether or not processing has been completed for all URLs in the search range (step B2). As a result,
If there is no URL to be searched next, the process waits until the currently operating robot 12 ends. If the URL exists, the final acquisition time is acquired, and it is determined whether or not the acquisition interval has elapsed (step B3). If the acquisition interval has not yet passed, the robot management unit 11 inquires the URL management unit 13 of a URL to be searched next.
If it has passed, the robot management unit 11 accesses the robot information storage unit 21, acquires the next connection time of the other robot 12 and the time required for connection, and checks whether the connection timing does not overlap (step B4). If they overlap, calculate the timing so that you can connect to the average,
The next time is adjusted (step B5). Next, the robot management means 11 starts the robot (step B6). Thereafter, the robot 12 connects to the WWW server (step B).
7) The time taken at this time is transmitted to the robot management means 11 (step B8). This flow is repeated until there is no more URL to search.

【0026】図3のステップA4,図4のステップB5
の時間を調節する方法について、例を用いてさらに詳し
く述べる。
Step A4 in FIG. 3 and Step B5 in FIG.
The method for adjusting the time is described in more detail using an example.

【0027】図5は従来のロボットと本発明でのロボッ
トの動作を示すシーケンスチャートである。図5では複
数のロボットの動作を時間軸上に表示している。黒の部
分はそのロボット12が動いてる時間を示している。灰
色の部分はすべてのロボットが動いてる時間を表してい
る。従来のロボットの並列動作では別のロボットが立ち
上がるタイミングをなんら考慮していないため、起動す
る時間が集中する可能性があり、複数のロボットが同じ
時間帯に動き、ロボットがまったく動かない時間(図5
の白い部分)が増えてしまうことがある。
FIG. 5 is a sequence chart showing the operation of the conventional robot and the robot of the present invention. In FIG. 5, the operations of a plurality of robots are displayed on a time axis. The black portion indicates the time during which the robot 12 is moving. The gray area represents the time all robots are moving. In parallel operation of conventional robots, there is no consideration of the timing when another robot starts up, so the startup time may be concentrated, and multiple robots move in the same time zone and the robot does not move at all (Fig. 5
White part) may increase.

【0028】本発明では複数のロボット12を分散させ
るように起動する時間を調節するので並列して動くロボ
ット12の数が減り、ロボット12が1つも動かない時
間が短くなる。
In the present invention, since the activation time is adjusted so that a plurality of robots 12 are dispersed, the number of robots 12 that move in parallel is reduced, and the time during which no robot 12 moves is shortened.

【0029】ロボット情報記憶部21には図6のように
データが記憶されている。サーバ名(WWW1,WWW
2,WWW3,WWW4,WWW5,WWW6)、その
サーバに接続しているロボット12のID(0001,
0002,0003,0004,0005,000
6)、次回の起動時間(10/10 11:24;5
5,10/10 11:24;56,10/10 1
1:25;05,10/1011:25;07,10/
10 11:24;58,10/10 11:24:5
7)、前回サーバに接続するのにかかった時間(5,
6,5,3,6,5)がサーバ毎に記述されている。
The robot information storage unit 21 stores data as shown in FIG. Server name (WWW1, WWW
2, WWW3, WWW4, WWW5, WWW6), and the IDs (0001, 0001,
0002,0003,0004,0005,000
6), next start time (October 11: 24; 5)
5, 10/10 11:24; 56, 10/10 1
1:25; 05, 10/101 1:25; 07, 10 /
10 11:24; 58, 10/10 11: 24: 5
7), the last time it took to connect to the server (5,
6, 5, 3, 6, 5) are described for each server.

【0030】ロボット12は同じサーバにアクセスする
時には一定間隔をあけることになっているが、この例で
はWWWサーバへの接続間隔を15秒だとする。サーバ
への接続間隔が一定なので、新規にロボット12が起動
されたり、あるサーバのURLがなくなって、ロボット
12が終了したりしなければ15秒おきに同じスケジュ
ールで接続が行われることになる。そこで本発明ではこ
の接続間隔15秒間のスケジューリングをロボット起動
時と次のURLにアクセスする時に逐次見直す方法をと
ることとする。図7では横軸を時間として、各ロボット
12がいつ起動され、接続時間が何秒かを図6で示した
ようにロボット情報記憶部21から抜き出し表示してい
る。黒く塗りつぶされた時間がそのロボットが目的のサ
ーバに接続している時間である。この図を使って単位時
間の接続数を算出する。ここでは単位時間を1秒とす
る。点線の間隔が単位時間に相当するので、この間隔で
縦に見てロボット12がいくつ起動されているかを算出
すればよい。例えばはじめの1秒はロボット1しか動い
ていないので合計は1になり、次の1秒ではロボット1
とロボット2が動いているため合計は2になる。こうし
て15秒間すべての単位時間での起動数を計算する。
When accessing the same server, the robot 12 has a predetermined interval. In this example, it is assumed that the connection interval to the WWW server is 15 seconds. Since the connection interval to the server is constant, unless the robot 12 is newly started up or the URL of a certain server disappears and the robot 12 is not terminated, the connection is made on the same schedule every 15 seconds. Therefore, in the present invention, a method of sequentially reviewing the scheduling for the connection interval of 15 seconds when the robot is started and when the next URL is accessed is adopted. In FIG. 7, the horizontal axis indicates time, and each robot 12 is activated and the connection time is extracted from the robot information storage unit 21 and displayed as shown in FIG. The time filled in black is the time when the robot is connected to the target server. The number of connections per unit time is calculated using this figure. Here, the unit time is 1 second. Since the interval between the dotted lines corresponds to the unit time, it is sufficient to calculate how many robots 12 are activated when viewed vertically at this interval. For example, in the first second, only the robot 1 is moving, so the total is 1, and in the next 1 second, the robot 1
And the robot 2 is moving, so the total is 2. In this way, the number of activations for all unit times for 15 seconds is calculated.

【0031】次に起動するロボットの接続時間を取得す
る。すでにそのサーバに対するロボット12が起動され
ている場合は、ロボット情報記憶部21に記述してある
接続時間を使用し、新しいサーバに接続するためにあら
たにロボット12を起動する場合は、現在起動している
ロボット12の接続時間の平均を接続時間とする。図7
の例では図6のロボット情報記憶部21を参照し、接続
時間の平均を計算して(5+6+5+3+6+5)/6
=5秒である。よって現在の時間からその5秒後まで
の、単位時間に起動されるロボットの総和を求める。こ
の例では現在から5秒後までの総和は1+2+3+4+
4=14となる。次の1秒からの5秒間は2+3+4+
4+3=16である。このように単位時間ずつずらして
総和を計算していく。この値が小さければ負荷がかかっ
ていないことになるため、一番小さく、かつ現在の時間
に近い地点を探す。この例では4が一番小さいので、こ
の時間からロボットを開始することとし、ロボット情報
記憶部21に記述する。
The connection time of the robot to be started next is acquired. If the robot 12 for the server has already been started, the connection time described in the robot information storage unit 21 is used, and if the robot 12 is newly started to connect to a new server, the current start is started. The average of the connection times of the robots 12 that are connected is defined as the connection time. FIG.
In the example of (5), the average of the connection time is calculated by referring to the robot information storage unit 21 of FIG. 6, and (5 + 6 + 5 + 3 + 6 + 5) / 6
= 5 seconds. Therefore, the total sum of the robots activated in the unit time from the current time to 5 seconds after the current time is obtained. In this example, the sum from the present to 5 seconds later is 1 + 2 + 3 + 4 +
4 = 14. 2 + 3 + 4 + for 5 seconds from the next 1 second
4 + 3 = 16. In this way, the sum is calculated by shifting the unit time. If this value is small, it means that no load is applied, so the smallest point and a point close to the current time are searched. In this example, since 4 is the smallest, the robot is started from this time and is described in the robot information storage unit 21.

【0032】次に、本発明の他の実施の形態について、
図8を参照して詳細に説明する。
Next, another embodiment of the present invention will be described.
This will be described in detail with reference to FIG.

【0033】図8は本発明のインターネット情報探索シ
ステムの一実施の形態のサーバへの接続間隔を調節した
時のシーケンスチャートである。
FIG. 8 is a sequence chart when the connection interval to the server in the embodiment of the Internet information search system of the present invention is adjusted.

【0034】図8においてロボット数が増えて、単位時
間の接続数が多くなる場合には接続間隔内のロボット1
2の起動時間を調節しても負荷はかかってしまう。そこ
で接続間隔内の接続数の上限を決め、それ以上にロボッ
ト12が起動された場合は、さらにWWWサーバへの接
続間隔を調節して負荷がかからないようにする。
In FIG. 8, when the number of robots increases and the number of connections per unit time increases, the robot 1 within the connection interval
Even if the startup time of 2 is adjusted, a load will be applied. Therefore, the upper limit of the number of connections within the connection interval is determined, and if the robot 12 is activated more than that, the connection interval to the WWW server is further adjusted so that no load is applied.

【0035】尚以上のようなインターネット情報探索シ
ステムの処理プログラムを記録した記録媒体を有し、コ
ンピュータに実行させることもできる。
It is to be noted that a computer-readable storage medium storing a processing program for the Internet information search system as described above may be executed by a computer.

【0036】[0036]

【発明の効果】以上説明したように、本発明のインター
ネット情報探索システムは、第1の効果は、ロボットが
次のURLにアクセスする時間を調節することにより、
同時にアクセスすることがなくなることにある。この結
果、CPUやネットワークに対する負荷が低減する。
As described above, the first effect of the Internet information search system of the present invention is that the robot adjusts the time for accessing the next URL.
There is no access at the same time. As a result, the load on the CPU and the network is reduced.

【0037】その理由は、ロボットがアクセスする時間
をロボット管理手段で管理し、調節を行うためである。
The reason is that the robot access time is managed and adjusted by the robot management means.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明のインターネット情報探索システムの一
実施の形態を示す概略図である。
FIG. 1 is a schematic diagram showing an embodiment of an Internet information search system according to the present invention.

【図2】本発明のインターネット情報探索システムの一
実施の形態を示すブロック図である。
FIG. 2 is a block diagram showing an embodiment of the Internet information search system of the present invention.

【図3】本発明のインターネット情報探索システムのロ
ボット起動時の動作を示す流れ図である。
FIG. 3 is a flowchart showing the operation of the Internet information search system according to the present invention when the robot is started.

【図4】本発明のインターネット情報探索システムの次
のURLに接続する時の動作を示す流れ図である。
FIG. 4 is a flowchart showing the operation of the Internet information search system of the present invention when connecting to the next URL.

【図5】従来のロボットと本発明でのロボットの動作を
示すシーケンスチャートである。
FIG. 5 is a sequence chart showing operations of a conventional robot and a robot according to the present invention.

【図6】本発明のインターネット情報探索システムの一
実施の形態の動作を示す構成図である。
FIG. 6 is a configuration diagram showing the operation of an embodiment of the Internet information search system of the present invention.

【図7】本発明のインターネット情報探索システムの一
実施の形態の単位時間当たりのロボット起動数算出方法
を示すシーケンスチャートである。
FIG. 7 is a sequence chart showing a method for calculating the number of robot activations per unit time according to an embodiment of the Internet information search system of the present invention.

【図8】本発明のインターネット情報探索システムの一
実施の形態のサーバへの接続間隔を調節した時のシーケ
ンスチャートである。
FIG. 8 is a sequence chart when the connection interval to the server in the embodiment of the Internet information search system according to the present invention is adjusted.

【符号の説明】[Explanation of symbols]

1 データ処理装置 2 記憶装置 11 ロボット管理手段 12 ロボット 13 URL管理手段 21 ロボット情報記憶部 22 URL情報記憶部 DESCRIPTION OF SYMBOLS 1 Data processing device 2 Storage device 11 Robot management means 12 Robot 13 URL management means 21 Robot information storage part 22 URL information storage part

フロントページの続き (56)参考文献 下島健彦,WWWサーバ情報検索サー ビス「NETPLAZA],NEC技 報,1996年 7月30日,第49巻 第7 号,p.91〜p.96 馬場始三,WWWサーバ技術,画像電 子学会誌,1997年 6月25日,第26巻 第3号,p.275〜p.284 (58)調査した分野(Int.Cl.7,DB名) G06F 17/30 JICSTファイル(JOIS)Continuation of the front page (56) References Takehiko Shimojima, WWW server information search service "NETPLAZA", NEC Technical Report, July 30, 1996, Vol. 49, No. 7, pp. 91 to 96, Shozo Baba , WWW Server Technology, Journal of the Institute of Image Electronics Engineers of Japan, June 25, 1997, Vol. 26, No. 3, pp. 275-284 (58) Fields investigated (Int. Cl. 7 , DB name) G06F 17 / 30 JICST file (JOIS)

Claims (24)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 データ処理装置と情報を記憶する記憶装
置とを含み、記憶装置はロボット情報記憶部とURL情
報記憶部とを備え、ロボット情報記憶部は、ロボットを
見分けるためのIDとそのロボットの起動時間、接続に
要する時間を記憶し、URL情報記憶部は、取得したW
WWサーバの情報及びURLの最終取得時間を含む情報
を記憶し、データ処理装置はロボット管理手段とロボッ
トとURL管理手段とを備え、ロボット管理手段はUR
L管理手段より未取得のWWWサーバを取得し、1つの
WWWサーバに対して1つのロボットを起動し、ロボッ
ト情報記憶部を参照して次のロボットの立ち上げ時間を
現在起動しているロボットの接続時間の平均を接続時間
とする単位時間の中で、単位時間ずつずらし、単位時間
に起動されるロボットの総和を求め、総和が小さく、か
つ現在の時間に近い地点の時間からロボットを開始する
ように調節し、ロボットはロボット管理手段によって起
動され、目的のURLを取得し、本URLの取得時間を
ロボット管理手段に通知し、取得したURLをURL管
理手段に通知し、起動された後はURL管理手段に次の
URLを問い合わせたのち、ロボット管理手段に次回起
動時間を問い合わせ、その時間によりアクセスし、UR
L管理手段はロボット管理手段から次のWWWサーバリ
ストの要求をうけ、また、ロボットからの次に探索すべ
きURLの要求を受けつけURL情報記憶部を検索し、
結果をロボット管理手段およびロボットに渡し、ロボッ
トからのURLの通知を受け取り、URL情報記憶部の
更新、または登録を行うことを特徴とするインターネッ
ト情報探索システム。
An information processing apparatus includes a data processing device and a storage device for storing information. The storage device includes a robot information storage portion and a URL information storage portion. The robot information storage portion includes an ID for identifying the robot and the robot. And the time required for connection are stored, and the URL information storage unit stores the acquired W
WW server information and information including the last URL acquisition time are stored. The data processing device includes a robot management unit, a robot and a URL management unit, and the robot management unit includes a URL management unit.
An unacquired WWW server is acquired from the L management means, one robot is started for one WWW server, and the startup time of the next robot is determined by referring to the robot information storage unit.
Average connection time of currently running robots connection time
In the unit time, shift the unit time
The total sum of the robots activated at
Start the robot from a time near the current time
The robot is started by the robot management unit, acquires the target URL, notifies the robot management unit of the acquisition time of the URL, notifies the acquired URL to the URL management unit, and starts the robot. After inquiring of the next URL to the URL management means, the robot management means is inquired about the next start time, and access is made based on the time.
The L management means receives a request for the next WWW server list from the robot management means, receives a request for the next URL to be searched from the robot, and searches the URL information storage unit.
An internet information search system, wherein a result is passed to a robot management unit and a robot, a URL notification is received from the robot, and a URL information storage unit is updated or registered.
【請求項2】 データ処理装置と情報を記憶する記憶装
置とを含み、記憶装置はロボット情報記憶部とURL情
報記憶部とを備え、ロボット情報記憶部は、ロボットを
見分けるためのIDとそのロボットの起動時間、接続に
要する時間を記憶し、URL情報記憶部は、取得したW
WWサーバの情報及びURLの最終取得時間を含む情報
を記憶し、データ処理装置はロボット管理手段とロボッ
トとURL管理手段とを備え、ロボット管理手段はUR
L管理手段より未取得のWWWサーバを取得し、1つの
WWWサーバに対して1つのロボットを起動し、ロボッ
ト情報記憶部を参照して次のロボットの立ち上げ時間を
現在起動しているロボットの接続時間の平均を接続時間
とする単位時間の中で、単位時間ずつずらし、単位時間
に起動されるロボットの総和を求め、総和が小さく、か
つ現在の時間に近い地点の時間からロボットを開始する
ように調節し、ロボットはロボット管理手段によって起
動され、目的のURLを取得し、本URLの取得時間を
ロボット管理手段に通知し、取得したURLをURL管
理手段に通知し、起動された後はURL管理手段に次の
URLを問い合わせたのち、ロボット管理手段に次回起
動時間を問い合わせ、その時間によりアクセスし、UR
L管理手段はロボット管理手段から次のWWWサーバリ
ストの要求をうけ、また、ロボットからの次に探索すべ
きURLの要求を受けつけURL情報記憶部を検索し、
結果をロボット管理手段およびロボットに渡し、ロボッ
トからのURLの通知を受け取り、URL情報記憶部の
更新、または登録を行うことを特徴とするインターネッ
ト情報探索方法。
2. A data processing device and a storage device for storing information, wherein the storage device includes a robot information storage portion and a URL information storage portion, wherein the robot information storage portion includes an ID for identifying the robot and the robot. And the time required for connection are stored, and the URL information storage unit stores the acquired W
WW server information and information including the last URL acquisition time are stored. The data processing device includes a robot management unit, a robot and a URL management unit, and the robot management unit includes a URL management unit.
An unacquired WWW server is acquired from the L management means, one robot is started for one WWW server, and the startup time of the next robot is determined by referring to the robot information storage unit.
Average connection time of currently running robots connection time
In the unit time, shift the unit time
The total sum of the robots activated at
Start the robot from a time near the current time
The robot is started by the robot management unit, acquires the target URL, notifies the robot management unit of the acquisition time of the URL, notifies the acquired URL to the URL management unit, and starts the robot. After inquiring of the next URL to the URL management means, the robot management means is inquired about the next start time, and access is made based on the time.
The L management means receives a request for the next WWW server list from the robot management means, receives a request for the next URL to be searched from the robot, and searches the URL information storage unit.
An Internet information search method, wherein a result is passed to a robot management unit and a robot, a URL notification is received from the robot, and a URL information storage unit is updated or registered.
【請求項3】 データ処理装置と情報を記憶する記憶装
置とを含み、記憶装置はロボット情報記憶部とURL情
報記憶部とを備え、ロボット情報記憶部は、ロボットを
見分けるためのIDとそのロボットの起動時間、接続に
要する時間を記憶し、URL情報記憶部は、取得したW
WWサーバの情報及びURLの最終取得時間を含む情報
を記憶し、データ処理装置はロボット管理手段とロボッ
トとURL管理手段とを備え、ロボット管理手段はUR
L管理手段より未取得のWWWサーバを取得し、1つの
WWWサーバに対して1つのロボットを起動し、ロボッ
ト情報記憶部を参照して次のロボットの立ち上げ時間を
現在起動しているロボットの接続時間の平均を接続時間
とする単位時間の中で、単位時間ずつずらし、単位時間
に起動されるロボットの総和を求め、総和が小さく、か
つ現在の時間に近い地点の時間からロボットを開始する
ように調節し、ロボットはロボット管理手段によって起
動され、目的のURLを取得し、本URLの取得時間を
ロボット管理手段に通知し、取得したURLをURL管
理手段に通知し、起動された後はURL管理手段に次の
URLを問い合わせたのち、ロボット管理手段に次回起
動時間を問い合わせ、その時間によりアクセスし、UR
L管理手段はロボット管理手段から次のWWWサーバリ
ストの要求をうけ、また、ロボットからの次に探索すべ
きURLの要求を受けつけURL情報記憶部を検索し、
結果をロボット管理手段およびロボットに渡し、ロボッ
トからのURLの通知を受け取り、URL情報記憶部の
更新、または登録を行うインターネット情報探索処理を
コンピュータに実行させるためのプログラムを記録した
ことを特徴とする記録媒体。
3. A data processing device and a storage device for storing information, wherein the storage device includes a robot information storage portion and a URL information storage portion, wherein the robot information storage portion includes an ID for identifying the robot and the robot. And the time required for connection are stored, and the URL information storage unit stores the acquired W
WW server information and information including the last URL acquisition time are stored. The data processing device includes a robot management unit, a robot and a URL management unit, and the robot management unit includes a URL management unit.
An unacquired WWW server is acquired from the L management means, one robot is started for one WWW server, and the startup time of the next robot is determined by referring to the robot information storage unit.
Average connection time of currently running robots connection time
In the unit time, shift the unit time
The total sum of the robots activated at
Start the robot from a time near the current time
The robot is started by the robot management unit, acquires the target URL, notifies the robot management unit of the acquisition time of the URL, notifies the acquired URL to the URL management unit, and starts the robot. After inquiring of the next URL to the URL management means, the robot management means is inquired about the next start time, and access is made based on the time.
The L management means receives a request for the next WWW server list from the robot management means, receives a request for the next URL to be searched from the robot, and searches the URL information storage unit.
The result is passed to the robot management means and the robot, a notification of the URL from the robot is received, and a program for causing the computer to execute an Internet information search process for updating or registering the URL information storage unit is recorded. recoding media.
【請求項4】 ロボット管理手段がURL管理手段に次
に探索すべきWWWサーバ名を問い合わせ、URL管理
手段はURL情報記憶部にアクセスし、探索する範囲の
WWWサーバについてすべて処理が終わっているかどう
か判断し、探索すべきWWWサーバが存在しない場合は
現在動作しているロボットが終了するのを待ち、ロボッ
ト管理手段はロボット情報記憶部にアクセスし、他のロ
ボットの次回接続時間と接続に要する時間を取得し、接
続するタイミングが重ならないかチェックし、重なる場
合は平均に接続できるようなタイミングを計算して、次
回時間を調節し、ロボット管理手段はロボットを起動
し、ロボットはWWWサーバに接続し、かかった時間を
ロボット管理手段に伝えることを特徴とするインターネ
ット情報探索システム。
4. The robot management unit inquires of the URL management unit about the name of the next WWW server to be searched, and the URL management unit accesses the URL information storage unit to determine whether all the WWW servers within the search range have been processed. Judgment, if there is no WWW server to search for, wait for the currently operating robot to end, the robot management means accesses the robot information storage unit, and the next connection time of other robots and the time required for connection , Check if the connection timings do not overlap, and if they overlap, calculate the timing so that the connection can be averaged, adjust the next time, the robot management means starts the robot, and the robot connects to the WWW server Internet information search system characterized by transmitting the time taken to robot management means .
【請求項5】 ロボット管理手段がURL管理手段に次
に探索すべきWWWサーバ名を問い合わせ、URL管理
手段はURL情報記憶部にアクセスし、探索する範囲の
WWWサーバについてすべて処理が終わっているかどう
か判断し、探索すべきWWWサーバが存在しない場合は
現在動作しているロボットが終了するのを待ち、ロボッ
ト管理手段はロボット情報記憶部にアクセスし、他のロ
ボットの次回接続時間と接続に要する時間を取得し、接
続するタイミングが重ならないかチェックし、重なる場
合は平均に接続できるようなタイミングを計算して、次
回時間を調節し、ロボット管理手段はロボットを起動
し、ロボットはWWWサーバに接続し、かかった時間を
ロボット管理手段に伝えることを特徴とするインターネ
ット情報探索方法。
5. The robot management means inquires of the URL management means about the name of the next WWW server to be searched, and the URL management means accesses the URL information storage unit to determine whether or not processing has been completed for all WWW servers in the search range. Judgment, if there is no WWW server to search for, wait for the currently operating robot to end, the robot management means accesses the robot information storage unit, and the next connection time of other robots and the time required for connection , Check if the connection timings do not overlap, and if they overlap, calculate the timing so that the connection can be averaged, adjust the next time, the robot management means starts the robot, and the robot connects to the WWW server And transmitting the time taken to the robot management means.
【請求項6】 ロボット管理手段がURL管理手段に次
に探索すべきWWWサーバ名を問い合わせ、URL管理
手段はURL情報記憶部にアクセスし、探索する範囲の
WWWサーバについてすべて処理が終わっているかどう
か判断し、探索すべきWWWサーバが存在しない場合は
現在動作しているロボットが終了するのを待ち、ロボッ
ト管理手段はロボット情報記憶部にアクセスし、他のロ
ボットの次回接続時間と接続に要する時間を取得し、接
続するタイミングが重ならないかチェックし、重なる場
合は平均に接続できるようなタイミングを計算して、次
回時間を調節し、ロボット管理手段はロボットを起動
し、ロボットはWWWサーバに接続し、かかった時間を
ロボット管理手段に伝えるインターネット情報探索処理
をコンピュータに実行させるためのプログラムを記録し
たことを特徴とする記録媒体。
6. The robot management means inquires of the URL management means about the name of the next WWW server to be searched, and the URL management means accesses the URL information storage unit to determine whether or not processing has been completed for all WWW servers in the search range. Judgment, if there is no WWW server to search for, wait for the currently operating robot to end, the robot management means accesses the robot information storage unit, and the next connection time of other robots and the time required for connection , Check if the connection timings do not overlap, and if they overlap, calculate the timing so that the connection can be averaged, adjust the next time, the robot management means starts the robot, and the robot connects to the WWW server Computer to perform Internet information search processing that tells the robot management means how much time was spent A recording medium characterized by recording a program for causing the recording medium to be executed.
【請求項7】 ロボット管理手段がURL管理手段に次
に探索すべきURLを問い合わせ、URL管理手段はU
RL情報記憶部にアクセスし、探索する範囲のURLに
ついてすべて処理が終わっているかどうか判断し、次に
探索すべきURLが存在しない場合は現在動作している
ロボットが終了するのを待ち、URLが存在する場合、
最終取得時間を取得し、取得間隔が経過してるかどうか
を判断し、まだ取得間隔を過ぎていなかった場合、ロボ
ット管理手段は次に探索すべきURLをURL管理手段
に問い合わせ、過ぎていた場合、ロボット管理手段はロ
ボット情報記憶部にアクセスし、他のロボットの次回接
続時間と接続に要する時間を取得し、接続するタイミン
グが重ならないかチェックし、重なる場合は平均に接続
できるようなタイミングを計算して、次回時間を調節
し、ロボット管理手段はロボットを起動し、ロボットは
WWWサーバに接続し、かかった時間をロボット管理手
段に伝えることを特徴とするインターネット情報探索シ
ステム。
7. The robot management means queries the URL management means for a next URL to be searched, and the URL management means determines
The RL information storage unit is accessed, and it is determined whether or not processing has been completed for all URLs in the search range. If there is no URL to be searched next, the system waits for the currently operating robot to end. If there,
The final acquisition time is acquired, it is determined whether or not the acquisition interval has elapsed, and if the acquisition interval has not yet passed, the robot management unit queries the URL management unit for the next URL to be searched. The robot management means accesses the robot information storage unit, obtains the next connection time of the other robot and the time required for connection, checks whether the connection timings do not overlap, and if so, determines the timing that can be connected on average. An Internet information search system, wherein the time is calculated, the next time is adjusted, the robot management means starts the robot, the robot is connected to the WWW server, and the time taken is reported to the robot management means.
【請求項8】 ロボット管理手段がURL管理手段に次
に探索すべきURLを問い合わせ、URL管理手段はU
RL情報記憶部にアクセスし、探索する範囲のURLに
ついてすべて処理が終わっているかどうか判断し、次に
探索すべきURLが存在しない場合は現在動作している
ロボットが終了するのを待ち、URLが存在する場合、
最終取得時間を取得し、取得間隔が経過してるかどうか
を判断し、まだ取得間隔を過ぎていなかった場合、ロボ
ット管理手段は次に探索すべきURLをURL管理手段
に問い合わせ、過ぎていた場合、ロボット管理手段はロ
ボット情報記憶部にアクセスし、他のロボットの次回接
続時間と接続に要する時間を取得し、接続するタイミン
グが重ならないかチェックし、重なる場合は平均に接続
できるようなタイミングを計算して、次回時間を調節
し、ロボット管理手段はロボットを起動し、ロボットは
WWWサーバに接続し、かかった時間をロボット管理手
段に伝えることを特徴とするインターネット情報探索方
法。
8. The robot management means inquires of the URL management means about the next URL to be searched,
The RL information storage unit is accessed, and it is determined whether or not processing has been completed for all URLs in the search range. If there is no URL to be searched next, the system waits for the currently operating robot to end. If there,
The final acquisition time is acquired, it is determined whether or not the acquisition interval has elapsed, and if the acquisition interval has not yet passed, the robot management unit queries the URL management unit for the next URL to be searched. The robot management means accesses the robot information storage unit, obtains the next connection time of the other robot and the time required for connection, checks whether the connection timings do not overlap, and if so, determines the timing that can be connected on average. An Internet information search method comprising calculating and adjusting the next time, the robot management means activating the robot, connecting the robot to a WWW server, and transmitting the time taken to the robot management means.
【請求項9】 ロボット管理手段がURL管理手段に次
に探索すべきURLを問い合わせ、URL管理手段はU
RL情報記憶部にアクセスし、探索する範囲のURLに
ついてすべて処理が終わっているかどうか判断し、次に
探索すべきURLが存在しない場合は現在動作している
ロボットが終了するのを待ち、URLが存在する場合、
最終取得時間を取得し、取得間隔が経過してるかどうか
を判断し、まだ取得間隔を過ぎていなかった場合、ロボ
ット管理手段は次に探索すべきURLをURL管理手段
に問い合わせ、過ぎていた場合、ロボット管理手段はロ
ボット情報記憶部にアクセスし、他のロボットの次回接
続時間と接続に要する時間を取得し、接続するタイミン
グが重ならないかチェックし、重なる場合は平均に接続
できるようなタイミングを計算して、次回時間を調節
し、ロボット管理手段はロボットを起動し、ロボットは
WWWサーバに接続し、かかった時間をロボット管理手
段に伝えるインターネット情報探索処理をコンピュータ
に実行させるためのプログラムを記録したことを特徴と
する記録媒体。
9. The robot management means queries the URL management means for the next URL to be searched, and the URL management means
The RL information storage unit is accessed, and it is determined whether or not processing has been completed for all URLs in the search range. If there is no URL to be searched next, the system waits for the currently operating robot to end. If there,
The final acquisition time is acquired, it is determined whether or not the acquisition interval has elapsed, and if the acquisition interval has not yet passed, the robot management unit queries the URL management unit for the next URL to be searched. The robot management means accesses the robot information storage unit, obtains the next connection time of the other robot and the time required for connection, checks whether the connection timings do not overlap, and if so, determines the timing that can be connected on average. Calculate and adjust the next time, the robot management means activates the robot, the robot connects to the WWW server, and records a program for causing the computer to execute an Internet information search process of transmitting the time taken to the robot management means. A recording medium characterized in that:
【請求項10】 ロボット情報記憶部に、サーバ名、そ
のサーバに接続しているロボットのID、次回の起動時
間、前回サーバに接続するのにかかった時間がサーバ毎
に記述し、ロボットは同じサーバにアクセスする時には
一定間隔をあけ、新規にロボットが起動されたり、ある
サーバのURLがなくなって、ロボットが終了したりし
なければ一定間隔おきに同じスケジュールで接続を行
い、また新規にロボットが起動されたり、あるサーバの
URLがなくなって、ロボットが終了したりした場合
は、現在起動しているロボットの接続時間の平均を接続
時間とする単位時間の中で、単位時間ずつずらし、単位
時間に起動されるロボットの総和を求め、総和が小さ
く、かつ現在の時間に近い地点の時間からロボットを開
始するように調整することを特徴とするインターネット
情報探索システム。
10. A server information, a server name, an ID of a robot connected to the server, a next startup time, and a time required for connecting to the server last time are described in the robot information storage unit for each server. At a certain interval when accessing the server, if a new robot is started or the URL of a certain server is lost and the robot is not terminated, the connection is made at the same interval at regular intervals.
A new robot is started, or a server
When the URL is gone and the robot ends
Connect the average of the connection time of the currently running robot
The unit time is shifted by the unit time within the unit time
Find the sum of the robots activated at time, and the sum is small
And start the robot from the time near the current time.
An Internet information search system characterized in that it is adjusted to start .
【請求項11】 ロボット情報記憶部に、サーバ名、そ
のサーバに接続しているロボットのID、次回の起動時
間、前回サーバに接続するのにかかった時間がサーバ毎
に記述し、ロボットは同じサーバにアクセスする時には
一定間隔をあけ、新規にロボットが起動されたり、ある
サーバのURLがなくなって、ロボットが終了したりし
なければ一定間隔おきに同じスケジュールで接続を行
い、また新規にロボットが起動されたり、あるサーバの
URLがなくなって、ロボットが終了したりした場合
は、現在起動しているロボットの接続時間の平均を接続
時間とする単位時間の中で、単位時間ずつずらし、単位
時間に起動されるロボットの総和を求め、総和が小さ
く、かつ現在の時間に近い地点の時間からロボットを開
始するように調整することを特徴とするインターネット
情報探索方法。
11. The robot information storage unit describes, for each server, a server name, an ID of a robot connected to the server, a next start time, and a time required to connect to the server last time. At a certain interval when accessing the server, if a new robot is started or the URL of a certain server is lost and the robot is not terminated, the connection is made at the same schedule at regular intervals.
A new robot is started, or a server
When the URL is gone and the robot ends
Connect the average of the connection time of the currently running robot
The unit time is shifted by the unit time within the unit time
Find the sum of the robots activated at time, and the sum is small
And start the robot from the time near the current time.
An Internet information search method, wherein the method is adjusted to start .
【請求項12】 ロボット情報記憶部に、サーバ名、そ
のサーバに接続しているロボットのID、次回の起動時
間、前回サーバに接続するのにかかった時間がサーバ毎
に記述し、ロボットは同じサーバにアクセスする時には
一定間隔をあけ、新規にロボットが起動されたり、ある
サーバのURLがなくなって、ロボットが終了したりし
なければ一定間隔おきに同じスケジュールで接続を行
い、また新規にロボットが起動されたり、あるサーバの
URLがなくなって、ロボットが終了したりした場合
は、現在起動しているロボットの接続時間の平均を接続
時間とする単位時間の中で、単位時間ずつずらし、単位
時間に起動されるロボットの総和を求め、総和が小さ
く、かつ現在の時間に近い地点の時間からロボットを開
始するように調整するインターネット情報探索処理をコ
ンピュータに実行させるためのプログラムを記録したこ
とを特徴とする記録媒体。
12. The robot information storage unit describes a server name, an ID of a robot connected to the server, a next startup time, and a time required for connecting to the server last time for each server. At a certain interval when accessing the server, if a new robot is started or the URL of a certain server is lost and the robot is not terminated, the connection is made at the same schedule at regular intervals.
A new robot is started, or a server
When the URL is gone and the robot ends
Connect the average of the connection time of the currently running robot
The unit time is shifted by the unit time within the unit time
Find the sum of the robots activated at time, and the sum is small
And start the robot from the time near the current time.
A recording medium on which is recorded a program for causing a computer to execute an Internet information search process for adjusting to start .
【請求項13】 データ処理装置と情報を記憶する記憶
装置とを含み、記憶装置はロボット情報記憶部とURL
情報記憶部とを備え、ロボット情報記憶部は、ロボット
を見分けるためのIDとそのロボットの起動時間、接続
に要する時間を記憶し、URL情報記憶部は、取得した
WWWサーバの情報及びURLの最終取得時間を含む情
報を記憶し、データ処理装置はロボット管理手段とロボ
ットとURL管理手段とを備え、ロボット管理手段はU
RL管理手段より未取得のWWWサーバを取得し、1つ
のWWWサーバに対して1つのロボットを起動し、ロボ
ット情報記憶部を参照して、接続間隔内の接続数の上限
を決め、それ以上にロボットが起動された場合は、WW
Wサーバへの接続間隔を調節して次のロボットを立ち上
げ、ロボットはロボット管理手段によって起動され、目
的のURLを取得し、本URLの取得時間をロボット管
理手段に通知し、取得したURLをURL管理手段に通
知し、起動された後はURL管理手段に次のURLを問
い合わせたのち、ロボット管理手段に次回起動時間を問
い合わせ、その時間によりアクセスし、URL管理手段
はロボット管理手段から次のWWWサーバリストの要求
をうけ、また、ロボットからの次に探索すべきURLの
要求を受けつけURL情報記憶部を検索し、結果をロボ
ット管理手段およびロボットに渡し、ロボットからのU
RLの通知を受け取り、URL情報記憶部の更新、また
は登録を行うことを特徴とするインターネット情報探索
システム。
13. A data processing device and a storage device for storing information, wherein the storage device includes a robot information storage unit and a URL.
An information storage unit, wherein the robot information storage unit stores an ID for identifying the robot, a startup time of the robot, and a time required for connection, and the URL information storage unit stores the acquired information of the WWW server and the final URL of the URL. The data processing device includes a robot management unit, a robot and a URL management unit, and the robot management unit stores information including an acquisition time.
An unacquired WWW server is acquired from the RL management means, one robot is started for one WWW server, and the upper limit of the number of connections within the connection interval is determined by referring to the robot information storage unit. If the robot is activated, WW
The next robot is started up by adjusting the connection interval to the W server, the robot is started by the robot management means, acquires the target URL, notifies the robot management means of the acquisition time of this URL, and sends the acquired URL to the robot management means. After being notified, the URL management means is inquired about the next URL to the URL management means. After that, the robot management means is inquired about the next start time, and the robot management means is accessed according to the next start time. Upon receiving a request for a WWW server list, receiving a request for the next URL to be searched from the robot, searching the URL information storage unit, passing the result to the robot management means and the robot,
An Internet information search system, which receives an RL notification and updates or registers a URL information storage unit.
【請求項14】 データ処理装置と情報を記憶する記憶
装置とを含み、記憶装置はロボット情報記憶部とURL
情報記憶部とを備え、ロボット情報記憶部は、ロボット
を見分けるためのIDとそのロボットの起動時間、接続
に要する時間を記憶し、URL情報記憶部は、取得した
WWWサーバの情報及びURLの最終取得時間を含む情
報を記憶し、データ処理装置はロボット管理手段とロボ
ットとURL管理手段とを備え、ロボット管理手段はU
RL管理手段より未取得のWWWサーバを取得し、1つ
のWWWサーバに対して1つのロボットを起動し、ロボ
ット情報記憶部を参照して、接続間隔内の接続数の上限
を決め、それ以上にロボットが起動された場合は、WW
Wサーバへの接続間隔を調節して次のロボットを立ち上
げ、ロボットはロボット管理手段によって起動され、目
的のURLを取得し、本URLの取得時間をロボット管
理手段に通知し、取得したURLをURL管理手段に通
知し、起動された後はURL管理手段に次のURLを問
い合わせたのち、ロボット管理手段に次回起動時間を問
い合わせ、その時間によりアクセスし、URL管理手段
はロボット管理手段から次のWWWサーバリストの要求
をうけ、また、ロボットからの次に探索すべきURLの
要求を受けつけURL情報記憶部を検索し、結果をロボ
ット管理手段およびロボットに渡し、ロボットからのU
RLの通知を受け取り、URL情報記憶部の更新、また
は登録を行うことを特徴とするインターネット情報探索
方法。
14. A data processing device and a storage device for storing information, wherein the storage device includes a robot information storage unit and a URL.
An information storage unit, wherein the robot information storage unit stores an ID for identifying the robot, a startup time of the robot, and a time required for connection, and the URL information storage unit stores the acquired information of the WWW server and the final URL of the URL. The data processing device includes a robot management unit, a robot and a URL management unit, and the robot management unit stores information including an acquisition time.
An unacquired WWW server is acquired from the RL management means, one robot is started for one WWW server, and the upper limit of the number of connections within the connection interval is determined by referring to the robot information storage unit. If the robot is activated, WW
The next robot is started up by adjusting the connection interval to the W server, the robot is started by the robot management means, acquires the target URL, notifies the robot management means of the acquisition time of this URL, and sends the acquired URL to the robot management means. After being notified, the URL management means is inquired about the next URL to the URL management means. After that, the robot management means is inquired about the next start time, and the robot management means is accessed according to the next start time. Upon receiving a request for a WWW server list, receiving a request for the next URL to be searched from the robot, searching the URL information storage unit, passing the result to the robot management means and the robot,
An Internet information search method, comprising: receiving an RL notification and updating or registering a URL information storage unit.
【請求項15】 データ処理装置と情報を記憶する記憶
装置とを含み、記憶装置はロボット情報記憶部とURL
情報記憶部とを備え、ロボット情報記憶部は、ロボット
を見分けるためのIDとそのロボットの起動時間、接続
に要する時間を記憶し、URL情報記憶部は、取得した
WWWサーバの情報及びURLの最終取得時間を含む情
報を記憶し、データ処理装置はロボット管理手段とロボ
ットとURL管理手段とを備え、ロボット管理手段はU
RL管理手段より未取得のWWWサーバを取得し、1つ
のWWWサーバに対して1つのロボットを起動し、ロボ
ット情報記憶部を参照して、接続間隔内の接続数の上限
を決め、それ以上にロボットが起動された場合は、WW
Wサーバへの接続間隔を調節して次のロボットを立ち上
げ、ロボットはロボット管理手段によって起動され、目
的のURLを取得し、本URLの取得時間をロボット管
理手段に通知し、取得したURLをURL管理手段に通
知し、起動された後はURL管理手段に次のURLを問
い合わせたのち、ロボット管理手段に次回起動時間を問
い合わせ、その時間によりアクセスし、URL管理手段
はロボット管理手段から次のWWWサーバリストの要求
をうけ、また、ロボットからの次に探索すべきURLの
要求を受けつけURL情報記憶部を検索し、結果をロボ
ット管理手段およびロボットに渡し、ロボットからのU
RLの通知を受け取り、URL情報記憶部の更新、また
は登録を行うインターネット情報探索処理をコンピュー
タに実行させるためのプログラムを記録したことを特徴
とする記録媒体。
15. A data processing device and a storage device for storing information, wherein the storage device includes a robot information storage unit and a URL.
An information storage unit, wherein the robot information storage unit stores an ID for identifying the robot, a startup time of the robot, and a time required for connection, and the URL information storage unit stores the acquired information of the WWW server and the final URL of the URL. The data processing device includes a robot management unit, a robot and a URL management unit, and the robot management unit stores information including an acquisition time.
An unacquired WWW server is acquired from the RL management means, one robot is started for one WWW server, and the upper limit of the number of connections within the connection interval is determined by referring to the robot information storage unit. If the robot is activated, WW
The next robot is started up by adjusting the connection interval to the W server, the robot is started by the robot management means, acquires the target URL, notifies the robot management means of the acquisition time of this URL, and sends the acquired URL to the robot management means. After being notified, the URL management means is inquired about the next URL to the URL management means. After that, the robot management means is inquired about the next start time, and the robot management means is accessed according to the next start time. Upon receiving a request for a WWW server list, receiving a request for the next URL to be searched from the robot, searching the URL information storage unit, passing the result to the robot management means and the robot,
A recording medium on which a program for receiving a notification of an RL and causing a computer to execute an Internet information search process for updating or registering a URL information storage unit is recorded.
【請求項16】 ロボット管理手段がURL管理手段に
次に探索すべきWWWサーバ名を問い合わせ、URL管
理手段はURL情報記憶部にアクセスし、探索する範囲
のWWWサーバについてすべて処理が終わっているかど
うか判断し、探索すべきWWWサーバが存在しない場合
は現在動作しているロボットが終了するのを待ち、ロボ
ット管理手段はロボット情報記憶部にアクセスし、他の
ロボットの次回接続時間と接続に要する時間を取得し、
接続するタイミングが重ならないかチェックし、重なる
場合は平均に接続できるようなタイミングを計算して、
接続間隔内の接続数の上限を決め、それ以上にロボット
が起動された場合は、WWWサーバへの接続間隔を調節
して次のロボットを立ち上げ、ロボット管理手段はロボ
ットを起動し、ロボットはWWWサーバに接続し、かか
った時間をロボット管理手段に伝えることを特徴とする
インターネット情報探索システム。
16. The robot management means inquires of the URL management means about the name of the next WWW server to be searched, and the URL management means accesses the URL information storage unit to determine whether or not processing has been completed for all WWW servers in the search range. Judgment, if there is no WWW server to search for, wait for the currently operating robot to end, the robot management means accesses the robot information storage unit, and the next connection time of other robots and the time required for connection And get
Check if the connection timings do not overlap, and if they do, calculate the timing so that you can connect on average,
The upper limit of the number of connections within the connection interval is determined, and if the robot is started more than that, the next robot is started by adjusting the connection interval to the WWW server, the robot management means starts the robot, and the robot An Internet information search system, wherein the Internet information search system is connected to a WWW server and notifies the robot management means of the time taken.
【請求項17】 ロボット管理手段がURL管理手段に
次に探索すべきWWWサーバ名を問い合わせ、URL管
理手段はURL情報記憶部にアクセスし、探索する範囲
のWWWサーバについてすべて処理が終わっているかど
うか判断し、探索すべきWWWサーバが存在しない場合
は現在動作しているロボットが終了するのを待ち、ロボ
ット管理手段はロボット情報記憶部にアクセスし、他の
ロボットの次回接続時間と接続に要する時間を取得し、
接続するタイミングが重ならないかチェックし、重なる
場合は平均に接続できるようなタイミングを計算して、
接続間隔内の接続数の上限を決め、それ以上にロボット
が起動された場合は、WWWサーバへの接続間隔を調節
して次のロボットを立ち上げ、ロボット管理手段はロボ
ットを起動し、ロボットはWWWサーバに接続し、かか
った時間をロボット管理手段に伝えることを特徴とする
インターネット情報探索方法。
17. The robot management unit inquires of the URL management unit about the name of the next WWW server to be searched, and the URL management unit accesses the URL information storage unit to determine whether or not processing has been completed for all WWW servers in the search range. Judgment, if there is no WWW server to search for, wait for the currently operating robot to end, the robot management means accesses the robot information storage unit, and the next connection time of other robots and the time required for connection And get
Check if the connection timings do not overlap, and if they do, calculate the timing so that you can connect on average,
The upper limit of the number of connections within the connection interval is determined, and if the robot is started more than that, the next robot is started by adjusting the connection interval to the WWW server, the robot management means starts the robot, and the robot A method for searching for Internet information, comprising connecting to a WWW server and transmitting the time taken to robot management means.
【請求項18】 ロボット管理手段がURL管理手段に
次に探索すべきWWWサーバ名を問い合わせ、URL管
理手段はURL情報記憶部にアクセスし、探索する範囲
のWWWサーバについてすべて処理が終わっているかど
うか判断し、探索すべきWWWサーバが存在しない場合
は現在動作しているロボットが終了するのを待ち、ロボ
ット管理手段はロボット情報記憶部にアクセスし、他の
ロボットの次回接続時間と接続に要する時間を取得し、
接続するタイミングが重ならないかチェックし、重なる
場合は平均に接続できるようなタイミングを計算して、
接続間隔内の接続数の上限を決め、それ以上にロボット
が起動された場合は、WWWサーバへの接続間隔を調節
して次のロボットを立ち上げ、ロボット管理手段はロボ
ットを起動し、ロボットはWWWサーバに接続し、かか
った時間をロボット管理手段に伝えるインターネット情
報探索処理をコンピュータに実行させるためのプログラ
ムを記録したことを特徴とする記録媒体。
18. The robot management unit inquires of the URL management unit about the name of the next WWW server to be searched, and the URL management unit accesses the URL information storage unit to determine whether all the WWW servers in the search range have been processed. Judgment, if there is no WWW server to search for, wait for the currently operating robot to end, the robot management means accesses the robot information storage unit, and the next connection time of other robots and the time required for connection And get
Check if the connection timings do not overlap, and if they do, calculate the timing so that you can connect on average,
The upper limit of the number of connections within the connection interval is determined, and if the robot is started more than that, the next robot is started by adjusting the connection interval to the WWW server, the robot management means starts the robot, and the robot A recording medium having recorded thereon a program for causing a computer to execute an Internet information search process for connecting to a WWW server and transmitting the time taken to robot management means.
【請求項19】 ロボット管理手段がURL管理手段に
次に探索すべきURLを問い合わせ、URL管理手段は
URL情報記憶部にアクセスし、探索する範囲のURL
についてすべて処理が終わっているかどうか判断し、次
に探索すべきURLが存在しない場合は現在動作してい
るロボットが終了するのを待ち、URLが存在する場
合、最終取得時間を取得し、取得間隔が経過してるかど
うかを判断し、まだ取得間隔を過ぎていなかった場合、
ロボット管理手段は次に探索すべきURLをURL管理
手段に問い合わせ、過ぎていた場合、ロボット管理手段
はロボット情報記憶部にアクセスし、他のロボットの次
回接続時間と接続に要する時間を取得し、接続するタイ
ミングが重ならないかチェックし、重なる場合は平均に
接続できるようなタイミングを計算して、接続間隔内の
接続数の上限を決め、それ以上にロボットが起動された
場合は、WWWサーバへの接続間隔を調節して次のロボ
ットを立ち上げ、ロボット管理手段はロボットを起動
し、ロボットはWWWサーバに接続し、かかった時間を
ロボット管理手段に伝えることを特徴とするインターネ
ット情報探索システム。
19. The robot management means inquires of the URL management means about the next URL to be searched, and the URL management means accesses the URL information storage unit to access the URL in the search range.
It is determined whether or not all the processes have been completed. If there is no URL to be searched next, the system waits for the currently operating robot to end. If the URL exists, obtains the final acquisition time, and acquires the acquisition interval. To determine if has elapsed, and if it has not passed the acquisition interval,
The robot management means queries the URL management means for the next URL to be searched, and if it has passed, the robot management means accesses the robot information storage unit to obtain the next connection time of another robot and the time required for connection, Check if the connection timings do not overlap. If they do overlap, calculate the timing so that the connection can be averaged, determine the upper limit of the number of connections within the connection interval, and if the robot is activated more than that, go to the WWW server An Internet information search system, wherein the next robot is started up by adjusting the connection interval of the robot, the robot management means activates the robot, the robot connects to the WWW server, and reports the time taken to the robot management means.
【請求項20】 ロボット管理手段がURL管理手段に
次に探索すべきURLを問い合わせ、URL管理手段は
URL情報記憶部にアクセスし、探索する範囲のURL
についてすべて処理が終わっているかどうか判断し、次
に探索すべきURLが存在しない場合は現在動作してい
るロボットが終了するのを待ち、URLが存在する場
合、最終取得時間を取得し、取得間隔が経過してるかど
うかを判断し、まだ取得間隔を過ぎていなかった場合、
ロボット管理手段は次に探索すべきURLをURL管理
手段に問い合わせ、過ぎていた場合、ロボット管理手段
はロボット情報記憶部にアクセスし、他のロボットの次
回接続時間と接続に要する時間を取得し、接続するタイ
ミングが重ならないかチェックし、重なる場合は平均に
接続できるようなタイミングを計算して、接続間隔内の
接続数の上限を決め、それ以上にロボットが起動された
場合は、WWWサーバへの接続間隔を調節して次のロボ
ットを立ち上げ、ロボット管理手段はロボットを起動
し、ロボットはWWWサーバに接続し、かかった時間を
ロボット管理手段に伝えることを特徴とするインターネ
ット情報探索方法。
20. The robot management means inquires of the URL management means about the next URL to be searched, and the URL management means accesses the URL information storage unit and sets the URL in the search range.
It is determined whether or not all the processes have been completed. If there is no URL to be searched next, the system waits for the currently operating robot to end. If there is a URL, the final acquisition time is acquired, and the acquisition interval is obtained. To determine if has elapsed, and if it has not passed the acquisition interval,
The robot management means queries the URL management means for the next URL to be searched, and if it has passed, the robot management means accesses the robot information storage unit to obtain the next connection time of another robot and the time required for connection, Check if the connection timings do not overlap. If they do overlap, calculate the timing so that the connection can be averaged, determine the upper limit of the number of connections within the connection interval, and if the robot is activated more than that, go to the WWW server A method for searching for Internet information, characterized in that the connection interval is adjusted to start the next robot, the robot management means starts the robot, the robot connects to the WWW server, and reports the time taken to the robot management means.
【請求項21】 ロボット管理手段がURL管理手段に
次に探索すべきURLを問い合わせ、URL管理手段は
URL情報記憶部にアクセスし、探索する範囲のURL
についてすべて処理が終わっているかどうか判断し、次
に探索すべきURLが存在しない場合は現在動作してい
るロボットが終了するのを待ち、URLが存在する場
合、最終取得時間を取得し、取得間隔が経過してるかど
うかを判断し、まだ取得間隔を過ぎていなかった場合、
ロボット管理手段は次に探索すべきURLをURL管理
手段に問い合わせ、過ぎていた場合、ロボット管理手段
はロボット情報記憶部にアクセスし、他のロボットの次
回接続時間と接続に要する時間を取得し、接続するタイ
ミングが重ならないかチェックし、重なる場合は平均に
接続できるようなタイミングを計算して、接続間隔内の
接続数の上限を決め、それ以上にロボットが起動された
場合は、WWWサーバへの接続間隔を調節して次のロボ
ットを立ち上げ、ロボット管理手段はロボットを起動
し、ロボットはWWWサーバに接続し、かかった時間を
ロボット管理手段に伝えるインターネット情報探索処理
をコンピュータに実行させるためのプログラムを記録し
たことを特徴とする記録媒体。
21. The robot management means inquires of the URL management means about a next URL to be searched, and the URL management means accesses the URL information storage unit and sets a URL in a search range.
It is determined whether or not all the processes have been completed. If there is no URL to be searched next, the system waits for the currently operating robot to end. If the URL exists, obtains the final acquisition time, and acquires the acquisition interval. To determine if has elapsed, and if it has not passed the acquisition interval,
The robot management means queries the URL management means for the next URL to be searched, and if it has passed, the robot management means accesses the robot information storage unit to obtain the next connection time of another robot and the time required for connection, Check if the connection timings do not overlap. If they do overlap, calculate the timing so that the connection can be averaged, determine the upper limit of the number of connections within the connection interval, and if the robot is activated more than that, go to the WWW server The next robot is started up by adjusting the connection interval of the robot, the robot management means starts the robot, the robot connects to the WWW server, and the computer executes an Internet information search process for transmitting the time taken to the robot management means. A recording medium characterized by recording the above program.
【請求項22】 ロボット情報記憶部に、サーバ名、そ
のサーバに接続しているロボットのID、次回の起動時
間、前回サーバに接続するのにかかった時間がサーバ毎
に記述し、ロボットは同じサーバにアクセスする時に
は、接続間隔内の接続数の上限を決め、それ以上にロボ
ットが起動された場合は、WWWサーバへの接続間隔を
調節して次のロボットの立ち上げ接続を行うことを特徴
とするインターネット情報探索システム。
22. The robot information storage unit describes the server name, the ID of the robot connected to the server, the next start time, and the time required for connecting to the server last time for each server, and the robot has the same name. When accessing the server, the upper limit of the number of connections within the connection interval is determined, and when the robot is activated beyond that limit, the connection interval to the WWW server is adjusted and the startup connection of the next robot is performed. Internet information search system.
【請求項23】 ロボット情報記憶部に、サーバ名、そ
のサーバに接続しているロボットのID、次回の起動時
間、前回サーバに接続するのにかかった時間がサーバ毎
に記述し、ロボットは同じサーバにアクセスする時に
は、接続間隔内の接続数の上限を決め、それ以上にロボ
ットが起動された場合は、WWWサーバへの接続間隔を
調節して次のロボットの立ち上げ接続を行うことを特徴
とするインターネット情報探索方法。
23. The server name, the ID of the robot connected to the server, the next start time, and the time required to connect to the server last time are described for each server in the robot information storage unit. When accessing the server, the upper limit of the number of connections within the connection interval is determined, and when the robot is activated beyond that limit, the connection interval to the WWW server is adjusted and the startup connection of the next robot is performed. Internet information search method.
【請求項24】 ロボット情報記憶部に、サーバ名、そ
のサーバに接続しているロボットのID、次回の起動時
間、前回サーバに接続するのにかかった時間がサーバ毎
に記述し、ロボットは同じサーバにアクセスする時に
は、接続間隔内の接続数の上限を決め、それ以上にロボ
ットが起動された場合は、WWWサーバへの接続間隔を
調節して次のロボットの立ち上げ接続を行うインターネ
ット情報探索処理をコンピュータに実行させるためのプ
ログラムを記録したことを特徴とする記録媒体。
24. In the robot information storage unit, a server name, an ID of a robot connected to the server, a next startup time, and a time required to connect to the server last time are described for each server, and When accessing the server, determine the upper limit of the number of connections within the connection interval, and if the robot is activated beyond that, adjust the connection interval to the WWW server and start the next robot for Internet connection search A recording medium on which a program for causing a computer to execute processing is recorded.
JP24323698A 1998-08-28 1998-08-28 Internet information search system and method Expired - Fee Related JP3298516B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP24323698A JP3298516B2 (en) 1998-08-28 1998-08-28 Internet information search system and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP24323698A JP3298516B2 (en) 1998-08-28 1998-08-28 Internet information search system and method

Publications (2)

Publication Number Publication Date
JP2000076264A JP2000076264A (en) 2000-03-14
JP3298516B2 true JP3298516B2 (en) 2002-07-02

Family

ID=17100872

Family Applications (1)

Application Number Title Priority Date Filing Date
JP24323698A Expired - Fee Related JP3298516B2 (en) 1998-08-28 1998-08-28 Internet information search system and method

Country Status (1)

Country Link
JP (1) JP3298516B2 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100403714B1 (en) 2000-06-10 2003-11-01 씨씨알 주식회사 System and method for facilitating internet search by providing web document layout image and web site structure
US7373510B2 (en) * 2000-09-12 2008-05-13 International Business Machines Corporation System and method for implementing a robot proof Web site
JP4808357B2 (en) * 2002-03-19 2011-11-02 三菱電機株式会社 Information collection device
JP4769775B2 (en) * 2003-09-22 2011-09-07 富士通株式会社 Program, information processing apparatus, access distribution method, system

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
下島健彦,WWWサーバ情報検索サービス「NETPLAZA],NEC技報,1996年 7月30日,第49巻 第7号,p.91〜p.96
馬場始三,WWWサーバ技術,画像電子学会誌,1997年 6月25日,第26巻 第3号,p.275〜p.284

Also Published As

Publication number Publication date
JP2000076264A (en) 2000-03-14

Similar Documents

Publication Publication Date Title
US7949763B2 (en) Information processing apparatus, session recovery method, recording medium for storing session recovery program
JP3866768B2 (en) Method and apparatus for forming hypermedia interactive
JP3681899B2 (en) Network printer control method
US6366947B1 (en) System and method for accelerating network interaction
JP4634547B2 (en) Real-time information distribution method
US6105028A (en) Method and apparatus for accessing copies of documents using a web browser request interceptor
JP3967806B2 (en) Computerized method and resource nomination mechanism for nominating a resource location
US7836338B2 (en) Distributed transaction processing method, distributed transaction processing system, transaction management device, and computer product
US20130346539A1 (en) Client side cache management
US20050204020A1 (en) Shared internet storage resource, user interface system, and method
JP2001519067A (en) Method and apparatus for providing a user hit for a mirrored web site to a remote site operator
GB2366418A (en) Browser collaboration system
JPH0981445A (en) Information controller
US20020052889A1 (en) Method for managing alterations of contents
JP3298516B2 (en) Internet information search system and method
JP4097584B2 (en) Embedded device having WWW server function, web page providing method, and web page providing control program
US20020078162A1 (en) Program generation system, network system and agent system
JPH11328113A (en) Information retrieval device
JP3560806B2 (en) Server-client type database system and remote database access method of database system
JP2001331398A (en) Server-managing system
US7908345B2 (en) Method and device for access to a digital document in a communication network of the station to station type
JP2000066945A (en) Document collection system, device and method and recording medium
JP2003196134A (en) Client-side system, server-side system and client-side program for information exchange system based on image, and storage medium with exchanging information data stored therein
EP1225748B1 (en) Communications terminal
JP2003242017A (en) Method and system for information disclosure

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20020319

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080419

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090419

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees