[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2003330948A - ウェブページを評価する装置および方法 - Google Patents

ウェブページを評価する装置および方法

Info

Publication number
JP2003330948A
JP2003330948A JP2002313711A JP2002313711A JP2003330948A JP 2003330948 A JP2003330948 A JP 2003330948A JP 2002313711 A JP2002313711 A JP 2002313711A JP 2002313711 A JP2002313711 A JP 2002313711A JP 2003330948 A JP2003330948 A JP 2003330948A
Authority
JP
Japan
Prior art keywords
evaluation
web page
items
item
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002313711A
Other languages
English (en)
Inventor
Yoshinori Katayama
佳則 片山
Junko Furukawa
淳子 古川
Fumito Nishino
文人 西野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2002313711A priority Critical patent/JP2003330948A/ja
Priority to US10/327,027 priority patent/US7395498B2/en
Priority to GB0300084A priority patent/GB2386218A/en
Priority to CNB031063888A priority patent/CN1257470C/zh
Publication of JP2003330948A publication Critical patent/JP2003330948A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/03Data mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

(57)【要約】 【課題】 インターネット上のWebページを具体的か
つ客観的に評価する。 【解決手段】 学習部21は、インターネット上のWe
bページ群からドメインと評価項目の対応関係を学習
し、評価セット群26を生成する。生成部22は、指定
されたドメインに対応する評価項目を評価セット群26
から抽出し、指定ドメイン評価セット27を生成する。
評価部23は、評価セット27に基いて評価対象Web
ページを評価し、結果処理部24は、得られた評価結果
を提示する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、インターネット上
のウェブ(Web)ページで発信されている情報を評価
する装置および方法に関する。
【0002】
【従来の技術および発明が解決しようとする課題】We
bページは、通常、トップページとそれにリンクされた
階層構造の複数のページからなり、それぞれのページに
発信情報が含まれている。全世界で20から40億くら
いあると言われているWebページの現状において、企
業や個人が同じ目的を持ったドメインで的確な情報発信
を行うためには、単にWebページのアクセス数を増や
すための工夫や、表面上の形式を整えるだけでは不十分
である。さらには、キーワードを用いた検索技術も日々
発展していることから、検索されるWebページにおい
ても発信内容の充実が重要である。
【0003】このためには、Webページとして発信す
る情報の内容に踏み込んだ評価が必要であり、それらの
結果をフィードバックしてWebページの価値を高め、
完成度を高める必要がある。
【0004】Webページの完成度を高めることは、単
に閲覧者への情報発信のためだけでなく、今後、情報抽
出や情報要約等の技術開発が進められていく中で、これ
らの開発技術を支える対象であるWebコンテンツの充
実を図るためにも必須である。なぜなら、情報抽出や情
報要約は、それぞれの対象となる情報がWebページ上
で発信されていることを前提としているからである。
【0005】Webページの評価規準は、例えば、以下
の電子情報に示されるように、英語圏を中心にすでにい
くつか提案されている。 J. Alexander and M. A. Tate, Evaluating Web Resour
ces, 1996. http://www2.widener.edu/Wolfgram-Memorial-Library/
webevaluation/webeval.htm この評価基準は、一般の印刷物に対する評価項目に対し
て、Webの特性を付加したものである。例えば、We
bの現状を考慮し、新たな視点を加えたチェックリスト
を作成したものとして、「チェックリストを使ったWe
bページの批判的評価とその効果」というものがある。
また、一方では、Webページの価値は如何に多くの閲
覧者にそのページを見てもらうかにあるという立場か
ら、Webページが開かれるまでの時間によってWeb
ページを評価することも考えられている。さらには、多
くの登録メンバに対してアンケートを依頼することでW
ebページを評価する試みもすでに実用化されている。
【0006】しかしながら、これらの従来技術では、W
ebページの記述内容にまで踏み込んでおらず、表面的
な評価や主観的な評価が中心になっている。したがっ
て、評価者の価値判断の変化や状況に応じて評価値が変
わってしまう等の問題を含んでいる。
【0007】本発明の課題は、Webページを具体的か
つ客観的に評価する装置および方法を提供することであ
る。
【0008】
【課題を解決するための手段】本発明のWebページ評
価装置は、格納手段、生成手段、評価手段、および出力
手段を備える。
【0009】格納手段は、インターネット上の複数のド
メインと複数の評価項目の対応関係を格納する。生成手
段は、格納手段に格納された対応関係を参照して、複数
の評価項目のうち指定されたドメインに対応する評価項
目を抽出し、抽出された評価項目からなる評価セットを
生成する。評価手段は、生成された評価セットに含まれ
る評価項目を用いて評価対象Webページの評価スコア
を計算し、出力手段は、得られた評価スコアを含む評価
結果を出力する。
【0010】ドメインと評価項目の対応関係をあらかじ
め格納しておくことで、ユーザが任意のドメインを指定
したとき、生成手段は、そのドメインに対応する具体的
な評価項目を自動的に抽出することができる。これによ
り、指定ドメインに応じて異なる評価セットが生成さ
れ、評価手段は、同じ評価対象Webページに対して、
指定ドメインに応じて異なる評価スコアを算出する。
【0011】ユーザは、ドメインを指定するだけで具体
的な評価結果を得ることができ、ドメインを変更すれば
異なる評価結果を得ることができる。また、どのユーザ
が評価装置を使用しても、指定ドメインが同じであれば
同じ評価結果が得られる。したがって、評価対象Web
ページを具体的かつ客観的に評価することが可能とな
る。
【0012】格納手段は、例えば、後述する図39の外
部記憶装置185に対応し、ドメインと評価項目の対応
関係は、例えば、後述する図3の洗練・整理済評価セッ
ト群96に対応する。また、生成手段および評価手段
は、例えば、後述する図1の生成部22および評価部2
3に対応し、出力手段は、例えば、図39の出力装置1
84に対応する。
【0013】
【発明の実施の形態】以下、図面を参照しながら、本発
明の実施の形態を詳細に説明する。Webページを作成
する場合、作成者側の容易性や、どれだけ多くの人の目
に触れるようにするか、どのような表現構成をとるべき
か等の観点から、ツールやアプリケーションの提供が行
われている。
【0014】Webページの立ち上げ時には、これらの
観点が必要となるが、すでに数多くの同じようなWeb
ページが存在し、さらに毎日増え続けている現状では、
これらのツールやアプリケーションだけでは、情報発信
を目的とするWebページの作成や維持には直接的な効
果を与えることができない。このためには、発信情報の
内容に踏み込んだ支援ツールやアプリケーションが必要
となる。
【0015】発信情報の内容に踏み込むためには、以下
の3つの機能が必要である。 (a)評価すべき対象ドメインの内容に関する評価項目
を詳細に整理する。 (b)整理された評価項目に対して、客観的に評価する
ためのスコア判定を行う。 (c)評価結果は、発信側や閲覧側等の様々な観点で分
析でき、その要望に対して容易に対処できる必要があ
る。
【0016】そこで、本実施形態におけるドメイン指定
のWebページ評価装置は、Webページで情報発信さ
れている内容をそのドメインの評価セットとして整理す
ることで、評価セットに応じてWebページのコンサル
テーションを行う。この評価方法は、これまでのチェッ
クシートやアンケート等によるWebページの全般的な
評価(見易さ、分かりやすさ等)ではなく、各発信情報
の内容に踏み込んだ評価を行う方法である。以下では、
(a)〜(c)の機能を有するWebページ評価装置の
構成と動作について、順を追って説明する。
【0017】図1は、このような評価装置の構成図であ
る。図1の評価装置は、例えば、情報処理装置(コンピ
ュータ)を用いて構成され、学習部21、生成部22、
評価部23、結果処理部24、および構築支援部25を
備える。そして、情報発信しているWebページを、そ
の発信内容を基に指定ドメインの評価セットを用いて評
価する機能と、評価結果に基いてWebページを改善す
る機能とを有する。
【0018】学習部21は、インターネット上のWeb
ページ群から評価項目を学習する。このとき、評価に用
いられるすべての項目を抽出して整理し、評価セット群
26を生成する。評価セットは、各Webページの評価
項目の集合であり、情報発信項目と詳細情報項目からな
る。これらの評価項目は、評価セット内において、イン
ターネット上のドメインと対応付けられている。
【0019】情報発信項目は、Webページ作成時に発
信すべき情報としてあらかじめ設定された基本項目であ
り、詳細情報項目は、情報発信項目以外で、内容情報の
細かい分析によって得られる項目である。評価セットと
しては、情報発信項目のみを用いてもよく、情報発信項
目と詳細情報項目の両方を用いてもよい。情報発信項目
としては、例えば、Webページ内であらかじめタグ付
けされたデータが抽出される。
【0020】また、詳細情報項目としては、テキストで
表されている情報に対して自然言語処理を行い、表現さ
れている内容を詳細に抽出することで得られた単位情報
が用いられる。自然言語処理としては、例えば、テキス
ト表現にパターンマッチのルールを用いて新たなタグを
付与する処理や、テキスト表現から形態素解析により抽
出された形態素とその品詞の組み合わせのうち、名詞と
判定された形態素を抽出する処理が考えられる。
【0021】生成部22は、ユーザが指定したドメイン
の評価セットを評価セット群26から抽出し、評価項目
を整理して、指定ドメイン評価セット27を生成する。
評価部23は、評価対象のWebページが与えられる
と、指定ドメイン評価セット27を用いてその内容を評
価し、評価結果を出力する。結果処理部24は、評価結
果をユーザに提示するとともに、評価結果に基いてWe
bページの内容を改善するための処理を行う。また、構
築支援部25は、指定ドメイン評価セット27を用いて
新たなWebページの構築を支援する。
【0022】このような構成によれば、ユーザは柔軟に
ドメインを指定し、指定ドメインに特化した評価セット
を用いて、Webページを具体的かつ客観的に評価する
ことが可能となる。また、評価結果の提示やWebペー
ジの改善を行うまでの処理をスムーズに進めることがで
きる。評価装置のユーザには、情報の発信者および閲覧
者の両方が含まれる。
【0023】図2は、図1の評価装置により行われる処
理のフローを示している。まず、学習部21は、Web
ページ群から評価項目を学習する際に、Webページの
クリーニング技術や形態素解析技術等を用いて、Web
ページから情報発信項目を抽出し(31)、それらを評
価セットとしてデータベースに登録する。これにより、
Webページ群の評価セット群26が生成される。
【0024】このとき、抽出された情報発信項目を無秩
序に収集するだけでは、選択利用する場合に混乱するこ
とが予想される。そこで、学習部21は、Webページ
群の体系(ドメインの体系)を整理したディレクトリ情
報33を用いて、体系に含まれるカテゴリごとに情報発
信項目を整理・分類し(32)、評価セットを生成す
る。
【0025】しかしながら、情報発信項目だけでは、内
容に踏み込んだ評価を行うには不十分である。そこで、
学習部21は、内容分析技術である情報抽出や情報要約
等が対象としている内容の要素も評価項目として活用す
ることで、記述されている内容まで深く扱えるように項
目を洗練して、洗練された評価セット群を生成する(3
4)。
【0026】このとき、学習部21は、情報発信項目か
らなる評価セット群に対して、あらかじめ用意されてい
る情報抽出ルール(テキストから情報を抽出するための
ルール)等の内容分析技術を適用して、詳細情報項目を
抽出し、評価セット群26を拡張する。
【0027】こうして抽出された情報発信項目や詳細情
報項目では、同じものに対して様々な表記が用いられて
いることがあり、このままでは正確な評価を行うことが
困難である。そこで、学習部21は、体系のカテゴリご
とのオントロジ(同義語辞書)36を用いて表記のゆれ
をなくし(統一化し)、評価項目を整理する(35)。
例えば、体系で整理されたカテゴリごとの情報発信項目
に関して、そのカテゴリに依存するオントロジ36を用
いて項目名称の統一化・標準化を行うことで、評価セッ
ト群26が統一化・標準化される。
【0028】次に、ユーザは、あらかじめ体系的に整理
された複数のカテゴリから必要ないくつかのカテゴリを
選択することで、ドメインを指定し、生成部22は、評
価セット群26から指定ドメインの評価セット27を生
成する(41)。このように、あらかじめ整理された体
系をもとに評価対象のドメインを限定することで、ドメ
インに依存した評価結果を得ることが可能となる。
【0029】しかし、実際のWebページから抽出され
た評価項目だけでは、そのドメインの発信情報の評価を
行うには不十分な場合がある。そこで、最新の動向や新
しい方向性、要望等に合わせて必要な項目を追加した
り、抽出された項目を修正したりする機能を設ける(4
2)。
【0030】これにより、ユーザは、指定ドメイン評価
セット27に対して、必要な項目(必須とされているも
の、期待されているもの)を追加することができる。追
加項目は、例えば、そのドメインの業界全体の流れや、
関係者および関心のある顧客等へのアンケート等から、
新たな項目として抽出される。
【0031】また、指定ドメイン評価セット27の評価
項目に対して、カテゴリごとに評価の重みを変えたい場
合がある。このような場合に対応できるように、カテゴ
リ単位で重みを与える機能を設ける(43)。この重み
の与え方としては、例えば、カテゴリ単位に算出関数を
設定する方法等が挙げられる。
【0032】さらに、同じカテゴリのドメインであって
も、評価観点等の違いにより、評価項目ごとに評価の重
みを変えたい場合もある。このような場合に対応できる
ように、指定ドメイン評価セット27の評価項目単位に
重みを与える機能を設ける(44)。
【0033】この重みを与える観点としては、例えば、
提供企業側、顧客側、企業を活用する立場、情報収集す
る立場等が設定できる。これらの観点に応じて、項目ご
とに重要度に差異が生まれるため、それらを各項目に与
える重みで調整する。また、各Webページの順位(ラ
ンキング)を用いて、ランキングの高いページ同士の項
目の共通性によって重みを与えることも可能である。こ
の場合のランキングとしては、リンクされているWeb
ページの数による重要度ランキングや、一般の人気度ラ
ンキング等が挙げられる。
【0034】学習部21および生成部22が上述したよ
うな処理を行うことで、評価対象となる各ドメインの評
価項目が、発信情報の内容にまで踏み込んで具体的かつ
詳細に整理される。
【0035】次に、評価部23は、指定ドメイン評価セ
ット27の評価項目により、評価対象Webページを評
価する(51)。評価結果は、指定されたドメインに対
して定量的な情報として出力される必要があるので、評
価スコアが算出される。評価スコアの計算方法としては
いくつかの方法が考えられ、ユーザは任意の計算方法を
指定することができる。
【0036】まず、単純スコア計算では、指定ドメイン
評価セット27の各情報発信項目について、評価対象W
ebページにおけるその項目の有無をチェックし、存在
する項目の数から単純に評価スコアを算出する(5
2)。
【0037】また、URL(Uniform Resource Locato
r)階層を含むスコア計算では、ユーザの利便性という
観点を評価スコアに組み込むために、各情報発信項目の
情報を含むページに対して、トップページからの階層
(リンク)の深さを考慮しながら、評価スコアを算出す
る(53)。
【0038】また、項目の順序によるスコア計算では、
指定ドメイン評価セット27の評価項目の評価対象We
bページにおける表示順序を用いて、評価スコアを算出
する(54)。項目の表示順序は、メニュー内やポップ
アップウインドウ内等における項目の位置から求めるこ
とができ、評価スコアは、指定ドメイン内で算出された
一般的な順序を基準として算出することができる。
【0039】また、情報抽出結果のスコア計算では、指
定ドメイン評価セット27の各詳細情報項目について、
評価対象Webページにおけるその項目の有無をチェッ
クし、存在する項目の数から評価スコアを算出する(5
5)。このとき、評価対象Webページの内容分析を実
際に行うことで、対応する詳細情報項目の有無が判断さ
れる。
【0040】また、抽出結果の記述の広がりを含むスコ
ア計算では、詳細情報項目に対してもユーザの利便性と
いう観点を踏まえるために、各詳細情報項目の情報を含
むページに対して、トップページからの階層の深さや内
容分析における記述位置の広がりを考慮しながら、評価
スコアを算出する(56)。
【0041】評価部23が上述したようなスコア計算を
行うことで、整理された評価項目に対して客観的なスコ
ア判定が行われる。次に、結果処理部24は、算出され
た評価スコアを評価結果として画面に表示する(6
1)。
【0042】同じドメインで表記のゆれがある場合、表
示された評価結果について、ユーザに誤った理解を起こ
させてしまう可能性がある。そこで、それぞれのWeb
ページが、対応するドメインにおいて、一般に使用され
ている表記とは異なるものを用いている場合の支援(指
示)を行う機能を設ける(62)。
【0043】この機能により、結果処理部24は、指定
ドメイン評価セット27におけるカテゴリごとの評価項
目に関して、そのカテゴリに依存するオントロジを用い
て、項目名称に対する修正への示唆(アドバイス)を提
示する。これにより、ユーザは、適切な項目名称の修正
を行うことができる。
【0044】また、結果処理部24は、ユーザにアドバ
イスを提示する代わりに、この修正を自動的に行うイン
タフェースを起動することもできる。この場合、システ
ム側からの指示に従って、同じドメインでの表記のゆれ
が積極的に修正される(63)。
【0045】評価スコアが示されることで指定ドメイン
における評価結果が定量的に得られるが、得られた評価
に対してユーザ(発信者)が改善アクションを起こした
い場合には、具体的にどの項目やどんな内容に問題があ
るのかを認識する必要がある。そこで、結果処理部24
は、スコアを低くしている具体的な評価項目や内容を、
Webページの改善方法として提示する(64)。
【0046】また、評価に対する改善アクション65と
して、どの項目を改善すると評価結果が定量的にどのよ
うに変化するかが分かれば、改善効果を認識した上で作
業の順序等の予定を立てることが可能になる。そこで、
結果処理部24は、各項目の改善結果が評価スコアに与
える影響を予測して提示する(66)。例えば、実際に
いくつかの情報発信項目を追加した場合の新たな評価ス
コアが算出され、その値が提示される。
【0047】また、結果処理部24は、各項目の改善の
シミュレーションだけでなく、実際に入力インタフェー
スを起動して、改善作業(必要な項目の追加や発信内容
の修正等)をユーザに行わせることもできる(67)。
この場合、起動された入力インタフェースは、改善作業
のための入力フォームを自動的に表示する。
【0048】Webページの内容評価では、発信される
べき情報がどれだけ含まれているか(あるいは欠けてい
るか)を主な評価結果として提示しているが、他のWe
bページにはない評価対象Webページ独自の発信情報
が存在するかどうかも、Webページの管理者にとって
は有用な情報になる。このような情報は、評価処理の途
中で副産物として収集することができる。
【0049】そこで、結果処理部24は、指定ドメイン
評価セット27の評価項目以外の項目を特殊情報として
提示し、それが奇抜な項目、集客力のある項目、無駄な
項目等に対応する旨のアドバイスを行う(68)。
【0050】結果処理部24が上述したような処理を行
うことで、評価結果を、発信者や閲覧者等の様々な観点
で分析することができ、その要望に対して容易に対処す
ることが可能となる。
【0051】次に、構築支援部25は、ユーザが指定ド
メインに対応する新たなWebページを構築するための
支援を行う(71)。新たなWebページを作成する場
合、どのような項目配置や表現方法を採用するか等の支
援が必要となり、実際に多数の作成支援ツールが用いら
れている。しかし、指定されたドメインにおいて、どの
ような内容の情報発信を行うべきか等の支援は行われて
いない。
【0052】構築支援部25を用いれば、Webページ
の評価のために生成された情報を利用して指定ドメイン
での新たなWebページを作成し、情報発信を行いたい
と考えているユーザに対して、どのような項目や内容情
報があればよいかを提示することができる。
【0053】このとき、ユーザは、カテゴリを選択する
ことでドメインを指定し、構築支援部25は、指定ドメ
インの評価セット27から情報発信の基本メタ情報を生
成して、ユーザに提示する(72)。この基本メタ情報
としては、標準的なタグセットやXML(eXtensible M
arkup Language)のDTD(Document Type Definition
)等が提示される。
【0054】また、構築支援部25は、基本メタ情報を
提示するだけでなく、実際に入力インタフェースを起動
して、基本メタ情報に応じて実際にWebページを作成
するための情報入力作業をユーザに行わせることもでき
る(73)。起動された入力インタフェースは、基本メ
タ情報に合わせて情報を入力するための入力フォームを
自動的に表示する。
【0055】構築支援部25が上述したような処理を行
うことで、発信者は、指定ドメインの評価項目に対応す
る情報を含むWebページを効率よく作成することがで
きる。
【0056】次に、図3から図38までを参照しなが
ら、図2に示した各処理の具体例を説明する。図3は、
学習部21の処理を示している。図3の学習部21は、
クリーニング部81、項目抽出部82、体系整理部8
3、体系対応処理部84、情報抽出部85、および項目
のゆれチェック部86を備え、インターネット上のWe
bページ群を入力として、洗練・整理済評価セット群9
6を出力する。Webページからの評価項目の抽出と抽
出した評価項目の体系化が、学習部21の重要な機能で
ある。
【0057】まず、クリーニング部81は、Webクリ
ーニングを行って、Webページの情報から不必要なタ
グやゴミを排除する。このWebクリーニングにより、
Webページ上に表示されているバナー広告や動画・静
止画情報等、テキスト処理の対象にならない部分が排除
される。
【0058】次に、項目抽出部82は、クリーニング後
の情報に対してタグ判定、タグクリーニング、形態素処
理、品詞判定等を行って、タグ付けされた情報を情報発
信項目91として抽出する。タグ判定は、Webページ
で表示されるメニュー項目のタグを抽出する処理であ
る。例えば、図4に示すようなデータが与えられた場
合、imgタグ内で用いられているaltデータ等が抽
出対象となる。また、タグクリーニングは、与えられた
データからタグを排除する処理である。
【0059】図5は、仮想的な企業のWebページに含
まれる会社概要に関する記述部分を示している。このよ
うなデータが与えられた場合、タグクリーニングによ
り、TABLE、TR、TD、B等のタグが排除され
る。例えば、このデータの101の部分についてタグク
リーニングを行うと、図6のようなデータが抽出され
る。
【0060】形態素処理は、自然言語処理ツールとして
一般的である形態素解析をテキスト情報の部分に適用
し、分割された単位を対象として、評価項目となり得る
候補を抽出する処理である。また、品詞判定は、例え
ば、形態素処理によって分割された単位情報の品詞を判
定して、特定の品詞を評価項目となり得る候補として抽
出する処理である。ここでは、例えば、名詞と判定され
た単位情報のうち、N個(例えば、3個)以上出現する
ものが、候補として抽出される。
【0061】図3の体系整理部83は、あらかじめWe
bページ群の体系をディレクトリ情報33として整理
し、格納しておく。ディレクトリ情報33は、Webペ
ージ群のカテゴリを体系化した情報であり、学習結果で
ある評価セット群93の評価項目の整理に活用される。
【0062】図7は、ディレクトリ情報33の例を示し
ている。このディレクトリ情報は、カテゴリ1〜6の6
階層で階層化された構造を有し、各カテゴリは、その下
位に位置する他のカテゴリを包含する。例えば、カテゴ
リ1の「産業」は最上位の階層に対応し、カテゴリ6の
「M社」等は最下位の階層に対応する。また、「第一次
産業」のカテゴリは、「農業」、「漁業」、「畜産
業」、「林業」、および「狩猟業」の各カテゴリを包含
している。
【0063】体系対応処理部84は、抽出された項目が
ディレクトリ情報33の体系のどの部分に対応するかを
調べて、各項目と対応するカテゴリを組にした体系化済
情報発信項目92を生成し、評価セット群93として格
納する。
【0064】図8〜13は、実際のインターネット上の
Webページから評価項目(情報発信項目)を抽出する
ことで生成された評価セット群93の例を示している。
抽出された情報発信項目は、すべてのWebページに共
通な共通項目と、各カテゴリに特有な特有項目と、各W
ebページに特有な個別項目とに分類される。
【0065】図8は、「食品メーカ」のカテゴリに属す
る企業の名称、URL、および共通項目を示しており、
図9は、それらの企業の特有項目および個別項目を示し
ている。また、図10は、「化粧品メーカ」のカテゴリ
に属する企業の名称、URL、および共通項目を示して
おり、図11は、それらの企業の特有項目および個別項
目を示している。さらに、図12は、「自動車メーカ」
のカテゴリに属する企業の名称、URL、および共通項
目を示しており、図13は、それらの企業の特有項目お
よび個別項目を示している。
【0066】図9、11、および13において、特有項
目および個別項目の記載順序は、対応する図8、10、
および12における企業名の記載順序に対応している。
次に、情報抽出部85は、あらかじめ格納されている情
報抽出ルール94を用いて、Webページの情報から詳
細情報項目95を抽出し、評価セット群93の情報発信
項目に追加する。ここでは、Webページの情報に新た
なタグを付与することで、詳細情報項目が抽出される。
【0067】例えば、図5に示したデータに対して、情
報抽出ルールを用いてタグを付与した場合、図14のよ
うなデータが得られる。図14においては、発表主体組
織情報、創業情報、要素1、創業年月日、設立情報、設
立年月日、不定組織補足情報、他情報、社長情報、資本
金情報、および従業員情報のタグが新たに付与されてい
る。この処理により、創業年月日、設立年月日、社長情
報、資本金情報、従業員情報等が詳細情報項目として抽
出される。
【0068】図15は、「会社概要」という情報発信項
目を詳細化して得られる詳細情報項目の例を示してい
る。ここでは、「会社概要」の項目で発信されている内
容情報に対して情報抽出ルールを適用することで、社
名、所在地、電話番号、代表者(社長)、資本金、創業
年、設立年、従業員数等の詳細情報項目が抽出されてい
る。
【0069】また、図16は、「製品情報」という情報
発信項目を詳細化して得られる詳細情報項目の例を示し
ている。ここでは、「製品情報」の項目で発信されてい
る内容情報に対して情報抽出ルールを適用することで、
製品名、種別情報、製品補足情報、製造製品情報、製造
組織情報、製造組織補足情報等の詳細情報項目が抽出さ
れている。
【0070】このように、情報抽出処理により情報発信
項目を詳細化することで、評価セット群93の評価項目
が洗練される。次に、項目のゆれチェック部86は、オ
ントロジ36を用いて名称統一処理を行い、項目名のゆ
れを排除する。これにより、評価セット群93の項目名
がカテゴリごとに代表的な項目名に統一され、項目名の
標準化が実現される。
【0071】図17〜19は、オントロジ36の例を示
している。図17、18、および19は、それぞれ「食
品メーカ」、「化粧品メーカ」、および「自動車メー
カ」のカテゴリに属する各項目の代表名と、対応する候
補の名称を示している。代表名は、例えば、これまでの
各項目名の出現個数を基準として選定される。
【0072】図20〜25は、評価セット群の学習結果
として生成される洗練・整理済評価セット群96の例を
示している。これらの図では、「食品メーカ」、「化粧
品メーカ」、および「自動車メーカ」の各カテゴリの評
価セットと、企業単位の評価セットがリストアップされ
ている。ただし、ここでは、便宜的に情報発信項目のみ
が示されており、これらの項目は、共通トップメニュー
の表現と、業界別特有項目と、その他のメニューとに分
類される。
【0073】図20は、「食品メーカ」に属する企業の
名称、トップページの構造(top構造)、および共通
トップメニューの表現を示しており、図21は、それら
の企業の業界別特有項目およびその他のメニューを示し
ている。また、図22は、「化粧品メーカ」に属する企
業の名称、トップページの構造、および共通トップメニ
ューの表現を示しており、図23は、それらの企業の業
界別特有項目およびその他のメニューを示している。さ
らに、図24は、「自動車メーカ」に属する企業の名
称、トップページの構造、および共通トップメニューの
表現を示しており、図25は、それらの企業の業界別特
有項目およびその他のメニューを示している。
【0074】図21、23、および25において、業界
別特有項目およびその他のメニューの記載順序は、対応
する図20、22、および24における企業名の記載順
序に対応している。
【0075】また、図20、22、および24において
は、「食品メーカ」、「化粧品メーカ」、および「自動
車メーカ」のカテゴリごとに、「新着」、「リリース」
等の代表項目名が付加されている。
【0076】さらに、図21においては、「工場見
学」、「topテキストメッセージ」等の代表項目名が
付加されており、図23においては、「美容」、「ファ
ッション」等の代表項目名が付加されており、図25に
おいては、「工場見学」、「リコール」等の代表項目名
が付加されている。
【0077】次に、図26は、生成部22の処理を示し
ている。図26の生成部22は、カテゴリ選択部11
1、部分体系選択部112、項目追加部113、カテゴ
リ作成部114、カテゴリ選択部115、重み付与部1
16、項目選択部117、および重み付与部118を備
え、洗練・整理済評価セット群96を入力として、重み
処理された指定ドメイン評価セット122を出力する。
【0078】洗練・整理済評価セット群96から指定ド
メイン評価セット121を選択するためには、ドメイン
指定と項目の追加・修正の機能が重要になる。ユーザ
は、ドメインを指定する際、カテゴリ選択部111を用
いて、体系化されている評価セットの個々のカテゴリを
選択することができ、部分体系選択部112を用いてよ
り上位の階層のカテゴリを指定することで、カテゴリの
まとまりを選択することができる。個々のカテゴリは、
個々のWebページのURLに対応し、カテゴリのまと
まりは、複数のWebページの集合に対応する。
【0079】カテゴリ選択部111を用いて、体系の最
下位の階層に含まれる1つ以上のカテゴリが選択された
場合、選択されたすべてのカテゴリがドメインとして指
定される。また、部分体系選択部112を用いて、より
上位の階層のカテゴリが指定された場合は、指定された
カテゴリとそれに包含される下位のカテゴリがドメイン
として指定される。したがって、カテゴリ選択部111
と部分体系選択部112を用いることで、必要な個々の
カテゴリをピックアップしたり、体系構造のあるまとま
った部分を選択したりして、ドメインを指定することが
できる。
【0080】そして、選択されたカテゴリに対応する評
価項目が洗練・整理済評価セット群96から抽出され、
指定ドメイン評価セット121が生成される。また、既
存のWebページから抽出された評価項目だけでは不十
分な場合、ユーザは、項目追加部113およびカテゴリ
作成部114を用いて、指定ドメイン評価セット121
の評価項目の追加・修正を行う。このとき、項目追加部
113は、ユーザが入力した項目を個々のカテゴリに追
加する。また、カテゴリ作成部114は、カテゴリ内の
項目からユーザが指定したものを削除したり、カテゴリ
名をユーザが指定した名称に変更したりする処理を行
う。
【0081】ここで、指定ドメイン評価セット121の
各評価項目に重要度を与えて扱えるようにするために
は、カテゴリの重み処理と項目の重み処理が重要な機能
になる。カテゴリの重み処理では、ユーザは、カテゴリ
選択部115を用いて重みを付与する対象カテゴリを選
択し、重み付与部116を用いて付与する重みを指定す
る。また、項目の重み処理では、ユーザは、項目選択部
117を用いて重みを付与する対象項目を選択し、重み
付与部118を用いて付与する重みを指定する。これに
より、重み処理された指定ドメイン評価セット122が
生成される。
【0082】図27〜32は、重み処理された指定ドメ
イン評価セット122の例を示している。ただし、ここ
では、図20〜25に示した評価セット群のすべてのカ
テゴリがドメインとして指定された場合を想定してい
る。
【0083】図28、30、および32において、業界
別特有項目およびその他のメニューの記載順序は、対応
する図27、29、および31における企業名の記載順
序に対応している。
【0084】また、図27、29、および31において
は、企業名のカテゴリごとに、カテゴリの重みが付与さ
れており、共通topメニューの表現の項目ごとに、項
目の重みが付与されている。さらに、図28、30、お
よび32においては、業界別特有項目ごとに、項目の重
みが付与されている。
【0085】図20〜25に示した評価セット群のうち
一部のカテゴリのみがドメインとして指定された場合
は、指定された部分の評価項目のみが抽出され、指定ド
メイン評価セット121と重み処理された指定ドメイン
評価セット122が生成される。例えば、「食品メー
カ」がドメインとして指定された場合、重み処理された
指定ドメイン評価セット122は、図27および28に
示された評価項目から構成される。
【0086】次に、図33は、評価部23の処理を示し
ている。評価部23の前処理として、図3のクリーニン
グ部81と項目抽出部82により、評価対象Webペー
ジから情報発信項目131が抽出され、情報抽出部85
により、評価対象Webページから詳細情報項目132
が抽出される。そして、項目のゆれチェック部86によ
り、これらの項目の名称が統一され、評価対象Webペ
ージにおける整理された評価対象項目が準備される。
【0087】図33の評価部23は、項目チェック部1
41、階層チェック部142、抽出内容チェック部14
3、広がりチェック部144、および順序チェック部1
45を備え、重み処理された指定ドメイン評価セット1
22と情報発信項目131および詳細情報項目132を
入力として、Webページの評価結果151を出力す
る。
【0088】項目チェック部141と階層チェック部1
42は、情報発信項目レベルの処理を行い、抽出内容チ
ェック部143と広がりチェック部144は、詳細情報
項目レベルの処理を行う。また、順序チェック部145
は、これらの両方の項目に関する処理を行う。
【0089】項目チェック部141は、情報発信項目の
有無をチェックして、単純スコア計算を行う。このと
き、評価セット122内の各情報発信項目に対応する内
容情報が、評価対象Webページから抽出された評価対
象項目に含まれているか否かをチェックする。そして、
存在する項目の項目チェック値を1とし、存在しない項
目の項目チェック値を0とする。また、各項目に付与さ
れている重みがあれば、それを考慮して各項目のスコア
を算出する。
【0090】例えば、図27〜32に示されているよう
に、1〜10の整数値により10ランクの重みが付与さ
れている場合、項目の有無を表す項目チェック値に、
(項目の重み/10)を掛けてスコアが算出される。し
たがって、評価スコアは、次式により算出される。
【0091】 各項目のスコア=項目チェック値*項目の重み/10 評価スコア=各項目のスコアの合計/項目数 図34および35は、「食品メーカ」を指定ドメインと
して各企業のWebページを評価した場合における情報
発信項目の項目チェック値の例を示している。図34
は、各企業のWebページにおける共通トップメニュー
の表現の項目チェック値を示しており、図35は、その
Webページにおける業界別特有項目の項目チェック値
を示している。
【0092】階層チェック部142は、URL階層計算
を行って、評価対象Webページにおける情報発信項目
の階層位置をチェックし、その結果に基いてスコア計算
を行う。このとき、評価対象Webページのトップペー
ジの出現階層を1として、各情報発信項目の出現階層
(深さ)を算出する。そして、項目チェック値に出現階
層の逆数を掛けて、各項目のスコアを算出する。この場
合、評価スコアは、次式により算出される。
【0093】各項目のスコア=項目チェック値*(項目
の重み/10)*(1/出現階層) 評価スコア=各項目のスコアの合計/項目数 抽出内容チェック部143は、詳細情報項目の有無をチ
ェックして、抽出結果を含めたスコア計算を行う。この
とき、評価セット122内の各詳細情報項目に対応する
内容情報が、評価対象Webページから抽出された評価
対象項目に含まれているか否かをチェックする。そし
て、項目チェック部141による単純スコア計算と同様
のアルゴリズムで、評価スコアを算出する。
【0094】図36は、図34に示した各企業のWeb
ページにおける詳細情報項目の項目チェック値の例を示
している。ここでは、「企業名」、「資本金」等の各項
目について項目チェック値が示されている。
【0095】広がりチェック部144は、詳細情報項目
の位置や記述の広がりをチェックして、スコア計算を行
う。このとき、評価対象Webページにおいて、関連が
ある複数の詳細情報項目同士の並び順や、それらの項目
の間の離れ度を算出する。離れ度は、項目間にどれだけ
他の項目が存在するかを表し、項目間に他の項目が存在
しない場合は1とする。そして、項目チェック値に離れ
度の逆数を掛けて、各項目のスコアを算出する。この場
合、評価スコアは、次式により算出される。
【0096】各項目のスコア=項目チェック値*(項目
の重み/10)*(1/離れ度) 評価スコア=各項目のスコアの合計/項目数 例えば、「郵便番号」と「住所」が詳細情報項目として
抽出された場合、これらの項目が互いに近くにあれば評
価スコアは高くなり、逆に離れていれば評価スコアは低
くなる。
【0097】順序チェック部145は、情報発信項目お
よび詳細情報項目の表示順序をチェックして、スコア計
算を行う。このとき、評価セット122の評価項目の評
価対象Webページにおける順序(メニュー項目の並び
等)を取得し、その順序を基本順序と比較して、評価ス
コアを算出する。基本順序は、例えば、指定ドメインの
Webページの項目からあらかじめ算出しておくものと
する。
【0098】なお、各項目のスコアの計算において、さ
らに各カテゴリに付与されている重みがあれば、それも
考慮してスコア計算を行う。この場合、例えば、項目チ
ェック値*(項目の重み/10)の値に(カテゴリの重
み/10)を掛けて、各項目のスコアが算出される。
【0099】以上説明したようなスコア計算によれば、
結果的に、情報発信項目レベルの評価スコアと、詳細情
報項目レベルの評価スコアと、項目順序による評価スコ
アの3種類の値がそれぞれ算出される。このうち、情報
発信項目レベルと詳細情報項目レベルの評価スコアにつ
いては、項目数に応じた平均処理を行うことが可能であ
る。
【0100】次に、図37は、結果処理部24の処理を
示している。図37の結果処理部24は、発信項目評価
部161、抽出内容評価部162、項目順序評価部16
3、項目名評価部164、改善処理部165、改善結果
予測部166、改善作業支援部167、および特殊情報
処理部168を備え、Webページの評価結果151を
入力としてユーザに評価結果を提示し、Webページの
改善作業を支援する。
【0101】発信項目評価部161は、情報発信項目レ
ベルの評価スコアと、各情報発信項目のスコアを提示
し、抽出内容評価部162は、詳細情報項目レベルの評
価スコアと、各詳細情報項目のスコアを提示する。ま
た、項目順序評価部163は、項目順序による評価スコ
アを提示する。
【0102】全体の評価スコアだけでなく、各項目のス
コアも合わせて提示することで、ユーザは、評価の低い
項目を容易に認識し、改善アクションをとることができ
る。例えば、項目のスコアが0であれば、対応する項目
がWebページに存在しないことが分かるので、その項
目を追加することでWebページが改善される。
【0103】項目名評価部164は、Webページにお
ける項目名の表記ゆれを表示し、オントロジを用いて適
切な代表項目名を求め、それを修正候補として提示す
る。これにより、ユーザは、提示された代表項目名への
修正を容易に行うことができる。さらに、改善処理部1
65は、表記ゆれの修正を行うインタフェースを起動
し、起動されたインタフェースは、代表項目名への修正
を自動的に行う。
【0104】改善結果予測部166は、評価結果に含ま
れる項目の改善結果を予測して提示する。例えば、項目
のスコアが0である情報発信項目があれば、その項目を
仮想的に追加した場合のスコア計算を評価部23に依頼
し、得られた評価結果をユーザに提示する。さらに、改
善作業支援部167は、このような改善作業を支援する
ために、入力インタフェースを起動する。起動された入
力インタフェースは、入力フォームを自動的に表示し、
ユーザが入力した変更をWebページに反映させる。
【0105】特殊情報処理部168は、情報の差分計算
を行って、Webページに評価項目以外の項目(差分項
目)が含まれているか否かをチェックし、差分項目が含
まれていれば、それを特殊情報として表示する。これに
より、ユーザは、指定ドメインにはない独自の情報が発
信されていることを認識できる。
【0106】次に、図38は、構築支援部25の処理を
示している。図38の構築支援部25は、メタ情報抽出
部171、メタ情報提示部172、および改善処理部1
73を備え、重み処理された指定ドメイン評価セット1
22を入力として、新たなWebページを構築するため
の支援を行う。
【0107】メタ情報抽出部171は、評価セット12
2の評価項目から指定ドメインにおけるメタ情報(タグ
セット、DTD等)を生成し、メタ情報提示部172
は、抽出されたメタ情報をユーザに提示する。
【0108】改善処理部173は、入力インタフェース
を起動し、起動された入力インタフェースは、メタ情報
に基く入力フォームを自動的に表示して、ユーザが入力
した情報を含むWebページを作成する。
【0109】ところで、図1の評価装置は、例えば、図
39に示すような情報処理装置(コンピュータ)を用い
て構成される。図39の情報処理装置は、CPU(中央
処理装置)181、メモリ182、入力装置183、出
力装置184、外部記憶装置185、媒体駆動装置18
6、およびネットワーク接続装置187を備え、それら
はバス188により互いに接続されている。
【0110】メモリ182は、例えば、ROM(read o
nly memory)、RAM(random access memory)等を含
み、処理に用いられるプログラムとデータを格納する。
CPU181は、メモリ182を利用してプログラムを
実行することにより、必要な処理を行う。この場合、図
1の学習部21、生成部22、評価部23、結果処理部
24、および構築支援部25は、メモリ182に格納さ
れたプログラムに対応する。
【0111】入力装置183は、例えば、キーボード、
ポインティングデバイス、タッチパネル等であり、ユー
ザからの指示や情報の入力に用いられる。出力装置18
4は、例えば、ディスプレイ、プリンタ、スピーカ等で
あり、ユーザへの問い合わせや処理結果(評価結果等)
の出力に用いられる。
【0112】外部記憶装置185は、例えば、磁気ディ
スク装置、光ディスク装置、光磁気ディスク装置、テー
プ装置等である。情報処理装置は、この外部記憶装置1
85に、上述のプログラムとデータを保存しておき、必
要に応じて、それらをメモリ182にロードして使用す
る。外部記憶装置185は、図2のディレクトリ情報3
3およびオントロジ36を格納するデータベースや、図
3の洗練・整理済評価セット群96を蓄積するデータベ
ースとしても使用される。
【0113】媒体駆動装置186は、可搬記録媒体18
9を駆動し、その記録内容にアクセスする。可搬記録媒
体189としては、メモリカード、フレキシブルディス
ク、CD−ROM(compact disk read only memory
)、光ディスク、光磁気ディスク等、任意のコンピュ
ータ読み取り可能な記録媒体が用いられる。ユーザは、
この可搬記録媒体189に上述のプログラムとデータを
格納しておき、必要に応じて、それらをメモリ182に
ロードして使用する。
【0114】ネットワーク接続装置187は、LAN
(Local Area Network)やインターネット等の任意の通
信ネットワークに接続され、通信に伴うデータ変換を行
う。情報処理装置は、上述のプログラムとデータをネッ
トワーク接続装置187を介して他の装置から受け取
り、必要に応じて、それらをメモリ182にロードして
使用する。
【0115】図40は、図39の情報処理装置にプログ
ラムとデータを供給することのできるコンピュータ読み
取り可能な記録媒体を示している。可搬記録媒体189
やサーバ190のデータベース191に保存されたプロ
グラムとデータは、メモリ182にロードされる。この
とき、サーバ190は、プログラムとデータを搬送する
搬送信号を生成し、ネットワーク上の任意の伝送媒体を
介して情報処理装置に送信する。そして、CPU181
は、そのデータを用いてそのプログラムを実行し、必要
な処理を行う。
【0116】(付記1) 生成手段が、格納手段に格納
されたインターネット上の複数のドメインと複数の評価
項目の対応関係を参照して、該複数の評価項目のうち指
定されたドメインに対応する評価項目を抽出し、抽出さ
れた評価項目からなる評価セットを生成し、評価手段
が、前記評価セットに含まれる評価項目を用いて評価対
象ウェブページの評価スコアを計算し、出力手段が、前
記評価スコアを含む評価結果を出力することを特徴とす
るウェブページ評価方法。
【0117】(付記2) 学習手段が、ウェブページ群
の情報からあらかじめ設定されている情報発信項目を評
価項目として抽出することにより、前記複数のドメイン
と複数の評価項目の対応関係を学習して、前記格納手段
に格納することを特徴とする付記1記載のウェブページ
評価方法。
【0118】(付記3) 前記学習手段が、前記ウェブ
ページ群の情報からあらかじめタグ付けされたデータを
前記情報発信項目として抽出することを特徴とする付記
2記載のウェブページ評価方法。
【0119】(付記4) 前記評価手段が、前記評価セ
ットに含まれる各情報発信項目が前記評価対象ウェブペ
ージに存在するか否かをチェックして、前記評価スコア
を計算することを特徴とする付記2記載のウェブページ
評価方法。
【0120】(付記5) 前記評価手段が、前記評価セ
ットに含まれる各情報発信項目について前記評価対象ウ
ェブページにおけるトップページからの階層の深さを求
めて、前記評価スコアを計算することを特徴とする付記
2記載のウェブページ評価方法。
【0121】(付記6) 前記学習手段が、前記情報発
信項目の内容情報を分析して該内容情報から詳細情報項
目を抽出し、該詳細情報項目を評価項目に追加すること
を特徴とする付記2記載のウェブページ評価方法。
【0122】(付記7) 前記学習手段が、前記評価対
象ウェブページの内容情報を分析して詳細情報項目を抽
出し、前記評価手段が、前記評価セットに含まれる各詳
細情報項目が該評価対象ウェブページから抽出された詳
細情報項目の中に存在するか否かをチェックして、前記
評価スコアを計算することを特徴とする付記6記載のウ
ェブページ評価方法。
【0123】(付記8) 前記評価手段が、前記評価セ
ットに含まれる詳細情報項目のうち関連がある詳細情報
項目同士が前記評価対象ウェブページ内でどれだけ離れ
ているかをチェックして、前記評価スコアを算出するこ
とを特徴とする付記6記載のウェブページ評価方法。
【0124】(付記9) 前記学習手段が、前記格納手
段に格納されたウェブページ群のカテゴリの体系を表す
ディレクトリ情報を参照して、該ディレクトリ情報に含
まれるカテゴリごとに前記情報発信項目を分類すること
で、前記複数のドメインと複数の評価項目の対応関係を
学習することを特徴とする付記2記載のウェブページ評
価方法。
【0125】(付記10) 前記学習手段が、前記ディ
レクトリ情報のカテゴリごとのオントロジを用いて前記
評価項目の名称を統一して、前記複数のドメインと複数
の評価項目の対応関係を整理することを特徴とする付記
9記載のウェブページ評価方法。
【0126】(付記11) 前記生成手段が、前記ディ
レクトリ情報に含まれる複数のカテゴリから選択された
1つ以上のカテゴリを前記指定されたドメインと解釈
し、該選択されたカテゴリに属する評価項目を抽出し
て、抽出された評価項目とカテゴリの対応関係を含む評
価セットを生成することを特徴とする付記9記載のウェ
ブページ評価方法。
【0127】(付記12) 前記生成手段が、前記評価
セットに含まれる評価項目に対してカテゴリ単位で評価
の重みを付与し、前記評価手段が、付与された重みを用
いて前記評価スコアを計算することを特徴とする付記1
1記載のウェブページ評価方法。
【0128】(付記13) 結果処理手段が、前記評価
セットに含まれるカテゴリごとの評価項目に対して、対
応するカテゴリに依存するオントロジを用いて適切な代
表項目名を求め、前記出力手段が、該代表項目名を修正
候補として出力することを特徴とする付記11記載のウ
ェブページ評価方法。
【0129】(付記14) 前記生成手段が、前記評価
セットに含まれる評価項目に対して項目単位で評価の重
みを付与し、前記評価手段が、付与された重みを用いて
前記評価スコアを計算することを特徴とする付記1記載
のウェブページ評価方法。
【0130】(付記15) 前記生成手段が、ユーザか
ら指定された評価項目を前記評価セットに追加すること
を特徴とする付記1記載のウェブページ評価方法。 (付記16) 前記評価手段が、前記評価セットに含ま
れる評価項目の前記評価対象ウェブページにおける表示
順序を求めて、前記評価スコアを算出することを特徴と
する付記1記載のウェブページ評価方法。
【0131】(付記17) 前記出力手段が、前記評価
スコアを低くしている具体的な評価項目を含む評価結果
を出力することを特徴とする付記1記載のウェブページ
評価方法。
【0132】(付記18) 結果処理手段が、前記評価
対象ウェブページに新たな評価項目を追加した場合の評
価スコアの変化を予測し、前記出力手段が、予測結果を
出力することを特徴とする付記1記載のウェブページ評
価方法。
【0133】(付記19) 結果処理手段が、前記評価
セットに含まれる評価項目以外の項目が前記評価対象ウ
ェブページに含まれているか否かをチェックし、前記出
力手段が、該評価項目以外の項目を特殊情報として出力
することを特徴とする付記1記載のウェブページ評価方
法。
【0134】(付記20) 構築支援手段が、前記評価
セットに含まれる評価項目を用いて、前記指定されたド
メインにおける新たなウェブページを作成するためのメ
タ情報を生成し、前記出力手段が、該メタ情報を出力す
ることを特徴とする付記1記載のウェブページ評価方
法。
【0135】(付記21) インターネット上の複数の
ドメインと複数の評価項目の対応関係を参照して、該複
数の評価項目のうち指定されたドメインに対応する評価
項目を抽出し、抽出された評価項目からなる評価セット
を生成し、前記評価セットに含まれる評価項目を用いて
評価対象ウェブページの評価スコアを計算し、前記評価
スコアを含む評価結果を提示することを特徴とするウェ
ブページ評価方法。
【0136】(付記22) あらかじめ格納されたイン
ターネット上の複数のドメインと複数の評価項目の対応
関係を参照して、該複数の評価項目のうち指定されたド
メインに対応する評価項目を抽出し、抽出された評価項
目からなる評価セットを生成し、前記評価セットに含ま
れる評価項目を用いて評価対象ウェブページの評価スコ
アを計算し、前記評価スコアを含む評価結果を出力する
処理をコンピュータに実行させることを特徴とするプロ
グラム。
【0137】(付記23) コンピュータのためのプロ
グラムを記録した記録媒体であって、該プログラムは、
あらかじめ格納されたインターネット上の複数のドメイ
ンと複数の評価項目の対応関係を参照して、該複数の評
価項目のうち指定されたドメインに対応する評価項目を
抽出し、抽出された評価項目からなる評価セットを生成
し、前記評価セットに含まれる評価項目を用いて評価対
象ウェブページの評価スコアを計算し、前記評価スコア
を含む評価結果を出力する処理を前記コンピュータに実
行させることを特徴とするコンピュータ読み取り可能な
記録媒体。
【0138】(付記24) コンピュータにプログラム
を搬送する搬送信号であって、該プログラムは、あらか
じめ格納されたインターネット上の複数のドメインと複
数の評価項目の対応関係を参照して、該複数の評価項目
のうち指定されたドメインに対応する評価項目を抽出
し、抽出された評価項目からなる評価セットを生成し、
前記評価セットに含まれる評価項目を用いて評価対象ウ
ェブページの評価スコアを計算し、前記評価スコアを含
む評価結果を出力する処理を前記コンピュータに実行さ
せることを特徴とする搬送信号。
【0139】(付記25) インターネット上の複数の
ドメインと複数の評価項目の対応関係を格納する格納手
段と、前記複数のドメインと複数の評価項目の対応関係
を参照して、該複数の評価項目のうち指定されたドメイ
ンに対応する評価項目を抽出し、抽出された評価項目か
らなる評価セットを生成する生成手段と、前記評価セッ
トに含まれる評価項目を用いて評価対象ウェブページの
評価スコアを計算する評価手段と、前記評価スコアを含
む評価結果を出力する出力手段とを備えることを特徴と
するウェブページ評価装置。
【0140】
【発明の効果】これまで、Webページの評価は、閲覧
者の主観的あるいは表面的な評価にとどまっていたが、
本発明によれば、指定ドメインに特化した評価項目によ
り、Webページを具体的かつ客観的に評価することが
可能となる。
【0141】また、Webページ作成時にあらかじめ設
定された項目だけでなく、内容分析により得られる項目
も評価対象として採用することで、より詳細な評価を行
うことができる。さらに、指定ドメインをURLや体系
構造に応じて自由に選択することで、評価項目を柔軟に
設定することができ、評価内容に関してもいくつかの方
法で重みをつけることができるので、的確な評価結果を
得ることができる。
【0142】また、Webページ評価のために蓄積され
る各種の詳細情報項目は、指定ドメインごとのオントロ
ジ構築の基礎データとして利用することができる。オン
トロジ構築には、各分野の専門家の非常に高度な知識を
必要とするため、これまでは、オントロジを容易に作成
することはできなかった。さらに、時代に応じて変化し
ていく流れを適宜汲み取ってオントロジのメンテナンス
を行うには、非常に大きなコストを必要とする。しか
し、本発明の技術を用いることで、これらの基本作業を
容易に実現できるようになる。
【0143】新たなWebページ構築に関しては、これ
までのようなブラウジング機能や見栄え的な構築支援で
はなく、指定ドメインにおいて抽出された詳細情報項目
によるWebページ構築支援を行うことができる。We
bページ作成インタフェースの充実は不可欠であるが、
現在のようにWebページが日々増え続けている状況に
おいては、詳細情報項目に関する構築支援が特に重要な
役割を果たす。
【図面の簡単な説明】
【図1】本発明の評価装置の構成図である。
【図2】処理フローを示す図である。
【図3】学習部の処理を示す図である。
【図4】タグ判定の対象データを示す図である。
【図5】Webページのデータを示す図である。
【図6】タグクリーニング後のデータを示す図である。
【図7】ディレクトリ情報を示す図である。
【図8】評価セット群を示す図(その1)である。
【図9】評価セット群を示す図(その2)である。
【図10】評価セット群を示す図(その3)である。
【図11】評価セット群を示す図(その4)である。
【図12】評価セット群を示す図(その5)である。
【図13】評価セット群を示す図(その6)である。
【図14】タグ付与後のデータを示す図である。
【図15】会社概要の詳細化を示す図である。
【図16】製品情報の詳細化を示す図である。
【図17】項目名称のオントロジを示す図(その1)で
ある。
【図18】項目名称のオントロジを示す図(その2)で
ある。
【図19】項目名称のオントロジを示す図(その3)で
ある。
【図20】洗練・整理済評価セット群を示す図(その
1)である。
【図21】洗練・整理済評価セット群を示す図(その
2)である。
【図22】洗練・整理済評価セット群を示す図(その
3)である。
【図23】洗練・整理済評価セット群を示す図(その
4)である。
【図24】洗練・整理済評価セット群を示す図(その
5)である。
【図25】洗練・整理済評価セット群を示す図(その
6)である。
【図26】生成部の処理を示す図である。
【図27】重み処理された指定ドメイン評価セットを示
す図(その1)である。
【図28】重み処理された指定ドメイン評価セットを示
す図(その2)である。
【図29】重み処理された指定ドメイン評価セットを示
す図(その3)である。
【図30】重み処理された指定ドメイン評価セットを示
す図(その4)である。
【図31】重み処理された指定ドメイン評価セットを示
す図(その5)である。
【図32】重み処理された指定ドメイン評価セットを示
す図(その6)である。
【図33】評価部の処理を示す図である。
【図34】情報発信項目の評価を示す図(その1)であ
る。
【図35】情報発信項目の評価を示す図(その2)であ
る。
【図36】詳細情報項目の評価を示す図である。
【図37】結果処理部の処理を示す図である。
【図38】構築支援部の処理を示す図である。
【図39】情報処理装置の構成図である。
【図40】記録媒体を示す図である。
【符号の説明】
21 学習部 22 生成部 23 評価部 24 結果処理部 25 構築支援部 26 評価セット群 27、121 指定ドメイン評価セット 31 評価項目抽出 32 体系化 33 ディレクトリ情報 34 情報抽出ルールを用いた洗練 35 項目名称の統一・標準化 36 オントロジ 41 ドメイン指定絞込み 42 必要項目の追加・修正 43 カテゴリ間の重み処理 44 項目レベルの重み処理 51 Webページの評価 52 単純スコア計算 53 URL階層を含むスコア計算 54 項目の順序によるスコア計算 55 情報抽出結果のスコア計算 56 抽出結果の記述の広がりを含むスコア計算 61 評価スコア算出 結果表示 62 項目名支援 63 項目名改善処理 64 発信内容支援 65 改善アクション 66 発信内容改善結果予測 67 発信内容改善作業支援 68 特殊情報提示 71 ドメイン対応Webページ作成 72 メタ情報の生成 73 メタ情報によるWebページ作成 81 クリーニング部 82 項目抽出部 83 体系整理部 84 体系対応処理部 85 情報抽出部 86 項目のゆれチェック部 91、131 情報発信項目 92 体系化済情報発信項目 93 評価セット群 94 情報抽出ルール 95、132 詳細情報項目 96 洗練・整理済評価セット群 111、115 カテゴリ選択部 112 部分体系選択部 113 項目追加部 114 カテゴリ作成部 116、118 重み付与部 117 項目選択部 122 重み処理された指定ドメイン評価セット 141 項目チェック部 142 階層チェック部 143 抽出内容チェック部 144 広がりチェック部 145 順序チェック部 151 Webページの評価結果 161 発信項目評価部 162 抽出内容評価部 163 項目順序評価部 164 項目名評価部 165、173 改善処理部 166 改善結果予測部 167 改善作業支援部 168 特殊情報処理部 171 メタ情報抽出部 172 メタ情報提示部 181 CPU 182 メモリ 183 入力装置 184 出力装置 185 外部記憶装置 186 媒体駆動装置 187 ネットワーク接続装置 188 バス 189 可搬記録媒体 190 サーバ 191 データベース
───────────────────────────────────────────────────── フロントページの続き (72)発明者 西野 文人 神奈川県川崎市中原区上小田中4丁目1番 1号 富士通株式会社内 Fターム(参考) 5B075 KK07 ND20 NK02 NK44 NR02 NR20 PQ02 PQ42

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 生成手段が、格納手段に格納されたイン
    ターネット上の複数のドメインと複数の評価項目の対応
    関係を参照して、該複数の評価項目のうち指定されたド
    メインに対応する評価項目を抽出し、抽出された評価項
    目からなる評価セットを生成し、 評価手段が、前記評価セットに含まれる評価項目を用い
    て評価対象ウェブページの評価スコアを計算し、 出力手段が、前記評価スコアを含む評価結果を出力する
    ことを特徴とするウェブページ評価方法。
  2. 【請求項2】 学習手段が、ウェブページ群の情報から
    あらかじめ設定されている情報発信項目を評価項目とし
    て抽出することにより、前記複数のドメインと複数の評
    価項目の対応関係を学習して、前記格納手段に格納する
    ことを特徴とする請求項1記載のウェブページ評価方
    法。
  3. 【請求項3】 前記学習手段が、前記情報発信項目の内
    容情報を分析して該内容情報から詳細情報項目を抽出
    し、該詳細情報項目を評価項目に追加することを特徴と
    する請求項2記載のウェブページ評価方法。
  4. 【請求項4】 前記学習手段が、前記評価対象ウェブペ
    ージの内容情報を分析して詳細情報項目を抽出し、前記
    評価手段が、前記評価セットに含まれる各詳細情報項目
    が該評価対象ウェブページから抽出された詳細情報項目
    の中に存在するか否かをチェックして、前記評価スコア
    を計算することを特徴とする請求項3記載のウェブペー
    ジ評価方法。
  5. 【請求項5】 前記学習手段が、前記格納手段に格納さ
    れたウェブページ群のカテゴリの体系を表すディレクト
    リ情報を参照して、該ディレクトリ情報に含まれるカテ
    ゴリごとに前記情報発信項目を分類することで、前記複
    数のドメインと複数の評価項目の対応関係を学習するこ
    とを特徴とする請求項2記載のウェブページ評価方法。
  6. 【請求項6】 前記生成手段が、前記ディレクトリ情報
    に含まれる複数のカテゴリから選択された1つ以上のカ
    テゴリを前記指定されたドメインと解釈し、該選択され
    たカテゴリに属する評価項目を抽出して、抽出された評
    価項目とカテゴリの対応関係を含む評価セットを生成す
    ることを特徴とする請求項5記載のウェブページ評価方
    法。
  7. 【請求項7】 結果処理手段が、前記評価対象ウェブペ
    ージに新たな評価項目を追加した場合の評価スコアの変
    化を予測し、前記出力手段が、予測結果を出力すること
    を特徴とする請求項1記載のウェブページ評価方法。
  8. 【請求項8】 構築支援手段が、前記評価セットに含ま
    れる評価項目を用いて、前記指定されたドメインにおけ
    る新たなウェブページを作成するためのメタ情報を生成
    し、前記出力手段が、該メタ情報を出力することを特徴
    とする請求項1記載のウェブページ評価方法。
  9. 【請求項9】 あらかじめ格納されたインターネット上
    の複数のドメインと複数の評価項目の対応関係を参照し
    て、該複数の評価項目のうち指定されたドメインに対応
    する評価項目を抽出し、抽出された評価項目からなる評
    価セットを生成し、 前記評価セットに含まれる評価項目を用いて評価対象ウ
    ェブページの評価スコアを計算し、 前記評価スコアを含む評価結果を出力する処理をコンピ
    ュータに実行させることを特徴とするプログラム。
  10. 【請求項10】 インターネット上の複数のドメインと
    複数の評価項目の対応関係を格納する格納手段と、 前記複数のドメインと複数の評価項目の対応関係を参照
    して、該複数の評価項目のうち指定されたドメインに対
    応する評価項目を抽出し、抽出された評価項目からなる
    評価セットを生成する生成手段と、 前記評価セットに含まれる評価項目を用いて評価対象ウ
    ェブページの評価スコアを計算する評価手段と、 前記評価スコアを含む評価結果を出力する出力手段とを
    備えることを特徴とするウェブページ評価装置。
JP2002313711A 2002-03-06 2002-10-29 ウェブページを評価する装置および方法 Pending JP2003330948A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2002313711A JP2003330948A (ja) 2002-03-06 2002-10-29 ウェブページを評価する装置および方法
US10/327,027 US7395498B2 (en) 2002-03-06 2002-12-24 Apparatus and method for evaluating web pages
GB0300084A GB2386218A (en) 2002-03-06 2003-01-03 Apparatus and method for evaluating web pages
CNB031063888A CN1257470C (zh) 2002-03-06 2003-02-26 评价网页的装置和方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2002060507 2002-03-06
JP2002-60507 2002-03-06
JP2002313711A JP2003330948A (ja) 2002-03-06 2002-10-29 ウェブページを評価する装置および方法

Publications (1)

Publication Number Publication Date
JP2003330948A true JP2003330948A (ja) 2003-11-21

Family

ID=26625702

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002313711A Pending JP2003330948A (ja) 2002-03-06 2002-10-29 ウェブページを評価する装置および方法

Country Status (4)

Country Link
US (1) US7395498B2 (ja)
JP (1) JP2003330948A (ja)
CN (1) CN1257470C (ja)
GB (1) GB2386218A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006164256A (ja) * 2004-11-12 2006-06-22 Yafoo Japan Corp 属性評価プログラム、属性評価システムおよび属性評価方法
US7246041B2 (en) 2004-07-05 2007-07-17 International Business Machines Corporation Computer evaluation of contents of interest
JP2015228173A (ja) * 2014-06-02 2015-12-17 一般社団法人日本コミュニケーション&マナー協会 マナー点数算出システム

Families Citing this family (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6859784B1 (en) * 1999-09-28 2005-02-22 Keynote Systems, Inc. Automated research tool
US6832245B1 (en) 1999-12-01 2004-12-14 At&T Corp. System and method for analyzing communications of user messages to rank users and contacts based on message content
US7624172B1 (en) 2000-03-17 2009-11-24 Aol Llc State change alerts mechanism
US9736209B2 (en) 2000-03-17 2017-08-15 Facebook, Inc. State change alerts mechanism
US7774711B2 (en) 2001-09-28 2010-08-10 Aol Inc. Automatic categorization of entries in a contact list
JP4090320B2 (ja) * 2002-09-30 2008-05-28 富士通株式会社 配信情報管理方法および情報管理サーバ
US8965964B1 (en) 2002-11-18 2015-02-24 Facebook, Inc. Managing forwarded electronic messages
US7428580B2 (en) 2003-11-26 2008-09-23 Aol Llc Electronic message forwarding
US8701014B1 (en) 2002-11-18 2014-04-15 Facebook, Inc. Account linking
US7640306B2 (en) 2002-11-18 2009-12-29 Aol Llc Reconfiguring an electronic message to effect an enhanced notification
US7590696B1 (en) 2002-11-18 2009-09-15 Aol Llc Enhanced buddy list using mobile device identifiers
AU2003287671A1 (en) 2002-11-18 2004-06-15 America Online, Inc. People lists
US8122137B2 (en) 2002-11-18 2012-02-21 Aol Inc. Dynamic location of a subordinate user
US7899862B2 (en) 2002-11-18 2011-03-01 Aol Inc. Dynamic identification of other users to an online user
US8005919B2 (en) 2002-11-18 2011-08-23 Aol Inc. Host-based intelligent results related to a character stream
US7949759B2 (en) 2003-04-02 2011-05-24 AOL, Inc. Degrees of separation for handling communications
US7945674B2 (en) 2003-04-02 2011-05-17 Aol Inc. Degrees of separation for handling communications
US7263614B2 (en) 2002-12-31 2007-08-28 Aol Llc Implicit access for communications pathway
US8538895B2 (en) * 2004-03-15 2013-09-17 Aol Inc. Sharing social network information
US9742615B1 (en) * 2002-12-31 2017-08-22 Aol Inc. Popularity index
JP3981729B2 (ja) * 2003-03-12 2007-09-26 独立行政法人情報通信研究機構 キーワード強調装置及びプログラム
WO2004084096A1 (ja) * 2003-03-19 2004-09-30 Fujitsu Limited 事例分類装置および方法
US8117265B2 (en) 2003-03-26 2012-02-14 Aol Inc. Identifying and using identities deemed to be known to a user
US7653693B2 (en) 2003-09-05 2010-01-26 Aol Llc Method and system for capturing instant messages
US8898239B2 (en) 2004-03-05 2014-11-25 Aol Inc. Passively populating a participant list with known contacts
CN1702651A (zh) * 2004-05-24 2005-11-30 富士通株式会社 特定类型信息文件的识别方法和装置
US9002949B2 (en) 2004-12-01 2015-04-07 Google Inc. Automatically enabling the forwarding of instant messages
US7730143B1 (en) 2004-12-01 2010-06-01 Aol Inc. Prohibiting mobile forwarding
US8060566B2 (en) 2004-12-01 2011-11-15 Aol Inc. Automatically enabling the forwarding of instant messages
GB2425195A (en) * 2005-04-14 2006-10-18 Yosi Heber Website analysis method
US8316446B1 (en) 2005-04-22 2012-11-20 Blue Coat Systems, Inc. Methods and apparatus for blocking unwanted software downloads
WO2006137564A1 (ja) * 2005-06-24 2006-12-28 Justsystems Corporation 文書処理装置
EP1770550A1 (en) * 2005-10-03 2007-04-04 Sony Ericsson Mobile Communications AB Method and electronic device for obtaining an evaluation of an electronic document
US8650506B2 (en) * 2005-11-10 2014-02-11 International Business Machines Corporation Use of extensible object data to represent a fully qualified solution order
US7877392B2 (en) 2006-03-01 2011-01-25 Covario, Inc. Centralized web-based software solutions for search engine optimization
US8166027B2 (en) * 2006-03-30 2012-04-24 International Business Machines Corporation System, method and program to test a web site
DE102006036304A1 (de) * 2006-08-03 2008-02-07 Universität Karlsruhe (Th) Verfahren zum Analysieren und/oder Testen zumindest einer Benutzeroberfläche, Datenverarbeitungseinrichtung und Computerprogrammprodukt
US8972379B1 (en) 2006-08-25 2015-03-03 Riosoft Holdings, Inc. Centralized web-based software solution for search engine optimization
US8838560B2 (en) * 2006-08-25 2014-09-16 Covario, Inc. System and method for measuring the effectiveness of an on-line advertisement campaign
US8943039B1 (en) 2006-08-25 2015-01-27 Riosoft Holdings, Inc. Centralized web-based software solution for search engine optimization
US9058608B2 (en) * 2007-09-12 2015-06-16 Google Inc. Placement attribute targeting
US8341267B2 (en) * 2008-09-19 2012-12-25 Core Wireless Licensing S.A.R.L. Memory allocation to store broadcast information
US20100138760A1 (en) * 2008-12-03 2010-06-03 International Business Machines Corporation Method and system for providing auto-navigation of a service registry and repository in service-oriented architecture
US8396742B1 (en) 2008-12-05 2013-03-12 Covario, Inc. System and method for optimizing paid search advertising campaigns based on natural search traffic
JP5359399B2 (ja) * 2009-03-11 2013-12-04 ソニー株式会社 テキスト分析装置および方法、並びにプログラム
GB2487573A (en) * 2011-01-28 2012-08-01 Clickscene Ltd Apparatus and method for obtaining data relating to a website retrieves a stored recommendation depending on determined values
JP5254402B2 (ja) * 2011-06-07 2013-08-07 株式会社東芝 注目評価対象抽出装置及びプログラム
US9348846B2 (en) 2012-07-02 2016-05-24 Google Inc. User-navigable resource representations
US9633103B2 (en) * 2013-09-30 2017-04-25 Wal-Mart Stores, Inc. Identifying product groups in ecommerce
CN103544257B (zh) * 2013-10-15 2017-01-18 北京国双科技有限公司 网页质量检测方法和装置
US9489470B1 (en) 2015-01-26 2016-11-08 Content Analytics, Inc. System and method for generating content comparison reports
CN106487845A (zh) * 2015-08-28 2017-03-08 百度在线网络技术(北京)有限公司 站点评价的展示方法和装置
CN108665306B (zh) * 2018-05-04 2021-05-25 合肥工业大学 核心竞争产品识别方法和系统、存储介质
CN108629023A (zh) * 2018-05-09 2018-10-09 北京京东金融科技控股有限公司 数据挖掘方法、装置以及计算机可读存储介质
IT202000005716A1 (it) * 2020-03-18 2021-09-18 Mediavoice S R L Metodo di navigazione di una risorsa mediante interazione vocale

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5991756A (en) * 1997-11-03 1999-11-23 Yahoo, Inc. Information retrieval from hierarchical compound documents
JPH11259524A (ja) 1998-03-06 1999-09-24 Omron Corp 情報検索システム、情報検索システムにおける情報処理方法および記録媒体
US6260064B1 (en) * 1999-01-08 2001-07-10 Paul J. Kurzrok Web site with automatic rating system
US6990628B1 (en) * 1999-06-14 2006-01-24 Yahoo! Inc. Method and apparatus for measuring similarity among electronic documents
US6816857B1 (en) * 1999-11-01 2004-11-09 Applied Semantics, Inc. Meaning-based advertising and document relevance determination
US6647381B1 (en) * 1999-10-27 2003-11-11 Nec Usa, Inc. Method of defining and utilizing logical domains to partition and to reorganize physical domains
US6751612B1 (en) * 1999-11-29 2004-06-15 Xerox Corporation User query generate search results that rank set of servers where ranking is based on comparing content on each server with user query, frequency at which content on each server is altered using web crawler in a search engine
US6785671B1 (en) * 1999-12-08 2004-08-31 Amazon.Com, Inc. System and method for locating web-based product offerings
JP2001243147A (ja) 2000-03-01 2001-09-07 Indigo Corp ホームページ評価システム
AU2001251281A1 (en) 2000-04-03 2001-10-15 Usablenet, Inc. System and method for evaluating an optimizing web site attributes
US6983320B1 (en) * 2000-05-23 2006-01-03 Cyveillance, Inc. System, method and computer program product for analyzing e-commerce competition of an entity by utilizing predetermined entity-specific metrics and analyzed statistics from web pages
US20020040311A1 (en) * 2000-10-04 2002-04-04 John Douglass Web browser page rating system
GB2368670A (en) 2000-11-03 2002-05-08 Envisional Software Solutions Data acquisition system
US7305622B2 (en) * 2000-12-05 2007-12-04 Clickfox, Llc Graphical user interface and web site evaluation tool for customizing web sites
US20020122078A1 (en) * 2000-12-07 2002-09-05 Markowski Michael J. System and method for organizing, navigating and analyzing data
JP2002183324A (ja) * 2000-12-11 2002-06-28 Dokonjo Soft:Kk 提案されたテーマに関して提供された情報の閲覧や評価を可能とするとともに、これら提案や提供、閲覧及び評価に伴うユーザのポイント管理を行うインターネット上のwwwサーバ、及びそのサーバの運用方法
EP1402408A1 (en) 2001-07-04 2004-03-31 Cogisum Intermedia AG Category based, extensible and interactive system for document retrieval
US6918066B2 (en) * 2001-09-26 2005-07-12 International Business Machines Corporation Method and system for evaluating applications on different user agents
US7599911B2 (en) * 2002-08-05 2009-10-06 Yahoo! Inc. Method and apparatus for search ranking using human input and automated ranking
US20060036598A1 (en) * 2004-08-09 2006-02-16 Jie Wu Computerized method for ranking linked information items in distributed sources

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7246041B2 (en) 2004-07-05 2007-07-17 International Business Machines Corporation Computer evaluation of contents of interest
JP2006164256A (ja) * 2004-11-12 2006-06-22 Yafoo Japan Corp 属性評価プログラム、属性評価システムおよび属性評価方法
JP2015228173A (ja) * 2014-06-02 2015-12-17 一般社団法人日本コミュニケーション&マナー協会 マナー点数算出システム

Also Published As

Publication number Publication date
CN1442803A (zh) 2003-09-17
US7395498B2 (en) 2008-07-01
GB2386218A (en) 2003-09-10
GB0300084D0 (en) 2003-02-05
US20030172349A1 (en) 2003-09-11
CN1257470C (zh) 2006-05-24

Similar Documents

Publication Publication Date Title
JP2003330948A (ja) ウェブページを評価する装置および方法
Rahman et al. A personalized group-based recommendation approach for Web search in E-learning
Zhang et al. Predicting the helpfulness of online product reviews: A multilingual approach
US8762404B2 (en) Information search system, method, and program, and information search service providing method
US8386482B2 (en) Method for personalizing information retrieval in a communication network
CN106874467B (zh) 用于提供搜索结果的方法和装置
Mahmud et al. Csurf: a context-driven non-visual web-browser
CN100533430C (zh) 用于消除文档的一部分的歧义的方法和设备
US20080097937A1 (en) Distributed method for integrating data mining and text categorization techniques
CN103339623A (zh) 涉及因特网搜索的方法和设备
KR20030091751A (ko) 분배 데이터베이스의 문서 분류 및 제시용 방법 및 장치
JP6509718B2 (ja) 文書分類装置、文書分類方法、及び文書分類プログラム
CN106776860A (zh) 一种搜索摘要生成方法及装置
Huang et al. Leveraging the crowd to improve feature-sentiment analysis of user reviews
CN107526718A (zh) 用于生成文本的方法和装置
KR101667199B1 (ko) 키워드 검색을 통한 웹 페이지의 상대적 품질 지수 평가 장치
Fuad et al. Analysis and classification of mobile apps using topic modeling: A case study on Google Play Arabic apps
JP2007172249A (ja) 文書分類プログラム、文書分類装置、および文書分類方法
Prajwal et al. Universal semantic web assistant based on sequence to sequence model and natural language understanding
JP5138621B2 (ja) 情報処理装置及び不満解決商品発見方法及びプログラム
Feng et al. Webtalk: Mining websites for automatically building dialog systems
JP5197491B2 (ja) 行動推薦装置及び方法及びプログラム
CN112084406A (zh) 短信处理方法、装置、电子设备和存储介质
JPWO2020054822A1 (ja) 音解析装置及びその処理方法、プログラム
JP2012093870A (ja) システム開発における要求獲得支援システム、要求獲得支援方法およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050112

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050114

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080108

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080122

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080228

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080729