JP2003330948A - ウェブページを評価する装置および方法 - Google Patents
ウェブページを評価する装置および方法Info
- Publication number
- JP2003330948A JP2003330948A JP2002313711A JP2002313711A JP2003330948A JP 2003330948 A JP2003330948 A JP 2003330948A JP 2002313711 A JP2002313711 A JP 2002313711A JP 2002313711 A JP2002313711 A JP 2002313711A JP 2003330948 A JP2003330948 A JP 2003330948A
- Authority
- JP
- Japan
- Prior art keywords
- evaluation
- web page
- items
- item
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 31
- 238000011156 evaluation Methods 0.000 claims abstract description 514
- 238000012545 processing Methods 0.000 claims abstract description 61
- 239000000284 extract Substances 0.000 claims abstract description 13
- 230000005540 biological transmission Effects 0.000 claims description 59
- 238000010276 construction Methods 0.000 claims description 21
- 230000008569 process Effects 0.000 claims description 18
- 238000003860 storage Methods 0.000 claims description 18
- 230000008859 change Effects 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 34
- 238000000605 extraction Methods 0.000 description 33
- 230000006872 improvement Effects 0.000 description 26
- 238000004364 calculation method Methods 0.000 description 20
- 230000006870 function Effects 0.000 description 14
- 238000004140 cleaning Methods 0.000 description 13
- 230000010365 information processing Effects 0.000 description 11
- 238000004458 analytical method Methods 0.000 description 8
- 238000012937 correction Methods 0.000 description 7
- 230000014509 gene expression Effects 0.000 description 7
- 230000008520 organization Effects 0.000 description 6
- 239000000047 product Substances 0.000 description 6
- 239000002537 cosmetic Substances 0.000 description 5
- 230000009471 action Effects 0.000 description 4
- 238000000926 separation method Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 238000003058 natural language processing Methods 0.000 description 3
- 238000007670 refining Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000003796 beauty Effects 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000000428 dust Substances 0.000 description 1
- 238000012854 evaluation process Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 244000144972 livestock Species 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2216/00—Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
- G06F2216/03—Data mining
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
つ客観的に評価する。 【解決手段】 学習部21は、インターネット上のWe
bページ群からドメインと評価項目の対応関係を学習
し、評価セット群26を生成する。生成部22は、指定
されたドメインに対応する評価項目を評価セット群26
から抽出し、指定ドメイン評価セット27を生成する。
評価部23は、評価セット27に基いて評価対象Web
ページを評価し、結果処理部24は、得られた評価結果
を提示する。
Description
のウェブ(Web)ページで発信されている情報を評価
する装置および方法に関する。
bページは、通常、トップページとそれにリンクされた
階層構造の複数のページからなり、それぞれのページに
発信情報が含まれている。全世界で20から40億くら
いあると言われているWebページの現状において、企
業や個人が同じ目的を持ったドメインで的確な情報発信
を行うためには、単にWebページのアクセス数を増や
すための工夫や、表面上の形式を整えるだけでは不十分
である。さらには、キーワードを用いた検索技術も日々
発展していることから、検索されるWebページにおい
ても発信内容の充実が重要である。
る情報の内容に踏み込んだ評価が必要であり、それらの
結果をフィードバックしてWebページの価値を高め、
完成度を高める必要がある。
に閲覧者への情報発信のためだけでなく、今後、情報抽
出や情報要約等の技術開発が進められていく中で、これ
らの開発技術を支える対象であるWebコンテンツの充
実を図るためにも必須である。なぜなら、情報抽出や情
報要約は、それぞれの対象となる情報がWebページ上
で発信されていることを前提としているからである。
の電子情報に示されるように、英語圏を中心にすでにい
くつか提案されている。 J. Alexander and M. A. Tate, Evaluating Web Resour
ces, 1996. http://www2.widener.edu/Wolfgram-Memorial-Library/
webevaluation/webeval.htm この評価基準は、一般の印刷物に対する評価項目に対し
て、Webの特性を付加したものである。例えば、We
bの現状を考慮し、新たな視点を加えたチェックリスト
を作成したものとして、「チェックリストを使ったWe
bページの批判的評価とその効果」というものがある。
また、一方では、Webページの価値は如何に多くの閲
覧者にそのページを見てもらうかにあるという立場か
ら、Webページが開かれるまでの時間によってWeb
ページを評価することも考えられている。さらには、多
くの登録メンバに対してアンケートを依頼することでW
ebページを評価する試みもすでに実用化されている。
ebページの記述内容にまで踏み込んでおらず、表面的
な評価や主観的な評価が中心になっている。したがっ
て、評価者の価値判断の変化や状況に応じて評価値が変
わってしまう等の問題を含んでいる。
つ客観的に評価する装置および方法を提供することであ
る。
価装置は、格納手段、生成手段、評価手段、および出力
手段を備える。
メインと複数の評価項目の対応関係を格納する。生成手
段は、格納手段に格納された対応関係を参照して、複数
の評価項目のうち指定されたドメインに対応する評価項
目を抽出し、抽出された評価項目からなる評価セットを
生成する。評価手段は、生成された評価セットに含まれ
る評価項目を用いて評価対象Webページの評価スコア
を計算し、出力手段は、得られた評価スコアを含む評価
結果を出力する。
め格納しておくことで、ユーザが任意のドメインを指定
したとき、生成手段は、そのドメインに対応する具体的
な評価項目を自動的に抽出することができる。これによ
り、指定ドメインに応じて異なる評価セットが生成さ
れ、評価手段は、同じ評価対象Webページに対して、
指定ドメインに応じて異なる評価スコアを算出する。
的な評価結果を得ることができ、ドメインを変更すれば
異なる評価結果を得ることができる。また、どのユーザ
が評価装置を使用しても、指定ドメインが同じであれば
同じ評価結果が得られる。したがって、評価対象Web
ページを具体的かつ客観的に評価することが可能とな
る。
部記憶装置185に対応し、ドメインと評価項目の対応
関係は、例えば、後述する図3の洗練・整理済評価セッ
ト群96に対応する。また、生成手段および評価手段
は、例えば、後述する図1の生成部22および評価部2
3に対応し、出力手段は、例えば、図39の出力装置1
84に対応する。
明の実施の形態を詳細に説明する。Webページを作成
する場合、作成者側の容易性や、どれだけ多くの人の目
に触れるようにするか、どのような表現構成をとるべき
か等の観点から、ツールやアプリケーションの提供が行
われている。
観点が必要となるが、すでに数多くの同じようなWeb
ページが存在し、さらに毎日増え続けている現状では、
これらのツールやアプリケーションだけでは、情報発信
を目的とするWebページの作成や維持には直接的な効
果を与えることができない。このためには、発信情報の
内容に踏み込んだ支援ツールやアプリケーションが必要
となる。
の3つの機能が必要である。 (a)評価すべき対象ドメインの内容に関する評価項目
を詳細に整理する。 (b)整理された評価項目に対して、客観的に評価する
ためのスコア判定を行う。 (c)評価結果は、発信側や閲覧側等の様々な観点で分
析でき、その要望に対して容易に対処できる必要があ
る。
のWebページ評価装置は、Webページで情報発信さ
れている内容をそのドメインの評価セットとして整理す
ることで、評価セットに応じてWebページのコンサル
テーションを行う。この評価方法は、これまでのチェッ
クシートやアンケート等によるWebページの全般的な
評価(見易さ、分かりやすさ等)ではなく、各発信情報
の内容に踏み込んだ評価を行う方法である。以下では、
(a)〜(c)の機能を有するWebページ評価装置の
構成と動作について、順を追って説明する。
る。図1の評価装置は、例えば、情報処理装置(コンピ
ュータ)を用いて構成され、学習部21、生成部22、
評価部23、結果処理部24、および構築支援部25を
備える。そして、情報発信しているWebページを、そ
の発信内容を基に指定ドメインの評価セットを用いて評
価する機能と、評価結果に基いてWebページを改善す
る機能とを有する。
ページ群から評価項目を学習する。このとき、評価に用
いられるすべての項目を抽出して整理し、評価セット群
26を生成する。評価セットは、各Webページの評価
項目の集合であり、情報発信項目と詳細情報項目からな
る。これらの評価項目は、評価セット内において、イン
ターネット上のドメインと対応付けられている。
信すべき情報としてあらかじめ設定された基本項目であ
り、詳細情報項目は、情報発信項目以外で、内容情報の
細かい分析によって得られる項目である。評価セットと
しては、情報発信項目のみを用いてもよく、情報発信項
目と詳細情報項目の両方を用いてもよい。情報発信項目
としては、例えば、Webページ内であらかじめタグ付
けされたデータが抽出される。
表されている情報に対して自然言語処理を行い、表現さ
れている内容を詳細に抽出することで得られた単位情報
が用いられる。自然言語処理としては、例えば、テキス
ト表現にパターンマッチのルールを用いて新たなタグを
付与する処理や、テキスト表現から形態素解析により抽
出された形態素とその品詞の組み合わせのうち、名詞と
判定された形態素を抽出する処理が考えられる。
の評価セットを評価セット群26から抽出し、評価項目
を整理して、指定ドメイン評価セット27を生成する。
評価部23は、評価対象のWebページが与えられる
と、指定ドメイン評価セット27を用いてその内容を評
価し、評価結果を出力する。結果処理部24は、評価結
果をユーザに提示するとともに、評価結果に基いてWe
bページの内容を改善するための処理を行う。また、構
築支援部25は、指定ドメイン評価セット27を用いて
新たなWebページの構築を支援する。
ドメインを指定し、指定ドメインに特化した評価セット
を用いて、Webページを具体的かつ客観的に評価する
ことが可能となる。また、評価結果の提示やWebペー
ジの改善を行うまでの処理をスムーズに進めることがで
きる。評価装置のユーザには、情報の発信者および閲覧
者の両方が含まれる。
理のフローを示している。まず、学習部21は、Web
ページ群から評価項目を学習する際に、Webページの
クリーニング技術や形態素解析技術等を用いて、Web
ページから情報発信項目を抽出し(31)、それらを評
価セットとしてデータベースに登録する。これにより、
Webページ群の評価セット群26が生成される。
序に収集するだけでは、選択利用する場合に混乱するこ
とが予想される。そこで、学習部21は、Webページ
群の体系(ドメインの体系)を整理したディレクトリ情
報33を用いて、体系に含まれるカテゴリごとに情報発
信項目を整理・分類し(32)、評価セットを生成す
る。
容に踏み込んだ評価を行うには不十分である。そこで、
学習部21は、内容分析技術である情報抽出や情報要約
等が対象としている内容の要素も評価項目として活用す
ることで、記述されている内容まで深く扱えるように項
目を洗練して、洗練された評価セット群を生成する(3
4)。
らなる評価セット群に対して、あらかじめ用意されてい
る情報抽出ルール(テキストから情報を抽出するための
ルール)等の内容分析技術を適用して、詳細情報項目を
抽出し、評価セット群26を拡張する。
報項目では、同じものに対して様々な表記が用いられて
いることがあり、このままでは正確な評価を行うことが
困難である。そこで、学習部21は、体系のカテゴリご
とのオントロジ(同義語辞書)36を用いて表記のゆれ
をなくし(統一化し)、評価項目を整理する(35)。
例えば、体系で整理されたカテゴリごとの情報発信項目
に関して、そのカテゴリに依存するオントロジ36を用
いて項目名称の統一化・標準化を行うことで、評価セッ
ト群26が統一化・標準化される。
された複数のカテゴリから必要ないくつかのカテゴリを
選択することで、ドメインを指定し、生成部22は、評
価セット群26から指定ドメインの評価セット27を生
成する(41)。このように、あらかじめ整理された体
系をもとに評価対象のドメインを限定することで、ドメ
インに依存した評価結果を得ることが可能となる。
た評価項目だけでは、そのドメインの発信情報の評価を
行うには不十分な場合がある。そこで、最新の動向や新
しい方向性、要望等に合わせて必要な項目を追加した
り、抽出された項目を修正したりする機能を設ける(4
2)。
セット27に対して、必要な項目(必須とされているも
の、期待されているもの)を追加することができる。追
加項目は、例えば、そのドメインの業界全体の流れや、
関係者および関心のある顧客等へのアンケート等から、
新たな項目として抽出される。
項目に対して、カテゴリごとに評価の重みを変えたい場
合がある。このような場合に対応できるように、カテゴ
リ単位で重みを与える機能を設ける(43)。この重み
の与え方としては、例えば、カテゴリ単位に算出関数を
設定する方法等が挙げられる。
も、評価観点等の違いにより、評価項目ごとに評価の重
みを変えたい場合もある。このような場合に対応できる
ように、指定ドメイン評価セット27の評価項目単位に
重みを与える機能を設ける(44)。
提供企業側、顧客側、企業を活用する立場、情報収集す
る立場等が設定できる。これらの観点に応じて、項目ご
とに重要度に差異が生まれるため、それらを各項目に与
える重みで調整する。また、各Webページの順位(ラ
ンキング)を用いて、ランキングの高いページ同士の項
目の共通性によって重みを与えることも可能である。こ
の場合のランキングとしては、リンクされているWeb
ページの数による重要度ランキングや、一般の人気度ラ
ンキング等が挙げられる。
うな処理を行うことで、評価対象となる各ドメインの評
価項目が、発信情報の内容にまで踏み込んで具体的かつ
詳細に整理される。
ット27の評価項目により、評価対象Webページを評
価する(51)。評価結果は、指定されたドメインに対
して定量的な情報として出力される必要があるので、評
価スコアが算出される。評価スコアの計算方法としては
いくつかの方法が考えられ、ユーザは任意の計算方法を
指定することができる。
評価セット27の各情報発信項目について、評価対象W
ebページにおけるその項目の有無をチェックし、存在
する項目の数から単純に評価スコアを算出する(5
2)。
r)階層を含むスコア計算では、ユーザの利便性という
観点を評価スコアに組み込むために、各情報発信項目の
情報を含むページに対して、トップページからの階層
(リンク)の深さを考慮しながら、評価スコアを算出す
る(53)。
指定ドメイン評価セット27の評価項目の評価対象We
bページにおける表示順序を用いて、評価スコアを算出
する(54)。項目の表示順序は、メニュー内やポップ
アップウインドウ内等における項目の位置から求めるこ
とができ、評価スコアは、指定ドメイン内で算出された
一般的な順序を基準として算出することができる。
定ドメイン評価セット27の各詳細情報項目について、
評価対象Webページにおけるその項目の有無をチェッ
クし、存在する項目の数から評価スコアを算出する(5
5)。このとき、評価対象Webページの内容分析を実
際に行うことで、対応する詳細情報項目の有無が判断さ
れる。
ア計算では、詳細情報項目に対してもユーザの利便性と
いう観点を踏まえるために、各詳細情報項目の情報を含
むページに対して、トップページからの階層の深さや内
容分析における記述位置の広がりを考慮しながら、評価
スコアを算出する(56)。
行うことで、整理された評価項目に対して客観的なスコ
ア判定が行われる。次に、結果処理部24は、算出され
た評価スコアを評価結果として画面に表示する(6
1)。
示された評価結果について、ユーザに誤った理解を起こ
させてしまう可能性がある。そこで、それぞれのWeb
ページが、対応するドメインにおいて、一般に使用され
ている表記とは異なるものを用いている場合の支援(指
示)を行う機能を設ける(62)。
ドメイン評価セット27におけるカテゴリごとの評価項
目に関して、そのカテゴリに依存するオントロジを用い
て、項目名称に対する修正への示唆(アドバイス)を提
示する。これにより、ユーザは、適切な項目名称の修正
を行うことができる。
イスを提示する代わりに、この修正を自動的に行うイン
タフェースを起動することもできる。この場合、システ
ム側からの指示に従って、同じドメインでの表記のゆれ
が積極的に修正される(63)。
における評価結果が定量的に得られるが、得られた評価
に対してユーザ(発信者)が改善アクションを起こした
い場合には、具体的にどの項目やどんな内容に問題があ
るのかを認識する必要がある。そこで、結果処理部24
は、スコアを低くしている具体的な評価項目や内容を、
Webページの改善方法として提示する(64)。
して、どの項目を改善すると評価結果が定量的にどのよ
うに変化するかが分かれば、改善効果を認識した上で作
業の順序等の予定を立てることが可能になる。そこで、
結果処理部24は、各項目の改善結果が評価スコアに与
える影響を予測して提示する(66)。例えば、実際に
いくつかの情報発信項目を追加した場合の新たな評価ス
コアが算出され、その値が提示される。
シミュレーションだけでなく、実際に入力インタフェー
スを起動して、改善作業(必要な項目の追加や発信内容
の修正等)をユーザに行わせることもできる(67)。
この場合、起動された入力インタフェースは、改善作業
のための入力フォームを自動的に表示する。
べき情報がどれだけ含まれているか(あるいは欠けてい
るか)を主な評価結果として提示しているが、他のWe
bページにはない評価対象Webページ独自の発信情報
が存在するかどうかも、Webページの管理者にとって
は有用な情報になる。このような情報は、評価処理の途
中で副産物として収集することができる。
評価セット27の評価項目以外の項目を特殊情報として
提示し、それが奇抜な項目、集客力のある項目、無駄な
項目等に対応する旨のアドバイスを行う(68)。
うことで、評価結果を、発信者や閲覧者等の様々な観点
で分析することができ、その要望に対して容易に対処す
ることが可能となる。
メインに対応する新たなWebページを構築するための
支援を行う(71)。新たなWebページを作成する場
合、どのような項目配置や表現方法を採用するか等の支
援が必要となり、実際に多数の作成支援ツールが用いら
れている。しかし、指定されたドメインにおいて、どの
ような内容の情報発信を行うべきか等の支援は行われて
いない。
の評価のために生成された情報を利用して指定ドメイン
での新たなWebページを作成し、情報発信を行いたい
と考えているユーザに対して、どのような項目や内容情
報があればよいかを提示することができる。
ことでドメインを指定し、構築支援部25は、指定ドメ
インの評価セット27から情報発信の基本メタ情報を生
成して、ユーザに提示する(72)。この基本メタ情報
としては、標準的なタグセットやXML(eXtensible M
arkup Language)のDTD(Document Type Definition
)等が提示される。
提示するだけでなく、実際に入力インタフェースを起動
して、基本メタ情報に応じて実際にWebページを作成
するための情報入力作業をユーザに行わせることもでき
る(73)。起動された入力インタフェースは、基本メ
タ情報に合わせて情報を入力するための入力フォームを
自動的に表示する。
うことで、発信者は、指定ドメインの評価項目に対応す
る情報を含むWebページを効率よく作成することがで
きる。
ら、図2に示した各処理の具体例を説明する。図3は、
学習部21の処理を示している。図3の学習部21は、
クリーニング部81、項目抽出部82、体系整理部8
3、体系対応処理部84、情報抽出部85、および項目
のゆれチェック部86を備え、インターネット上のWe
bページ群を入力として、洗練・整理済評価セット群9
6を出力する。Webページからの評価項目の抽出と抽
出した評価項目の体系化が、学習部21の重要な機能で
ある。
ーニングを行って、Webページの情報から不必要なタ
グやゴミを排除する。このWebクリーニングにより、
Webページ上に表示されているバナー広告や動画・静
止画情報等、テキスト処理の対象にならない部分が排除
される。
の情報に対してタグ判定、タグクリーニング、形態素処
理、品詞判定等を行って、タグ付けされた情報を情報発
信項目91として抽出する。タグ判定は、Webページ
で表示されるメニュー項目のタグを抽出する処理であ
る。例えば、図4に示すようなデータが与えられた場
合、imgタグ内で用いられているaltデータ等が抽
出対象となる。また、タグクリーニングは、与えられた
データからタグを排除する処理である。
まれる会社概要に関する記述部分を示している。このよ
うなデータが与えられた場合、タグクリーニングによ
り、TABLE、TR、TD、B等のタグが排除され
る。例えば、このデータの101の部分についてタグク
リーニングを行うと、図6のようなデータが抽出され
る。
一般的である形態素解析をテキスト情報の部分に適用
し、分割された単位を対象として、評価項目となり得る
候補を抽出する処理である。また、品詞判定は、例え
ば、形態素処理によって分割された単位情報の品詞を判
定して、特定の品詞を評価項目となり得る候補として抽
出する処理である。ここでは、例えば、名詞と判定され
た単位情報のうち、N個(例えば、3個)以上出現する
ものが、候補として抽出される。
bページ群の体系をディレクトリ情報33として整理
し、格納しておく。ディレクトリ情報33は、Webペ
ージ群のカテゴリを体系化した情報であり、学習結果で
ある評価セット群93の評価項目の整理に活用される。
ている。このディレクトリ情報は、カテゴリ1〜6の6
階層で階層化された構造を有し、各カテゴリは、その下
位に位置する他のカテゴリを包含する。例えば、カテゴ
リ1の「産業」は最上位の階層に対応し、カテゴリ6の
「M社」等は最下位の階層に対応する。また、「第一次
産業」のカテゴリは、「農業」、「漁業」、「畜産
業」、「林業」、および「狩猟業」の各カテゴリを包含
している。
ディレクトリ情報33の体系のどの部分に対応するかを
調べて、各項目と対応するカテゴリを組にした体系化済
情報発信項目92を生成し、評価セット群93として格
納する。
Webページから評価項目(情報発信項目)を抽出する
ことで生成された評価セット群93の例を示している。
抽出された情報発信項目は、すべてのWebページに共
通な共通項目と、各カテゴリに特有な特有項目と、各W
ebページに特有な個別項目とに分類される。
る企業の名称、URL、および共通項目を示しており、
図9は、それらの企業の特有項目および個別項目を示し
ている。また、図10は、「化粧品メーカ」のカテゴリ
に属する企業の名称、URL、および共通項目を示して
おり、図11は、それらの企業の特有項目および個別項
目を示している。さらに、図12は、「自動車メーカ」
のカテゴリに属する企業の名称、URL、および共通項
目を示しており、図13は、それらの企業の特有項目お
よび個別項目を示している。
目および個別項目の記載順序は、対応する図8、10、
および12における企業名の記載順序に対応している。
次に、情報抽出部85は、あらかじめ格納されている情
報抽出ルール94を用いて、Webページの情報から詳
細情報項目95を抽出し、評価セット群93の情報発信
項目に追加する。ここでは、Webページの情報に新た
なタグを付与することで、詳細情報項目が抽出される。
報抽出ルールを用いてタグを付与した場合、図14のよ
うなデータが得られる。図14においては、発表主体組
織情報、創業情報、要素1、創業年月日、設立情報、設
立年月日、不定組織補足情報、他情報、社長情報、資本
金情報、および従業員情報のタグが新たに付与されてい
る。この処理により、創業年月日、設立年月日、社長情
報、資本金情報、従業員情報等が詳細情報項目として抽
出される。
目を詳細化して得られる詳細情報項目の例を示してい
る。ここでは、「会社概要」の項目で発信されている内
容情報に対して情報抽出ルールを適用することで、社
名、所在地、電話番号、代表者(社長)、資本金、創業
年、設立年、従業員数等の詳細情報項目が抽出されてい
る。
発信項目を詳細化して得られる詳細情報項目の例を示し
ている。ここでは、「製品情報」の項目で発信されてい
る内容情報に対して情報抽出ルールを適用することで、
製品名、種別情報、製品補足情報、製造製品情報、製造
組織情報、製造組織補足情報等の詳細情報項目が抽出さ
れている。
項目を詳細化することで、評価セット群93の評価項目
が洗練される。次に、項目のゆれチェック部86は、オ
ントロジ36を用いて名称統一処理を行い、項目名のゆ
れを排除する。これにより、評価セット群93の項目名
がカテゴリごとに代表的な項目名に統一され、項目名の
標準化が実現される。
している。図17、18、および19は、それぞれ「食
品メーカ」、「化粧品メーカ」、および「自動車メー
カ」のカテゴリに属する各項目の代表名と、対応する候
補の名称を示している。代表名は、例えば、これまでの
各項目名の出現個数を基準として選定される。
として生成される洗練・整理済評価セット群96の例を
示している。これらの図では、「食品メーカ」、「化粧
品メーカ」、および「自動車メーカ」の各カテゴリの評
価セットと、企業単位の評価セットがリストアップされ
ている。ただし、ここでは、便宜的に情報発信項目のみ
が示されており、これらの項目は、共通トップメニュー
の表現と、業界別特有項目と、その他のメニューとに分
類される。
名称、トップページの構造(top構造)、および共通
トップメニューの表現を示しており、図21は、それら
の企業の業界別特有項目およびその他のメニューを示し
ている。また、図22は、「化粧品メーカ」に属する企
業の名称、トップページの構造、および共通トップメニ
ューの表現を示しており、図23は、それらの企業の業
界別特有項目およびその他のメニューを示している。さ
らに、図24は、「自動車メーカ」に属する企業の名
称、トップページの構造、および共通トップメニューの
表現を示しており、図25は、それらの企業の業界別特
有項目およびその他のメニューを示している。
別特有項目およびその他のメニューの記載順序は、対応
する図20、22、および24における企業名の記載順
序に対応している。
は、「食品メーカ」、「化粧品メーカ」、および「自動
車メーカ」のカテゴリごとに、「新着」、「リリース」
等の代表項目名が付加されている。
学」、「topテキストメッセージ」等の代表項目名が
付加されており、図23においては、「美容」、「ファ
ッション」等の代表項目名が付加されており、図25に
おいては、「工場見学」、「リコール」等の代表項目名
が付加されている。
ている。図26の生成部22は、カテゴリ選択部11
1、部分体系選択部112、項目追加部113、カテゴ
リ作成部114、カテゴリ選択部115、重み付与部1
16、項目選択部117、および重み付与部118を備
え、洗練・整理済評価セット群96を入力として、重み
処理された指定ドメイン評価セット122を出力する。
メイン評価セット121を選択するためには、ドメイン
指定と項目の追加・修正の機能が重要になる。ユーザ
は、ドメインを指定する際、カテゴリ選択部111を用
いて、体系化されている評価セットの個々のカテゴリを
選択することができ、部分体系選択部112を用いてよ
り上位の階層のカテゴリを指定することで、カテゴリの
まとまりを選択することができる。個々のカテゴリは、
個々のWebページのURLに対応し、カテゴリのまと
まりは、複数のWebページの集合に対応する。
下位の階層に含まれる1つ以上のカテゴリが選択された
場合、選択されたすべてのカテゴリがドメインとして指
定される。また、部分体系選択部112を用いて、より
上位の階層のカテゴリが指定された場合は、指定された
カテゴリとそれに包含される下位のカテゴリがドメイン
として指定される。したがって、カテゴリ選択部111
と部分体系選択部112を用いることで、必要な個々の
カテゴリをピックアップしたり、体系構造のあるまとま
った部分を選択したりして、ドメインを指定することが
できる。
価項目が洗練・整理済評価セット群96から抽出され、
指定ドメイン評価セット121が生成される。また、既
存のWebページから抽出された評価項目だけでは不十
分な場合、ユーザは、項目追加部113およびカテゴリ
作成部114を用いて、指定ドメイン評価セット121
の評価項目の追加・修正を行う。このとき、項目追加部
113は、ユーザが入力した項目を個々のカテゴリに追
加する。また、カテゴリ作成部114は、カテゴリ内の
項目からユーザが指定したものを削除したり、カテゴリ
名をユーザが指定した名称に変更したりする処理を行
う。
各評価項目に重要度を与えて扱えるようにするために
は、カテゴリの重み処理と項目の重み処理が重要な機能
になる。カテゴリの重み処理では、ユーザは、カテゴリ
選択部115を用いて重みを付与する対象カテゴリを選
択し、重み付与部116を用いて付与する重みを指定す
る。また、項目の重み処理では、ユーザは、項目選択部
117を用いて重みを付与する対象項目を選択し、重み
付与部118を用いて付与する重みを指定する。これに
より、重み処理された指定ドメイン評価セット122が
生成される。
イン評価セット122の例を示している。ただし、ここ
では、図20〜25に示した評価セット群のすべてのカ
テゴリがドメインとして指定された場合を想定してい
る。
別特有項目およびその他のメニューの記載順序は、対応
する図27、29、および31における企業名の記載順
序に対応している。
は、企業名のカテゴリごとに、カテゴリの重みが付与さ
れており、共通topメニューの表現の項目ごとに、項
目の重みが付与されている。さらに、図28、30、お
よび32においては、業界別特有項目ごとに、項目の重
みが付与されている。
一部のカテゴリのみがドメインとして指定された場合
は、指定された部分の評価項目のみが抽出され、指定ド
メイン評価セット121と重み処理された指定ドメイン
評価セット122が生成される。例えば、「食品メー
カ」がドメインとして指定された場合、重み処理された
指定ドメイン評価セット122は、図27および28に
示された評価項目から構成される。
ている。評価部23の前処理として、図3のクリーニン
グ部81と項目抽出部82により、評価対象Webペー
ジから情報発信項目131が抽出され、情報抽出部85
により、評価対象Webページから詳細情報項目132
が抽出される。そして、項目のゆれチェック部86によ
り、これらの項目の名称が統一され、評価対象Webペ
ージにおける整理された評価対象項目が準備される。
41、階層チェック部142、抽出内容チェック部14
3、広がりチェック部144、および順序チェック部1
45を備え、重み処理された指定ドメイン評価セット1
22と情報発信項目131および詳細情報項目132を
入力として、Webページの評価結果151を出力す
る。
42は、情報発信項目レベルの処理を行い、抽出内容チ
ェック部143と広がりチェック部144は、詳細情報
項目レベルの処理を行う。また、順序チェック部145
は、これらの両方の項目に関する処理を行う。
有無をチェックして、単純スコア計算を行う。このと
き、評価セット122内の各情報発信項目に対応する内
容情報が、評価対象Webページから抽出された評価対
象項目に含まれているか否かをチェックする。そして、
存在する項目の項目チェック値を1とし、存在しない項
目の項目チェック値を0とする。また、各項目に付与さ
れている重みがあれば、それを考慮して各項目のスコア
を算出する。
に、1〜10の整数値により10ランクの重みが付与さ
れている場合、項目の有無を表す項目チェック値に、
(項目の重み/10)を掛けてスコアが算出される。し
たがって、評価スコアは、次式により算出される。
して各企業のWebページを評価した場合における情報
発信項目の項目チェック値の例を示している。図34
は、各企業のWebページにおける共通トップメニュー
の表現の項目チェック値を示しており、図35は、その
Webページにおける業界別特有項目の項目チェック値
を示している。
を行って、評価対象Webページにおける情報発信項目
の階層位置をチェックし、その結果に基いてスコア計算
を行う。このとき、評価対象Webページのトップペー
ジの出現階層を1として、各情報発信項目の出現階層
(深さ)を算出する。そして、項目チェック値に出現階
層の逆数を掛けて、各項目のスコアを算出する。この場
合、評価スコアは、次式により算出される。
の重み/10)*(1/出現階層) 評価スコア=各項目のスコアの合計/項目数 抽出内容チェック部143は、詳細情報項目の有無をチ
ェックして、抽出結果を含めたスコア計算を行う。この
とき、評価セット122内の各詳細情報項目に対応する
内容情報が、評価対象Webページから抽出された評価
対象項目に含まれているか否かをチェックする。そし
て、項目チェック部141による単純スコア計算と同様
のアルゴリズムで、評価スコアを算出する。
ページにおける詳細情報項目の項目チェック値の例を示
している。ここでは、「企業名」、「資本金」等の各項
目について項目チェック値が示されている。
の位置や記述の広がりをチェックして、スコア計算を行
う。このとき、評価対象Webページにおいて、関連が
ある複数の詳細情報項目同士の並び順や、それらの項目
の間の離れ度を算出する。離れ度は、項目間にどれだけ
他の項目が存在するかを表し、項目間に他の項目が存在
しない場合は1とする。そして、項目チェック値に離れ
度の逆数を掛けて、各項目のスコアを算出する。この場
合、評価スコアは、次式により算出される。
の重み/10)*(1/離れ度) 評価スコア=各項目のスコアの合計/項目数 例えば、「郵便番号」と「住所」が詳細情報項目として
抽出された場合、これらの項目が互いに近くにあれば評
価スコアは高くなり、逆に離れていれば評価スコアは低
くなる。
よび詳細情報項目の表示順序をチェックして、スコア計
算を行う。このとき、評価セット122の評価項目の評
価対象Webページにおける順序(メニュー項目の並び
等)を取得し、その順序を基本順序と比較して、評価ス
コアを算出する。基本順序は、例えば、指定ドメインの
Webページの項目からあらかじめ算出しておくものと
する。
らに各カテゴリに付与されている重みがあれば、それも
考慮してスコア計算を行う。この場合、例えば、項目チ
ェック値*(項目の重み/10)の値に(カテゴリの重
み/10)を掛けて、各項目のスコアが算出される。
結果的に、情報発信項目レベルの評価スコアと、詳細情
報項目レベルの評価スコアと、項目順序による評価スコ
アの3種類の値がそれぞれ算出される。このうち、情報
発信項目レベルと詳細情報項目レベルの評価スコアにつ
いては、項目数に応じた平均処理を行うことが可能であ
る。
示している。図37の結果処理部24は、発信項目評価
部161、抽出内容評価部162、項目順序評価部16
3、項目名評価部164、改善処理部165、改善結果
予測部166、改善作業支援部167、および特殊情報
処理部168を備え、Webページの評価結果151を
入力としてユーザに評価結果を提示し、Webページの
改善作業を支援する。
ベルの評価スコアと、各情報発信項目のスコアを提示
し、抽出内容評価部162は、詳細情報項目レベルの評
価スコアと、各詳細情報項目のスコアを提示する。ま
た、項目順序評価部163は、項目順序による評価スコ
アを提示する。
コアも合わせて提示することで、ユーザは、評価の低い
項目を容易に認識し、改善アクションをとることができ
る。例えば、項目のスコアが0であれば、対応する項目
がWebページに存在しないことが分かるので、その項
目を追加することでWebページが改善される。
ける項目名の表記ゆれを表示し、オントロジを用いて適
切な代表項目名を求め、それを修正候補として提示す
る。これにより、ユーザは、提示された代表項目名への
修正を容易に行うことができる。さらに、改善処理部1
65は、表記ゆれの修正を行うインタフェースを起動
し、起動されたインタフェースは、代表項目名への修正
を自動的に行う。
れる項目の改善結果を予測して提示する。例えば、項目
のスコアが0である情報発信項目があれば、その項目を
仮想的に追加した場合のスコア計算を評価部23に依頼
し、得られた評価結果をユーザに提示する。さらに、改
善作業支援部167は、このような改善作業を支援する
ために、入力インタフェースを起動する。起動された入
力インタフェースは、入力フォームを自動的に表示し、
ユーザが入力した変更をWebページに反映させる。
を行って、Webページに評価項目以外の項目(差分項
目)が含まれているか否かをチェックし、差分項目が含
まれていれば、それを特殊情報として表示する。これに
より、ユーザは、指定ドメインにはない独自の情報が発
信されていることを認識できる。
示している。図38の構築支援部25は、メタ情報抽出
部171、メタ情報提示部172、および改善処理部1
73を備え、重み処理された指定ドメイン評価セット1
22を入力として、新たなWebページを構築するため
の支援を行う。
2の評価項目から指定ドメインにおけるメタ情報(タグ
セット、DTD等)を生成し、メタ情報提示部172
は、抽出されたメタ情報をユーザに提示する。
を起動し、起動された入力インタフェースは、メタ情報
に基く入力フォームを自動的に表示して、ユーザが入力
した情報を含むWebページを作成する。
39に示すような情報処理装置(コンピュータ)を用い
て構成される。図39の情報処理装置は、CPU(中央
処理装置)181、メモリ182、入力装置183、出
力装置184、外部記憶装置185、媒体駆動装置18
6、およびネットワーク接続装置187を備え、それら
はバス188により互いに接続されている。
nly memory)、RAM(random access memory)等を含
み、処理に用いられるプログラムとデータを格納する。
CPU181は、メモリ182を利用してプログラムを
実行することにより、必要な処理を行う。この場合、図
1の学習部21、生成部22、評価部23、結果処理部
24、および構築支援部25は、メモリ182に格納さ
れたプログラムに対応する。
ポインティングデバイス、タッチパネル等であり、ユー
ザからの指示や情報の入力に用いられる。出力装置18
4は、例えば、ディスプレイ、プリンタ、スピーカ等で
あり、ユーザへの問い合わせや処理結果(評価結果等)
の出力に用いられる。
スク装置、光ディスク装置、光磁気ディスク装置、テー
プ装置等である。情報処理装置は、この外部記憶装置1
85に、上述のプログラムとデータを保存しておき、必
要に応じて、それらをメモリ182にロードして使用す
る。外部記憶装置185は、図2のディレクトリ情報3
3およびオントロジ36を格納するデータベースや、図
3の洗練・整理済評価セット群96を蓄積するデータベ
ースとしても使用される。
9を駆動し、その記録内容にアクセスする。可搬記録媒
体189としては、メモリカード、フレキシブルディス
ク、CD−ROM(compact disk read only memory
)、光ディスク、光磁気ディスク等、任意のコンピュ
ータ読み取り可能な記録媒体が用いられる。ユーザは、
この可搬記録媒体189に上述のプログラムとデータを
格納しておき、必要に応じて、それらをメモリ182に
ロードして使用する。
(Local Area Network)やインターネット等の任意の通
信ネットワークに接続され、通信に伴うデータ変換を行
う。情報処理装置は、上述のプログラムとデータをネッ
トワーク接続装置187を介して他の装置から受け取
り、必要に応じて、それらをメモリ182にロードして
使用する。
ラムとデータを供給することのできるコンピュータ読み
取り可能な記録媒体を示している。可搬記録媒体189
やサーバ190のデータベース191に保存されたプロ
グラムとデータは、メモリ182にロードされる。この
とき、サーバ190は、プログラムとデータを搬送する
搬送信号を生成し、ネットワーク上の任意の伝送媒体を
介して情報処理装置に送信する。そして、CPU181
は、そのデータを用いてそのプログラムを実行し、必要
な処理を行う。
されたインターネット上の複数のドメインと複数の評価
項目の対応関係を参照して、該複数の評価項目のうち指
定されたドメインに対応する評価項目を抽出し、抽出さ
れた評価項目からなる評価セットを生成し、評価手段
が、前記評価セットに含まれる評価項目を用いて評価対
象ウェブページの評価スコアを計算し、出力手段が、前
記評価スコアを含む評価結果を出力することを特徴とす
るウェブページ評価方法。
の情報からあらかじめ設定されている情報発信項目を評
価項目として抽出することにより、前記複数のドメイン
と複数の評価項目の対応関係を学習して、前記格納手段
に格納することを特徴とする付記1記載のウェブページ
評価方法。
ページ群の情報からあらかじめタグ付けされたデータを
前記情報発信項目として抽出することを特徴とする付記
2記載のウェブページ評価方法。
ットに含まれる各情報発信項目が前記評価対象ウェブペ
ージに存在するか否かをチェックして、前記評価スコア
を計算することを特徴とする付記2記載のウェブページ
評価方法。
ットに含まれる各情報発信項目について前記評価対象ウ
ェブページにおけるトップページからの階層の深さを求
めて、前記評価スコアを計算することを特徴とする付記
2記載のウェブページ評価方法。
信項目の内容情報を分析して該内容情報から詳細情報項
目を抽出し、該詳細情報項目を評価項目に追加すること
を特徴とする付記2記載のウェブページ評価方法。
象ウェブページの内容情報を分析して詳細情報項目を抽
出し、前記評価手段が、前記評価セットに含まれる各詳
細情報項目が該評価対象ウェブページから抽出された詳
細情報項目の中に存在するか否かをチェックして、前記
評価スコアを計算することを特徴とする付記6記載のウ
ェブページ評価方法。
ットに含まれる詳細情報項目のうち関連がある詳細情報
項目同士が前記評価対象ウェブページ内でどれだけ離れ
ているかをチェックして、前記評価スコアを算出するこ
とを特徴とする付記6記載のウェブページ評価方法。
段に格納されたウェブページ群のカテゴリの体系を表す
ディレクトリ情報を参照して、該ディレクトリ情報に含
まれるカテゴリごとに前記情報発信項目を分類すること
で、前記複数のドメインと複数の評価項目の対応関係を
学習することを特徴とする付記2記載のウェブページ評
価方法。
レクトリ情報のカテゴリごとのオントロジを用いて前記
評価項目の名称を統一して、前記複数のドメインと複数
の評価項目の対応関係を整理することを特徴とする付記
9記載のウェブページ評価方法。
レクトリ情報に含まれる複数のカテゴリから選択された
1つ以上のカテゴリを前記指定されたドメインと解釈
し、該選択されたカテゴリに属する評価項目を抽出し
て、抽出された評価項目とカテゴリの対応関係を含む評
価セットを生成することを特徴とする付記9記載のウェ
ブページ評価方法。
セットに含まれる評価項目に対してカテゴリ単位で評価
の重みを付与し、前記評価手段が、付与された重みを用
いて前記評価スコアを計算することを特徴とする付記1
1記載のウェブページ評価方法。
セットに含まれるカテゴリごとの評価項目に対して、対
応するカテゴリに依存するオントロジを用いて適切な代
表項目名を求め、前記出力手段が、該代表項目名を修正
候補として出力することを特徴とする付記11記載のウ
ェブページ評価方法。
セットに含まれる評価項目に対して項目単位で評価の重
みを付与し、前記評価手段が、付与された重みを用いて
前記評価スコアを計算することを特徴とする付記1記載
のウェブページ評価方法。
ら指定された評価項目を前記評価セットに追加すること
を特徴とする付記1記載のウェブページ評価方法。 (付記16) 前記評価手段が、前記評価セットに含ま
れる評価項目の前記評価対象ウェブページにおける表示
順序を求めて、前記評価スコアを算出することを特徴と
する付記1記載のウェブページ評価方法。
スコアを低くしている具体的な評価項目を含む評価結果
を出力することを特徴とする付記1記載のウェブページ
評価方法。
対象ウェブページに新たな評価項目を追加した場合の評
価スコアの変化を予測し、前記出力手段が、予測結果を
出力することを特徴とする付記1記載のウェブページ評
価方法。
セットに含まれる評価項目以外の項目が前記評価対象ウ
ェブページに含まれているか否かをチェックし、前記出
力手段が、該評価項目以外の項目を特殊情報として出力
することを特徴とする付記1記載のウェブページ評価方
法。
セットに含まれる評価項目を用いて、前記指定されたド
メインにおける新たなウェブページを作成するためのメ
タ情報を生成し、前記出力手段が、該メタ情報を出力す
ることを特徴とする付記1記載のウェブページ評価方
法。
ドメインと複数の評価項目の対応関係を参照して、該複
数の評価項目のうち指定されたドメインに対応する評価
項目を抽出し、抽出された評価項目からなる評価セット
を生成し、前記評価セットに含まれる評価項目を用いて
評価対象ウェブページの評価スコアを計算し、前記評価
スコアを含む評価結果を提示することを特徴とするウェ
ブページ評価方法。
ターネット上の複数のドメインと複数の評価項目の対応
関係を参照して、該複数の評価項目のうち指定されたド
メインに対応する評価項目を抽出し、抽出された評価項
目からなる評価セットを生成し、前記評価セットに含ま
れる評価項目を用いて評価対象ウェブページの評価スコ
アを計算し、前記評価スコアを含む評価結果を出力する
処理をコンピュータに実行させることを特徴とするプロ
グラム。
グラムを記録した記録媒体であって、該プログラムは、
あらかじめ格納されたインターネット上の複数のドメイ
ンと複数の評価項目の対応関係を参照して、該複数の評
価項目のうち指定されたドメインに対応する評価項目を
抽出し、抽出された評価項目からなる評価セットを生成
し、前記評価セットに含まれる評価項目を用いて評価対
象ウェブページの評価スコアを計算し、前記評価スコア
を含む評価結果を出力する処理を前記コンピュータに実
行させることを特徴とするコンピュータ読み取り可能な
記録媒体。
を搬送する搬送信号であって、該プログラムは、あらか
じめ格納されたインターネット上の複数のドメインと複
数の評価項目の対応関係を参照して、該複数の評価項目
のうち指定されたドメインに対応する評価項目を抽出
し、抽出された評価項目からなる評価セットを生成し、
前記評価セットに含まれる評価項目を用いて評価対象ウ
ェブページの評価スコアを計算し、前記評価スコアを含
む評価結果を出力する処理を前記コンピュータに実行さ
せることを特徴とする搬送信号。
ドメインと複数の評価項目の対応関係を格納する格納手
段と、前記複数のドメインと複数の評価項目の対応関係
を参照して、該複数の評価項目のうち指定されたドメイ
ンに対応する評価項目を抽出し、抽出された評価項目か
らなる評価セットを生成する生成手段と、前記評価セッ
トに含まれる評価項目を用いて評価対象ウェブページの
評価スコアを計算する評価手段と、前記評価スコアを含
む評価結果を出力する出力手段とを備えることを特徴と
するウェブページ評価装置。
者の主観的あるいは表面的な評価にとどまっていたが、
本発明によれば、指定ドメインに特化した評価項目によ
り、Webページを具体的かつ客観的に評価することが
可能となる。
定された項目だけでなく、内容分析により得られる項目
も評価対象として採用することで、より詳細な評価を行
うことができる。さらに、指定ドメインをURLや体系
構造に応じて自由に選択することで、評価項目を柔軟に
設定することができ、評価内容に関してもいくつかの方
法で重みをつけることができるので、的確な評価結果を
得ることができる。
る各種の詳細情報項目は、指定ドメインごとのオントロ
ジ構築の基礎データとして利用することができる。オン
トロジ構築には、各分野の専門家の非常に高度な知識を
必要とするため、これまでは、オントロジを容易に作成
することはできなかった。さらに、時代に応じて変化し
ていく流れを適宜汲み取ってオントロジのメンテナンス
を行うには、非常に大きなコストを必要とする。しか
し、本発明の技術を用いることで、これらの基本作業を
容易に実現できるようになる。
までのようなブラウジング機能や見栄え的な構築支援で
はなく、指定ドメインにおいて抽出された詳細情報項目
によるWebページ構築支援を行うことができる。We
bページ作成インタフェースの充実は不可欠であるが、
現在のようにWebページが日々増え続けている状況に
おいては、詳細情報項目に関する構築支援が特に重要な
役割を果たす。
ある。
ある。
ある。
1)である。
2)である。
3)である。
4)である。
5)である。
6)である。
す図(その1)である。
す図(その2)である。
す図(その3)である。
す図(その4)である。
す図(その5)である。
す図(その6)である。
る。
る。
Claims (10)
- 【請求項1】 生成手段が、格納手段に格納されたイン
ターネット上の複数のドメインと複数の評価項目の対応
関係を参照して、該複数の評価項目のうち指定されたド
メインに対応する評価項目を抽出し、抽出された評価項
目からなる評価セットを生成し、 評価手段が、前記評価セットに含まれる評価項目を用い
て評価対象ウェブページの評価スコアを計算し、 出力手段が、前記評価スコアを含む評価結果を出力する
ことを特徴とするウェブページ評価方法。 - 【請求項2】 学習手段が、ウェブページ群の情報から
あらかじめ設定されている情報発信項目を評価項目とし
て抽出することにより、前記複数のドメインと複数の評
価項目の対応関係を学習して、前記格納手段に格納する
ことを特徴とする請求項1記載のウェブページ評価方
法。 - 【請求項3】 前記学習手段が、前記情報発信項目の内
容情報を分析して該内容情報から詳細情報項目を抽出
し、該詳細情報項目を評価項目に追加することを特徴と
する請求項2記載のウェブページ評価方法。 - 【請求項4】 前記学習手段が、前記評価対象ウェブペ
ージの内容情報を分析して詳細情報項目を抽出し、前記
評価手段が、前記評価セットに含まれる各詳細情報項目
が該評価対象ウェブページから抽出された詳細情報項目
の中に存在するか否かをチェックして、前記評価スコア
を計算することを特徴とする請求項3記載のウェブペー
ジ評価方法。 - 【請求項5】 前記学習手段が、前記格納手段に格納さ
れたウェブページ群のカテゴリの体系を表すディレクト
リ情報を参照して、該ディレクトリ情報に含まれるカテ
ゴリごとに前記情報発信項目を分類することで、前記複
数のドメインと複数の評価項目の対応関係を学習するこ
とを特徴とする請求項2記載のウェブページ評価方法。 - 【請求項6】 前記生成手段が、前記ディレクトリ情報
に含まれる複数のカテゴリから選択された1つ以上のカ
テゴリを前記指定されたドメインと解釈し、該選択され
たカテゴリに属する評価項目を抽出して、抽出された評
価項目とカテゴリの対応関係を含む評価セットを生成す
ることを特徴とする請求項5記載のウェブページ評価方
法。 - 【請求項7】 結果処理手段が、前記評価対象ウェブペ
ージに新たな評価項目を追加した場合の評価スコアの変
化を予測し、前記出力手段が、予測結果を出力すること
を特徴とする請求項1記載のウェブページ評価方法。 - 【請求項8】 構築支援手段が、前記評価セットに含ま
れる評価項目を用いて、前記指定されたドメインにおけ
る新たなウェブページを作成するためのメタ情報を生成
し、前記出力手段が、該メタ情報を出力することを特徴
とする請求項1記載のウェブページ評価方法。 - 【請求項9】 あらかじめ格納されたインターネット上
の複数のドメインと複数の評価項目の対応関係を参照し
て、該複数の評価項目のうち指定されたドメインに対応
する評価項目を抽出し、抽出された評価項目からなる評
価セットを生成し、 前記評価セットに含まれる評価項目を用いて評価対象ウ
ェブページの評価スコアを計算し、 前記評価スコアを含む評価結果を出力する処理をコンピ
ュータに実行させることを特徴とするプログラム。 - 【請求項10】 インターネット上の複数のドメインと
複数の評価項目の対応関係を格納する格納手段と、 前記複数のドメインと複数の評価項目の対応関係を参照
して、該複数の評価項目のうち指定されたドメインに対
応する評価項目を抽出し、抽出された評価項目からなる
評価セットを生成する生成手段と、 前記評価セットに含まれる評価項目を用いて評価対象ウ
ェブページの評価スコアを計算する評価手段と、 前記評価スコアを含む評価結果を出力する出力手段とを
備えることを特徴とするウェブページ評価装置。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002313711A JP2003330948A (ja) | 2002-03-06 | 2002-10-29 | ウェブページを評価する装置および方法 |
US10/327,027 US7395498B2 (en) | 2002-03-06 | 2002-12-24 | Apparatus and method for evaluating web pages |
GB0300084A GB2386218A (en) | 2002-03-06 | 2003-01-03 | Apparatus and method for evaluating web pages |
CNB031063888A CN1257470C (zh) | 2002-03-06 | 2003-02-26 | 评价网页的装置和方法 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002060507 | 2002-03-06 | ||
JP2002-60507 | 2002-03-06 | ||
JP2002313711A JP2003330948A (ja) | 2002-03-06 | 2002-10-29 | ウェブページを評価する装置および方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2003330948A true JP2003330948A (ja) | 2003-11-21 |
Family
ID=26625702
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002313711A Pending JP2003330948A (ja) | 2002-03-06 | 2002-10-29 | ウェブページを評価する装置および方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US7395498B2 (ja) |
JP (1) | JP2003330948A (ja) |
CN (1) | CN1257470C (ja) |
GB (1) | GB2386218A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006164256A (ja) * | 2004-11-12 | 2006-06-22 | Yafoo Japan Corp | 属性評価プログラム、属性評価システムおよび属性評価方法 |
US7246041B2 (en) | 2004-07-05 | 2007-07-17 | International Business Machines Corporation | Computer evaluation of contents of interest |
JP2015228173A (ja) * | 2014-06-02 | 2015-12-17 | 一般社団法人日本コミュニケーション&マナー協会 | マナー点数算出システム |
Families Citing this family (55)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6859784B1 (en) * | 1999-09-28 | 2005-02-22 | Keynote Systems, Inc. | Automated research tool |
US6832245B1 (en) | 1999-12-01 | 2004-12-14 | At&T Corp. | System and method for analyzing communications of user messages to rank users and contacts based on message content |
US7624172B1 (en) | 2000-03-17 | 2009-11-24 | Aol Llc | State change alerts mechanism |
US9736209B2 (en) | 2000-03-17 | 2017-08-15 | Facebook, Inc. | State change alerts mechanism |
US7774711B2 (en) | 2001-09-28 | 2010-08-10 | Aol Inc. | Automatic categorization of entries in a contact list |
JP4090320B2 (ja) * | 2002-09-30 | 2008-05-28 | 富士通株式会社 | 配信情報管理方法および情報管理サーバ |
US8965964B1 (en) | 2002-11-18 | 2015-02-24 | Facebook, Inc. | Managing forwarded electronic messages |
US7428580B2 (en) | 2003-11-26 | 2008-09-23 | Aol Llc | Electronic message forwarding |
US8701014B1 (en) | 2002-11-18 | 2014-04-15 | Facebook, Inc. | Account linking |
US7640306B2 (en) | 2002-11-18 | 2009-12-29 | Aol Llc | Reconfiguring an electronic message to effect an enhanced notification |
US7590696B1 (en) | 2002-11-18 | 2009-09-15 | Aol Llc | Enhanced buddy list using mobile device identifiers |
AU2003287671A1 (en) | 2002-11-18 | 2004-06-15 | America Online, Inc. | People lists |
US8122137B2 (en) | 2002-11-18 | 2012-02-21 | Aol Inc. | Dynamic location of a subordinate user |
US7899862B2 (en) | 2002-11-18 | 2011-03-01 | Aol Inc. | Dynamic identification of other users to an online user |
US8005919B2 (en) | 2002-11-18 | 2011-08-23 | Aol Inc. | Host-based intelligent results related to a character stream |
US7949759B2 (en) | 2003-04-02 | 2011-05-24 | AOL, Inc. | Degrees of separation for handling communications |
US7945674B2 (en) | 2003-04-02 | 2011-05-17 | Aol Inc. | Degrees of separation for handling communications |
US7263614B2 (en) | 2002-12-31 | 2007-08-28 | Aol Llc | Implicit access for communications pathway |
US8538895B2 (en) * | 2004-03-15 | 2013-09-17 | Aol Inc. | Sharing social network information |
US9742615B1 (en) * | 2002-12-31 | 2017-08-22 | Aol Inc. | Popularity index |
JP3981729B2 (ja) * | 2003-03-12 | 2007-09-26 | 独立行政法人情報通信研究機構 | キーワード強調装置及びプログラム |
WO2004084096A1 (ja) * | 2003-03-19 | 2004-09-30 | Fujitsu Limited | 事例分類装置および方法 |
US8117265B2 (en) | 2003-03-26 | 2012-02-14 | Aol Inc. | Identifying and using identities deemed to be known to a user |
US7653693B2 (en) | 2003-09-05 | 2010-01-26 | Aol Llc | Method and system for capturing instant messages |
US8898239B2 (en) | 2004-03-05 | 2014-11-25 | Aol Inc. | Passively populating a participant list with known contacts |
CN1702651A (zh) * | 2004-05-24 | 2005-11-30 | 富士通株式会社 | 特定类型信息文件的识别方法和装置 |
US9002949B2 (en) | 2004-12-01 | 2015-04-07 | Google Inc. | Automatically enabling the forwarding of instant messages |
US7730143B1 (en) | 2004-12-01 | 2010-06-01 | Aol Inc. | Prohibiting mobile forwarding |
US8060566B2 (en) | 2004-12-01 | 2011-11-15 | Aol Inc. | Automatically enabling the forwarding of instant messages |
GB2425195A (en) * | 2005-04-14 | 2006-10-18 | Yosi Heber | Website analysis method |
US8316446B1 (en) | 2005-04-22 | 2012-11-20 | Blue Coat Systems, Inc. | Methods and apparatus for blocking unwanted software downloads |
WO2006137564A1 (ja) * | 2005-06-24 | 2006-12-28 | Justsystems Corporation | 文書処理装置 |
EP1770550A1 (en) * | 2005-10-03 | 2007-04-04 | Sony Ericsson Mobile Communications AB | Method and electronic device for obtaining an evaluation of an electronic document |
US8650506B2 (en) * | 2005-11-10 | 2014-02-11 | International Business Machines Corporation | Use of extensible object data to represent a fully qualified solution order |
US7877392B2 (en) | 2006-03-01 | 2011-01-25 | Covario, Inc. | Centralized web-based software solutions for search engine optimization |
US8166027B2 (en) * | 2006-03-30 | 2012-04-24 | International Business Machines Corporation | System, method and program to test a web site |
DE102006036304A1 (de) * | 2006-08-03 | 2008-02-07 | Universität Karlsruhe (Th) | Verfahren zum Analysieren und/oder Testen zumindest einer Benutzeroberfläche, Datenverarbeitungseinrichtung und Computerprogrammprodukt |
US8972379B1 (en) | 2006-08-25 | 2015-03-03 | Riosoft Holdings, Inc. | Centralized web-based software solution for search engine optimization |
US8838560B2 (en) * | 2006-08-25 | 2014-09-16 | Covario, Inc. | System and method for measuring the effectiveness of an on-line advertisement campaign |
US8943039B1 (en) | 2006-08-25 | 2015-01-27 | Riosoft Holdings, Inc. | Centralized web-based software solution for search engine optimization |
US9058608B2 (en) * | 2007-09-12 | 2015-06-16 | Google Inc. | Placement attribute targeting |
US8341267B2 (en) * | 2008-09-19 | 2012-12-25 | Core Wireless Licensing S.A.R.L. | Memory allocation to store broadcast information |
US20100138760A1 (en) * | 2008-12-03 | 2010-06-03 | International Business Machines Corporation | Method and system for providing auto-navigation of a service registry and repository in service-oriented architecture |
US8396742B1 (en) | 2008-12-05 | 2013-03-12 | Covario, Inc. | System and method for optimizing paid search advertising campaigns based on natural search traffic |
JP5359399B2 (ja) * | 2009-03-11 | 2013-12-04 | ソニー株式会社 | テキスト分析装置および方法、並びにプログラム |
GB2487573A (en) * | 2011-01-28 | 2012-08-01 | Clickscene Ltd | Apparatus and method for obtaining data relating to a website retrieves a stored recommendation depending on determined values |
JP5254402B2 (ja) * | 2011-06-07 | 2013-08-07 | 株式会社東芝 | 注目評価対象抽出装置及びプログラム |
US9348846B2 (en) | 2012-07-02 | 2016-05-24 | Google Inc. | User-navigable resource representations |
US9633103B2 (en) * | 2013-09-30 | 2017-04-25 | Wal-Mart Stores, Inc. | Identifying product groups in ecommerce |
CN103544257B (zh) * | 2013-10-15 | 2017-01-18 | 北京国双科技有限公司 | 网页质量检测方法和装置 |
US9489470B1 (en) | 2015-01-26 | 2016-11-08 | Content Analytics, Inc. | System and method for generating content comparison reports |
CN106487845A (zh) * | 2015-08-28 | 2017-03-08 | 百度在线网络技术(北京)有限公司 | 站点评价的展示方法和装置 |
CN108665306B (zh) * | 2018-05-04 | 2021-05-25 | 合肥工业大学 | 核心竞争产品识别方法和系统、存储介质 |
CN108629023A (zh) * | 2018-05-09 | 2018-10-09 | 北京京东金融科技控股有限公司 | 数据挖掘方法、装置以及计算机可读存储介质 |
IT202000005716A1 (it) * | 2020-03-18 | 2021-09-18 | Mediavoice S R L | Metodo di navigazione di una risorsa mediante interazione vocale |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5991756A (en) * | 1997-11-03 | 1999-11-23 | Yahoo, Inc. | Information retrieval from hierarchical compound documents |
JPH11259524A (ja) | 1998-03-06 | 1999-09-24 | Omron Corp | 情報検索システム、情報検索システムにおける情報処理方法および記録媒体 |
US6260064B1 (en) * | 1999-01-08 | 2001-07-10 | Paul J. Kurzrok | Web site with automatic rating system |
US6990628B1 (en) * | 1999-06-14 | 2006-01-24 | Yahoo! Inc. | Method and apparatus for measuring similarity among electronic documents |
US6816857B1 (en) * | 1999-11-01 | 2004-11-09 | Applied Semantics, Inc. | Meaning-based advertising and document relevance determination |
US6647381B1 (en) * | 1999-10-27 | 2003-11-11 | Nec Usa, Inc. | Method of defining and utilizing logical domains to partition and to reorganize physical domains |
US6751612B1 (en) * | 1999-11-29 | 2004-06-15 | Xerox Corporation | User query generate search results that rank set of servers where ranking is based on comparing content on each server with user query, frequency at which content on each server is altered using web crawler in a search engine |
US6785671B1 (en) * | 1999-12-08 | 2004-08-31 | Amazon.Com, Inc. | System and method for locating web-based product offerings |
JP2001243147A (ja) | 2000-03-01 | 2001-09-07 | Indigo Corp | ホームページ評価システム |
AU2001251281A1 (en) | 2000-04-03 | 2001-10-15 | Usablenet, Inc. | System and method for evaluating an optimizing web site attributes |
US6983320B1 (en) * | 2000-05-23 | 2006-01-03 | Cyveillance, Inc. | System, method and computer program product for analyzing e-commerce competition of an entity by utilizing predetermined entity-specific metrics and analyzed statistics from web pages |
US20020040311A1 (en) * | 2000-10-04 | 2002-04-04 | John Douglass | Web browser page rating system |
GB2368670A (en) | 2000-11-03 | 2002-05-08 | Envisional Software Solutions | Data acquisition system |
US7305622B2 (en) * | 2000-12-05 | 2007-12-04 | Clickfox, Llc | Graphical user interface and web site evaluation tool for customizing web sites |
US20020122078A1 (en) * | 2000-12-07 | 2002-09-05 | Markowski Michael J. | System and method for organizing, navigating and analyzing data |
JP2002183324A (ja) * | 2000-12-11 | 2002-06-28 | Dokonjo Soft:Kk | 提案されたテーマに関して提供された情報の閲覧や評価を可能とするとともに、これら提案や提供、閲覧及び評価に伴うユーザのポイント管理を行うインターネット上のwwwサーバ、及びそのサーバの運用方法 |
EP1402408A1 (en) | 2001-07-04 | 2004-03-31 | Cogisum Intermedia AG | Category based, extensible and interactive system for document retrieval |
US6918066B2 (en) * | 2001-09-26 | 2005-07-12 | International Business Machines Corporation | Method and system for evaluating applications on different user agents |
US7599911B2 (en) * | 2002-08-05 | 2009-10-06 | Yahoo! Inc. | Method and apparatus for search ranking using human input and automated ranking |
US20060036598A1 (en) * | 2004-08-09 | 2006-02-16 | Jie Wu | Computerized method for ranking linked information items in distributed sources |
-
2002
- 2002-10-29 JP JP2002313711A patent/JP2003330948A/ja active Pending
- 2002-12-24 US US10/327,027 patent/US7395498B2/en not_active Expired - Fee Related
-
2003
- 2003-01-03 GB GB0300084A patent/GB2386218A/en not_active Withdrawn
- 2003-02-26 CN CNB031063888A patent/CN1257470C/zh not_active Expired - Fee Related
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7246041B2 (en) | 2004-07-05 | 2007-07-17 | International Business Machines Corporation | Computer evaluation of contents of interest |
JP2006164256A (ja) * | 2004-11-12 | 2006-06-22 | Yafoo Japan Corp | 属性評価プログラム、属性評価システムおよび属性評価方法 |
JP2015228173A (ja) * | 2014-06-02 | 2015-12-17 | 一般社団法人日本コミュニケーション&マナー協会 | マナー点数算出システム |
Also Published As
Publication number | Publication date |
---|---|
CN1442803A (zh) | 2003-09-17 |
US7395498B2 (en) | 2008-07-01 |
GB2386218A (en) | 2003-09-10 |
GB0300084D0 (en) | 2003-02-05 |
US20030172349A1 (en) | 2003-09-11 |
CN1257470C (zh) | 2006-05-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2003330948A (ja) | ウェブページを評価する装置および方法 | |
Rahman et al. | A personalized group-based recommendation approach for Web search in E-learning | |
Zhang et al. | Predicting the helpfulness of online product reviews: A multilingual approach | |
US8762404B2 (en) | Information search system, method, and program, and information search service providing method | |
US8386482B2 (en) | Method for personalizing information retrieval in a communication network | |
CN106874467B (zh) | 用于提供搜索结果的方法和装置 | |
Mahmud et al. | Csurf: a context-driven non-visual web-browser | |
CN100533430C (zh) | 用于消除文档的一部分的歧义的方法和设备 | |
US20080097937A1 (en) | Distributed method for integrating data mining and text categorization techniques | |
CN103339623A (zh) | 涉及因特网搜索的方法和设备 | |
KR20030091751A (ko) | 분배 데이터베이스의 문서 분류 및 제시용 방법 및 장치 | |
JP6509718B2 (ja) | 文書分類装置、文書分類方法、及び文書分類プログラム | |
CN106776860A (zh) | 一种搜索摘要生成方法及装置 | |
Huang et al. | Leveraging the crowd to improve feature-sentiment analysis of user reviews | |
CN107526718A (zh) | 用于生成文本的方法和装置 | |
KR101667199B1 (ko) | 키워드 검색을 통한 웹 페이지의 상대적 품질 지수 평가 장치 | |
Fuad et al. | Analysis and classification of mobile apps using topic modeling: A case study on Google Play Arabic apps | |
JP2007172249A (ja) | 文書分類プログラム、文書分類装置、および文書分類方法 | |
Prajwal et al. | Universal semantic web assistant based on sequence to sequence model and natural language understanding | |
JP5138621B2 (ja) | 情報処理装置及び不満解決商品発見方法及びプログラム | |
Feng et al. | Webtalk: Mining websites for automatically building dialog systems | |
JP5197491B2 (ja) | 行動推薦装置及び方法及びプログラム | |
CN112084406A (zh) | 短信处理方法、装置、电子设备和存储介质 | |
JPWO2020054822A1 (ja) | 音解析装置及びその処理方法、プログラム | |
JP2012093870A (ja) | システム開発における要求獲得支援システム、要求獲得支援方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050112 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050114 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080108 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080122 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080228 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080729 |