[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JPH11232267A - 頁付けした文書内の頁付けしていないハイパーテキストの捕獲 - Google Patents

頁付けした文書内の頁付けしていないハイパーテキストの捕獲

Info

Publication number
JPH11232267A
JPH11232267A JP10325495A JP32549598A JPH11232267A JP H11232267 A JPH11232267 A JP H11232267A JP 10325495 A JP10325495 A JP 10325495A JP 32549598 A JP32549598 A JP 32549598A JP H11232267 A JPH11232267 A JP H11232267A
Authority
JP
Japan
Prior art keywords
document
markup representation
computer program
physical markup
computer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10325495A
Other languages
English (en)
Inventor
Richard Eric Sweet
エリック スイート リチャード
Edward Royce Warren Rowe
ロイス ワーレン ロー エドワード
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Adobe Inc
Original Assignee
Adobe Systems Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=25517442&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JPH11232267(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Adobe Systems Inc filed Critical Adobe Systems Inc
Publication of JPH11232267A publication Critical patent/JPH11232267A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/114Pagination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/117Tagging; Marking up; Designating a block; Setting of attributes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/134Hyperlinking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/137Hierarchical processing, e.g. outlines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents
    • G06F40/143Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • G06F40/154Tree transformation for tree-structured or markup documents, e.g. XSLT, XSL-FO or stylesheets
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/953Organization of data
    • Y10S707/959Network
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99932Access augmentation or optimizing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

(57)【要約】 【課題】 ある文書の意味論的マークアップ表現を該文
書の物理的マークアップ表現へ変換させる方法及びコン
ピュータプログラムを提供する。 【解決手段】 本発明によれば、文書内の全てのスクリ
ーンオブジェクトをそれらの通常の寸法で表示させるの
に必要な最小幅に等しい論理的最小幅を計算し、該文書
の物理的マークアップ表現で少なくとも該論理的最小幅
と同じ幅を持った物理的マークアップ表現を作成し、且
つ該物理的マークアップ表現をターゲット幅を含むター
ゲット寸法へ適合させる。ターゲット寸法に適合させる
場合に、該論理的最小幅に対するターゲット寸法の要素
の比から派生したスケーリング係数によって該物理的マ
ークアップ表現の幅をスケーリングする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、便利に見るための
ハイパーテキストウエブ頁を捕獲する技術に関するもの
である。
【0002】
【従来の技術】インターネットのワールドワイドウエブ
(「ウエブ」)は、近年、文書情報を発表する一般的な
手段となっている。特に、ウエブへのアクセスを有する
ユーザが、例えばネットスケープナビゲータ(商標)又
はマイクロソフトインターネットエクスプロアラ(商
標)などのハイパーテキストブラウザを使用することに
よってリンクされている文書の集まりを介してブラウズ
することが一般的であり、その場合に、表示されている
文書内のあるスクリーンオブジェクトをユーザが選択す
ると、別の文書の内容が検索され且つユーザに対して表
示される。
【0003】ウエブ上の文書の多くは、ハイパーテキス
トマークアップランゲージ(HTML)として知られる
マークアップ言語を使用してエンコードされている。フ
レーム拡張を有するHTMLバージョン3. 2は、19
97年にワイリーコンピュータパブリシングによって出
版されたGraham著「HTMLソースブック(HT
ML Sourcebook)」、第三版に記載されて
いる。マークアップ言語は、ビデオスクリーン又はプリ
ンタなどの表示装置上にどの様にして表示されるべきか
を記述するために文書内において埋込むことの可能な一
組のコード即ちタグである。HTMLは「意味論的」マ
ークアップ言語として知られているものである。このこ
とは、文書のある物理的特性(例えば行間隔又はフォン
ト寸法)などを設定するためにHTMLを使用すること
が可能なものではあるが、多くのHTMLタグは、例え
ばタイトル、パラグラフ、リスト、テーブルなどの文書
の論理的特徴を単に識別するに過ぎないものであること
を意味している。これらの論理的特徴が表示される精密
な態様は、その文書が表示される時に決定すべくブラウ
ザソフトウエアへ任されている。
【0004】HTMLタグは、しばしば、文書又はその
コンポーネントの固定した物理的寸法を特定するもので
はないので、ブラウザによって表示される特定の文書の
精密な様相は、しばしば、それが表示されるブラウザウ
インドの寸法に依存する。例えば、図1及び2は米国特
許庁(1997年9月現在ユニフォームリソースロケイ
タ(URL)がhttp://www.uspto.g
ov/で特定される)のホームウエブ頁の二つのビュー
を示している。図2においては、ウエブブラウザウイン
ドは図1におけるものよりも著しく小さく、且つ、理解
されるように、これら二つのウインドを介して見られる
ウエブ頁は、例えば、タイトル30及びリスト要素40
の幅に関してその全体的な様相が異なっている。
【0005】HTMLの一つの重要な特徴は、HTML
文書内において外部データ資源を参照することが可能で
あるということである。この様な参照がHTML内にお
いて使用される一つの方法は、そのHTML文書の表示
の一部として表示されるべき内容の発生源である補助文
書を識別することである。例えば、HTMLタグ「IM
G」は、そのIMGタグが見つけられたHTML文書の
表示の一部内において特定された画像文書の内容が表示
されるべきであることを特定する。同様に、HTML文
書内の「FRAME(フレーム)」タグは、特定された
文書の内容がそのHTML文書によって画定されるフレ
ームセットの特定のフレーム内に表示されるべきである
ことを特定する。(HTML内におけるフレーム及びフ
レームセットの使用については後に詳細に説明する。) HTMLは、更に、HTML文書内のハイパーテキスト
リンクを有することが可能であるということを特徴とし
ている。HTML文書内のハイパーテキストリンクは、
スクリーンオブジェクト(例えば、単語又はイメージ)
と外部資源との間の関連性を形成する。HTML文書が
ブラウザによって表示されると、ユーザはそのスクリー
ンオブジェクトを選択することが可能であり、且つブラ
ウザは外部資源からの内容を検索し且つ表示することに
よって応答する。ハイパーテキストリンクは、例えば、
HREF属性を有するHTMLアンカータグでHTML
文書内において特定することが可能である。
【0006】HTML内のこの様な外部参照の使用は、
ワイドエリアネットワーク(WAN)上での分散型文書
格納を容易なものとさせる。大型の文書を分断し且つ外
部参照によって論理的に関連付けされた一組のより小さ
な文書として格納することが可能である。例えば、HT
ML文書内のグラフィックイメージを別々の文書として
格納することが一般的である(例えば、GIF又はJP
EGフォーマットにおいて)。又、大きなテキストの複
数個のセクションを別々の文書として格納すること、及
びハイパーテキストリンクを使用することによって一つ
のセクションから別のセクションへ移動することを容易
とさせることも一般的である。
【0007】更に、一組の予め存在する文書をHTML
タグでリンクさせて一貫性のある統一体を形成すること
も可能である。例えば、共通の主題に関連する一組の予
め存在する文書に対してハイパーテキストリンクを含む
HTML文書を作成し、ユーザによってこの様な文書を
体系的にレビューすることを容易なものとさせることが
可能である。
【0008】HTML文書の一つの特徴は、該文書が頁
付けされていないということである。即ち、HTML文
書の表示された「高さ」は、それを見るために使用され
るブラウザによって表示された場合に、その中に画定さ
れるスクリーンオブジェクトの配列及び量によってのみ
決定されるものであって、その文書に関連している何ら
の固定した頁寸法によって決定されるものではない。
(尚、「頁寸法」は、例えば、用紙上に印刷された物理
的な頁のことを必ずしも言及するものではなく、単に、
その文書の内容が固定した寸法で一連の領域へ分割され
る電子的文書の特性であるに過ぎない。)表示された文
書がブラウザウインドの高さに入らない場合には、ブラ
ウザはウエブ頁がスクロールして付加的な内容を見るこ
とを可能とさせる。図3は図2に示した同一のブラウザ
ウインド内に表示されている米国特許庁のホームウエブ
頁を示しているが、その頁は幾分スクロールされて付加
的な材料を表示している点が異なっている。
【0009】最近のHTMLに対してなされた拡張によ
って、単一のブラウザウインド内において複数個のスク
ロール可能であり且つ再寸法設定可能な「フレーム」を
表示させることが可能である。フレームとは、「フレー
ムセット」として知られる特別のタイプのHTML文書
によって画定される。フレームセットはウインド内のフ
レームの寸法及び配向状態を与える情報を与え、且つ各
フレームの内容を特定する。一つのフレームの内容は、
HTML文書の内容か、又は副次的なフレームセット
(即ち、その内容全体がより大きなフレームセットの単
一のフレーム内に表われるフレームセット)とすること
が可能である。他のHTMLスクリーンオブジェクトの
場合と同様に、一つのフレームの高さ又は幅は絶対的又
は相対的な意味で特定することが可能である。
【0010】図4,5,6はHTMLにおけるフレーム
の動作を例示している。図4は二つのフレームを含むフ
レームセットを表示しているブラウザウインドを示して
いる。フレーム50はスクリーンの左側にある狭い垂直
の欄である。フレーム55はフレーム50の右側にある
より幅広の欄である。フレーム50はHTML文書を有
しており、それはブラウザウインドの高さと同じ長さで
あり、一方フレーム55はブラウザウインドの高さより
も一層大きな文書を有している。図5において理解され
るように、フレーム55内に含まれるHTML文書の残
部を表示させるために、フレーム55はフレーム50と
は独立的にスクロールさせることが可能である。
【0011】上の例において、フレーム50は115個
のピクセルからなる固定した幅を有するものとして画定
されており、一方フレーム55の幅はフレーム50の幅
と相対的に画定されており、即ちその幅はブラウザウイ
ンドの幅からフレーム50によって使用されている11
5個のピクセルを差引いたものと等しいものに設定され
ている。図6から理解されるように、ブラウザウインド
がより小さなものとされると、フレーム55はそれに従
って縮小し、一方フレーム50は固定された幅に止どま
る。
【0012】上に説明したように、ブラウザによって表
示されるHTML文書の究極的な様相は、通常、それが
表示されるブラウザウインド(又はフレーム)の寸法に
依存する。一般的に、ウエブブラウザは、HTML文書
から一連のスクリーンオブジェクト(例えば、単語、イ
メージ、リスト、フレーム又はテーブル)を抽出し、且
つそれらをスクリーン上において逐次的に行毎に配置さ
せる。一つの行が満杯となると、次のオブジェクトはそ
れに続く行内に配置される。このプロセスは、HTML
文書内の全てのスクリーンオブジェクトが配置されるま
で継続して行われる。
【0013】しかしながら、この一般的な原理は、表示
されたHTML文書の幅はその中に含まれる最も幅広の
スクリーンオブジェクトの最小幅よりもより小さなもの
とすることはできないという拘束条件によって制限され
る。この拘束条件下において、あるスクリーンオブジェ
クトの最小幅がブラウザウインドの幅よりも一層大きい
ものである場合には、ブラウザウインドを介して見る場
合に、その文書の一部はスクリーンから外れたままであ
り(左又は右)、且つ典型的には、水平スクロールバー
が表示されて、ユーザがその文書のビューを左又は右へ
シフトさせることを可能とする。
【0014】HTMLスクリーンオブジェクトは、固定
されているか又は可変の何れかの幅を有することが可能
である。例えば、HTML文書内のテキストの単一の単
語の幅は固定されている(それを表示するためのブラウ
ザによって選択されているフォントによって与えられ
る)。その幅は、その単語内のキャラクタ及びそれが表
示されるフォント寸法によって決定される。同様に、H
TMLテーブル内のセルの幅は、ある数のピクセルとし
てその幅を明示的に特定することによって固定すること
が可能である。
【0015】これと対比して、可変幅スクリーンオブジ
ェクトの幅は、それが表われるブラウザウインドの幅に
依存して変化する。しかしながら、可変幅スクリーンオ
ブジェクトであっても最小幅を有している。例えば、テ
キストの1個のパラグラフの幅は、通常、ブラウザウイ
ンドの寸法に従って変化するが、それは、該パラグラフ
内に含まれる最も幅広の単語よりも幅狭のものとするこ
とはできない。同様に、イメージを含むテーブルは、そ
の幅が相対的な意味で画定されているセルを有すること
が可能であるが、該テーブルは、それにも拘らず、その
最も幅広の行内のイメージの幅の和よりも小さいものと
することはできない。
【0016】この拘束条件を図7,8,9,10に例示
してある。図7,8,9の各々において、同一のHTM
L文書がブラウザウインド65内に表示されている。そ
の背後に存在するHTMLコードの一部を図10に示し
てある。図7及び10を参照すると、表示されている文
書は上側が揃えられている2個のセルを有するテーブル
80を包含しており、1個のセル85はクライエント側
イメージマップを包含しており且つ他方のセル90は
「US PATENT AND TRADEMARK
OFFICE(米国特許庁)」という見出しと、水平線
と、「New on the PTO site;米国
特許庁サイトでの新しいこと)」という見出しを有する
順番付けされていないリストとを包含している。図8に
おいて、ウインド65は図7におけるよりも一層幅狭で
あるが、スクリーン上のどのオブジェクトの最小幅より
も幅広である。従って、該文書の各線はウインド65の
幅と同じに調節されており且つブラウザウインドの右側
においてユーザから隠されているものは何もない。これ
と対比して、図9においては、ウインド65はテーブル
80の最小幅よりも一層幅狭である。セル85における
イメージマップの固定幅+セル90における最も幅広の
単語の幅(「TRADEMARK」の単語)がブラウザ
ウインド65の幅よりも一層大きいからである。従っ
て、その文書の結果的に得られる表示幅はウインド65
よりも一層幅広であり、該文書の最も右側の部分はビュ
ーから隠れることとなる。
【0017】ウエブ上の視覚的表示データの集まりは、
典型的に、リンクされているHTML文書のセットとし
て格納されるものであるが、例えばポータブルドキュメ
ントフォーマット(PDF)のような物理的マークアッ
プ言語を使用して固定頁寸法を持った単一文書として格
納させることも一般的であり且つ便利である。PDFは
アドビシステムズ、インコーポレイテッドの出版物であ
る「ポータブルドキュメントフォーマット参照マニュア
ル(Portable Document Forma
t Reference Manual)」、アジソン
・ウエズリ出版社、1993年の文献に記載されてい
る。
【0018】
【発明が解決しようとする課題】本発明は、以上の点に
鑑みなされたものであって、上述した如き従来技術の欠
点を解消し、HTMLなどの意味論的マークアップ言語
で記載されている複数個のウエブ頁をPDFなどの物理
的マークアップ言語で記載されている単一の頁付けした
文書内へ統合させることを可能とした技術を提供するこ
とを目的とする。本発明の別の目的とするところは、頁
付けした文書内における頁付けしていないハイパーテキ
ストを捕獲する技術を提供することである。
【0019】
【課題を解決するための手段】一般的に、一つの側面に
おいては、本発明は、一つの文書の意味論的マークアッ
プ表現を該文書の物理的マークアップ表現へ変換する方
法を提供している。本方法は、文書内の全てのスクリー
ンオブジェクトをそれらの通常の寸法で表示するのに必
要な最小幅に等しい論理的最小幅を計算し、該文書の物
理的マークアップ表現であって該論理的最小幅と少なく
とも同じ幅を有する物理的マークアップ表現を作成し、
且つ該物理的マークアップ表現をターゲット幅を含むタ
ーゲット寸法へ適合させ、その場合に該物理的マークア
ップ表現を該論理的最小幅に対する該ターゲット寸法の
要素の比から派生したスケーリング係数によってスケー
リングさせる。本発明の好適実施例では、以下の特徴の
一つ又はそれ以上を有するものである。該物理的マーク
アップ表現は新しく作成した文書内に組込む。該物理的
マークアップ表現は既存の文書内へ組込む。該ターゲッ
ト寸法の該要素はターゲット幅である。該物理的マーク
アップ表現は、各々がそれぞれの物理的幅及びそれぞれ
の物理的高さを持った頁を包含する頁付けした表現であ
る。該ターゲット寸法はターゲット高さを有している。
該ターゲット寸法は標準の用紙寸法である。該標準の用
紙寸法は、8. 5×11インチ、8. 5×14インチ、
A4、A5、11×17インチのうちの一つである。該
物理的マークアップ表現の頁はターゲット寸法と同一の
アスペクト比を有している。該物理的マークアップ表現
の高さは、該スケーリング係数によってスケーリングさ
れる。該物理的マークアップ表現の頁高さは該スケーリ
ング係数によってスケーリングされる。該ターゲット寸
法の要素はターゲット高さである。該物理的マークアッ
プ表現の頁は+又は−90°だけ回転される。論理的最
小幅に対するターゲット幅の比は、それが特定したスレ
ッシュホールド未満であるか否かテストする。該文書は
複数個のフレームを特定するフレームセットである。該
文書は少なくとも1個のハイパーテキストリンクを包含
しており、該物理的マークアップ表現はビュア内に表示
され、且つ表示されたマークアップからハイパーテキス
トリンクがユーザによって選択される場合に外部文書が
アクセスされる。該ハイパーテキストリンクはサーバ側
イメージマップである。該意味論的マークアップ表現は
HTMLである。該物理的マークアップ表現はPDFで
ある。該物理的マークアップ表現がターゲット寸法へ適
合された後に、該物理的マークアップ表現は、該スケー
リング係数の逆数によってスケーリングされ且つその結
果がビュア内に表示される。
【0020】一般的に、別の側面においては、本発明は
ハイパーテキストデータを表示する方法を提供してい
る。本方法は、ビュア内において、物理的マークアップ
表現で表現されており且つ少なくとも1個のハイパーテ
キストリンクを包含する第一文書を表示し、ハイパーテ
キストリンクが該表示された第一文書からユーザによっ
て選択される場合に外部文書へアクセスし、該外部文書
の意味論的マークアップ表現を物理的マークアップ表現
へ変換し、且つ該外部文書の物理的マークアップ表現を
該第一文書内に組込む、ことを包含している。本発明の
好適実施例は、以下の特徴の一つ又はそれ以上を有して
いる。ハイパーテキストリンクは外部文書の物理的マー
クアップ表現へポイントするように修正される。該ハイ
パーテキストリンクの元の状態が保存される。該第一文
書の一部を削除する動作に応答して、該削除された部分
に対してポイントするハイパーテキストリンクがその元
の状態へ復帰される。該外部文書が要約されて該外部文
書のダイジェストを作成し、且つ該外部文書のダイジェ
ストは、該外部文書の物理的マークアップ表現が既に該
第一文書内に組込まれているか否かを決定するためにテ
ストされる。該外部文書は、主要文書と1個又はそれ以
上の補助文書とを有している。各補助文書は要約されて
それぞれの補助文書ダイジェストを作成し、且つ各補助
文書のデジタルダイジェストは、該外部文書の物理的マ
ークアップ表現が既に該第一文書内に組込まれているか
否かを決定するためにテストされる。該デジタルダイジ
ェストは複合ダイジェストである。
【0021】一般的に、別の側面においては、本発明
は、主要文書と1個又はそれ以上の補助文書とを有する
データの集まりの区別用識別子を形成する方法を提供し
ている。本方法は、各補助文書を要約してそれぞれの補
助文書ダイジェストを作成し、且つ該主要文書と全ての
補助文書ダイジェストとの連結を要約することによって
区別用識別子を作成することを包含している。本発明の
好適実施例は以下の特徴のうちの一つ又はそれ以上を有
している。デジタルダイジェストアルゴリズムが適用さ
れる。該デジタルダイジェストアルゴリズムはMD5メ
ッセージダイジェストアルゴリズムである。
【0022】一般的に、別の側面においては、本発明
は、階層的ファイルシステム上の最初の文書に対して推
移的にリンクされている文書を検索する方法を提供して
いる。本方法は、該最初の文書を検索し且つ該最初の文
書からその他の文書への推移的リンクが存在しており且
つ該推移的リンクが全て該最初の文書と同一のディレク
トリパス内にある文書を包含しているその他の文書のみ
を検索することを包含している。本発明の好適実施例は
以下の特徴のうちの一つ又はそれ以上を有している。該
階層的ファイルシステムはネットワーク上に分散されて
いる。該階層的ファイルシステムはインターネット上に
分散されている。
【0023】一般的に、別の側面においては、本発明
は、文書の意味論的マークアップ表現を該文書の物理的
マークアップ表現へ変換するためのコンピュータによっ
て読取り可能な媒体上に存在しているコンピュータプロ
グラムであって、該コンピュータプログラムが、コンピ
ュータをして、該文書内における全てのスクリーンオブ
ジェクトをそれらの通常の寸法で表示させるために必要
な最小幅に等しい論理的最小幅を計算させ、該文書の物
理的マークアップ表現であって少なくとも該論理的最小
幅と同じ幅を持った物理的マークアップ表現を作成さ
せ、且つ該物理的マークアップ表現をターゲット幅を含
むターゲット寸法へ適合させる、上記各命令を有してお
り、該コンピュータをして物理的マークアップ表現を適
合させる命令が、コンピュータをして、該論理的最小幅
に対するターゲット寸法の要素の比から派生されたスケ
ーリング係数によって該物理的マークアップ表現の幅を
スケーリングさせる命令を有しているコンピュータプロ
グラムを提供している。本発明の好適実施例は、以下の
特徴のうちの一つ又はそれ以上を有している。該プログ
ラムは、コンピュータをして、物理的マークアップ表現
を新たに作成した文書内に組込ませる命令を有してい
る。該プログラムは、コンピュータをして、物理的マー
クアップ表現を既存の文書内に組込ませる命令を有して
いる。該ターゲット寸法の該要素はターゲット幅であ
る。該物理的マークアップ表現は、各々がそれぞれの物
理的幅とそれぞれの物理的高さとを持った複数個の頁を
包含する頁付けした表現である。該ターゲット寸法はタ
ーゲット高さを包含している。該ターゲット寸法は標準
の用紙寸法である。該標準の用紙寸法は、8. 5×11
インチ、8. 5×14インチ、A4、A5、11×17
インチのうちの一つである。該物理的マークアップ表現
の頁は、該ターゲット寸法と同一のアスペクト比を有し
ている。本プログラムは、コンピュータをして、スケー
リング係数によって物理的マークアップ表現の高さをス
ケーリングさせる命令を有している。本プログラムは、
コンピュータをして、該スケーリング係数によって物理
的マークアップ表現の頁高さをスケーリングさせる命令
を有している。該ターゲット寸法の該要素はターゲット
高さである。本プログラムは、コンピュータをして、物
理的マークアップ表現の頁を+又は−90°だけ回転さ
せる命令を有している。本プログラムは、コンピュータ
をして、該論理的最小幅に対するターゲット寸法の比が
特定したスレッシュホールド未満であるか否かをテスト
させる命令を有している。該文書は複数個のフレームを
特定するフレームセットである。該文書は少なくとも1
個のハイパーテキストリンクを包含しており且つ本プロ
グラムは、コンピュータをして、ビュア内に物理的マー
クアップ表現を表示させ且つ表示されたマークアップか
らユーザによってハイパーテキストリンクが選択される
場合に外部文書へアクセスさせる命令を有している。該
ハイパーテキストリンクはサーバ側イメージマップであ
る。該意味論的マークアップ表現はHTMLである。該
物理的マークアップ表現はPDFである。本プログラム
は、コンピュータをして、該物理的マークアップ表現を
ターゲット寸法へ適合させた後に、該物理的マークアッ
プ表現を該スケーリング係数の逆数によってスケーリン
グさせ且つその結果をビュア内に表示させる命令を有し
ている。本プログラムは、コンピュータをして、ビュア
内において、物理的マークアップ表現で表わされており
且つ少なくとも1個のハイパーテキストリンクを含む第
一文書を表示させ、表示された第一文書からユーザによ
ってハイパーテキストリンクが選択された場合に外部文
書へアクセスさせ、該外部文書の意味論的マークアップ
表現を物理的マークアップ表現へ変換させ、且つ該外部
文書の物理的マークアップ表現を該第一文書内に組込ま
せる命令を有している。本プログラムは、コンピュータ
をして、該外部文書の物理的マークアップ表現へポイン
トさせるようにハイパーテキストリンクを修正させる命
令を有している。本プログラムは、コンピュータをし
て、該ハイパーテキストリンクの元の状態を保存させる
命令を有している。本プログラムは、コンピュータをし
て、該第一文書の一部の削除動作に応答して、該削除さ
れた部分に対してポイントしているハイパーテキストリ
ンクをその元の状態へ回復させる命令を有している。本
プログラムは、コンピュータをして、該外部文書を要約
して該外部文書のダイジェストを作成させ、且つ該外部
文書の物理的マークアップ表現が既に該第一文書内に組
込まれているか否かを決定するために該外部文書のダイ
ジェストをテストさせる命令を有している。該外部文書
は、主要文書と1個又はそれ以上の補助文書とを有して
いる。本プログラムは、コンピュータをして、各補助文
書を要約してそれぞれの補助文書ダイジェストを作成さ
せ且つ該外部文書の物理的マークアップ表現が既に該第
一文書内に組込まれているか否かを決定するために各補
助文書のデジタルダイジェストをテストさせる命令を有
している。該デジタルダイジェストは複合ダイジェスト
である。
【0024】一般的に、別の側面においては、本発明
は、主要文書と1個又はそれ以上の補助文書とを有する
データの集まりの区別用識別子を形成するためにコンピ
ュータによって読取り可能な媒体上に存在しているコン
ピュータプログラムにおいて、コンピュータをして、各
補助文書を要約してそれぞれの補助文書ダイジェストを
作成させ且つ該主要文書と全ての補助文書ダイジェスト
との連結を要約することにより区別用識別子を作成させ
る命令を有しているコンピュータプログラムを提供して
いる。本プログラムは、コンピュータをして、デジタル
ダイジェストアルゴリズムを適用させる命令を有してい
る。該デジタルダイジェストアルゴリズムはMD5メッ
セージダイジェストアルゴリズムである。
【0025】一般的に、別の側面においては、本発明
は、階層的ファイルシステム上の最初の文書へ推移的に
リンクされている文書を検索するためのコンピュータに
よって読取り可能な媒体上に存在しているコンピュータ
プログラムにおいて、コンピュータをして、該最初の文
書を検索させ、且つ該最初の文書からその他の文書への
推移的リンクが存在しており且つ該推移的リンクが全て
該最初の文書と同一のディレクトリパス内に存在してい
る文書を包含しているその他の文書のみを検索させる、
命令を有しているコンピュータプログラムを提供してい
る。本発明の好適実施例は、以下の特徴のうちの一つ又
はそれ以上を有している。該階層的ファイルシステムは
ネットワーク上に分散されている。該階層的ファイルシ
ステムはインターネット上に分散されている。
【0026】本発明の効果としては以下に記載する一つ
又はそれ以上のものがある。HTMLなどの意味論的マ
ークアップ言語で記載されているウエブ頁を、PDFな
どの物理的マークアップ言語で記載されている単一の頁
付けした文書内に統合させることが可能である。ウエブ
頁は、空間的拘束条件のために情報を失うことなしに、
固定した頁寸法を持ったフォーマットへ変換させること
が可能である。主要文書及び関連する補助文書に対して
事実上独特の単一の識別子を作成することが可能であ
る。一つの文書へリンクされており、且つ同一のディレ
クトリパス内に存在する文書の全てをファイルシステム
から検索することが可能である。
【0027】
【発明の実施の形態】図11を参照すると、クライエン
トソフトウエアを稼動しているユーザコンピュータ10
0が、通信リンク102を介して、ウエブサーバ140
のようなウエブサーバへ接続している。ウエブサーバは
例えば頁144のようなウエブ頁を含むデータ格納部1
42のようなデータ格納部へリンクされている(静的又
は動的)。クライエントソフトウエア(それは、1個又
はそれ以上の別のプログラム、及びプラグインモジュー
ル及びオペレーティングシステム拡張を包含することが
可能)は、典型的に、モニタ104のようなディスプレ
イ装置上に情報を表示し且つキーボード(不図示)及び
マウス106のようなカーソル位置決め装置からユーザ
の入力を受取る。コンピュータ100は、通常、マウス
106のユーザによる移動がディスプレイ104上に表
示されているカーソルグラフィックの対応した移動を発
生させるようにプログラムされている。
【0028】コンピュータ100のプログラミングは、
マウス106から位置情報を受取り且つそれをコンピュ
ータ100上で稼動しているアプリケーションプログラ
ムへ供給するインターフェース108を有している。こ
の様なアプリケーションプログラムの中には、ウエブブ
ラウザ110、PDFビュア120がある。又、コンピ
ュータ100上ではウエブ頁インテグレータ135が稼
動しており、それはPDFビュア120の一部とさせる
ことが可能である。ユーザからの要求に応答して、PD
Fビュアは、ウエブ頁インテグレータ135に対して一
つ又はそれ以上のウエブサーバ(例えばウエブサーバ1
40)から、ユーザによって供給されたURLによって
特定される最初の文書及び該最初の文書に対して直接的
に又は間接的にリンクされているその他の文書を検索さ
せることを要求することが可能である。要求された文書
が検索されると、ウエブ頁インテグレータはそれらを単
一のPDF文書内へ統合させ、それは、次いで、PDF
ビュア120によって表示される。
【0029】PDFビュアによって表示されるPDF文
書は、ウエブ頁に対するハイパーテキストリンクを有す
ると共に、PDF文書内の内部頁に対するハイパーリン
クを有することが可能である。ユーザがPDF文書内の
ハイパーリンクを、例えば、マウスで選択すると、その
リンクが該PDF文書内における一つの頁に対するもの
である場合には、その頁がPDFビュアによって表示さ
れる。しかしながら、そのハイパーテキストリンクがウ
エブ頁に対するものである場合には、その頁はユーザに
よって設定されたモードに依存して、ブラウザによって
表示されるか、又はPDF文書内へ統合され且つPDF
ビュアによって表示される。
【0030】図12、12a、12bはウエブ頁を単一
の頁付けした文書内へ組込む方法のフローチャートであ
って、プログラムしたコンピュータシステムにおいて実
現される場合について説明する。第一に、システムがユ
ーザに対して既存のPDF文書の名前、又はURLとウ
エブ横断基準を与えるようにユーザに質問を行う(ステ
ップ200)。ユーザがPDF文書の名前を与える場合
には、その文書は「ターゲット文書」となる(ステップ
210)。そのターゲット文書はPDFビュア内に表示
され且つユーザ入力を待機する(ステップ220)。ユ
ーザがURLとウエブ横断基準とを与える場合には、新
たな空のPDF文書が作成される。この文書はターゲッ
ト文書となる。ターゲット文書のパラメータが設定さ
れ、それはデフォルト値又はユーザからの入力の何れか
に従って、その文書内の頁のターゲット幅及びターゲッ
ト高さ(集約的に、該文書の「ターゲット寸法」)を特
定する。次いで、FetchAndIncorpora
te(フェッチアンドインコーポレイト)ルーチンが呼
出され、それは、URLによって特定された開始文書、
及び該開始文書へリンクされており且つウエブ横断基準
を満足するその他の文書をターゲット文書内へ組込む
(ステップ230)。次いで、ターゲット文書はPDF
ビュアによって表示され、システムはユーザ入力を待機
する(ステップ220)。
【0031】ターゲット文書の頁は、通常、それらのタ
ーゲット寸法、即ちそれらのPDFエンコーディングで
特定された頁の寸法で表示される。しかしながら、ユー
ザの要求により、該頁をそれらの「自然の寸法」で表示
させることが可能である。頁の「自然の寸法」とは、タ
ーゲット寸法と同一のアスペクト比を有しているが、該
ターゲット幅のうちの一層大きなものに等しい幅及びそ
の頁を組込んだウエブ頁をブラウザ内において表示する
のに必要な最小幅を持った寸法のことを意味している。
【0032】ユーザがハイパーテキストリンクを選択す
ると(ステップ235)、図12aを参照すると、その
リンクが検査されて、それが既にターゲット文書内へ組
込まれている文書に対してポイントするものであるか否
かを決定し(ステップ240)、且つ、そうである場合
には、前に組込んだ文書に対応するターゲット文書の頁
をPDFビュアで表示させる(ステップ250)。そう
でない場合には、ユーザが設定可能なフラグであるIn
corporate?の値をチェックし(ステップ26
0)且つ以下のステップのうちの一つを行う。
【0033】Incorporate?フラグがFAL
SE(偽)である場合には、ハイパーテキストリンクに
よって特定されたURLがそのURLに対応する文書を
表示するための命令と共に標準のウエブブラウザプログ
ラムへ供給される(ステップ270)。
【0034】Incorporate?フラグがTRU
E(真)である場合には、FetchAndIncor
porateルーチンが、URL、及びそのURLと関
連する文書のみが検索されることを特定するウエブ横断
基準と共に呼出される(ステップ280)。その結果、
そのURLによって特定された文書に対応するターゲッ
ト文書内に1個又はそれ以上の頁が作成される。次い
で、これらの頁のうちの第一のものがPDFビュアによ
って表示される(ステップ290)。
【0035】再度図12を参照すると、ユーザがターゲ
ット文書内に含まれるフォームを提起することを要求す
ると(ステップ300)、図12aに示したように、該
フォームの内容が適宜のサーバへ提供される(ステップ
310)。フォームの提供に応答してサーバから受取っ
たウエブ文書は、ウエブブラウザ内に表示されるか(ス
テップ330)又はConvertToPDF手順(以
下に詳細に説明する)によってターゲット文書内へ組込
まれ且つIntegrate?フラグの値に従って(ス
テップ320)、PDFビュアによって表示される(ス
テップ340)。
【0036】再度図12を参照すると、ユーザがターゲ
ット文書内のサーバ側イメージマップ上の点を選択する
場合には以下のステップがとられる(ステップ35
0)。(サーバ側イメージマップは、ユーザがマウスな
どのポインティング装置を使用して該イメージ内の任意
の点を選択する場合に、そのイメージ内のその点の座標
が特定したサーバへ提供され、該サーバがブラウザへ文
書を送ることによって応答するようにブラウザ内に表示
されるイメージのことである。)第一に、且つ図12b
を参照すると、ユーザによって選択された座標は現在表
示されている頁と関連している変数ScalingFa
ctorの値によって割算される(ステップ360)。
変数ScalingFactorは、存在する場合に
は、ターゲット文書内の頁上に入るように元のサーバ側
イメージマップの寸法を減少させた量を表わす。その結
果得られる座標値がサーバへ送信され(ステップ36
0)、且つIncortorate?フラグの値に従っ
て(ステップ370)、該サーバによって送信された文
書がウエブブラウザによって表示されるか(ステップ3
80)、又はターゲット文書内に組込まれ且つPDFビ
ュアによって表示される(ステップ390)。
【0037】再度図12を参照すると、ユーザがターゲ
ット文書から頁を削除することを要求すると(ステップ
400)、図12bを参照して説明すると、その頁は削
除され(ステップ410)、且つその頁に対してポイン
トしていた該文書内の全てのハイパーテキストリンクは
外部リンクとなるべくリセットされる(ステップ42
0)。
【0038】ユーザの要求が処理されると、制御はステ
ップ220へ復帰し、そこでユーザからのさらなる要求
を待機する。
【0039】図13はFetchAndIncorpo
rateルーチンのステップを示したフローチャートで
あり、それは、与えられたURLからターゲット文書へ
リンクされている文書の集まりを検索する。最初に、そ
のURLは未決のURLのリスト上に配置される(ステ
ップ500)。次いで、ユーザによって特定された基準
に従って、該リスト上のURLの何れかが有効であるか
否かを決定するために該リストのチェックを行う(ステ
ップ510)。
【0040】ユーザによって特定することが可能な一つ
のウエブ横断基準は最大深さ基準である。この基準は、
FetchAndIncorporateルーチンへの
反復するコール即ち呼出しの深さを制限し、従って最初
に検索した文書とターゲット文書内に組込むべき後に検
索した文書との間の「リンク距離」を制限する。
【0041】ユーザによって特定することの可能な別の
基準は「ステイ・オン・サーバ(stay on se
rver)」基準である。この基準がセットされると、
最初に検索した文書と同一のサーバを表わすURLを有
する文書のみが検索される。ユーザによって設定するこ
との可能な別の基準は「同一パス」基準である。この基
準がセットされると、最初に検索した文書と同一のファ
イルシステムディレクトリ(又はそのディレクトリのサ
ブディレクトリ)を表わすURLを有する文書のみが検
索される。
【0042】リスト上に有効なURLが存在する場合に
は、このリスト上の最初の有効なURLによって識別さ
れた文書がFetchDocルーチンを呼出すことによ
って検索される(ステップ520)。FetchDoc
ルーチンは、ターゲット文書から一組の頁を返すか、又
は0又はそれ以上の関連する補助文書を有するウエブサ
ーバから検索された文書を返す。FetchDocルー
チンがターゲット文書から頁を返すと(ステップ53
0)、このことは、要求された文書が既にターゲット文
書内に組込まれていることを表わし、且つ該ルーチンは
ステップ560において継続して行われる。
【0043】FetchDocルーチンがウエブサーバ
からPDF頁を包含する文書をリターン即ち返すと、こ
れらの頁はターゲット文書の終わりにアペンドされる
(ステップ540)。
【0044】FetchDocルーチンがウエブサーバ
から非PDF文書(多分、関連する補助文書と共に)を
返すと、ConvertToPDFルーチンが呼出され
る(ステップ550)。ConvertToPDFルー
チンは、引数として非PDF文書及びその補助文書をと
り且つターゲット文書へアペンドされる対応するPDF
頁を作成する。
【0045】次に、FetchDocルーチンによって
返された文書内のハイパーテキストリンクによって参照
されるURLの全てが未決のURLのリストへ付加され
(ステップ560)、且つ制御はステップ510へ返さ
れる。
【0046】この様に、ターゲット文書へリンクされて
いる全ての文書及びこれらの文書にリンクされている全
ての文書などが、ユーザによって特定されたウエブ横断
基準に従って検索される。本明細書においては「推移的
リンク」という用語を使用するが、それは二つの文書
が、それらを接続する一連の1個又はそれ以上のリンク
が存在していることを示すものである。
【0047】任意の時刻において、未決のURLのリス
トが有効なURLを包含するものではない場合には、タ
ーゲット文書内のハイパーテキストリンクは、ターゲッ
ト文書内に組込まれた文書へリンクしているハイパーテ
キストリンク(本書においては「内部リンク」と呼称す
る)が今やウエブからの対応するHTML文書に対して
ではなくターゲット文書内の対応する頁に対してポイン
トするように修正される(ステップ570)。元のリン
ク情報(即ち、ウエブをベースとしたデータ資源に対し
てポイントしているURL)は、維持される。内部リン
クが無効なものとなると(例えば、それがポイントする
頁がターゲット文書から削除された場合)、元のリンク
情報は、ウエブからのデータへアクセスするために使用
することが可能である。
【0048】図14はFetchDocルーチンによっ
てとられるステップを示したフローチャートである。特
定されたURLは、それが既にターゲット文書の頁内に
組込まれているウエブからの文書に対応するものである
か否かを判別するためにチェックされる(ステップ60
0)。(URLはその様に対応することが可能である。
なぜならば、URLはターゲット文書の頁として前に組
込まれてた文書を参照するからであり、又は以下に更に
詳細に説明するように、ターゲット文書の頁内に組込ん
だ文書を参照するURLと等価なものとして以前に発見
されていたからである。)そうである場合には、ターゲ
ット文書からの対応する頁がリターン即ち返される(ス
テップ610)。
【0049】そうでない場合には、要求された文書(本
書においては、「主要な文書」と呼称する)はウエブサ
ーバから検索される(ステップ620)。主要文書がス
キャンされ、且つ主要文書のディスプレイ内に含まれる
べき全ての補助文書(存在する場合)のURLが注記さ
れる(ステップ630)。フレームセットではないHT
ML文書の場合には、該補助文書はイメージ(画像)文
書を包含する場合がある。フレームセットの場合には、
これらの補助文書はフレームの内容を供給する文書を包
含している。
【0050】補助文書を参照する各URLに対して、該
補助文書がイメージ文書である場合には、URLがター
ゲット文書の頁内に既に検索された文書を参照するか否
かを決定する。このことは、URLをターゲット文書内
に前に組込んだURL参照用イメージ文書のリストと比
較することによって行われる。(URLがこのリスト上
に表われる場合がある。なぜならば、それはターゲット
文書内に前に組込んだイメージ文書を参照するからであ
るか、又は以下に更に詳細に説明するように、ターゲッ
ト文書内に前に組込んだイメージ文書を参照するURL
と等価なものであることが前もって判明していたからで
ある。)そうである場合には、対応するイメージに対す
る間接的なオブジェクト参照がターゲット文書から検索
される(ステップ640)。そうでない場合には、UR
Lによって識別された補助文書がウエブから検索される
(ステップ640)。ウエブから検索された各補助文書
に対して、インターネットエンジニアリングタスクフォ
ースによって発表されたRFC1321文書、MD5メ
ッセージダイジェストアルゴリズムにおいて記載されて
いるMD5ダイジェストアルゴリズムのような非線形ダ
イジェスト(要約)用アルゴリズムを使用して数値的な
「ダイジェスト」が作成される(ステップ650)。該
文書に対してMD5を適用することによって作成された
ダイジェストはMD5を異なる文書に適用することによ
って発生される蓋然性が極めて少ない数値である。従っ
て、それは、その文書に対して事実上ユニークな識別用
の「シグナチャ」として作用する。
【0051】イメージ文書である各補助文書に対して、
該ダイジェスト値がターゲット文書の頁内に既に組込ま
れている文書に対するダイジェスト値と比較される。一
致が見つかると、検索されたイメージ文書が廃棄され、
その文書に対する間接的オブジェクト参照がターゲット
文書からその代わりに検索され、且つ補助文書に対する
URLが一致したイメージと関連しているURLを有す
る等価なクラス内に配置される(ステップ660)。オ
プションとして、等価クラス内のURLは、満期日付で
マーク付けすることが可能であり、それは、その日付の
後にそれらが等価クラスから除去されるべきであること
を表わす。このことを行うことが可能であるので、時間
と共に変化する蓋然性のある資源を参照するURLが
「陳腐」なものとなることはない。
【0052】注意すべきことであるが、ウエブ上におい
ては、語彙的には別個のURLが同一又は同じ内容に対
してポイントするものであることは通常である。数値的
ダイジェストを使用することによって、ターゲット文書
内に複製の頁及びイメージを組込むことを回避すること
によって空間が節約される。
【0053】補助文書の全てが検索されると(ウエブか
ら又はターゲット文書内に前に組込んだ内容に対する間
接的な参照として)、補助文書の全てのダイジェストと
主要文書の内容との連結に対してダイジェストアルゴリ
ズムを適用することによって新たなダイジェストが作成
される(ステップ670)。その結果得られる「複合ダ
イジェスト」は主要文書のダイジェストである。
【0054】単純なダイジェスト(即ち、主要文書のみ
の内容のダイジェスト)ではなく主要文書の複合ダイジ
ェストを使用することは、テキスト的には同一であるが
異なる内容の表示となる主要文書間の区別を行うという
利点を与える。例えば、HTML文書内の補助文書は相
対的参照として特定することが可能である。即ち、UR
Lは例えばサーバ名又はディレクトリ名を特定すること
なしに文書名を特定することが可能である。この様な相
対的参照はその参照が形成された文書と同一のサーバ上
及び同一のディレクトリ内の文書に対する参照として解
釈される。従って、補助文書に対する同一の相対的参照
を有する二つの主要文書は、それらが異なるホスト上に
おいて見つかった場合に、実際には異なる補助文書を参
照する場合がある。
【0055】テキスト的に同一の主要文書は、又、それ
らが異なる時間において検索される場合に観察者に対し
て異なった表われ方をする場合がある。なぜならば、該
文書によって参照される補助文書の内容は時間と共に変
化する場合があるからである。
【0056】複合ダイジェストを使用することは、主要
文書とその補助文書の両方の内容を、該主要文書をこれ
らの頁の複製物として取扱うか否かを決定する前に、既
存のターゲット文書頁と効率的に比較することを可能と
する。
【0057】次いで、主要文書の複合ダイジェストをチ
ェックして、それがターゲット文書の一つの頁又は複数
個の頁として前に組込まれた何れかのウエブ文書のダイ
ジェストに対応するか否かを判別する(ステップ68
0)。そうである場合には、該主要文書は廃棄され、前
に組込んだウエブ文書に対応するターゲット文書の頁が
返され、且つ該主要文書に対するURLが一致した前に
組込んだ文書と関連しているURLを有する等価クラス
内に配置される(ステップ660)。そうでない場合に
は、該主要文書は、それと関連する補助文書と共にリタ
ーン、即ち返される(ステップ700)。
【0058】図15はConvertToPDFルーチ
ンのステップを示したフローチャートである。Conv
ertToPDFルーチンは、引数として、非PDF文
書及びその補助文書をとる。最初に、主要文書がチェッ
クされて、それがHTML文書であるか否かが判別され
る(ステップ800)。そうでない場合には(即ち、そ
れが例えばイメージ文書などの何らかのその他のタイプ
の文書である場合)、それは通常の技術を使用してター
ゲット文書内に組込まれる(ステップ810)。
【0059】主要文書がHTML文書である場合には、
該主要文書及び補助文書が、標準のパーシング(構文解
析)技術を使用して、スクリーンオブジェクト(例え
ば、文書ボディ、テーブル、リスト、イメージ、パラグ
ラフ)のパースツリー(parce tree)へ構文
解析する(ステップ820)。この様な技術は、例え
ば、Aho及びUllman著「コンパイラ設計の原理
(Principlesof Compiler De
sign)」、アジソン・ウエズリー出版社、1977
の文献に記載されている。
【0060】次に、LayoutRegionデータ構
造を作成する。LayoutRegionデータ構造
は、特定のPDF文書を介しての固定幅ストライプを表
わす。該LayoutRegionデータ構造は、更
に、ポインタcurYを有しており、それはレイアウト
が行われるべき文書内の現在の垂直位置を特定する。L
ayoutRegionデータ構造は、更に、それが参
照するPDF頁の幅及び高さを表わす頁寸法情報を有し
ている。LayoutRegionデータ構造は、更
に、所謂「フローティングイメージ」のリストを有して
おり、該フローティングイメージはLayoutReg
ionの左側又は右側の端部における固定した垂直位置
を占有すべく画定され、且つその周りに他のスクリーン
オブジェクトがフロー即ち流れる。図16はテキスト8
40の幾つかのラインをレイアウトし且つ二つの相次ぐ
PDF頁860内に四つのイメージ850を配置するた
めに使用されているレイアウト領域830を模式的に示
している。
【0061】再度図15を参照すると、LayoutR
egionが形成され、従ってcurYはターゲット文
書の最後に存在する頁の最下部端部に対してポイントす
る。(慣習によって、この位置に配置された任意のPD
Fスクリーンオブジェクトは次続の頁の上部に表われ
る。)LayoutRegionの左側及び右側の範囲
は、ターゲット文書内の頁の所望の幅に等しく設定され
る。頁高さ及び幅情報はターゲット文書の頁寸法と等し
く設定される(ステップ870)。
【0062】次に、LayoutElementルーチ
ンが呼出される。LayoutElementルーチン
は引数としてHTMLスクリーンオブジェクト(例え
ば、フレームセット、テーブル、文書、パラグラフ、又
はイメージ)、LayoutRegion及びRend
erPDF?フラグをとる。LayoutElemen
tはスクリーンオブジェクトをレイアウトするために実
際に必要とされる寸法、即ち幅及び高さをリターン即ち
返す。RenderPDF?がTRUE(真)である場
合には、LayoutElementはそのHTMLオ
ブジェクトに対応するターゲット文書内に内容を作成す
る試みを行う。このプロセスについては後に更に詳細に
説明する。
【0063】LayoutElementは、最初に、
主要HTML文書及びその補助文書、新たに作成された
LayoutRegion及びFALSE(偽)のRe
nderPDF?値の引数としての新たに作成されたパ
ースツリーと共に呼出される(ステップ880)。Re
nderPDF?がFALSE(偽)であると、Lay
outElementがそれらの通常の寸法でパースツ
リー内に特定されているスクリーンオブジェクトの全て
を完全に表示するのに必要な最小幅及び高さを計算す
る。尚、この幅とは、パースツリーによって表わされる
HTMLオブジェクトの「論理的最小幅」のことを意味
している。
【0064】次いで、LayoutElementによ
ってリターン即ち返される幅値がターゲット文書のター
ゲット幅と比較される(ステップ890)。返された幅
値がターゲットPDF頁の幅未満であるか又は等しい場
合には、可変ScalingFactorが1と等しく
セットされ(ステップ900)、且つLayoutRe
gionにおけるcurYの値がターゲット文書の最後
の頁の底部端部と等しくなるようにリセットされる(ス
テップ910)。
【0065】LayoutElementによって返さ
れる幅値がターゲットPDF頁の幅よりも大きい場合に
は、以下のステップがとられる。ScalingFac
torが、返された幅値によってターゲット文書のター
ゲット幅を割算することによって計算される(ステップ
920)。ScalingFactorが約0. 7より
大きい場合には(ステップ930)、新たなLayou
tRegionが作成され、頁高さ及び幅がScali
ngFactorによって割算されたターゲットPDF
頁の頁寸法と等しくなるように定義され、curYがタ
ーゲット文書の最後の頁の底部端部に対してポイントす
べく設定され、且つLayoutRegionの幅が新
たに定義された頁幅と等しく設定される(ステップ94
0)。
【0066】ScalingFactorが約0. 7未
満である場合には、LandscapeView?フラ
グがTRUE(真)に設定される。ターゲット文書のタ
ーゲット高さを返された幅値によって割算することによ
り新たなScalingFactorが再計算される。
その結果得られる値が1より大きい場合には、それは1
と等しく設定される。次いで、新たなLayoutRe
gionが作成され、その場合に頁高さ及び幅はSca
lingFactorによって割算された相補的頁寸法
(即ち、幅に対して高さ及びその逆も又真)と等しく画
定され、curYはターゲット文書の最後の頁の底部端
部に対してポイントすべく設定され、且つLayout
Regionの幅は新たに画定された頁幅に設定される
(ステップ950)。
【0067】(別の実施例においては、ユーザは、La
ndscapeView?フラグがTRUE(真)に設
定されるスレッシュホールドの値を特定することが可能
であり、且つ更にLandscapeView?フラグ
がTRUE(真)に設定されることがないように特定す
ることも可能である。)次に、LayoutEleme
ntが再度呼出され、この時はパースツリー、新たに作
成されたLayoutRegion、及びTRUE
(真)のRenderPDF?値と共に呼出される。L
ayoutElementに対してその呼出しによって
発生されたPDF頁は全てScalingFactor
によってスケーリングされ、それらをターゲット文書内
の頁の寸法へ変換させる。ScalingFactor
は将来の参照のために各頁と共に格納される。(例え
ば、ユーザがPDF頁がその「自然の寸法」で表示され
ることを要求する場合には、PDF頁の寸法はScal
ingFactorによって割算されてその頁をその自
然の寸法へ復帰させる。)LandscapeView
?がTRUE(真)である場合には、LayoutEl
ementに対してその呼出しによって発生されたPD
F頁の各々が90°だけ回転される(ステップ96
0)。次いで、ConvertToPDFから抜出る
(ステップ970)。
【0068】図17、17a、17bはLayoutE
lementルーチンによってとられるステップを示し
たフローチャートである。最初に、変数MinWidt
hはLayoutRegionの幅と等しくされ、且つ
ポインタstartYはcurYの値が割当てられる
(ステップ1000)。次いで、パースツリーによって
表わされるHTMLオブジェクトのタイプが決定され
る。そのオブジェクトが非構造型内容オブジェクトであ
る場合には(即ち、パラグラフ、フォーム要素、又は見
出しなどの内部的構造なしで単にテキスト及びイメージ
からなるオブジェクトである場合)(ステップ101
0)、LayoutElementは、そのオブジェク
ト内の最も幅広の要素の幅(即ち、最も幅広の単語又は
イメージ)を決定することによってそのオブジェクトの
論理的最小幅を計算し、この幅がMinWidthより
も大きい場合には、MinWidthはその幅に設定さ
れる(ステップ1020)。
【0069】RenderPDF?がTRUE(真)で
ある場合には、そのオブジェクトをcurYによってポ
イントされている位置においてターゲット文書内に配置
させる。(注意すべきことであるが、そのオブジェクト
は、表示されると、頁上で複数本のラインをとる場合が
ある。例えば、該オブジェクトがテキストの一つのパラ
グラフである場合には、該テキストは現在のラインを一
杯とさせ、且つ継続して付加的なライン一杯とさせ、各
ライン上に可及的に多くの単語が配置されるように配置
される。)curYによってポイントされている位置に
該オブジェクトを配置させることが該オブジェクトの一
部を現在の頁の終わりを超えて配置させるような場合に
は、curYによって表わされる位置より下側のターゲ
ット文書内に付加的なPDF頁が存在するか否かを判別
する。この様な頁が存在しない場合には、それが作成さ
れる。該オブジェクトが該付加的な頁上に完全に配置さ
れるのに充分に小さなものである場合には、これで完了
する。そうでない場合には、該オブジェクトが頁の境界
を超えて配置され、可能である場合には頁の境界を超え
てキャラクタ又はイメージが配置されることがないよう
にする。次いで、ポインタcurYがインクリメントさ
れて、配置されたオブジェクトのすぐ下の位置に対して
ポイントすることとなる(ステップ1030)。
【0070】RenderPDF?の値に拘らずに、次
いで、curYの値が該オブジェクトの高さによってイ
ンクリメントされる(ステップ1040)。
【0071】MinWidthの値及びcurY及びs
tartYの間の差がリターン即ち返され、スクリーン
オブジェクトの実際の寸法を表わす(ステップ105
0)。該オブジェクトがリスト又はリスト状オブジェク
ト(例えば、メニュー、順番付けしたリスト、又はディ
レクトリリスト)又は単純な文書(即ち、フレームセッ
トではない)のボディである場合には(ステップ106
0)、以下のステップがとられる。該文書のボディ内の
リスト又はスクリーンオブジェクトの各要素に対して、
LayoutElementルーチンが呼出され、リス
ト要素又は文書スクリーンオブジェクト、現在のLay
outRegion及びRenderPDF?の値を引
数として呼出される。この様な各呼出しに対して、返さ
れた幅値がMinWidthより大きい場合には、Mi
nWidthはその値に設定される(ステップ107
0)。全てのこの様な要素又はスクリーンオブジェクト
がこの様な態様で処理された後に、MinWidthの
値及びcurYとstartYとの間の差がリターン即
ち返される(ステップ1080)。
【0072】該オブジェクトがテーブルである場合には
(ステップ1090)、以下のステップがとられる。図
17aを参照すると、テーブル欄の幅が全体的なMin
Widthに等しいように設定される(ステップ111
0)。(各欄の相対幅はHTMLテーブルマークアップ
と共に与えられるHTMLテーブル形態情報に従って決
定される。)次いで、該テーブル内の各行に対して、最
初の行から開始し(ステップ1120)、その行内にお
いて開始するセルの各々が以下の如くに逐次的に処理さ
れる(左から右)。curYの現在の値及び現在の頁寸
法で新たなLayoutRegionが作成されるが、
左側及び右側の境界は、セルによって占有されるべき欄
の左側及び右側の範囲によって決定される。次いで、引
数としてセルの内容、新たなLayoutRegion
及びRenderPDF?の値と共にLayoutEl
ementが呼出される(ステップ1130)。
【0073】一つの行内のセルの全てが処理された後
に、以下のステップがとられる。即ち、curYがその
行のセルの最も高いものの下側の点に設定される(現在
の行内において終端するものよりも大きな行範囲を有す
るセルを含む)。次いで、その行の幅(その行を占有す
る全てのセルに対するLayoutElementによ
って返される幅値の和として定義される)が計算され
(ステップ1140)、且つ次の行の処理がステップ1
130において開始される。この様にして全ての行が処
理された後に(ステップ1150)、MinWidth
の値が各行の幅と比較され、且つ最も幅広の行の幅がM
inWidthよりも大きい場合には、MinWidt
hがその行の幅と等しく設定される(ステップ116
0)。MinWidthの値及びcurYとstart
Yとの間の差が返される(ステップ1170)。
【0074】再度図17を参照すると、該オブジェクト
がフレームセットである場合には、以下のステップがと
られる。図17bを参照すると、トップレベルのフレー
ムセットにおける各フレームに対して、MinWidt
hの値及び該フレームセット内において特定されている
フレーム幅情報に基づいて、仮の幅及び位置が決定され
る。(例えば、トップレベルのフレームセットが水平な
フレームを画定する場合には、各フレームの仮の幅はM
inWidthである。トップレベルのフレームセット
が垂直のフレームを画定する場合には、各フレームの仮
の幅は、フレームセットにおいて特定されるように該フ
レームの相対幅に従ってMinWidthによって特定
された幅を分割することによって決定される。)次い
で、トップレベルのフレームセット内の各フレームに対
して、新たなLayoutRegionが作成され、そ
れは既存の頁寸法及び該フレームの仮の幅及び位置を有
しており、curYは該フレームの上部端部に対してポ
イントすべく設定される(ステップ1190)。
【0075】次いで、トップレベルのフレームセットが
水平のフレームを包含する場合には(ステップ120
0)、以下のステップがとられる。該フレームセット内
の各トップレベルのフレームに対して、最初のこの様な
フレームから開始し(ステップ1210)、Layou
tElementが呼出され、該フレームの内容、新た
に作成されたLayoutRegion及びRende
rPDF?が引数として使用される(ステップ122
0)。この様な各呼出しの後に、curYの値はLay
outElementによって返された高さ値によって
インクリメントされる(ステップ1230)。Layo
utElementに対する呼出しによって返された幅
値がMinWidthよりも大きい場合には(ステップ
1240)、MinWidthはその値に設定され、c
urYはstartYと等しくリセットされ(ステップ
1250)、且つ本プロセスは新たにステップ1190
において開始する。トップレベルのフレームセットにお
ける全てのフレームがその様に処理された後に(ステッ
プ1260)、MinWidthの値及びcurYとs
tartYとの間の差が返される(ステップ127
0)。
【0076】トップレベルのフレームセットにおけるフ
レームが垂直のフレームである場合には(ステップ12
00)、以下のステップがとられる。該フレームセット
における各トップレベルのフレームに対して、該フレー
ムの内容、新たに作成されたLayoutRegion
及びRenderPDF?の値を引数としてLayou
tElementが呼出される(ステップ1280)。
各トップレベルのフレームがその様に処理された後に、
これらのLayoutElementに対する呼出しの
各々によって返された幅の和がテストされる(ステップ
1290)。この和がMinWidthよりも大きい場
合には、MinWidthが該幅の和と等しく設定され
(ステップ1300)且つ本プロセスはステップ119
0において新たに開始される。そうでない場合には、c
urYがLayoutElementに対する呼出しに
よって返された高さ値のうちで最も高いものによってイ
ンクリメントされ(ステップ1310)、且つMinW
idthの値及びcurYとstartYとの間の差が
返される(ステップ1320)。
【0077】図18−21は本方法をHTML文書に対
して適用した場合の結果を例示している。図18に示し
たものは、2個のフレーム1410及び1420からな
るHTML文書のウエブブラウザにおける表示である。
フレーム1410はほぼブラウザウインド内にフィット
しているが、フレーム1420はブラウザウインドの底
部端部を超えて延在しており且つ図19に例示した如
く、ウインド内のフレームの位置を調節するためのスラ
イダを使用することによって見ることが可能である。図
20及び21は、本方法を図18及び19に示したHT
ML文書に適用することによって発生される一組のPD
F頁を示している。理解されるように、単一の頁上にフ
ィットするのに充分小さなフレーム1410はフレーム
1420の最初の部分と共に、頁1440上に示されて
いる。頁1450及び1460上において、フレーム1
420の残りの部分が表示されている。注意すべきこと
であるが、フレーム1420の幅はグラフィック143
0の幅と等しく、それは該フレーム内の最も幅広の論理
幅を有するスクリーンオブジェクトである。
【0078】その他の実施例も本発明の技術的範囲内の
ものである。例えば、本発明のステップの順番は変更す
ることが可能である。ユーザコンピュータは単一ユーザ
又はマルチユーザプラットフォームとすることが可能で
あり、又はそれは家庭用のテレビ、パーソナルデジタル
アシスタント、インターネットサーフィング、又は特別
目的アプリケーション製品などの埋込み型コンピュータ
とすることが可能である。ウエブ頁はワイドエリアネッ
トワーク、ローカルエリアネットワーク、又は単一のフ
ァイルシステム上に存在することが可能である。ターゲ
ット文書は、固定幅を持った頁付けしていない文書とす
ることが可能である。ターゲット文書は可変幅頁を有す
る頁付けした文書とすることが可能である。ウエブ頁は
HTMLでコード化されることは必要ではなく、任意の
意味論的マークアップ言語とすることが可能である。タ
ーゲット文書はPDFでコード化されることは必要では
なく、任意の物理的マークアップ言語とすることが可能
である。
【0079】以上、本発明の具体的実施の態様について
詳細に説明したが、本発明は、これら具体例にのみ制限
されるべきものではなく、本発明の技術的範囲を逸脱す
ることなしに種々の変形が可能であることは勿論であ
る。
【図面の簡単な説明】
【図1】 従来のウエブブラウザにおいて表示されたウ
エブ頁のビューを示した概略図。
【図2】 従来のウエブブラウザにおいて表示されたウ
エブ頁のビューを示した概略図。
【図3】 従来のウエブブラウザにおいて表示されたウ
エブ頁のビューを示した概略図。
【図4】 従来のウエブブラウザにおけるフレームを包
含するウエブ頁のビューを示した概略図。
【図5】 従来のウエブブラウザにおけるフレームを包
含するウエブ頁のビューを示した概略図。
【図6】 従来のウエブブラウザにおけるフレームを包
含するウエブ頁のビューを示した概略図。
【図7】 従来のウエブブラウザにおいて表示されたウ
エブ頁のビューを示した概略図。
【図8】 従来のウエブブラウザにおいて表示されたウ
エブ頁のビューを示した概略図。
【図9】 従来のウエブブラウザにおいて表示されたウ
エブ頁のビューを示した概略図。
【図10】 図7−9において表示されたウエブ頁に対
してその基礎となるHTMLコードの一部を示した説明
図。
【図11】 本発明に基づいてプログラムされたコンピ
ュータシステムを示した概略ブロック図。
【図12】 複数個のウエブ頁を単一の頁付けした文書
へ組込む方法のフローチャートの一部を示した概略図。
【図12a】 複数個のウエブ頁を単一の頁付けした文
書へ組込む方法のフローチャートの一部を示した概略
図。
【図12b】 複数個のウエブ頁を単一の頁付けした文
書へ組込む方法のフローチャートの一部を示した概略
図。
【図13】 FetchAndIncortorate
ルーチンのステップを示したフローチャート。
【図14】 FetchDocルーチンのステップを示
したフローチャート。
【図15】 ConvertToPDFルーチンのステ
ップを示したフローチャート。
【図16】 LayoutRegion及び関連するP
DF文書の内容の間の論理的関係を示した概略図。
【図17】 LayoutElementルーチンによ
ってとられるステップを示したフローチャートの一部を
示した概略図。
【図17a】 LayoutElementルーチンに
よってとられるステップを示したフローチャートの一部
を示した概略図。
【図17b】 LayoutElementルーチンに
よってとられるステップを示したフローチャートの一部
を示した概略図。
【図18】 従来のウエブブラウザにおいて表示された
ウエブ頁のビューを示した概略図。
【図19】 従来のウエブブラウザにおいて表示された
ウエブ頁のビューを示した概略図。
【図20】 本発明によって発生されるPDF頁を示し
た概略図。
【図21】 本発明によって発生されるPDF頁を示し
た概略図。
【符号の説明】
100 ユーザコンピュータ 102 通信リンク 104 モニタ(ディスプレイ) 106 マウス 108 インターフェース 110 ウエブブラウザ 120 PDFビュア 135 ウエブ頁インテグレータ 140 ウエブサーバ 142 データ格納部 144 ウエブ頁
───────────────────────────────────────────────────── フロントページの続き (72)発明者 エドワード ロイス ワーレン ロー アメリカ合衆国, カリフォルニア 94086, サニーベル, アノ ヌエボ アベニュー 395, ナンバー 301

Claims (68)

    【特許請求の範囲】
  1. 【請求項1】 文書の意味論的マークアップ表現を該文
    書の物理的マークアップ表現へ変換する方法において、 文書内の全てのスクリーンオブジェクトをそれらの通常
    の寸法で表示するために必要とされる最小幅に等しい論
    理的最小幅を計算し、 前記文書の物理的マークアップ表現であって少なくとも
    前記物理的最小幅と同じ幅を有する物理的マークアップ
    表現を作成し、 前記物理的マークアップ表現をターゲット幅を含むター
    ゲット寸法へ適合させ、その場合に前記論理的最小幅に
    対する前記ターゲット寸法の要素の比から派生されるス
    ケーリング係数によって前記物理的マークアップ表現の
    幅をスケーリングさせる、上記各ステップを有すること
    を特徴とする方法。
  2. 【請求項2】 請求項1において、更に、前記物理的マ
    ークアップ表現を新たに作成した文書内に組込むことを
    特徴とする方法。
  3. 【請求項3】 請求項1において、更に、前記物理的マ
    ークアップ表現を既存の文書内に組込むことを特徴とす
    る方法。
  4. 【請求項4】 請求項1において、前記ターゲット寸法
    の前記要素がターゲット幅であることを特徴とする方
    法。
  5. 【請求項5】 請求項1において、前記物理的マークア
    ップ表現が各々がそれぞれの物理的幅とそれぞれの物理
    的高さとを持った頁を含む頁付けした表現であることを
    特徴とする方法。
  6. 【請求項6】 請求項5において、前記ターゲット寸法
    がターゲット高さを含んでいることを特徴とする方法。
  7. 【請求項7】 請求項6において、前記ターゲット寸法
    が標準の用紙寸法であることを特徴とする方法。
  8. 【請求項8】 請求項7において、前記標準の用紙寸法
    が8. 5×11インチ、8. 5×14インチ、A4、A
    5、11×17インチのうちの一つであることを特徴と
    する方法。
  9. 【請求項9】 請求項6において、前記物理的マークア
    ップ表現の頁が前記ターゲット寸法と同一のアスペクト
    比を有していることを特徴とする方法。
  10. 【請求項10】 請求項5において、前記物理的マーク
    アップ表現を適合させるステップが、更に、前記スケー
    リング係数によって前記物理的マークアップ表現の高さ
    をスケーリングすることを特徴とする方法。
  11. 【請求項11】 請求項10において、前記物理的マー
    クアップ表現の高さを前記スケーリング係数によってス
    ケーリングする場合に、前記スケーリング係数によって
    前記物理的マークアップ表現の頁高さをスケーリングす
    ることを特徴とする方法。
  12. 【請求項12】 請求項6において、前記ターゲット寸
    法の前記要素がターゲット高さであることを特徴とする
    方法。
  13. 【請求項13】 請求項6において、前記物理的マーク
    アップ表現を適合させる場合に、前記物理的マークアッ
    プ表現の頁を+又は−90°だけ回転させることを特徴
    とする方法。
  14. 【請求項14】 請求項13において、前記物理的マー
    クアップ表現を前記ターゲット幅へ適合させる場合に、
    更に、前記論理的最小幅に対する前記ターゲット幅の比
    が特定したスレッシュホールド未満であるか否かをテス
    トすることを特徴とする方法。
  15. 【請求項15】 請求項1において、前記文書が複数個
    のフレームを特定するフレームセットであることを特徴
    とする方法。
  16. 【請求項16】 請求項1において、前記文書が少なく
    とも1個のハイパーテキストリンクを有しており、本方
    法が、更に、 前記物理的マークアップ表現をビュア内に表示し、 ハイパーテキストリンクが前記表示されたマークアップ
    からユーザによって選択された場合に外部文書へアクセ
    スする、上記各ステップを有することを特徴とする方
    法。
  17. 【請求項17】 請求項16において、前記ハイパーテ
    キストリンクがサーバ側イメージマップであることを特
    徴とする方法。
  18. 【請求項18】 請求項1において、前記意味論的マー
    クアップ表現がHTMLであることを特徴とする方法。
  19. 【請求項19】 請求項1において、前記物理的マーク
    アップ表現がPDFであることを特徴とする方法。
  20. 【請求項20】 請求項1において、更に、 前記物理的マークアップ表現を前記ターゲット寸法へ適
    合させた後に、前記スケーリング係数の逆数によって前
    記物理的マークアップ表現をスケーリングし、且つその
    結果をビュア内に表示する、上記各ステップを有するこ
    とを特徴とする方法。
  21. 【請求項21】 ハイパーテキストデータを表示する方
    法において、 物理的マークアップ表現で表わされており且つ少なくと
    も1個のハイパーテキストリンクを包含する第一文書を
    ビュア内に表示し、 前記表示した第一文書からユーザによってハイパーテキ
    ストリンクが選択される場合に外部文書へアクセスし、 前記外部文書の意味論的マークアップ表現を物理的マー
    クアップ表現へ変換し、 前記外部文書の物理的マークアップ表現を前記第一文書
    内に取込む、上記各ステップを有することを特徴とする
    方法。
  22. 【請求項22】 請求項21において、更に、前記外部
    文書の物理的マークアップ表現へポイントさせるために
    ハイパーリンクを修正することを特徴とする方法。
  23. 【請求項23】 請求項22において、更に、前記ハイ
    パーテキストリンクの元の状態を保存することを特徴と
    する方法。
  24. 【請求項24】 請求項23において、更に、前記第一
    文書の一部を削除する動作に応答して、前記削除した部
    分へポイントしていたハイパーリンクをその元の状態へ
    復帰させることを特徴とする方法。
  25. 【請求項25】 請求項21において、更に、 前記外部文書を要約して前記外部文書のダイジェストを
    作成し、 前記外部文書の物理的マークアップ表現が前記第一文書
    内に既に組込まれているか否かを決定するために前記外
    部文書の前記ダイジェストをテストする、上記各ステッ
    プを有することを特徴とする方法。
  26. 【請求項26】 請求項21において、前記外部文書が
    主要文書と1個又はそれ以上の補助文書とを有している
    ことを特徴とする方法。
  27. 【請求項27】 請求項26において、更に、 各補助文書を要約してそれぞれの補助文書ダイジェスト
    を作成し、 前記外部文書の物理的マークアップ表現が前記第一文書
    内に既に組込まれているか否かを決定するために各補助
    文書のデジタルダイジェストをテストする、上記各ステ
    ップを有することを特徴とする方法。
  28. 【請求項28】 請求項25において、前記デジタルダ
    イジェストが複合ダイジェストであることを特徴とする
    方法。
  29. 【請求項29】 主要文書と1個又はそれ以上の補助文
    書とを有するデータの集まりの区別用識別子を形成する
    方法において、 各補助文書を要約してそれぞれの補助文書ダイジェスト
    を作成し、 前記主要文書の全ての補助文書ダイジェストとの連結を
    要約することにより区別用識別子を作成する、上記各ス
    テップを有することを特徴とする方法。
  30. 【請求項30】 請求項29において、前記要約するス
    テップが、デジタルダイジェストアルゴリズムを適用す
    ることを特徴とする方法。
  31. 【請求項31】 請求項30において、前記デジタルダ
    イジェストアルゴリズムがMD5メッセージダイジェス
    トアルゴリズムであることを特徴とする方法。
  32. 【請求項32】 階層的ファイルシステム上の最初の文
    書へ推移的にリンクしている文書を検索する方法におい
    て、 前記最初の文書を検索し、 前記最初の文書からその他の文書へ推移的リンクが存在
    しており且つ前記推移的リンクが全て前記最初の文書と
    同一のディレクトリパス内にある文書を包含しているそ
    の他の文書のみを検索する、上記各ステップを有するこ
    とを特徴とする方法。
  33. 【請求項33】 請求項32において、前記階層的ファ
    イルシステムがネットワーク上に分散されていることを
    特徴とする方法。
  34. 【請求項34】 請求項32において、前記階層的ファ
    イルシステムがインターネット上で分散されていること
    を特徴とする方法。
  35. 【請求項35】 文書の意味論的マークアップ表現を前
    記文書の物理的マークアップ表現へ変換するためのコン
    ピュータによって読取り可能な媒体上に存在するコンピ
    ュータプログラムにおいて、コンピュータをして、 前記文書内の全てのスクリーンオブジェクトをそれらの
    通常の寸法で表示するために必要とされる最小幅に等し
    い論理的最小幅を計算させ、 前記文書の物理的マークアップ表現であって前記論理的
    最小幅と少なくとも同じ幅を有する物理的マークアップ
    表現を作成させ、 前記物理的マークアップ表現をターゲット寸法を含むタ
    ーゲット寸法へ適合させる、上記各命令を有しており、
    コンピュータをして前記物理的マークアップ表現を適合
    させる命令が、コンピュータをして、 前記論理的最小幅に対する前記ターゲット寸法の要素の
    比から派生したスケーリング係数によって前記物理的マ
    ークアップ表現の幅をスケーリングさせる、命令を有す
    ることを特徴とするコンピュータプログラム。
  36. 【請求項36】 請求項35において、更に、コンピュ
    ータをして、前記物理的マークアップ表現を新たに作成
    した文書内に組込ませる命令を有することを特徴とする
    コンピュータプログラム。
  37. 【請求項37】 請求項35において、更に、コンピュ
    ータをして、前記物理的マークアップ表現を既存の文書
    内に組込ませる命令を有することを特徴とするコンピュ
    ータプログラム。
  38. 【請求項38】 請求項35において、前記ターゲット
    寸法の前記要素がターゲット幅であることを特徴とする
    コンピュータプログラム。
  39. 【請求項39】 請求項35において、前記物理的マー
    クアップ表現が、各々がそれぞれの物理的幅とそれぞれ
    の物理的高さとを持った複数個の頁を含む頁付けした表
    現であることを特徴とするコンピュータプログラム。
  40. 【請求項40】 請求項39において、前記ターゲット
    寸法がターゲット高さを包含していることを特徴とする
    コンピュータプログラム。
  41. 【請求項41】 請求項40において、前記ターゲット
    寸法が標準の用紙寸法であることを特徴とするコンピュ
    ータプログラム。
  42. 【請求項42】 請求項41において、前記標準の用紙
    寸法が8. 5×11インチ、8. 5×14インチ、A
    4、A5、11×17インチのうちの一つであることを
    特徴とするコンピュータプログラム。
  43. 【請求項43】 請求項40において、前記物理的マー
    クアップ表現の頁が前記ターゲット寸法と同一のアスペ
    クト比を有していることを特徴とするコンピュータプロ
    グラム。
  44. 【請求項44】 請求項39において、コンピュータを
    して前記物理的マークアップ表現を適合させる命令が、
    コンピュータをして、前記スケーリング係数によって前
    記物理的マークアップ表現の高さをスケーリングさせる
    命令を有していることを特徴とするコンピュータプログ
    ラム。
  45. 【請求項45】 請求項44において、前記コンピュー
    タをして前記スケーリング係数によって前記物理的マー
    クアップ表現の高さをスケーリングさせる命令が、コン
    ピュータをして、前記スケーリング係数によって前記物
    理的マークアップ表現の頁高さをスケーリングさせる命
    令を有していることを特徴とするコンピュータプログラ
    ム。
  46. 【請求項46】 請求項40において、前記ターゲット
    寸法の前記要素がターゲット高さであることを特徴とす
    るコンピュータプログラム。
  47. 【請求項47】 請求項40において、前記コンピュー
    タをして物理的マークアップ表現を適合させる命令が、
    コンピュータをして、前記物理的マークアップ表現の頁
    を+又は−90°だけ回転させる命令を有することを特
    徴とするコンピュータプログラム。
  48. 【請求項48】 請求項47において、前記コンピュー
    タをして前記物理的マークアップ表現を前記ターゲット
    寸法へ適合させる命令が、コンピュータをして、前記論
    理的最小幅に対する前記ターゲット幅の比が特定したス
    レッシュホールド未満であるか否かをテストさせる命令
    を有することを特徴とするコンピュータシステム。
  49. 【請求項49】 請求項35において、前記文書が複数
    個のフレームを特定するフレームセットであることを特
    徴とするコンピュータプログラム。
  50. 【請求項50】 請求項35において、前記文書が少な
    くとも1個のハイパーテキストリンクを有しており、更
    に、コンピュータをして、 前記物理的マークアップ表現をビュア内に表示させ、 前記表示されたマークアップからユーザによってハイパ
    ーテキストリンクが選択される場合に外部文書へアクセ
    スさせる、上記各命令を有することを特徴とするコンピ
    ュータプログラム。
  51. 【請求項51】 請求項50において、前記ハイパーテ
    キストリンクがサーバ側イメージマップであることを特
    徴とするコンピュータプログラム。
  52. 【請求項52】 請求項35において、前記意味論的マ
    ークアップ表現がHTMLであることを特徴とするコン
    ピュータプログラム。
  53. 【請求項53】 請求項35において、前記物理的マー
    クアップ表現がPDFであることを特徴とするコンピュ
    ータプログラム。
  54. 【請求項54】 請求項35において、更に、コンピュ
    ータをして、 前記物理的マークアップ表現を前記ターゲット寸法へ適
    合させた後に、前記スケーリング係数の逆数によって前
    記物理的マークアップ表現をスケーリングさせ、 前記結果をビュア内に表示させる、上記各命令を有する
    ことを特徴とするコンピュータプログラム。
  55. 【請求項55】 コンピュータによって読取り可能な媒
    体上に存在しているコンピュータプログラムにおいて、
    コンピュータをして、 物理的マークアップ表現で表現されており且つ少なくと
    も1個のハイパーテキストリンクを包含する第一文書を
    ビュア内に表示させ、 ハイパーテキストリンクが前記表示された第一文書から
    ユーザによって選択された場合に外部文書へアクセスさ
    せ、 前記外部文書の前記意味論的マークアップ表現を物理的
    マークアップ表現へ変換させ、 前記外部文書の物理的マークアップ表現を前記第一文書
    内に組込ませる、上記各ステップを有することを特徴と
    するコンピュータプログラム。
  56. 【請求項56】 請求項55において、更に、コンピュ
    ータをして、前記外部文書の物理的マークアップ表現へ
    ポイントさせるようにハイパーテキストリンクを修正さ
    せる命令を有することを特徴とするコンピュータプログ
    ラム。
  57. 【請求項57】 請求項56において、更に、コンピュ
    ータをして、前記ハイパーテキストリンクの元の状態を
    保存させる命令を有することを特徴とするコンピュータ
    プログラム。
  58. 【請求項58】 請求項57において、更に、コンピュ
    ータをして、前記第一文書の一部を削除する動作に応答
    して、前記削除した部分にポイントしていたハイパーテ
    キストリンクをその元の状態へ復帰させる命令を有する
    ことを特徴とするコンピュータプログラム。
  59. 【請求項59】 請求項55において、更に、コンピュ
    ータをして、 前記外部文書を要約して前記外部文書のダイジェストを
    作成させ、 前記外部文書の前記物理的マークアップ表現が既に前記
    第一文書内に組込まれているか否かを決定するために前
    記外部文書のダイジェストをテストさせる、上記各命令
    を有することを特徴とするコンピュータプログラム。
  60. 【請求項60】 請求項55において、前記外部文書が
    主要文書及び1個又はそれ以上の補助文書を有している
    ことを特徴とするコンピュータプログラム。
  61. 【請求項61】 請求項60において、更に、コンピュ
    ータをして、 各補助文書を要約してそれぞれの補助文書ダイジェスト
    を作成させ、 前記外部文書の物理的マークアップ表現が既に前記第一
    文書内へ組込まれているか否かを決定するために各補助
    文書のデジタルダイジェストをテストさせる、上記各命
    令を有することを特徴とするコンピュータプログラム。
  62. 【請求項62】 請求項59において、前記デジタルダ
    イジェストが複合ダイジェストであることを特徴とする
    コンピュータプログラム。
  63. 【請求項63】 主要文書と1個又はそれ以上の補助文
    書とを有するデータの集まりの区別用識別子を作成する
    ためのコンピュータによって読取り可能な媒体上に存在
    しているコンピュータプログラムにおいて、コンピュー
    タをして、 それぞれの補助文書ダイジェストを作成するために各補
    助文書を要約させ、 前記主要文書と全ての補助文書ダイジェストとの連結を
    要約することによって区別用識別子を作成させる、上記
    各命令を有することを特徴とするコンピュータプログラ
    ム。
  64. 【請求項64】 請求項63において、前記コンピュー
    タをして要約させる命令が、コンピュータをしてデジタ
    ルダイジェストアルゴリズムを適用させる命令を有して
    いることを特徴とするコンピュータプログラム。
  65. 【請求項65】 請求項64において、前記デジタルダ
    イジェストアルゴリズムがMD5メッセージダイジェス
    トアルゴリズムであることを特徴とするコンピュータプ
    ログラム。
  66. 【請求項66】 階層的ファイルシステム上の最初の文
    書へ推移的にリンクされている文書を検索するためのコ
    ンピュータによって読取り可能な媒体上に存在している
    コンピュータプログラムにおいて、コンピュータをし
    て、 前記最初の文書を検索させ、 前記最初の文書からその他の文書への推移的リンクが存
    在しており且つ前記推移的リンクが前記最初の文書と同
    一のディレクトリパス内に存在する全ての文書を包含し
    ているその他の文書のみを検索させる、上記各命令を有
    することを特徴とするコンピュータプログラム。
  67. 【請求項67】 請求項66において、前記階層的ファ
    イルシステムがネットワーク上に分散されていることを
    特徴とするコンピュータプログラム。
  68. 【請求項68】 請求項66において、前記階層的ファ
    イルシステムがインターネット上に分散されていること
    を特徴とするコンピュータプログラム。
JP10325495A 1997-11-14 1998-11-16 頁付けした文書内の頁付けしていないハイパーテキストの捕獲 Pending JPH11232267A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/970743 1997-11-14
US08/970,743 US6415278B1 (en) 1997-11-14 1997-11-14 Retrieving documents transitively linked to an initial document

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2008321351A Division JP4805336B2 (ja) 1997-11-14 2008-12-17 頁付けした文書内の頁付けしていないハイパーテキストの捕獲

Publications (1)

Publication Number Publication Date
JPH11232267A true JPH11232267A (ja) 1999-08-27

Family

ID=25517442

Family Applications (2)

Application Number Title Priority Date Filing Date
JP10325495A Pending JPH11232267A (ja) 1997-11-14 1998-11-16 頁付けした文書内の頁付けしていないハイパーテキストの捕獲
JP2008321351A Expired - Lifetime JP4805336B2 (ja) 1997-11-14 2008-12-17 頁付けした文書内の頁付けしていないハイパーテキストの捕獲

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2008321351A Expired - Lifetime JP4805336B2 (ja) 1997-11-14 2008-12-17 頁付けした文書内の頁付けしていないハイパーテキストの捕獲

Country Status (6)

Country Link
US (4) US6415278B1 (ja)
EP (2) EP1821222B1 (ja)
JP (2) JPH11232267A (ja)
CA (1) CA2252181A1 (ja)
DE (1) DE69839175T2 (ja)
HK (1) HK1110664A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4510232B2 (ja) * 2000-05-31 2010-07-21 キヤノン株式会社 情報処理装置および情報処理方法および記憶媒体
JP4536872B2 (ja) * 2000-05-31 2010-09-01 キヤノン株式会社 情報処理装置および情報処理方法および記憶媒体

Families Citing this family (104)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6415278B1 (en) * 1997-11-14 2002-07-02 Adobe Systems Incorporated Retrieving documents transitively linked to an initial document
US6789080B1 (en) 1997-11-14 2004-09-07 Adobe Systems Incorporated Retrieving documents transitively linked to an initial document
US7257589B1 (en) * 1997-12-22 2007-08-14 Ricoh Company, Ltd. Techniques for targeting information to users
US7124093B1 (en) 1997-12-22 2006-10-17 Ricoh Company, Ltd. Method, system and computer code for content based web advertising
TW428146B (en) * 1999-05-05 2001-04-01 Inventec Corp Data file updating method by increment
DE60015764T2 (de) 1999-05-28 2005-11-03 Nokia Corp. Benutzerschnittstelle und server für interaktive dienste
US6675351B1 (en) * 1999-06-15 2004-01-06 Sun Microsystems, Inc. Table layout for a small footprint device
US6886036B1 (en) * 1999-11-02 2005-04-26 Nokia Corporation System and method for enhanced data access efficiency using an electronic book over data networks
US7765271B1 (en) * 2000-02-03 2010-07-27 Hyland Software, Inc. System and method for scanning a document in client/server environment
WO2001057717A1 (en) * 2000-02-07 2001-08-09 4Media Group Ag Document pagination system and process
US6819339B1 (en) * 2000-02-24 2004-11-16 Eric Morgan Dowling Web browser with multilevel functions
US20010049707A1 (en) * 2000-02-29 2001-12-06 Tran Bao Q. Systems and methods for generating intellectual property
US20010049700A1 (en) * 2000-05-26 2001-12-06 Shinobu Ichikura Information processing apparatus, information processing method and storage medium
US6556217B1 (en) * 2000-06-01 2003-04-29 Nokia Corporation System and method for content adaptation and pagination based on terminal capabilities
US6938083B1 (en) * 2000-07-21 2005-08-30 Unisys Corporation Method of providing duplicate original file copies of a searched topic from multiple file types derived from the web
US6654758B1 (en) * 2000-07-21 2003-11-25 Unisys Corporation Method for searching multiple file types on a CD ROM
JP3703080B2 (ja) * 2000-07-27 2005-10-05 インターナショナル・ビジネス・マシーンズ・コーポレーション ウェブコンテンツを簡略化するための方法、システムおよび媒体
US7073122B1 (en) * 2000-09-08 2006-07-04 Sedghi Ali R Method and apparatus for extracting structured data from HTML pages
US7408657B2 (en) 2000-09-19 2008-08-05 Fuji Xerox Co., Ltd. Image input and output system, method and recording medium having a common initiation portion
FR2814562A1 (fr) * 2000-09-22 2002-03-29 Cytale Procede pour afficher un document numerique, dispositif electronique, logiciel, publication numerique, support de donneees et procede de telechargement
US20020073149A1 (en) * 2000-10-11 2002-06-13 Young Christopher Tyler Dynamic content linking
ATE288103T1 (de) * 2000-11-21 2005-02-15 Juergen Kohn Verfahren und vorrichtung zum darstellen eines aus pixeln aufgebauten bildes
US7003551B2 (en) 2000-11-30 2006-02-21 Bellsouth Intellectual Property Corp. Method and apparatus for minimizing storage of common attachment files in an e-mail communications server
US6948116B2 (en) * 2000-12-01 2005-09-20 International Business Machines Corporation System and method for creating a unified printable collection of hyperlinked documents
US7013309B2 (en) * 2000-12-18 2006-03-14 Siemens Corporate Research Method and apparatus for extracting anchorable information units from complex PDF documents
FR2823942A1 (fr) * 2001-04-24 2002-10-25 Koninkl Philips Electronics Nv Dispositif pour une conversion d'un format bifs textuel vers un format bifs binaire
US8392827B2 (en) * 2001-04-30 2013-03-05 International Business Machines Corporation Method for generation and assembly of web page content
US20030030840A1 (en) * 2001-08-10 2003-02-13 Parry Travis J. Direct printing from internet database
US20040205488A1 (en) * 2001-11-27 2004-10-14 Fry Randolph Allan Active web page for editing with any browser
US6862592B1 (en) * 2001-12-21 2005-03-01 Adobe Systems Incorporated Document processing in a cross-platform environment
US7213269B2 (en) 2002-02-21 2007-05-01 Adobe Systems Incorporated Application rights enabling
JP2004086845A (ja) * 2002-06-27 2004-03-18 Oki Electric Ind Co Ltd 電子文書情報拡充装置、方法及びプログラム、並びに、電子文書情報拡充プログラムを記録した記録媒体
US7278168B1 (en) 2002-11-27 2007-10-02 Adobe Systems Incorporated Dynamic enabling of functionality in electronic document readers
US7356768B1 (en) 2002-11-27 2008-04-08 Adobe Systems Incorporated Using document templates to assemble a collection of documents
US8660960B2 (en) 2002-11-27 2014-02-25 Adobe Systems Incorporated Document digest allowing selective changes to a document
JP2004303160A (ja) * 2003-04-01 2004-10-28 Oki Electric Ind Co Ltd 情報抽出装置
US7315947B2 (en) * 2003-05-20 2008-01-01 Adobe Systems Incorporated Author signatures for legal purposes
US7359963B1 (en) * 2003-06-09 2008-04-15 Microsoft Corporation System and method for maintaining and publishing web site content
US20050166137A1 (en) * 2004-01-26 2005-07-28 Bao Tran Systems and methods for analyzing documents
US20050210008A1 (en) * 2004-03-18 2005-09-22 Bao Tran Systems and methods for analyzing documents over a network
JP4424038B2 (ja) * 2004-03-31 2010-03-03 セイコーエプソン株式会社 印刷管理システムおよび印刷管理装置並びにこれらに用いるプログラム
US7461170B1 (en) * 2004-09-01 2008-12-02 Microsoft Corporation Zone-based rendering of resource addresses
US8949287B2 (en) 2005-08-23 2015-02-03 Ricoh Co., Ltd. Embedding hot spots in imaged documents
US8332401B2 (en) 2004-10-01 2012-12-11 Ricoh Co., Ltd Method and system for position-based image matching in a mixed media environment
US8510283B2 (en) 2006-07-31 2013-08-13 Ricoh Co., Ltd. Automatic adaption of an image recognition system to image capture devices
US8600989B2 (en) 2004-10-01 2013-12-03 Ricoh Co., Ltd. Method and system for image matching in a mixed media environment
US8856108B2 (en) * 2006-07-31 2014-10-07 Ricoh Co., Ltd. Combining results of image retrieval processes
US8184155B2 (en) 2007-07-11 2012-05-22 Ricoh Co. Ltd. Recognition and tracking using invisible junctions
US8276088B2 (en) 2007-07-11 2012-09-25 Ricoh Co., Ltd. User interface for three-dimensional navigation
US8176054B2 (en) 2007-07-12 2012-05-08 Ricoh Co. Ltd Retrieving electronic documents by converting them to synthetic text
US7702673B2 (en) 2004-10-01 2010-04-20 Ricoh Co., Ltd. System and methods for creation and use of a mixed media environment
US7920759B2 (en) 2005-08-23 2011-04-05 Ricoh Co. Ltd. Triggering applications for distributed action execution and use of mixed media recognition as a control input
US8385589B2 (en) * 2008-05-15 2013-02-26 Berna Erol Web-based content detection in images, extraction and recognition
US8156116B2 (en) 2006-07-31 2012-04-10 Ricoh Co., Ltd Dynamic presentation of targeted information in a mixed media reality recognition system
US9373029B2 (en) 2007-07-11 2016-06-21 Ricoh Co., Ltd. Invisible junction feature recognition for document security or annotation
US8838591B2 (en) 2005-08-23 2014-09-16 Ricoh Co., Ltd. Embedding hot spots in electronic documents
US8156115B1 (en) 2007-07-11 2012-04-10 Ricoh Co. Ltd. Document-based networking with mixed media reality
US8335789B2 (en) 2004-10-01 2012-12-18 Ricoh Co., Ltd. Method and system for document fingerprint matching in a mixed media environment
US8521737B2 (en) 2004-10-01 2013-08-27 Ricoh Co., Ltd. Method and system for multi-tier image matching in a mixed media environment
US7991778B2 (en) 2005-08-23 2011-08-02 Ricoh Co., Ltd. Triggering actions with captured input in a mixed media environment
US9405751B2 (en) 2005-08-23 2016-08-02 Ricoh Co., Ltd. Database for mixed media document system
US7970171B2 (en) 2007-01-18 2011-06-28 Ricoh Co., Ltd. Synthetic image and video generation from ground truth data
US8868555B2 (en) 2006-07-31 2014-10-21 Ricoh Co., Ltd. Computation of a recongnizability score (quality predictor) for image retrieval
US8156427B2 (en) 2005-08-23 2012-04-10 Ricoh Co. Ltd. User interface for mixed media reality
US8195659B2 (en) 2005-08-23 2012-06-05 Ricoh Co. Ltd. Integration and use of mixed media documents
US8369655B2 (en) * 2006-07-31 2013-02-05 Ricoh Co., Ltd. Mixed media reality recognition using multiple specialized indexes
US7812986B2 (en) * 2005-08-23 2010-10-12 Ricoh Co. Ltd. System and methods for use of voice mail and email in a mixed media environment
US9171202B2 (en) 2005-08-23 2015-10-27 Ricoh Co., Ltd. Data organization and access for mixed media document system
US8144921B2 (en) 2007-07-11 2012-03-27 Ricoh Co., Ltd. Information retrieval using invisible junctions and geometric constraints
US8086038B2 (en) * 2007-07-11 2011-12-27 Ricoh Co., Ltd. Invisible junction features for patch recognition
US9530050B1 (en) 2007-07-11 2016-12-27 Ricoh Co., Ltd. Document annotation sharing
US8825682B2 (en) * 2006-07-31 2014-09-02 Ricoh Co., Ltd. Architecture for mixed media reality retrieval of locations and registration of images
US8005831B2 (en) 2005-08-23 2011-08-23 Ricoh Co., Ltd. System and methods for creation and use of a mixed media environment with geographic location information
US9384619B2 (en) 2006-07-31 2016-07-05 Ricoh Co., Ltd. Searching media content for objects specified using identifiers
US8156428B1 (en) * 2005-02-25 2012-04-10 Adobe Systems Incorporated Method and apparatus for merging digital content
US8683312B2 (en) 2005-06-16 2014-03-25 Adobe Systems Incorporated Inter-document links involving embedded documents
JP4906072B2 (ja) * 2006-05-01 2012-03-28 キヤノン株式会社 情報処理装置ならびに情報処理方法
US8489987B2 (en) 2006-07-31 2013-07-16 Ricoh Co., Ltd. Monitoring and analyzing creation and usage of visual content using image and hotspot interaction
US9020966B2 (en) 2006-07-31 2015-04-28 Ricoh Co., Ltd. Client device for interacting with a mixed media reality recognition system
US9063952B2 (en) * 2006-07-31 2015-06-23 Ricoh Co., Ltd. Mixed media reality recognition with image tracking
US8073263B2 (en) * 2006-07-31 2011-12-06 Ricoh Co., Ltd. Multi-classifier selection and monitoring for MMR-based image recognition
US8201076B2 (en) 2006-07-31 2012-06-12 Ricoh Co., Ltd. Capturing symbolic information from documents upon printing
US8676810B2 (en) 2006-07-31 2014-03-18 Ricoh Co., Ltd. Multiple index mixed media reality recognition using unequal priority indexes
US9176984B2 (en) 2006-07-31 2015-11-03 Ricoh Co., Ltd Mixed media reality retrieval of differentially-weighted links
US8490117B1 (en) 2006-10-23 2013-07-16 Adobe Systems Incorporated Bridging script engines
US8020089B1 (en) 2006-10-23 2011-09-13 Adobe Systems Incorporated Rendering hypertext markup language content
US7614003B2 (en) * 2006-10-23 2009-11-03 Adobe Systems Incorporated Rendering hypertext markup language content
US7853887B2 (en) 2007-06-26 2010-12-14 Adobe Systems Incorporated Detection and preview of graphical elements within a graphic
US8161023B2 (en) * 2008-10-13 2012-04-17 Internatioanal Business Machines Corporation Inserting a PDF shared resource back into a PDF statement
US8385660B2 (en) 2009-06-24 2013-02-26 Ricoh Co., Ltd. Mixed media reality indexing and retrieval for repeated content
US8099397B2 (en) * 2009-08-26 2012-01-17 International Business Machines Corporation Apparatus, system, and method for improved portable document format (“PDF”) document archiving
US9049117B1 (en) * 2009-10-21 2015-06-02 Narus, Inc. System and method for collecting and processing information of an internet user via IP-web correlation
US8375285B2 (en) * 2009-12-15 2013-02-12 International Business Machines Corporation Enabling access to data files unsupported by a computing device
US20110221766A1 (en) * 2010-03-09 2011-09-15 Designmade Co., Ltd. Method for printing a captured screen of web pages
US8799260B2 (en) * 2010-12-17 2014-08-05 Yahoo! Inc. Method and system for generating web pages for topics unassociated with a dominant URL
US9058331B2 (en) 2011-07-27 2015-06-16 Ricoh Co., Ltd. Generating a conversation in a social network based on visual search results
US20140129927A1 (en) * 2012-11-02 2014-05-08 Tencent Technology (Shenzhen) Company Limited Page browsing method and browser
CN103793436B (zh) * 2012-11-02 2019-04-02 腾讯科技(深圳)有限公司 浏览页面的方法及浏览器
US9258126B2 (en) * 2012-12-13 2016-02-09 Xerox Corporation Method for non-repudiation of ad-hoc workflows
US9632986B2 (en) * 2013-03-14 2017-04-25 Aol Inc. Systems and methods for horizontally paginating HTML content
US10248630B2 (en) * 2014-12-22 2019-04-02 Microsoft Technology Licensing, Llc Dynamic adjustment of select elements of a document
WO2018022068A1 (en) * 2016-07-28 2018-02-01 Hewlett-Packard Development Company, L.P. Document content resizing
RU177072U1 (ru) * 2017-03-24 2018-02-07 Федеральное государственное казенное образовательное учреждение высшего образования "Волгоградская академия Министерства внутренних дел Российской Федерации" (Волгоградская академия МВД России) Устройство установления содержания документов, повреждённых механическим способом
US11055475B2 (en) 2019-05-03 2021-07-06 Microsoft Technology Licensing, Llc Cross-browser techniques for efficient document pagination

Family Cites Families (103)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5043891A (en) * 1985-08-16 1991-08-27 Wang Laboratories, Inc. Document generation apparatus and methods
US4945475A (en) * 1986-10-30 1990-07-31 Apple Computer, Inc. Hierarchical file system to provide cataloging and retrieval of data
GB8704883D0 (en) 1987-03-03 1987-04-08 Hewlett Packard Co Secure information storage
US5228121A (en) * 1989-09-29 1993-07-13 Digital Equipment Corporation Document generation using information engineering
CA2056865C (en) * 1990-12-11 1999-01-05 Barbara Clapp Interactive computerized document assembly system
US5301286A (en) * 1991-01-02 1994-04-05 At&T Bell Laboratories Memory archiving indexing arrangement
JPH06266702A (ja) 1993-03-11 1994-09-22 Ricoh Co Ltd 文書処理装置
JPH06301732A (ja) 1993-04-13 1994-10-28 Hitachi Ltd 文書検索処理方法
JP2620576B2 (ja) 1993-04-15 1997-06-18 インターナショナル・ビジネス・マシーンズ・コーポレイション ユーザが要求したフォントに従ってグラフィカル・ユーザ・インターフェースを調節する方法及びシステム
US5446653A (en) * 1993-05-10 1995-08-29 Aetna Casualty And Surety Company Rule based document generation system
US5367573A (en) * 1993-07-02 1994-11-22 Digital Equipment Corporation Signature data object
JPH07121344A (ja) 1993-10-21 1995-05-12 Fuji Xerox Co Ltd 文書表示装置
JPH07160683A (ja) 1993-12-13 1995-06-23 Hitachi Ltd 情報処理方法及び情報処理装置
JPH07319924A (ja) * 1994-05-24 1995-12-08 Matsushita Electric Ind Co Ltd 手書き電子文書のインデックス付けおよび探索方法
US5694546A (en) * 1994-05-31 1997-12-02 Reisman; Richard R. System for automatic unattended electronic information transport between a server and a client by a vendor provided transport software with a manifest list
US6769009B1 (en) * 1994-05-31 2004-07-27 Richard R. Reisman Method and system for selecting a personalized set of information channels
EP0804769B1 (en) * 1994-06-30 2000-02-02 International Business Machines Corporation Variable length data sequence matching method and apparatus
EP0701220B1 (en) * 1994-09-12 2001-07-04 Adobe Systems Inc. Method and apparatus for viewing electronic documents
NZ296340A (en) * 1994-10-28 2000-01-28 Surety Technologies Inc Digital identification and authentication of documents by creating repository of hash values based on documents
US5530852A (en) 1994-12-20 1996-06-25 Sun Microsystems, Inc. Method for extracting profiles and topics from a first file written in a first markup language and generating files in different markup languages containing the profiles and topics for use in accessing data described by the profiles and topics
US5873077A (en) * 1995-01-13 1999-02-16 Ricoh Corporation Method and apparatus for searching for and retrieving documents using a facsimile machine
US6115723A (en) 1995-04-27 2000-09-05 International Business Machines Corporation System and method for converting a coordinate based document to a markup language (ML) based document
JP3338585B2 (ja) * 1995-05-16 2002-10-28 富士通株式会社 プレゼンテーションデータの変換装置及び方法
US6230173B1 (en) * 1995-07-17 2001-05-08 Microsoft Corporation Method for creating structured documents in a publishing system
US6209004B1 (en) * 1995-09-01 2001-03-27 Taylor Microtechnology Inc. Method and system for generating and distributing document sets using a relational database
US5572643A (en) 1995-10-19 1996-11-05 Judson; David H. Web browser with dynamic display of information objects during linking
US5963966A (en) * 1995-11-08 1999-10-05 Cybernet Systems Corporation Automated capture of technical documents for electronic review and distribution
US6157649A (en) * 1995-11-17 2000-12-05 3 Com Corporation Method and system for coordination and control of data streams that terminate at different termination units using virtual tunneling
US5930813A (en) * 1995-12-21 1999-07-27 Adobe Systems Incorporated Method and system for designating objects
JP3622313B2 (ja) * 1996-01-29 2005-02-23 株式会社日立製作所 ドキュメント管理システム
US5659729A (en) * 1996-02-01 1997-08-19 Sun Microsystems, Inc. Method and system for implementing hypertext scroll attributes
US6167409A (en) * 1996-03-01 2000-12-26 Enigma Information Systems Ltd. Computer system and method for customizing context information sent with document fragments across a computer network
US5745908A (en) * 1996-03-29 1998-04-28 Systems Focus International Method for converting a word processing file containing markup language tags and conventional computer code
US5864852A (en) * 1996-04-26 1999-01-26 Netscape Communications Corporation Proxy server caching mechanism that provides a file directory structure and a mapping mechanism within the file directory structure
US5764908A (en) * 1996-07-12 1998-06-09 Sofmap Future Design, Inc. Network system containing program modules residing in different computers and executing commands without return results to calling modules
US5987480A (en) * 1996-07-25 1999-11-16 Donohue; Michael Method and system for delivering documents customized for a particular user over the internet using imbedded dynamic content
US5892908A (en) * 1996-09-10 1999-04-06 Marketscape Method of extracting network information
US6029182A (en) * 1996-10-04 2000-02-22 Canon Information Systems, Inc. System for generating a custom formatted hypertext document by using a personal profile to retrieve hierarchical documents
US5809250A (en) * 1996-10-23 1998-09-15 Intel Corporation Methods for creating and sharing replayable modules representive of Web browsing session
US6096096A (en) * 1996-12-13 2000-08-01 Silicon Graphics, Inc. Web-site delivery
US5937406A (en) * 1997-01-31 1999-08-10 Informix Software, Inc. File system interface to a database
US6026433A (en) * 1997-03-17 2000-02-15 Silicon Graphics, Inc. Method of creating and editing a web site in a client-server environment using customizable web site templates
US6005945A (en) * 1997-03-20 1999-12-21 Psi Systems, Inc. System and method for dispensing postage based on telephonic or web milli-transactions
US6038573A (en) * 1997-04-04 2000-03-14 Avid Technology, Inc. News story markup language and system and process for editing and processing documents
US6081907A (en) * 1997-06-09 2000-06-27 Microsoft Corporation Data delivery system and method for delivering data and redundant information over a unidirectional network
US6308188B1 (en) * 1997-06-19 2001-10-23 International Business Machines Corporation System and method for building a web site with automated workflow
US20020107946A1 (en) * 1997-06-30 2002-08-08 Michael C. Albers Method and apparatus maintaining a to-be-visited site bookmark file
US6157917A (en) * 1997-07-11 2000-12-05 Barber; Timothy P. Bandwidth-preserving method of charging for pay-per-access information on a network
US6061700A (en) * 1997-08-08 2000-05-09 International Business Machines Corporation Apparatus and method for formatting a web page
US6072461A (en) * 1997-08-15 2000-06-06 Haran; Yossi Apparatus and method for facilitating document generation
US5987482A (en) * 1997-09-08 1999-11-16 International Business Machines Corporation Computer system and method of displaying hypertext documents with internal hypertext link definitions
US5991878A (en) * 1997-09-08 1999-11-23 Fmr Corp. Controlling access to information
US6192382B1 (en) * 1997-09-24 2001-02-20 Mediaone Group, Inc. Method and system for web site construction using HTML fragment caching
US6615258B1 (en) * 1997-09-26 2003-09-02 Worldcom, Inc. Integrated customer interface for web based data management
US6810404B1 (en) * 1997-10-08 2004-10-26 Scansoft, Inc. Computer-based document management system
US6237011B1 (en) * 1997-10-08 2001-05-22 Caere Corporation Computer-based document management system
US5940843A (en) * 1997-10-08 1999-08-17 Multex Systems, Inc. Information delivery system and method including restriction processing
US6061698A (en) * 1997-10-22 2000-05-09 International Business Machines Corporation Merging tagged documents and scripts having dynamic content
US6035323A (en) * 1997-10-24 2000-03-07 Pictra, Inc. Methods and apparatuses for distributing a collection of digital media over a network with automatic generation of presentable media
US6594682B2 (en) * 1997-10-28 2003-07-15 Microsoft Corporation Client-side system for scheduling delivery of web content and locally managing the web content
US6415278B1 (en) * 1997-11-14 2002-07-02 Adobe Systems Incorporated Retrieving documents transitively linked to an initial document
US6789080B1 (en) * 1997-11-14 2004-09-07 Adobe Systems Incorporated Retrieving documents transitively linked to an initial document
US6263352B1 (en) * 1997-11-14 2001-07-17 Microsoft Corporation Automated web site creation using template driven generation of active server page applications
US6208995B1 (en) * 1997-11-24 2001-03-27 International Business Machines Corporation Web browser download of bookmark set
US6389437B2 (en) 1998-01-07 2002-05-14 Ion Systems, Inc. System for converting scrolling display to non-scrolling columnar display
US6243740B1 (en) * 1998-02-13 2001-06-05 Xerox Corporation Public interactive document
US6493758B1 (en) * 1998-09-08 2002-12-10 Microsoft Corporation Offline viewing of internet content with a mobile device
US7085997B1 (en) * 1998-12-08 2006-08-01 Yodlee.Com Network-based bookmark management and web-summary system
US6605120B1 (en) * 1998-12-10 2003-08-12 International Business Machines Corporation Filter definition for distribution mechanism for filtering, formatting and reuse of web based content
US6460060B1 (en) * 1999-01-26 2002-10-01 International Business Machines Corporation Method and system for searching web browser history
US6313835B1 (en) * 1999-04-09 2001-11-06 Zapa Digital Arts Ltd. Simplified on-line preparation of dynamic web sites
US6237060B1 (en) * 1999-04-23 2001-05-22 Sun Microsystems, Inc. Cache management techniques
US20010047375A1 (en) * 1999-07-14 2001-11-29 Marcus Fest Method for selecting multiple hyperlinks
US6538673B1 (en) * 1999-08-23 2003-03-25 Divine Technology Ventures Method for extracting digests, reformatting, and automatic monitoring of structured online documents based on visual programming of document tree navigation and transformation
US6449636B1 (en) * 1999-09-08 2002-09-10 Nortel Networks Limited System and method for creating a dynamic data file from collected and filtered web pages
US6907463B1 (en) * 1999-10-19 2005-06-14 Audiogalaxy, Inc. System and method for enabling file transfers executed in a network environment by a software program
US6351755B1 (en) * 1999-11-02 2002-02-26 Alta Vista Company System and method for associating an extensible set of data with documents downloaded by a web crawler
US6441996B1 (en) * 1999-11-03 2002-08-27 Jin-Sheng Weng Device for cleaning magnetic head of a disk drive
US6864904B1 (en) * 1999-12-06 2005-03-08 Girafa.Com Inc. Framework for providing visual context to www hyperlinks
US7103566B2 (en) * 2000-02-23 2006-09-05 Lucent Technologies Inc. Applications of executable shopping lists
US7099950B2 (en) * 2000-03-13 2006-08-29 At&T Corp. Method and apparatus for using XML for both a protocol layer and application layer
US20010047326A1 (en) * 2000-03-14 2001-11-29 Broadbent David F. Interface system for a mortgage loan originator compliance engine
EP1428142A2 (en) * 2000-03-22 2004-06-16 Sidestep, Inc. Method and apparatus for dynamic information connection engine
US6681255B1 (en) * 2000-04-19 2004-01-20 Icplanet Corporation Regulating rates of requests by a spider engine to web sites by creating instances of a timing module
US20020065851A1 (en) * 2000-06-02 2002-05-30 Watson Emerson C. System and method for creating a website
US7152058B2 (en) 2000-07-13 2006-12-19 Biap Systems, Inc. Apparatus for and method of selectively retrieving information and enabling its subsequent display
US6990633B1 (en) * 2000-07-28 2006-01-24 Seiko Epson Corporation Providing a network-based personalized newspaper with personalized content and layout
AU2001278095A1 (en) * 2000-07-31 2002-02-13 James A. Starkey Method and apparatus for generating web pages from templates
US7152203B2 (en) * 2000-09-11 2006-12-19 Appeon Corporation Independent update and assembly of web page elements
US20020103828A1 (en) * 2001-01-26 2002-08-01 Abb Automation Inc. System and method for world wide web based mapping of multiple system name spaces
US6925594B2 (en) * 2001-02-28 2005-08-02 International Business Machines Corporation Saving selected hyperlinks for retrieval of the hyperlinked documents upon selection of a finished reading button in a web browser
US20040030741A1 (en) * 2001-04-02 2004-02-12 Wolton Richard Ernest Method and apparatus for search, visual navigation, analysis and retrieval of information from networks with remote notification and content delivery
US20020152245A1 (en) * 2001-04-05 2002-10-17 Mccaskey Jeffrey Web publication of newspaper content
US20020178190A1 (en) * 2001-05-22 2002-11-28 Allison Pope Systems and methods for integrating mainframe and client-server data into automatically generated business correspondence
US20020188633A1 (en) * 2001-06-06 2002-12-12 Craig Davis Generating HTML using templates and cached files
US20020198962A1 (en) * 2001-06-21 2002-12-26 Horn Frederic A. Method, system, and computer program product for distributing a stored URL and web document set
JP2003108475A (ja) * 2001-09-27 2003-04-11 Brother Ind Ltd 通信システム、通信装置、およびコンピュータプログラム
US7447990B2 (en) * 2002-01-03 2008-11-04 International Business Machines Corporation Method for creating a reusable list, saving it in a clipboard, and accessing a current document version by selecting a hyperlink on the list
US20030135824A1 (en) * 2002-01-15 2003-07-17 International Business Machines Corporation System for delayed viewing of selected documents hyperlinked to hypertext documents received at a user interactive receiving display station in a computer controlled communication network
US7610339B2 (en) * 2002-03-04 2009-10-27 Datawitness Online Ltd. Internet-based communications verification system
US7689899B2 (en) * 2002-03-06 2010-03-30 Ge Corporate Financial Services, Inc. Methods and systems for generating documents
US7900147B2 (en) * 2002-07-22 2011-03-01 International Business Machines Corporation System and method for enabling disconnected web access
US20050091340A1 (en) * 2003-10-01 2005-04-28 International Business Machines Corporation Processing interactive content offline

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4510232B2 (ja) * 2000-05-31 2010-07-21 キヤノン株式会社 情報処理装置および情報処理方法および記憶媒体
JP4536872B2 (ja) * 2000-05-31 2010-09-01 キヤノン株式会社 情報処理装置および情報処理方法および記憶媒体

Also Published As

Publication number Publication date
EP0917071A3 (en) 2001-02-28
EP0917071A2 (en) 1999-05-19
HK1110664A1 (en) 2008-07-18
JP2009104628A (ja) 2009-05-14
US8005843B2 (en) 2011-08-23
US20020073074A1 (en) 2002-06-13
US6415278B1 (en) 2002-07-02
EP1821222A3 (en) 2007-12-12
EP1821222A2 (en) 2007-08-22
CA2252181A1 (en) 1999-05-14
US7937409B2 (en) 2011-05-03
JP4805336B2 (ja) 2011-11-02
DE69839175T2 (de) 2009-02-26
US20080222091A1 (en) 2008-09-11
US20080252912A1 (en) 2008-10-16
DE69839175D1 (de) 2008-04-10
EP0917071B1 (en) 2008-02-27
EP1821222B1 (en) 2011-05-18
US6567799B2 (en) 2003-05-20

Similar Documents

Publication Publication Date Title
JPH11232267A (ja) 頁付けした文書内の頁付けしていないハイパーテキストの捕獲
US7177948B1 (en) Method and apparatus for enhancing online searching
US7401067B2 (en) Retrieving documents transitively linked to an initial document
US6456305B1 (en) Method and system for automatically fitting a graphical display of objects to the dimensions of a display window
US8826121B2 (en) Magnifying the text of a link while still retaining browser function in the magnified display
US7085999B2 (en) Information processing system, proxy server, web page display method, storage medium, and program transmission apparatus
KR101121070B1 (ko) 큰 오브젝트를 작은 디스플레이 위에 표현
US20040205514A1 (en) Hyperlink preview utility and method
US8181102B2 (en) Creating bookmark symlinks
US20140052778A1 (en) Method and apparatus for mapping a site on a wide area network
US20060015821A1 (en) Document display system
JP4248411B2 (ja) 文書を表示するための方法、システム、コンピュータプログラムおよび記憶装置
JP2006114012A (ja) 電子文書への最適アクセス
US20190073342A1 (en) Presentation of electronic information
US20110191328A1 (en) System and method for extracting representative media content from an online document
JP2002055872A (ja) ウェブコンテンツを簡略化するための方法、システムおよび媒体
WO1999040507A1 (en) Method of updating display frames while preserving information associated therewith
US7047487B1 (en) Methods for formatting electronic documents
US20050131859A1 (en) Method and system for standard bookmark classification of web sites
CN117591223A (zh) 终端设备中基于微件进行数据展示的方法及相关设备
WO2005098666A1 (en) Processing data and documents that use a markup language
Grabowski The Web Publisher’s Illustrated Quick Reference: Covers HTML 3.2 and VRML 2.0
Grabowski et al. Alphabetical HTML 3.2 Reference

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20051116

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070821

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071121

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080212

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080512

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080819