[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN1799051B - 使用页面存储文件浏览内容的方法 - Google Patents

使用页面存储文件浏览内容的方法 Download PDF

Info

Publication number
CN1799051B
CN1799051B CN2004800153139A CN200480015313A CN1799051B CN 1799051 B CN1799051 B CN 1799051B CN 2004800153139 A CN2004800153139 A CN 2004800153139A CN 200480015313 A CN200480015313 A CN 200480015313A CN 1799051 B CN1799051 B CN 1799051B
Authority
CN
China
Prior art keywords
storage file
request object
file
management information
uri
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2004800153139A
Other languages
English (en)
Other versions
CN1799051A (zh
Inventor
山渕深司
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Access Co Ltd
Original Assignee
Access Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Access Co Ltd filed Critical Access Co Ltd
Publication of CN1799051A publication Critical patent/CN1799051A/zh
Application granted granted Critical
Publication of CN1799051B publication Critical patent/CN1799051B/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9574Browsing optimisation, e.g. caching or content distillation of access to content, e.g. by caching

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种以终端设备的脱机方式浏览网络上内容的方法。该方法包括:接收对象的请求,通过使用管理信息从存储文件读出请求对象,所述存储文件存储了从网络获得的至少一个对象并且所述存储文件具有预先确定的文件格式,所述管理信息包括在网络上定位请求对象的定位信息与包含请求对象的存储文件的文件名之间的关系,以及显示从存储文件读出的请求对象。

Description

使用页面存储文件浏览内容的方法
技术领域
本发明涉及用于浏览内容的浏览器,尤其涉及脱机模式中内容的浏览。
背景技术
近来,随着诸如PDA(个人数字助理)、移动电话等便携式设备的广泛使用,用户在这种情况下对便携式设备在脱机模式中浏览网页的需求现在正与日俱增。原因在于即使用户的便携式设备处于设备无法连接到网络(即,处于脱机模式)的环境中用户也希望浏览网页。另一个原因就是在用户已经将网页下载到便携式设备中之后希望浏览网页,而无需关心连接费用。
以下说明在此使用的术语具有下列含义。
“网页”:当用户指定URI(统一资源标识符)时将要显示的全部内容。也就是说,在屏幕上通过滚动内容能够看到的全部内容。
“对象”:在网络上通过URI可以指定的数据。也就是说,对象包括HTML(超文本标记语言)文档,图像文件,音频数据,等等。
“锚标志”:由例如锚标志<A>~</A>代表其中的链接之一。
通过高速缓存可以获得通过网络下载的脱机浏览的网页。常规浏览器具有利用高速缓存将用户浏览的网页存储到诸如存储器或硬盘驱动器之类的存储设备中的功能。由于可以在屏幕上显示高速缓存的网页而无需将用户设备连接到网络,因而可以通过使用高速缓存功能来获得脱机浏览。日本专利临时公开号NO.平4-219839和日本专利号NO.2976896分别公开了一种结构,用于将网络获得的数据通过高速缓存到本地文件中。
另一种用于脱机浏览的方法是将通过网络下载的网页作为文件来存储。一种用于存储网页的公知的格式是“mht”格式。通过利用mht格式,将网页数据根据MIME(多用网络邮件扩展)来编码,并存储为单个文件。因此,在用户将网页保存为mht格式文件之后,用户能够以脱机模式浏览网页。
如上所述,可以通过使用浏览器完成高速缓存操作或者通过将网页存储为mht格式文件来获得脱机浏览。
然而,关于高速缓存操作的功能,存在一个问题,即保存高速缓存的数据(网页)所经历的时间段依赖于浏览器上的设置,在超过了根据浏览器上设备的该时间段之后,高速缓存的数据就废弃了。
此外,存在这样的情况,其中在来自服务器的响应中指定高速缓存操作的终止日期,或者在获得的内容的说明中定义高速缓存的终止日期。此外,存在这样的情况,其中在来自服务器的响应中或者在所获得的内容的说明中不准高速缓存操作。在这种情况下,无法执行使用高速缓存的操作进行的脱机浏览。
关于将网页作为mht文件来存储的方法,尽管在高速缓存情况下的上述问题不会发生,因为mht文件不是自动删除的,但是会发生以下问题.也就是说,当用户在屏幕上显示作为mht格式文件存储的网页时,如果用户选择一个链接,(即,锚标志),那么无法获得从显示在屏幕上的当前网页到用户选择的网页(URI)的转变,因为无法指定mht格式文件来进行存储在不同mht文件中的网页间的转变.即使包含用户所选择的链接(URI)的mht格式文件存在于用户设备中,也会出现这个问题.
发明内容
本发明优点在于,它提供了一种方法,该方法能够在脱机模式中浏览网页,就好像用户在联机模式中浏览网页一样。
根据本发明一个方面,提供了一种在终端设备的脱机模式中浏览网络上的内容的方法。该方法包括接收对于对象的请求;从存储文件读出请求对象,所述存储文件存储至少一个从网络获得的对象,并具有预先确定的文件格式,通过使用包括在网络上定位请求对象的定位信息和存储包含请求对象的文件的文件名之间关系的管理信息;以及显示从存储文件读出的请求对象。
利用这种结构,例如在脱机模式中可以获得由锚标志选择从一个网页到另一个网页选择地转变。也就是说,执行的脱机浏览就好像终端设备处于联机模式一样。
可选地,存储文件可以包含多个对象。在这种情况下,管理信息可以包括对于多个对象中的每个:
(a)目标对象的定位信息;
(b)包括目标对象的存储文件的文件名;以及
(c)在存储文件中目标对象的地址信息。
依然可选的,从存储文件读出请求对象包括:搜索管理信息以获得包含请求对象的文件的文件名,并且以获得请求对象的地址信息,以及使用所获得的文件名和地址信息从搜索的存储文件读出请求对象。
根据本发明另一个方面,提供了一种以终端设备的脱机方式浏览网络上内容的方法。该方法包括接收对由URI(统一资源标识符)指定的对象的请求,通过使用管理信息从存储文件读出请求对象,所述存储文件存储包含至少一个对象的网页,所述管理信息用于使用URI作为关键字在存储文件中搜索请求对象,以及显示从存储文件读出的请求对象。
根据这种结构,例如在脱机模式中可以获得由锚标志选择地从一个网页到另一个网页的转变。也就是说,执行的脱机浏览就好像终端设备处于联机模式一样。
可选地,存储文件可以包含多个对象。在这种情况下,管理信息可以包括对于多个对象中的每个:
(a)目标对象的URI;
(b)包括目标对象的存储文件的文件名;以及
(c)在存储文件中目标对象的地址信息。
此外,在这种情况下,从存储文件读出请求对象可以包括搜索管理信息以获得包含请求对象的存储文件的文件名,并且以获得请求对象的地址信息,以及使用所获得的文件名和地址信息从搜索的存储文件读出请求对象。
仍然可选地,管理信息可以包括对于多个对象中的每个:
(d)目标对象的最近的更新时间和目标对象的获得时间之一.在这种情况下,从存储文件读出请求对象可以包括:如果具有对应于请求对象相同URI的两个或多个对象都存储在一个或多个存储文件中,那么使用管理信息从具有对应于请求对象相同的URI的对象中选择最近的一个;以及使用关于最近一个的文件名和地址信息从存储文件读出最近的一个.
可替换的是,管理信息可以包括对于多个对象中的每个:(d)目标对象最近的更新时间和目标对象的获得时间之一。在这种情况下,存储文件读出请求对象可以包括:如果具有对应于请求对象的相同URI的两个或多个对象都存储在一个或多个存储文件中,那么显示关于两个或多个对象的文件名和/或获得时间,以便用户能够选择两个或多个对象中的一个;以及使用关于用户选择的对象的文件名和地址信息从存储文件读出用户所选择的两个或多个对象中的一个。
可替换的是,管理信息可以包括对于多个对象中的每个:(d)目标对象最近的更新时间和目标对象的获得时间之一。在这种情况下,从存储文件读出请求对象包括:如果具有对应于请求对象相同URI的两个或多个对象都存储在一个或多个存储文件中,那么选择两个或多个对象中的一个,其中两个或多个对象中的一个具有最接近当前请求的请求对象之前在先前显示的网页所获得的时间;以及使用关于所选择的对象的文件名和地址信息从存储文件读出所选择的对象。
在特定情况下,管理信息还可以包括对于多个对象中的每个:(e)当包含目标对象的存储文件被初始寄存的时候,没有改变验证数据,所述数据用于验证包括目标对象的存储文件。在这种情况下,从存储文件读出请求对象可以包括仅仅当确认了对应于请求对象的验证数据与包含请求对象的存储文件一致时,才读出请求对象。
可选地,验证数据可以包括关于存储文件的文件大小、时间戳、检查和以及CRC中的至少一个。
可选地,验证数据包括消息摘要,所述消息摘要包括MD5和SHA-1之一。
在特定情况下,用户可以通过用户接口设备的使用,通过字母输入来输入请求对象的URI。
在特定情况下,用户可以通过锚标志来指定请求对象的URI。
在特定情况下,存储文件可以包含单个对象,并且管理信息可以包括对于多个对象中的每个:
(a)目标对象的URI;以及
(b)包括目标对象的存储文件的文件名。
可选地,该方法可以包括当网页作为存储文件来存储时,创建或更新管理信息。
可选地,该方法可以包括当终端设备从联机模式改变到脱机模式时,根据要存储的存储文件,创建或更新管理信息。
可选地,该方法可以包括当发现,具有搜索的文件名的存储文件在现状中不存在时,创建或更新管理信息。
可选地,该方法可以包括:检测关于存储文件的文件操作;以及根据文件操作的类型来创建或更新管理信息。该文件操作可以包括存储文件的添加、更新和删除中的至少一个。
在特定情况下,该方法可以包括当检测到,对应于请求对象的验证数据与包含请求对象的存储文件不一致时,更新与验证数据不一致的、用于存储文件的管理信息。
可选地,管理信息可以存储在终端设备的存储器上。
可选地,管理信息可以作为终端设备中提供的文件设备中的文件来存储。
可选地,存储文件可以存储在终端设备提供的文件设备中。
可选地,管理信息和存储文件存储在基于逐个目录的(directory-by-directory)终端设备中。
根据本发明另一个方面,提供了一种由计算机执行的计算机程序,以便达到在终端设备的脱机模式中浏览网络上内容的方法。该方法包含步骤:接收对由URI(统一资源标识符)指定的对象的请求;通过使用管理信息从存储文件读出请求对象,所述存储文件存储包含至少一个对象的网页,所述管理信息用于使用URI作为关键字在存储文件中搜索请求对象;以及显示从存储文件读出的请求对象。
利用这种结构,例如在脱机模式中可以获得由锚标志选择地从一个网页到另一个网页的转变。也就是说,执行了脱机浏览就好像终端设备处于联机模式一样。
可选地,存储文件可以包含多个对象。在这种情况下,管理信息可以包括对于多个对象中的每个:
(a)目标对象的URI;
(b)包括目标对象的存储文件的文件名;以及
(c)在存储文件中目标对象的地址信息。
此外,在这种情况下,从存储文件读出请求对象可以包括:搜索管理信息以获得包含请求对象的存储文件的文件名,并且以获得请求对象的地址信息,以及使用所获得的文件名和地址信息从搜索的存储文件读出请求对象。
仍然可选地,管理信息可以包括对于多个对象中的每个:(d)目标对象最近的更新时间和目标对象的获得时间之一。在这种情况下,从存储文件读出请求对象包括:如果具有相同对应于请求对象的URI的两个或多个对象都存储在一个或多个存储文件中,那么使用管理信息从具有对应于请求对象的相同URI的对象中选择最近的一个;以及使用关于最近一个的文件名和地址信息从存储文件读出最近的一个。
可替换地,管理信息可以包括对于多个对象中的每个:(d)目标对象的最近的更新时间和目标对象的获得时间之一。在这种情况下,从存储文件读出请求对象包括:如果具有对应于请求对象的相同URI的两个或多个对象都存储在一个或多个存储文件中,那么显示关于两个或多个对象的文件名和/或获得时间,以便用户能够选择两个或多个对象中的一个;以及使用关于用户选择的对象的文件名和地址信息,从存储文件读出用户所选择的两个或多个对象中的一个。
可替换地,管理信息可以包括对于多个对象中的每个:(d)目标对象的最近的更新时间和目标对象的获得时间之一。在这种情况下,从存储文件读出请求对象包括:如果具有对应于请求对象的相同URI的两个或多个对象都存储在一个或多个存储文件中,那么选择两个或多个对象中的一个,其中两个或多个对象中的一个具有最接近当前请求的请求对象之前先前显示的网页的获得时间;以及从存储文件中使用关于所选择的对象的文件名和地址信息读出所选择的对象。
在特定情况下,管理信息还可以包括对于多个对象中的每个:(e)从初始寄存包含目标对象的存储文件的时候,没有改变验证数据,所述数据用于验证包括目标对象的存储文件.在这种情况下,从存储文件读出的请求对象可以包括仅仅当确认了对应于请求对象的验证数据与包含请求对象的存储文件一致时,才读出请求对象.
可选地,验证数据可以包括关于存储文件的文件大小、时间戳、检验和以及CRC中的至少一个。
可选地,验证数据可以包括消息摘要,所述消息摘要包括MD5和SHA-1之一。
在特定情况下,用户可以通过用户接口设备的使用,通过字母输入来输入请求对象的URI。
在特定情况下,用户可以通过锚标志来指定请求对象的URI。
在特定情况下,存储文件可以包含单个对象,并且管理信息可以包括对于多个对象中的每个:
(a)目标对象的URI;以及
(b)包括目标对象的存储文件的文件名。
可选地,该方法可以包括当网页作为存储文件来存储时,创建或更新管理信息。
可选地,该方法可以包括当终端设备从联机模式改变到脱机模式时,根据要存储的存储文件创建或更新管理信息。
可选地,该方法可以包括当发现具有搜索的文件名的存储文件在现状中不存在时,创建或更新管理信息。
可选地,该方法可以包括:检测关于存储文件的文件操作;以及根据文件操作的类型来创建或更新管理信息。该文件操作可以包括存储文件的添加、更新和删除中的至少一个。
在特定情况下,该方法可以包括当检测到对应于请求对象的验证数据与包含请求对象的存储文件不一致时,更新与验证数据不一致的用于存储文件的管理信息。
可选地,管理信息可以存储在终端设备的存储器上。
可选地,管理信息在提供的文件设备中可以作为终端设备的文件来存储。
可选地,存储文件可以存储在终端设备提供的文件设备上。
可选地,管理信息和存储文件存储在基于逐个目录的终端设备中。
根据本发明的另一个方面,提供了一种计算机程序产品,提供终端设备执行的一组指令,所述终端设备以脱机模式执行作为浏览网络上内容的功能的指令。该计算机程序产品包含以下功能:接收对山URI(统一资源标识符)指定的对象的请求;通过使用管理信息从存储文件读出请求对象,所述存储文件存储包含至少一个对象的网页,所述管理信息用于使用URI作为关键字在存储文件中搜索请求对象;以及显示从存储文件读出的请求对象。
利用这种结构,例如在脱机模式中可以获得由锚标志选择地从一个网页到另一个网页的转变。也就是说,执行了脱机浏览就好像终端设备处于联机模式一样。
根据本发明的另一个方面,提供了一种终端设备,其包括获得系统(obtaining sysytem),通过网络获得网页并将包含在网页中的至少一个对象存储到存储文件中,以及管理信息创建系统,创建管理信息,所述信息用于使用对象的URI作为关键字在存储文件中的搜索对象。该终端设备还包括搜索系统,搜索管理信息以查找URI指定的请求对象,并从存储文件中读出请求对象,以及显示系统,显示从存储文件中读出的请求对象。
利用这种结构,例如在脱机模式中可以获得由锚标志选择地从一个网页到另一个网页的转变。也就是说,执行了脱机浏览就好像终端设备处于联机模式一样。
根据本发明的另一个方面,提供了一种终端设备,其包括自动访问系统,自动地访问预先在URI列表中指定的网页,并将访问的网页存储到存储文件中,以及管理信息创建系统,创建管理信息,所述管理信息用于使用对象的URI作为关键字在存储文件中搜索对象。该终端设备还包括搜索系统,搜索管理信息以查找URI指定的请求对象,并从存储文件之一读出请求对象以及显示系统,显示从存储文件之一读出的请求对象。
利用这种结构,例如在脱机模式中可以获得由锚标志选择地从一个网页到另一个网页的转变。也就是说,执行了脱机浏览就好像终端设备处于联机模式一样。网页可以由自动访问系统自动地采集。
可选地,该自动访问系统可以被配置以访问包含在访问网页中的链接页面,并配置以通过网络保存链接页面以及在URI列表中列出的网页。
仍然可选地,该自动访问系统被配置以首先查询管理信息以确定URI列表中的网页是否已经存在于终端设备中。此外仅仅当确定URI列表中的各个网页不存在于终端设备中时,该自动访问系统可以通过网络获得各个网页。
附图说明
联系附图,从以下详细描述中将明白和理解和木发明,其中:
图1根据本发明实施方式示出终端设备框图;
图2是当终端设备处于联机模式时浏览器引擎的功能框图;
图3示出脱机模式中浏览器的功能框图;
图4为一包含网页存储文件的映射(map)图的实施例,所述网页包括两个图像文件;
图5示出页面存储管理信息的配置;
图6示出浏览器中数据库搜索单元的操作的流程图;
图7示出归档配置的实施例,其中页面存储管理信息和相关的页面存储文件存储于基于逐个目录的终端设备中。
具体实施方式
下文中,将参照附图描述本发明实施方式。
图1根据本发明实施方式示出终端设备10的框图。如图1所示,终端设备10包括CPU 3(中央处理单元),其控制终端设备10具备的各种功能。浏览器50在CPU 3的控制下运行在终端设备10上。终端设备10可以是各种类型的终端设备之一,所述终端设备包括连接到网络的个人计算机、PDA、移动电话、汽车导航系统和家庭的电子设备。
如图1所示,终端设备10还包括经由总线19连接到CPU 3的ROM(只读存储器)5,RAM(随机访问存储器)7,网络接口9,PC卡接口16,显示驱动器11和接口15。此外,终端设备10具有连接到显示驱动器11的显示器13,和连接到接口15的诸如键盘之类的用户接口设备17。
各种类型的PC卡可以经由PC卡接口16附接到终端设备10.在该实施方式中,闪存卡18经由PC卡接口16附接到终端设备10.
在ROM 5中,存储了包括浏览器50的程序的各种类型的计算机程序。当用户使用用户接口17执行预先确定的操作时,启动浏览器50。
在下文,将参照图2和图3来描述浏览器50的功能。首先,参照图2解释浏览器引擎30的功能,所述浏览器引擎30是浏览器50的主要部件。其次,将参照图3解释浏览器50在脱机模式下的操作。
图2是当浏览器50处于联机模式时(即当终端设备10连接到网络时)浏览器引擎30的功能框图。如图2所示,浏览器50具有分析器31,页面制造器32和格式器33的功能块。
当用户使用用户接口设备17输入URI或者用户通过选择要显示在显示器13上的网页中的锚标志之一时,浏览器50操作以从因特网上的URI获得HTML文档21(即,请求对象)。然后将所获得的HTM L文档21输入分析器31中。
分析器31分析HTML文档21,所述HTML文档21是经由网络接口9从因特网获得的,以便做出文档树23,其中HTML文档21的语法结构是由树结构来表达的。应当注意的是,文档树23仅仅表达HTML文档21的语法结构,而不包括涉及HTML文档23的表示的信息。
接下来,根据文档树23和涉及标记的信息,页面制造器32做出布局树25,其中包括HTML文档21的表示形式,例如,块、并行、表、列表、项等等。也就是说,在HTML文档21中,布局树25包括关于数据次序的信息,诸如块、并行、表等等。应当注意的是,显示器13的屏幕上,布局树25不包括关于这些项(块、并行、表等等)的位置和大小的信息。
根据布局树25和涉及显示器13的屏幕大小的信息,格式器33在显示器13的屏幕上布局上述项。也就是说,格式器33在显示器13的屏幕上布置布局树25中的项,并确定这些项的位置、宽度和高度,并且在HTML文档21中返回字母的运送位置。
通过由分析器31,页面制造器32和格式器33执行的这种处理,在显示器13的屏幕上适当地显示HTML文档21。
浏览器50还具有存储将以预先确定的文件格式显示在显示器13上的网页的功能。通过使用用户接口设备17来执行某个操作,用户能够将要显示在显示器上的网页作为具有预先确定的文件格式的文件保存到例如,闪存卡18中。在下文,包含网页(即,对象)的文件指的是页面存储文件110或者页面存储文件,所述网页由浏览器50创建并且具有预先确定的格式。从下列解释中应当理解到,页面存储文档的预先确定的格式不同于高速缓存文件的格式。
通过使用浏览器50来访问想要的网页和保存网页,用户能够以脱机模式浏览网页而无需关心连接费用。
浏览器50还具有创建数据库的功能,以便管理存储在终端设备10中的所有的页面存储文件110。在下文,用于管理所有由浏览器50创建的页面存储文件110的数据库,指的是页面存储管理信息120(参见图3)。页面存储管理信息120可以在闪存存储卡18中作为文件来创建。
参见图5如下文所述,页面存储管理信息120包括关于由URI指定的对象(诸如图像文件和HTML文档)是否作为页面存储文件110存储在终端设备10中的信息,以及涉及页面存储文件110的目标对象的位置信息.也就是说,在页面存储管理信息120中,涉及对象的信息基于逐个URI(URI-by-URI)进行存储.
图3示出浏览器50脱机模式中的功能框图。如图3所示,在脱机模式中,当用户通过使用用户接口设备17指定用户想要浏览的URI时,生成URI请求23并将其输入到数据库搜索单元40中。
数据库搜索单元40搜索用于对应于请求URI(即,URI请求23)的对象的页面存储管理信息120。
有助于生成URI请求23的典型因素是用户的字母输入(通过用户接口设备17)和锚标志。有助于生成URI请求23的其它因素如下:
·通过使用书签的目的地URI的选择。
·在显示器13上的浏览器50显示的浏览窗口(未示出)中表示的“向后(Back)”或者“向前(Forward)”按钮的选择。
·通过在浏览窗户上表示的“更新”按钮的用户选择来重新加载网页。
·在所获得的网页中的<img>标记中指定的图像文件的获得。
·经由网络的外部样式表的获得。
·在所获得的网页中的<frame>标记或者<iframe>标记中指定的帧页的获得。
·由<meta http-equiv=“refresh”>标记、等导致的更新操作。
·由例如JavaScript导致的到另一个网页的转变。
图4是页面存储文件110,其包含包括两个图像文件网页的映射的实例。在下列解释中,图4所示网页由“html01”来表示,而图4的网页中两个图像文件分别由“image1(图像1)”和“image2(图像2)”来表示。
如图4所示,在页面存储文件110的顶部(0字节~a字节),页面存储文件110包括标题信息101。标题信息101包括涉及页面存储文件110的通用信息,例如,页面存储文件110由MIME格式来编码。以下是标题信息101的实例。
[标题信息101的实例]
来自(From):
主题(Subject):访问(ACCESS)
日期(Date):2003年5月12日,星期一,13:46:48+0900
MIME-版本:1.0
内容类型(Content-Type):多部分/相关(multipart/related);
    界限(boundary)=“------=_NextPart_000_0000_01C3188C.EF7C3A90”;
    类型(type)=“text/html”
这是MIME格式的多部分消息。
标题信息101之后,包括了html 01的补充信息102和html 01的内容103。在html 01的补充信息102中,包括了html 01的URI、html01的编码格式等等。以下是html 01的补充信息102的实例。
[补充信息102的实例]
------=_NextPart_000_0000_01C3188C.EF7C3A90
内容类型(Content-type)=text/html;
    charset=“shift-jis”;
内容转变编码(Content-Transfer-Encoding):quoted-printable
内容定位(Content-Location):http://www.access.co.jp/top.html
在html 01的内容103之后,包括了图像1的补充信息104和图像1的数据103。在图像1的补充信息104中,包括了图像1的格式、图像1的URI、图像1的编码格式等等。以下是图1的补充信息104的实例。
[补充信息104的实例]
------=_NextPart_000_0000_01C3188C.EF7C3A90
内容类型(Content-type)=image/gif;
内容转变编码(Content-Transfer-Encoding):base64
内容定位(Content-Location):
http://www.access.co.jp/newimage/logo.gif
在图像1的数据105之后,包括了图像2的补充信息106和图像2的数据104。类似于补充信息102,在图像2的补充信息104中,包括了图像2的格式、图像2的URI、图像2的编码格式等等。
图5示出页面存储管理信息120的配置。页面存储管理信息120包括使得能够从页面存储文件110查找请求对象的信息。像使用关键字一样使用请求对象的URI,可以在页面存储管理信息120中查找请求对象的信息。
更确切地说,页面存储管理信息120对于各个URI包括下列信息。
·目标URI(目标对象)
·页面存储文件110的文件名,其中存储了目标URI。
·页面存储文件110的格式。
·页面存储文件110中目标URI(目标对象)的地址信息(开始地址和结束地址)
·目标URI(目标对象)上的时间信息(例如,目标对象最新的更新时间,或者由终端设备10获得目标对象的获得时间)。
·验证数据
验证数据用于验证包括目标URI没有改变的页面存储文件110。例如,当页面存储文件110首先被寄存时,验证数据是文件大小、时间戳、目标对象的部分数据、页面存储文件110的检查和以及CRC(循环冗余码校验)之一。验证数据可以是诸如MD5(消息摘要5)和SHA-1(安全散列算法1)的消息摘要。
当具有同一URI的多个对象包括在存储在终端设备10的一个或多个页面存储文件110中时,时间信息用于选择最近的对象,并在显示器13上显示最近的对象。
可以如下使用时间信息。
(a)如果具有对应于请求对象的同一URI的两个或多个对象存储在一个或多个页面存储文件中,那么例如,通过对象消息,浏览器50在显示器13上显示关于两个或多个对象的文件名和/或获得时间,以便用户能够选择两个或多个对象中的一个。然后,从页面存储文件110获得用户所选择的对象并显示。
(b)如果具有对应于请求对象的同一URI的两个或多个对象存储在一个或多个页面存储文件中,那么浏览器50选择两个或多个对象中的一个.在先前显示的网页上由用户(例如,通过锚标志)指定当前请求的请求对象之前,两个或多个对象中的一个具有最接近先前显示的网页的获得时间.然后,从页面存储文件110获得所选择的对象并显示.
以下是关于图4所示的页面存储文件110的页面存储管理信息120的实例。在下文中,页面存储文件110的文件名由“access_about_acces_.htm”来表示。
[页面存储管理信息120的实例]
URI http://www.access.co.jp/top.html
  文件名:access_about_acces_.mht
  格式:mht
  开始地址:a字节
  结束地址:b字节
  时间:2003/04/22 12:00:00.00
URI http://www.access.co.jp/newimages/logo.gif
  文件名:access_about_acces_.mht
  格式:mht
  开始地址:b字节
  结束地址:c字节
  时间:2003/04/22 12:00:00.00
URI http://www.access.co.jp/newimages/logo2.gif
  文件名:access_about_acces_.mht
  格式:mht
  开始地址:c字节
  结束地址:d字节
  时间:2003/04/22 12:00:00.00
现在再次参照图3,数据库搜索单元40为请求的URI搜索页面存储管理信息120,所述URI已经作为URI请求23输入其中。如果在页面存储管理信息120中查找到请求的URI,那么通过使用包含在页面存储管理信息120中的请求对象的地址信息,从包括请求对象的页面存储文件110中读出请求对象。
然后将从页面存储文件110中读出的请求对象输入浏览器引擎30。如果输入到浏览器引擎30中的HTML文档包括链接(例如,图像文件的超级链接),那么可以创建新的URI请求23(参见图3中箭头30a)。
图6示出的数据库搜索单元40的操作的流程。如图6所示,在将URI请求23输入到数据库搜索单元40之后,数据库搜索单元40为请求对象搜索页面存储管理信息120(301)。当从页面存储管理信息120获得请求的URI的地址信息时,从页面存储管理信息120获得请求的URI的地址信息(302)。
接下来,通过使用存储在页面存储管理信息120中的请求的URI验证数据,数据库搜索单元40检查包含请求的URI的页面存储文件是否被修改了(303)。
假定验证数据是包含请求对象的页面存储文件110的文件大小,存储在页面存储管理信息120中的文件大小作为验证数据与包含请求对象的页面存储文件的当前文件大小进行比较。仅仅当两个文件大小彼此相等时才从页面存储文件110中读出请求对象。
通过使用验证数据验证页面存储文件110没有改变时,防止了不适当数据从页面存储文件110中作为请求对象数据读出。例如,当包含请求对象的页面存储文件110被修改,尽管使页面存储管理信息120包括请求URI但不包含请求对象时,这种不适当的对象读出就会发生。
如果验证数据(文件大小)与包含请求对象的页面存储文件110的当前文件大小一致,从页面存储文件110中读出请求对象(304)。接下来,根据包含在补充信息(305)中的请求对象的译码格式,对读出对象的数据进行译码。然后将解码对象输入浏览器引擎30中以显示该对象。
如果在浏览器引擎30的分析器31中认定,译码对象是HTML文档,并且HTML文档包括图像文件的链接,那么创建对图像文件新的URI请求(307,23)。然后,数据库搜索单元40为新的URI请求搜索页面存储管理信息120(301)。
随着数据库搜索单元40执行的以上提及的处理,搜索用户希望在脱机模式中读取的网页,并且从页面存储文件110中读取出来,然后将其显示在显示器13上。
在页面存储管理信息120中,包括了用于从存储在终端设备10中的所有页面存储文件110中查找请求对象的信息。换句话说,页面存储管理信息120包括基于逐个对象(object-by-object)的、涉及页面存储文件的信息。因此,可以在脱机模式中导致显示器13上的、从一个网页到另一个网页的转变。也就是说,当用户选择显示在显示器13上的网页中固定标记之一时,从页面存储文件110中读出所选择的对象并由浏览器50显示在显示器13上。
如上所述,根据本发明实施方式,例如可以在脱机模式中获得由锚标志所选择的从网页到另一个网页的转变。也就是说,执行脱机浏览就好像终端设备10处于联机模式一样。
此外,根据浏览器50的上述结构,完成下列优点。
(1)可以为浏览器引擎30的显示处理瞄准(target)页面存储文件110中部分数据(即,包括在页面存储文件中的对象)。也就是说,由于可以从页面存储管理信息120得知请求对象的地址信息,因而不需要读出包含请求对象的页面存储文件110的全部数据。因此,可以减少用于获得请求对象的处理时间和存储器空间。
(2)通过使用浏览器功能使用高速缓存的高速缓存文件的情况下,在某个时间段期满之后不能自动删除页面存储文件110。
(3)总而言之,当通过浏览器的功能来保存高速缓存文件时,高速缓存文件以一对一关系利用URI进行关联。也就是说,对于一个URI,仅仅存储了一个高速缓存文件。相比之下,根据本发明实施方式,可以在一个或多个页面存储文件110中存储具有相同URI的多个对象。因此,即使删除了包含频繁使用的图像文件A的页面存储文件110,只要图像文件A存储在另一个页面存储文件110中,也可以在脱机模式中读出图像文件A。
以下是创建或更新页面存储管理信息120的时序的实例。
(A-1)当获得网页并将其作为页面存储文件110存储在终端设备10中时(即,当创建页面存储文件110时),浏览器50创建页面存储管理信息120。
(A-2)当在页面存储管理信息120中查找到请求对象的文件名时,但是当对应于文件名的页面存储文件不存在于终端设备10中时,假定页面存储文件110被删除而没有浏览器50的管理,那么涉及请求对象的页面存储管理信息120中所有的字段都被删除.
(A-3)当验证数据及其对应当页面存储文件110之间的失配被删除时,假定页面存储文件110被修改而没有浏览器50的管理,那么在页面存储文件110被分析之后,涉及请求对象的页面存储管理信息120中所有的字段都被更新。
(A-4)当包括页面存储文件110的增加、以及页面存储文件110的更新以及页面存储文件110的删除的操作之一被删除时,根据操作类型创建或更新页面存储管理信息120。更确切地说,在下列情况下创建或更新页面存储管理信息120。
(A-4-1)例如,通过将页面存储文件从外部终端设备或外部文件设备(诸如闪存卡)导入终端设备10中,将由浏览器50管理的页面存储文件新近增加到终端设备10中时。
(A-4-2)当在浏览器50的控制下的页面存储文件110被删除时,页面存储管理信息120中涉及删除的页面存储文件110的文件名所有字段都被删除。
(A-4-3)当在浏览器50的控制下的页面存储文件110被移动或更新时,页面存储管理信息120中涉及移动或更新的页面存储文件110的所有字段都被更新。
上述文件的移动、更新和删除操作可以由各种下列的方法来检测。用于检测文件的移动、更新和删除方法之一就是准备文件操作菜单作为浏览器50的功能,以便用户通过浏览器50的文件操作菜单的使用来执行文件操作。在这种情况下,浏览器50可以检测到文件操作。
用于检测文件的移动、更新和删除另一种方法就是通过使用来自操作系统的通知来检测文件操作。用于检测文件的移动、更新和删除另一种方法就是通过以固定间隔扫描浏览器50控制下的页面存储文件(例如,存储在某个目录下)来检测文件操作。
(A-5)当终端设备50从联机模式改变到脱机模式时,分析页面存储文件并创建或更新页面存储管理信息120。
(A-6)当浏览器引擎30开始搜索页面存储管理信息120时,仅仅当没有创建页面存储管理信息120时,浏览器50才创建页面存储管理信息120。
尽管参照某些优选实施方式比较详细地描述了本发明,然而其它实施方式也是可以的。
尽管在上述实施方式中,解释了页面存储管理信息和页面存储文件是存储在闪存卡18中的,但是其它实施方式也是可以的。例如,如图7所示,页面存储管理信息120和相关的页面存储文件110可以基于逐个目录存储在终端设备10上。在图7中,用户创建两个目录A和B,以便分别管理两组页面存储文件。在图7中,为各个目录A和B存储页面存储管理信息120及其相关的页面存储文件110。应当注意的是,在目录B在闪存卡18中创建,而目录A在终端设备10中的另一个存储设备中创建。在这种情况下,用户能够将包含满意的页面存储管理信息120和页面存储文件110的闪存卡18附接到另一个终端设备上,并且能够在脱机模式下在另一台终端设备10上享受浏览喜爱的网页。
页面存储管理信息120还可以包括以下内容。
·在HTTP(超文本传送协议)中使用的请求方法(即,GET方法或POST方法)
·当请求的方式是POST方法时POST数据的内容
·接收的HTTP标题
通过进一步使用上述为页面存储管理信息120列出的附加信息,可以更详细地执行对象(即,页面存储文件)的管理.
尽管在上述实施方式中,为一个网页预备了一个页面存储文件110(即,页面存储文件以一对一关系与网页相关联),另一个实施方式也是可以的,其中为一个对象准备页面存储文件。在这种情况下,对于图4所示页面存储文件110的实施例,html 01、图像1和图像2存储在不同的页面存储文件(即,分别为html 01,图像1和图像2创建三个页面存储文件)中。应当理解的是,在这种情况下,不需要地址信息(即,对象的开始地址和结束地址)。因此,在这种情况下,各个对象(URI)的页面存储管理信息120的所需数据项是:
·URI,以及
·页面存储文件的文件名
尽管在上述实施方式中,页面存储管理信息120存储在诸如闪存卡18的文件设备中,页面存储管理信息120可以存储在RAM 7中。也就是说,页面存储管理信息120可以用于存储器上(即,在“基于存储器”的基础上)。在这种情况下,浏览器50可以将保存在存储器(RAM 7)上的页面存储管理信息120作为浏览器50的终点文件存储到文件设备中,并且浏览器可以将存储在文件设备中的页面存储管理信息120拷贝到浏览器50的初始的存储器(RAM 7)中。可选地或附加地,当更新保存在存储器中的页面存储管理信息120时,浏览器50可以更新作为文件存储在文件设备中的页面存储管理信息120。
可选地或附加地,当闪存卡18经由PC卡接口16附接到终端设备10时,浏览器50可以将存储在闪存卡18目录中的页面存储管理信息120增加到存储器(RAM 17)。此外,当页面存储管理信息120增加到存储器(RAM 7)时,可以执行增加到存储器的信息与存储在闪存18的目录中的页面存储文件之间的验证以证实增加的信息的正确性。此外,如果在增加的信息和存储在闪存卡18的目录中的页面存储文件之间检测到不匹配,那么可以通过分析存储在闪存卡18的目录中的页面存储文件来执行增加的信息的校正。
尽管在上述实施方式中,页面存储文件110仅仅用于脱机浏览,但是在联机模式中可以使用高速缓存的存储文件来代替页面存储文件110,或者页面存储文件110可以用作除通过浏览器50的高速缓存功能保存的高速缓存存储的文件之外的文件。也就是说,在联机模式中浏览器50可以用作页面存储文件110以显示请求的URI。
以下是在联机模式中用于使用页面存储文件110以及高速缓存文件的程序的实例:
(步骤1)当URI请求发生时,为请求的URI搜索存储器高速缓存或磁盘高速缓存,
(步骤2)如果在存储器高速缓存和磁盘高速缓存中没有发现请求的URI,那么为请求的URI搜索页面存储管理信息120,
(步骤3)如果在页面存储文件之一中发现了请求的URI,那么从页面存储文件中读出请求对象并显示。
上述程序对应于浏览器50的实例(casing)功能设置之一,即,以使用存储器高速缓存作为级别1高速缓存,以使用磁盘高速缓存作为级别2高速缓存,以及使用页面存储文件作为级别3高速缓存。
在上述实施方式中,当用户使用浏览器50访问想要地网页时,页面存储文件110由用户人工地存储。然而,也可以由自动访问软件自动地保存页面存储文件,所述自动访问软件自动地访问在URI列表中事先指定的网页,并将访问的网页存储到页面存储文件中。
自动访问软件可以如下操作。自动访问软件可以首先查阅页面存储管理信息120,并且可以确定是否需要访问网络上的网页,以存储在URI列表中列出的请求网页。
自动访问软件可以配置为进一步访问包含在访问的网页中的链接页,并保存链接页以及在URI列表中列出的网页。
例如,通过使用包括在页面存储管理信息120中的时间信息,仅仅当服务器上对象的创建时间比页面存储管理信息120中存储的请求对象的时间信息更新时,可以从网络上的服务器获得请求对象。可以通过使用某种类型的HTTP标题执行终端设备10和网络上服务器之间的更新验证。
自动访问软件可以具有如下附加功能。也就是说,自动访问软件可以配置以根据预先确定的规则进行操作:
(1)为各个对象(URI)在页面存储管理信息120中预备检查标记,检查标记用于表示是否确定对象(URI)更新,
(2)在访问URI列表列出的网页的操作序列终止时(即,访问在URI列表中列出的网页的一次例行程序)或者在访问URI列表列出的网页的操作序列启动时,将页面存储管理信息120中所有检查标记设置为未确认状态。
(3)当从服务器获得未寄存对象(即,在页面存储管理信息120中没有寄存的对象),并且所获得对象在页面存储管理信息120中新近寄存时,将新近寄存的对象的检查标记设置为确认的状态,
(4)如果用于确认对象更新的查询信息发送到服务器,那么无论发送到服务器的查询结果如何,都将具有未确认状态的对象的检查标记设置为确认状态,以及
(5)无论具有确认状态的对象(URI)如何,不将用于确认对象的更新的查询信息发送到服务器。
通过根据上述规则进行操作,仅仅当在执行自动访问软件期间的第一次某个URI的请求出现时,自动访问软件与服务器进行通信。也就是说,消除了对一个URI访问的复制。因此,如果自动访问软件被配置为自动地获得链接的URI(链接对象),并且从URI列表中列出的多个网页直接或间接地链接某个网页,那么用于与服务器通信的数据量以及自动访问软件执行所需的时间就可以减少。此外,可以减小网络和服务器的负载。“间接链接的网页”意思是经由一个或多个插入网页从URI列表中列出的多个网页链接的某个网页。
上述自动访问软件可以实施为浏览器50的功能之一。
尽管在上述实施方式中,页面存储文件和页面存储管理信息存储在本地存储设备(例如,RAM 7和闪存卡18)中,然而其它实施方式也是可以的。例如,页面存储文件和页面存储管理信息可以存储在连接到LAN(局域网)的文件服务器中。在这种情况下,可以在连接到LAN的客户终端设备上执行上述脱机浏览。
上述内容可置于各种类型的网络上,诸如公共交换电话网和移动电话网以及因特网,并完成脱机浏览。
当提供根据本发明的设备和方法的另外适当的程序并由计算机来执行时也可以实现。这种程序可以存储在诸如软盘、CD-ROM、存储卡等等的记录介质中并进行分配。可替换地或可选地,这种程序可以通过诸如因特网之类的网络来分配。

Claims (25)

1.一种在终端设备以脱机模式浏览网络上内容的方法,包含:
接收对于对象的请求;
通过使用管理信息从存储文件读出请求对象,所述存储文件存储一个包含多个从网络获得的对象的网页并具有预先确定的文件格式,所述管理信息包括在网络上定位请求对象的定位信息与包含请求对象存储文件的文件名之间关系;以及
显示从存储文件读出的请求对象,
其中存储文件包含多个对象,其中管理信息包括对于多个对象中的每个:
(a)目标对象的定位信息;
(b)包括目标对象的存储文件的文件名;
(c)在存储文件中目标对象的地址信息;以及
(d)目标对象的最近更新时间和目标对象的获得时间之一;
其中所述从存储文件读出请求对象包括:
搜索管理信息以获得包含请求对象的存储文件的文件名,并且获得请求对象的地址信息;
使用所获得的文件名和地址信息从搜索的存储文件读出请求对象;
如果具有对应于请求对象的相同定位信息的两个或多个对象都存储在一个或多个存储文件中,那么使用管理信息从具有对应于请求对象的相同定位信息的对象中选择最近的一个;以及
使用最近的一个文件名和地址信息从存储文件读出最近的一个。
2.根据权利要求1所述的方法,其中所述从存储文件读出请求对象包括:
搜索管理信息以获得包含请求对象文件的文件名,并且以获得请求对象的地址信息;以及
使用所获得的文件名和地址信息从搜索的存储文件读出请求对象。
3.一种在终端设备以脱机方式浏览网络上内容的方法,包含:
接收由URI(统一资源标识符)指定对象的请求;
通过使用管理信息从存储文件读出请求对象,所述存储文件存储一个包含至少一个对象的网页,所述管理信息用于使用URI作为关键字在存储文件中搜索请求对象;以及
显示从存储文件读出的请求对象;
其中存储文件包含多个对象,其中管理信息包括对于多个对象中的每个:
(a)目标对象的URI;
(b)包括目标对象的存储文件的文件名;
(c)在存储文件中目标对象的地址信息;以及
(d)目标对象的最近更新时间和目标对象的获得时间之一;
其中所述从存储文件读出请求对象包括:
搜索管理信息以获得包含请求对象的存储文件的文件名,并且获得请求对象的地址信息;
使用所获得的文件名和地址信息从搜索的存储文件读出请求对象;
如果具有对应于请求对象的相同URI的两个或多个对象都存储在一个或多个存储文件中,那么使用管理信息从具有对应于请求对象的相同URI的对象中选择最近的一个;以及
使用最近的一个文件名和地址信息从存储文件读出最近的一个。
4.根据权利要求3所述的方法,其中管理信息还包括对于多个对象中的每个:
(e)当包含目标对象的存储文件被初始寄存的时候,没有改变验证数据,所述数据用于验证包括目标对象的存储文件,
其中所述从存储文件读出请求对象包括:
仅仅当确认了对应于请求对象的验证数据与包含请求对象的存储文件一致时,才读出请求对象。
5.根据权利要求4所述的方法,其中验证数据包括关于存储文件的文件大小、时间戳、检查以及CRC中的至少一个。
6.根据权利要求4所述的方法,其中验证数据包括消息摘要,所述消息摘要包括MD5和SHA-1之一。
7.根据权利要求4所述的方法,还包含:
当检测到对应于请求对象的验证数据与包含请求对象的存储文件不一致时,更新与验证数据不一致的用于存储文件的管理信息。
8.根据权利要求3所述的方法,其中用户通过用户接口设备的使用,通过字母输入来输入请求对象的URI。
9.根据权利要求3所述的方法,其中用户通过锚标志来指定请求对象的URI。
10.根据权利要求3所述的方法,还包含:
当网页作为存储文件来存储时,创建或更新管理信息。
11.根据权利要求3所述的方法,还包含:
当终端设备从联机模式改变到脱机模式时,根据要存储的存储文件,创建或更新管理信息。
12.根据权利要求3所述的方法,还包含:
当发现具有搜索的文件名的存储文件在现状中不存在时,创建或更新管理信息。
13.根据权利要求3所述的方法,还包含:
检测关于存储文件的文件操作;以及
根据文件操作的类型来创建或更新管理信息,
其中文件操作包括存储文件的添加、更新和删除中的至少一个。
14.根据权利要求3所述的方法,其中管理信息存储在终端设备的存储器上。
15.根据权利要求3所述的方法,其中管理信息作为文件存储在终端设备中所提供的文件设备中。
16.根据权利要求3所述的方法,其中存储文件存储在终端设备提供的文件设备中。
17.根据权利要求3所述的方法,其中管理信息和存储文件存储在基于逐个目录的终端设备中。
18.一种在终端设备以脱机方式浏览网络上内容的方法,包含:
接收由URI(统一资源标识符)指定对象的请求;
通过使用管理信息从存储文件读出请求对象,所述存储文件存储一个包含至少一个对象的网页,所述管理信息用于使用URI作为关键字在存储文件中搜索请求对象;以及
显示从存储文件读出的请求对象;
其中存储文件包含多个对象,其中管理信息包括对于多个对象中的每个:
(a)目标对象的URI;
(b)包括目标对象的存储文件的文件名;
(c)在存储文件中目标对象的地址信息;以及
(d)目标对象最近的更新时间和目标对象的获得时间之一;
其中所述从存储文件读出请求对象包括:
搜索管理信息以获得包含请求对象的存储文件的文件名,并且获得请求对象的地址信息;
使用所获得的文件名和地址信息从搜索的存储文件读出请求对象;
如果具有对应于请求对象的相同URI的两个或多个对象都存储在一个或多个存储文件中,那么显示关于两个或多个对象的文件名和/或获得时间,以便用户能够选择两个或多个对象中的一个;以及
使用关于用户选择对象的文件名和地址信息从存储文件读出用户所选择的两个或多个对象中的一个。
19.一种在终端设备以脱机方式浏览网络上内容的方法,包含:
接收由URI(统一资源标识符)指定对象的请求;
通过使用管理信息从存储文件读出请求对象,所述存储文件存储一个包含至少一个对象的网页,所述管理信息用于使用URI作为关键字在存储文件中搜索请求对象;以及
显示从存储文件读出的请求对象;
其中存储文件包含多个对象,其中管理信息包括对于多个对象中的每个:
(a)目标对象的URI;
(b)包括目标对象的存储文件的文件名;
(c)在存储文件中目标对象的地址信息;以及
(d)目标对象最近的更新时间和目标对象的获得时间之一;
其中所述从存储文件读出请求对象包括:
搜索管理信息以获得包含请求对象的存储文件的文件名,并且获得请求对象的地址信息;
使用所获得的文件名和地址信息从搜索的存储文件读出请求对象;
如果具有对应于请求对象相同的URI的两个或多个对象都存储在一个或多个存储文件中,那么选择两个或多个对象中的一个,其中两个或多个对象中的一个具有最接近当前请求的请求对象之前先前显示的网页的获得时间的获得时间;以及
使用关于所选择对象的文件名和地址信息从存储文件读出所选择的对象。
20.一种在终端设备以脱机方式浏览网络上内容的方法,包含:
接收由URI(统一资源标识符)指定对象的请求;
通过使用管理信息从存储文件读出请求对象,所述存储文件存储一个包含至少一个对象的网页,所述管理信息用于使用URI作为关键字在存储文件中搜索请求对象;以及
显示从存储文件读出的请求对象;
其中存储文件包含多个对象,其中管理信息包括对于多个对象中的每个:
(a)目标对象的URI;
(b)包括目标对象的存储文件的文件名;
(c)在存储文件中目标对象的地址信息;
(d)目标对象最近的更新时间和目标对象的获得时间之一;以及
(e)当包含目标对象的存储文件被初始寄存的时候,没有改变验证数据,所述数据用于验证包括目标对象的存储文件;
其中所述从存储文件读出请求对象包括:
搜索管理信息以获得包含请求对象的存储文件的文件名,并且获得请求对象的地址信息;
使用所获得的文件名和地址信息从搜索的存储文件读出请求对象;
如果具有对应于请求对象的相同URI的两个或多个对象都存储在一个或多个存储文件中,那么显示关于两个或多个对象的文件名和/或获得时间,以便用户能够选择两个或多个对象中的一个;
使用关于用户选择对象的文件名和地址信息从存储文件读出用户所选择的两个或多个对象中的一个;以及
仅仅当确认了对应于请求对象的验证数据与包含请求对象的存储文件一致时,才读出请求对象。
21.一种在终端设备以脱机方式浏览网络上内容的方法,包含:
接收由URI(统一资源标识符)指定对象的请求;
通过使用管理信息从存储文件读出请求对象,所述存储文件存储一个包含至少一个对象的网页,所述管理信息用于使用URI作为关键字在存储文件中搜索请求对象;以及
显示从存储文件读出的请求对象;
其中存储文件包含多个对象,其中管理信息包括对于多个对象中的每个:
(a)目标对象的URI;
(b)包括目标对象的存储文件的文件名;
(c)在存储文件中目标对象的地址信息;
(d)目标对象最近的更新时间和目标对象的获得时间之一;以及
(e)当包含目标对象的存储文件被初始寄存的时候,没有改变验证数据,所述数据用于验证包括目标对象的存储文件;
其中所述从存储文件读出请求对象包括:
搜索管理信息以获得包含请求对象的存储文件的文件名,并且获得请求对象的地址信息;
使用所获得的文件名和地址信息从搜索的存储文件读出请求对象;
如果具有对应于请求对象相同的URI的两个或多个对象都存储在一个或多个存储文件中,那么选择两个或多个对象中的一个,其中两个或多个对象中的一个具有最接近当前请求的请求对象之前先前显示的网页的获得时间的获得时间;
使用关于所选择对象的文件名和地址信息从存储文件读出所选择的对象;以及
仅仅当确认了对应于请求对象的验证数据与包含请求对象的存储文件一致时,才读出请求对象。
22.一种终端设备,包含:
获得系统,通过网络获得一个网页并将包含在该网页中的至少一个对象存储到存储文件中;
管理信息创建系统,创建管理信息,所述管理信息用于使用对象的URI作为关键字在存储文件中搜索对象;
搜索系统,搜索管理信息以查找URI指定的请求对象,并从存储文件中读出请求对象;以及
显示系统,显示从存储文件中读出的请求对象;
其中存储文件包含多个对象,其中管理信息包括对于多个对象中的每个:
(a)目标对象的URI;
(b)包括目标对象的存储文件的文件名;
(c)在存储文件中目标对象的地址信息;以及
(d)目标对象的最近更新时间和目标对象的获得时间之一;
其中所述搜索系统操作于:
搜索管理信息以获得包含请求对象的存储文件的文件名,并且获得请求对象的地址信息;
使用所获得的文件名和地址信息从搜索的存储文件读出请求对象;
如果具有对应于请求对象的相同URI的两个或多个对象都存储在一个或多个存储文件中,那么使用管理信息从具有对应于请求对象的相同URI的对象中选择最近的一个;以及
使用最近的一个文件名和地址信息从存储文件读出最近的一个。
23.一种终端设备,包含:
自动访问系统,自动地访问预先在URI列表中指定的网页,并将访问的网页存储到存储文件中;
管理信息创建系统,创建管理信息,所述管理信息用于使用对象的URI作为关键字在存储文件中搜索对象;
搜索系统,搜索管理信息以查找URI指定的请求对象,并从存储文件之一读出请求对象;以及
显示系统,显示从存储文件之一读出的请求对象;
其中存储文件包含多个对象,其中管理信息包括对于多个对象中的每个:
(a)目标对象的URI;
(b)包括目标对象的存储文件的文件名;以及
(c)在存储文件中目标对象的地址信息;
(d)目标对象的最近更新时间和目标对象的获得时间之一;
其中所述搜索系统操作于:
搜索管理信息以获得包含请求对象的存储文件的文件名,并且获得请求对象的地址信息;
使用所获得的文件名和地址信息从搜索的存储文件读出请求对象;
如果具有对应于请求对象的相同URI的两个或多个对象都存储在一个或多个存储文件中,那么使用管理信息从具有对应于请求对象的相同URI的对象中选择最近的一个;以及
使用最近的一个文件名和地址信息从存储文件读出最近的一个。
24.根据权利要求23所述的终端设备,其中配置的自动访问系统以访问包含在访问网页中的链接页,并配置以通过网络保存链接页以及在URI列表中列出的网页。
25.根据权利要求23所述的终端设备,其中配置的自动访问系统以首先查询管理信息以确定URI列表中的网页是否已经存在于终端设备中,其中仅仅当确定URI列表中的各个网页不存在于终端设备中时,自动访问系统通过网络获得各个网页。
CN2004800153139A 2003-06-03 2004-05-28 使用页面存储文件浏览内容的方法 Expired - Fee Related CN1799051B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP157683/2003 2003-06-03
JP2003157683 2003-06-03
PCT/JP2004/007794 WO2004109552A2 (en) 2003-06-03 2004-05-28 Method for browsing contents using page storing file

Publications (2)

Publication Number Publication Date
CN1799051A CN1799051A (zh) 2006-07-05
CN1799051B true CN1799051B (zh) 2010-05-12

Family

ID=33508399

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2004800153139A Expired - Fee Related CN1799051B (zh) 2003-06-03 2004-05-28 使用页面存储文件浏览内容的方法

Country Status (5)

Country Link
US (1) US20070011130A1 (zh)
EP (1) EP1629404A2 (zh)
JP (1) JP2006526837A (zh)
CN (1) CN1799051B (zh)
WO (1) WO2004109552A2 (zh)

Families Citing this family (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2559079A1 (en) * 2004-03-10 2005-09-15 Nokia Corporation Storage of content-location information
JP2006338338A (ja) * 2005-06-02 2006-12-14 Sanden Corp 集中管理システムにおける被管理端末
US20070143293A1 (en) * 2005-12-15 2007-06-21 Inventec Corporation Portable device and network information browsing system and method
JP4943054B2 (ja) * 2006-05-02 2012-05-30 株式会社Access 端末装置、及び、端末装置用プログラム
GB0623912D0 (en) * 2006-11-30 2007-01-10 Bayne Duncan J Improved electronic form software and brower programming methods
US8117303B2 (en) * 2007-06-29 2012-02-14 Nokia Corporation Systems, methods, devices, and computer program products for downloading content for offline browsing
US20090063590A1 (en) * 2007-08-30 2009-03-05 Microsoft Corporation Operating System Support of Graceful Degradation for Web Applications
US8103967B2 (en) * 2007-08-31 2012-01-24 Microsoft Corporation Generating and organizing references to online content
US20090132556A1 (en) * 2007-11-16 2009-05-21 Nitin Gupta Offline operations for online applications
US9152208B2 (en) * 2008-04-10 2015-10-06 Here Global B.V. Methods, apparatuses and computer program products for updating a content item
WO2010022459A1 (en) 2008-08-27 2010-03-04 Rob Chamberlain System and/or method for linking network content
US9047381B1 (en) * 2009-07-17 2015-06-02 Open Invention Network, Llc Method and apparatus of obtaining and organizing relevant user defined information
US9213709B2 (en) * 2012-08-08 2015-12-15 Amazon Technologies, Inc. Archival data identification
US9767098B2 (en) 2012-08-08 2017-09-19 Amazon Technologies, Inc. Archival data storage system
US9563681B1 (en) 2012-08-08 2017-02-07 Amazon Technologies, Inc. Archival data flow management
CN102982044A (zh) * 2011-09-07 2013-03-20 腾讯科技(深圳)有限公司 一种网页浏览方法及装置
JP5984439B2 (ja) * 2012-03-12 2016-09-06 キヤノン株式会社 画像表示装置、画像表示方法
US10120579B1 (en) 2012-08-08 2018-11-06 Amazon Technologies, Inc. Data storage management for sequentially written media
US9904788B2 (en) 2012-08-08 2018-02-27 Amazon Technologies, Inc. Redundant key management
US9830111B1 (en) 2012-08-08 2017-11-28 Amazon Technologies, Inc. Data storage space management
US9652487B1 (en) 2012-08-08 2017-05-16 Amazon Technologies, Inc. Programmable checksum calculations on data storage devices
US9779035B1 (en) 2012-08-08 2017-10-03 Amazon Technologies, Inc. Log-based data storage on sequentially written media
US9225675B2 (en) 2012-08-08 2015-12-29 Amazon Technologies, Inc. Data storage application programming interface
US8805793B2 (en) 2012-08-08 2014-08-12 Amazon Technologies, Inc. Data storage integrity validation
CA2881567C (en) * 2012-08-08 2023-10-17 Amazon Technologies, Inc. Archival data storage system and method
US8959067B1 (en) 2012-08-08 2015-02-17 Amazon Technologies, Inc. Data storage inventory indexing
CN103870487B (zh) 2012-12-13 2017-07-25 腾讯科技(深圳)有限公司 网页文件处理方法及移动终端
CN103150291B (zh) * 2013-01-31 2015-09-09 小米科技有限责任公司 文件切边方法、终端及服务器
US10558581B1 (en) 2013-02-19 2020-02-11 Amazon Technologies, Inc. Systems and techniques for data recovery in a keymapless data storage system
CN104123292B (zh) * 2013-04-25 2018-07-06 腾讯科技(深圳)有限公司 信息记录方法、装置、浏览器及电子设备
US10353979B2 (en) 2013-04-25 2019-07-16 Tencent Technology (Shenzhen) Company Limited Web-user navigating information recording method, apparatus and storage medium
JP6157265B2 (ja) * 2013-08-08 2017-07-05 三菱電機株式会社 画像表示システム
US9456335B2 (en) 2013-09-21 2016-09-27 Oracle International Corporation Method and system for defining an offlinable model graph
CN103455632B (zh) * 2013-09-22 2018-11-23 深圳市金蝶精斗云网络科技有限公司 一种网页显示方法和客户端
CN103699840B (zh) * 2013-12-12 2017-07-11 北京奇虎科技有限公司 网页劫持的检测方法和装置
CN104899208A (zh) * 2014-03-05 2015-09-09 腾讯科技(深圳)有限公司 一种浏览器的缓存方法及装置
US11386060B1 (en) 2015-09-23 2022-07-12 Amazon Technologies, Inc. Techniques for verifiably processing data in distributed computing systems
KR101893371B1 (ko) * 2016-11-30 2018-08-31 충북대학교 산학협력단 온라인 상에서의 열람정보에 대한 오프라인 상에서의 액세스 시스템 및 방법
CN106777348B (zh) * 2017-01-17 2019-10-25 武汉噢易云计算股份有限公司 基于HAR的脱离后台逻辑的Web系统演示方法及装置
US10416940B2 (en) * 2017-03-17 2019-09-17 Ricoh Company, Ltd. Image processing apparatus, image processing system, and image processing method for interpreting content obtained from a web browser and displaying a screen based on the interpreted content
US12086450B1 (en) 2018-09-26 2024-09-10 Amazon Technologies, Inc. Synchronous get copy for asynchronous storage
US12073264B2 (en) * 2021-12-07 2024-08-27 Sap Se Decomposition of resource discovery roles, parts, and transport modeslc

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1194413A (zh) * 1997-03-26 1998-09-30 国际商业机器公司 在服务器上预先高速缓存数据的方法和设备
US5987476A (en) * 1996-01-31 1999-11-16 Kabushiki Kaisha Toshiba File reading method and file requesting client device in client-server information communication system
US6105028A (en) * 1997-06-26 2000-08-15 Digital Equipment Corporation Method and apparatus for accessing copies of documents using a web browser request interceptor
CN1356644A (zh) * 2000-11-30 2002-07-03 国际商业机器公司 从网络服务器向客户计算机提供资源的方法
CN1368691A (zh) * 2001-02-07 2002-09-11 无敌科技(西安)有限公司 在掌上型数据处理装置浏览网络资料的方法

Family Cites Families (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5165103A (en) * 1986-09-12 1992-11-17 Hitachi, Ltd. Image data processing method for selective partial image storage
JPH03223966A (ja) * 1989-12-26 1991-10-02 Fuji Xerox Co Ltd ファイリング装置およびそれを用いたファイル検索方法
US5479656A (en) * 1992-05-13 1995-12-26 Rawlings, Iii; Joseph H. Method and system for maximizing data files stored in a random access memory of a computer file system and optimization therefor
JP2865500B2 (ja) * 1992-09-30 1999-03-08 富士通株式会社 ファイル格納管理方法
US5694546A (en) * 1994-05-31 1997-12-02 Reisman; Richard R. System for automatic unattended electronic information transport between a server and a client by a vendor provided transport software with a manifest list
US5737599A (en) * 1995-09-25 1998-04-07 Rowe; Edward R. Method and apparatus for downloading multi-page electronic documents with hint information
EP0773503B1 (en) * 1995-11-10 2004-03-31 Kabushiki Kaisha Toshiba File transfer method, method for a file requesting client device, and file server device
US5987459A (en) * 1996-03-15 1999-11-16 Regents Of The University Of Minnesota Image and document management system for content-based retrieval
US5864852A (en) * 1996-04-26 1999-01-26 Netscape Communications Corporation Proxy server caching mechanism that provides a file directory structure and a mapping mechanism within the file directory structure
US5991798A (en) * 1996-05-17 1999-11-23 Hitachi, Ltd. Package medium system having URL hyper-linked to data in removable storage
JP2976896B2 (ja) 1996-07-31 1999-11-10 日本電気株式会社 リモートファイルのキャッシュ装置
US5892908A (en) * 1996-09-10 1999-04-06 Marketscape Method of extracting network information
US6026474A (en) * 1996-11-22 2000-02-15 Mangosoft Corporation Shared client-side web caching using globally addressable memory
US6678724B2 (en) * 1997-03-12 2004-01-13 Microsoft Corporation Common namespace for internet and local filesystem objects
JP3560758B2 (ja) * 1997-03-17 2004-09-02 シャープ株式会社 データ管理方法およびそれを用いたデータ管理装置
FI115566B (fi) * 1997-06-02 2005-05-31 Ericsson Telefon Ab L M Menetelmä ja järjestely selailuun
US20010010046A1 (en) * 1997-09-11 2001-07-26 Muyres Matthew R. Client content management and distribution system
US6163779A (en) * 1997-09-29 2000-12-19 International Business Machines Corporation Method of saving a web page to a local hard drive to enable client-side browsing
US5848410A (en) * 1997-10-08 1998-12-08 Hewlett Packard Company System and method for selective and continuous index generation
US6442598B1 (en) * 1997-10-27 2002-08-27 Microsoft Corporation System and method for delivering web content over a broadcast medium
US6119153A (en) * 1998-04-27 2000-09-12 Microsoft Corporation Accessing content via installable data sources
JP2000035933A (ja) * 1998-07-16 2000-02-02 Fujitsu Ltd ファイル管理方法、ファイル表示方法及び記憶媒体
US6493758B1 (en) * 1998-09-08 2002-12-10 Microsoft Corporation Offline viewing of internet content with a mobile device
US7100106B1 (en) * 1998-12-14 2006-08-29 Microsoft Corporation Mirroring operations performed on linked files and folders
US6507867B1 (en) * 1998-12-22 2003-01-14 International Business Machines Corporation Constructing, downloading, and accessing page bundles on a portable client having intermittent network connectivity
US6567918B1 (en) * 1999-01-28 2003-05-20 Microsoft Corporation Saved Web page security system and method
US6625624B1 (en) * 1999-02-03 2003-09-23 At&T Corp. Information access system and method for archiving web pages
US6880008B1 (en) * 1999-03-31 2005-04-12 Sony Corporation System and method for retrieving a backup file having a file name exactly corresponding to the date and time of a client request, if no exact match for the date and time corresponding to the client request is found, to search for the backup file having the file name with a date and time that are closest to but prior to the specified date and time
US6578078B1 (en) * 1999-04-02 2003-06-10 Microsoft Corporation Method for preserving referential integrity within web sites
US6757698B2 (en) * 1999-04-14 2004-06-29 Iomega Corporation Method and apparatus for automatically synchronizing data from a host computer to two or more backup data storage locations
US6438743B1 (en) * 1999-08-13 2002-08-20 Intrinsity, Inc. Method and apparatus for object cache registration and maintenance in a networked software development environment
US7096417B1 (en) * 1999-10-22 2006-08-22 International Business Machines Corporation System, method and computer program product for publishing interactive web content as a statically linked web hierarchy
WO2001039043A2 (en) * 1999-11-23 2001-05-31 Microsoft Corporation Content-specific filename systems
JP2001169067A (ja) * 1999-12-10 2001-06-22 Ricoh Co Ltd 画像処理装置、画像情報管理方法およびその方法をコンピュータに実行させるプログラムを記憶したコンピュータ読み取り可能な記憶媒体
JP3842940B2 (ja) * 1999-12-17 2006-11-08 株式会社リコー 画像処理装置
US6608634B1 (en) * 1999-12-23 2003-08-19 Qwest Communications International, Inc. System and method for demonstration of dynamic web sites with integrated database without connecting to a network
US8171158B1 (en) * 2000-03-27 2012-05-01 Altera Corporation Browser system and method
US6643641B1 (en) * 2000-04-27 2003-11-04 Russell Snyder Web search engine with graphic snapshots
US6886132B1 (en) * 2000-06-06 2005-04-26 Microsoft Corporation Method and system for packing and unpacking web pages
US6996599B1 (en) * 2000-06-21 2006-02-07 Microsoft Corporation System and method providing multi-tier applications architecture
US7231494B1 (en) * 2000-10-03 2007-06-12 Ironport System, Inc. Storage and retrieval system for WEB cache
EP1205855A3 (en) * 2000-11-10 2006-01-25 Masae Yanagi Data managing method, data managing system, data managing apparatus, data handling apparatus, computer program, and recording medium
US20020073082A1 (en) * 2000-12-12 2002-06-13 Edouard Duvillier System modification processing technique implemented on an information storage and retrieval system
US7356530B2 (en) * 2001-01-10 2008-04-08 Looksmart, Ltd. Systems and methods of retrieving relevant information
US7159014B2 (en) * 2001-06-04 2007-01-02 Fineground Networks Method and system for efficient and automated version management of embedded objects in web documents
US20030014441A1 (en) * 2001-06-29 2003-01-16 Akira Suzuki Document data structure, information recording medium, information processing apparatus, information processing system and information processing method
US6985936B2 (en) * 2001-09-27 2006-01-10 International Business Machines Corporation Addressing the name space mismatch between content servers and content caching systems
CN1476561A (zh) * 2001-09-28 2004-02-18 索尼株式会社 访问限制装置、访问限制方法、记录有访问限制程序的计算机可读程序存储媒体以及访问限制程序
US6754800B2 (en) * 2001-11-14 2004-06-22 Sun Microsystems, Inc. Methods and apparatus for implementing host-based object storage schemes
US6944634B2 (en) * 2002-04-24 2005-09-13 Hewlett-Packard Development Company, L.P. File caching method and apparatus
US20040088647A1 (en) * 2002-11-06 2004-05-06 Miller Adrian S. Web-based XML document processing system
JP4219839B2 (ja) 2004-03-25 2009-02-04 独立行政法人石油天然ガス・金属鉱物資源機構 水素化処理方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5987476A (en) * 1996-01-31 1999-11-16 Kabushiki Kaisha Toshiba File reading method and file requesting client device in client-server information communication system
CN1194413A (zh) * 1997-03-26 1998-09-30 国际商业机器公司 在服务器上预先高速缓存数据的方法和设备
US6105028A (en) * 1997-06-26 2000-08-15 Digital Equipment Corporation Method and apparatus for accessing copies of documents using a web browser request interceptor
CN1356644A (zh) * 2000-11-30 2002-07-03 国际商业机器公司 从网络服务器向客户计算机提供资源的方法
CN1368691A (zh) * 2001-02-07 2002-09-11 无敌科技(西安)有限公司 在掌上型数据处理装置浏览网络资料的方法

Also Published As

Publication number Publication date
CN1799051A (zh) 2006-07-05
WO2004109552A3 (en) 2005-03-03
WO2004109552A2 (en) 2004-12-16
EP1629404A2 (en) 2006-03-01
US20070011130A1 (en) 2007-01-11
JP2006526837A (ja) 2006-11-24

Similar Documents

Publication Publication Date Title
CN1799051B (zh) 使用页面存储文件浏览内容的方法
US8572202B2 (en) Persistent saving portal
CN100476805C (zh) 与字符流相关的基于主机智能结果的信息呈现方法及系统
US7877682B2 (en) Modular distributed mobile data applications
US6457046B1 (en) Information providing apparatus for server and computer-readable recording medium storing information providing program for server
US20070208704A1 (en) Packaged mobile search results
US20070162566A1 (en) System and method for using a mobile device to create and access searchable user-created content
US20020198962A1 (en) Method, system, and computer program product for distributing a stored URL and web document set
US20020124022A1 (en) Method and apparatus for processing web documents using multi-browse function
JP2001503537A (ja) オンラインデータリポジトリの変更データの識別
US20070162459A1 (en) System and method for creating searchable user-created blog content
US20050114756A1 (en) Dynamic Internet linking system and method
US11599584B2 (en) Method and system for processing information in social network system
WO2008141424A1 (en) System and method for content navigation
WO2005103929A1 (en) Method, system, and computer program product for sharing information within a global computer network
US20070162524A1 (en) Network document management
US7895337B2 (en) Systems and methods of generating a content aware interface
US20090125533A1 (en) Reference-Based Technique for Maintaining Links
US7089305B2 (en) Conditional promotion of bookmarks
JP2002082936A (ja) コンテンツデータ表示装置とコンテンツデータ表示システム
JPH10171703A (ja) サイトマップ表示装置および文書閲覧支援装置
US6993525B1 (en) Document-database access device
JP4253315B2 (ja) 知識情報収集システムおよび知識情報収集方法
JP3708893B2 (ja) 知識情報収集システムおよび知識情報収集方法
JP3708894B2 (ja) 知識情報収集システムおよび知識情報収集方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100512

Termination date: 20140528