[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN101458702A - 用于建立地址数据库的设备及其方法 - Google Patents

用于建立地址数据库的设备及其方法 Download PDF

Info

Publication number
CN101458702A
CN101458702A CNA200810186709XA CN200810186709A CN101458702A CN 101458702 A CN101458702 A CN 101458702A CN A200810186709X A CNA200810186709X A CN A200810186709XA CN 200810186709 A CN200810186709 A CN 200810186709A CN 101458702 A CN101458702 A CN 101458702A
Authority
CN
China
Prior art keywords
address
effective
read
effective address
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA200810186709XA
Other languages
English (en)
Other versions
CN101458702B (zh
Inventor
金湖然
张升翼
朴钟兴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Electronics and Telecommunications Research Institute ETRI
Original Assignee
Electronics and Telecommunications Research Institute ETRI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Electronics and Telecommunications Research Institute ETRI filed Critical Electronics and Telecommunications Research Institute ETRI
Publication of CN101458702A publication Critical patent/CN101458702A/zh
Application granted granted Critical
Publication of CN101458702B publication Critical patent/CN101458702B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/217Database tuning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/40Data acquisition and logging

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Sorting Of Articles (AREA)

Abstract

本发明涉及一种用于建立地址数据库的设备及其方法。根据本发明的设备包括:地址读取单元,用于从地址图像中读取地址;读取结果存储单元,用于存储所读取的地址和表示所读取的地址的读取次数的累积值;有效地址存储单元,用于存储包括多个实际存在的有效地址的有效地址数据库;以及有效地址提取单元,用于根据从读取结果存储单元加载的所读取的地址的累积值是否大于预定阈值,来将所读取的地址存储在有效地址存储单元中。根据本发明,通过验证从被写入在一封邮件上的地址信息中读取的地址来建立地址数据库,从而改善了地址数据库的可靠性和完整性。

Description

用于建立地址数据库的设备及其方法
相关申请的交叉引用
本申请要求2007年12月13日向韩国知识产权局提交的韩国专利申请第10-2007-0130132号的优先权和权益,通过参考将其全部内容合并于此。
技术领域
本发明涉及一种用于建立地址数据库的设备及其方法。
更具体地,本发明涉及一种用于从其中分别写入地址的邮件中提取地址并使用所提取的地址建立地址数据库的设备、及其方法。
本发明受到MIC/IITA的IT R&D规划[2006-X-001-02,Development ofElement Technology for Real-time Postal Distribution(用于实时邮政分发的基本技术的开发)]支持。
背景技术
地址信息可以与许多不同的对象一起使用,并且对自动分类邮件的性能具有很大影响。因此,建立准确的地址数据库是提高邮件服务效率的必要条件之一。
结果,存在如下的需要:收集全国的(countrywide)地址信息、使用所述地址信息建立地址数据库、并然后连续管理和充分利用所述数据库。
而且,需要动员人力资源和连续付出努力,并且难以很好地建立地址数据库。为了这些原因,最近在韩国已经实现了建立邮件地址数据库的尝试。
在相关技术中,邮件地址数据库通过以下方法建立:其中由邮政服务雇员收集地址,并排列和输入地址。然而,因为在收集邮件地址时遗漏一些邮件地址、并且操作者在输入地址时可能犯错误,所以存在降低了地址数据库可靠性和质量的问题。
为了解决所述问题,可能通过利用自动分类器来连续检查并补充地址数据库而改善它的质量。然而,这由于建立地址数据库的初始处理中的反复试验而导致巨大花费。
而且,即使地址数据库最初是完美的,但由于重复地进行邮件地址的创建和废弃,所以地址数据库的完美性在一段时间之后也降低。相应地,为了维持地址数据库的数据与国家中的实际邮件地址之间的对应关系,没有选择,只有依靠诸如收集邮件地址的邮政服务雇员和其他人的努力。这连续地导致了建立和维持地址数据库的巨大花费。
此外,可能通过使用自动识别技术来从邮件中提取地址信息。然而,在所提取的地址信息的可靠性方面存在问题。相应地,难以将地址信息的提取应用于建立可以依赖的地址数据库。
在这个背景技术部分公开的上面信息仅仅是为了增强对本发明背景技术的理解,并因此它可能包含没有形成对于本领域普通技术人员而言在这个国家中已知的现有技术的信息。
发明内容
已努力做出本发明以提供用于通过验证从邮件的地址中读取的地址信息来建立具有高可靠性的地址数据库的设备、及其方法。
本发明的示范实施例提供了一种利用包括地址的地址图像来建立地址数据库的设备。所述设备包括:地址读取单元,用于从地址图像中读取地址;读取结果存储单元,用于存储所读取的地址和表示所读取的地址的读取次数的累积值;有效地址存储单元,用于存储包括多个实际存在的有效地址的有效地址数据库;以及有效地址提取单元,用于根据从读取结果存储单元加载的所读取的地址的累积值是否大于预定阈值,来将所读取的地址存储在有效地址存储单元中。
本发明的又一实施例提供了一种用于利用包括地址的地址图像来建立地址数据库的方法。所述方法包括:存储从地址图像中读取的地址和表示所读取的地址的读取次数的累积值;确定所读取的地址的累积值是否大于预定阈值;以及当所读取的地址的累积值大于预定阈值时,将所读取的地址存储在有效地址数据库中,其中所述有效地址数据库包括实际存在的有效地址。
本发明的又一实施例提供了一种用于利用包括地址的地址图像来建立地址数据库的设备。所述设备包括:地址读取单元,用于从地址图像中读取地址;读取结果存储单元,用于存储所读取的地址和表示所读取的地址的读取次数的累积值;有效地址存储单元,用于存储包括多个在世界上实际存在的有效地址的有效地址数据库;有效地址候选者提取单元,用于根据从读取结果存储单元加载的所读取的地址的累积值是否大于预定阈值,来将所读取的地址设置为有效地址候选者;和有效地址验证单元,用于输出有效地址候选者和与其对应的地址图像,地址管理员向该有效地址验证单元提供关于所述有效地址候选者是否与地址图像的地址相同的信息,并且基于所述信息在有效地址数据库中存储有效地址候选者。
本发明的又一实施例提供了一种用于利用包括地址的地址图像来建立地址数据库的方法。所述方法包括:存储从地址图像中读取的地址和表示所读取的地址的读取次数的累积值;当所读取的地址的累积值大于预定阈值时,将所读取的地址设置为有效地址候选者;输出有效地址候选者和与其对应的地址图像,并被提供从地址管理员输入的、关于所述有效地址候选者是否与地址图像的地址相同的信息;以及基于所述信息将所述有效地址候选者存储在有效地址数据库中,其中所述有效地址数据库包括实际存在的有效地址。
根据本发明的实施例,通过验证从邮件的地址中读取的地址信息、并基于所述地址信息来建立地址数据库,可能改善地址数据库的可靠性和完整性。
除了读取地址信息之外,执行维持地址数据库的数据以对应于实际的邮件地址。结果,这允许减少建立地址数据库所需要的花费和努力。
附图说明
图1示出了根据本发明第一示范实施例的、用于建立有效地址数据库的设备的构造。
图2示出了根据本发明第一示范实施例的、用于建立有效地址数据库的方法的流程图。
图3示出了根据本发明第二示范实施例的、用于建立有效地址数据库的设备的构造。
图4示出了根据本发明第二示范实施例的、用于在线实时地建立有效地址数据库的方法的流程图。
图5示出了根据本发明第二示范实施例的、用于在线实时地建立有效地址数据库的方法中的步骤S493的详细处理的流程图。
图6示出了根据本发明第二示范实施例的、用于离线地建立有效地址数据库的方法中的用于存储读取结果的处理的流程图。
图7示出了根据本发明第二示范实施例的、用于离线地建立有效地址数据库的方法中的用于向地址数据库添加有效地址候选者的处理的流程图。
图8示出了根据本发明第二示范实施例的、用于离线地建立有效地址数据库的方法中的用于从地址数据库中删除无效地址候选者的处理的流程图。
具体实施方式
在接下来的详细描述中,简单通过图示的方式已经仅仅示出并描述了本发明的特定示范实施例。如本领域的技术人员将实现的,可以以各种不同的方式修改所描述的实施例,而都不脱离本发明的精神或范围。相应地,附图和描述将实际上被认为是图示性的而不是限制性的。贯穿说明书中,相同的附图标记指定相同的元件。
另外,除非明确地相反描述,词语“包括”以及诸如“包含”或“含有”的变型将被理解为意指包括所陈述的元件但并不排除任何其它元件。
现在,将详细说明根据本发明示范实施例的、用于建立有效地址数据库的设备及其方法。
图1示出了根据本发明第一示范实施例的、用于建立有效地址数据库的设备的构造。
参考图1,本发明第一示范实施例的有效地址数据库建立设备100包括:地址图像提供单元110、地址读取单元120、读取结果存储单元130、有效地址提取单元140、和有效地址存储单元180。
地址图像提供单元110扫描在其上写入地址的邮件,生成地址图像,并将它提供到地址读取单元120。
这里,地址图像提供单元110可以是类似自动邮件分类器的用于自动提供邮件的装置、或者是用于提供由照相机或扫描仪扫描的图像的装置、以及其它。
地址读取单元120对包括字符或条形码的地址图像执行预处理,并识别它以生成与该地址图像对应的地址字符串。而且,地址读取单元120通过使用类似条形码读取、字符识别、和地址解译的技术,来自动地从地址图像提供单元110所提供的地址图像中读取地址。
这里,由于不能够通过对地址数据库的地址执行后处理来利用可读取地址的识别装置从地址数据库获得新添加的地址信息,所以地址读取单元120从地址图像中读取地址,而没有使用地址数据库。
而且,地址读取单元120不仅读取包括字符串的地址,还读取由条形码构成的地址信息。相应地,它可能能够减少读取地址中的错误。
读取结果存储单元130存储并管理由地址读取单元120读取的多个地址。
在这个情况下,当输入了与已经存储在读取结果存储单元130中的地址等同的地址时,读取结果存储单元130生成地址的累积值(accumulatedvalue),并将它存储为与所述地址匹配。这里,累积值用于提取有效地址。
读取结果存储单元130存储地址字符串,并照原样存储类似住宅门牌号码和街区编号或建筑物的房间号的详细信息。
在这个情况下,在执行地址解译和地址信息的后处理之后,读取结果存储单元130可使用类似行政区域的名称的地址信息。
当执行地址解译时,由于根据地址组织来建立行政区域名称数据库相对容易,所以执行类似街区编号和房间号的详细地址信息的提取和分析。
有效地址提取单元140加载并分析所读取的地址、和作为通过读取多个地址图像获得的结果并被存储在读取结果存储单元130中的那些地址的累积值。然后,有效地址提取单元140从所读取的地址中提取具有高可能性的地址,所述可能性表示地址可能真实有效。
这里,有效地址提取单元140检查累积值,确定高于预定阈值的累积值的所读取的地址作为有效地址,并将该有效地址存储在有效地址存储单元180中。
有效地址存储单元180存储并管理包括真实有效地址的有效地址数据库。
有效地址存储单元180提供用于确定在世界上是否真的存在由地址读取单元120读取的地址所需要的信息,并且还提供有效地址提取单元140从在读取结果存储单元130中存储的多个所读取的地址中提取有效地址所需要的信息。
此外,有效地址存储单元180存储被有效地址提取单元140确定为真实存在地址的有效地址。
现在,参考图2,将描述根据本发明第一示范实施例的、用于建立有效地址数据库的方法。
图2示出了根据本发明第一示范实施例的、用于建立有效地址数据库的方法的流程图。
根据本发明第一示范实施例的方法涉及如下的处理:当输入地址图像时,实时地确定地址图像的地址是否是有效地址,并基于有效地址建立有效地址数据库。
首先,地址图像提供单元110通过扫描一封邮件的地址(即,邮件上被写入地址的部分)来生成地址图像,并将所述地址图像提供到地址读取单元120(S210)。地址读取单元120从所述地址图像中读取地址(S220),并将所读取的地址和所读取的地址的累积值存储在读取结果存储单元130中(S230)。
接下来,有效地址提取单元140加载包括所读取的地址及其累积值的读取地址结果,并确定所述累积值中的每一个是否大于预定的阈值(S240)。
在步骤S240中,当累积值大于预定的阈值时,有效地址提取单元140通过检查具有该累积值的所读取的地址是否处于有效地址存储单元180的有效地址数据库中,来确定它是否是新的有效地址(S250)。
在步骤S250中,当由于具有该累积值的所读取的地址没有处于有效地址数据库中而确定所述所读取的地址是新的有效地址时,有效地址提取单元140将所述所读取的地址设置为新的有效地址并将它存储在有效地址存储单元180的有效地址数据库中(S260)。
然而,当在步骤S240中所读取的地址不具有大于预定阈值的累积值时、或当在步骤S250中具有该累积值的所读取的地址没有被确定为新的有效地址时,终止本方法的上面处理。
图3示出了根据本发明第二示范实施例的、用于建立有效地址数据库的设备。
参考图3,根据本发明第二示范实施例的有效地址数据库建立设备300包括:地址图像提供单元310、地址读取单元320、读取结果存储单元330、有效地址候选者提取单元340、有效地址验证单元350、无效地址候选者提取单元360、无效地址验证单元370、和有效地址存储单元380。
这里,根据本发明第二示范实施例的有效地址数据库建立设备的结构与根据本发明第一示范实施例的所述设备的结构类似。因此,将省略与第一示范实施例的那些构成元件相同的构成元件的描述。
有效地址候选者提取单元340加载并分析已经累积并存储在读取结果存储单元330中的读取结果,并然后提取具有高可能性的地址,所述可能性表示地址可能是真实有效的。
这里,象第一示范实施例的有效地址提取单元140一样,有效地址候选者提取单元340使用累积的统计来选择有效地址。
例如,在地址读取结果已经累积了有规则的时间段之后、或者在地址读取结果的数量满足预定的数量之后,将在读取结果中出现超过阈值次数的地址确定为真实存在的有效地址。当被确定为有效地址的地址没有包括在有效地址存储单元380的有效地址数据库中时,将该地址设置为有效地址候选者。
有效地址验证单元350验证有效地址候选者提取单元340所提取的地址,即,有效地址候选者。这里,有效地址验证单元350输出有效地址候选者以及地址图像,所述地址图像是通过地址图像提供单元310扫描邮件获得的、并且基于选择有效地址候选者。而且,有效地址验证单元350被提供有地址管理员的输入,该地址管理员用于确定有效地址候选者的有效性,并且由于有效地址候选者与地址图像的地址相同,所以有效地址验证单元350在有效地址存储单元380的有效地址数据库中存储被地址管理员确定为有效的有效地址候选者。
在这个情况下,有效地址验证单元350输出基于选择有效地址候选者的地址图像作为视频场景(scene),从而地址管理员看见该视频场景并确定是否正确地执行了地址图像的读取。
这里,验证有效地址可被分类为:用于确定地址读取单元320所读取并提供的地址是否等同于地址图像的地址的处理;以及用于确定在一封邮件中是否真的使用了所提供的地址的处理。
在这个情况下,可基于对正被讨论的区域的认知来执行后面的处理。因此,需要诸如所述区域的邮政服务雇员或市政公务员的人员。
由于一个人难以执行两个处理,所以如偶尔需要的,有效地址验证单元350可通过基于地址图像来确定读取结果的有效性并验证将要添加的有效地址的有效性,来执行有效地址的验证。
添加有效地址可通过以下两种方法来实现:在线实时有效地址数据库添加方法,用于只要输入读取结果就确定读取结果的地址是否是有效地址;和离线有效地址数据库添加方法,用于通过分析累积的读取结果的同时来提取有效地址。
无效地址候选者提取单元360加载并分析在读取结果存储单元330中已经累积的读取结果,并从有效地址存储单元380的地址中提取地址可能实际不存在的高可能性的地址。
这里,无效地址候选者提取单元360使用累积的统计来选择无效地址。
例如,在地址读取结果已经累积了有规则的时间段之后、或者在地址读取结果的数量满足预定的数量之后,将在读取结果中出现低于阈值次数的地址确定为无效地址。当被确定为无效地址的地址存储在有效地址存储单元380的有效地址数据库中时,将该地址设置为无效地址候选者。
无效地址验证单元370输出无效地址候选者以及地址图像,所述地址图像是通过地址图像提供单元310扫描邮件获得的、并且基于选择无效地址候选者。而且,无效地址验证单元370被提供有地址管理员的输入,该地址管理员用于确定无效地址候选者的无效性,并且当因为无效地址候选者与该地址图像的地址相同所以该地址管理员确定该无效地址候选者无效时,该无效地址验证单元370从有效地址数据库中删除该无效地址候选者。
在这个情况下,无效地址验证单元370输出基于选择无效地址候选者的地址图像作为视频场景,从而地址管理员看见该视频场景并确定是否正确地执行了读取地址图像。
接下来,将参考附图描述用于建立在线实时有效地址的方法和用于建立离线有效地址数据库的方法。
在线实时有效地址数据库建立方法当通过地址图像提供单元310输入地址图像时实时地确定该地址图像的地址是否是有效地址,并当该地址图像被确定为有效地址时将该地址图像的地址添加到有效地址数据库中。
离线有效地址数据库建立方法在超过预定数目的地址图像被累积在读取结果存储单元330中之后确定所述地址图像的地址是有效地址,并然后将被确定为有效地址的所述地址图像的地址添加到有效地址数据库中。
现在,将描述在线实时有效地址数据库建立方法。
图4示出了根据本发明第二示范实施例的在线实时有效地址数据库建立方法的流程图。图5示出了在线实时有效地址数据库建立方法的步骤的流程图。
将参考图4和图5描述在线实时有效地址数据库建立方法。
地址图像提供单元310通过扫描一封邮件的被写入地址的部分来生成地址图像,并将所述地址图像输入到地址读取单元320(S410)。地址读取单元320从地址图像中读取地址(S420),并将所读取的地址存储到读取结果存储单元330(S430)。
在这个情况下,在读取结果存储单元330中存在多个所读取的地址和与每个所读取的地址对应的累积值,其中累积值表示读取并存储对应的所读取的地址的累积次数。
有效地址候选者提取单元340分析来自读取结果存储单元330的所读取的地址和其累积值(S440),并确定该所读取的地址的累积值是否小于预定的阈值(S450)。
当所读取的地址的累积值小于预定的阈值时,有效地址候选者提取单元340调整预定的阈值(S460)。
这里,根据接下来的等式1和2来调整所述预定的阈值。
(等式1)
T=max((k×E/P),L)
(k>0,L>0,k和L是常数)
(等式2)
T=max((k×N/D),L)
(k>0,L>0,k和L是常数)
这里,T表示作为用于确定有效地址的参考的阈值,N表示所提供的地址图像的总数,E表示具有有效地址的邮件数量(E<=N),D表示在一区域中的邮政投递分支机构的数目,而P表示其中出现有效地址邮件的邮政投递分支机构的数目。
而且,N、E、D、P>m。L表示最小的阈值,而m表示在投递邮件时使用的邮政投递分支机构的最小数目。
当n(a)表示所读取的地址的出现积累频率时,如果n(a)>=T,则所读取的地址是有效地址,而如果n(a)<T,则所读取的地址是无效地址。
然后,有效地址候选者提取单元340确定是否输入来自地址图像提供单元310的新的所读取的地址并将其存储在读取结果存储单元330中(S470),并且当没有输入并存储所述新的所读取的地址时终止上述的处理。
其间,在步骤S450中,当所读取的地址的累积值不小于预定阈值时,有效地址候选者提取单元340确定该所读取的地址作为有效地址。然后,有效地址候选者提取单元340确定所读取的地址是否在有效地址存储单元380的有效地址数据库中(S480)。
当所读取的地址不在有效地址存储单元380的有效地址数据库中时,有效地址候选者提取单元340确定当前的模式是否是自动添加模式,该自动添加模式用于当确定了有效地址时自动将有效地址存储在有效地址存储单元380的有效地址数据库中(S491)。
当当前模式不是自动添加模式时,如图5所示,有效地址验证单元350输出有效地址候选者提取单元340所确定的有效地址候选者、以及与该有效地址候选者对应的并且从地址图像提供单元310提供的地址图像(S493b)。然后,地址管理员向有效地址验证单元350提供关于该有效地址候选者是否等同于地址图像的地址的信息(S493c)。
在这个情况下,用于按照出现累积频率的顺序来排列有效地址候选者以便改善地址管理员的处置效率的步骤S493a可以插入在步骤S493与步骤S493b之间。
如图4所示,有效地址验证单元350基于从地址管理员输入的信息来确定有效地址候选者是否与地址图像的地址相同(S494)。
当有效地址候选者与地址图像的地址相同时,有效地址验证单元350将该有效地址候选者添加到有效地址存储单元380的有效地址数据库中,并前进到步骤S460。
然而,当有效地址候选者与地址图像的地址不相同时,执行对在读取结果存储单元330中存储的有效地址候选者的累积值的补偿,并然后执行步骤S460。
这里,例如,因为有效地址候选者不等同于地址图像的地址,所以有效地址候选者提取单元340从该有效地址候选者的累积值中减去“1”。
其间,在步骤S491中,当当前模式是自动添加模式时,有效地址验证单元350确定由有效地址候选者提取单元340确定的有效地址候选者是否处于有效地址存储单元380的有效地址数据库中(S492)。
当由有效地址候选者提取单元340确定的有效地址候选者处于有效地址存储单元380的有效地址数据库中时,有效地址验证单元350前进到步骤S460。然而,当它不在有效地址数据库中时,有效地址验证单元350前进到步骤S495。
接下来,将描述离线有效地址数据库建立方法。
图6示出了根据本发明第二示范实施例的、离线有效地址数据库建立方法中的用于存储读取结果的处理的流程图。图7和图8分别示出了根据本发明第二示范实施例的、离线有效地址数据库建立方法中的、用于向有效地址数据库添加有效地址候选者的处理的流程图、和用于从有效地址数据库中删除无效地址候选者的处理的流程图。
首先,将参考图6描述离线有效地址数据库建立方法中的用于存储读取结果的处理。
地址图像提供单元310通过扫描一封邮件的被写入地址的部分来生成地址图像,并将所述地址图像输入到地址读取单元320(S610)。地址读取单元320从地址图像中读取地址(S620),并将所读取的地址存储到读取结果存储单元330(S630)。
在这个情况下,在读取结果存储单元330中存在多个所读取的地址和与每个所读取的地址对应的累积值,其中所述累积值表示读取并存储对应的所读取的地址的累积次数。
然后,地址图像提供单元310确定是否通过扫描一封新邮件而生成了新的地址图像(S640),并且当没有生成新的地址图像时终止处理。
这里,当生成了新的地址图像时,地址图像提供单元310重复步骤S610-S640。
接下来,参考图7,将描述根据本发明第二示范实施例的、离线有效地址数据库建立方法中的用于向有效地址数据库添加有效地址候选者的处理。
当已经过去预定的时间时,例如当在开始用于在读取结果存储单元330中存储读取结果的处理之后已经过去了预定时间时,或者当从地址图像中读取的读取结果的数目超过预定的数目时,有效地址候选者提取单元340从读取结果存储单元330加载读取结果(S710),并分析与该读取结果的所读取的地址对应的累积值(S720)。
有效地址候选者提取单元340从读取结果之中选择如下的地址,该地址具有超过预定阈值的累积值、并且不在有效地址存储单元380的有效地址数据库中(S730)。
这里,所选择的地址被设置为有效地址候选者。
有效地址验证单元350从有效地址候选者提取单元340所选择的有效地址候选者之中选择一个,并确定当前模式是否是用于在有效地址存储单元380的有效地址数据库中自动存储有效地址候选者的自动添加模式(S750)。
当在步骤S750中当前模式是自动添加模式时,有效地址验证单元350将所选择的有效地址候选者存储在有效地址存储单元380的有效地址数据库中(S760),并确定在有效地址候选者提取单元340所选择的有效地址候选者之中是否存在由于未被选择而被留下的任何有效地址候选者(S770)。
当存在被留下的有效地址候选者时,有效地址验证单元350前进到步骤S740。
其间,当在步骤S750中当前模式不是自动添加模式时,有效地址验证单元350输出所选择的有效地址候选者以及与其对应的地址图像,以便地址管理员看见。然后,根据地址管理员的验证向有效地址验证单元350提供输入(S780)。
有效地址验证单元350基于地址管理员的输入来确定所输出的有效地址候选者是否与该地址图像的地址相同(S790)。
当所输出的有效地址候选者等同于该地址图像的地址时,有效地址验证单元350前进到步骤S760,而当所输出的有效地址候选者不同于该地址图像的地址时,有效地址验证单元350前进到步骤S770。
接下来,参考图8,将描述根据本发明第二示范实施例的、离线有效地址数据库建立方法中的用于从有效地址数据库中删除无效地址候选者的处理。
当已经过去预定的时间时,例如当在开始用于在读取结果存储单元330中存储读取结果的处理之后已经过去了预定时间时,或者当从地址图像中读取的读取结果的数目超过预定的数目时,无效地址候选者提取单元360从读取结果存储单元330加载读取结果(S810),并分析与该读取结果的所读取的地址对应的累积值(S820)。
无效地址候选者提取单元360从读取结果之中选择如下的地址,该地址具有小于预定阈值的累积值、并且处于有效地址存储单元380的有效地址数据库中(S830)。
这里,所选择的地址被设置为无效地址候选者。
无效地址验证单元370从无效地址候选者提取单元360所选择的无效地址候选者之中选择一个,并确定当前模式是否是用于从有效地址存储单元380的有效地址数据库中自动删除无效地址候选者的自动删除模式(S850)。
当在步骤S850中当前模式是自动删除模式时,无效地址验证单元370将所选择的无效地址候选者从有效地址存储单元380的有效地址数据库中删除(S860),并确定在无效地址候选者提取单元360所选择的无效地址候选者之中是否存在由于未被选择而被留下的无效地址候选者(S870)。
当存在被留下的无效地址候选者时,无效地址验证单元370前进到步骤S840。
其间,当在步骤S850中当前模式不是自动删除模式时,无效地址验证单元370输出所选择的无效地址候选者以及与其对应的地址图像,以便地址管理员看见。然后,根据地址管理员的验证向无效地址验证单元370提供输入(S880)。
无效地址验证单元370基于地址管理员的输入来确定所输出的无效地址候选者是否与该地址图像的地址相同(S890)。
当所输出的无效地址候选者与该地址图像的地址相同时,无效地址验证单元370前进到步骤S860,而当所输出的无效地址候选者不等同于该地址图像的地址时,无效地址验证单元370前进到步骤S870。
本发明的上述示范实施例并不仅仅通过方法和设备来实施。可替换地,可以通过用于执行与本发明示范实施例的配置对应的功能的程序、或者在其上记录所述程序的记录介质来实现上述示范实施例。本发明所属领域的技术人员可以容易地从上述示范实施例的描述中导出这些实施例。尽管已经结合当前被认为是实用示范实施例的内容描述了本发明,但是要理解,本发明不限于所公开的实施例,而是相反,本发明意欲覆盖在所附权利要求的精神和范围内包括的各种修改和等效安排。

Claims (19)

1.一种用于利用包括地址的地址图像来建立地址数据库的设备,所述设备包括:
地址读取单元,用于从地址图像中读取地址;
读取结果存储单元,用于存储所读取的地址和表示所读取的地址的读取次数的累积值;
有效地址存储单元,用于存储包括多个实际存在的有效地址的有效地址数据库;以及
有效地址提取单元,用于根据从读取结果存储单元加载的所读取的地址的累积值是否大于预定阈值,来将所读取的地址存储在有效地址存储单元中。
2.根据权利要求1的设备,其中,当所读取的地址的累积值大于预定阈值时,有效地址提取单元确定所读取的地址作为有效地址,并将所读取的地址存储在有效地址存储单元中。
3.根据权利要求1的设备,其中,当所读取的地址的累积值大于预定阈值、并且在有效地址存储单元的有效地址数据库中不存在与所读取的地址相同的地址时,有效地址提取单元将所读取的地址存储在有效地址存储单元中。
4.一种用于利用包括地址的地址图像来建立地址数据库的方法,所述方法包括以下步骤:
存储从地址图像中读取的地址和表示所读取的地址的读取次数的累积值;
确定所读取的地址的累积值是否大于预定阈值;以及
当所读取的地址的累积值大于预定阈值时,将所读取的地址存储在有效地址数据库中,
其中所述有效地址数据库包括实际存在的有效地址。
5.根据权利要求4的方法,其中,当所读取的地址的累积值大于预定阈值、并且在有效地址数据库中不存在与所读取的地址相同的地址时,该确定步骤将所读取的地址存储在有效地址数据库中。
6.一种用于利用包括地址的地址图像来建立地址数据库的设备,所述设备包括:
地址读取单元,用于从地址图像中读取地址;
读取结果存储单元,用于存储所读取的地址和表示所读取的地址的读取次数的累积值;
有效地址存储单元,用于存储包括多个在世界上实际存在的有效地址的有效地址数据库;
有效地址候选者提取单元,用于根据从读取结果存储单元加载的所读取的地址的累积值是否大于预定阈值,来将所读取的地址设置为有效地址候选者;以及
有效地址验证单元,用于输出有效地址候选者和与其对应的地址图像,向该有效地址验证单元提供关于所述有效地址候选者是否与地址图像的地址相同的信息,所述信息由地址管理员输入,并且所述有效地址验证单元基于所述信息在有效地址数据库中存储有效地址候选者。
7.根据权利要求6的设备,其中,当所读取的地址的累积值大于预定阈值、并且在有效地址存储单元的有效地址数据库中不存在与所读取的地址相同的地址时,有效地址提取单元将所读取的地址设置为有效地址候选者。
8.根据权利要求7的设备,其中,当从地址管理员输入的信息指明有效地址候选者与地址图像的地址相同时,有效地址验证单元将有效地址候选者存储在有效地址存储单元的有效地址数据库中。
9.根据权利要求8的设备,其中,当从地址管理员输入的信息指明有效地址候选者不同于地址图像的地址时,有效地址验证单元补偿有效地址候选者的累积值,所述累积值被存储在读取结果存储单元中。
10.根据权利要求6的设备,其中,有效地址提取单元基于地址图像的数目、具有有效地址的邮件的数目、处于与所提供的地址图像对应的区域中的邮政投递分支机构的数目、和其中出现有效地址邮件的邮政投递分支机构的数目,来调整所述预定阈值。
11.根据权利要求10的设备,其中有效地址提取单元基于接下来的等式之一来调整预定的阈值:
T=max((k×E/P),L)
(k>0,L>0,k和L是常数)
T=max((k×N/D),L)
(k>0,L>0,k和L是常数)
其中,地址图像的数目为N,具有有效地址的邮件的数目为E,处于与所提供的地址图像对应的区域中的邮政投递分支机构的数目为D,并且其中出现有效地址邮件的邮政投递分支机构的数目为P。
12.根据权利要求10的设备,其中所述有效地址提取单元还包括:
无效地址候选者提取单元,用于当所读取的地址的累积值小于预定阈值时,将所读取的地址设置为无效地址候选者,所述无效地址候选者具有表示地址可能实际不存在的可能性;以及
无效地址验证单元,用于输出无效地址候选者和与其对应的地址图像,并且当从地址管理员输入关于无效地址候选者与地址图像的地址相同的信息时,从有效地址数据库删除所述无效地址候选者。
13.一种用于利用包括地址的地址图像来建立地址数据库的方法,所述方法包括以下步骤:
存储从地址图像中读取的地址和表示所读取的地址的读取次数的累积值;
当所读取的地址的累积值大于预定阈值时,将所读取的地址设置为有效地址候选者;
输出有效地址候选者和与其对应的地址图像,并被提供从地址管理员输入的、关于所述有效地址候选者是否与地址图像的地址相同的信息;以及
基于所述信息将所述有效地址候选者存储在有效地址数据库中,其中所述有效地址数据库包括实际存在的有效地址。
14.根据权利要求13的方法,其中,当所读取的地址的累积值大于预定阈值、并且在有效地址数据库中不存在与所读取的地址相同的地址时,所述设置所读取的地址的步骤将所读取的地址设置为有效地址候选者。
15.根据权利要求14的方法,其中,当从地址管理员输入指明有效地址候选者与地址图像的地址相同的信息时,所述存储有效地址候选者的步骤将有效地址候选者存储在有效地址数据库中。
16.根据权利要求15的方法,其中,当从地址管理员输入用于指明有效地址候选者不同于地址图像的地址的信息时,所述存储有效地址候选者的步骤补偿与有效地址候选者对应的累积值。
17.根据权利要求13的方法,其中,当所读取的地址的累积值不大于预定阈值、并且在有效地址数据库中存在与所读取的地址相同的地址时,所述设置所读取的地址的步骤将所读取的地址设置为无效地址候选者。
18.根据权利要求17的方法,还包括:
基于地址图像的数目、具有有效地址的邮件的数目、处于与所提供的地址图像对应的区域中的邮政投递分支机构的数目、和其中出现有效地址邮件的邮政投递分支机构的数目,来调整所述预定阈值。
19.根据权利要求18的方法,其中所述调整预定阈值的步骤基于接下来的等式之一来调整预定的阈值:
T=max((k×E/P),L)
(k>0,L>0,k和L是常数)
T=max((k×N/D),L)
(k>0,L>0,k和L是常数)
其中,地址图像的数目为N,具有有效地址的邮件的数目为E,处于与所提供的地址图像对应的区域中的邮政投递分支机构的数目为D,并且其中出现有效地址邮件的邮政投递分支机构的数目为P。
CN200810186709XA 2007-12-13 2008-12-12 用于建立地址数据库的设备及其方法 Expired - Fee Related CN101458702B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020070130132A KR100926565B1 (ko) 2007-12-13 2007-12-13 주소 데이터베이스 구축 장치 및 그 방법
KR130132/07 2007-12-13

Publications (2)

Publication Number Publication Date
CN101458702A true CN101458702A (zh) 2009-06-17
CN101458702B CN101458702B (zh) 2012-05-23

Family

ID=40754636

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200810186709XA Expired - Fee Related CN101458702B (zh) 2007-12-13 2008-12-12 用于建立地址数据库的设备及其方法

Country Status (4)

Country Link
US (1) US8099443B2 (zh)
JP (1) JP4847505B2 (zh)
KR (1) KR100926565B1 (zh)
CN (1) CN101458702B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101996247A (zh) * 2010-11-10 2011-03-30 百度在线网络技术(北京)有限公司 地址数据库的建构方法及装置
CN102024024A (zh) * 2010-11-10 2011-04-20 百度在线网络技术(北京)有限公司 地址数据库的建构方法及装置
CN104915368A (zh) * 2014-03-13 2015-09-16 株式会社东芝 数据库管理装置以及地址识别装置
CN109325014A (zh) * 2018-08-23 2019-02-12 北京信安世纪科技股份有限公司 一种关系数据库建库完整性效验方法及装置
CN109655762A (zh) * 2019-01-09 2019-04-19 安徽省航嘉智源科技有限公司 电池管理单元的地址标定系统和方法

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2259210A2 (de) * 2009-06-05 2010-12-08 Siemens Aktiengesellschaft Verfahren und Vorrichtung zur Analyse einer Datenbank
JP5390440B2 (ja) * 2010-03-17 2014-01-15 株式会社東芝 集中情報処理装置及び集中情報処理システム
JP5433470B2 (ja) 2010-03-17 2014-03-05 株式会社東芝 住所データベース構築装置および住所データベース構築方法
US8526743B1 (en) 2010-11-01 2013-09-03 Raf Technology, Inc. Defined data patterns for object handling
US9443298B2 (en) 2012-03-02 2016-09-13 Authentect, Inc. Digital fingerprinting object authentication and anti-counterfeiting system
US8774455B2 (en) 2011-03-02 2014-07-08 Raf Technology, Inc. Document fingerprinting
US9152862B2 (en) 2011-09-15 2015-10-06 Raf Technology, Inc. Object identification and inventory management
JP6222699B2 (ja) * 2014-03-05 2017-11-01 株式会社東芝 住所データベース構築装置、住所データベース構築システム、および住所データベース構築方法
US10037537B2 (en) 2016-02-19 2018-07-31 Alitheon, Inc. Personal history in track and trace system
US10867301B2 (en) 2016-04-18 2020-12-15 Alitheon, Inc. Authentication-triggered processes
US10614302B2 (en) 2016-05-26 2020-04-07 Alitheon, Inc. Controlled authentication of physical objects
US10740767B2 (en) 2016-06-28 2020-08-11 Alitheon, Inc. Centralized databases storing digital fingerprints of objects for collaborative authentication
US10915612B2 (en) 2016-07-05 2021-02-09 Alitheon, Inc. Authenticated production
US10534782B1 (en) 2016-08-09 2020-01-14 American Express Travel Related Services Company, Inc. Systems and methods for name matching
US11176180B1 (en) * 2016-08-09 2021-11-16 American Express Travel Related Services Company, Inc. Systems and methods for address matching
US10902540B2 (en) 2016-08-12 2021-01-26 Alitheon, Inc. Event-driven authentication of physical objects
US10839528B2 (en) 2016-08-19 2020-11-17 Alitheon, Inc. Authentication-based tracking
US11055653B2 (en) * 2017-03-06 2021-07-06 United States Postal Service System and method of providing informed delivery items using a hybrid-digital mailbox
US11062118B2 (en) 2017-07-25 2021-07-13 Alitheon, Inc. Model-based digital fingerprinting
EP3514715A1 (en) 2018-01-22 2019-07-24 Alitheon, Inc. Secure digital fingerprint key object database
US10963670B2 (en) 2019-02-06 2021-03-30 Alitheon, Inc. Object change detection and measurement using digital fingerprints
EP3734506A1 (en) 2019-05-02 2020-11-04 Alitheon, Inc. Automated authentication region localization and capture
EP3736717A1 (en) 2019-05-10 2020-11-11 Alitheon, Inc. Loop chain digital fingerprint method and system
US12033111B2 (en) 2019-10-03 2024-07-09 United States Postal Service Distribution item delivery point management system
US11238146B2 (en) 2019-10-17 2022-02-01 Alitheon, Inc. Securing composite objects using digital fingerprints
US11934379B2 (en) * 2019-12-20 2024-03-19 Lob.com, Inc. Method and system for address verification
EP3859603A1 (en) 2020-01-28 2021-08-04 Alitheon, Inc. Depth-based digital fingerprinting
EP3885984A1 (en) 2020-03-23 2021-09-29 Alitheon, Inc. Facial biometrics system and method of using digital fingerprints
EP3885982A3 (en) 2020-03-23 2021-12-22 Alitheon, Inc. Hand biometrics system and method using digital fingerprints
US11948377B2 (en) 2020-04-06 2024-04-02 Alitheon, Inc. Local encoding of intrinsic authentication data
US11663849B1 (en) 2020-04-23 2023-05-30 Alitheon, Inc. Transform pyramiding for fingerprint matching system and method
US11983957B2 (en) 2020-05-28 2024-05-14 Alitheon, Inc. Irreversible digital fingerprints for preserving object security
EP3926496A1 (en) 2020-06-17 2021-12-22 Alitheon, Inc. Asset-backed digital security tokens

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5742769A (en) * 1996-05-06 1998-04-21 Banyan Systems, Inc. Directory with options for access to and display of email addresses
JP3443515B2 (ja) * 1997-05-27 2003-09-02 東芝テック株式会社 ファクシミリ型電子メール装置
US5991369A (en) * 1997-06-06 1999-11-23 Nortel Networks Corporation System and method for message delivery for non-published directory numbers to voice mail boxes
EP0889418A3 (en) * 1997-06-30 1999-08-18 Sun Microsystems, Inc. Abstract URL resolution via relocation service
EP1196252B1 (en) * 1999-07-05 2003-08-06 PTT Post Holdings B.V. Installation and method for updating an address database with recorded address records
JP2002352189A (ja) * 2001-05-30 2002-12-06 Toshiba Corp 配達原簿情報入力システム
CA2555220A1 (en) * 2003-03-28 2004-10-14 Dun & Bradstreet, Inc. System and method for data cleansing
JP2007004584A (ja) * 2005-06-24 2007-01-11 Toshiba Corp 情報処理装置
JP4706379B2 (ja) 2005-08-04 2011-06-22 日本電気株式会社 住所認識装置
KR100771198B1 (ko) * 2005-09-12 2007-10-29 (주)와이즈그램 영상 데이터를 전자 액자로 전송하는 방법 및 그 장치
US20090055206A1 (en) * 2007-08-24 2009-02-26 Bowe Bell + Howell Company Method and system for performing address resolution processing

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101996247A (zh) * 2010-11-10 2011-03-30 百度在线网络技术(北京)有限公司 地址数据库的建构方法及装置
CN102024024A (zh) * 2010-11-10 2011-04-20 百度在线网络技术(北京)有限公司 地址数据库的建构方法及装置
CN101996247B (zh) * 2010-11-10 2013-02-20 百度在线网络技术(北京)有限公司 地址数据库的建构方法及装置
CN102024024B (zh) * 2010-11-10 2013-07-10 百度在线网络技术(北京)有限公司 地址数据库的建构方法及装置
CN104915368A (zh) * 2014-03-13 2015-09-16 株式会社东芝 数据库管理装置以及地址识别装置
CN109325014A (zh) * 2018-08-23 2019-02-12 北京信安世纪科技股份有限公司 一种关系数据库建库完整性效验方法及装置
CN109655762A (zh) * 2019-01-09 2019-04-19 安徽省航嘉智源科技有限公司 电池管理单元的地址标定系统和方法
CN109655762B (zh) * 2019-01-09 2024-03-22 安徽省航嘉智源科技有限公司 电池管理单元的地址标定系统和方法

Also Published As

Publication number Publication date
JP2009146393A (ja) 2009-07-02
KR100926565B1 (ko) 2009-11-12
JP4847505B2 (ja) 2011-12-28
US8099443B2 (en) 2012-01-17
US20090157733A1 (en) 2009-06-18
CN101458702B (zh) 2012-05-23
KR20090062714A (ko) 2009-06-17

Similar Documents

Publication Publication Date Title
CN101458702B (zh) 用于建立地址数据库的设备及其方法
CN103593371A (zh) 推荐搜索关键词的方法和装置
CN104392171B (zh) 一种基于数据关联的自动内存证据分析方法
CN105005600A (zh) 一种访问日志中url的预处理方法
CN109492081A (zh) 文本信息搜索和信息交互方法、装置、设备及存储介质
CN107590236B (zh) 一种面向建筑施工企业的大数据采集方法和系统
CN103366247A (zh) 标准有效性判断系统及方法
CN101719124A (zh) 基于正则匹配的无限层次多路径采集系统
CN103294845B (zh) 业务分析设计辅助装置以及业务分析设计辅助方法
CN103577414B (zh) 数据处理方法和设备
CN109858980B (zh) 基于开源ocr上的高速扫描增值税发票勾选认证系统及方法
CN102708215A (zh) 一种处理视频的方法及其系统
Bailer et al. Challenges for Automatic Detection of Fake News Related to Migration
CN116383201A (zh) 一种基于流批一体的多维数据处理方法及系统
CN109254978A (zh) 一种数据处理方法及处理装置
JP2006244315A (ja) データエントリーシステム
CN115329169A (zh) 一种基于深度神经模型的档案归档计算方法
CN115563597A (zh) 一种基于大数据的人工智能运算系统及运算方法
CN112307406A (zh) 一种刑事会勘会检综合应用平台
CN111274885A (zh) 一种基于人脸识别技术的商场客户轨迹跟踪及信息采集系统
CN112837690B (zh) 一种音频数据生成方法、音频数据转写方法及其装置
Ning et al. Design of an automated data entry system for hand-filled forms
CN108520047A (zh) 一种视频特征信息检索方法
CN107239517A (zh) 基于Hbase数据库的多条件搜索方法及装置
Wilson Business processes: modelling and analysis for re-engineering and improvement

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120523

Termination date: 20141212

EXPY Termination of patent right or utility model