[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN110458675B - 一种基于大数据的票据生成凭证方法 - Google Patents

一种基于大数据的票据生成凭证方法 Download PDF

Info

Publication number
CN110458675B
CN110458675B CN201910671900.1A CN201910671900A CN110458675B CN 110458675 B CN110458675 B CN 110458675B CN 201910671900 A CN201910671900 A CN 201910671900A CN 110458675 B CN110458675 B CN 110458675B
Authority
CN
China
Prior art keywords
word vector
service type
business
bill
standard
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910671900.1A
Other languages
English (en)
Other versions
CN110458675A (zh
Inventor
郭其超
胡晓维
毅力奇
张阿敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Yinuo Prospect Finance And Taxation Technology Co ltd
Original Assignee
Beijing Yinuo Prospect Finance And Taxation Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Yinuo Prospect Finance And Taxation Technology Co ltd filed Critical Beijing Yinuo Prospect Finance And Taxation Technology Co ltd
Priority to CN201910671900.1A priority Critical patent/CN110458675B/zh
Publication of CN110458675A publication Critical patent/CN110458675A/zh
Application granted granted Critical
Publication of CN110458675B publication Critical patent/CN110458675B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/12Accounting

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明实施例公开了一种基于大数据的票据生成凭证方法,包括如下步骤:定义会计准则下的标准业务类型,对每种标准业务类型编码标号;对应每种标准业务类型创建一组唯一的记账凭证模板;利用词向量技术判断票据对应的标准业务类型,同时匹配对应的记账凭证模板,识别票据内容生成记账凭证记录;人工更新业务类型,并对应更新会计记账凭证模板;本方案采用词向量匹配的方式处理票据内容,将词向量距离相近的票据使用同一个记账凭证,通过对票据信息中的词语、规则以及历史数据的词向量计算,实现简单,复杂性低。

Description

一种基于大数据的票据生成凭证方法
技术领域
本发明实施例涉及票据生成凭证技术领域,具体涉及一种基于大数据的票据生成凭证方法。
背景技术
记账凭证是财会部门根据原始凭证填制,记载经济业务简要内容,确定会计分录,作为记账依据的会计凭证。记账凭证亦称分录凭证,又称记账凭单,是由会计部门根据审核无误的原始凭证或原始凭证汇总表编制,按照登记账簿的要求、确定账户名称、记账方向(应借、应贷)和金额的一种记录,是登记明细分类账和总分类账的依据。
现在的电子信息系统中,处理票据生成凭证的方法,都是通过会计进行原始票据的手动整理,然后在系统中编制凭证,这样的做法不仅工作量特别大,而且还容易出现错误,需要会计多次核对,大大影响了工作效率。特别是在一些中型或者小型的企业中,由于缺少优秀的会计,非常容易出现会计凭证处理上的问题。
随着互联网技术的不断创新与普及,人工智能在计算机领域内,得到了愈加广泛的重视,越来越多的行业开始运用人工智能为企业创造价值,并在票据的识别中得到越来越广泛的应用。基于人工智能技术(智能识别)的票据扫码识别,可以对票据版面进行自动识别取得了突破性的进展,使票据内容变成电子数据成为可能,从而达到智能记账的目的。
但是现有的票据生成认账凭证方法还存在如下缺陷:
(1)采用票据内容关键字作为票据信息生成凭证的标准,由于很多信息也无法通过关键字匹配,导致现有技术对于票据生成凭证的准确率不高。
(2)对于每一种票据信息生成对应配置规则的认账凭证模块,但是票据信息量非常大,则配置规则无法穷尽,因此导致最新票据信息无法准确快速确定认账凭证模块,生成认账凭证操作复杂,导致智能系统的崩溃。
发明内容
为此,本发明实施例提供一种基于大数据的票据生成凭证方法,采用采用词向量匹配的方式处理票据内容,将词向量距离相近的票据使用同一个记账凭证,通过对票据信息中的词语、规则以及历史数据的词向量计算,以解决现有技术中对每一种票据匹配一种凭证生成规则,准确度低,计算量大,无法通过关键字匹配处理各种票据信息的问题。
为了实现上述目的,本发明的实施方式提供如下技术方案:一种基于大数据的票据生成凭证方法,包括如下步骤:
步骤100、定义会计准则下的标准业务类型,对每种标准业务类型编码标号;
步骤200、对应每种标准业务类型创建一组唯一的记账凭证模板;
步骤300、利用词向量技术判断票据对应的标准业务类型,同时匹配对应的记账凭证模板,识别票据内容生成记账凭证记录;
步骤400、人工更新业务类型,并对应更新会计记账凭证模板。
作为本发明的一种优选方案,在步骤100中,所述标准业务类型包括公司内部业务分类和银行对公业务分类。
作为本发明的一种优选方案,在步骤200中,创建会计记账凭证模块的具体步骤为:
步骤201、创建业务对象的画像,统计与业务对象交易的基本信息,包括业务对象的名称、与每个业务对象交易的实际业务类型、每个业务对象的主营业务、与每个业务对象的交易货品,以及与每个业务对象的常用交易资产;
步骤202、根据业务对象交易的基本信息、企业的纳税类型、会计准则和发票是否已经认证勾选,判断涉及的会计科目,以及与会计科目之间的关联关系,确定使用的记账凭证分录,生成记账凭证模块;
步骤203、将记账凭证模块与对应的业务类型编码匹配,确定业务类型编码与记账凭证模块之间的一一对应关系。
作为本发明的一种优选方案,基于大数据统计,利用业务对象的画像计算票据内容与客户画像基本信息的词向量距离,在判断当前票据对应的标准业务类型时,只需要对应查找与业务类型词向量距离最近的业务对象交易基本信息,即可判断对应的业务类型,计算票据内容与客户画像基本信息的词向量距离的具体步骤为:
建立业务交易信息库,计算业务对象的名称与标准业务类型的词向量距离,确定业务对象名称对应的业务类型,明确匹配的业务类型具体为是公司内部业务还是银行对公业务;
根据业务对象画像的其他基本信息,计算其他基本信息与标准业务类型的词向量距离,确定对应的业务细化分类,即具体为哪种公司内部业务类别或者哪种银行对公业务类别;
创建业务对象名称与标准业务类型之间的词向量数据库A,以及业务对象画像的基本信息与业务细化分类之间的词向量数据库B。
作为本发明的一种优选方案,在步骤300中,判断票据的标准业务类型时,需计算票据内容与客户画像基本信息的词向量距离,选取词向量距离最近的视为匹配信息,根据匹配的基本信息选择出票据的标准业务类型,依据标准业务类型获取匹配的记账凭证模板,具体实现步骤为:
步骤301、建立标准业务类型信息库,计算票据内容中的实际业务类型与标准业务类型的词向量距离,将词向量距离按照从大到小的顺序排列,生成词向量数据库C,通过从词向量数据库C查找票据的实际业务类型,实现第一次确定票据内容的标准业务类型;
步骤302、通过从词向量数据库A匹配业务对象名称,或计算业务对象名称与标准业务类型词向量之间的距离,选择距离较近的标准业务类型,实现第二次确定票据内容的标准业务类型;
步骤303、通过从词向量数据库B匹配业务对象画像的基本信息,或计算业务对象画像的基本信息与标准业务类型词向量之间的距离,选择距离较近的标准业务类型,实现第三次确定票据内容的标准业务类型;
步骤304、通过步骤301、步骤302或者步骤302确定的标准业务类型,匹配对应的记账凭证模板。
作为本发明的一种优选方案,在步骤301中,当词向量数据库C中没有当前票据的实际业务类型,则计算词向量数据库C中实际业务类型与标准业务类型的词向量距离,需要设定词向量距离阈值,若实际业务类型与标准业务类型词向量之间的距离大于最大阈值,则认为两个业务类型语义相似,若实际业务类型与标准业务类型词向量之间的距离小于最小阈值,则认为两个业务类型语义不相关。
作为本发明的一种优选方案,根据当前票据内容,从词向量数据库A、词向量数据库B或者词向量数据库C中查找匹配的标准业务类型时,具体实现过程为:
使用从上到下、从左到右结合的方式识别票据内容;
提取票据内容中的交易基本信息,根据交易基本信息从词向量数据库A和词向量数据库B中查找匹配的标准业务类型;
提取票据内容中的实际业务类型,根据实际业务类型从词向量数据库C中查找匹配的标准业务类型;
根据查找的业务类型,对应业务类型编码,获取与标准业务类型编码唯一对应的记账凭证模板。
作为本发明的一种优选方案,词向量数据库C查找的标准业务类型使用优先级大于词向量数据库A和词向量数据库B中查找的标准业务类型使用优先级,当词向量数据库C无法计算词向量距离时,则使用词向量数据库A和向量数据库B匹配的标准业务类型即可。
作为本发明的一种优选方案,在确定记账凭证模板后,将票据的相关方名称、商品名称、商品分类、金额、税额信息填入记账凭证模板内,生成记账凭证。
作为本发明的一种优选方案,在步骤400中,在审核记账凭证结果时,如果自动识别票据业务类型出现偏差,则需要进行人工调整业务类型,并且自动将调整结果添加到业务对象的画像中,重新确定此票据内容与业务类型之间的词向量距离,并将词向量距离在词向量数据库A、词向量数据库B和词向量数据库C同步更新。
本发明的实施方式具有如下优点:
(1)本发明通过对标准业务类型的定义和编码,可确定公司内部业务分类和银行对公业务分类,使用有限的认账凭证模块规则,生成大量票据匹配的记账凭证,实现简单,且生成凭证的准确度高,不会造成无法选择唯一认账凭证模板的问题;
(2)本发明通过建立一个业务系统词向量数据库,统计现实生活中大概会出现的标准业务类型表达方式,因此对于一些较长使用的实际业务类型可直接在词向量数据库内查找,而无需进行词向量距离的实时计算,可提高匹配标准业务类型的准确度,同时减少凭证生成系统的计算时间复杂度;
(3)本发明通过建立三种词向量数据库,分别对应当前票据实际业务类型与标准业务类型之间的词向量距离,交易对象画像与标准业务类型之间的词向量距离,因此可结合当前票据的所有内容匹配标准业务类型,可提高标准业务类型匹配的准确性,进而增加认账凭证填写的准确率;
(4)本发明采用词向量匹配的方式处理票据内容,将词向量距离相近的票据使用同一个记账凭证,通过对票据信息中的词语、规则以及历史数据的词向量计算,解决关键字规则无法处理各种票据信息问题,使用固定的认账凭证模块即可对应不同的票据内容。
附图说明
为了更清楚地说明本发明的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引伸获得其它的实施附图。
图1为本发明实施方式中的票据生成凭证的流程示意图;
图2为本发明实施方式中的使用交易信息确定业务类型的流程示意图;
图3为本发明实施方式中的票据内容信息确定业务类型的流程示意图。
具体实施方式
以下由特定的具体实施例说明本发明的实施方式,熟悉此技术的人士可由本说明书所揭露的内容轻易地了解本发明的其他优点及功效,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明提供了一种基于大数据的票据生成凭证方法,本发明采用词向量匹配的方式处理票据内容,将词向量距离相近的票据使用同一个记账凭证,通过对票据信息中的词语、规则以及历史数据的词向量计算,解决关键字规则无法处理各种票据信息问题。
而现有技术对于票据信息生成凭证的方式,通过根据每一个票据内容配置对应的规则,由于票据信息量非常大,规则无法穷尽,对于很多信息也无法通过关键字匹配,导致票据生成凭证的准确率不高,生成凭证的耗时长且实用性不高的问题。
因此本发明相对而言,使用较少的配置规则,通过词向量匹配的方式将部分票据统一处理,处理简单效率高,且同时提高票据生成凭证的准确率。
具体包括如下步骤:
步骤100、定义标准业务类型,对每种标准业务类型编码标号。
举例来说,标准业务类型可分为采购业务类型、销售业务类型、入库业务类型、出库业务类型,对于企业来说,一般标准业务类型包括公司内部业务分类和银行对公业务分类,公司内部业务分类具体包括公司与其他公司之间的资金往来,或者公司与个人之间的资金往来,银行对公业务分类具体包括公司与各个银行之间的资金往来。
因此本发明的主要特征点之一,通过对标准业务类型的定义和编码,可确定公司内部业务分类和银行对公业务分类,一般来说,标准业务类型在公司内部业务分类有6种,标准业务类型在银行对公业务分类有20种,因此对应每一种标准业务类型创建一个唯一对应的会计记账凭证模板,即需要创建26种记账凭证模板即可。
在将票据内容生成记账凭证时,通过判断票据内容涉及的标准业务类型,即可确定会计记账凭证模板,实现简单,且生成凭证的准确度高,不会造成无法选择唯一认账凭证模板的问题。
步骤200、对应每种标准业务类型创建一组唯一的记账凭证模板。
通过将标准业务类型与记账凭证模板一一对应,则在将票据内容生成认账凭证时,只需要判断票据对应的标准业务类型,即可确定记账凭证模板,将票据内容一一对应填入记账凭证模板内,即生成认账凭证,无需根据每张票据重新配置记账凭证模板的规则,因此实现过程简便,减少会计人员的工作量,提高工作效率。
因此在本步骤的重点在于创建会计记账凭证模块,具体实现过程为:
步骤201、创建业务对象的画像,统计与业务对象交易的基本信息,包括业务对象的个数、与每个业务对象交易的实际业务类型、每个业务对象的主营业务、与每个业务对象的交易货品,以及与每个业务对象的常用交易资产。
业务对象的画像是基于大数据的处理对象,将公司的每次交易记录均保存统计,因此可统计与公司进行交易的对象名称,与该交易对象的常见业务类型,与该交易对象进行交易的常见货品,以及每次交易的常用交易资产,生成关于业务对象的统计表格。
步骤202、根据业务对象交易的基本信息、企业的纳税类型、会计准则和发票是否已经认证勾选,判断涉及的会计科目,以及与会计科目之间的关联关系,确定使用的记账凭证分录,生成记账凭证模块;
步骤203、将记账凭证模块与对应的标准业务类型编码匹配,确定标准业务类型编码与记账凭证模块之间的一一对应关系。
因此在判断票据内容的标准业务类型时,不仅仅只通过票据上用于确定标准业务类型的关键字来判断,还可以通过货品种类、对象名称和交易资产等参数作为标准业务类型词向量。
也就是说,在本发明中,根据业务对象的画像,基于大数据统计,利用业务对象的画像计算票据内容与客户画像基本信息的词向量距离,在判断当前票据对应的标准业务类型时,只需要对应查找与标准业务类型词向量距离最近的业务对象交易的基本信息,即可判断对应的标准业务类型,计算票据内容与客户画像基本信息的词向量距离的具体步骤为:
如图2所示,建立业务交易信息库,计算业务对象名称与标准业务类型的词向量距离,确定业务对象名称对应的标准业务类型,明确匹配的标准业务类型具体为是公司内部业务还是银行对公业务;
根据业务对象画像的其他基本信息,计算其他基本信息与标准业务类型的词向量距离,确定对应的业务细化分类,即具体为哪种公司内部业务类别或者哪种银行对公业务类别;
创建业务对象名称与标准业务类型之间的词向量数据库A,以及业务对象画像的基本信息与业务细化分类之间的词向量数据库B。
词向量数据库A和词向量数据库B对应两种词向量匹配方式:
第一种词向量匹配方式,先确定业务对象的名称,再根据业务对象的名称与标准业务类型之间的词向量距离,一次确定该票据内容对应的标准业务类型,此时确定的标准业务类型具体为是公司内部业务,还是银行对公业务。
第二种词向量匹配方式,在确定此票据内容是公司内部业务分类,还是银行对公业务分类之后,根据货品种类、对象名称和交易资产等参数,确定标准业务类型的具体细化分类,即是采购业务类型、销售业务类型、入库业务类型、出库业务类型。
确定标准业务类型的具体细化分类后,即可对应选定记账凭证模块,生成记账凭证。
因此本发明创建,业务对象的画像作用就是通过大数据统计,计算业务对象画像的每个参数与标准业务类型之间的词向量距离。
步骤300、利用词向量技术判断票据的标准业务类型,匹配对应的记账凭证模板,识别票据内容生成记账凭证记录。
在判断票据的标准业务类型时,计算票据内容与客户画像基本信息的词向量距离,选取词向量距离最近的视为匹配信息,根据匹配的基本信息选择出票据的标准业务类型,依据标准业务类型获取匹配的记账凭证模板,具体实现步骤为:
步骤301、建立标准业务类型信息库,计算票据内容中的实际业务类型与标准业务类型的词向量距离,将词向量距离按照从大到小的顺序排列,生成词向量数据库C,通过从词向量数据库C查找票据的实际业务类型,实现第一次确定票据内容的标准业务类型。
因此本发明的主要特征点之二,由于步骤100定义的标准业务类型为会计准则下的标准业务类型,但是对于一些发票来说,实际填写的标准业务类型并不一定是标准业务类型的写法,因此需要对标准业务类型进行词向量计算,将填写发票的过程中使用到的实际业务类型与标准业务准则进行相似度匹配。
如图3所示,本发明对实际业务类型与标准业务类型之间的词向量距离计算时,先建立一个词向量数据库C,统计现实生活中大概会出现的标准业务类型表达方式,因此对于一些较长使用的实际业务类型可直接在词向量数据库C内查找,而无需进行词向量距离的实时计算,可提高匹配标准业务类型的准确度,同时减少凭证生成系统的计算时间复杂度。
同时对于历史数据未出现过程的实际业务类型,可也在判断该票据对应的标准业务类型时,计算词向量数据库C中实际业务类型与标准业务类型的词向量距离。
在计算的过程中,设定词向量距离阈值,若实际业务类型与标准业务类型词向量之间的距离大于最大阈值,则认为两个标准业务类型语义相似,若实际业务类型与标准业务类型词向量之间的距离小于最小阈值,则认为两个标准业务类型语义不相关。
由于词向量数据库C查找的标准业务类型使用优先级大于词向量数据库A和词向量数据库B中查找的标准业务类型使用优先级,也就是说票据内容中出现的实际业务类型,确定对应的标准业务类型时重要程度较高,因此更需要进一步确定实际业务类型与标准业务类型的词向量距离的有效性和准确性,通过对词向量距离阈值的确定,可提高词向量数据库C查找票据标准业务类型的准确性。
步骤302、通过从词向量数据库A匹配业务对象名称,或计算业务对象名称与标准业务类型词向量之间的距离,选择距离较近的标准业务类型,实现第二次确定票据内容的标准业务类型。
例如票据内容中记录的一个交易对象的名称在词向量数据库A内能找到,则可沿着词向量数据库A大致确定对应的标准业务类型,即确定标准业务类型具体为是公司内部业务,还是银行对公业务。
步骤303、通过从词向量数据库B匹配业务对象画像的基本信息,或计算业务对象画像的基本信息与标准业务类型词向量之间的距离,选择距离较近的标准业务类型,实现第三次确定票据内容的标准业务类型。
例如票据内容中记录的交易货品以及交易的金额,在词向量数据库B内能找到,则可沿着词向量数据库B大致确定对应的标准业务类型具体类别,即确定标准业务类型具体为是6种公司内部业务类别中的哪一个,还是20种银行对公业务类别中的哪一个。
步骤304、通过步骤301、步骤302或者步骤302确定的标准业务类型,匹配对应的记账凭证模板。
当步骤301、步骤302或者步骤302确定的标准业务类型不一致时,则使用功能词向量数据库C确定的标准业务类型。
在步骤304中,根据当前票据内容,从词向量数据库A、词向量数据库B或者词向量数据库C中查找匹配的标准业务类型时,具体实现过程为:
使用从上到下、从左到右结合的方式识别票据内容;
提取票据内容中的交易基本信息,根据交易基本信息从词向量数据库A和词向量数据库B中查找匹配的标准业务类型;
提取票据内容中的实际业务类型,根据实际业务类型从词向量数据库C中查找匹配的标准业务类型;
根据查找的标准业务类型,对应标准业务类型编码,获取与标准业务类型编码唯一对应的记账凭证模板。
当词向量数据库C无法计算词向量距离时,则使用词向量数据库A和向量数据库B匹配的标准业务类型即可。
因此本发明的主要特征点之三,本发明通过建立三种词向量数据库,分别对应当前票据实际业务类型与标准业务类型之间的词向量距离,交易对象画像与标准业务类型之间的词向量距离,因此可结合当前票据的所有内容匹配标准业务类型,可提高标准业务类型匹配的准确性,进而增加认账凭证填写的准确率。
在确定记账凭证模板后,将票据的相关方名称、商品名称、商品分类、金额、税额信息填入记账凭证模板内,生成记账凭证。
另外特别需要说明的是,本发明中选择票据内容对应的业务类型时,均从词向量数据库A、词向量数据库B和词向量数据库C中,选择出词向量距离最近的业务类型视为最终选择的票据的业务类型。
步骤400、人工更新标准业务类型,并对应更新会计记账凭证模板。
在审核记账凭证结果时,如果自动识别票据标准业务类型出现偏差,则需要进行人工调整标准业务类型,并且自动将调整结果添加到业务对象的画像中,重新确定此票据内容与标准业务类型之间的词向量距离,并将词向量距离在词向量数据库A、词向量数据库B和词向量数据库C同步更新。
处理最新的票据生成凭证的时候,也就是说当词向量数据库A、词向量数据库B和词向量数据库C均没有相关可确定标准业务类型时,则将该票据内容与标准业务类型之间的词向量距离重新人工确定后,在词向量数据库中更新保存为历史数据,因此当下次再出现此类的票据时,也可根据历史数据确定标准业务类型,生成认账凭证。
因此本发明的主要特征点之四,本发明并不是根据票据的数量对应产生不同配置规则的认账凭证,而是将最新的票据内容与标准业务类型之间的词向量距离保存作为历史数据,因此使用固定的认账凭证模块即可对应不同的票据内容,通过对票据信息中的词语和规则以及历史数据的词向量计算,解决关键字规则无法处理各种票据信息问题。
虽然,上文中已经用一般性说明及具体实施例对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。

Claims (8)

1.一种基于大数据的票据生成凭证方法,其特征在于,包括如下步骤:
步骤100、定义会计准则下的标准业务类型,对每种标准业务类型编码标号;
步骤200、对应每种标准业务类型创建一组唯一的记账凭证模板;
步骤300、利用词向量技术判断票据对应的标准业务类型,同时匹配对应的记账凭证模板,识别票据内容生成记账凭证记录;
基于大数据统计,利用业务对象的画像计算票据内容与客户画像基本信息的词向量距离,在判断当前票据对应的标准业务类型时,只需要对应查找与业务类型词向量距离最近的业务对象交易基本信息,即可判断对应的业务类型,计算票据内容与客户画像基本信息的词向量距离的具体步骤为:
建立业务交易信息库,计算业务对象的名称与标准业务类型的词向量距离,确定业务对象名称对应的业务类型,明确匹配的业务类型具体为是公司内部业务还是银行对公业务;
根据业务对象画像的其他基本信息,计算其他基本信息与标准业务类型的词向量距离,确定对应的业务细化分类,即具体为哪种公司内部业务类别或者哪种银行对公业务类别;
创建业务对象名称与标准业务类型之间的词向量数据库A,以及业务对象画像的基本信息与业务细化分类之间的词向量数据库B;
在步骤300中,判断票据的标准业务类型时,需计算票据内容与客户画像基本信息的词向量距离,选取词向量距离最近的视为匹配信息,根据匹配的基本信息选择出票据的标准业务类型,依据标准业务类型获取匹配的记账凭证模板,具体实现步骤为:
步骤301、建立标准业务类型信息库,计算票据内容中的实际业务类型与标准业务类型的词向量距离,将词向量距离按照从大到小的顺序排列,生成词向量数据库C,通过从词向量数据库C查找票据的实际业务类型,实现第一次确定票据内容的标准业务类型;
步骤302、通过从词向量数据库A匹配业务对象名称,或计算业务对象名称与标准业务类型词向量之间的距离,选择距离较近的标准业务类型,实现第二次确定票据内容的标准业务类型;
步骤303、通过从词向量数据库B匹配业务对象画像的基本信息,或计算业务对象画像的基本信息与标准业务类型词向量之间的距离,选择距离较近的标准业务类型,实现第三次确定票据内容的标准业务类型;
步骤304、通过步骤301、步骤302或者步骤302确定的标准业务类型,匹配对应的记账凭证模板;步骤400、人工更新业务类型,并对应更新会计记账凭证模板。
2.根据权利要求1所述的一种基于大数据的票据生成凭证方法,其特征在于,在步骤100中,所述标准业务类型包括公司内部业务分类和银行对公业务分类。
3.根据权利要求1所述的一种基于大数据的票据生成凭证方法,其特征在于,在步骤200中,创建会计记账凭证模块的具体步骤为:
步骤201、创建业务对象的画像,统计与业务对象交易的基本信息,包括业务对象的名称、与每个业务对象交易的实际业务类型、每个业务对象的主营业务、与每个业务对象的交易货品,以及与每个业务对象的常用交易资产;
步骤202、根据业务对象交易的基本信息、企业的纳税类型、会计准则和发票是否已经认证勾选,判断涉及的会计科目,以及与会计科目之间的关联关系,确定使用的记账凭证分录,生成记账凭证模块;
步骤203、将记账凭证模块与对应的业务类型编码匹配,确定业务类型编码与记账凭证模块之间的一一对应关系。
4.根据权利要求1所述的一种基于大数据的票据生成凭证方法,其特征在于,在步骤301中,当词向量数据库C中没有当前票据的实际业务类型,则计算词向量数据库C中实际业务类型与标准业务类型的词向量距离,需要设定词向量距离阈值,若实际业务类型与标准业务类型词向量之间的距离大于最大阈值,则认为两个业务类型语义相似,若实际业务类型与标准业务类型词向量之间的距离小于最小阈值,则认为两个业务类型语义不相关。
5.根据权利要求1所述的一种基于大数据的票据生成凭证方法,其特征在于,根据当前票据内容,从词向量数据库A、词向量数据库B或者词向量数据库C中查找匹配的标准业务类型时,具体实现过程为:
使用从上到下、从左到右结合的方式识别票据内容;
提取票据内容中的交易基本信息,根据交易基本信息从词向量数据库A和词向量数据库B中查找匹配的标准业务类型;
提取票据内容中的实际业务类型,根据实际业务类型从词向量数据库C中查找匹配的标准业务类型;
根据查找的业务类型,对应业务类型编码,获取与标准业务类型编码唯一对应的记账凭证模板。
6.根据权利要求5所述的一种基于大数据的票据生成凭证方法,其特征在于,词向量数据库C查找的标准业务类型使用优先级大于词向量数据库A和词向量数据库B中查找的标准业务类型使用优先级,当词向量数据库C无法计算词向量距离时,则使用词向量数据库A和向量数据库B匹配的标准业务类型即可。
7.根据权利要求5所述的一种基于大数据的票据生成凭证方法,其特征在于,在确定记账凭证模板后,将票据的相关方名称、商品名称、商品分类、金额、税额信息填入记账凭证模板内,生成记账凭证。
8.根据权利要求1所述的一种基于大数据的票据生成凭证方法,其特征在于,在步骤400中,在审核记账凭证结果时,如果自动识别票据业务类型出现偏差,则需要进行人工调整业务类型,并且自动将调整结果添加到业务对象的画像中,重新确定此票据内容与业务类型之间的词向量距离,并将词向量距离在词向量数据库A、词向量数据库B和词向量数据库C同步更新。
CN201910671900.1A 2019-07-24 2019-07-24 一种基于大数据的票据生成凭证方法 Active CN110458675B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910671900.1A CN110458675B (zh) 2019-07-24 2019-07-24 一种基于大数据的票据生成凭证方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910671900.1A CN110458675B (zh) 2019-07-24 2019-07-24 一种基于大数据的票据生成凭证方法

Publications (2)

Publication Number Publication Date
CN110458675A CN110458675A (zh) 2019-11-15
CN110458675B true CN110458675B (zh) 2022-12-23

Family

ID=68483167

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910671900.1A Active CN110458675B (zh) 2019-07-24 2019-07-24 一种基于大数据的票据生成凭证方法

Country Status (1)

Country Link
CN (1) CN110458675B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113129000A (zh) * 2019-12-31 2021-07-16 航天信息股份有限公司 一种电子业务凭证生成方法及设备
CN111523298A (zh) * 2020-04-21 2020-08-11 北京易点淘网络技术有限公司 记账凭证的生成方法及装置
CN111738847B (zh) * 2020-08-03 2020-11-20 成都寻道数财科技有限公司 匹配凭证单中同一项经济业务的借贷双方的系统和方法
CN112037028A (zh) * 2020-09-01 2020-12-04 中国银行股份有限公司 交易明细记录方法及装置
CN112232036A (zh) * 2020-09-08 2021-01-15 用友网络科技股份有限公司 报销单生成方法、电子设备和计算机可读存储介质
CN113723071B (zh) * 2021-08-31 2023-05-09 重庆富民银行股份有限公司 电子档案校验方法、系统、存储介质及设备
CN114239520A (zh) * 2021-11-22 2022-03-25 航天信息股份有限公司 针对资金业务的凭证生成方法、系统、电子设备及介质
CN113886448B (zh) * 2021-12-07 2022-03-08 畅捷通信息技术股份有限公司 一种账目数据处理方法、装置及存储介质
CN115641219A (zh) * 2022-10-09 2023-01-24 湖北普联东文信息科技有限公司 会计自动记账的生成方法及系统、电子设备、存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105512890A (zh) * 2015-11-30 2016-04-20 深圳市金蝶友商电子商务服务有限公司 生成记账凭证的方法和系统
CN108734528A (zh) * 2018-05-18 2018-11-02 北京大账房网络科技股份有限公司 一种电子发票自动入账方法
CN109636557A (zh) * 2018-12-11 2019-04-16 厦门商集网络科技有限责任公司 一种基于票据识别的智能分类记账方法及设备
CN109685477A (zh) * 2018-12-28 2019-04-26 北京爱康鼎科技有限公司 账务处理系统及处理方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002189865A (ja) * 2000-12-20 2002-07-05 Fuji Photo Film Co Ltd 発券システム、発券方法、発券サーバ、及び記録媒体
CN106296378B (zh) * 2016-07-26 2021-06-01 四川长虹电器股份有限公司 基于xbrl的智能财务云平台系统、构建方法及业务实现方法
CN109993644A (zh) * 2017-12-29 2019-07-09 航天信息股份有限公司 一种画像确定方法、装置、电子设备及存储介质
CN108961021B (zh) * 2018-05-18 2022-03-15 大账房网络科技股份有限公司 利用智能移动设备拍照生成凭证的方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105512890A (zh) * 2015-11-30 2016-04-20 深圳市金蝶友商电子商务服务有限公司 生成记账凭证的方法和系统
CN108734528A (zh) * 2018-05-18 2018-11-02 北京大账房网络科技股份有限公司 一种电子发票自动入账方法
CN109636557A (zh) * 2018-12-11 2019-04-16 厦门商集网络科技有限责任公司 一种基于票据识别的智能分类记账方法及设备
CN109685477A (zh) * 2018-12-28 2019-04-26 北京爱康鼎科技有限公司 账务处理系统及处理方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
信息化环境下的记账凭证分类探讨;杨定泉;《中国管理信息化》;20080601(第11期);全文 *

Also Published As

Publication number Publication date
CN110458675A (zh) 2019-11-15

Similar Documents

Publication Publication Date Title
CN110458675B (zh) 一种基于大数据的票据生成凭证方法
CN110383319B (zh) 大规模异构数据摄取和用户解析
CN108985912B (zh) 数据对账
CN109887153A (zh) 一种财税处理方法和处理系统
US20140258246A1 (en) Recognizing and combining redundant merchant deisgnations in a transaction database
US20230123072A1 (en) Transaction Data Processing Systems And Methods
CN109670945B (zh) 一种基于大数据的综合风险预警决策平台
CN108241603A (zh) 一种财务报表生成方法及系统
US20180024983A1 (en) System and method for reporting based on electronic documents
JP6895632B1 (ja) 会計処理装置、会計処理システム、会計処理方法及びプログラム
Tater et al. AI driven accounts payable transformation
TWI716761B (zh) 智能會計帳務系統與會計憑證的辨識入帳方法
US11798100B2 (en) Transaction counterpart identification
CN113469005B (zh) 一种银行回单的识别方法、相关装置及存储介质
CN112308695A (zh) 一种可灵活配置的会计账记账系统及方法
KR102710397B1 (ko) 금융 마이데이터 기반 기계학습을 위한 말뭉치를 이용한 거래 적요 데이터 분석 장치 및 방법과 이를 위한 컴퓨터 프로그램
CN117726464A (zh) 一种对账方法、系统及相关设备
KR20150097838A (ko) 패턴 데이터베이스를 이용한 계정추천 및 전표생성 시스템 및 그 제공방법
CN115827798A (zh) 一种基于行业特征建立的票据管理方法
US20230113578A1 (en) Transaction and ownership information document extraction
KR20150097837A (ko) 계정추천 및 전표생성을 위한 패턴생성시스템 및 그 제공방법
TWM575887U (zh) 智能會計帳務系統
Oliverio et al. A hybrid model for fraud detection on purchase orders
CN117882081A (zh) 包括自动评估核单证据的技术的ai增强审计平台
CN113256351A (zh) 用户业务需求识别方法、装置及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant