CN114036949A - 基于资讯信息分析的投资策略确定方法及装置 - Google Patents
基于资讯信息分析的投资策略确定方法及装置 Download PDFInfo
- Publication number
- CN114036949A CN114036949A CN202111314123.9A CN202111314123A CN114036949A CN 114036949 A CN114036949 A CN 114036949A CN 202111314123 A CN202111314123 A CN 202111314123A CN 114036949 A CN114036949 A CN 114036949A
- Authority
- CN
- China
- Prior art keywords
- information
- model
- emotion classification
- entity
- investment strategy
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000004458 analytical method Methods 0.000 title claims abstract description 34
- 230000008451 emotion Effects 0.000 claims abstract description 110
- 238000013145 classification model Methods 0.000 claims abstract description 26
- 238000012549 training Methods 0.000 claims description 28
- 238000004590 computer program Methods 0.000 claims description 16
- 238000012545 processing Methods 0.000 claims description 15
- 238000007781 pre-processing Methods 0.000 claims description 6
- 230000009193 crawling Effects 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 13
- 238000004891 communication Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 230000002996 emotional effect Effects 0.000 description 4
- 238000004880 explosion Methods 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 102100030988 Angiotensin-converting enzyme Human genes 0.000 description 1
- 101710185050 Angiotensin-converting enzyme Proteins 0.000 description 1
- 101000972273 Homo sapiens Mucin-7 Proteins 0.000 description 1
- 102100022493 Mucin-6 Human genes 0.000 description 1
- 108010008692 Mucin-6 Proteins 0.000 description 1
- 102100022492 Mucin-7 Human genes 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/06—Asset management; Financial planning or analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- General Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Technology Law (AREA)
- Operations Research (AREA)
- Human Resources & Organizations (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种基于资讯信息分析的投资策略确定方法及装置,可用于大数据技术领域,该方法包括:在获取到资讯信息后,将资讯信息的题目输入至实体识别模型,识别出资讯信息中的实体对象;将资讯信息的题目输入至情感分类模型,获得咨询信息的情感分类;基于识别出的实体对象搜索资讯信息库,获得第一时长内的历史资讯信息及对应的情感分类;基于所述资讯信息的情感分类和所述历史资讯信息的情感分类,确定对所述实体对象的投资策略。本发明可以基于资讯信息分析的投资策略确定方法,用以实现对资讯信息进行全面分析,从而确定投资策略。
Description
技术领域
本发明涉及大数据技术领域,尤其涉及一种基于资讯信息分析的投资策略确定方法及装置。
背景技术
网络信息爆炸的今天,资讯信息在网络中传播的速度块,范围广,对于投资者的分析判断,公司机构的信用评级都有着实时的影响。如何实时利用资讯信息,进行高效地分析,从而生成针对投资对象的投资策略,依然是目前的痛点之一。现有技术都是对资讯信息进行情感分析,对分析出来的资讯信息,不能直观的看到是对哪些对象产生了影响,还需要人进一步地统计检查,因此,并不能及时准确地对投资对象进行投资策略的确定。
发明内容
本发明实施例提出一种基于资讯信息分析的投资策略确定方法,用以实现对资讯信息进行全面分析,从而确定投资策略,该方法包括:
在获取到资讯信息后,将资讯信息的题目输入至实体识别模型,识别出资讯信息中的实体对象;
将资讯信息的题目输入至情感分类模型,获得咨询信息的情感分类;
基于识别出的实体对象搜索资讯信息库,获得第一时长内的历史资讯信息及对应的情感分类;
基于所述资讯信息的情感分类和所述历史资讯信息的情感分类,确定对所述实体对象的投资策略。
本发明实施例提出一种基于资讯信息分析的投资策略确定装置,用以实现对资讯信息进行全面分析,从而确定投资策略,该装置包括:
实体对象识别模块,用于在获取到资讯信息后,将资讯信息的题目输入至实体识别模型,识别出资讯信息中的实体对象;
情感分类模块,用于将资讯信息的题目输入至情感分类模型,获得咨询信息的情感分类;
历史情感分类获得模块,用于基于识别出的实体对象搜索资讯信息库,获得第一时长内的历史资讯信息及对应的情感分类;
投资策略确定模块,用于基于所述资讯信息的情感分类和所述历史资讯信息的情感分类,确定对所述实体对象的投资策略。
本发明实施例还提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于资讯信息分析的投资策略确定方法。
本发明实施例还提出了一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述基于资讯信息分析的投资策略确定方法的计算机程序。
在本发明实施例中,在获取到资讯信息后,将资讯信息的题目输入至实体识别模型,识别出资讯信息中的实体对象;将资讯信息的题目输入至情感分类模型,获得咨询信息的情感分类;基于识别出的实体对象搜索资讯信息库,获得第一时长内的历史资讯信息及对应的情感分类;基于所述资讯信息的情感分类和所述历史资讯信息的情感分类,确定对所述实体对象的投资策略。在上述过程中,对资讯信息的题目进行实体识别,是为了方便于银行人员的自定义地查看,搜索资讯信息库,获得第一时长内的历史资讯信息及对应的情感分类。对资讯信息的题目而非对资讯信息内容进行实体识别,方便精准定位实体,而不受资讯信息中提到的相关连的实体的干扰。另外,在情感分析时,将资讯信息的题目输入至情感分类模型,而不是资讯信息内容,也可进一步提高资讯信息情感分类的效率,从而可快速判断出对所述实体对象的投资策略。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本发明实施例中基于资讯信息分析的投资策略确定方法的流程图;
图2为本发明实施例中实体识别模型的训练流程图;
图3为本发明实施例中情感分类模型的训练流程图;
图4为本发明实施例中基于资讯信息分析的投资策略确定装置的示意图;
图5为本发明实施例中计算机设备的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。
在本说明书的描述中,所使用的“包含”、“包括”、“具有”、“含有”等,均为开放性的用语,即意指包含但不限于。参考术语“一个实施例”、“一个具体实施例”、“一些实施例”、“例如”等的描述意指结合该实施例或示例描述的具体特征、结构或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。各实施例中涉及的步骤顺序用于示意性说明本申请的实施,其中的步骤顺序不作限定,可根据需要作适当调整。
图1为本发明实施例中基于资讯信息分析的投资策略确定方法的流程图,如图1所示,包括:
步骤101,在获取到资讯信息后,将资讯信息的题目输入至实体识别模型,识别出资讯信息中的实体对象;
步骤102,将资讯信息的题目输入至情感分类模型,获得咨询信息的情感分类;
步骤103,基于识别出的实体对象搜索资讯信息库,获得第一时长内的历史资讯信息及对应的情感分类;
步骤104,基于所述资讯信息的情感分类和所述历史资讯信息的情感分类,确定对所述实体对象的投资策略。
在本发明实施例中,对资讯信息的题目进行实体识别,是为了方便于银行人员的自定义地查看,搜索资讯信息库,获得第一时长内的历史资讯信息及对应的情感分类。对资讯信息的题目而非对资讯信息内容进行实体识别,方便精准定位实体,而不受资讯信息中提到的相关连的实体的干扰。另外,在情感分析时,将资讯信息的题目输入至情感分类模型,而不是资讯信息内容,也可进一步提高资讯信息情感分类的效率,从而可快速判断出对所述实体对象的投资策略。
具体实施时,资讯信息题目中是一篇资讯的核心,能够从中发现资讯讲的是哪个主体,也能反应出一篇资讯的正、负情感。所以,对资讯信息的题目进行实体识别。
在步骤101中,在获取到资讯信息后,将资讯信息的题目输入至实体识别模型,识别出资讯信息中的实体对象。
具体实施时,如果对资讯信息整篇内容分析,识别出很多个实体对象,容易抓不住重点,并且处理速度慢,因此,本发明实施例只对咨询信息的题目进行识别,可提高效率。另外,避免了资讯信息中出现的其它实体对象产生的干扰信息。
在一实施例中,所述实体识别模型采用NER模型。
NER模型基于Standford ner系统,Standford ner系统是斯坦福大学开发的基于条件随机场的命名实体识别系统,该系统参数是基于CoNLL、MUC-6、MUC-7和ACE命名实体语料训练出来的。standford ner采用线性链条件随机场(CRF)序列模型,可以使用自己的标注数据集为各种应用程序训练自己的自定义模型。但也可不仅仅局限于该种方法。
图2为本发明实施例中实体识别模型的训练流程图,在一实施例中,所述实体识别模型的训练步骤包括:
步骤201,构建银行相关的实体字典文件;
步骤202,基于stanford ner方法对实体字典文件的格式进行处理,获得.tsv格式的文档;
步骤203,基于所述.tsv格式的文档训练NER模型,生成训练好的NER模型。
在上述实施例中,银行相关的实体字典文件包括银行工作人员关心的公司机构名、客户人名,组织机构名等。为了得到更加准确的分词效果和命名实体识别效果,采用人工构建实体字典文件。
基于stanford ner方法对实体字典文件的格式进行处理,获得.tsv格式的文档,包括:
将实体字典文件中的训练数据设置为第一列是对象名,例如公司名或者人名,第二列为该对象的标记,第一列与第二列之间用tab分隔,最后形成.tsv格式的文档;
配置standford ner的属性文件。
在训练时,在standford ner系统中,应用standford ner的属性文件的参数,输入.tsv格式的文档,执行运行训练模型的命令,生成NER模型。
在训练好NER模型后,可将资讯信息的题目输入至实体识别模型,识别出资讯信息中的实体对象,该实体对象可添加至实体字典文件,以重新训练NER模型,使得NER模型逐步精确。
在步骤102中,将资讯信息的题目输入至情感分类模型,获得咨询信息的情感分类。
在一实施例中,所述情感分类模型采用Fasttext模型。
Fasttext是facebook开源的一个文本分类工具,最常用的应用场景是带监督的文本分类,提供简单而高效的文本分类方法,被大家普遍运用。采用有监督的文本分类方法时,先将训练样本进行分词处理,然后去掉停用词,对其进行随机打乱处理以后,生成训练样本数据集,应用Fasttext算法框架对其进行训练,得到分类模型,将测试数据进行数据预处理后,输入该模型中,即得到该测试样本的分类。Fasttext算法引入n-gram的概念解决了词形变化的问题,将单词打散到字符级别,并且利用字符级别的n-gram信息来捕捉自字符间的顺序关系,这就避免了用词汇表中的独立单词作为基本单元来进行训练而让一些低频词无对应向量表示的问题,进行n-gram单词处理后得到的往往是数量级比较大的单词信息,然后采用Hirearchical softmax函数对输入的处理后的单词信息进行线性和指数变换后,再进行全局的归一化处理,得到概率最大的输出项。在Hierachical softmax之前采用二叉huffman树降低计算复杂度,通过将所有词汇及其频次构建一棵huffman树,越频繁出现的词汇,离根节点越近,需要的判断次数也越少,从而使整体的判断效率提高。
不同于用Fasttext进行一般的文本分类,本发明实施例只对资讯信息的题目进行了情感分类,从而提高情感分类效率。
图3为本发明实施例中情感分类模型的训练流程图,在一实施例中,所述情感分类模型的训练步骤包括:
步骤301,爬取网络上的历史资讯信息;
步骤302,对爬取的历史资讯信息的题目进行预处理,获得符合预设格式要求的文本信息;
步骤303,对符合预设格式要求的文本信息进行情感标签标注;
步骤304,基于标注后的文本信息训练Fasttext模型,获得训练好的Fasttext模型。
其中,预处理包括对资讯信息题目整理、去空格、标点及转义字符,然后进行jieba分词、停用词处理。进行情感标签标注时,正向情感为1,负向情感标注为0,标注的数据量越大,最后训练出的模型的准确度越高。在情感分类结果中,越接近于1的,表示越接近于正向情感,越接近于0的,表示越接近于负向情感。
在进行情感标签标注后,并将标注好的文本信息随机打乱合并到一个文本文件中,以训练Fasttext模型。
在步骤103中,基于识别出的实体对象搜索资讯信息库,获得第一时长内的历史资讯信息及对应的情感分类。
第一时长可以根据实际情况来定,比如一周,将实体对象作为关键词搜索资讯信息库,可得到大量的资讯信息,因为识别资讯信息的题目的实体对象后,已经对资讯信息建立了索引,并且还有正、负情感判断,从而能够帮助银行工作人员判断公司和客户的信用评级,以及公司和客户是否可以作为投资对象进行投资。如果银行工作人员想看详细的资讯信息,只要点击资讯题目即可,就能打开整条资讯信息。
上述得到的资讯信息及历史资讯信息可以以资讯信息识别出的实体对象为索引,放入咨询信息库,便于使用和展示。
展示时,可以通过设计可视化界面,通过表格、柱形图、饼图等进行实体对象、咨询信息、情感分类的展示。
在步骤104中,基于所述资讯信息的情感分类和所述历史资讯信息的情感分类,确定对所述实体对象的投资策略。
投资策略包括按照不同的规模进行投资,例如,某实体对象的正向情感的咨询信息非常多,那么可以进行大规模投资;某实体对象的正向情感和负向情感比例基本一致,那么进行小规模投资;某实体对象的负向情感的咨询信息非常多,那么不进行投资。
综上所述,本发明实施例提出的方法中,在获取到资讯信息后,将资讯信息的题目输入至实体识别模型,识别出资讯信息中的实体对象;将资讯信息的题目输入至情感分类模型,获得咨询信息的情感分类;基于识别出的实体对象搜索资讯信息库,获得第一时长内的历史资讯信息及对应的情感分类;基于所述资讯信息的情感分类和所述历史资讯信息的情感分类,确定对所述实体对象的投资策略。在上述过程中,对资讯信息的题目进行实体识别,是为了方便于银行人员的自定义地查看,搜索资讯信息库,获得第一时长内的历史资讯信息及对应的情感分类。对资讯信息的题目而非对资讯信息内容进行实体识别,方便精准定位实体,而不受资讯信息中提到的相关连的实体的干扰。另外,在情感分析时,将资讯信息的题目输入至情感分类模型,而不是资讯信息内容,也可进一步提高资讯信息情感分类的效率,从而可快速判断出对所述实体对象的投资策略。对于现在的信息爆炸时代,不用通过点击资讯信息就能得到大量的关于所关注实体对象的正向情感或负向情感的资讯信息,以及一些统计信息,对于银行工作人员工作效率的提高有很大帮助。
本发明还提出一种基于资讯信息分析的投资策略确定装置,其原理与基于资讯信息分析的投资策略确定方法相同,这里不再赘述。
图4为本发明实施例中基于资讯信息分析的投资策略确定装置的示意图,如图4所示,包括:
实体对象识别模块401,用于在获取到资讯信息后,将资讯信息的题目输入至实体识别模型,识别出资讯信息中的实体对象;
情感分类模块402,用于将资讯信息的题目输入至情感分类模型,获得咨询信息的情感分类;
历史情感分类获得模块403,用于基于识别出的实体对象搜索资讯信息库,获得第一时长内的历史资讯信息及对应的情感分类;
投资策略确定模块404,用于基于所述资讯信息的情感分类和所述历史资讯信息的情感分类,确定对所述实体对象的投资策略。
在一实施例中,所述实体识别模型采用NER模型。
在一实施例中,所述实体识别模型的训练步骤包括:
构建银行相关的实体字典文件;
基于stanford ner方法对实体字典文件的格式进行处理,获得.tsv格式的文档;
基于所述.tsv格式的文档训练NER模型,生成训练好的NER模型。
在一实施例中,所述情感分类模型采用Fasttext模型。
在一实施例中,所述情感分类模型的训练步骤包括:
爬取网络上的历史资讯信息;
对爬取的历史资讯信息的题目进行预处理,获得符合预设格式要求的文本信息;
对符合预设格式要求的文本信息进行情感标签标注;
基于标注后的文本信息训练Fasttext模型,获得训练好的Fasttext模型。
综上所述,本发明实施例提出的装置中,实体对象识别模块,用于在获取到资讯信息后,将资讯信息的题目输入至实体识别模型,识别出资讯信息中的实体对象;情感分类模块,用于将资讯信息的题目输入至情感分类模型,获得咨询信息的情感分类;历史情感分类获得模块,用于基于识别出的实体对象搜索资讯信息库,获得第一时长内的历史资讯信息及对应的情感分类;投资策略确定模块,用于基于所述资讯信息的情感分类和所述历史资讯信息的情感分类,确定对所述实体对象的投资策略。在上述过程中,对资讯信息的题目进行实体识别,是为了方便于银行人员的自定义地查看,搜索资讯信息库,获得第一时长内的历史资讯信息及对应的情感分类。对资讯信息的题目而非对资讯信息内容进行实体识别,方便精准定位实体,而不受资讯信息中提到的相关连的实体的干扰。另外,在情感分析时,将资讯信息的题目输入至情感分类模型,而不是资讯信息内容,也可进一步提高资讯信息情感分类的效率,从而可快速判断出对所述实体对象的投资策略。对于现在的信息爆炸时代,不用通过点击资讯信息就能得到大量的关于所关注实体对象的正向情感或负向情感的资讯信息,以及一些统计信息,对于银行工作人员工作效率的提高有很大帮助。
本发明的实施例还提供一种计算机设备,图5为本发明实施例中计算机设备的示意图,该计算机设备能够实现上述实施例中的基于资讯信息分析的投资策略确定方法中全部步骤,所述计算机设备具体包括如下内容:
处理器(processor)501、存储器(memory)502、通信接口(CommunicationsInterface)503和通信总线504;
其中,所述处理器501、存储器502、通信接口503通过所述通信总线504完成相互间的通信;所述通信接口503用于实现服务器端设备、检测设备以及用户端设备等相关设备之间的信息传输;
所述处理器501用于调用所述存储器502中的计算机程序,所述处理器执行所述计算机程序时实现上述实施例中的基于资讯信息分析的投资策略确定方法中的全部步骤。
本发明的实施例还提供一种计算机可读存储介质,能够实现上述实施例中的基于资讯信息分析的投资策略确定方法中全部步骤,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中的基于资讯信息分析的投资策略确定方法的全部步骤。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (12)
1.一种基于资讯信息分析的投资策略确定方法,其特征在于,包括:
在获取到资讯信息后,将资讯信息的题目输入至实体识别模型,识别出资讯信息中的实体对象;
将资讯信息的题目输入至情感分类模型,获得咨询信息的情感分类;
基于识别出的实体对象搜索资讯信息库,获得第一时长内的历史资讯信息及对应的情感分类;
基于所述资讯信息的情感分类和所述历史资讯信息的情感分类,确定对所述实体对象的投资策略。
2.如权利要求1所述的基于资讯信息分析的投资策略确定方法,其特征在于,所述实体识别模型采用NER模型。
3.如权利要求2所述的基于资讯信息分析的投资策略确定方法,其特征在于,所述实体识别模型的训练步骤包括:
构建银行相关的实体字典文件;
基于stanford ner方法对实体字典文件的格式进行处理,获得.tsv格式的文档;
基于所述.tsv格式的文档训练NER模型,生成训练好的NER模型。
4.如权利要求1所述的基于资讯信息分析的投资策略确定方法,其特征在于,所述情感分类模型采用Fasttext模型。
5.如权利要求4所述的基于资讯信息分析的投资策略确定方法,其特征在于,所述情感分类模型的训练步骤包括:
爬取网络上的历史资讯信息;
对爬取的历史资讯信息的题目进行预处理,获得符合预设格式要求的文本信息;
对符合预设格式要求的文本信息进行情感标签标注;
基于标注后的文本信息训练Fasttext模型,获得训练好的Fasttext模型。
6.一种基于资讯信息分析的投资策略确定装置,其特征在于,包括:
实体对象识别模块,用于在获取到资讯信息后,将资讯信息的题目输入至实体识别模型,识别出资讯信息中的实体对象;
情感分类模块,用于将资讯信息的题目输入至情感分类模型,获得咨询信息的情感分类;
历史情感分类获得模块,用于基于识别出的实体对象搜索资讯信息库,获得第一时长内的历史资讯信息及对应的情感分类;
投资策略确定模块,用于基于所述资讯信息的情感分类和所述历史资讯信息的情感分类,确定对所述实体对象的投资策略。
7.如权利要求6所述的基于资讯信息分析的投资策略确定装置,其特征在于,所述实体识别模型采用NER模型。
8.如权利要求7所述的基于资讯信息分析的投资策略确定装置,其特征在于,所述实体识别模型的训练步骤包括:
构建银行相关的实体字典文件;
基于stanford ner方法对实体字典文件的格式进行处理,获得.tsv格式的文档;
基于所述.tsv格式的文档训练NER模型,生成训练好的NER模型。
9.如权利要求6所述的基于资讯信息分析的投资策略确定装置,其特征在于,所述情感分类模型采用Fasttext模型。
10.如权利要求9所述的基于资讯信息分析的投资策略确定装置,其特征在于,所述情感分类模型的训练步骤包括:
爬取网络上的历史资讯信息;
对爬取的历史资讯信息的题目进行预处理,获得符合预设格式要求的文本信息;
对符合预设格式要求的文本信息进行情感标签标注;
基于标注后的文本信息训练Fasttext模型,获得训练好的Fasttext模型。
11.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5任一项所述方法。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有执行权利要求1至5任一项所述方法的计算机程序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111314123.9A CN114036949B (zh) | 2021-11-08 | 2021-11-08 | 基于资讯信息分析的投资策略确定方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111314123.9A CN114036949B (zh) | 2021-11-08 | 2021-11-08 | 基于资讯信息分析的投资策略确定方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114036949A true CN114036949A (zh) | 2022-02-11 |
CN114036949B CN114036949B (zh) | 2024-11-05 |
Family
ID=80143330
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111314123.9A Active CN114036949B (zh) | 2021-11-08 | 2021-11-08 | 基于资讯信息分析的投资策略确定方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114036949B (zh) |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102023967A (zh) * | 2010-11-11 | 2011-04-20 | 清华大学 | 一种面向股票领域的文本情感分类方法 |
CN105740353A (zh) * | 2016-01-26 | 2016-07-06 | 中国人民解放军国防科学技术大学 | 个股和文章关联度的计算方法及其系统 |
US20170351971A1 (en) * | 2016-06-07 | 2017-12-07 | International Business Machines Corporation | Method and apparatus for informative training repository building in sentiment analysis model learning and customaization |
CN108197113A (zh) * | 2018-01-19 | 2018-06-22 | 百度在线网络技术(北京)有限公司 | 文章资讯转换方法、装置、设备及计算机可读介质 |
CN109101597A (zh) * | 2018-07-31 | 2018-12-28 | 中电传媒股份有限公司 | 一种电力新闻数据采集系统 |
CN109271627A (zh) * | 2018-09-03 | 2019-01-25 | 深圳市腾讯网络信息技术有限公司 | 文本分析方法、装置、计算机设备和存储介质 |
CN111143562A (zh) * | 2019-12-27 | 2020-05-12 | 中国银行股份有限公司 | 一种资讯信息情感分析方法、装置及存储介质 |
CN111414754A (zh) * | 2020-03-19 | 2020-07-14 | 中国建设银行股份有限公司 | 一种事件的情感分析方法、装置、服务器及存储介质 |
US20200302540A1 (en) * | 2019-03-21 | 2020-09-24 | The University Of Chicago | Applying a trained model to predict a future value using contextualized sentiment data |
CN112528028A (zh) * | 2020-12-28 | 2021-03-19 | 北京华彬立成科技有限公司 | 投融资信息挖掘方法、装置、电子设备和存储介质 |
CN112784580A (zh) * | 2021-01-25 | 2021-05-11 | 中国工商银行股份有限公司 | 基于事件抽取的金融数据分析方法及装置 |
CN113434685A (zh) * | 2021-07-06 | 2021-09-24 | 中国银行股份有限公司 | 一种资讯分类处理的方法及系统 |
CN113535813A (zh) * | 2021-06-30 | 2021-10-22 | 北京百度网讯科技有限公司 | 一种数据挖掘方法、装置、电子设备以及存储介质 |
-
2021
- 2021-11-08 CN CN202111314123.9A patent/CN114036949B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102023967A (zh) * | 2010-11-11 | 2011-04-20 | 清华大学 | 一种面向股票领域的文本情感分类方法 |
CN105740353A (zh) * | 2016-01-26 | 2016-07-06 | 中国人民解放军国防科学技术大学 | 个股和文章关联度的计算方法及其系统 |
US20170351971A1 (en) * | 2016-06-07 | 2017-12-07 | International Business Machines Corporation | Method and apparatus for informative training repository building in sentiment analysis model learning and customaization |
CN108197113A (zh) * | 2018-01-19 | 2018-06-22 | 百度在线网络技术(北京)有限公司 | 文章资讯转换方法、装置、设备及计算机可读介质 |
CN109101597A (zh) * | 2018-07-31 | 2018-12-28 | 中电传媒股份有限公司 | 一种电力新闻数据采集系统 |
CN109271627A (zh) * | 2018-09-03 | 2019-01-25 | 深圳市腾讯网络信息技术有限公司 | 文本分析方法、装置、计算机设备和存储介质 |
US20200302540A1 (en) * | 2019-03-21 | 2020-09-24 | The University Of Chicago | Applying a trained model to predict a future value using contextualized sentiment data |
CN111143562A (zh) * | 2019-12-27 | 2020-05-12 | 中国银行股份有限公司 | 一种资讯信息情感分析方法、装置及存储介质 |
CN111414754A (zh) * | 2020-03-19 | 2020-07-14 | 中国建设银行股份有限公司 | 一种事件的情感分析方法、装置、服务器及存储介质 |
CN112528028A (zh) * | 2020-12-28 | 2021-03-19 | 北京华彬立成科技有限公司 | 投融资信息挖掘方法、装置、电子设备和存储介质 |
CN112784580A (zh) * | 2021-01-25 | 2021-05-11 | 中国工商银行股份有限公司 | 基于事件抽取的金融数据分析方法及装置 |
CN113535813A (zh) * | 2021-06-30 | 2021-10-22 | 北京百度网讯科技有限公司 | 一种数据挖掘方法、装置、电子设备以及存储介质 |
CN113434685A (zh) * | 2021-07-06 | 2021-09-24 | 中国银行股份有限公司 | 一种资讯分类处理的方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN114036949B (zh) | 2024-11-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110765257B (zh) | 一种知识图谱驱动型的法律智能咨询系统 | |
KR102288249B1 (ko) | 정보 처리 방법, 단말기, 및 컴퓨터 저장 매체 | |
CN116911312B (zh) | 一种任务型对话系统及其实现方法 | |
CN112667794A (zh) | 一种基于孪生网络bert模型的智能问答匹配方法及系统 | |
CN114357117A (zh) | 事务信息查询方法、装置、计算机设备及存储介质 | |
CN114153994A (zh) | 医保信息问答方法及装置 | |
CN113627797A (zh) | 入职员工画像生成方法、装置、计算机设备及存储介质 | |
CN112784591B (zh) | 数据的处理方法、装置、电子设备和存储介质 | |
CN117235215A (zh) | 基于大模型和知识图谱的生成对话方法、系统及介质 | |
CN114372454B (zh) | 文本信息抽取方法、模型训练方法、装置及存储介质 | |
CN117540004B (zh) | 基于知识图谱和用户行为的工业领域智能问答方法及系统 | |
CN116561288B (zh) | 事件查询方法、装置、计算机设备、存储介质及程序产品 | |
CN114036949B (zh) | 基于资讯信息分析的投资策略确定方法及装置 | |
CN116484021A (zh) | 一种构建leetcode题库知识图谱的方法、装置、存储介质 | |
CN112328812B (zh) | 基于自调参数的领域知识抽取方法与系统、电子设备 | |
Gurin | Methods for Automatic Sentiment Detection | |
CN116049376A (zh) | 一种信创知识检索回复的方法、装置和系统 | |
WO2022227196A1 (zh) | 一种数据分析方法、装置、计算机设备及存储介质 | |
CN114925185B (zh) | 交互方法、模型的训练方法、装置、设备及介质 | |
CN113064887B (zh) | 数据管理方法、装置、设备及存储介质 | |
CN118095296B (zh) | 基于知识图谱的语义分析方法、系统和介质 | |
Bharadi | Sentiment Analysis of Twitter Data Using Named Entity Recognition | |
Bektemyssova et al. | Building a Semantic Knowledge Graph Search Model for Finding a Causal Answer. | |
Amsa–nguan et al. | Development of the Topic Tagging System for Thai and English-Translated Web Contents | |
Nadia | Automated model to rank candidates for a job position based on data extracted from LinkedIn profiles |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |