CN110970098A - 一种功能多肽苦味预测方法 - Google Patents
一种功能多肽苦味预测方法 Download PDFInfo
- Publication number
- CN110970098A CN110970098A CN201911174720.9A CN201911174720A CN110970098A CN 110970098 A CN110970098 A CN 110970098A CN 201911174720 A CN201911174720 A CN 201911174720A CN 110970098 A CN110970098 A CN 110970098A
- Authority
- CN
- China
- Prior art keywords
- bitter taste
- functional polypeptide
- polypeptide
- model
- functional
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108090000765 processed proteins & peptides Proteins 0.000 title claims abstract description 55
- 102000004196 processed proteins & peptides Human genes 0.000 title claims abstract description 53
- 229920001184 polypeptide Polymers 0.000 title claims abstract description 52
- 235000019658 bitter taste Nutrition 0.000 title claims abstract description 35
- 238000000034 method Methods 0.000 title claims abstract description 18
- 238000012360 testing method Methods 0.000 claims abstract description 14
- 238000013210 evaluation model Methods 0.000 claims abstract description 8
- 238000013528 artificial neural network Methods 0.000 claims abstract description 6
- 230000003993 interaction Effects 0.000 claims abstract description 5
- 230000007613 environmental effect Effects 0.000 claims abstract description 4
- 229920000858 Cyclodextrin Polymers 0.000 claims description 7
- HFHDHCJBZVLPGP-UHFFFAOYSA-N schardinger α-dextrin Chemical compound O1C(C(C2O)O)C(CO)OC2OC(C(C2O)O)C(CO)OC2OC(C(C2O)O)C(CO)OC2OC(C(O)C2O)C(CO)OC2OC(C(C2O)O)C(CO)OC2OC2C(O)C(O)C1OC2CO HFHDHCJBZVLPGP-UHFFFAOYSA-N 0.000 claims description 7
- 150000001413 amino acids Chemical class 0.000 claims description 3
- -1 aromatic amino acid Chemical class 0.000 claims description 3
- 230000002209 hydrophobic effect Effects 0.000 claims description 3
- 239000002904 solvent Substances 0.000 claims description 3
- 235000019640 taste Nutrition 0.000 abstract description 2
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 102000015636 Oligopeptides Human genes 0.000 description 2
- 108010038807 Oligopeptides Proteins 0.000 description 2
- 238000004617 QSAR study Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 235000019596 Masking bitterness Nutrition 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/30—Prediction of properties of chemical compounds, compositions or mixtures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种功能多肽的苦味预测方法,包括如下步骤:采用局部与整体组合策略表征功功能多肽与苦味相关的序列‑结构‑动力学特征,包括二维信息,三维结构信息,动力学特征,环境参数,共20种参数作为模型的输入变量,应用长短时记忆神经网络建立功能多肽苦味预测模型,以五折交互检验评价模型的内部预测能力,以测试集检验评价模型的外部预测能力。该方法可用于功能多肽的苦味预测,进行功能多肽的结构‑苦味关系分析,协助优化选择合适的掩盖或者消除功能多肽苦味的实验条件与参数。
Description
技术领域
本发明涉及一种功能多肽的物化性质预测方法,特别是一种功能多肽的苦味预测方法。
背景技术
功能多肽对于人体健康具有重要的作用,然而,许多功能多肽具有苦味,这大大限制了其广泛应用,因此,及时或者准确的检测多肽的苦味,对于拓展功能多肽的应用具有重要的现实意义,但是,因为功能多肽的数量巨大,用实验方法一一检测其苦味费时,费力且费钱。随着人工智能技术与数学等学科的迅速发展与融合,采用人工智能技术预测功能多肽的苦味是一种有效的方法。定量构效关系模型为肽的苦味预测提供了重要工具,它通过在多肽的序列,结构和苦味之间建立定量联系,寻找出结构特征与苦味之间的量变规律,实现苦味的预测,其对于选择与优化实验条件,快速了解功能多肽的苦味特征具有十分重要的意义。本发明公开一种基于定量序列-结构-动力学-苦味关系模型的功能多肽苦味预测方法。
发明内容
有鉴于此,为了解决上述问题,本发明提供了一种功能多肽的苦味预测方法,其可用于功能多肽的苦味预测,也可以用于分析功能多肽的结构-苦味关系,同时,也可以用于评价环糊精对于功能多肽的苦味掩盖效果。
本发明的目的是这样实现的:一种功能多肽的苦味预测方法,包括如下步骤:
a)采用局部与整体组合策略表征功能多肽与苦味相关的序列-结构-动力学特征,包括a1)二维信息,包括序列长度,芳香族氨基酸比例,疏水性氨基酸比例,多肽的等电点,极化度,疏水性;a2)三维结构信息,包括立体特征,几何特征,局部柔性;a3)动力学特征,包括多肽主链扭转角,多肽紊乱度,可及表面积,溶剂自由能,侧链体积,侧链回转半径;a4)环境参数,包括反应体系的pH、温度、多肽的浓度、环糊精的浓度、环糊精的类型,上述20种参数作为模型的输入变量;
b)应用长短时记忆神经网络建立功能多肽苦味预测模型,以五折交互检验评价模型的内部预测能力,以测试集检验评价模型的外部预测能力,将每个功能多肽样本的输入变量带入模型并计算功能多肽的苦味值。
本发明的一种功能多肽的苦味预测方法,是基于一个新颖的定量序列-结构-动力学-苦味关系模型提出的。其中选取的局部与整体组合策略表征功能多肽的序列-结构-动力学特征,其所含信息量大、表征能力强、拓展性能好及操作简便;长短时记忆神经网络可以很好地相关苦味寡肽的结构变量与苦味值之间的关系,可以有效的防止模型的过拟合,同时,采用的五折交互检验及外部检验验证方法可以较大程度地保证所建模型的预测能力,所建方法具有良好的泛化性能。
本发明的其它优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书,权利要求书来实现和获得。
具体实施方式
以下对采用本发明的方法用于功能多肽的苦味预测为例进行详细的描述,包括以下步骤:
a)采用局部与整体组合策略表征功能多肽与苦味相关的序列-结构-动力学特征,包括a1)二维信息,包括序列长度,芳香族氨基酸比例,疏水性氨基酸比例,多肽的等电点,极化度,疏水性;a2)三维结构信息,包括立体特征,几何特征,局部柔性;a3)动力学特征,包括多肽主链扭转角,多肽紊乱度,可及表面积,溶剂自由能,侧链体积,侧链回转半径;a4)环境参数,包括反应体系的pH、温度、多肽的浓度、环糊精的浓度、环糊精的类型,上述20种参数作为模型的输入变量。
b)应用长短时记忆神经网络建立功能多肽苦味预测模型,以五折交互检验评价模型的内部预测能力,以测试集检验评价模型的外部预测能力,将每个功能多肽样本的输入变量带入模型并计算功能多肽的苦味值。
将实验测定60个功能多肽样本按照2:1分为训练集和测试集,以20个变量作为输入,实验测定的苦味值为输出值,用长短时记忆神经网络建立功能多肽的苦味预测模型。然后用五折法交互检验验证模型的内部预测能力,用对测试集的外部预测结果评价模型的外部预测能力。
模型预测能力通过以下统计量评价:拟合的复相关系数(R2),五折交互验证的复相关系数(Q2 cv),外部验证的复相关系数(Q2 ext),以及误差(MSE)。
预测结果见表1,可看出,拟合、五折交互检验和外部检验的相关系数分别为R2=0.973,Q2 cv=0.921,Q2 ext=0.886,误差(MSE)分别为0.18、0.26和0.33。结果表明,所建方法具有较强的苦味预测能力。
表1苦味寡肽的苦味预测结果
以上所述仅为本发明的优选实施例,并不用于限制本发明,显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (1)
1.一种功能多肽的苦味预测方法,其特征在于包括如下步骤:
a)采用局部与整体组合策略表征功能多肽与苦味相关的序列-结构-动力学特征,包括a1)二维信息,包括序列长度,芳香族氨基酸比例,疏水性氨基酸比例,多肽的等电点,极化度,疏水性;a2)三维结构信息,包括立体特征,几何特征,局部柔性;a3)动力学特征,包括多肽主链扭转角,多肽紊乱度,可及表面积,溶剂自由能,侧链体积,侧链回转半径;a4)环境参数,包括反应体系的pH、温度、多肽的浓度、环糊精的浓度、环糊精的类型,上述20种参数作为模型的输入变量;
b)应用长短时记忆神经网络建立功能多肽苦味预测模型,以五折交互检验评价模型的内部预测能力,以测试集检验评价模型的外部预测能力,将每个功能多肽样本的输入变量带入模型并计算功能多肽的苦味值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911174720.9A CN110970098A (zh) | 2019-11-26 | 2019-11-26 | 一种功能多肽苦味预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911174720.9A CN110970098A (zh) | 2019-11-26 | 2019-11-26 | 一种功能多肽苦味预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110970098A true CN110970098A (zh) | 2020-04-07 |
Family
ID=70031727
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911174720.9A Pending CN110970098A (zh) | 2019-11-26 | 2019-11-26 | 一种功能多肽苦味预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110970098A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050084907A1 (en) * | 2002-03-01 | 2005-04-21 | Maxygen, Inc. | Methods, systems, and software for identifying functional biomolecules |
CN108491680A (zh) * | 2018-03-07 | 2018-09-04 | 安庆师范大学 | 基于残差网络和注意力机制的药物关系抽取方法 |
CN109033738A (zh) * | 2018-07-09 | 2018-12-18 | 湖南大学 | 一种基于深度学习的药物活性预测方法 |
CN109671469A (zh) * | 2018-12-11 | 2019-04-23 | 浙江大学 | 基于循环神经网络预测多肽与hla i型分子之间结合关系与结合亲和力的方法 |
US20190304568A1 (en) * | 2018-03-30 | 2019-10-03 | Board Of Trustees Of Michigan State University | System and methods for machine learning for drug design and discovery |
CN110308254A (zh) * | 2019-04-22 | 2019-10-08 | 江南大学 | 低溶解氧的精准监测方法 |
CN110413319A (zh) * | 2019-08-01 | 2019-11-05 | 北京理工大学 | 一种基于深度语义的代码函数味道检测方法 |
-
2019
- 2019-11-26 CN CN201911174720.9A patent/CN110970098A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050084907A1 (en) * | 2002-03-01 | 2005-04-21 | Maxygen, Inc. | Methods, systems, and software for identifying functional biomolecules |
CN108491680A (zh) * | 2018-03-07 | 2018-09-04 | 安庆师范大学 | 基于残差网络和注意力机制的药物关系抽取方法 |
US20190304568A1 (en) * | 2018-03-30 | 2019-10-03 | Board Of Trustees Of Michigan State University | System and methods for machine learning for drug design and discovery |
CN109033738A (zh) * | 2018-07-09 | 2018-12-18 | 湖南大学 | 一种基于深度学习的药物活性预测方法 |
CN109671469A (zh) * | 2018-12-11 | 2019-04-23 | 浙江大学 | 基于循环神经网络预测多肽与hla i型分子之间结合关系与结合亲和力的方法 |
CN110308254A (zh) * | 2019-04-22 | 2019-10-08 | 江南大学 | 低溶解氧的精准监测方法 |
CN110413319A (zh) * | 2019-08-01 | 2019-11-05 | 北京理工大学 | 一种基于深度语义的代码函数味道检测方法 |
Non-Patent Citations (6)
Title |
---|
HYUN OCK KIM ET AL.: ""Quantitative Structure-Activity Relationship Study of Bitter Peptides"", 《J. AGRIC. FOOD CHEM.》, pages 10102 - 10111 * |
云永欢;邓百川;梁逸曾;: "化学建模与模型集群分析", 分析化学, no. 11, pages 37 - 46 * |
仝建波;李康楠;吴英纪;占培;李玲霄;: "一种新的氨基酸描述符及其在肽QSAR中的应用", 分析测试学报, no. 02, pages 87 - 92 * |
秦琦枫等: ""深度神经网络在化学中的应用研究"", 《江西化工》, pages 1 - 5 * |
郭延哺;李维华;王兵益;金宸;: "基于卷积长短时记忆神经网络的蛋白质二级结构预测", 模式识别与人工智能, no. 06, pages 80 - 86 * |
马铁铮等: ""蛋白短肽苦味成因与脱苦技术研究进展"", 《中国粮油学报》, pages 220 - 226 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230207068A1 (en) | Methods of Profiling Mass Spectral Data Using Neural Networks | |
Ciosek et al. | The analysis of sensor array data with various pattern recognition techniques | |
Vlasov et al. | Nonspecific sensor arrays (" electronic tongue") for chemical analysis of liquids (IUPAC Technical Report) | |
Daikuzono et al. | Information visualization and feature selection methods applied to detect gliadin in gluten-containing foodstuff with a microfluidic electronic tongue | |
CN112418212B (zh) | 一种基于EIoU改进的YOLOv3算法 | |
Gustafson et al. | Optimizing information content in MOF sensor arrays for analyzing methane-air mixtures | |
CN110018294B (zh) | 土壤重金属检测值校正方法、装置和计算机存储介质 | |
Kalinichenko et al. | Electronic nose combined with chemometric approaches to assess authenticity and adulteration of sausages by soy protein | |
CN117348574B (zh) | 涂料生产线的智能化控制系统及方法 | |
CN106779217A (zh) | 空气质量检测方法和空气质量检测系统 | |
CN114445407A (zh) | 材料的耐磨性能检测方法和装置 | |
KR20210116278A (ko) | 가스 감지 디바이스 및 가스 감지 디바이스를 작동시키기 위한 방법 | |
Das et al. | Application of deep convolutional neural networks for automated and rapid identification and computation of crack statistics of thin cracks in strain hardening cementitious composites (SHCCs) | |
CN110970098A (zh) | 一种功能多肽苦味预测方法 | |
Da Wang et al. | In situ characterization of heterogeneous surface wetting in porous materials | |
Natale et al. | Data analysis for chemical sensor arrays | |
Pourbasheer | High Accurate Prediction of Carbonate Selectivity of PVC-Plasticized Membranes Sensors by Genetic Algorithm-Support Vector Machine. | |
CN110310706A (zh) | 一种蛋白质无标绝对定量方法 | |
CN115902814B (zh) | 基于信息空间度量的目标识别模型性能评估方法和装置 | |
CN111008710A (zh) | 一种全局信息加局部信息正则的支持向量数据描述方法 | |
CN118392946B (zh) | 目标环境多组分气体下mos气体传感器选择系统 | |
Ling et al. | Usage Space Sampling for Fringe Customer Identification. | |
Yang et al. | Power-error analysis of sensor array regression algorithms for gas mixture quantification in low-power microsystems | |
Xie et al. | Gas quantitative analysis with support vector machine | |
CN107341515A (zh) | 一种基于数据表达的特殊点检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20200407 |
|
WD01 | Invention patent application deemed withdrawn after publication |