本文数据集选择从中文公开数据集weibo_senti_100k与ChnSentiCorp中选取10000条中文句子构建成初始语料,其中包含两种情感类别,正负各5000条。 为了避免藏文分词系统的版权问题,本数据集为原始语料,未经过分词系统。 本团队希望使用此藏文情感分析数据集的各位从事科研工作人员,能够在实验过程中,向我们提出您的宝贵意见,若要在您的公开论文中引用此数据集,烦请告知我们,联系邮箱:q_nuo@163.com。 本团队也会对此数据集进行后续更新以及维护工作,希望对藏文信息处理做出一点贡献。
-
Notifications
You must be signed in to change notification settings - Fork 1
UTibetNLP/TU_SA
Folders and files
Name | Name | Last commit message | Last commit date | |
---|---|---|---|---|
Repository files navigation
About
朱宇雷,德吉卡卓,群诺等.基于图神经网络结合预训练模型的藏文短文本情感分析研究[J].中文信息学报,2023,37(02):71-79.