[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN116049523A - 一种ai智能生成古诗词情境视频的系统及其工作方法 - Google Patents

一种ai智能生成古诗词情境视频的系统及其工作方法 Download PDF

Info

Publication number
CN116049523A
CN116049523A CN202211398608.5A CN202211398608A CN116049523A CN 116049523 A CN116049523 A CN 116049523A CN 202211398608 A CN202211398608 A CN 202211398608A CN 116049523 A CN116049523 A CN 116049523A
Authority
CN
China
Prior art keywords
image
sentence
video
ancient poetry
paraphrasing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211398608.5A
Other languages
English (en)
Other versions
CN116049523B (zh
Inventor
陈旭
吴砥
钟正
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central China Normal University
Original Assignee
Central China Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central China Normal University filed Critical Central China Normal University
Priority to CN202211398608.5A priority Critical patent/CN116049523B/zh
Publication of CN116049523A publication Critical patent/CN116049523A/zh
Application granted granted Critical
Publication of CN116049523B publication Critical patent/CN116049523B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F16/345Summarisation for human users
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • H04N5/265Mixing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

本发明属于信息技术的教学应用领域,提供一种AI智能生成古诗词情境视频的系统及其工作方法,系统包括古诗词释义检索模块、中英文转换模块、提示语句提取模块、单句图像生成模块、视频合成模块;工作方法包括以下步骤:(1)古诗词释义检索;(2)中文释义转换英文释义;(3)提示语句提取;(4)单句诗词图像生成;(5)视频合成。本发明构建了一个AI智能生成古诗词情境视频系统,该系统根据古诗词文本自动生成内容对应的情境视频,可以为教师教学及学生自学活动提供大量的视频学习资源,降低理解难度,本发明提供了一种古诗词学习视频生成的新途径,促进了古诗词教学资源生成的智能化。

Description

一种AI智能生成古诗词情境视频的系统及其工作方法
技术领域
本发明属于信息技术的教学应用领域,更具体地,涉及一种AI智能生成古诗词情境视频的系统及其工作方法。
背景技术
古诗词教学是中小学语文教学中的重要部分,但相比白话文,古诗词中蕴含的意境和情感往往更难理解。
为了便于学生理解,目前古诗词教学过程中主要采用网上公开的古诗词视频或教师自己制作微课的方式,存在如下问题:(1)视频资源数量有限:仅有部分古诗词具有情境视频;(2)古诗词视频制作工作量大:缺少自动化的工具来快速生成古诗词视频。这些问题使得现有的古诗词教学视频资源难以满足实际教学需求。
发明内容
本发明的目的是为了克服上述现有技术的不足,提供一种AI智能生成古诗词情境视频的系统及其工作方法,能够全自动化为古诗词生成情境视频。
本发明的目的是通过以下技术措施实现的。
本发明提供一种AI智能生成古诗词情境视频的系统,包括古诗词释义检索模块、中英文转换模块、提示词提取模块、单句图像生成模块、视频合成模块;
所述古诗词释义检索模块从网络上开放的古诗词解析、译文等网站上以古诗词题目和作者作为关键字段爬取古诗词的全文译文;
所述中英文转换模块利用预训练的NLLB-200模型将古诗词中文译文转换为英文译文;
所述提示语句提取模块根据英文译文按照主语总体描述、细节描述、艺术风格、画面质量来抽取关键词,组成提示语句;
所述单句图像生成模块基于Stable Diffusion模型利用抽取的提示语句来生成每句诗词的情境图像,然后利用图像摘要模型生成情境图像的摘要,将摘要补充至提示语句进行迭代优化得到最终图像;
所述视频合成模块采用帧插网络将单句诗词生成的图像内插为视频片段,并将古诗词内容合成音频,按视频片段时间间隔将音频与视频数据融合,得到最终完整的古诗词情境视频。
本发明还提供一种上述的AI智能生成古诗词情境视频的系统的工作方法,包括以下步骤:
(1)古诗词释义检索,首先按照古诗词题目和作者作为关键字段从网络上爬取古诗词的全文释义。
(2)中文释义转换英文释义,采用transformer网络架构利用预训练的NLLB-200模型逐句将中文释义翻译成英文释义。
(3)提示语句提取,首先抽取英文释义语句中的关键词,在此基础上生成关键词的细节描述词,最后补全艺术风格和图像质量描述词,得到最终的提示语句。
(4)单句诗词图像生成,采用Stable Diffusion模型将提示语句转化为初始的情境图像,然后对情境图像生成图像摘要,将图像摘要补充到原始的提示语句,再用补充后的提示语句继续生成图像,执行该过程2次,得到最终的图像。
(5)视频合成,先将单句诗词生成的情境图像进行扩充为视频片段,然后利用TTS模型将每句中文诗句文本转为音频文件,最后采用FFmpeg库按视频片段的间隔时间将视频片段数据与音频数据写出为古诗词情境视频。
本发明AI智能生成古诗词情境视频的系统及其工作方法,构建了一个AI智能生成古诗词情境视频系统,该系统根据古诗词文本自动生成内容对应的情境视频,可以为教师教学及学生自学活动提供大量的视频学习资源,降低理解难度。另外,目前还未有其他古诗词情境视频自动生成的公开方法,本发明为古诗词情境教学提供了一种新的路径。
附图说明
图1是本发明实施例中AI智能生成古诗词情境视频系统架构图。
图2是本发明实施例中AI智能生成古诗词情境视频系统的工作方法流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施案例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施案例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
如图1所示,本实施例提供一种AI智能生成古诗词情境视频的系统,包括古诗词释义检索模块、中英文转换模块、提示语句提取模块、单句图像生成模块、视频合成模块;
所述古诗词释义检索模块从网络上开放的古诗词解析、译文等网站上以古诗词题目和作者作为关键字段爬取古诗词的全文译文;
所述中英文转换模块利用预训练的NLLB-200模型将古诗词中文译文转换为英文译文;
所述提示语句提取模块根据英文译文按照主语总体描述、细节描述、艺术风格、画面质量来抽取关键词,组成提示语句;
所述单句图像生成模块基于Stable Diffusion模型利用抽取的提示词来生成诗词中每句的情境图像,然后利用图像摘要模型(如OFA模型)生成情境图像的摘要,将摘要补充至提示语句进行迭代优化得到最终图像;
所述视频合成模块采用帧插网络将单句诗词生成的图像内插为视频片段,并将古诗词内容合成音频,按视频片段时间间隔将音频与视频数据融合,得到最终完整的古诗词情境视频。
本实施例还提供一种上述的AI智能生成古诗词情境视频的系统的工作方法,如图2所示,包括以下步骤:
(1)古诗词释义检索,将古诗词题目和作者作为关键字段从网络上爬取古诗词的全文释义;
(1-1)释义爬取,基于Python语言与https://www.gushiwen.cn/网站建立会话链接,将需要检索的古诗词题目和作者名称替换以下地址https://so.gushiwen.cn/search.aspx?value=title+author&valuej=title[0]中的title和author字段,获取替换后网页的编码内容。根据class的定义方式得到诗词对应的超链接,获取超链接对应的文本内容,其中译文对应的内容即为古诗词的完整释义。
(1-2)释义存储,将获取到的诗词全文释义按句存储,每一句对应古诗词中的一句。
(2)中文释义转换英文释义,采用transformer网络架构利用预训练的NLLB-200模型逐句将中文释义翻译成英文释义。
(2-1)模型初始化,从transformer库中引入AutoModelForSeq2SeqLM、AutoTokenizer类,加载NLLB-200-Distilled-600M预训练模型。
(2-2)释义翻译,利用AutoTokenizer类逐句对中文释义进行编码,然后利用AutoModelForSeq2SeqLM类将编码后的中文分词器生成英文分词器,最后利用AutoTokenizer类对得到英文分词器执行解码操作,得到每句诗词的英文译文。
(3)提示语句提取,首先抽取英文释义语句中的关键词,在此基础上生成关键词的细节描述词,最后补全艺术风格和图像质量描述词,得到最终的提示语句。
(3-1)关键词抽取,首先采用Bert模型提取每句英文译文的整句语义特征向量,然后采用N-Gram模型提取每个词的特征向量,计算每个词的特征向量与整句语义特征向量的相似度,选取相似度最大的词作为关键词。
(3-2)细节描述词生成,在英文释义中检索关键词前面的词句与后面的从句作为关键词的细节描述词句。
(3-3)提示语句自动补全,按照风景、物体、人物、季节、事件、节日划分多个艺术风格,根据诗词的类型自动补全提示语句的艺术风格描述词,图像质量统一采用高质量描述词,得到最终的提示语句。
(4)单句诗词图像生成,采用Stable Diffusion模型将提示语句转化为初始的情境图像,然后对情境图像生成图像摘要,将图像摘要补充到原始的提示语句,再用补充后的提示语句继续生成图像,执行该过程2次,得到最终的图像。
(4-1)初始图像生成,初始化StableDiffusionPipeline类加载预训练的stable-diffusion-v1-4模型,将提示语句传入StableDiffusionPipeline,生成初始的情境图像。
(4-2)图像摘要生成,采用Transformer网络架构生成,利用预训练OFA模型,为情境图像生成摘要描述。
(4-3)迭代优化,将得到的摘要描述信息补充到原始的提示语句中,利用补充后的提示语句再次执行步骤(4-1)和(4-2),重复步骤(4-3)两次,得到诗句最终的情境图像。
(5)视频合成,先将单句诗词生成的情境图像进行扩充为视频片段,然后利用TTS模型将每句中文诗句文本转为音频文件,最后采用FFmpeg库按视频片段的间隔时间将视频片段数据与音频数据写出为古诗词情境视频。
(5-1)单句诗词情境图像扩充视频片段,将提示语句中的关键词作为图像主体进行图像裁剪,将裁剪后图像超分辨至原图大小,利用帧插网络在原始图像和裁剪图像之间插帧得到视频片段。
(5-1-1)图像主体裁剪,将单句诗词生成的图像输入到YOLOv5网络中进行目标检测,选取步骤(3-1)中相似度最高的关键词作为检测目标,获取检测目标对应的包围框,将包围框的宽高分别扩大1.5倍,扩大后的包围框作为裁剪框,对词句生成的原始图像进行裁剪。
(5-1-2)裁剪图像超分辨,根据诗句生成的原始图像大小和裁剪图像大小确定放大比例S,然后采用RCAN网络对裁剪后的图像进行超分辨S倍,将超分辨后图像裁剪至原图像大小。
(5-1-3)图像间插帧,将诗句生成的原始图像和超分辨后的裁剪图像作为起始帧和结束帧,利用FILM网络生成中间帧图像,然后对原始图像、插值的中间帧图像、结束帧图像继续插帧,共插入118帧。
(5-2)音频合成,利用TTS模型将中文古诗词文本逐句转换为音频文件,计算每句音频的时间,小于5秒的增加空白音,使每句音频时间为5秒。
(5-3)音视频合并,利用FFmpeg库按诗句的顺序,读取视频片段到缓存,再读取合成的音频文件到缓存,写入到同一个视频文件中。
本说明书中未作详细描述的内容,属于本专业技术人员公知的现有技术。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进,均应包含在本发明的保护范围之内。

Claims (7)

1.一种AI智能生成古诗词情境视频的系统,其特征在于:该系统包括古诗词释义检索模块、中英文转换模块、提示语句提取模块、单句图像生成模块、视频合成模块;
所述古诗词释义检索模块从网络上开放的古诗词解析、译文网站上以古诗词题目和作者作为关键字段爬取古诗词的全文译文;
所述中英文转换模块利用预训练的NLLB-200模型将古诗词中文译文转换为英文译文;
所述提示语句提取模块根据英文译文按照主语总体描述、细节描述、艺术风格、画面质量来抽取关键词,组成提示语句;
所述单句图像生成模块基于Stable Diffusion模型利用抽取的提示语句来生成每句诗词的情境图像,然后利用图像摘要模型生成情境图像的摘要,将摘要补充至提示语句进行迭代优化得到最终图像;
所述视频合成模块采用帧插网络将单句诗词生成的图像内插为视频片段,并将古诗词内容合成音频,按视频片段时间间隔将音频与视频数据融合,得到最终完整的古诗词情境视频。
2.一种如权利要求1所述的AI智能生成古诗词情境视频的系统的工作方法,其特征在于该方法包括以下步骤:
(1)古诗词释义检索,将古诗词题目和作者作为关键字段从网络上爬取古诗词的全文释义;
(2)中文释义转换英文释义,采用transformer网络架构利用预训练的NLLB-200模型逐句将中文释义翻译成英文释义;
(3)提示语句提取,抽取英文释义语句中的关键词,在此基础上生成关键词的细节描述词,补全艺术风格和图像质量描述词,得到最终的提示语句;
(4)单句诗词图像生成,采用Stable Diffusion模型将提示语句转化为初始的情境图像,对情境图像生成图像摘要,将图像摘要补充到原始的提示语句,再用补充后的提示语句继续生成图像,执行该过程2次,得到最终的图像;
(5)视频合成,将单句诗词生成的情境图像进行扩充为视频片段,利用TTS模型将每句中文诗句文本转为音频文件,最后采用FFmpeg库按视频片段的间隔时间将视频片段数据与音频数据写出为古诗词情境视频。
3.根据权利要求2所述的AI智能生成古诗词情境视频的系统的工作方法,其特征在于步骤(1)所述古诗词释义检索具体为:
(1-1)释义爬取,基于Python语言与古诗词网站建立会话链接,根据网络URL地址的规则将需要检索的古诗词题目和作者名称替换网络URL地址中的题目和作者名称字段,获取替换后网页的编码内容,检索其中的译文内容,即为古诗词的完整释义;
(1-2)释义存储,将获取到的诗词全文释义按句存储,每一句对应古诗词中的一句。
4.根据权利要求2所述的AI智能生成古诗词情境视频的系统的工作方法,其特征在于步骤(2)所述中文释义转换英文释义具体为:
(2-1)模型初始化,从transformer库中引入AutoModelForSeq2SeqLM、AutoTokenizer类,加载NLLB-200-Distilled-600M预训练模型;
(2-2)释义翻译,利用AutoTokenizer类逐句对中文释义进行编码,然后利用AutoModelForSeq2SeqLM类将编码后的中文分词器生成英文分词器,最后利用AutoTokenizer类对得到英文分词器执行解码操作,得到每句诗词的英文译文。
5.根据权利要求2所述的AI智能生成古诗词情境视频的系统的工作方法,其特征在于步骤(3)所述提示语句提取具体为:
(3-1)关键词抽取,采用Bert模型提取每句英文译文的整句语义特征向量,采用N-Gram模型提取每个词的特征向量,计算每个词的特征向量与整句语义特征向量的相似度,选取相似度最大的词作为关键词;
(3-2)细节描述词生成,在英文释义中检索关键词前面的词句与后面的从句作为关键词的细节描述词句;
(3-3)提示语句自动补全,按照风景、物体、人物、季节、事件、节日划分多个艺术风格,根据诗词的类型自动补全提示语句的艺术风格描述词,图像质量统一采用高质量描述词,得到最终的提示语句。
6.根据权利要求2所述的AI智能生成古诗词情境视频的系统的工作方法,其特征在于步骤(4)所述单句诗词图像生成具体为:
(4-1)初始图像生成,初始化StableDiffusionPipeline类加载预训练的stable-diffusion-v1-4模型,将提示语句传入StableDiffusionPipeline,生成初始的情境图像;
(4-2)图像摘要生成,采用Transformer网络架构生成,利用预训练OFA模型,为情境图像生成摘要描述;
(4-3)迭代优化,将得到的摘要描述信息补充到原始的提示语句中,利用补充后的提示语句再次执行步骤(4-1)和(4-2),重复步骤(4-3)两次,得到诗句最终的情境图像。
7.根据权利要求2所述的AI智能生成古诗词情境视频的系统的工作方法,其特征在于步骤(5)所述视频合成具体为:
(5-1)单句诗词情境图像扩充视频片段,将提示语句中的关键词作为图像主体进行图像裁剪,将裁剪后图像超分辨至原图大小,利用帧插网络在原始图像和裁剪图像之间插帧得到视频片段;
(5-1-1)图像主体裁剪,将单句诗词生成的图像输入到YOLOv5网络中进行目标检测,选取步骤(3)中相似度最高的关键词作为检测目标,获取检测目标对应的包围框,将包围框的宽高分别扩大1.5倍,扩大后的包围框作为裁剪框,对词句生成的原始图像进行裁剪;
(5-1-2)裁剪图像超分辨,根据诗句生成的原始图像大小和裁剪图像大小确定放大比例S,采用RCAN网络对裁剪后的图像进行超分辨S倍,将超分辨后图像裁剪至原图像大小;
(5-1-3)图像间插帧,将诗句生成的原始图像和超分辨后的裁剪图像作为起始帧和结束帧,利用FILM网络生成中间帧图像,对原始图像、插值的中间帧图像、结束帧图像继续插帧,共插入118帧;
(5-2)音频合成,利用TTS模型将中文古诗词文本逐句转换为音频文件,计算每句音频的时间,小于5秒的增加空白音,使每句音频时间为5秒;
(5-3)音视频合并,利用FFmpeg库按诗句的顺序,读取视频片段到缓存,读取合成的音频文件到缓存,写入到同一个视频文件中。
CN202211398608.5A 2022-11-09 2022-11-09 一种ai智能生成古诗词情境视频的系统及其工作方法 Active CN116049523B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211398608.5A CN116049523B (zh) 2022-11-09 2022-11-09 一种ai智能生成古诗词情境视频的系统及其工作方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211398608.5A CN116049523B (zh) 2022-11-09 2022-11-09 一种ai智能生成古诗词情境视频的系统及其工作方法

Publications (2)

Publication Number Publication Date
CN116049523A true CN116049523A (zh) 2023-05-02
CN116049523B CN116049523B (zh) 2023-08-22

Family

ID=86114548

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211398608.5A Active CN116049523B (zh) 2022-11-09 2022-11-09 一种ai智能生成古诗词情境视频的系统及其工作方法

Country Status (1)

Country Link
CN (1) CN116049523B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116634178A (zh) * 2023-07-26 2023-08-22 清华大学 一种极低码率的安防场景监控视频编解码方法及系统
CN117808923A (zh) * 2024-02-29 2024-04-02 浪潮电子信息产业股份有限公司 一种图像生成方法、系统、电子设备及可读存储介质
CN118037898A (zh) * 2024-04-15 2024-05-14 南京邮电大学 一种基于图像引导视频编辑的文本生成视频方法
CN118470160A (zh) * 2024-07-11 2024-08-09 厦门亿学软件有限公司 一种基于人工智能语境的四维意境自动构建方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020051077A1 (en) * 2000-07-19 2002-05-02 Shih-Ping Liou Videoabstracts: a system for generating video summaries
CN205486907U (zh) * 2016-01-01 2016-08-17 山西大同大学 一种古诗词点读器
CN107045810A (zh) * 2017-03-03 2017-08-15 河南职业技术学院 一种在旅游中古诗词教学设备及方法
CN112289339A (zh) * 2020-06-04 2021-01-29 郭亚力 一种将语音转化为画面的系统
CN113392273A (zh) * 2020-12-31 2021-09-14 腾讯科技(深圳)有限公司 视频播放方法、装置、计算机设备及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020051077A1 (en) * 2000-07-19 2002-05-02 Shih-Ping Liou Videoabstracts: a system for generating video summaries
CN205486907U (zh) * 2016-01-01 2016-08-17 山西大同大学 一种古诗词点读器
CN107045810A (zh) * 2017-03-03 2017-08-15 河南职业技术学院 一种在旅游中古诗词教学设备及方法
CN112289339A (zh) * 2020-06-04 2021-01-29 郭亚力 一种将语音转化为画面的系统
CN113392273A (zh) * 2020-12-31 2021-09-14 腾讯科技(深圳)有限公司 视频播放方法、装置、计算机设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
赵芬;: "小学语文古诗词教学中情境教学策略研究", 传播力研究, no. 11 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116634178A (zh) * 2023-07-26 2023-08-22 清华大学 一种极低码率的安防场景监控视频编解码方法及系统
CN116634178B (zh) * 2023-07-26 2023-10-31 清华大学 一种极低码率的安防场景监控视频编解码方法及系统
CN117808923A (zh) * 2024-02-29 2024-04-02 浪潮电子信息产业股份有限公司 一种图像生成方法、系统、电子设备及可读存储介质
CN117808923B (zh) * 2024-02-29 2024-05-14 浪潮电子信息产业股份有限公司 一种图像生成方法、系统、电子设备及可读存储介质
CN118037898A (zh) * 2024-04-15 2024-05-14 南京邮电大学 一种基于图像引导视频编辑的文本生成视频方法
CN118470160A (zh) * 2024-07-11 2024-08-09 厦门亿学软件有限公司 一种基于人工智能语境的四维意境自动构建方法及系统

Also Published As

Publication number Publication date
CN116049523B (zh) 2023-08-22

Similar Documents

Publication Publication Date Title
CN116049523B (zh) 一种ai智能生成古诗词情境视频的系统及其工作方法
Lörscher Investigating the translation process
CN106919646B (zh) 中文文本摘要生成系统及方法
US20170308526A1 (en) Compcuter Implemented machine translation apparatus and machine translation method
CN111428467A (zh) 生成阅读理解的问题题目的方法、装置、设备及存储介质
CN112395858B (zh) 融合试题数据和解答数据的多知识点标注方法和系统
US20210319053A1 (en) Method and System for Automated Generation and Editing of Educational and Training Materials
CN114972848A (zh) 基于细粒度视觉信息控制网络的图像语义理解及文本生成
Hassani et al. LVTIA: A new method for keyphrase extraction from scientific video lectures
CN117787409A (zh) 基于大语言模型的人机交互方法、装置及电子设备
CN115983294A (zh) 翻译模型的训练方法、翻译方法及设备
KR20040024619A (ko) 복수 언어의 대역 텍스트 입력에 의한 제 3 언어 텍스트생성 알고리즘, 장치 및 프로그램
Vybhavi et al. Video transcript summarizer
CN117688220A (zh) 一种基于大语言模型的多模态信息检索方法及系统
CN117332789A (zh) 一种面向对话场景的语义分析方法及系统
CN111859950A (zh) 一种自动化生成讲稿的方法
Ayadi et al. Automatic translation from Arabic to Arabic Sign Language: a review
Pulipaka et al. Machine translation of English videos to Indian regional languages using open innovation
Quach et al. Recommending the workflow of vietnamese sign language translation via a comparison of several classification algorithms
KR20230080849A (ko) 실시간 온라인 전문 강의용 주제 친화적 자막 생성 방법 및 시스템
CN114298037A (zh) 基于深度学习的文本摘要获取方法
Arong A native clearing: the English language in Anglophone Filipino novels
KR101587026B1 (ko) 사전에 포함된 용어 정의들로부터 온톨로지들을 자동으로 생성하기 위한 디바이스 및 방법
Vecchi et al. Transferring multiple text styles using CycleGAN with supervised style latent space
Wedriyani et al. Translation Procedures of The Animated Movie “A Stork’s Journey”

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant