[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN1178469C - 图像信息编辑方法和编辑设备 - Google Patents

图像信息编辑方法和编辑设备 Download PDF

Info

Publication number
CN1178469C
CN1178469C CNB998151971A CN99815197A CN1178469C CN 1178469 C CN1178469 C CN 1178469C CN B998151971 A CNB998151971 A CN B998151971A CN 99815197 A CN99815197 A CN 99815197A CN 1178469 C CN1178469 C CN 1178469C
Authority
CN
China
Prior art keywords
scene
value
camera lens
predetermined
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB998151971A
Other languages
English (en)
Other versions
CN1332925A (zh
Inventor
高桥靖
杉山和雄
渡边诚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN1332925A publication Critical patent/CN1332925A/zh
Application granted granted Critical
Publication of CN1178469C publication Critical patent/CN1178469C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • G06V20/47Detecting features for summarising video content
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/034Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/11Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information not detectable on the record carrier
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/21Disc-shaped record carriers characterised in that the disc is of read-only, rewritable, or recordable type
    • G11B2220/215Recordable discs
    • G11B2220/216Rewritable discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/25Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
    • G11B2220/2537Optical discs
    • G11B2220/2562DVDs [digital versatile discs]; Digital video discs; MMCDs; HDCDs
    • G11B2220/2575DVD-RAMs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/90Tape-like record carriers
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/022Electronic editing of analogue information signals, e.g. audio or video signals
    • G11B27/024Electronic editing of analogue information signals, e.g. audio or video signals on tapes
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/022Electronic editing of analogue information signals, e.g. audio or video signals
    • G11B27/026Electronic editing of analogue information signals, e.g. audio or video signals on discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/032Electronic editing of digitised analogue information signals, e.g. audio or video signals on tapes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/8042Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction
    • H04N9/8045Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction using predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Television Signal Processing For Recording (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)
  • Studio Devices (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

视频图像片目的正规版图像被分成带有时间码的多个镜头或多个场景,并且为故事的语义评估的供应信息被加入给相应的场景以编成场景分值。用于每个目的的需要场景根据场景分值和一个阈值来提取(处理Pr14)。对于构成每个被提取场景的每个镜头加入图像特征评估信息,以便编成镜头分值(处理Pr16)。根据适于此目的的一个预定规则选择每个被提取场景的最佳镜头(处理Pr16)。最佳镜头从正规版图像中顺序剪切下,从而自动编成适于此目的的预览图像(处理Pr22)。

Description

图像信息编辑方法和编辑设备
技术领域
本发明涉及一种图像(video)信息编辑方法和编辑设备,特别是与生成与图像片目(video title)的预览图像有关的图像信息编辑方法和编辑设备。
背景技术
具有如电影、电视剧和纪录片节目的故事性的图像片目作为商品经诸如地面波/卫星广播和互联网来提供,或者通过DVD(数字多功能盘)和其它的封装媒介来提供。观众通过购买它们来获得这样的图像片目的所需的一个。
当选择某个具有故事的图像片目时,观众有效地使用一个预览影片或类似物的预览图像。
通常,预览影片是为电影院银幕上放映的电影准备的。因而这种预览影片不一定适合通过如广播和互联网的网络,或通过DVD和其它封装媒介来使用,因为这里包含额外的广告和不合时宜的解说。
因此,目前,图像片目的发送方为每个图像片目准备了独特的预览图像。
同时,观众将在观看了表征诸如概况、亮点(最精彩部分)和主要演员等观众的各个兴趣点的预览图像之后决定购买和观赏该图像片目的正规版本。最好的情况是准备与满足观众需要的目的对应的几种类型的图像。然而,由于发送方当前仅准备了一个预览图像,因此不能提供观众所需要的各种类型的预览图像。
此外,制作预览图像需要特殊的敏感性和才能以及大量的费用。特别是在目前,大量的内容的流通被普遍采纳,而这种人才数量是不够的。因此,目前很难在短时期内以低成本制作满足各种观点的预览图像或者制作相应于此目的的一段时间(长度)的预览图像。
发明内容
鉴于上述现有技术的状况,本发明的目的是提供一种实现各种类型预览图像的编辑和能够容易地编辑所需时间长度的预览图像的图像信息编辑方法和编辑设备。
本发明的图像信息编辑方法包括以下步骤:按定界指令的定时把一个正规版图像定界为作为动态图像单位的多个镜头(shot)或定界为多个场景,其中,正规版图像由与记录位置信息或时间经历信息一同记录的连续动态图像构成,每个场景至少包括一个镜头,该记录位置信息或时间经历信息与该镜头或场景相关联;根据相应于每个镜头或场景提供的信息,产生每个镜头或每个场景的一个评估值;和从正规版图像中选择镜头或场景,使镜头或场景的每个评估值满足一个预定条件。
此外,本发明的图像信息编辑方法包括以下步骤:按定界指令的定时把一个正规版图像定界为作为动态图像单位的镜头(shot)或定界为场景,其中,正规版图像由与记录位置信息或时间经历信息一同记录的连续动态图像构成,每个场景至少包含一个镜头,该记录位置信息或时间经历信息与该镜头或场景相关联;根据相应于每个场景提供的信息,产生每个场景的一个评估值;从正规版图像中选择场景,使场景的每个评估值满足一个预定的第一条件;根据相应于每个镜头提供的信息产生包含在每个被选择场景中的每个镜头的一个评估值;和选择镜头,使镜头的每个评估值满足一个预定的第二条件。
本发明的图像信息编辑设备包括:一个定界装置,按定界指令的定时把一个正规版图像定界为作为动态图像单位的镜头或定界为场景,其中,正规版图像由与记录位置信息或时间经历信息一同记录的连续动态图像构成,每个场景至少包含一个镜头,该记录位置信息或时间经历信息与该镜头或场景相关联;产生装置,根据相应于每个镜头或场景提供的信息,产生每个镜头或每个场景的一个评估值;和选择装置,从正规版图像中选择镜头或场景,使镜头或场景的每个评估值满足一个预定条件。
此外,本发明的图像信息编辑设备包括:定界装置,按定界指令的定时把一个正规版图像定界为作为动态图像单位的镜头或定界为场景,其中,正规版图像由与记录位置信息或时间经历信息一同记录的连续动态图像构成,每个场景至少包含一个镜头,该记录位置信息或时间经历信息与该镜头或场景相关联;产生装置,根据相应于每个场景提供的信息,产生每个场景的一个评估值;选择装置,从正规版图像中选择场景,使场景的每个评估值满足一个预定的第一条件;装置,根据相应于每个镜头提供的信息产生包含在每个被选择场景中的每个镜头的一个评估值;和选择镜头的装置,使镜头的每个评估值满足一个预定的第二条件。
此外,本发明的图像信息编辑设备包括:定界装置,按定界指令的定时把一个正规版图像定界为作为动态图像单位的镜头或定界为场景,其中,正规版图像由与记录位置信息或时间经历信息一同记录的连续动态图像构成,每个场景至少包含一个镜头,该记录位置信息或时间经历信息与该镜头或场景相关联;产生装置,根据相应于每个镜头或每个场景提供的信息,产生每个镜头或每个场景的一个评估值;选择装置,从正规版图像中选择镜头或场景,使镜头或场景的每个评估值满足一个预定条件;和对数据进行编码的装置,所述的数据至少包含相应于被选择镜头或场景的记录位置信息或时间经历信息以及相应的评估值。
此外,本发明的一种图像信息编辑设备,包括:定界装置,根据定界指令的定时把一个正规版图像定界为作成动态图像单位的多个镜头或定界为多个场景,其中,正规版图像由与记录位置信息或时间经历信息一同记录的连续动态图像构成,其中,每个场景至少包含一个镜头,所述记录位置信息或时间经历信息与该镜头或场景相关联;产生装置,根据相应于每个场景提供的信息,产生每个场景的一个评估值;选择装置,从正规版图像中选择场景,使场景的每个评估值满足预定的第一条件;产生装置,根据相应于每个镜头提供的信息产生包含在每个被选择场景中的每个镜头的一个评估值;选择镜头的装置,使镜头的每个评估值满足一个预定的第二条件;和用于编码对应于每个选择的镜头的记录位置信息或时间经历信息的信息和至少包括镜头评估值的数据的装置。
附图说明
图1是图示说明本发明一个被提取图像编成方法的一个实施例处理的示例性示意图;
图2是续图1的示例性示意图;
图3是图示说明本发明的被提取图像编成的每个过程的示意图;
图4示出了在本发明方法的一个语义分值(semantic score)编成过程中的示例性操作,其中示出了用于电影“MASK”的一个场景分值表;
图5示出了在本发明方法的一个镜头分值(shot score)准备处理中的示例性操作,其中示出了用于电影“MASK”的一个镜头分值表;
图6示出了在本发明方法的一个镜头分值准备处理中的另一个示例性操作,其中示出了用于电影“MASK”的主要演员,Tina,的一个镜头分值表;
图7是显示根据本发明方法编成的一个说明性语义分值的一个示例性示图;
图8是显示根据本发明方法编成的说明性语义码的示例性示图;
图9是图示说明本发明的图像信息编辑方法的一个实施例的基本部分处理的示例性示图;
图10是图示说明本发明的图像信息编辑方法的另一个实施例的基本部分的处理的示例性示图;
图11是显示本发明的被提取图像编成设备的一个实施例的结构的方框图;
图12示出了基于本发明的装置的图像转换特征表在屏幕上显示的一个示例性图像转换特征曲线图;
图13是显示图11所示的景象索引表编成装置的操作的流程图;
图14是显示图11所示的场景索引表编成装置的操作的流程图;
图15是显示图11所示的场景分值表编成装置的操作的流程图;
图16是显示图11所示的图像转换特征编成装置的操作的流程图;
图17是显示图11所示的适用的场景提取装置的操作的流程图;
图18是显示图11所示的镜头编成和镜头提取装置的操作的流程图;
图19是显示图11所示的显示编成装置的操作的流程图;
图20是显示图11所示的预览图像时间调整装置的操作的流程图;
图21是显示图11所示的预览图像编成装置的操作的流程图;
图22是显示本发明的图像信息编辑设备的一个实施例结构的方框图;
图23是显示图22中所示的图像信息编辑装置的语义分值记录装置的操作的流程图;
图24是显示本发明的图像信息编辑装置的另一实施例结构的方框图;
图25是显示图24所示的图像信息编辑设备的语义码编成装置的操作的流程图。
具体实施方式
本发明的图像信息编辑方法和设备,例如,具有以下功能:把诸如电影或电视节目的图像片目划分成场景和镜头(稍后定义);加入每个场景故事的语义评估(evaluation)信息和关于从外部提供的每个镜头的图像特性的评估信息,以作为对每个场景和镜头编辑语义分值的规定条件;记录和保存语义分值;并通过使用语义分值根据为每个特定目的设置的预定规则,自动地判定正规版图像的剪切点,从而,自动地编成(organize)与该目的相符的预定时间长度的预览图像,记录和利用用于自动编成的语义分值,或编辑用于预览图像的自动编成的一个语义码。
根据上述独特的观点从正规版图像编成预览图像的工作可以被视作一个文学作品的准备工作。因而,在本发明中,具有这样一种功能的被提取图像编成设备被称作编辑工具或编辑设备。此外,具有编辑语义码的功能的图像信息编辑设备作为广义的编辑工具或编辑设备来处理,其中语义码使得能够根据一个独特视点从正规版图像生成预览图像。
在对实施例进行说明之前,首先对技术术语进行定义和解释。
镜头是连续动态图像的最小单位,相当于电影的一个拍摄镜头。
场景是几个镜头的集合,是构成一个故事的各个语义的单位。
记录位置信息是这样一种信息,它指示关于记录媒体上记录的场景和镜头的在记录媒体上的记录位置。它包括与记录位置有关的所有信息,比如绝对扇区号,绝对轨道号,时间码,绝对记录号等。
图像的语义评估是对故事进程产生影响的视频图像(video)的评估。语义评估由一个评估者产生或者根据一个预定标准自动产生。该评估的评估值被提供作为该图像的语义评估信息。因此,在本发明中,图像的语义评估信息作为一个“规定条件”来处理。
图像的语义评估信息通常为每个场景提供,它也可为每个镜头提供。
有关图像特征的评估是关于图像特征的评估,例如有关有/无演员台词和特殊音效,比如大音响效果的评估。该评估中的评估值作为图像特征的评估信息来提供。
该评估由一个评估者产生,或者其评估值根据一个预定标准自动计算。或者,评估者确认单个或多个图像特征项目的有/无,并且以作为一个规定条件的有/无信息为依据自动计算该评估值。
尽管有关图像特征的评估信息通常是为每个镜头设置的,但也可以为每个场景而设置。
正规版图像是构成每个图像片目的多个场景和镜头的集合(例如,一个广播节目或一个电影/戏剧),并以图像片目的开始到结束的时间宽度形成。经广播节目或网络分配的图像片目,或者在盒式录像带或光盘那样的封装记录媒体上记录并提供的图像片目通常由这样的正规版图像构成。
预览图像是相应于此目的的诸如摘要的短图像,其含有从正规版图像中提取的部分。因此,在正规版图像中包含与构成预览图像的图像相同的图像。因此,如果存在各种目的,就存在各种模式。
这样的模式可以是概要模式,精彩片段(highlight)模式和面向演员模式等。
预览图像至少包括通过从构成正规版图像的场景和镜头中提取并连接该场景和镜头而形成的图像,如此使图像的语义评估值和/或有关图像特征的评估值满足预定的条件。因此,可以通过仅连接从正规版图像中提取的场景,或者通过仅连接从正规版图像中提取的镜头,或者仅连接从正规版图像中提取的镜头和场景,构成预览图像。
两步法筛选是与预览图像的编成有关的技术。作为第一步筛选,仅从正规版图像提取以下场景,使作为规定条件的每个场景的图像的语义评估值满足一个预定条件。作为第二步筛选,从被提取的场景中提取以下镜头,使有关图像特征的评估值满足一个预定条件,并且连接被提取的镜头以编成预览图像。
因此,一般地,被提取的场景和合适的镜头根据预览图像的模式而变化。
预览图像规则是根据预览模式和时间长度来选择和指定要从正规版图像中提取的图像的规则。
语义分值是表格形式的信息,其中作为规定条件的语义评估值(场景分值)与构成图像片目的正规版图像的所有场景相关联,而有关图像特征(镜头分值)的评估值则与所有的镜头或至少一部分镜头相关联,其中这些信息片段与至少每个场景和每个镜头的记录位置信息或时间经历信息(时间码)相关联并且被记录为各个项目。此外,每个场景和每个镜头的各种属性被记录在该表中。
根据语义分值(score)的内容,从正规版图像中提取相应的场景,并从被提取的场景中选择并连接多个镜头,以便编成预览图像。
语义分值是一种正规版图像的元信息。它提供一个有效率的数据码(语义码),用于实现正规版本的压缩图像的编辑和自动制作、观众终端的预览图像的自动制作、和在感觉上表达故事进程的交互式浏览器的生成。
语义码是代码形式的信息,是通过选择语义分值的所有项目的至少一部分并对其内容编码构成的。因此,在语义码中,例如,被选择场景中的选用镜头的记录位置信息或时间经历信息和有关图像的评估结果被描述为相应的代码。
这样的一个语义码被编辑作为每个图像节目信息相关的信息,也就是,被编辑为元信息,并且提供一个高效的数据吗,用于在观众的终端实现预览图像的自动制作和实现在感觉上表达故事进程的交互式浏览器。例如,以语义码为基础,提取和连接正规版图像的相应镜头,以形成预览图像。
为便于描述,本发明所述的图像信号包括一个有关动态图像的信号和一个有关声音的信号。
下面将结合附图说明本发明的优选实施例。下面的实施例是优选实列的一部分,用于描述本发明的基本结构和效果,因此包括适合技术配置的各种限制。此外,本发明的范围不局限于这些实施例,除非另有说明。
图1是图示说明本发明一个被提取图像编成方法的一个实施例处理的示例性示意图。图2是续图1的示例性示意图。
图3是图示说明本发明的被提取图像编成的每个过程的概念图。
图4示出了在语义分值编成过程中产生工作结果的一个实例。
图5示出了在一个镜头分值准备过程中的一个实例。
图6示出了在本发明方法的一个场景分值准备过程中的另一个实例。
在图6中,作为一个演员模式实例,着重描述了出现演员(Tina)的一个镜头;
图7是显示根据本发明方法编成的一个说明性语义分值的一个示例性示图。
以下,采用图1和2并适当参照图3到7描述本实施例的提取的图像编成方法的每个处理过程。
如图1所示,处理一开始,就进入设置一个初始值和一个参数的处理。
当在一个过程Pr1中输入图像压缩参数的初始值时,预置参数的默认值DT1根据一个过程Pr2中的输入值来更新。
图像压缩是提取正规版图像的一部分并编成一个短图像特别是一个预览图像的处理。其参数包括:已编成的短图像的一个所需图像时间(例如,60秒);一个场景评估值(或场景分值)的阈值,作为从正规版图像中提取场景的标准;一个主要演员(例如,演员A1,A2,A3等)的名单;一个主峰(mainpeak)的条件(例如,峰隙≥0.8);图像特征的加权系数(例如,系数W1=3至W8=1,下文描述);剪辑秒数;剪辑位置。
例如,在从2小时的电影中制作1至2分钟的提要图像的情况下,正规版本的镜头和场景在时间上过长,因此不能用来制作许多剪辑。大多数商业预览使用1秒钟或至多2至3秒钟的剪辑(cut)。通常,镜头的开头经常包括说明性或介绍性图像(video),结尾部分经常包括印象最深刻的一个问题的提出或解决。因此,作为从镜头和场景中自动提取一个提要图像的算法,它能有效的从结尾剪切一部分规定秒数。
因此,在本发明中,作为要从镜头或场景图像上剪切的图像的规定剪辑秒数、把位于峰顶的场景阈值、到该峰顶的上升斜率阈值、和从该峰顶下降斜率的阈值、或者正场景分值的阈值和具有负场景分值的阈值被指定为不同的秒数的时间。
场景评估(评分)方法是图像语义评估方法。例如,代表故事复杂性的一个场景具有(+)值,代表平静的场景具有(-)值,用绝对值0.1-1.0的10级代表等级。复杂性是指一个新问题的发生,从而导致引发角色心理的复杂活动。平静是指问题的解决,从而导致人物心理的释放和宣泄。
下面将更详细的说明场景分值的阈值。大多数电影和电视节目的预览是展现代表诸如一个问题的发生和一个新情况或新人物关系的发展以吸引观众的场景,而不展现表示诸如问题的解决和结束的平静的场景。因此,作为场景选择的默认阈值,反映一个复杂场景的场景评估值F(+)被设置为≥0.6,反映一个平静场景的场景评估值F(-)被设置为≤-0.8。
在电影或电视节目的情况下,故事的情形说明或戏剧的开头被随意地设置在介绍部分中。因此,介绍部分的默认阈值下降0.1点,使得反映复杂场景的场景评估值F(+)被设为F(+)≥0.5,而反映一个平静场景的场景评估值F(-)被设为≤-0.7。
以这种方式,可以在图像提取处理执行之前,把所需参数设置在过程Pr2中。这些参数的修改或更新可以由编成操作的进行而进行,下文进行说明。
在后续处理Pr3中,选择一个压缩模式。该压缩模式是这样一种模式,把按照上述提取所编成的一个短片,特别是一个预览图像编成为具有相应于此目的的一个结构。有概况模式、精彩片段模式、演员模式等。
当选择模式时,在后续处理Pr4中设置适于该模式的规则。该规则在相应于上述两步筛选的两个步骤中进行。第一步骤包括一个选择要从正规版图像中提取的场景的一个条件,第二步骤包括选择构成每个被提取场景的多个镜头之一的一个条件。这些规则对每个模式设定。这些规则的更新可以通过编成操作的进行来进行,稍后将进行说明。
下面将说明这些规则。概要规则是按故事的模式而设置的,以便于容易地理解其故事概要。为实现该规则,作为用于选择要提取的场景的条件,在介绍部分(US1)中选择相应于场景评估值F(+)≥0.5的复杂场景和相应于阈值F(-)≤-0.7的平静场景。在后续部分中选择相应于场景评估值F(+)≥0.6的复杂场景和相应于阈值F(-)≤-0.8的平静场景。
作为根据概要规则选择镜头的一个条件,下式被用作作为其标准的一个镜头分值Sht。Sht=3×A+2×B+2×C+2×D+E+F+G+H
A至B是下面将要说明的项。与A至H相乘的系数是上述的用于图象特征的加权系数W1至W8。
因而选择具有最大镜头分值的一个镜头,或者根据稍后将要说明的子规则选择一个镜头。
精彩片段规则是为处理主要包括一段情节高潮的精彩片段图像的一个模式而设置的。为实现该规则,情节Ep的数值被用作从谷底到峰顶的场景分值积分值的一个上升值;并且,从Ep的第一等级的Ep1、第二等级的Ep2、第三等级的Ep3的上升斜率所包含的所有场景和紧随其后的一个场景,和面向最后峰顶(Pz)的上升斜率(Usz)所含有的所有场景和紧随其后的一个场景中,选择相应于场景评估值F(+)≥0.7的复杂场景和相当于阈值F(-)≤-0.8的平静场景。如果Usz被包含在Ep1、Ep2、Ep3中,则增加Ep4,以执行相似的处理。
作为选择镜头的一个条件,下式被用作作为其标准的一个镜头分值Sht。
Sht=3×A+2×B+2×C+2×D+E+F+G+H
因而选择具有最大镜头分值Sht的一个镜头,或者根据稍后将要说明的子规则选择一个镜头。
演员规则是为关注主要演员的一个模式设置的。例如,多至三个男演员/女演员可以被指定为主要演员,如果被指定的主要演员是A1,则介绍部分和一般部分中为场景提取而设置的上述阈值适用于场景选择。作为用于镜头选择标准的一个镜头分值Sh,使用下式。
Sht=3×A1+2×B+2×C+2×D+E+F+G+H
在此方式中,只有演员A1出现的镜头被加权(W1=3),其他主要演员被视作普通演员(W1=1)。因而选择具有最大镜头分值Sht的一个镜头,或者根据稍后将要说明的子规则选择一个镜头。
对于在少数场景中出现的主要演员,该阈值降低0.1。
上述的初始设置一经完成,即开始处理。
处理Pr5和后续处理是镜头和场景的自动决定处理。在图1所示的本实施例中,利用了自动执行镜头定界的一个自动分解方法。然而,本发明不局限于这种方法,操作者任意设置所需的镜头分解的定界也是可行的。
自动检测处理开始于处理Pr5,并且在处理Pr6中,从正规版图像数据(根据MPEG1或MPEG2标准)中自动检测镜头。在处理Pr7中,依据检测的结果产生镜头索引表。镜头号和该镜头的起点和终点被存储在该镜头索引表中。
作为进入镜头的图像片目的自动分解的工具,例如应用MPEG图像处理的应用软件Slipclip可以被利用。通过例如使用该软件处理95分钟电影片目“MASK(变脸)”,可以获得如图3和图4所示的1274个镜头(索引)。
在后续处理Pr8中,执行场景的自动检测。在该处理中,几个作为上述自动分解结果生成的连续场景被组合成一个场景。场景索引表在处理Pr9中产生。相应于时间码,将场景编号、该场景起点的镜头编号和场景终点的镜头编号存储到该场景索引表中。
对于该场景分解,通过在用上述的Slipclip观看图像时根据故事的语义设置标志,可以组合多个镜头以编成一个场景。在电影片目“MASK”的实例中,1274个镜头可以被聚合成图3和图4所示的150个场景。
当上述的镜头和场景分解完成时,决定每个场景评估值,即场景分值的场景评估值处理,在处理Pr10和后续处理中执行。
在处理Pr10的处理之前,操作者使用与故事的语义重要性相适应的特定等级(例如20个等级)来对每个场景评分,并作为规定条件输入评分的结果。
操作者执行这样的场景评分方法时,可以利用Freitak技术。根据该技术,如果场景的语义趋向复杂,则该分值有符号(+);如果场景的语义趋向平静,则该场景有符号(-)。复杂和平静的级别被分别分成10个等级,并且总共使用21个等级来进委评分,即,-1.0至0.0和0.0至+1.0。观看图像的操作者依据信息方面和心理方面这两个方面的因素,来执行复杂和平静的评估,其中,信息方面是有关指新问题出现和该问题解决的信息,心理方面是指由于复杂而导致心理紧张以及因平静而导致心理放松或宣泄。
评分和评估可以通过其他技术执行。
当在处理Pr10中上述评分结果作为规定条件从外部输入时,它被用作在处理Pr11中的相应场景的场景分值。由此编成场景分值表(图4)。在该场景分值表中,相对地存储每个场景编号和每个场景的场景分值。
场景分值被如此编成时,处理移到图2,在处理Pr12中完成图像特征曲线图和关联数据的产生。
首先,参照场景分值表计算场景分值的积分值以及场景的转换。假设第n个场景的场景分值是Sc(n),则第n个场景的场景分值的积分值F(n)用下列递推公式表示。
F(n)=Sc(n)+F(n-1)
在该公式中,F(n-1)是直到场景(n-1)的场景分值的积分值。积分值F(n)的变换用图4中的数值显示。
通过用代表场景编号的横坐标和代表积分值的纵坐标绘制该变换,在图3中得到分段图形表示的图像变换特征区域。该图形对掌握故事的结构和提取有用场景是有用的。此外,横坐标可以是时间轴(场景终点的时间码)。
基于该图象变换特征曲线图,可以执行主峰和谷的计算、从谷到峰的上升值的计算、包含上升斜面和下降斜面的主斜面的计算以及被选择场景的显示。
根据预定规则,主峰和主谷从曲线图的细微峰和谷中提取。
为了计算主峰和谷,在执行上述初始设置时加入间隙值(峰/谷间隙值)G。
对于上升斜面和下降斜面,间隙值G通常具有相同的绝对值。例如,对于上升斜面和下降斜面,默认值被设置为G=0.8。
下面对该默认值进行描述。
主峰Pi(i=1,2,3,……)定义如下:对于作为一个节点的相应场景中的积分值,如果与前一个谷的积分值相比具有0.8点的积分值的上升并且其后的相应场景的下降斜面表明具有-0.8点间隙的下降(也就是,间隙的绝对值达到0.8点),则该节点被视为主峰Pi。
对于第一顶点P1,前一个谷是起始点。起始点的积分值为0。
主谷Vi(i=1,2,3,……)定义如下:对于作为一个节点的相应场景中的积分值,如果与前一个峰的积分值相比具有-0.8点的积分值的下降,并且其后的相应场景的上升斜面表明具有0.8点间隙的上升,则该节点被视为主谷Vi。起始点为Vo。
还可以为上升斜面和下降斜面分别设置间隙,例如,对于上升斜面,G=0.6,对于下降斜面,G=-0.8。
以此方式,主峰P(i)和主谷V(i)按照图3所示的时间顺序被排列为V0、P1、V1、P2、V2、……Pn、Vn。依据峰和谷的走向,可以对故事的发生(起)、发展(承)(包括多个情节)、变化(转)和结论(结)进行分类。
从V(n-1)到Pn的上升斜面被称作USn(上升斜面n),从Pn到Vn的下降斜面被称作DSn(下降斜面n)。
构成故事的情节被视为由峰Pn之前和之后提供的上升斜面Usn和下降斜面DSn组成。情节Ep的数值由下式表示。
Ep=Ypn-YV(n-1)
在此式中,YV(n-1)是V(n-1)处的场景分值的增加值F(n-1),Ypn是P(n)处的场景分值的增加值F(n),其中V(n-1)是当前峰之前的谷,P(n)是当前峰。
然后,判定主要斜面,从具有最大上升值的上升斜面排列各个主要上升斜面。从具有最大下降值绝对值的下降斜面排列主要下降斜面。
作为示例性默认值,简介、发展、变化和结论被认为如下。
发生:US1(第一情节的上升斜面)
发展:DS1至DS(z-1),具有代表最终情节的下降斜面的DSz
变化:USz(最终情节的上升斜面)
结论:DSz(最终情节的下降斜面)
这样自动检测的发生、发展、变化和结束可以由编成者随意地修改,以便使发生、发展、变化和结论适合于目的和效果。图3所示的发生、发展、变化和结论是在编成者基于自动检测的发生、发展、变化和结论进行定界和调整时生成的。
在处理Pr13和后续处理中,选择要提取的场景。根据上述的曲线图、数据和场景分值,提取满足场景提取条件的场景,例如到达阈值的场景,并对适用的场景设置一个标志。
作为阈值,像上述的发生部分(US1)那样利用反映复杂性的场景评估值F(+)≥0.5和反映平静的的场景评估值F(-)≤-0.7,以及在除发生部分(US1)的部分中利用反映复杂性的场景评估值F(+)≥0.6和反映平静的的场景评估值F(-)≤-0.8。
为峰与邻近谷之间的每个区域设置不同阈值也是可能的。也就是,可以为每个峰号和为每个谷号设置一个阈值,或可以为每个上升斜面和为每个下降斜面设置一个阈值。
此外,可以相应于从谷到邻近峰的上升斜面或者从峰到邻近谷的下降斜面设置阈值。
通常,根据图像的语义转换设置的和作为规定条件提供的具有反映平静的负场景评估值的一个场景的感染力(impact),低于与该负场景评估值绝对值相同的具有反映复杂性的正场景评估值的一个场景的感染力,因此,最好把为反映平静的场景评估值而使用的阈值的绝对值设置为大于为反映复杂性的场景评估值而使用的阈值的绝对值。
如果仅把高分值和具有高的镜头分值的场景或峰的图像提取和组合为一个概要图像,强感染力的剪辑则处于并列的地位,以致生成不可预料的蒙太奇(montage)效果,从而产生可能造成误解的视频图像流。为了避免这种情况,自然流的概述图像可以通过从基本上对应于情节的转折点的谷提取和添加低分值的场景来产生。
从一个谷到另一个谷,相关联的图像连续为一个情节。因此,好的蒙太奇效果经常可以通过高密度的连续图像获得,它是满足下列条件的镜头:
A:主要演员出现;
B:有台词;
C:加强喊叫、大声、爆炸声和其它声音效果;
D:角色是半身镜头。
因而,在本发明中,具有不高于阈值的绝对值的一个语义分值并且不包含特定图像特征的一个镜头从一个谷的场景或一个最接近于该谷的场景(在距该谷的相同距离上,优先使用上升斜面上的场景)中提取,并且按照正规编辑的时间顺序进行组装。
语义分值是用于检索和浏览各种概要图像的重要元信息和正规版图像的重要部分。其分值由熟知其内容的各个人给出。然而,为了产生更可靠的数据,理想的情况是从多个评评估者产生的评估值中求出代表该内容的一个总分值。所述的多个评估者可以是制作该内容的一组人,或者可以是代表观众的一组特定监视器。
故事复杂场景的语义分值是正值,故事平静场景的语义分值是负值,它们具有由数值0至1.0表示的等级。因此,在具有不同符号的语义分值的情况下,甚至对具有最大绝对值场景其简单平均值也接近0,不能正确地反映场景的感染力。
因而,总场景分值依据多个场景分值生成。通过平均绝对值求得其值大小,并且按样值的符号的多数原则确定其符号。
具体地,如果存在多组有效场景分值,则总场景分值大小被定义为
( Σ i = 1 n ABS ( Si ) ) / n
其中,n代表样值数目,S代表每个样值的场景分值。
总场景分值的符号按照n个样值的符号的多数原则确定。
如果两个符号的数目相等,则正的一组数值的总和与负的一组数值的总和进行比较,并且较大总和的符号被用作总场景分值的符号。
如果两个总和相等,则总场景标志为0。
在同一时间通过简单平均来判定量值和符号以及通过考虑离散量来判定待提取的场景也是可以的。然而,在这种情况下,代表场景分值的积分值的语义曲线图的形状变形,因而妨碍了峰值的检测。
此外,例如,在图像转换的“变化”和“结束”中,故事的分值,也就是,像侦探故事中的真实罪犯的披露那样的场景被显示。这些场景一般具有大场景分值,因此很可能是提取的候选场景。然而,由于在预览图像中披露这些场景将极大的减小观众观看正规版图像的意愿,因此最好有意地排除这种核心的场景。
因此,在“变化”和“结论”部分,最好改变或调整参数以进一步限制阈值,或者分别检查待提取的场景的适合性。
当根据参数和规则自动选择待提取的场景时,这些被提取的场景可以自动地在图3的曲线图上显示,具有用垂直线在提取的场景上进行的加重和修改。
因而被提取的场景通过上述的处理选定。
然后,在处理Pr17和后续处理中,对于这些被提取的场景的每一个,选择待应用的镜头。
在处理Pr17的处理之前,在处理Pr15中,由操作员检查每个镜头是否具有每个图像特征项目,然后,将检查结果作为规定条件输入给处理Pr16。
下面说明由操作者进行的这种项目检查的一个实例。
就每个镜头的图像特征项目而言,使用了下列的项目A至H。
A:主要演员出现(先前选择的任一个主角和配角男演员/女演员A1、A2、A3出现),加权的默认值=3
B:有台词。加权的默认值+2
C:喊叫、大声、爆炸声和其他声音效果被加重。加权的默认值=2
D:背景音乐变得激昂。加权的默认值=2
E:有其他演员。加权的默认值=1
F:人物是半身镜头或更大镜头。加权的默认值=1
G:有强烈的屏幕变化。加权的默认值=1
H:有特殊的画面效果,比如SFX(特技)或闪光。加权的默认值=1
在上述的工作被人工执行的情况下,图像特征的有/无用1或0评分,然后写入电子表格(spreadsheet)软件中事先准备的一个模板上,而通过上述Slipclip观看图像。以这种方式,为所有的构成所提取场景的镜头检查有助于图像效果的项目A至H的有/无,并且作为一个规定条件从外部输入关于有/无的信息。
在处理Pr16中,以提供的检查结果为基础准备图5和图6所示的表,并且为每个镜头计算镜头分值。
图5示出了根据概要(outline)模式选择的场景的示例性镜头分值。图6示出了与演员模式相符的示例性镜头分值。在图中,主要演员(Tina)出现的镜头由网格加重。
通过用相应于项目A至H的有/无信息的提供的加权系数W1至W8乘以图像特征,可以获得镜头分值,然后对相乘结果求积分。
例如,在概要预览的情况下,通过下式计算镜头分值Shc。
Shc=3×A+2×B+2×C+2×D+E+F+G+H
在处理Pr16中执行的项目A至H的确认和镜头分值Shc的计算可以使用微计算机的逻辑处理功能自动完成,通过读出事先准备的图5和图6所示的表和相应的加权系数W1至W8,然后使该表和加权系数相互对应,从而完成算法处理。
在上述方式中,每个镜头的镜头分值被产生。
在上述说明中,依据正规版图像为每个镜头的项目A至H的有/无而作的评分由操作者完成,并且作为提供条件从外部输入。然而。本发明不限于此,它还能够自动地为项目的有/无作评分。
例如,通过从正规版图像的声频通道中自动检测不低于一个阈值的声音大小的生成,可以自动地为项目A的有/无即主要演员是否出现;以及项目B的有/无,即是否有台词,作评分,其中事先选择的主角和配角男演员/女演员A1、A2、A3的台词声音被独立的记录。
可以容易地准备这种记录,特别是在用于外国电影的替身演员和配音(对口型)方面。
类似的,通过从声频通道中自动检测不低于一个阈值的声音大小的生成,可以自动地为项目C的有/无,即是否加重声音效果,作评分。
此外,通过图像识别技术能够进行特定图像效果有/无的自动识别和评估。
因此,本实施例中的处理Pr15不仅包括外部操作者的提供条件的输入,而且还包括对项目自动执行评分。在本实施例中,处理Pr16中的镜头分值计算处理是使用上述的微计算机的逻辑处理功能来自动执行的。
就效率而言最好情况是,在按照上述方式选择场景之后,执行从检验每个镜头是否有每个图像特征项目的处理到镜头分值计算处理这样的上述处理。然而,本发明不限于此,本发明还能够同时完成这些处理,或者在场景评估处理之前完成这些处理。在这种情况下,大量的镜头成为处理对象。
在后续处理Pr17A中,进行最佳镜头的自动计算。该自动计算中所利用的计算规则是第二条件。
作为被利用的计算规则,自动地检索每个被提取场景中的每个镜头的分值,把具有最高镜头分值的镜头称作最佳镜头。作为子规则,如果存在具有相同分值的镜头,则利用较早的镜头。如果没有获得镜头分值,则利用场景的前导镜头。
在使用微计算机的逻辑处理功能自动执行该处理时,场景中的第一镜头的镜头编号和镜头分值被存储到一个缓冲存储器中。即使镜头分值具有0的值,也进行类似的存储。
然后,读出第二镜头的镜头分值,与缓冲存储器中存储的镜头的镜头分值进行比较。如果第二镜头的镜头分值高于缓冲存储器中存储的镜头分值,则用第二镜头的镜头编号和镜头分值更新缓冲存储器的内容。
另一方面,如果包含0值的第二镜头的镜头分值等于或低于缓冲存储器中存储的镜头分值,则不更新缓冲存储器的内容。因而通过执行检索和比较场景中的所有镜头,将最佳镜头存储在缓冲存储器中。
作为另一个子规则,它能够按照从场景的最高镜头分值的镜头开始的顺序自动地取出指定数量的镜头,和按照预定的秒数(例如,每个镜头两秒钟)的时间顺序自动地安排这些镜头。
在后续处理Pr17B中,执行用一个特定区间片段对一个最佳镜头区间的过滤处理。
具体地说,在处理Pr17B中,处理Pr17A中提取的镜头或场景的时间分别由片段信息过滤,该片段信息指示另外预先确定的一个特定区间,从而提取压缩的概要图像。
作为片段信息,指示台词存在的一个部分的图像段落的信息,可有效地通过图像信号分析或图像分析进行检测,用于检测图像字幕部分。这样,就能够从重要镜头中仅提取一个特别有效的部分作为一个概要图像。在镜头的图像特征评估处理中可以自动检测或人工指定该片段信息。对于采用声频信号分析进行的台词部分的检测,可以利用日本待审专利申请第H10-301593中公开的区分非图像区间与图像区间的技术或者日本待审专利申请公开H11-119796中公开的从背景噪声区间精确判别声频信号区间而不考虑背景噪声电平的技术。或者,可以把片段信息理解为在一个完全不同的处理中获得的提供条件信息。
当接上述方式选择关于每个被提取场景的最佳镜头时,在处理Pr18中完成压缩图像数据的计算。所计算的值是被压缩图像镜头的数量、压缩图像的总时间和平均镜头时间。
在后续处理Pr19中,自动调整被压缩图像的总时间。
如果被压缩图像的总时间超过上述的指定预期图像时间,则按照从负侧到正侧的顺序在绝对值上自动地限制阈值0.1个点,包括对发生部分的限制。然后,按照从DS1开始的较小时间码的镜头的顺序排除不适用的镜头,以便重新计算总时间。总时间被连续地减少,直至到达规定的时间。最后,排除US1中的镜头并自动调整时间。
此外,在该处理中,删除或调整由上述自动编成所编成的镜头中的明显不适合于所述目的的镜头。
通过重复前述处理,完成自动调整,直至被压缩图像的的总时间与所需图像时间相匹配。从而确定了适用镜头。
随后,在处理Pr20中,执行每个数据的最终检验和确定该数据。前述处理中所选择的各种数据被编成为语义分值。
图7示出了如此编成的示例性语义分值。如图7所示,每个镜头或每个场景(由时间码表示)的定界、图像语义评估值(场景分值)、图像特征评估值(镜头分值)、每个男演员/女演员出现(由细线表示)的镜头、台词出现的镜头(用粗线表示)、关键字出现的镜头、声音效果、和图像效果被记录,并且在场景的转换期间相互关联。
随后,在处理Pr12中,根据按上述方式确定的适用镜头的时间码,从正规版图像数据DT2中连续剪辑和复制适用镜头的图像,从而制作压缩的图像数据DT3。
最后,在处理Pr22中,组装压缩的图像数据DT3,以编成预览图像。剪辑顺序基本上是沿正规版图像的时间顺序。
为了用视觉确认和检验为每个预览模式选择的场景,可以在分段的曲线图上加重被选择的场景。在这种情况下,所选场景的数目、总时同和平均场景时间被显示为关联数据。
组装的预览图像被记录并保存到记录单元,比如硬盘。需要时,可以取出预览图像并在适当的媒介上利用该预览图像。
根据本实施例的方法,可以容易地和有效地制作场景分值和镜头分值。此外,由于可以在确认故事的配置和图像特征曲线图上的预览场景的位置时候编辑预览图像,因此可以容易地制作把握整个故事的恰当预览图像。
此外,由于第一步筛选通过场景选择完成,以及包括镜头分值检查的第二步筛选仅仅是关于筛选场景中的镜头,因此减少了算法处理的次数,从而能够快速处理。
通过选择压缩模式,即选择相应于所需模式的预览编成规则,可以容易地制作相应于所述目的的预览图像,比如概要、精彩场面或主要演员。
此外,根据本实施例,在非初始设置的时间,通过在编成期间改变、更新或修改参数和规则,可以完成压缩图像的时间调整和适于片目风格特征的预览图像的制作,从而能够进行灵活制作。
下面说明本发明的图像信息编辑方法的实施例。
图9是图示说明本实施例的图像信息编辑方法的基本部分的处理的示意图。
该图像信息编辑方法的特征在于记录和保存语义分值。该方法包括处理Pr1至Pr19以及处理Pr20’。
处理Pr1至Pr19与上述的图1和图2所示的实施例的处理相同,因此将不进行详细说明。
在处理Pr20’中,将处理Pr20’之前的处理中生成或使用的、对外部输入信号采样而获得的数据以及各种识别或选择数据,按照图7所示的相互关联的语义分值以表形式进行编成,并记录和保存这些数据。所述数据被记录和保存到磁盘或类似物中。
记录和保存的语义分值能够在任意时间读出,并且还能够向外提供该语义分值。
因而,该语义分值可以在任何时间点读出,而且还可以把该语义分值仅仅用于语义分值。
下面将说明本发明的图像信息编辑方法的另一个实施例。
图10是图示说明该实施例的图像信息编辑方法的基本部分的处理的示例性示图。该图像信息编辑方法的特征在于语义分值的编成、输出以及记录/保存。该方法包括处理Pr1至Pr19以及处理Pr20”。
处理Pr1至Pr19与上述的图1和图2所示的实施例的处理相同,因此将不进行详细说明。
在处理Pr20”中,将只从处理Pr20”之前的处理中生成或使用的、对外部输入信号采样而获得的数据以及各种识别或选择的数据中,取出编成预览图像所需要的数据,并进行编码。从而编成了语义码。
在语义码中,例如,如图8所示,诸如仅与被提取场景有关的图像语义评估值(场景分值)以及图像特征评估值(镜头分值)的数据、时间码的定界、每个男演员/女演员出现的镜头以及仅与适用镜头有关的关键字出现的镜头,在场景转换期间相互关联并且被编码。
能够在任何时间点向外部输出和供应该语义码。此外,通过将语义码记录和保存到适当的记录装置上,就能够在任何时间点读出该语义。
因而,可以在任何时间点输出语义码,并且仅仅为语义码的使用而读出该语义码。
图11是显示本发明的被提取图像编成设备的一个实施例结构的方框图。图12示出了基于该设备的图像转换特征表在屏幕上所显示的一个示例性图像转换特征曲线图。
如图11所示,本实施例的被提取图像编成设备Athr1是一个与外部记录媒介再现单元VP连接的编辑设备。被提取图像编成设备Athr1具有:诸如微计算机的一个中央处理单元CPU;输入装置Prg11和显示编成装置Prg7,它可由中央处理单元CPU阅读和执行,并且为只读用而安装在混合半导体存储器中;一个由只读存储器ROM构成的记录媒介2,其中存有中央处理单元CPU可读和可执行的程序;一个由DRAM的半导体存储器构成的临时存储单元;一个用于屏幕显示的监视器单元Mnt;和一个能够读写已经构成的预览图像信号的图像记录单元VR。此外,还设有图中未示出的,用于整个设备的控制电路、电源电路和输入/输出端子。
输入装置Prg11具有镜头/场景定界输入装置Ip1,图像语义评估值输入装置Ip2,场景指定输入装置Ip3,参数设置装置Ip4,预览图像编成规则设置装置Ip5,和图像特征评估值输入装置Ip6。
记录媒介2以非易失性半导体存储器那样的一个单芯片结构构成。记录媒体2具有镜头索引表编成装置Prg1,场景索引表编成装置Prg2,场景分值表编成装置Prg3,图像转换特征编成装置Prg4,适用场景提取装置Prg5,镜头分值编成和镜头提取装置Prg6,预览图像时间调整装置Prg8,和预览图像编成装置Prg9,它们都是计算机运行程序。
通过运行上述的每个程序,在临时存储单元3中产生镜头索引表Tab1,场景索引表Tab2,场景分值表Tab3,图像转换特征表Tab4,被提取场景表Tab5,和提取镜头表6。
显示编成装置Prg7也是计算机运行程序,但被安装在与记录媒介2不同的一个芯片上。该芯片具有在其上安装的显示编成装置Prg7,还具有用于监视单元Mnt的驱动电路。
图像记录单元VR适于按照一个可复制的方式把图像信号记录在带状或盘状磁记录媒介或光记录媒介上。
镜头/场景定界输入装置Ip1接收一个镜头/场景定界指令i1,并把该定界指令发送给镜头索引表编成装置Prg1和场景索引表编成装置Prg2。镜头/场景定界指令i1可以像先前实施例那样被自动输入,也可以人工输入。
图像语义评估值输入装置Ip2从外部接收一个作为规定条件的图像语义评估值i2,并把该评估值发送给场景分值表编成装置Prg3。
场景指定输入装置Ip3接收一个场景指定值输入值i3,并把场景指定信息发送给场景分值表编成装置Prg3。
参数设置装置Ip4接收参数设置值i4,并把有关镜头选择的参数发送给适用的场景提取装置Prg5,把有关镜头选择的参数发送给镜头分值编成和镜头提取装置Prg6,把预览图像时间设置值发送给预览时间调整装置Prg8。
预览图像编成规则设置装置Ip5接收用于每个模式的预览图像编成规则指令i5,并把有关场景选择的规则发送给适用的场景提取装置Prg5,把有关镜头选择的规则发送给镜头分值编成和镜头提取装置Prg6。预览图像编成规则设置装置Ip5还从预览图像时间调整装置Prg8接收规则调整指令。该规则调整反映在发送给适用的场景提取装置Prg5以及镜头分值编成和镜头提取装置Prg6的图像编成规则上。
图像特征评估值输入装置Ip6接收有关图像特征评估值或评估的信息i6,并把该信息发送给镜头分值编成和镜头提取装置Prg6。举例来说,信息i6可以是镜头评估值本身或者是有关镜头评估的图像项目的有/无信息。信息i6可以自动输入也可以人工输入。
下面说明被提取图像编成设备Athr1的操作。
首先,把图像片目分解成若干镜头,和存储定界信息。当操作员在复制来自记录媒介复制单元VP的正规版图像Sg的时候跳过简介部分的片目图像和无用部分的图像,使图像转到应当执行分解为若干镜头的部分时,该操作员操作开关、按钮和按键(图中未示出)生成指令i1,开始分解为若干镜头。此后,每个装置的操作开始于镜头索引表编成装置Prg1。
下面结合附带的流程图说明每个装置的操作。
一旦接收到来自镜头/场景定界输入装置Ip1的镜头定界启动指令(步骤S10),镜头索引表编成装置Prg1就向记录媒体复制单元VP(步骤S11)输出一个启动复制的再现信号Cg,如图13所示。镜头索引表编成装置Prg1从记录媒体再现单元VP接收正规版图像Sg,按镜头定界指令的定时从正规版图像中剪下时间码或类似物(步骤S12)。镜头索引表编成装置Prg1把每个镜头与其时间码之间对应关系的数据存储到镜头索引表Tab1(步骤S13)。
一旦接收到镜头定界结束指令(步骤S14),镜头索引表编成装置Prg1就从记录媒体再现单元VP接收正规版图像Sg,并按镜头定界指令的定时从正规版图像Sg中剪下时间码或类似物(步骤S15)。镜头索引表编成装置Prg1把每个镜头与其时间码之间对应关系的数据存储到镜头索引表Tab1(步骤S16),并向记录媒介再现单元VP输出停止复制的一个控制信号Cg(步骤S17)。
一旦接收到来自镜头/场景定界输入装置Ip1的场景定界启动指令(步骤S20),场景索引表编成装置Prg2就向记录媒体再现单元VP输出一个启动再现的控制信号Cg(步骤S11),如图14所示。场景索引表编成装置Prg2从记录媒体再现单元VP接收正规版图像Sg,并剪下当前地址(即,当前时间码)(步骤S22)。镜头索引表编成装置Prg2从镜头索引表Tab1中接收数据,并参考当前地址确定构成该场景的起点镜头编号(步骤S23),场景索引编成装置Prg2把关于带时间码的镜头数据与该场景之间对应关系的信息存储到场景索引表Tab2(步骤S24)中。
当接收到场景定界结束指令时(步骤S25),场景索引表编成装置Prg2接收正规版图像Sg,并剪下当前地址(即,当前时间码)(步骤S26)。场景索引表编成装置Prg2接受来自镜头索引表Tab1的数据,并确定构成该场景的终点的镜头编号(步骤S27)。场景索引表编成装置Prg2把关于带时间码的镜头数据与该场景之间对应关系的信息存储到场景索引表Tab2中(步骤S28),并向记录媒介复制单元VP输出一个停止复制的控制信号Cg(步骤S29)。
在仅通过场景提取进行预览图像编成的情况下,按场景定界指令的定时将时间码或类似物剪下,并存储到场景索引表Tab2上。
当接收到来自场景指定输入装置Ip3的场景指定信息时(步骤S30),场景分值表编成装置Prg3参考场景索引表Tab2读出指定场景的起点和终点(步骤S31),向记录媒介再现单元VP输出搜索和再现(reproduce)场景的控制信号Cg(步骤S32),如图15所示。完成该场景的再现后(步骤S33),场景分值表编成装置Prg3从图像语义评估值输入装置Ip2接收一个评估值(步骤S34),并把评估值、场景编号和构成场景的镜头信息存储到场景分值表Tab3上(步骤S35)。
图像转换信息特征编成装置Prg4从场景分值表Tab3中读出数据(步骤S40),对场景分值求积分(F值)(步骤S41),计算主峰和谷(步骤S42),计算斜面的上升值(步骤S43),决定主斜面(步骤S44),和把这些数据写入图像转换特征表Tab4(步骤S45),如图16所示。
适用场景提取装置Prg5接收来自参数设置装置Ip4的参数,并从预览图像编成规则设置装置Ip5中接收用于每个模式的预览图像编成规则(步骤S50),如图17所示。适用场景提取装置Prg5随后从场景分值表Tab3或图像转换特征表Tab4中接收数据,并选择待提取的场景(步骤S51)。适用场景提取装置Prg5把场景编号和构成该场景的镜头信息存储到被提取的场景表Tab5中(步骤S52)。
图18示出了镜头分值编成和镜头提取装置Prg6使用两步筛选法进行的操作。
镜头分值编成和镜头提取装置Prg6从参数设置装置Ip4和预览图像编成规则设置装置Ip5中接收参数和有关模式指定的规则以及镜头提取(步骤S61)。根据由接收的规则指定的模式,镜头分值编成和镜头提取装置Prg6从被提取场景表Tab5中接收为该模式提取的场景的数据,然后确认构成该场景的每个镜头(目标镜头),并从镜头索引表Tab1中接收一个目标镜头的起点和终点的时间码数据(步骤S62)。镜头分值编成和镜头提取装置Prg6向记录媒介复制单元VP输出搜索和再现该镜头的控制信号Cg(步骤S63)。完成该镜头的再现后(步骤S64),镜头分值编成和镜头提取装置Prg6编成该镜头的图像特征评估值(步骤S65),执行上述的关于所有目标镜头的处理(步骤S66),从所有目标镜头中选择待提取的镜头(步骤S67),并把带时间码的被提取镜头存储到被提取的镜头表Tab6上(步骤S68)。
在上述的确定镜头的图像特征评估值的操作中,操作员从外部经图像特征评估值输入装置Ip6提供作为输入i6的图像特征评估值本身。如果不是这样,而是如前述实施例那样只从外部提供图像特征项目的有/无信息,则可增加基于该有/无信息计算评估值的步骤。
不同于两步筛选的场景单独处理或镜头单独处理,将在后面说明。
接收到指令正规版图像Sg的显示的一个显示命令Cm时(步骤S70),显示编成装置Prg7从记录媒介复制单元VP接收正规版视像Sg并在监视单元Mnt上显示,如图19所示。
此外,当从其他装置Prg1至Prg6、Prg8和Prg9接收到除图像转换特征表Tab4和被提取场景表Tab5外的各自表的显示命令Cm时,显示编成装置Prg7从表Tab1至Tab3和Tab6中接收数据RG,和在监视单元Mnt上显示数据(步骤S73)。
接收到用于图像转换特征表Tab4的显示命令Cm时(步骤S74),显示编成装置Prg7从图像转换特征表Tab4中接收数据,并把图12所示的图像转换曲线图显示到监视单元Mnt上(步骤S75)。屏幕上显示的数据包括每个场景中的积分场景分值(F值)、主峰(峰和谷),以及主斜面(上升斜面和下降斜面),如图12所示。
接收到用于被提取场景表Tab5的显示命令Cm时(步骤S76),显示编成装置Prg7从被提取场景表Tab5接收相应模式的数据,并在图12所示的图像转换曲线图上修改被提取场景的标志(步骤S77)。在图12中,颜色由不同于曲线图的垂直虚线显示。
预览图像时间调整装置Prg8等待参数设置装置Ip4的预期图像时间的输入,如果有输入,则使用所需图像时间;如果在预定时间周期内没有此输入,则使用默认值作为预期图像时间(步骤S80至S82)。预览图像时间调整装置Prg8从被提取镜头表Tab6中读出相应模式的被提取镜头(步骤S83),从镜头索引表Tab1中读出相应时间码(步骤S84),执行时间积分(步骤S85),和检验该图像是否落入所需图像时间中(步骤S86)。如果该图像未落入所需图像时间,则预览图像时间调整装置Prg8命令参数设置装置Ip4和预览图像编成规则设置装置Ip5分别更新和调整参数和预览图像规则。如果该图像落入预期图像时间内,则预览图像时间调整装置Prg8把具有被提取镜头排序及具有起点和终点的时间码的确定数据输出给预览图像编成装置Prg9(步骤S87)。
预览图像编成装置Prg9从预览图像时间调整装置Prg8中接收确定的数据(步骤S90),如图21所示。根据确定的数据,预览图像编成装置Prg9顺序地向记录媒介复制单元VP发送包括每个镜头起点和终点的时间码的一个控制信号Cg。然后接收从记录媒介复制单元VP再现的正规版图像的提取部分,组合该提取部分以编成预览图像(步骤S91)。预览图像编成装置Prg9把编成的预览图像信号输出和记录到图像记录单元VR上(步骤S92)。
在适用场景提取装置Prg5在步骤S51选择待提取的场景的过程中,提取一个使考虑的场景分值具有达到预定阈值的一个绝对值的场景。从而便于选定一个效果更显著的场景的处理。
对于适用场景提取装置Prg5在步骤S51选择待提取场景的处理中的阈值,可以为一个峰或谷场景与邻近谷或峰场景之间的每个区域确定一个阈值,其中峰场景是这样一种场景:与沿场景转换的每个场景分值的积分值有关的直到被考虑场景的积分值的连续增加超过一个预定的第一间隙值,该场景之后的积分值的连续降低的绝对值超过一个预定的第二间隙值;而凹点场景是这样一种场景:直到被考虑场景的积分值的连续降低超过一个预定的第三间隙值,并且该场景之后的积分值的连续增加的绝对值超过一个预定的第四间隙值。因而,可以为指定模式提取最佳场景。前述实施例中详细说明了为每种模式设置预置的实例。
或者是,对于适用场景提取装置Prg5在步骤S51选择待提取场景的处理中的目标场景,可以根据谷场景与该谷场景之后的邻近峰场景的积分值的增加幅度,或者根据积分值的增加数值的排序,仅考虑位于从前一谷到峰的上升斜面上的场景和该位于顶点之后的下降斜面上的场景。因而,限制了目标场景的数量,从而能够实现有效的选择。
此外,适用场景提取装置Prg5在步骤S51选择待提取场景的处理中的阈值可以根据从谷到邻近峰的上升斜面或从峰到邻近谷的下降斜面来设置。
因此,待提取的场景不是集中在一个特定的部分,而是在整个图像中采用,从而实现了预览图像的场景的平衡提取。
此外,当每个场景分值具有正值或负值时,对于由适用场景提取装置Prg5在步骤S51选择待提取场景的处理中的阈值,由于前述实施例所详细说明的原因,使适用于正场景分值的阈值的绝对值等于或小于适用于负场景分值的阈值的绝对值将是有效的。
在镜头分值编成和镜头提取装置Prg6在步骤S64执行的镜头分值编成的过程中,镜头分值最好加上一个通过对以下每个图像特征项目的预定加权而获得的值,这些图像特征项目至少包括:正规版图像的相应部分中的台词出现、预定大小或更高大小的音量、特定男演员/女演员的出现、或特殊画面效果。
预定加权可以响应目的而改变,因此可以有效地进行适于此模式目的的镜头提取。特别是,通过使用一个比其他项目的加权值高的特定男演员/女演员出现的加权值,可以有效的进行适于演员模式目的的镜头提取。
下面将说明仅使用被提取的场景来编成预览图像的操作。来自记录媒介复制单元VP的正规版图像(video)Sg被再现和输出,并且当操作员想在附在记录媒介再现单元VP的显示单元Mvp或设置在该单元上的监视单元Mnt上观看该图像的时候,把场景定界输入信号i1输入到操作员想要定界为一个场景的位置上。然后响应于此,镜头/场景定界输入装置Ip1向场景索引表编成装置Prg2发送定界命令。在此时刻,场景索引表编成装置Prg2从正规版图像Sg中剪切下时间码和绝对轨道地址(absolute track address),把相应于该定界的时间码和绝对轨道地址存储到场景索引表Tab2上。对整个正规版图像连续执行该操作,于是在完成正规版图像的再现后,在场景索引表Tab2中形成一组把整个正规版图像定界为场景的时间码。
当整体控制装置(未示出)检测到正规版图像Sg的再现结束时,启动场景分值表编成装置Prg3。场景分值表编成装置Prg3使记录媒介再现单元VP参考场景索引表Tab2从第一场景开始按每个场景再现正规版图像。
当操作员观看一个场景的图像并用一个接键输入其语义评估值i2时,该语义评估值i2经图像语义评估值输入装置Ip2输入给场景分值表编成装置Prg3,然后场景分值表编成装置Prg3将语义评估值i2和该场景的时间码一起存储到场景分值表Tab3上。如果操作员想输入或改变一个特定场景的评估值,操作员用按键输入用于该场景的场景指定i3并进一步输入相应场景的被更新的评估值i2。这样,场景指定i3和被更新的评估值i2分别经场景指定输入装置Ip3和图像语义评估值输入装置Ip2发送给场景分值表编成装置Prg3。根据这些指定和评估值,场景表编成装置Prg3更新场景分值表Tab3的内容。
接着,当操作员向参数设置装置Ip4输入作为输入i4的一个所需预览图像时间和关于场景选择的参数,并向预览图像编成规则设置装置Ip5输入作为输入i5的预览图像编成规则时,参数设置装置Ip4零时存储所需预览图像时间并向适用场景提取装置Prg5发送关于场景选择的参数和预览图像编成规则命令。适用场景提取装置Prg5参照场景分值表Tab3中的数据根据参数和规则选择待提取的一个场景,并把提取的场景存储到被提取图像表Tab5中。存储的内容包括时间码。因而,存储了所有待提取的场景。
当适用场景提取装置Prg5完成操作时,整体控制装置启动预览图像时间调整装置PRG8并向参数设置装置Ip4发送一个命令。参数设置装置Ip4把临时存储的预期预览图像时间发送给预览图像时间调整装置Prg8。预览图像时间调整装置Prg8从被提取场景表Tab5中顺序地读出被提取场景的数据P8a并计算被连接的提取场景的图像时间长度。当计算的图像时间长度大于或小于所需预览时间时,将限制或放松规则的修改命令发送给预览图像编成规则设置装置Ip5,或者将限制或放松参数的修改命令发送给参数设置装置Ip4。
以该修改为基础,适用场景提取装置Prg5重新选择待提取的场景和更新被提取场景表Tab5的存储内容。预览图像时间调整装置Prg8从被提取场景表Tab5中顺序地读出已更新的提取场景的数据P8a,并计算连接的所有提取场景的图像时间长度。当重复上述处理时,与预期预览图像时间一致的预览图像的数据被发送给预览图像编成装置Prg9。
预览图像编成装置Prg9控制记录媒介复制单元VP制作和输出正规版图像,并根据预览图像时间调整装置Prg8发送的数据顺序地将相应的被提取场景记录到图像记录单元VP上。从而编成预览图像。
下面将说明仅使用被提取镜头编成预览图像而不是用被提取场景完成上述筛选的操作。
来自记录媒介再现单元VP的正规版图像Sg被再现和输出,并且当操作员在连接记录媒介复制单元VP的显示单元Mvp或设置在该单元上的监视单元Mnt上观看图像的时候,把镜头定界输入信号输入到操作员想要定界为一个镜头的位置上。然后响应于此,镜头/场景定界输入装置Ip1向镜头索引表编成装置Prg1发送定界命令。在此时刻,镜头索引表编成装置Prg1从正规版图像Sg中剪下时间码和绝对轨道地址(absolute track address),把相应于该定界的时间码和绝对轨道地址存储到镜头索引表Tab1上。连续执行关于整个正规版图像连续的该操作,于是在完成正规版图像的再现后,在镜头索引表Tab1中形成一组把整个正规版图像定界为镜头的时间码。
然后,当操作员输入关于镜头分值计算的参数i4时,参数设置装置Ip4向镜头分值编成和镜头提取装置Prg6发送作为数据P6a的参数。当操作员发送关于最佳镜头计算的规则i5时,预览图像编成规则设置装置Ip5向镜头图像编成和镜头提取装置Prg6发送作为数据P6b的规则。镜头分值编成和镜头提取装置Prg6使记录媒介再现单元VP参考镜头索引表Tab1从第一镜头开始逐个镜头再现正规版图像和接收正规版图像Sg。
当操作员观看一个镜头的图像并用一个按键输入其图像评估值i6时,该图像特征评估值i6经图像特征评估值输入装置Ip6输入给镜头分值编成和镜头提取装置Prg6。镜头分值编成和镜头提取装置Prg6根据该评估值计算相应镜头的分值,然后根据镜头分值确定相应镜头是否适用于提取,并把被选择镜头的数据存储到被提取镜头表Tab6上。存储的内容包括包括时间码。为所有镜头执行上述的处理,并存储所有待提取的镜头。
然后,当操作员将作为输入i4的一个所需预览图像时间输入给预览图像时间调整装置Prg8时,预览图像时间调整装置Prg8从被提取镜头表Tab6中读出被提取镜头的数据,并计算连接的所有被提取镜头的图像时间长度。当被计算的图像时间长度大于或小于所需预览图像时间时,将限制或放松规则的修改命令发送给预览图像编成规则设置装置Ip5,或者将限制或放松参数修的改命令发送给参数设置装置Ip4。
以该修改为基础,镜头分值编成和镜头提取装置Prg6再次选择待提取的镜头并更新被提取镜头表Tab6的存储内容。预览图像时间调整装置Prg8从被提取镜头表Tab6中顺序地读出已更新的提取镜头的数据,并计算连接的所有提取镜头的图像时间长度。当重复上述处理时,与所需预览图像时间一致的预览图像的数据被发送给预览图像编成装置Prg9。预览图像编成装置Prg9控制记录媒介复制单元VP制作和输出正规版图像Sg,并根据该数据顺序地将相应的被提取镜头记录到图像记录单元VP上。从而组成预览图像。
记录媒介复制单元VP具有安装在其中或设置在其中的记录媒介,图像信号和关于记录位置或时间码的记录位置信息被一同记录在该记录媒介上,并具有从记录媒介中读出基于记录位置信息或时间码而存取的图像信号以作为再现信号的功能。记录媒介再现单元VP是具有单独微计算机的独立单元。作为这样一种记录媒介,在其上可存取地记录记录位置信息的媒介适合于采用带状或盘状磁记录媒介或光媒介之一。
作为这种记录位置信息,例如在录像带媒介的情况下,关于螺旋磁道或时间码的绝对磁道号被可存取地记录在螺旋磁道或纵向磁道上。在硬磁盘媒介或光盘/磁-光盘媒介的情况下,记录轨迹号或扇区号。这种位置信息在再现时作为当前地址向外输出,并且当从外部进行指定输入时作为目标地址进行搜索以开始再现。
在本实施例中,记录媒介再现单元VP是外部单元。然而,也可以把它设置在被提取图像编成单元Athr1内部。例如,作为具有这样一个设置在其内的记录媒介再现单元的系统中,可以应用以个人计算机为平台的编辑系统,其中设置了DVD加RAM(在重写时间的DVD)。
记录媒介再现单元VP响应从被提取图像编成单元Athr1输入的控制时间,进行再现的启动、停止或暂停。记录媒介复制单元VP还根据包含在控制信号Cg中的目标地址以预定轨迹地址启动再现,并把正规版图像Sg输出给被提取图像的编成单元Athr1。
上述分解为多个镜头的处理包括由人工操作和自动分解的分解。
在再现正规版图像Sg的时候执行由人工操作的分解成多个镜头的处理这里有下述的执行该操作的两种方式。
1、为每个单镜头分解执行用于正规版图像的再现的暂停或停止,并且在下一个单镜头分解的起点再次开始正规版图像的再现。
2、连续地执行正规版图像的再现和连续地执行镜头的定界,而不执行中途的再现暂停或停止。
本实施例利用“1”的单镜头分解。如果对分解为多个镜头同时执行镜头分值的设置,则该单镜头分解是合适的。
如上所述,本实施例的被提取图像编成单元Athr1可以容易地制作语义分值。因此,即便操作员不是专业创作者,该操作员也可以通过简单操作可靠和有效地制作预定等级或更高等级的预览图像。
此外,在应用两步筛选的情况下,可以通过减少数量的操作来编成预览图像,从而实现了有效制作。
此外,通过允许设置各种阈值和反映关于镜头分值的多个不同的图像特征项目,可以编成满足各种目的的预览图像。此外,通过选择模式,可以制作与诸如概要、精彩场面和主要演员预览图像的目的相符的各类预览图像。
此外,通过自动地修改参数和规则,可以使用相同的语义分值自动地执行被编成的预览图像的时间调整,从而允许更灵活的制作。
此外,由于可以在语义曲线图(代表图像转换特征的曲线图)上确认故事配置和被提取场景的位置的时候编辑预览图像,因此能够编成把握了整个故事的合适的预览图像。
下面将结合图22和23说明本发明的图像信息编辑设备的一个实施例。
图22是显示图像信息编辑设备Athr2的结构的方框图,具有编辑、记录和保存语义分值的功能。与前述实施例相同的部分用相同的标号表示,并且不再进行详细说明。
图像信息编辑装置Athr2是与外部记录媒介再现单元VP连接的编辑装置。图像信息编辑装置Athr2具有:一个诸如微计算机的中央处理单元CPU;输入装置Prg11和显示编成装置Prg7,它们可由中央处理单元CPU读取和运行,并且为只读用途安装在一个混合(hybrid)半导体存储器中;一个由像DRAM那样的半导体存储器组成的临时存储单元3;一个用于屏幕显示的监视器单元Mnt;一个能够读写被编辑和编成的语义分值(Semantic score)的图像记录单元VR″。还可以设置连接到数据记录单元VR″的输出端子T1。此外,还设置了整体控制电路和电源电路(未示出)。
记录媒介22以非易失性半导体存储器那样的一个单芯片结构构成。记录媒体22具有镜头索引表编成装置Prg1,场景索引表编成装置Prg2,场景分值表编成装置Prg3,图像转换特征编成装置Prg4,适用场景提取装置Prg5,镜头分值编成和镜头提取装置Prg6,预览图像时间调整装置Prg8,和语义分值记录装置Prg20`,它们都是计算机运行程序。
通过运行上述的每个程序,在临时存储单元3中制作镜头索引表Tab1,场景索引表Tab2,场景分值表Tab3,图像转换特征表Tab4,被提取场景表Tab5,和提取镜头表6。
图23是显示语义分值记录装置20`的操作的流程图。在步骤S100,语义分值记录装置20`等待从预览图像时间调整装置Prg8的预定数据的输入。如果有输入,语义分值记录装置因而确认语义分值数据被确定。如果有不同于该确定数据的必需数据,语义分值记录装置20`从存储在数据索引表Tab1至被提取镜头表Tab6的表内的数据中读出必需的数据D(步骤S102),然后在临时存储器上以表的形式编辑语义分值,并把它记录和保存到数据记录单元VR`。
被编辑的语义分值还可以从输出端子T1输出到外部。
语义分值向外部的输出由语义分值记录装置Prg20`从临时存储器直接进行或者经数据记录单元VR`直接进行。
因而,图22所示的实施例的图像信息编辑装置Athr2编辑、记录和保存这样的语义分值:该语义分值允许通过任意改变选择待提取场景的条件和预览图像制作规则的参数来进行压缩图像(预览图像)的时间调整,并且允许适合于图像片目的风格特征的预览图像的自动制作。此外,还能够在任意时间点读出和使用或向外供应语义分值。
下面将结合图24和25说明本发明的图像信息编辑装置的另一个实施例。
图24是显示图像信息编辑设备Athr3的结构的方框图,它具有编辑、记录和保存语义分值的功能。与前述实施例相同的部分用相同的标号表示,并且不再进行详细说明。
图像信息编辑装置Athr3是与外部记录媒介再现单元VP连接的编辑装置。图像信息编辑装置Athr3具有:一个诸如微计算机的中央处理单元CPU;输入装置Prg11和显示编成装置Prg7,它们可由中央处理单元CPU读取和运行,并且为只读用途安装在一个混合半导体存储器中;一个由ROM只读存储器组成的记录媒介32,其中存储了中央处理单元CPU可读和可运行的程序;一个临时存储单元3,由像一个DRAM那样的半导体存储器组成;一个快速存储单元4;一个用于屏幕显示的监视器单元Mnt;和一个输出终端T1。此外,还设置了整体控制电路和电源电路(未示出)。
记录媒介32以非易失性半导体存储器那样的一个单芯片结构构成。记录媒体32具有镜头索引表编成装置Prg1,场景索引表编成装置Prg2,场景分值表编成装置Prg3,图像转换特征编成装置Prg4,适用场景提取装置Prg5,镜头分值编成和镜头提取装置Prg6,预览图像时间调整装置Prg8,和语义分值编成装置Prg20″,它们都是计算机运行程序。
通过运行上述的每个程序,在临时存储单元3中制作镜头索引表Tab1,场景索引表Tab2,场景分值表Tab3,图像转换特征表Tab4,被提取场景表Tab5,和提取镜头表6。通过运行语义码编成装置Prg20″,在快速存储器4中制作语义码表Tab12。
图25是显示语义分值编成装置20″的操作的流程图。在步骤S110,语义分值编成装置20″等待从预览图像时间调整装置Prg8的确定数据的输入。如果有输入,语义分值编成装置因而确认语义分值数据被确定,然后对确定的数据编码,为每个模式编辑语义码,和把它作为语义码表TAB12存储到快速存储器4中(步骤S111)。如果有用于向外输出的请求(步骤S112),则从输出端子T1输出快速存储器4中存储的编码数据。
因而,图24所示的实施例的图像信息编辑装置Athr3编辑、记录和保存这样的语义分值:该语义分值允许适合于图像片目的风格特征的预览图像的自动制作。此外,还能够在任意时间点使用该语义码。
如上所述,本实施例的图像信息编辑装置以场景分值和镜头分值为基础并依照用于各种目的的预定的预览图像编成规则,编辑允许为各种目的编成预览图像的语义码,其中所述的场景分值和镜头分值是通过在故事的语义阶段(phase)和图像特征方面评估构成图像片目的正规版图像的每个场景和每个镜头而获得的。语义码允许依据图像片目的正规版图像自动制作适合各种目的的预览图像。
特别是,使用了为各种目的的每种模式设置条件的预览图像编成规则,并且选择了提取用于每种模式的条件的一种模式。根据每种模式的条件,允许自动制作各种模式包括概要、精彩场面和主要演员模式的预览图像的语义码可以被编辑和制作。所以,至少以被制作的语义码中的代码形式描述了为每种模式设置的数据。
作为要从一个镜头或场景图像中剪切下的图像的剪辑秒数、峰场景的阈值、用于到峰的上升斜面的阈值和用于自峰的下降斜面的阈值,或者正和负场景分值的阈值被指定为不同数量的秒数。
根据本发明的图像信息编辑方法和图像信息编辑设备,选择一个镜头或场景,使为每个镜头或为每个场景制作的评估值满足一个预定的条件,并且记录和保存包括有关被选择场景和镜头的信息的数据。因此,能够进行使用记录和保存的数据来编成仅包括镜头的连接图像、编成仅包括场景的连接图像和编成镜头和场景的连接图像。因而,能够提供允许相应于此目的的连接图像的编成的数据。
此外,可以提供便于各类连接图像编成的数据,以及可以提供通过执行使图像时间长度与所需时间长度相匹配的自动调整而允许自动编成任意时间长度的连接图像的数据。
特别是,在根据本发明的图像信息编辑方法和图像信息编辑装置中,如果选择了具有满足预定第一条件的场景评估值的场景,以及如果从每个被选择场景所包含的镜头中选择具有满足预定第二条件的镜头评估值的镜头,则可以通过执行较少次数的处理来有效地获得待选择的镜头,并且可以有效地记录和保存包括关于被选择镜头或场景的信息的数据。
此外,根据本发明的图像信息编辑方法和图像信息编辑设备,选择一个镜头或场景,使为每个镜头或为每个场景制作的评估值满足一个预定的条件,并且编码和输出或者记录和保存包括有关被选择场景和镜头的信息的数据。因此,能够进行使用编码来编成仅包括镜头的连接图像、编成仅包括场景的连接图像和编成镜头和场景的连接图像。因而,能够提供允许相应于此目的的连接图像的编成的编码数据。
此外,可以提供便于各类连接图像编成的数据,以及可以提供通过执行使图像时间长度与预期时间长度相匹配的自动调整而允许自动编成任意时间长度的连接图像的数据。
特别是,在根据本发明的图像信息编辑方法和图像信息编辑装置中,如果选择了具有满足预定第一条件的场景评估值的场景,以及如果从每个被选择场景所包含的镜头中选择具有满足预定第二条件的镜头评估值的镜头,则可以通过执行较少次数的处理来有效地获得待选择的镜头,并且可以有效地输出或记录及保存包括关于被选择镜头或场景的信息的编码数据。
此外,在本发明的图像信息编辑方法和图像信息编辑设备中,在选择待提取场景时,通过提取使场景评估值的绝对值达到一个预定阈值的的场景,可以方便地进行选定更好效果的场景的处理。
此外,在本发明的图像信息编辑方法和图像信息编辑设备中,可以通过设置用于由沿场景转换的每个场景评估值的积分值所确定的峰或谷场景与邻近谷或峰之间的每个区域的阈值,作为选择待提取场景的阈值,来提取用于一个指定目的的一个最佳场景。
或者,在本发明的图像信息编辑方法和图像信息编辑设备中,对于选择待提取场景时的目标场景,以谷场景和谷之后的峰场景的积分值增加的幅度或者根据积分值增加的幅度的排列为基础,能够通过仅处理从该之前的邻近谷到此峰的上升斜面上的场景和紧接此峰后的下降斜面上的场景,目标场景的数目受到了限制,可以进行高效的选择工作。
此外,在本发明的图像信息编辑方法和图像信息编辑设备中,由于根据从谷到邻近峰的上升斜面或者从峰到邻近谷的下降斜面设置用来选择待提取的场景的阈值,待提取的场景不是集中在特定部分而是从整个图像来使用,于是能够进行很均衡的连接图像的提取。
此外,在本发明的图像信息编辑方法和图像信息编辑设备中,作为镜头评估值,加上关于以下每个图像特征项目的值,该值是通过执行对每个图像特征项目的预定加权处理而获得的,所述的图像特征项目至少包括在正规版图像的相应部分中的台词出现、预定大小或更高大小音量、特定男演员/女演员的出现或特殊画面效果。因而,可以根据目的改变预定加权,和可以有效地提取适合于此目的的镜头。特另是,通过对特定的男演员/女演员出现的项目使用比对其他项目加权值大的加权值,可以有效提取突出该演员的镜头。

Claims (48)

1、一种图像信息编辑方法,包括以下步骤:
按照定界指令的定时把一个正规版图像定界为作为动态图像单位的多个镜头或定界为多个场景,其中,正规版图像由与记录位置信息或时间经历信息一同记录的连续动态图像构成,其中,每个场景至少包括一个镜头,并且所述记录位置信息或时间经历信息与该镜头或场景相关联;
根据相应于每个镜头或每个场景提供的信息,产生每个镜头或每个场景的一个评估值;和
从正规版图像中选择多个镜头或多个场景,使镜头或场景的每个评估值满足一个预定条件。
2、根据权利要求1所述的图像编辑方法,其中如果从正规版图像选择的图像消息的时间的总和超过一个预定的图像时间,则修改评估值的预定的条件并重复该处理,直至所述图像信息的时间的总和与预定的图像时间相匹配。
3、根据权利要求1所述的图像信息编辑方法,其中预定条件是关于镜头或场景的评估值的绝对值到达一个预定的阈值。
4、根据权利要求3所述的图像信息编辑方法,其中对于沿着场景转换的每个场景有关的评估值的积分值,当直到一个场景的积分值的连续增加超过一个预定的第一间隔值以及该场景之后的积分值的连续降低的绝对值超过一个预定的第二间隔值时,该场景是一个峰场景;
而当直到一个场景的积分值的连续降低的绝对值超过一个预定的第三间隔值以及该场景之后的积分值的连续增加超过一个预定的第四间隔值时,该场景是一个谷场景;和
为峰或谷场景与邻近的谷或峰场景之间的每个区域确定一个阈值。
5、根据权利要求4所述的图像信息编辑方法,其中根据从谷到邻近峰的上升斜面或者从峰到邻近谷的下降斜面来设置阈值。
6、根据权利要求3所述的图像信息的编辑方法,其中当每个评估值由一个正或负值构成时,适用于正评估值的阈值的绝对值等于或小于适用于负评估值的阈值的绝对值。
7、根据权利要求1所述的图像信息编辑方法,其中对于以下每个图像特征项目,镜头评估值是加入一个通过对每个图像特征项目执行预定加权获得的值而获得的一个值,所述的图像特征项目至少包括正规版图像的对应部分中的台词出现、预定大小或更高大小的音量、选定男演员/女演员的出现、或特殊画面效果。
8、根据权利要求7所述的图像信息编辑方法,其中对于镜头评估值,关于特定的男演员/女演员出现的项目的加权值被设置为大于其他项目的加权值。
9、一种图像信息编辑方法,包括以下步骤:
按照定界指令的定时把一个正规版图像定界为作为动态图像单位的多个镜头或定界为多个场景,其中,正规版图像由与记录位置信息或时间经历信息一同记录的连续动态图像构成,其中,每个场景至少包含一个镜头,并且所述记录位置信息或时间经历信息与该镜头或场景相关联;
根据相应于每个场景提供的信息,产生每个场景的一个评估值;
从正规版图像中选择场景,使场景的每个评估值满足一个预定的第一条件;
根据相应于每个镜头提供的信息产生包含在每个被选择场景中的每个镜头的一个评估值;和
选择镜头,使镜头的每个评估值满足一个预定的第二条件。
10、根据权利要求9所述的图像信息编辑方法,其中如果通过连接被选择镜头而制作的一个图像的长度超过一个预定图像时间时,修改预定的第一条件和第二条件的至少一个,并重复其处理,直至该图像图象的长度变得等于预定的图像时间。
11、根据权利要求9所述的图像信息编辑方法,其中预定第一条件是关于该场景的场景评估值的绝对值到达一个预定阈值,和
其中对于沿场景转换的每个场景有关的评估值的积分值,当直到一个场景的积分值的连续增加超过一个预定的第一间隔值以及该场景之后的积分值的连续降低的绝对值超过一个预定的第二间隔值时,该场景是一个峰场景;
而当直到一个场景的积分值的连续降低的绝对值超过一个预定的第三间隔值以及该场景之后的积分值的连续增加超过一个预定的第四间隔值时,该场景是一个谷场景;和
为峰或谷场景与邻近的谷或峰场景之间的每个区域确定阈值。
12、根据权利要求9所述的图像信息编辑方法,其中对于沿场景转换的每个场景有关的评估值的积分值,当直到一个场景的积分值的连续增加超过一个预定的第一间隔值以及该场景之后的积分值的连续降低的绝对值超过一个预定的第二间隔值时,该场景是一个峰场景;
而当直到一个场景的积分值的连续降低的绝对值超过一个预定的第三间隔值以及该场景之后的积分值的连续增加超过一个预定的第四间隔值时,该场景是一个谷场景;和
基于谷场景和该谷之后的邻近峰场景的积分值的增加的幅度,或者基于该积分值增加的幅度的排序,将预定的第一条件应用于从该峰之前的邻近谷到该峰的上升斜面上的场景和紧接该峰的下降斜面上的场景。
13、根据权利要求11所述的图像信息编辑方法,其中根据从谷到邻近峰的上升斜面或者从峰到邻近谷的下降斜面设置阈值。
14、根据权利要求11所述的图像信息编辑方法,其中当每个评估值由一个正或负值构成时,适用于正评估值的阈值的绝对值被设置为等于或小于适用于负评估值的阈值的绝对值。
15、根据权利要求9所述的图像信息编辑方法,其中对于以下每个图像特征项目,镜头评估值是加入通过对每个图像特征项目执行预定加权所得到的值而获得的一个值,所述的图像特征项目至少包括正规版图像的对应部分中的台词出现、预定大小或更高大小的音量、特定男演员/女演员的出现、或特殊画面效果。
16、根据权利要求15所述的图像信息编辑方法,其中对于镜头评估值,关于特定的男演员/女演员出现的项目的加权值被设置为大于其他项目的加权值。
17、一种图像信息编辑设备,包括:
定界装置,根据定界指令的定时把一个正规版图像定界为作为动态图像单位的多个镜头或定界为多个场景,其中,正规版图像由与记录位置信息或时间经历信息一同记录的连续动态图像构成,其中,每个场景至少包括一个镜头,所述记录位置信息或时间经历信息与该镜头或场景相关联;
产生装置,根据相应于每个镜头或场景提供的信息,产生每个镜头或每个场景的一个评估值;和
选择装置,从正规版图像中选择多个镜头或多个场景,使镜头或场景的每个评估值满足一个预定条件。
18、根据权利要求17所述的图像编辑设备,还包括计算被选择镜头或场景的时间总和的装置;和如果计算的时间的总和超过一个预定的图像时间,则修改预定的条件并重复该处理,直至时间的总和与预定的图像时间匹配的装置。
19、根据权利要求17所述的图像信息编辑设备,其中预定条件是关于镜头或场景的评估值的绝对值到达一个预定的阈值。
20.根据权利要求17所述的图像信息编辑设备,其中预定条件是关于场景的评估值的绝对值到达一个预定的阈值,和
其中对于沿场景转换的每个场景有关的评估值的积分值,当直到一个场景的积分值的连续增加超过一个预定的第一间隔值以及该场景之后的积分值的连续降低的绝对值超过一个预定的第二间隔值时,场景是一个峰场景;
而当直到一个场景的积分值的连续降低的绝对值超过一个预定的第三间隔值以及该场景之后的积分值的连续增加超过一个预定的第四间隔值时,场景是一个谷场景;和
为峰或谷场景与邻近的谷或峰场景之间的每个区域确定一个阈值。
21、根据权利要求20所述的图像信息编辑设备,其中根据从谷到邻近峰的上升斜面或者从峰到邻近谷的下降斜面设置阈值。
22、根据权利要求19所述的图像信息的编辑设备,其中当每个评估值由一个正或负值构成时,适用于正评估值的阈值的绝对值被设置为等于或小于适用于负评估值的阈值的绝对值。
23、根据权利要求17所述的图像信息编辑设备,其中对于以下每个图像特征项目,镜头评估值是加入通过对每个图像特征项目执行预定加权获得的一个值而得到的一个值,所述的图像特征项目至少包括正规版图像的对应部分中的台词出现、预定大小或更高大小的音量、选定男演员/女演员的出现、或特定画面效果。
24、根据权利要求23所述的图像信息编辑设备,其中对于镜头评估值,关于特定的男演员/女演员出现的项目的加权值被设置为大于其他项目的加权值。
25、一种图像信息编辑设备,包括:
定界装置,用于根据定界指令的定时把一个正规版图像定界为作为动态图像单位的多个镜头或定界为多个场景,其中,正规版图像由与记录位置信息或时间经历信息一同记录的连续动态图像构成,其中,每个场景至少包含一个镜头,所述记录位置信息或时间经历信息与该镜头或场景相关联;
产生装置,根据相应于每个场景提供的信息,产生每个场景的一个评估值;
选择装置,从正规版图像中选择场景,使场景的每个评估值满足一个预定的第一条件;
产生装置,根据相应于每个镜头提供的信息产生包含在每个被选择场景中的每个镜头的一个评估值;和
选择镜头的装置,使镜头的每个评估值满足一个预定的第二条件。
26、根据权利要求25所述的图像信息编辑设备,还包括如果通过连接被选择镜头而制作的一个图像的长度超过一个预定图像时间时,修改预定的第一条件和第二条件的至少一个,并重复其处理,直至该图象的长度变得等于预定的图像时间的装置。
27、根据权利要求25所述的图像信息编辑设备,其中预定第一条件是关于场景的场景评估值的绝对值到达一个预定阈值,和
其中对于沿场景转换的每个场景有关的评估值的积分值,当直到一个场景的积分值的连续增加超过一个预定的第一间隔值以及该场景之后的积分值的连续降低的绝对值超过一个预定的第二间隔值时,该场景是一个峰场景;
而当到达一个场景的积分值的连续降低的绝对值超过一个预定的第三间隔值以及该场景之后的积分值的连续增加超过一个预定的第四间隔值时,该场景是一个谷场景;和
为峰或谷场景与邻近的谷或峰场景之间的每个区域确定阈值。
28、根据权利要求25所述的图像信息编辑设备,其中对于与场景转换期间的每个场景有关的评估值的积分值,当直到一个场景的积分值的连续增加超过一个预定的第一间隔值以及该场景之后的积分值的连续降低的绝对值超过一个预定的第二间隔值时,该场景是一个峰场景;
而当直到一个场景的积分值的连续降低的绝对值超过一个预定的第三间隔值以及该场景之后的积分值的连续增加超过一个预定的第四间隔值时,该场景是一个谷场景;和
基于谷场景和该谷之后的邻近定点场景的积分值的增加的数值,或者基于该积分值增加的数值的排列,将预定的第一条件应用于从该顶点之前的邻近谷到该峰的上升斜面上的场景和紧接该顶点的下降斜面上的场景。
29、根据权利要求27所述的图像信息编辑设备,其中预定第一条件是关于场景的场景评估值的绝对值到达一个预定阈值,和根据从谷到邻近峰的上升斜面或者从峰到邻近谷的下降斜面设置阈值。
30、根据权利要求27所述的图像信息编辑设备,其中预定第一条件是关于场景的场景评估值的绝对值到达一个预定阈值,和当每个评估值由一个正或负值构成时,适用于正评估值的阈值的绝对值被设置为等于或小于适用于负评估值的阈值的绝对值。
31、根据权利要求25所述的图像信息编辑设备,其中对于每个图像特征项目,镜头评估值是加入通过对每个图像特征项目执行预定加权所得到的值而获得的一个值,所述的图像特征项目至少包括正规版图像的对应部分中的台词出现、预定大小或更高大小的音量、特定男演员/女演员的出现、或特定画面效果。
32、根据权利要求31所述的图像信息编辑设备,其中对于镜头评估值,关于特定的男演员/女演员出现的项目的加权值被设置为大于其他项目的加权值。
33、一种图像信息编辑设备,包括:
定界设备,用于根据定界指令的定时把一个正规版图像定界为作为动态图像单位的多个镜头或定界为多个场景,其中,正规版图像由与记录位置信息或时间经历信息一同记录的连续动态图像构成,其中,每个场景至少包含一个镜头,所述记录位置信息或时间经历信息与该镜头或场景相关联;
产生装置,根据相应于每个镜头或场景提供的信息,产生每个镜头或每个场景的一个评估值;
选择装置,从正规版图像中选择镜头或场景,使镜头或场景的每个评估值满足一个预定条件;和
对数据进行编码的装置,所述的数据至少包含相应于被选择镜头或场景的记录位置信息或时间经历信息以及相应的评估值。
34、根据权利要求33所述的图像信息编辑设备,还包括根据记录位置信息或时间经历信息计算被选择的镜头或场景的时间总和的装置;和如果计算的时间总和超过一个预定图像时间,则修改预定的条件和重复其处理,直至时间总和与预定图像时间相等的装置。
35、根据权利要求33所述的图像信息编辑设备,其中预定条件是关于镜头或场景的评估值的绝对值达到一个预定的阈值。
36、根据权利要求33所述的图像信息编辑设备,其中预定的条件是关于场景的评估的绝对值到达一个预定阈值,和
其中对于沿场景转换的每个场景有关的评估值的积分值,当直到一个场景的积分值的连续增加超过一个预定的第一间隔值以及该场景之后的积分值的连续降低的绝对值超过一个预定的第二间隔值时,该场景是一个峰场景;
而当直到一个场景的积分值的连续降低的绝对值超过一个预定的第三间隔值以及该场景之后的积分值的连续增加超过一个预定的第四间隔值时,该场景是一个谷场景;和
为峰或谷场景与邻近的谷或峰场景之间的每个区域确定阈值。
37、根据权利要求36所述的图像信息编辑设备,其中根据从谷到邻近峰的上升斜面或者从峰到邻近谷的下降斜面设置阈值。
38、根据权利要求35所述的图像信息编辑设备,其中当每个评估值由一个正或负值构成时,适用于正评估值的阈值的绝对值被设置为等于或小于适用于负评估值的阈值的绝对值。
39、根据权利要求33所述的图像信息编辑设备,其中对于以下每个图像特征项目,镜头评估值是加入通过对每个图像特征项目执行预定加权所得到的值而获得的一个值,所述的图像特征项目至少包括正规版图像的对应部分中的台词出现、预定大小或更高大小的音量、特定男演员/女演员的出现、或特殊画面效果。
40、根据权利要求39所述的图像信息编辑设备,其中对于镜头评估值,关于特定的男演员/女演员出现的项目的加权值被设置为大于其他项目的加权值。
41、一种图像信息编辑设备,包括:
定界装置,根据定界指令的定时把一个正规版图像定界为作成动态图像单位的多个镜头或定界为多个场景,其中,正规版图像由与记录位置信息或时间经历信息一同记录的连续动态图像构成,其中,每个场景至少包含一个镜头,所述记录位置信息或时间经历信息与该镜头或场景相关联;
产生装置,根据相应于每个场景提供的信息,产生每个场景的一个评估值;
选择装置,从正规版图像中选择场景,使场景的每个评估值满足预定的第一条件;
产生装置,根据相应于每个镜头提供的信息产生包含在每个被选择场景中的每个镜头的一个评估值;选择镜头的装置,使镜头的每个评估值满足一个预定的第二条件;和
用于编码对应于每个选择的镜头的记录位置信息或时间经历信息的信息和至少包括镜头评估值的数据的装置。
42、根据权利要求41所述的图像信息编码设备,还包括如果连接被选择镜头而制作的图像长度超过一个预定图像时间,修改预定的第一条件和第二条件的至少一个和重复其处理,直至图像的长度变得等于预定的图像时间的装置。
43、根据权利要求41所述的图像信息编辑设备,其中预定的第一条件是关于场景的评估的绝对值到达一个预定阈值,和
其中对于沿场景转换的每个场景有关的评估值的积分值,当直到一个场景的积分值的连续增加超过一个预定的第一间隔值以及该场景之后的积分值的连续降低的绝对值超过一个预定的第二间隔值时,该场景是一个峰场景;
而当直到一个场景的积分值的连续降低的绝对值超过一个预定的第三间隔值以及该场景之后的积分值的连续增加超过一个预定的第四间隔值时,该场景是一个谷场景;和
为峰或谷场景与邻近的谷或峰场景之间的每个区域确定阈值。
44、根据权利要求41所述的图像信息编辑设备,其中对于沿场景转换的每个场景有关的评估值的积分值,当直到一个场景的积分值的连续增加超过一个预定的第一间隔值以及该场景之后的积分值的连续降低的绝对值超过一个预定的第二间隔值时,该场景是一个峰场景;
而当直到一个场景的积分值的连续降低的绝对值超过一个预定的第三间隔值以及该场景之后的积分值的连续增加超过一个预定的第四间隔值时,该场景是一个谷场景;和
基于谷场景和该谷之后的邻近峰场景的积分值的增加的数值,或者基于该积分值增加的数值的排列,将预定的第一条件应用于从该顶点之前的邻近谷到该峰的上升斜面上的场景和紧接该顶点的下降斜面上的场景。
45、根据权利要求43所述的图像信息编辑设备,其中预定的第一条件是关于场景的评估的绝对值到达一个预定阈值,并且根据从谷到邻近峰的上升斜面或者从峰到邻近谷的下降斜面设置阈值。
46、根据权利要求43所述的图像信息编辑设备,其中预定的第一条件是关于场景的评估的绝对值到达一个预定阈值,并且当每个评估值由一个正或负值构成时,适用于正评估值的阈值的绝对值被设置为等于或小于适用于负评估值的阈值的绝对值。
47、根据权利要求43所述的图像信息编辑设备,其中对于每个图像特征项目,镜头评估值是加入通过对每个图像特征项目执行预定加权所得到的值而获得的一个值,所述的图像特征项目至少包括正规版图像的对应部分中的台词出现、预定大小或更高大小的音量、特定男演员/女演员的出现、或特殊画面效果。
48、根据权利要求47所述的图像信息编辑设备,其中对于镜头评估值,关于选定的男演员/女演员出现的项目的加权值被设置为大于其他项目的加权值。
CNB998151971A 1998-12-28 1999-12-28 图像信息编辑方法和编辑设备 Expired - Fee Related CN1178469C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP37385598 1998-12-28
JP373855/1998 1998-12-28

Publications (2)

Publication Number Publication Date
CN1332925A CN1332925A (zh) 2002-01-23
CN1178469C true CN1178469C (zh) 2004-12-01

Family

ID=18502874

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB998151971A Expired - Fee Related CN1178469C (zh) 1998-12-28 1999-12-28 图像信息编辑方法和编辑设备

Country Status (6)

Country Link
US (2) US7904813B1 (zh)
EP (1) EP1143714A1 (zh)
JP (1) JP4449216B2 (zh)
KR (1) KR100608476B1 (zh)
CN (1) CN1178469C (zh)
WO (1) WO2000040011A1 (zh)

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7685520B2 (en) * 2000-06-22 2010-03-23 Intel Corporation Electronic programming guide with selectable categories
US7333712B2 (en) * 2002-02-14 2008-02-19 Koninklijke Philips Electronics N.V. Visual summary for scanning forwards and backwards in video content
JP3747904B2 (ja) * 2002-11-22 2006-02-22 ソニー株式会社 Avサーバーに蓄積されたavデータの参照システム及び方法
TWI310545B (en) * 2003-10-04 2009-06-01 Samsung Electronics Co Ltd Storage medium storing search information and reproducing apparatus
KR20050033100A (ko) * 2003-10-04 2005-04-12 삼성전자주식회사 검색정보를 기록한 정보저장매체, 검색항목간의 이동재생방법 및 재생장치
US20060010366A1 (en) * 2004-05-18 2006-01-12 Takako Hashimoto Multimedia content generator
CN100396094C (zh) * 2004-09-15 2008-06-18 财团法人工业技术研究院 数字视频影片随选预览方法
WO2006065223A1 (en) * 2004-12-13 2006-06-22 Muvee Technologies Pte Ltd A method of automatically editing media recordings
WO2007025167A1 (en) * 2005-08-26 2007-03-01 The Directv Group, Inc. Administrative tool for video programming
WO2007052395A1 (ja) * 2005-10-31 2007-05-10 Sharp Kabushiki Kaisha 視聴環境制御システム
WO2007077713A1 (ja) * 2006-01-05 2007-07-12 Nec Corporation 映像生成装置、映像生成方法および映像生成プログラム
WO2008003183A1 (en) * 2006-07-07 2008-01-10 Abb Research Ltd Method and system for controlling execution of computer processing steps
US8375416B2 (en) * 2006-10-27 2013-02-12 Starz Entertainment, Llc Media build for multi-channel distribution
JP4482829B2 (ja) 2006-11-08 2010-06-16 ソニー株式会社 嗜好抽出装置、嗜好抽出方法及び嗜好抽出プログラム
US7941442B2 (en) * 2007-04-18 2011-05-10 Microsoft Corporation Object similarity search in high-dimensional vector spaces
EP2051173A3 (en) * 2007-09-27 2009-08-12 Magix Ag System and method for dynamic content insertion from the internet into a multimedia work
CA2741461C (en) * 2007-10-31 2015-12-29 Xtranormal Technologie Inc. Automated cinematographic editing tool
WO2009060507A1 (ja) * 2007-11-05 2009-05-14 Pioneer Corporation 動画編集装置、動画編集方法、動画編集プログラムおよび記録媒体
KR20090093105A (ko) * 2008-02-28 2009-09-02 삼성전자주식회사 컨텐츠 재생 장치 및 방법
JP5129198B2 (ja) * 2009-06-03 2013-01-23 日本電信電話株式会社 映像予告生成装置、映像予告生成方法および映像予告生成プログラム
KR101643602B1 (ko) * 2009-06-24 2016-07-29 삼성전자주식회사 구도 가이드 방법 및 장치, 및 디지털 촬영 장치
US20110047163A1 (en) 2009-08-24 2011-02-24 Google Inc. Relevance-Based Image Selection
CN102025892A (zh) * 2009-09-16 2011-04-20 索尼株式会社 镜头转换检测方法及装置
JP5715810B2 (ja) * 2010-01-29 2015-05-13 株式会社東芝 医用画像診断装置
US8971651B2 (en) 2010-11-08 2015-03-03 Sony Corporation Videolens media engine
US10134440B2 (en) * 2011-05-03 2018-11-20 Kodak Alaris Inc. Video summarization using audio and visual cues
US8938393B2 (en) 2011-06-28 2015-01-20 Sony Corporation Extended videolens media engine for audio recognition
US9973800B2 (en) * 2011-08-08 2018-05-15 Netflix, Inc. Merchandising streaming video content
US9940970B2 (en) 2012-06-29 2018-04-10 Provenance Asset Group Llc Video remixing system
CN103714094B (zh) * 2012-10-09 2017-07-11 富士通株式会社 识别视频中的对象的设备和方法
JP6321945B2 (ja) * 2013-11-18 2018-05-09 日本電信電話株式会社 ダイジェスト映像生成装置、ダイジェスト映像生成方法及びダイジェスト映像生成プログラム
US20150172787A1 (en) * 2013-12-13 2015-06-18 Amazon Technologies, Inc. Customized movie trailers
CN107077595A (zh) * 2014-09-08 2017-08-18 谷歌公司 选择和呈现代表性帧以用于视频预览
US10248864B2 (en) * 2015-09-14 2019-04-02 Disney Enterprises, Inc. Systems and methods for contextual video shot aggregation
US11438510B2 (en) 2016-03-22 2022-09-06 Jung Yoon Chun System and method for editing video contents automatically technical field
KR101717014B1 (ko) 2016-04-21 2017-03-15 (주)노바빈 비디오 컨텐츠 자동 편집 시스템 및 자동 편집 방법
KR102361811B1 (ko) 2016-03-22 2022-02-11 천종윤 비디오 컨텐츠 자동 편집 시스템 및 자동 편집 방법
US11822591B2 (en) * 2017-09-06 2023-11-21 International Business Machines Corporation Query-based granularity selection for partitioning recordings
JP7133433B2 (ja) * 2018-10-24 2022-09-08 ヤフー株式会社 生成装置、生成方法、生成プログラム
CN109724364B (zh) * 2018-11-13 2020-11-20 徐州云创物业服务有限公司 存放物品容量解析平台
US10735786B2 (en) 2018-12-11 2020-08-04 Rovi Guides, Inc. Systems and methods for associating program actors with program genres
CN109819338B (zh) * 2019-02-22 2021-09-14 影石创新科技股份有限公司 一种视频自动剪辑方法、装置及便携式终端
BR102019027509A2 (pt) 2019-12-20 2021-07-06 Globo Comunicação E Participações S.a. sistema e método de captação de vídeo e ordenação de sequência de cenas
CN111918122A (zh) * 2020-07-28 2020-11-10 北京大米科技有限公司 视频处理方法、装置、电子设备和可读存储介质

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5416696A (en) * 1989-12-27 1995-05-16 Kabushiki Kaisha Toshiba Method and apparatus for translating words in an artificial neural network
JPH04294694A (ja) 1991-03-25 1992-10-19 Nippon Telegr & Teleph Corp <Ntt> 映像の自動要約編集方法
US5821945A (en) * 1995-02-03 1998-10-13 The Trustees Of Princeton University Method and apparatus for video browsing based on content and structure
JP3579111B2 (ja) 1995-03-16 2004-10-20 株式会社東芝 情報処理装置
US5903892A (en) * 1996-05-24 1999-05-11 Magnifi, Inc. Indexing of media content on a network
US5983176A (en) * 1996-05-24 1999-11-09 Magnifi, Inc. Evaluation of media content in media files
US8107015B1 (en) * 1996-06-07 2012-01-31 Virage, Incorporated Key frame selection
JP3250467B2 (ja) 1996-10-04 2002-01-28 松下電器産業株式会社 映像要約方法および映像表示方法
JPH10150629A (ja) 1996-11-15 1998-06-02 Sony Corp 送受信システム、受信装置、及び送信装置
US5956026A (en) * 1997-12-19 1999-09-21 Sharp Laboratories Of America, Inc. Method for hierarchical summarization and browsing of digital video
JPH11220689A (ja) 1998-01-31 1999-08-10 Media Link System:Kk 映像ソフト処理装置及び同処理プログラム記録記憶媒体
JPH11238071A (ja) * 1998-02-20 1999-08-31 Toshiba Corp ダイジェスト作成装置及びダイジェスト作成方法
US5917990A (en) * 1998-04-22 1999-06-29 Pinnacle Systems, Inc. Process for precisely identifying a desired location on a video tape
US6163510A (en) * 1998-06-30 2000-12-19 International Business Machines Corporation Multimedia search and indexing system and method of operation using audio cues with signal thresholds
KR100327368B1 (ko) 1998-07-10 2002-03-06 구자홍 영상 부호화 및 복호화 방법
US6721454B1 (en) * 1998-10-09 2004-04-13 Sharp Laboratories Of America, Inc. Method for automatic extraction of semantically significant events from video
US6389168B2 (en) * 1998-10-13 2002-05-14 Hewlett Packard Co Object-based parsing and indexing of compressed video streams
US6454875B1 (en) * 1999-06-30 2002-09-24 Pro Club Cleaner, L.L.C. Golf club cleaning apparatus
US6931595B2 (en) * 2000-11-02 2005-08-16 Sharp Laboratories Of America, Inc. Method for automatic extraction of semantically significant events from video
US6678635B2 (en) * 2001-01-23 2004-01-13 Intel Corporation Method and system for detecting semantic events
US7203620B2 (en) * 2001-07-03 2007-04-10 Sharp Laboratories Of America, Inc. Summarization of video content

Also Published As

Publication number Publication date
US20070067724A1 (en) 2007-03-22
EP1143714A1 (en) 2001-10-10
CN1332925A (zh) 2002-01-23
WO2000040011A1 (fr) 2000-07-06
KR100608476B1 (ko) 2006-08-09
KR20010092767A (ko) 2001-10-26
US7627823B2 (en) 2009-12-01
JP4449216B2 (ja) 2010-04-14
US7904813B1 (en) 2011-03-08

Similar Documents

Publication Publication Date Title
CN1178469C (zh) 图像信息编辑方法和编辑设备
CN1145965C (zh) 用于生成存储在信息记录盘上的图象位流设备和方法
CN1118065C (zh) 光盘的记录和复制设备及方法
CN1816879A (zh) 视频处理装置、视频处理装置的ic电路、视频处理方法和视频处理程序
CN1201568C (zh) 虚拟节目表呈现系统
CN1700336A (zh) 信息处理设备、方法及程序
CN1779715A (zh) 信息处理设备和方法及其程序
CN1367612A (zh) 特殊再生控制信息记录方法,产生装置及方法,图象再生装置
CN1738440A (zh) 用于处理信息的设备,方法和计算机程序
CN1922605A (zh) 辞典制作装置以及辞典制作方法
CN1742484A (zh) 视频信号处理器、视频信号记录器、视频信号再现器、视频信号处理器处理方法、视频信号记录器处理方法、视频信号再现器处理方法、记录介质
CN1874243A (zh) 数据传输装置及方法
CN1685719A (zh) 广播系统、记录装置、记录方法、程序、记录媒体
CN1801908A (zh) 信息处理装置、信息处理方法、及程序
CN1351444A (zh) 记录和再现设备
CN101051514A (zh) 记录和复现装置与记录和复现方法
CN100348044C (zh) 不同帧速率多流混合视频流的无缝译码装置
CN1808416A (zh) 信息处理设备和方法以及程序
CN1457495A (zh) 信息记录、再现设备及方法、信息记录介质、程序存储介质、及程序
CN1906694A (zh) 再现装置、再现方法、程序、记录介质和数据结构
CN1810025A (zh) 信息记录介质、信息记录设备及其方法 ,信息重放设备及其方法,信息录放设备及其方法,信息记录程序和信息重放程序,信息录放程序, 以及包括控制信号的数据结构
CN101031055A (zh) 图像处理装置及方法、记录介质、以及程序
CN1679327A (zh) 信息处理设备和程序
CN1254100C (zh) 控制电视广播节目预约录像的信息处理装置、方法
CN1711610A (zh) 信息记录介质、信息记录设备和方法、信息重放设备和方法、信息录放设备和方法、用于控制记录或重放的计算机程序 ,以及包括控制信号的数据结构

Legal Events

Date Code Title Description
C06 Publication
C10 Entry into substantive examination
PB01 Publication
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20041201

Termination date: 20151228

EXPY Termination of patent right or utility model