[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP5922255B2 - データストリームのリアルタイム自然言語処理 - Google Patents

データストリームのリアルタイム自然言語処理 Download PDF

Info

Publication number
JP5922255B2
JP5922255B2 JP2014548776A JP2014548776A JP5922255B2 JP 5922255 B2 JP5922255 B2 JP 5922255B2 JP 2014548776 A JP2014548776 A JP 2014548776A JP 2014548776 A JP2014548776 A JP 2014548776A JP 5922255 B2 JP5922255 B2 JP 5922255B2
Authority
JP
Japan
Prior art keywords
content
text
context
user interface
graphical user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2014548776A
Other languages
English (en)
Other versions
JP2015501059A (ja
Inventor
スミス,エリオット
シラジー,ヴィクター
Original Assignee
インテル コーポレイション
インテル コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by インテル コーポレイション, インテル コーポレイション filed Critical インテル コーポレイション
Publication of JP2015501059A publication Critical patent/JP2015501059A/ja
Application granted granted Critical
Publication of JP5922255B2 publication Critical patent/JP5922255B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7844Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using original textual content or text extracted from visual content or transcript of audio data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/4104Peripherals receiving signals from specially adapted client devices
    • H04N21/4126The peripheral being portable, e.g. PDAs or mobile phones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
    • H04N21/4355Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream involving reformatting operations of additional data, e.g. HTML pages on a television screen
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/4722End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for requesting additional data associated with the content
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/84Generation or processing of descriptive data, e.g. content descriptors
    • H04N21/8405Generation or processing of descriptive data, e.g. content descriptors represented by keywords

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Library & Information Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Information Transfer Between Computers (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

実施形態はコンテンツ処理技法および関連するソフトウェア・アプリケーションの使用に関する。いくつかの実施形態は、インターネット関係のアプリケーションおよびサービスとの関連での、データストリームおよびデジタル・コンテンツ情報の自然言語処理に関する。
自然言語処理(NLP: natural language processing)は伝統的に非常に処理および記憶集約的なコンピューティング活動である。実のところ、この活動の多くの型が、NLPを発話テキスト化のような他の機能と合わせる、大規模なコンピューティングおよび記憶資源を提供するクラウド設備に移行されている。しかしながら、クライアント側のパフォーマンスおよびローカルな記憶が増したことから、ローカル・プラットフォーム上でNLPが使用されることを許容する有能なシステムが存在する。
今日のNLPの実装は、パフォーマンス中心的な関心および特定のハードウェアおよびオペレーティング・システム環境に合わせてコードおよびアルゴリズムをチューニングする能力を反映して、典型的にはC/C++のような言語を使って提供される。一つの著しいマイナス面は、複数のハードウェアおよびオペレーティング・システム構成および組み合わせがあると、多数のNLP実装があり、その結果、開発、最適化およびサポートのタスクが著しくなるということである。
本願は請求項記載の手段によって従来技術の課題を解決する。
ある例示的な実施形態に基づく、自然言語処理との関連で複数の表示装置の間でのコンテンツ表示を可能にするシステム・アーキテクチャの図解である。 ある例示的な実施形態に基づく、コンテンツおよび関係するコンテンツ表示を提供する装置の装置アーキテクチャの図解である。 ある例示的な実施形態に基づく、自然言語処理を使うユーザーのために関係するコンテンツを提供するよう構成された、HTML5/JavaScript(登録商標)〔ジャバスクリプト〕対応のグラフィカル・ユーザー・インターフェースの図解である。 ある例示的な実施形態に基づく、マルチメディア・データ・ストリームによって提供されるテキスト・データの自然言語処理のための方法を示すフローチャートである。 ある例示的な実施形態に基づく、自然言語によって提供されるコンテンツ・タームを使って、関係するコンテンツを判別する方法を示すフローチャートである。 一つまたは複数の実施形態が実装できる例示的な機械を示すブロック図である。
以下の記述および図面は、当業者が実施できるよう具体的な実施形態を十分に示すものである。他の実施形態は構造的、論理的、電気的、処理上およびその他の変更を組み込んでもよい。いくつかの実施形態の部分および特徴は、他の実施形態の部分および特徴に含まれたりその代わりとされてもよい。請求項に記載される実施形態は、それらの請求項のあらゆる利用可能な等価物を包含する。
本開示は、NLPおよび動的コンテンツ送達仕様の使用を通じてコンテンツ検索および送達を可能にする技法および構成を示す。ある実施形態では、NLPエンジンは、テキスト・コンテンツのストリームから有用な語句をリアルタイムで抽出することを実行するよう構成される。このNLPエンジンへのインターフェースが、W3Cハイパーテキスト・マークアップ言語仕様バージョン5(HTML5)、EMCAScript標準スクリプティング(たとえばJavaScript(登録商標)またはJScript)およびJavaScriptオブジェクト記法(JSON: JavaScript Object Notation)の標準ベースの実装を使って提供される。このインターフェースは、複数のハードウェアおよびオペレーティング・システム領域を横断して移植可能なフォーマットでコンテンツ項目の選択および送達を可能にし、クライアント側の装置における展開のために特化したプログラミングやコンパイルは必要としない。
ユーザーのために関係したコンテンツを判別し、位置特定し、提供するための追加的な技法および構成が本稿に記載される。そうした技法および構成は、コンテンツの第一のセットに(いくつもある関係のいずれかに基づいて)関係しているコンテンツの第二のセットを送達するためにNLPエンジンおよびHTML5インターフェースを使うことを含む。たとえば、コンテンツの第一のセット(ビデオなど)を位置特定するまたは呈示する結果として、該第一のセットに関係したコンテンツの第二のセット(別のビデオまたはテキスト・コンテンツなど)が位置特定され、ユーザーに対して提供されてもよい。ある実施形態では、コンテンツの第二のセットは、コンテンツの第一のセットによって与えられるテキスト言語タームおよびストリングに対してNLPを実行することによって決定される。たとえば、マルチメディア・ビデオ、字幕またはクローズドキャプションを含むコンテンツの第一のセットが、コンテンツの第二のセットを決定するためのNLP抽出されたキーワードを生成するために、NLPエンジンに提供されてもよい。
ある実施形態のさらなる例示的な使用では、コンテンツ・システムはメディア・コンテンツ項目に関連するテキストのストリームを判別し、該テキストのストリームを解析し、該テキストからキーワードおよびフレーズを捕捉し、捕捉されたテキストから追加的な選択および解析を実行することができる。NLPエンジンは次いで、関心のある言語タームを解析および選択してもよい。選択されるタームは数多くの仕方で使用されうる。たとえば、関係したコンテンツを位置特定するための品詞クエリー〔問い合わせ〕を提供する;重要な、持続的なユーザー・データを識別する;コンテンツを意識した動作およびデータ検索のためのテキスト・ペイロードの性質およびコンテンツを解析する;またはメタデータとして使うもしくは他のメタデータへのマッピングとの関連で使うことを含むがこれに限られない。
多様なユーザー・インターフェースおよびエンジン構成が、これらのNLP技法との関連で使用され、設計されてもよい。以下の開示は、上記コンテンツ・システム、NLPエンジン、コンテンツ・インターフェース(たとえばHTML5/JavaScript技法で呈示される)、コンテンツ・サービスおよび表示装置に関連するいくつかの使用例および構成を提供する。これらの実施形態の特徴が単一のシステムまたは装置において提供されても、別個の装置またはサブシステムにおいて提供されても、あるいはハードウェアまたはソフトウェアのさまざまな組み合わせにおいて提供されてもよいことは明白であろう。よって、本稿で与える使用例はさまざまな処理および表示要素を独立して動作しているように記述することがあるが、それらさまざまな要素は、ある種のシステムまたは装置構成では互いとの関連で使用されることが意図されている。
ある実施形態では、関係したコンテンツ表示および処理環境が、JavaScriptおよび動的マークアップ言語(たとえばHTML5)の解釈を実装するウェブ・ブラウザーのようなソフトウェア・アプリケーションとの関連で提供される。JavaScript/動的マークアップ言語対応ブラウザーにおける実装を提供することにより、コンテンツ処理要素(NLPなど)は、リアルタイムで、関連するウェブ・サービスから受領されたコンテンツ・テキストを解析し、対応する関係したコンテンツ表示を提供するよう展開されうる。ブラウザーは、一つまたは複数の動的に実行されるウェブページまたはウェブ・アプリケーション(ウェブ・アプリ)内で実行されるスクリプティングを通じてこれらのアプリケーションをレンダリングおよび実行してもよい。さらに、この動的スクリプティング構成は、W3C HTML5/JavaScript標準に準拠するいくつもあるウェブページまたはウェブ・アプリケーションの任意のものに統合されうるNLP実装を可能にする。
図1は、ある例示的な実施形態に基づく、自然言語処理との関連で複数の表示装置の間でコンテンツを提供するコンテンツ環境100の図解を与えている。特に、コンテンツ環境100は、NLPエンジン112およびHTML5/JavaScript対応ユーザー・インターフェース(UI)114を含むコンテンツ処理システム110の使用を示している。コンテンツ処理システム110は、以下の構成において示されるように、処理されたテキスト・コンテンツに応答してユーザーに対して追加的な関連コンテンツを提供するよう構成される。
ビデオ源120は、データ源122からビデオおよびテキスト・コンテンツを取得し、ビデオ・コンテンツ124および126をそれぞれ受信器装置テレビジョン130およびモバイル装置132に提供する。ビデオ・コンテンツ124は、ビデオ・データに対応するテキスト字幕またはクローズドキャプション・データといった、提供されるビデオ・データに関係したテキスト・データを含むものとして示されている。ビデオ・コンテンツ126は、ビデオ・データだけを含むとして示されている。
ビデオ源120は、コンテンツ処理システム110に、ビデオ・データに対応するテキスト・コンテンツ128をも提供する。コンテンツ処理システム110は、NLPエンジン112を用いてテキスト・コンテンツ128を処理し、関連するキーワード、ターム、フレーズおよび他の自然言語概念を導出して関連する自然言語データとする。次いでNLPエンジン112は関連する自然言語データを、HTML5/JavaScript UI 114のようなユーザー・インターフェースに提供する。
HTML5/JavaScript UI 114は、NLPエンジン112によって導出された関連自然言語データに基づいて追加的なビデオ・コンテンツを取得するよう構成されている。この関連自然言語データは、ビデオ・コンテンツのオーディオに対応するテキスト(たとえば、クローズドキャプション・テキストまたは字幕)のような、ビデオ源120から提供されるビデオ・コンテンツ124、126に関係した概念のテキストまたは一つまたは複数のキーワードを含んでいてもよい。
あるいはまた、コンテンツ処理システム110に提供されるテキスト・コンテンツ128はビデオ・コンテンツに関係するがビデオ・コンテンツのオーディオに直接的には対応しないのでもよい。たとえば、テレビジョン130に提供されるビデオ・コンテンツ124が特定の俳優が出演する映画である場合、ビデオ源120から受信されるテキスト・コンテンツ128は、その映画に関連するメタデータを含んでいてもよい。メタデータ・フィールドは、俳優の名前、その映画の説明およびジャンルまたは内容についての所定の情報といった関連するキー・タームを抽出するために、NLPエンジン112によって処理されてもよい。NLPエンジン112は、検索を実行するために、たとえば同じ俳優を含む同じまたは類似のジャンルの映画のような関連する追加的コンテンツを位置特定するために使われるキー・タームを抽出してもよい。さらに、俳優の名前が他の型のマルチメディア・コンテンツ(他の映画、その俳優および映画に関するレビューおよびニュース、映画クリップ・プレビューおよび予告編、俳優インタビューおよびプロモーション素材などを含む)を判別するために使われてもよい。これらの検索は、たとえばHTML5/JavaScript UI 114によって容易にされレンダリングされる動的ウェブサイトまたはウェブ・アプリケーション内の、コンテンツ処理システム110によって実施されてもよい。
キー・タームを判別すると、HTML5/JavaScript UI 114は、ユーザーが該キー・タームを用いて検索を実施し、検索の結果を見、検索の結果を選択する能力を提供してもよい。たとえば、検索からの結果のユーザー選択は、ビデオ源136から入手可能な特定のビデオ・コンテンツを表示のために呈示させてもよい。この関係したコンテンツは、HTML5/JavaScript UI 114において表示のために呈示されてもよいし、表示装置(たとえば、テレビジョン130、モバイル装置132)の一つにストリーミングされてもよい。これらの動作の一部または全部は、たとえば自動的に関連検索を実行するまたは自動的に関係したコンテンツを取得して表示するために、自動化されてもよい。
このように、ビデオ源120は、クローズドキャプション、字幕、文字起こしおよびスクリプト、メタデータ、レビューおよび要約、ユーザー生成コンテンツなどを含むいくつもある源またはフォーマットの任意のものから導出されるテキスト・コンテンツを、NLPエンジン112での使用のために提供してもよい。同様に、コンテンツ処理システム110は、ビデオ源120から提供されるテキスト・データまたはキーワードに基づいて、外部源から追加的なテキスト・コンテンツを取得する(たとえば、表示装置(たとえば、テレビジョン130またはモバイル装置132)にストリーミングされるビデオ番組を同定するテキスト・メタデータを与えられているときにインターネットからそのビデオ番組の転記を取得することによって)よう構成されていてもよい。
コンテンツ処理システム110は、公にアクセス可能なウェブサイト、インターネット・コンテンツ・サービス、加入メディア・プロバイダー(電話、無線またはケーブル・コンテンツ・サービスを含む)または他の電子データ源を含む任意の多様な源からの関係したコンテンツを位置特定し、生成しうる。このように、ビデオ源136は、任意的に、この関係したコンテンツを提供するものとして示されている。この関係したコンテンツは、第一のコンテンツの源、ビデオ源120から提供されてもよい。しかしながら、ビデオ源120は必ずしもネットワーク接続されたビデオ源に制限されない。多様な無線経由の(over-the-air)またはローカルに処理される源(たとえばDVDまたはブルーレイ・プレーヤー)がデジタルまたはアナログ・フォーマットでのデータ源122からのコンテンツの源となりうる。
HTML5/JS UI 114は、いくつもあるユーザー操作可能な装置および設定においておよびリモートにまたはローカルに実行されるアプリケーションにおいてアクセスされまたは具現されうる。たとえば、HTML5/JS ユーザー・インターフェース114は、テレビジョン130内の画面上アプリケーションとして提供されてもよい;HTML5/JS ユーザー・インターフェース114は、モバイル装置132上にインストールされたスタンドアローン・アプリケーションとの関連で提供されてもよい;HTML5/JS ユーザー・インターフェース114は、コンピューティング装置134上で動作するウェブ・ブラウザーによってアクセスされてもよい。
コンテンツ処理システム110は、ネットワークを通じてHTML5/JS ユーザー・インターフェース114をサービスするリモート・サービスによって提供されてもよい。コンテンツ処理システム110はあるいはまた、ディスプレイ画面に結合されたクライアント装置(たとえば、テレビジョンに接続されているセットトップ・ケーブル・ボックスまたはビデオ受信器)のようなクライアント側ハードウェア装置によって、あるいは一つまたは複数のコンピューティング・システムにおいて実装されるソフトウェアによって実行されるアプリケーション、コンポーネントまたはモジュールによって提供されてもよい。さらに、コンテンツ処理システムの諸側面は、(インターネット接続されたテレビジョンまたはスマートフォン/タブレット・コンピューティング装置のような)表示装置上の処理ハードウェアを使って直接実行されてもよい。
さまざまなアプリケーション・プログラミング・インターフェース(API)が、コンテンツ処理システム100によって提供され、アクセスされ、あるいは他の仕方で使用されてもよい。たとえば、コンテンツ処理システム100は、ビデオ源120からまたは表示装置(たとえばテレビジョン130、モバイル装置132)からテキスト・コンテンツを受領するよう構成されたAPIを提供し、ビデオに対応するテキスト・コンテンツが表示装置上に表示される(たとえばビデオ番組の開始または再生時に提供される)のでもよい。前の例に戻ると、テレビジョンのクローズドキャプション/字幕情報がビデオ放送フィードから複製されて、リアルタイム処理のためにコンテンツ処理システム110に提供されてもよい。このシナリオにおけるテレビジョンは、テキストのリアルタイム・データストリームを別の装置(たとえば前記テレビジョンと同じ環境において動作可能な、インターネットに接続されたタブレットPC;該タブレットPCは、ユーザーが表示されるビデオ・コンテンツについてより多くを知ることができるようにするユーザー操作可能なグラフィカル・ユーザー・インターフェースを提供する)上で動作しているコンテンツ処理システム110に送信するサーバーとして動作してもよい。
ある実施形態では、コンテンツ処理システム110は、JavaScriptおよびHTML5構造体を使ってユーザー経験をレンダリングし、入出力(I/O)動作を扱うなどするネイティブなHTML5/JavaScriptアプリケーションの使用により、テキスト・ストリームを処理する。こうして、NLPエンジン112、HTML5/JS UI 114および他のコンポーネントを含むコンテンツ処理システム110の諸部分または全部が、動的なスクリプティング環境において適用可能なコンポーネントを実行する軽いウェブ・ベースのアプリケーションを通じて提供されてもよい。そのようなHTML5/JavaScript UI 114の特徴は、表示装置(たとえばテレビジョン130、モバイル装置132)またはコンピューティング装置134の任意の組み合わせ上で実行されてもよい。
図2は、ある例示的な実施形態に基づく自然言語処理との関連でコンテンツおよび関係したコンテンツ表示を提供する装置のための装置アーキテクチャの図解を与えている。具体的には、テレビジョン202およびタブレット204装置はコンテンツ206および関係したコンテンツ208をそれぞれ表示するよう構成されている。図示した例では、関係したコンテンツ208はコンテンツ206に関係しており、コンテンツ206に関係しユーザーにとって関心対象でありうる追加的または補足的コンテンツの表示のはたらきをする。
図のように、テレビジョン202は、コンテンツ206に関連するそれぞれオーディオおよびビデオの出力のためにオーディオ・スピーカー210およびディスプレイ画面212を備える。テレビジョン202はさらに、グラフィカルUI(図示せず)との関連で提供されていてもよいHTML5アプリケーション216の動作のために構成されている。HTML5アプリケーション216はウェブ・ブラウザー、スタンドアローンのアプリケーションまたはコンテンツ機能を提供するために前記テレビジョン上で実行される同様の命令のセットを有していてもよい。
HTML5アプリケーション216はさらに、制御クライアント214およびコンテンツ処理クライアント218を提供する。制御クライアント214はコンテンツ処理システム224との関連でコマンドを受信するよう構成されていてもよく、たとえば、コンテンツの異なるセットを提供し、あるいはコンテンツ処理システム224から受領されるコマンドに応答しての何らかのユーザーによって指揮される活動を実行してもよい。コンテンツ処理クライアント218は、コンテンツ処理システム224にある種のコンテンツ情報(たとえば、テレビジョン202上で提供されるコンテンツ206のクローズドキャプション・テキストまたはコンテンツ206に関連するメタデータ)を提供するよう構成されていてもよい。
さらに図示されるように、タブレット204はディスプレイ画面220を備え、スピーカー(図示せず)を使ってオーディオ出力を提供してもよい。タブレット204はさらに、HTML5アプリケーション222、特にウェブ・ブラウザー、スタンドアローンのアプリケーションまたはコンテンツ処理システムのためのコンテンツ機能を提供するために前記タブレット上で実行される同様の命令のセットの動作のために構成される。
特に、HTML5アプリケーション222は、コンテンツ処理システム224の機能を実行するためのスクリプティング環境を提供するウェブ・ブラウザーを有していてもよい。コンテンツ処理システム224の機能は、HTML5アプリケーション222内で開始され潜在的に実行される、NLP 226および検索論理228を含んでいてもよい。たとえば、スクリプティング環境を提供するウェブ・ブラウザーが、スクリプト対応のNLPエンジンとの関連でスクリプティング・コマンドを実行するよう構成されていてもよい。
テレビジョン202とタブレット204との間の通信は、無線ルーター230によって容易にされる無線ネットワークのようなローカル・エリア・ネットワーク(LAN)によって容易にされてもよい。たとえば、テレビジョン202は、コンテンツ206に関連するリアルタイム・テキスト転記を提供するなどのために、テキスト・コンテンツおよびメタデータ・コンテンツを含むデータをLANを通じてタブレット204に通信してもよい。タブレット204のコンテンツ処理システム224は、(NLP 226を使って)このデータを受領および処理し、関係したコンテンツ208を位置特定して取得するよう検索論理228を用いてさまざまな問い合わせを開始するよう機能してもよい。
関係したコンテンツ208は、ユーザーにとってローカルまたはリモートないくつもあるコンテンツ源の任意のものから取得されてもよい。図のように、インターネット・ウェブ・サービス240との接続が無線ルーター230を通じて提供され、関係したコンテンツ208について潜在的なインターネット・ウェブ・サービスとしては、情報検索プロバイダー250、ニュースまたは動的コンテンツ・プロバイダー252、ソーシャル・メディア源254、ショッピング情報源256およびビデオ・コンテンツ源258を含む。関係したコンテンツ208は、これらの源の一つまたはいくつかから提供されてもよい。たとえば、関係したコンテンツ208は、テレビジョン202上のコンテンツ206の表示に由来するクローズドキャプション・キーワードに対してNLPを実行する結果として決定される、ビデオ・コンテンツ源258から得られるインターネット・ストリーミングされるビデオによって提供されてもよい。
図2に示されるように、関係したコンテンツ208の表示はタブレット204上で行なわれ、コンテンツ206の表示は別個の装置(テレビジョン202)上で行なわれる。関係したコンテンツ208の表示がもとのコンテンツと同じ装置上で、同時にまたは後刻に、たとえばピクチャー・イン・ピクチャー表示、スクリーン・オーバーレイまたは同様の表示技法を使って、行なわれてもよいことは理解されるであろう。
テレビジョン202からの通信を受領するためにコンテンツ処理システム224によってAPIが提供される。たとえば、クローズドキャプション・テキスト・ストリームがタブレット204に送信される。テレビジョン202がタブレット204に接続し、タブレット204とメッセージを送受信し、接続がもはや必要でなくなったときに接続を切断するよう構成されているからである。テレビジョン202とタブレット204との間で交換されるメッセージはいくつもあるフォーマットの任意のものを有していてもよい。
ある実施形態では、テキスト・データは、HTML5アプリケーション214、222において使うためのJSONパース可能なフォーマットで、コンテンツ処理システム224に提供される。たとえば、テキスト・コンテンツのフォーマットは次のように提供されてもよい:
{meta: 'title' | 'transcript' | 'tags' | 'summary', content: 'some text' | ['tag1', 'tag2', ...]}
この例示的なフォーマットにおいて、値「title」はビデオ・コンテンツについてのタイトルを与えてもよい;値「transcript」はビデオ・コンテンツについてのテキストの部分的なまたは完全な転記を与えてもよい;値「tags」はビデオ・コンテンツに関連した一つまたは複数のテキスト・タグまたはキーワードを与えてもよい;値「summary」はユーザーが読むための、そのビデオ・コンテンツのテキストによる要約を提供してもよい;「content」〔コンテンツ〕内の値「some text」はテキスト・コンテンツの指示を与えてもよい;「tag1」、「tag2」を含むアレイは、追加的なコンテンツを得るために使用されるデータ・タームまたはフレーズのリストを提供してもよい。
JSONフォーマット内でテキスト・データを提供することは、JavaScript/EMCAScriptを理解するプラットフォームが、ビデオ・コンテンツに関連するテキスト・コンテンツを受領してそれと対話することを可能にする。JSON内の構造およびシンタックスは、アプリケーションが、該アプリケーションが受け取っているものを理解し、そのペイロードを適切に使用することを簡単にする。このように、ソフトウェアで実装されるNLPエンジンおよびHTML5/JS UIのようなコンテンツ処理システムのさまざまなコンポーネントが、そのようなデータの結果を処理し、使用し、表示するよう構成されていてもよい。
たとえば、コンテンツ処理システムは、JSONフォーマットのストリングをパースし、主題コンテンツに関係する関連性のあるメタデータおよび転記の行を決定するために、抽出器または他のテキスト・パース・コンポーネントを備えていてもよい。コンテンツの表示に先立ち、コンテキスト的キーワードを決定するためにプログラム・タグまたはタイトルのようなメタデータからキーワードが抽出されてもよい。コンテンツの表示の間、一時に一ラインずつ受領されうる転記テキスト(たとえばクローズドキャプションまたは字幕)については、コンテンツ処理システムは、この情報を受領されるにつれて待ち行列に入れ、関係した情報が位置特定され、決定されるもとになる、より大きな有用かつ関連性のあるフレーズを構築してもよい。
以下のNLP技法は、JavaScriptおよびJavaScriptベースのNLPエンジンを使って実装されてもよい。以下の記述されるNLP技法に対する変形が、コンテンツ処理システムにおいて展開されるNLPエンジンとの関連で実装されてもよいことは明白であろう。
テキスト・データ中のタームについて適正なコンテキストを得るために、テキスト・データに対して品詞〔パート・オブ・スピーチ〕タグ付けが適用されてもよい。たとえば、品詞タグ付けは、転記のライン内の単語にタグ付けする(品詞を割り当てる)ために使用されてもよい。以下に記述されるように、今記述しているNLP構成との関連で使用されうる品詞タグ付けに向けた多数のアプローチがある。
自動化されたテキスト・タグ付け動作のために使用可能なソフトウェア・アプリケーションの一つの限定しない例は、EngTagger(英語品詞タグ付け器ライブラリ(English Part-of-Speech Tagger Library)、RubyForgeによって頒布されるオープンソースのソフトウェア・プロジェクト)である。これは、確率ベースの、コーパスでトレーニングされるタグ付け器で、検索辞書〔ディクショナリー〕および一組の確率値に基づいて品詞タグを英語テキストに割り当てる。EngTaggerは、JavaScriptとの使用のための移植性を提供しており、よって今記載しているHTML5/JavaScript動作環境との関連で統合されてもよい。
NLPとの関連で実行されうるタグ付けの一つの型はユニグラム・タグ付けである。ユニグラム・タグ付けは、レキシコンの検索により、関連付けのための最も蓋然性の高いタグを決定するために、単一片(一般には単一の単語)の情報を使う。コーパスを与えられたとき、コーパス中の各単語についてレキシコンが生成され、コーパス中でその単語が特定の品詞として現われる回数のカウントを付けた単語を与える。たとえば、「Peter」はコーパス中で固有名詞として110回タグ付けされることがあり、一方「let」のような単語は名詞として10回、動詞として83回タグ付けされることがありうる。この情報から、諸品詞がセンテンスに割り当てられてもよい。
ユニグラム・タグ付けを用いて品詞を割り当てるには、センテンスはまず個々のトークンに分割される必要がある(たとえばトークン化器を使って)。次いで、テキストはユニグラム・タグ付けを実行するタグ付け器に通される。センテンスについてのユニグラム・タグ付けの結果はたとえば、次のようにフォーマットされてもよい:
I/PRP walked/VBD the/DET dog/NN this/DET morning/NN before/IN work/NN ./PP
タグのセットは何らかの標準に従って定義されてもよい。可能なタグのサブセットは、限定ではなく例解のために与えておく:PRP=決定詞、所有第二;VBD=動詞、過去時制;DET=決定詞;NN=名詞(単数);IN=前置詞または接続詞;PP=句読点、文末符。
NLPにおいてタグ付けとともに使うためのもう一つの技法は、バイグラム・タグ付けの使用に関わる。この形のタグ付けは、より多くの「インテリジェンス」をアルゴリズムに加えるために使われる。すなわち、単に(その単語が属するかもしれない可能な品詞の集合のうちから)最も蓋然性の高い品詞を適用するのではなく、直前のタグとの関連で確率が決定される。こうして、ある単語についての最も蓋然性の高いタグは、実際には「直前の語に対するタグがXであったということが与えられたときの最も蓋然性の高いタグ」となる。
バイグラム・タグ付けを実行するためには、あるタグから別のタグへの遷移の確率を表わすために第二のデータ・セットが使用されてもよい。こうした確率は、コーパス中のタグ・シーケンスに基づいてタグ付け器をトレーニングすることによって導出されてもよい。たとえばEngTaggerライブラリから提供されるタグ遷移データ・セットが、NLPエンジンによって使用されてもよい。NLPエンジンはこのデータ・セットをもとのタグ確率セットと組み合わせて、両方のデータ・セットをテキスト・センテンスに適用してもよい。この技法は、タグ付け精度を改善するためにビタビ・アルゴリズムの修正との関連で使用されてもよい。
NLP処理との関連で使用されうる多様な他のタグ付けモデルおよび例が存在する。これらは、正規表現との比較によるタグ付け;変換規則との組み合わせにおけるタグ付け;確からしいタグ・シーケンスに基づくタグ付け;および他のモデルを含む。いくつもある単純なまたは包括的なアプローチが、HTML5/JavaScript UIを実装するコンテンツ処理システムおよびクライアントとの関連で、NLP技法のために使用されうる。
テキストのタグ付けに応答して、一つまたは複数の単数形または複数形の固有名詞のような特定のタームのシーケンスが識別されうる。たとえば、シーケンスは、NNP(固有名詞、単数形)およびNNPS(固有名詞、複数形)のシーケンスであって任意的に固有名詞間に接続詞(たとえば「and」)または前置詞(たとえば「of」)をもつものを探すことによって実行されてもよい。チャンク・パース方法の進んだ諸実装との関連で他の技法が使われてもよい。
キーワード・タグ付け以外の技法が、テキスト・シーケンスにおけるキーワードおよびフレーズのコンテキストおよび重要性を取得するために使われてもよい。これらはたとえば、あるフレーズが転記内で「重要」かどうかを決定するのを助けるために、転記全体内で各シーケンスが生起する回数の計数を要因として含めることを含んでいてもよい。
先のタグ付けの諸技法は一般に、NLP環境における自由なインデックス付けを可能にする一つのアプローチを記述している。自由なインデックス付けは、任意のテキストの処理を可能にするが、いくつもの関連性のないタームを得たり、あるいは逆に関連性のある関係したタームを無視することがある(たとえば、「notebook」〔ノートブック〕と「laptop」〔ラップトップ〕が同義であるにもかかわらず異なるキー・フレーズとして扱われる)。インデックス付けの適合性を改善するための一つのアプローチは、「制御されたインデックス付け」として知られている。これは、既知のフレーズをインデックス・タームにマッピングする(たとえば「notebook」および「laptop」は、単一の、キーとなる共有されるフレーズ「laptop」をトリガーすることができる)。
ひとたびキー・フレーズが抽出されたら、NLPエンジンは、新しいキー・フレーズをリスナーに通知する、あるいはそれらのタームに関連する他の好適な処理を実行するよう構成されていてもよい。たとえば、テキスト抽出器が、新しいキー・フレーズの結果としてコンテンツ処理システムから「newKeyPhrase」〔新キー・フレーズ〕イベントを開始するとともに、遭遇するすべてのキー・フレーズについて「keyPhraseCounted」〔キー・フレーズ計数〕イベントを開始するよう構成されていてもよい。イベント・リスナーは、検索クエリーを実行するおよびユーザー・プロンプトを提供するといった好適なアクションをもって応答するために、これらのテキスト処理イベントの発生を傾聴するよう構成されていてもよい。イベントの観察者は、その情報を使うまたはそれを無視することを決定してもよい。こうして、そのような実施形態では、潜在的なキーワードおよび検索クエリーを見出すことは、どのクエリーを検索源に与えるかを選択するのとは独立に実行される。
さらなる向上は、さらなるデータをキー・フレーズ・イベントに追加することを含んでいてもよい。たとえば、NLPとの関連で、たとえば、コンテンツ処理システムは、テキスト中の固有表現(named entity)を探し、キー・フレーズがあればそれに分類(たとえば「場所」「人物」「組織」)をもってマーク付けしてもよい。他のコンテキスト・ベースのタームがNLPの最中に追加されてもよい。
NLPの実行は、コンテキストに富む環境において潜在的に関連性がある多様なキー・フレーズおよびタームを検出しうるが、NLPシステムによって検出されるタームおよびフレーズのすべてがコンテンツの位置特定または取得のために好適であるまたは望ましいわけではないことがある。そこで、識別されたキー・タームおよびフレーズをコンテンツを位置特定または取得するための検索クエリーのために使うかどうかを決定するために、処理システムによって、追加的な選択基準が使用されてもよい。
たとえば、クエリー選択は、キー・タームまたはフレーズが検索クエリーとして使うに値するかどうかを決定するために一連のフィルタを使ってもよい。この決定を助けるために、クエリー選択器は:キー・フレーズ;そのキー・フレーズが転記またはテキスト・リスティング内で生起した回数;および現在のプログラムによって提供されるコンテンツを要因として含めてもよい。それは、(デフォルトにより):それまでにみつかったすべての検索結果;該検索結果から生成された文書があればその文書(テキストの語幹処理されたバージョンおよび各語幹についての計数を含む);検索された以前のクエリーがあればそのクエリー;およびこれまでの転記またはテキスト・リスティング全体。あるキー・フレーズをクエリーとして選択するかどうかを決定するために、複数のフィルタが並列に適用されてもよい。
コンテンツ処理システムは、同じキー・フレーズが二回以上検索されないよう、すでに検索(もとのコンテンツを得るための検索を含む)として使われたキー・タームおよびフレーズを追跡するよう構成されていてもよい。各候補キー(名詞)フレーズに重みが適用されてもよい。たとえば、そのような重みは次式から確立されてもよい:
生起回数×(フレーズ中の語数×フレーズ中の語数)
コンテンツ処理システムは、何らかの構成設定可能な値を超える、たとえば3以上の重みをもつフレーズのみを検索するよう構成されていてもよい。そのような値は、単独語の固有名詞句が検索されるためには三回生起する必要があることを要求しうる。一方、二語の名詞句は一回生起するだけでよい。このアプローチは、特にコンテンツのノンフィクション転記のような「エンティティに富む」テキストに対して合理的な結果を生じる。
クエリー選択は、潜在的なクエリー、たとえばNLPによって生成されるキー・フレーズ内の構造からも裨益してもよい。さらなる実施形態では、固有表現抽出および固有名詞外の要素についてのチャンク・パースが、NLP技法と関連して使用されてもよい。
NLP技法は、キー・フレーズを選ぶときにコンテキストを得るよう試みてもよい。たとえば、NLPエンジンからのキー・フレーズを解析してどのフレーズが部分的にまたは完全に前の諸検索タームから重なっているかを判別することによって、NLPエンジンはそれらのフレーズのコンテキストを導出することができてもよい。これは、フレーズ(またはコンテンツ項目)の複数のストリームを通じたリンケージおよびスレッドを生成し、それらの間で共通のコンテキストを識別することになる。そのような技法は、コンテンツの複数のセット(たとえばドキュメンタリー・シリーズ)を解析し、ユーザー関心対象のテーマを識別して、単語およびフレーズについての定義の典型的な範囲を確立するときに適用されてもよい。たとえば、あるセグメントにおいて繰り返し使われている単語が何らかのコンテキストと関連付けられてもよい。たとえば、自然ドキュメンタリーにおいて使用されうる、「bass fish」〔バス魚〕のように使われるターム「bass」に対して、音楽ドキュメンタリーにおいて「bass guitar」〔ベース・ギター〕としての「bass」である。
一つまたは複数の源からの関係するコンテンツを決定するために、多様な使用事例が今記載している自然言語処理技法を実装しうる。単一キーワードへのコンテンツの「最良一致」を見出そうとするコンテンツ検索エンジンとは対照的に、今記載しているNLP技法は、複数のキーワードからのコンテンツのコンテキストに基づいて、ユーザーにとって有用であり関心のある関係したコンテンツの諸セットを提供するよう適応されうる。「関係した」コンテンツを位置特定しようとするとき、NLP技法は、かろうじて関係している概念――最も頻繁に使われる単語の単純なキーワード検索からは必ずしも得られないであろう概念――を同定するために使われてもよい。あるジャンルまたは他のより大きなコンテンツ範疇内での当該コンテンツのコンテキストを決定することは、NLP技法が移りゆくコンテンツをもつメディアにとって(たとえば、複数のコンテンツ・セグメントを提供するニュース・ビデオ番組において)特に価値あるものとなることを許容する。
たとえば、ニュース・ビデオ番組コンテンツの呈示において、ビデオのコンテキストは、字幕またはクローズドキャプション・テキストとの関連で決定されうる。同様に、番組を記述するテキスト・データまたは番組に関連付けられた動画像専門家グループ(MPEG: Moving Picture Experts Group)フォーマット・メタデータが、コンテキストを決定するためのテキスト源として使用されてもよい。メディアのコンテキストは、たとえば番組のジャンル/記述から、番組を見る前に決定されてもよい。NLP技法は、さらなる関連性のあるコンテンツまたはユーザー駆動の活動を決定するために、ツイッター、フリッカー、ウィキペディアなどのようなコンテンツおよびソーシャル・メディア・サイトを横断してキー・タームの潜在的なクエリーを決定するために使われてもよい。そうしたクエリーは、コンテンツを動的に取得して送達するよう、HTML5/JSインターフェース内に統合されてもよい。
NLPの結果として決定された関係したコンテンツは、手動または自動的な機能の任意の組み合わせをもって、いくつもある形またはフォーマットの任意のもので提供されてもよい。たとえば、関係したコンテンツは、同様の型のコンテンツの検索結果;検索を実施するまたはウェブサイトを訪問するユーザー・プロンプト;関連性のある広告;関連性のあるユーザー対話ディスプレイおよび機能対話;および関係したメタデータ対話を含んでいてもよい。
図3は、ある例示的な実施形態に基づく自然言語処理との関連で決定された関係したコンテンツに基づいて、ユーザーのために関係したコンテンツを提供することを可能にされたHTML5/JavaScript対応のグラフィカル・ユーザー・インターフェース窓300の例解を与えている。図のように、グラフィカル・ユーザー・インターフェース窓302は、タイトル・パネル304と、表示パネル306、312および318を含んでいる。表示パネル306、312、318のそれぞれは、さまざまな源からの何らかの関係したコンテンツのグラフィック表示を提供する。その特定の関係したコンテンツ表示は、NLPから導出されるキーワードの結果として決定される。
たとえば、ユーザーが車安全性のドキュメンタリー(タイトル324によって記される)を見ているとき、このドキュメンタリー番組に関連付けられた、クローズドキャプション、字幕およびプログラミング・メタデータのようなテキスト・コンテンツから多様なキーワードが導出されうる。番組が閲覧され、テキストのストリームが得られるにつれて、テキスト中に現われるさまざまなキー・ターム・ワードおよびフレーズ(たとえば事故326、車安全テスト328、身を守る運転術330)が導出されうる。ターム「車(car)」と「自動車(automobile)」は同義であり、「身を守る運転術(defensive driving)」は「オフェンス(offense)」やモータースポーツ(motor sports)とは何ら関係のない自動車両(motor vehicle)に関連して生起する人間活動をいうので、キー・ターム326、328、330はたとえばコンテキスト依存的であってもよい。
キー・ターム326、328、330はユーザー入力のために表示されてもよく、関係したコンテンツを表示するために直接、たとえば該キーワードの一つまたは複数のカーソル選択によって、対話されてもよい。あるいはまた、キーワードは、表示パネル306、312、318の一つまたは複数においてコンテンツまたはコンテンツ・リンクを自動的に生成するために使われてもよい。表示パネルは、もとのコンテンツの共通のテーマは車安全性のドキュメンタリーであったが、「安全性テスト」、「車修理」および「車購入」といった関係したトピックがユーザーにとって関心のある関係したコンテンツになりうることを示している。
具体的には、パネル306は、ソーシャル・メディア・サービスなどからのビデオのイラスト310および記述308を提供し、これらはユーザーによって選択されうる。パネル312は、オンライン百科事典項目のイラスト316および記述314(コンテンツのスナップショットまたは抜粋など)を提供し、これらはユーザーによって選択されうる。パネル318は、オンライン書店などからユーザーが購入しうる商品またはサービスのイラスト322および記述320を提供する。
パネル306、312、318のそれぞれは、ビデオ、アニメーション、ロゴおよび他の動的コンテンツの形で向上されたイラストを提供するために使用されてもよい。図3に示されるユーザー・インターフェース窓302によって受け容れられるユーザー対話は、画面上選択、ナビゲーション・ボタン、キーボードまたは音声コマンドなどといった、いくつもある形の任意のものを有していてもよい。さらに、図3に示されるユーザー・インターフェースは、タブレット・コンピュータのようなポータブル・モバイル・コンピューティング環境において提供され、関心のある関係したコンテンツをナビゲートして選択するようユーザー・タッチ・コマンドおよびジェスチャーを受領するよう適応されていてもよい。
図4は、ある例示的な実施形態に基づくマルチメディア・データ・ストリームによって提供されるテキスト・データの自然言語処理のための方法400を示すフローチャートを与えている。このプロセス400の実行は、全体的または部分的に、先述したコンテンツ処理システムおよびNLPエンジンを用いて生起してもよい。
動作410において示されるように、コンテンツに関連付けられたテキスト・ストリームがNLPのためにアクセスされる。このテキスト・ストリームは、メディア装置によって(たとえばある種のマルチメディア・コンテンツの再生中に)コンテンツ処理システムに提供されてもよく、あるいは何らかのデータ源からコンテンツ処理システムによって取得されてもよい。テキスト・ストリームは、その時点でのまたは遅延された処理のためにNLPエンジンに直接的または間接的に提供されてもよい。
動作420では、タグおよびタグ付け技法が、テキスト・ストリームからのテキスト要素に適用される。たとえば、タグをテキストからのアーティクル・オブ・スピーチ(articles of speech)に関連付けるために、先述したイングラム(in-gram)タグ付け技法がNLPエンジンによって適用されてもよい。代替的な実施形態では、NLPエンジンに提供されるテキスト・ストリームが処理に先立って部分的または全体的にタグ付けされてもよい。
動作430では、アーティクル・オブ・スピーチ・タグ付けまたは他のインデックス付け基準に基づいて、テキスト要素がNLPエンジンによってインデックス付けされる。たとえば、インデックス付けは、固有名詞としてタグ付けされたテキスト要素について生起数を同定してもよい。インデックス付けの結果は、動作440において、それらのテキスト要素のうちから、固有名詞またはフレーズといったキー・タームを同定するために使われてもよい。たとえば、キー・タームは、動作430のインデックス付けによって示される、所定の頻度で現われる(または何らかの決められた生起数を超える)テキスト要素として同定されてもよい。
動作450では、キー・タームのコンテキストが同定される。たとえば、ある種のキー・タームは互いの同義語または反義語であることがあり、関係したコンテンツを位置特定するために適正なコンテキストを決定し、キー・タームを消去、整理統合または増強するためにコンテキスト依存的なテキスト処理が使われてもよい。さらに、どんな型のコンテンツ(たとえばビデオまたはオーディオのようなある種のコンテンツ種別)が、テキスト・ストリームを提供するもとのコンテンツに最も関係していて、関連性があるかを識別するために、それらのキー・タームからコンテキスト情報が導出されてもよい。コンテキストを位置特定して導出するとともに、どのキー・タームが最も価値あるかを決定するために、多様な処理アルゴリズムが使用されてもよい。
動作460では、キー・タームは、関係したコンテンツを位置特定し、取得するための動作と関連して使用される。たとえば、キー・タームは、追加的な関係したコンテンツをオファーしてストリーミングするために、コンテンツ・プロバイダーからのインターネット検索との関連で使用されてもよい。それらのキーワードを用いてコンテンツのさまざまなリスティングおよび推薦が得られて、ユーザーがコンテンツをさらに選択してストリーミングできるようにしてもよい。関係したコンテンツの位置特定、取得および表示は、本稿でさらに述べるように、HTML5/JavaScript準拠環境において生起してもよい。
図5は、ある例示的な実施形態に基づく。自然言語によって与えられるコンテンツ・タームを使って関係したコンテンツを決定するための方法500を示すフローチャートを与えている。動作510に示されるように、第一のコンテンツに関連付けられたテキストが処理のために受領される。このテキストは、一つまたは複数のAPIとの関連で装置によって与えられてもよく、あるいはこのテキストは、何らかの第一のコンテンツの通知または検出に応答して処理システムによって取得されてもよい。
動作520では、NLP(たとえば、図4に示したプロセスによって実行されるもの)が第一のコンテンツに関連付けられたテキストに対して実行される。自然言語処理は、関係したコンテンツの決定に有用な単語またはフレーズといったキー・テキスト・タームを導出する。
動作530は、キー・テキスト・タームを使って関係したコンテンツを決定するために実行される。関係したコンテンツは、処理システムによってアクセス可能なテキスト・インデックスとの関連で提供されてもよい。関係したコンテンツは、処理システムによってアクセス可能な検索サービスとの関連で、上記キー・タームを使った提供される検索サービスへのクエリーを用いて、提供されてもよい。
動作530の実行に応答して、関係したコンテンツ項目または関係したコンテンツ項目のグループといった関係したコンテンツが決定される。いくつかの実施形態では、該関係したコンテンツの表示または使用に進む前に、潜在的な関係したコンテンツのリストをユーザーに対して呈示する結果などから、さらなるユーザー選択が処理されてもよい。動作540では、関係したコンテンツから第二のコンテンツを選択するためにユーザー選択が受領される。ある実施形態では、ユーザー選択は、選好の形で事前に確立されている。それにより該選好に基づく第二のコンテンツの自動的な送達または表示が引き起こされる。別の実施形態では、第二のコンテンツのユーザー選択を受け容れるよう、UI(またはUI内のプロンプト)が提供される。
最後に、動作550では、(第一のコンテンツに関係している)第二のコンテンツがユーザーに提供される。第二のコンテンツは、第一のコンテンツに関連付けられたのと同じディスプレイまたはメディア出力に提供されてもよく;あるいはまた、第二のコンテンツは第一のコンテンツに関連付けられたのとは異なるディスプレイまたはメディア出力に提供されてもよい。たとえば、ユーザーが第一のコンテンツをテレビジョンに表示している場合、第二のコンテンツはそのテレビジョンでの同時のまたはのちの表示のために提供されてもよいし;あるいは第二のコンテンツはそのテレビジョンとは独立に動作するモバイル装置上での同時のまたはのちの表示のために提供されてもよい。
先述した技法は、いくつもある処理システムおよび装置の任意のものとの関連で実行されてもよく、本稿に記載される言語処理の構成またはアルゴリズムに限定されるものではない。テキスト・コンテンツは、データのテキスト・ストリームとは独立なコンテンツから得られてもよい。たとえば、ビデオ・コンテンツに関連付けられたテキストは、音声および発話認識、光学式文字および画像テキスト認識および機械実装される言語翻訳を含むいくつもある自動化された技法の任意のものの組み合わせによって得られてもよい。
上記の例のいくつかはテレビジョン番組のようなマルチメディア・ビデオ・コンテンツを参照して与えたが、本技法との関連でそのようなコンテンツに対して実行される処理は、幅広い多様な単一メディアおよびマルチメディアのデータおよびフォーマットに拡張されうる。これは、三次元(3D)ディスプレイ・コンテンツ(3Dビデオなど);テキスト・コンテンツ(電子書籍、記事および他の刊行物など);静的視覚コンテンツ(写真など);およびオーディオ・コンテンツ(音楽およびラジオなど)を含んでいてもよい。さらに、位置特定されユーザーに提供される関係したコンテンツは、位置特定されユーザーに提供されるもとのコンテンツとは異なるフォーマットであってもよい(たとえば、もとのテキスト・コンテンツに応答してビデオの関係したコンテンツを提供することおよびその逆)。さらに、NLPおよびユーザー・インターフェース技法は、(ビデオまたはオーディオの形またはその他の)コンテンツをユーザーに対して表示し、容易にし、あるいは出力することができるいくつもある電子装置の任意のものと一緒に動作するために構成されていてもよい。
他の適用可能なネットワーク構成が、今記載されている通信ネットワークの範囲内に含められてもよい。無線ローカル・エリア・ネットワーク構成および広域インターネット・ネットワーク接続を用いて例が与えられたが、通信は、有線または無線伝送媒体の任意の組み合わせを使って、いくつもあるパーソナル・エリア・ネットワーク、ローカル・エリア・ネットワーク(LAN)および広域ネットワーク(WAN)の任意のものを使って容易にされてもよいことは理解されるであろう。
実施形態は、ハードウェア、ファームウェアおよびソフトウェアの一つまたは組み合わせにおいて実装されてもよい。実施形態は、少なくとも一つのコンピュータ可読記憶デバイス上に記憶された命令として実装されてもよく、該命令が、本稿に記載される動作を実行するために少なくとも一つのプロセッサによって読まれ、実行されてもよい。コンピュータ可読記憶デバイスは、機械(たとえば、コンピュータ、スマートフォン、電子装置)によって読み取り可能な形で情報を記憶するための任意の非一時的な機構を含んでいてもよい。たとえば、コンピュータ可読記憶デバイスは、読み出し専用メモリ(ROM)、ランダム・アクセス・メモリ(RAM)、磁気ディスク記憶媒体、光記憶媒体、フラッシュメモリ・デバイスおよび他の記憶デバイスおよび媒体を含んでいてもよい。いくつかの実施形態では、本稿に記載される電子装置およびコンピューティング・システムは、一つまたは複数のプロセッサを含んでいてもよく、コンピュータ可読記憶デバイス上に記憶された命令をもって構成されてもよい。
図6は、本稿で論じた方法論の任意の一つまたは複数が実行できる例示的な機械を示すブロック図である。代替的な実施形態では、機械はスタンドアローン装置として動作するまたは他の機械に接続(たとえばネットワーク接続)されることができる。ネットワーク接続された展開では、機械は、サーバー‐クライアント・ネットワーク環境におけるサーバーまたはクライアント機械のいずれかの資格で動作でき、あるいはピアツーピア(または分散式)ネットワーク環境においてピア機械として作用できる。機械は、パーソナル・コンピュータ(PC)、タブレットPC、セットトップボックス(STB)、携帯情報端末(PDA)、携帯電話、ウェブ機器、ネットワーク・ルータ、スイッチまたはブリッジまたは当該機械が取るべき行動を指定する命令(逐次的またはそれ以外の)を実行することができる任意の機械であることができる。さらに、単一の機械しか示されていないが、用語「機械」は、本稿で論じた方法論の任意の一つまたは複数を実行するための命令のセット(または複数のセット)を個々にまたは合同して実行する機械の任意の集合を含むものとも解釈される。
例示的なコンピュータ・システム600はプロセッサ602(たとえば、中央処理ユニット(CPU)、グラフィック処理ユニット(GPU)または両方)、メイン・メモリ604および静的メモリ606を含み、これらはバス608を介して互いと通信する。コンピュータ・システム600はさらに、ビデオ・ディスプレイ・ユニット610、英数字入力装置612(たとえばキーボード)およびUIナビゲーション装置614(たとえばマウス)を含むことができる。ある実施形態では、ビデオ・ディスプレイ・ユニット610、入力装置612およびUIナビゲーション装置614はタッチスクリーン・ディスプレイである。コンピュータ・システム600はさらに、記憶装置616(たとえばドライブ・ユニット)、信号生成装置618(たとえばスピーカー)、ネットワーク・インターフェース装置620(これは一つまたは複数のアンテナ628、トランシーバまたは他の無線通信ハードウェアを含んでいてもよく、またはそれらと動作可能に通信してもよい)および全地球測位システム(GPS)センサー、コンパス、加速度計または他のセンサーのような一つまたは複数のセンサー(図示せず)を含むことができる。
記憶装置616は、本稿に記述される方法論または機能の任意の一つまたは複数を具現するまたはそれによって利用されるデータ構造および命令624(たとえばソフトウェア)の一つまたは複数のセットが記憶されている少なくとも一つの機械可読媒体622を含む。命令624は、コンピュータ・システム600によるその実行中、完全にまたは少なくとも部分的に、メイン・メモリ604、静的メモリ606内および/またはプロセッサ602内に存在することもできる。メイン・メモリ604、静的メモリ606およびプロセッサ602も機械可読媒体をなす。
機械可読媒体622は例示的な実施形態では単一の媒体として示されているが、用語「機械可読媒体」は、前記一つまたは複数の命令624を記憶する単一の媒体または複数の媒体(たとえば中央集中されたまたは分散されたデータベースおよび/または関連したキャッシュおよびサーバー)を含むことができる。用語「機械可読媒体」は、機械による実行のための、該機械に本開示の方法論の任意の一つまたは複数を実行させる命令を記憶、エンコードまたは担持することができる、あるいはそのような命令によって利用されるまたはそのような命令に関連するデータ構造を記憶、エンコードまたは担持することができる任意の有体の媒体を含むものと解釈される。よって、用語「機械可読媒体」は、固体メモリおよび光学式および磁気式媒体を含むがそれに限られないものと解釈される。機械可読媒体の具体例は、たとえば半導体メモリ・デバイス(たとえば、電気的にプログラム可能な読み出し専用メモリ(EPROM)、電気的に消去可能なプログラム可能型読み出し専用メモリ(EEPROM))およびフラッシュメモリ・デバイス;内蔵ハードディスクおよびリムーバブル・ハードディスクのような磁気ディスク;光磁気ディスク;およびCD-ROMおよびDVD-ROMディスクを含む不揮発性メモリを含む。
命令624はさらに、いくつものよく知られた転送プロトコル(たとえばHTTP)の任意のものを利用するネットワーク・インターフェース装置620を介して伝送媒体を使って通信ネットワーク626上で送信または受信されることができる。通信ネットワークの例は、LAN、WAN、インターネット、モバイル電話ネットワーク、旧来式電話(POTS)ネットワークおよび無線データ・ネットワーク(たとえばWi-Fi、3Gおよび4G LTE/LTE-AまたはWiMAXネットワーク)を含む。用語「伝送媒体」は、機械による実行のための命令を記憶、エンコードまたは担持することができる任意の有体でない媒体を含むと解釈され、デジタルまたはアナログ通信信号またはそのようなソフトウェアの通信を容易にするための他の有体でない媒体を含む。
今記述される方法、システムおよび装置実施形態のさらなる例は、以下の限定しない構成を含む。以下の限定しない例のそれぞれは、それ自身で成立しうるものであり、あるいは以下に与えられるまたは本開示全体を通じた他の例の任意の一つまたは複数との任意の置換または組み合わせにおいて組み合わされうる。
実施例1は、少なくとも一つのプロセッサと、複数の命令を記憶している少なくとも一つのメモリ・デバイスとを有する装置であって、前記複数の命令は、前記プロセッサによって実行されたときに、前記プロセッサに、動的ブラウザー・グラフィカル・ユーザー・インターフェースにおけるスクリプティング・コマンドを実行して: 一つまたは複数のメディア・コンテンツ項目から得られたテキストの自然言語処理を実行してコンテキストに関連性のあるタームを同定し; 前記コンテキストに関連性のあるタームを使って一つまたは複数のコンテンツ源から一つまたは複数の関係したコンテンツ項目を位置特定し; 前記関係したコンテンツ項目を前記動的ブラウザー・グラフィカル・ユーザー・インターフェースにおいて表示する動作を実行させるものである、装置を含む。
実施例2では、実施例1の主題が任意的に、前記動的ブラウザー・グラフィカル・ユーザー・インターフェースにおける前記メディア・コンテンツ項目の表示を含むことができる。
実施例3では、実施例1〜2の一つまたは任意の組み合わせの主題が任意的に、第二の装置を使ってユーザーに提供される前記メディア・コンテンツ項目の表示を含むことができ、ここで、前記関係したコンテンツ項目の表示は前記メディア・コンテンツ項目の前記表示に協調させられる。
実施例4では、実施例1〜3の一つまたは任意の組み合わせの主題が任意的に、前記動的ブラウザー・グラフィカル・ユーザー・インターフェースにおいて実行される前記スクリプティング・コマンドがJavaScript命令を実行することによって実行され、前記動的ブラウザー・グラフィカル・ユーザー・インターフェースは、HTML5マークアップ言語標準に準拠する一つまたは複数のウェブページまたはウェブ・アプリケーションをレンダリングすることを含むことができる。
実施例5は、コンピューティング装置によって実行される方法であって: グラフィカル・ユーザー・インターフェース内でクライアント側スクリプティング・コマンドを実行することによってコンテンツと関連付けられたテキストの自然言語処理を実行する段階であって、前記自然言語処理は: 前記テキスト中の複数のキー・ターム候補を同定し; 前記テキスト内での使用に基づいて前記キー・ターム候補からコンテキストに依存するキー・タームを選択することを含む、段階と; 前記コンテキストに依存するキー・タームを使って一つまたは複数のコンテキスト源から関係したコンテンツを判別する段階と; 前記グラフィカル・ユーザー・インターフェースにおいて前記関係したコンテンツをユーザーに対して表示する段階とを含む、方法を含むことができるまたは任意的に実施例1〜4の一つまたは任意の組み合わせの主題と組み合わされて該方法を含むことができる。
実施例6では、実施例5の主題は任意的に、前記グラフィカル・ユーザー・インターフェースがブラウザーであり、前記グラフィカル・ユーザー・インターフェースにおいて前記関係したコンテンツを表示する段階が、前記ブラウザーを使ってHTML5マークアップ言語標準に準拠するウェブページまたはウェブ・アプリケーションにおいて前記関係したコンテンツの表示を提供することを含むことができる。
実施例7では、実施例5〜6の一つまたは任意の組み合わせの主題が任意的に、前記クライアント側スクリプティング・コマンドを実行することが、前記グラフィカル・ユーザー・インターフェース内で一つまたは複数のJavaScriptスクリプティング・コマンドを使って前記テキストの前記自然言語処理を実行することを含むことを含むことができる。
実施例8では、実施例5〜7の一つまたは任意の組み合わせの主題が任意的に、前記テキスト中の前記複数のキー・ターム候補を同定することが: 前記テキスト中の、一つまたは複数のあらかじめ定義された基準を満たす一つまたは複数の固有名詞およびフレーズからキー・ターム候補を選択することを含む、ことを含むことができる。
実施例9では、実施例5〜8の一つまたは任意の組み合わせの主題が任意的に、前記テキスト中の前記複数のキー・ターム候補を同定することが: 前記テキストにアクセスし; 前記テキストに一つまたは複数の品詞をタグ付けし; 前記テキストに、品詞ごとの単語の頻度に基づいてインデックス付けし; 前記テキストの前記インデックス付けを使ってフレーズおよび固有名詞からキー・ターム候補を決定することを含み、前記キー・ターム候補から前記コンテキストに依存するキー・タームを選択することが: 前記テキスト内の前記キー・ターム候補のコンテキストを決定し; 前記テキスト内の一つまたは複数の他のキー・ターム候補と共通のコンテキストを有するキー・ターム候補を選択することを含む、ことを含むことができる。
実施例10では、実施例5〜9の一つまたは任意の組み合わせの主題が任意的に、前記グラフィカル・ユーザー・インターフェースにおいて前記関係したコンテンツをユーザーに対して表示する段階であって、前記コンテンツの表示と並行して行なわれる段階を含むことができる。
実施例11では、実施例5〜10の一つまたは任意の組み合わせの主題が任意的に、前記コンテンツおよび前記関係したコンテンツがそれぞれ前記グラフィカル・ユーザー・インターフェースにおいて表示され、前記グラフィカル・ユーザー・インターフェースはユーザーが操作できる同じ表示装置上に設けられる、ことを含むことができる。
実施例12では、実施例5〜11の一つまたは任意の組み合わせの主題が任意的に、前記関係したコンテンツを判別する段階が、前記一つまたは複数のコンテンツ源からの前記関係したコンテンツの検索を実行することを含み、前記検索は前記コンテキストに依存するキー・タームを含む、ことを含むことができる。
実施例13では、実施例5〜12の一つまたは任意の組み合わせの主題が任意的に、前記コンテンツがビデオを含み、前記コンテンツに関連するテキストが:ビデオ転記、字幕テキストまたは前記ビデオに関連付けられたクローズドキャプション・テキストの一つまたは複数を含む、ことを含むことができる。
実施例14は、コンピュータによって実行されたときに前記コンピュータにグラフィカル・ユーザー・インターフェースを提供させるコンピュータ可読命令を有するコンピュータ可読記憶媒体であって、前記グラフィカル・ユーザー・インターフェースは: 前記グラフィカル・ユーザー・インターフェースに与えられるスクリプティング命令を使って、第一のコンテンツのセットに関連するテキストの自然言語処理を実行して、一つまたは複数のコンテンツ・タームを抽出する段階と; 前記コンテンツ・タームを使って一つまたは複数のクエリーを実行して関係したコンテンツのセットを位置特定して取得する段階と; 前記関係したコンテンツを前記グラフィカル・ユーザー・インターフェースにおいて表示するよう構成されている、コンピュータ可読記憶媒体を含むことができ、あるいは実施例1〜13の一つまたは任意の組み合わせの主題と組み合わされて該コンピュータ可読記憶媒体を含むことができる。
実施例15では、実施例14の主題が任意的に、前記グラフィカル・ユーザー・インターフェースがブラウザーであり、前記関係したコンテンツの表示が、前記関係したコンテンツを含む一つまたは複数のウェブページをレンダリングすることによって提供され、前記関係したコンテンツを含む前記ウェブページは、HTML5マークアップ言語標準に準拠するユーザー対話式表示を提供する、ことを含むことができる。
実施例16では、実施例14〜15の一つまたは任意の組み合わせの主題が任意的に、前記ブラウザーにおける前記第一のコンテンツの表示を含むことができ、ここで、前記第一のコンテンツの表示は、前記第一のコンテンツを含む一つまたは複数のウェブページまたはウェブ・アプリケーションをレンダリングすることによって提供され、前記ウェブページまたはウェブ・アプリケーションは、HTML5マークアップ言語標準に準拠するユーザー対話式表示を提供する。
実施例17では、実施例14〜16の一つまたは任意の組み合わせの主題が任意的に、第一のコンテンツの前記セットに関連付けられた前記テキストが、前記コンテンツに関連付けられたリアルタイム・データストリームによって与えられることを含むことができる。
実施例18では、実施例14〜17の一つまたは任意の組み合わせの主題が任意的に、前記データストリームが:クローズドキャプション・テキスト、字幕テキストまたはメタデータの一つまたは複数から与えられることを含むことができる。
実施例19では、実施例14〜18の一つまたは任意の組み合わせの主題が任意的に、前記グラフィカル・ユーザー・インターフェースに与えられる前記スクリプティング命令が、JavaScript対応ディスプレイ環境における実行のために構成されたJavaScript命令であることを含むことができる。
実施例20は、ユーザーに対してコンテンツの第一のセットを出力するよう構成されている出力装置と; コンテンツの前記第一のセットに関連付けられたテキストから関係したコンテンツを提供するよう構成されているコンテンツ処理システムとを有するシステムであって、前記コンテンツ処理システムは: コンテンツの前記第一のセットに関係したタームを判別するよう構成された自然言語処理コンポーネントであって、自然言語処理はスクリプティング・コマンドを使って実行される、自然言語処理コンポーネントと; コンテンツの前記第一のセットに関係した前記タームを使って、コンテンツの前記第一のセットに関係したコンテンツの第二のセットを判別するよう構成されたコンテンツ検索コンポーネントと; ユーザーに対してコンテンツの前記第二のセットを、マークアップ言語を使ってユーザーに対して動的に生成された表示を提供するユーザー・インターフェース内で提供するよう構成されているユーザー・インターフェース・コンポーネントとを含んでいる、システムを含むことができ、あるいは任意的に実施例1〜19の一つまたは任意の組み合わせの主題と組み合わされて該システムを含むことができる。
実施例21では、実施例20の主題は任意的に、コンテンツの前記第一のセットおよびコンテンツの前記第一のセットに関連付けられた前記テキストを与える第一のコンテンツ源と; コンテンツの前記第二のセットを与える第二のコンテンツ源とを含むことができる。
実施例22では、実施例20〜21の一つまたは任意の組み合わせの主題が任意的に、前記出力装置が、ユーザーに対して前記ユーザー・インターフェースおよびコンテンツの前記第二のセットを出力するようさらに構成されていることを含むことができる。
実施例23では、実施例20〜22の一つまたは任意の組み合わせの主題が任意的に、ユーザーに対して前記ユーザー・インターフェースおよびコンテンツの前記第二のセットを出力するよう構成されている第二の出力装置を含むことができる。
実施例24では、実施例20〜23の一つまたは任意の組み合わせの主題が任意的に、前記コンテンツ検索および前記自然言語処理が、前記ユーザー・インターフェース内で実行されるスクリプティングを使って実行され、前記コンテンツ処理システムが前記出力装置のプロセッサ上で実行されるソフトウェア命令によって提供されることを含むことができる。
要約書は、技術的な開示の性質および要旨を読者が見極められるようにするために提供されている。要約書は、請求項の範囲または意味を限定または解釈するために使用されないという理解のもとに提出される。請求項はここに詳細な発明に組み込まれ、各請求項は別個の実施形態として成立する。
いくつかの態様を記載しておく。
〔態様1〕
少なくとも一つのプロセッサと、複数の命令を記憶している少なくとも一つのメモリ・デバイスとを有する装置であって、前記複数の命令は、前記プロセッサによって実行されたときに、前記プロセッサに、動的ブラウザー・グラフィカル・ユーザー・インターフェースにおけるスクリプティング・コマンドを実行して:
一つまたは複数のメディア・コンテンツ項目から得られたテキストの自然言語処理を実行してコンテキストに関連性のあるタームを同定し;
前記コンテキストに関連性のあるタームを使って一つまたは複数のコンテンツ源から一つまたは複数の関係したコンテンツ項目を位置特定し;
前記関係したコンテンツ項目を前記動的ブラウザー・グラフィカル・ユーザー・インターフェースにおいて表示する動作を実行させるものである、
装置。
〔態様2〕
前記複数の命令はさらに、前記プロセッサに、動的ブラウザー・グラフィカル・ユーザー・インターフェースにおける前記スクリプティング・コマンドを実行して:
前記動的ブラウザー・グラフィカル・ユーザー・インターフェースにおいて前記メディア・コンテンツ項目を表示する動作を実行させる、
態様1記載の装置。
〔態様3〕
前記メディア・コンテンツ項目の表示が第二の装置を使ってユーザーに提供され、前記関係したコンテンツ項目の表示は前記メディア・コンテンツ項目の前記表示に協調させられる、態様1記載の装置。
〔態様4〕
前記動的ブラウザー・グラフィカル・ユーザー・インターフェースにおいて実行される前記スクリプティング・コマンドはJavaScript命令を実行することによって実行され、前記動的ブラウザー・グラフィカル・ユーザー・インターフェースは、HTML5マークアップ言語標準に準拠する一つまたは複数のウェブページまたはウェブ・アプリケーションをレンダリングする、態様1記載の装置。
〔態様5〕
コンピューティング装置によって実行される方法であって:
グラフィカル・ユーザー・インターフェース内でクライアント側スクリプティング・コマンドを実行することによってコンテンツと関連付けられたテキストの自然言語処理を実行する段階であって、前記自然言語処理は:
前記テキスト中の複数のキー・ターム候補を同定し;
前記テキスト内での使用に基づいて前記キー・ターム候補からコンテキストに依存するキー・タームを選択することを含む、段階と;
前記コンテキストに依存するキー・タームを使って一つまたは複数のコンテキスト源から関係したコンテンツを判別する段階と;
前記グラフィカル・ユーザー・インターフェースにおいて前記関係したコンテンツをユーザーに対して表示する段階とを含む、
方法。
〔態様6〕
前記グラフィカル・ユーザー・インターフェースがブラウザーであり、前記グラフィカル・ユーザー・インターフェースにおいて前記関係したコンテンツを表示する段階が、前記ブラウザーを使ってHTML5マークアップ言語標準に準拠するウェブページまたはウェブ・アプリケーションにおいて前記関係したコンテンツの表示を提供することを含む、態様5記載の方法。
〔態様7〕
前記クライアント側スクリプティング・コマンドを実行することが、前記グラフィカル・ユーザー・インターフェース内で一つまたは複数のJavaScriptスクリプティング・コマンドを使って前記テキストの前記自然言語処理を実行することを含む、態様5記載の方法。
〔態様8〕
前記テキスト中の前記複数のキー・ターム候補を同定することが:
前記テキスト中の、一つまたは複数のあらかじめ定義された基準を満たす一つまたは複数の固有名詞およびフレーズからキー・ターム候補を選択することを含む、態様5記載の方法。
〔態様9〕
前記テキスト中の前記複数のキー・ターム候補を同定することが:
前記テキストにアクセスし;
前記テキストに一つまたは複数の品詞をタグ付けし;
前記テキストに、品詞ごとの単語の頻度に基づいてインデックス付けし;
前記テキストの前記インデックス付けを使ってフレーズおよび固有名詞からキー・ターム候補を決定することを含み、
前記キー・ターム候補から前記コンテキストに依存するキー・タームを選択することが:
前記テキスト内の前記キー・ターム候補のコンテキストを決定し;
前記テキスト内の一つまたは複数の他のキー・ターム候補と共通のコンテキストを有するキー・ターム候補を選択することを含む、
態様5記載の方法。
〔態様10〕
前記グラフィカル・ユーザー・インターフェースにおいて前記関係したコンテンツをユーザーに対して表示する段階が前記コンテンツの表示と並行して行なわれる、態様5記載の方法。
〔態様11〕
前記コンテンツおよび前記関係したコンテンツがそれぞれ前記グラフィカル・ユーザー・インターフェースにおいて表示され、前記グラフィカル・ユーザー・インターフェースはユーザーが操作できる同じ表示装置上に設けられる、態様5記載の方法。
〔態様12〕
前記関係したコンテンツを判別する段階が、前記一つまたは複数のコンテンツ源からの前記関係したコンテンツの検索を実行することを含み、前記検索は前記コンテキストに依存するキー・タームを含む、態様5記載の方法。
〔態様13〕
前記コンテンツがビデオを含み、前記コンテンツに関連するテキストが:ビデオ転記、字幕テキストまたは前記ビデオに関連付けられたクローズドキャプション・テキストの一つまたは複数を含む、態様5記載の方法。
〔態様14〕
コンピュータによって実行されたときに前記コンピュータにグラフィカル・ユーザー・インターフェースを提供させるコンピュータ可読命令を有するコンピュータ可読記憶媒体であって、前記グラフィカル・ユーザー・インターフェースは:
前記グラフィカル・ユーザー・インターフェースに与えられるスクリプティング命令を使って、第一のコンテンツのセットに関連するテキストの自然言語処理を実行して、一つまたは複数のコンテンツ・タームを抽出する段階と;
前記コンテンツ・タームを使って一つまたは複数のクエリーを実行して関係したコンテンツのセットを位置特定して取得する段階と;
前記関係したコンテンツを前記グラフィカル・ユーザー・インターフェースにおいて表示するよう構成されている、
コンピュータ可読記憶媒体。
〔態様15〕
前記グラフィカル・ユーザー・インターフェースがブラウザーであり、前記関係したコンテンツの表示が、前記関係したコンテンツを含む一つまたは複数のウェブページをレンダリングすることによって提供され、前記関係したコンテンツを含む前記ウェブページは、HTML5マークアップ言語標準に準拠するユーザー対話ディスプレイを提供する、態様14記載のコンピュータ可読記憶媒体。
〔態様16〕
前記命令がさらに、前記コンピュータに、前記ブラウザーにおいて前記第一のコンテンツを表示するよう構成された前記グラフィカル・ユーザー・インターフェースを提供させるものであり、
前記第一のコンテンツの表示が、前記第一のコンテンツを含む一つまたは複数のウェブページまたはウェブ・アプリケーションをレンダリングすることによって提供され、前記ウェブページまたはウェブ・アプリケーションは、HTML5マークアップ言語標準に準拠するユーザー対話ディスプレイを提供する、態様14記載のコンピュータ可読記憶媒体。
〔態様17〕
第一のコンテンツの前記セットに関連付けられた前記テキストが、前記コンテンツに関連付けられたリアルタイム・データストリームによって与えられる、態様14記載のコンピュータ可読記憶媒体。
〔態様18〕
前記データストリームが:クローズドキャプション・テキスト、字幕テキストまたはメタデータの一つまたは複数から与えられる、態様17記載のコンピュータ可読記憶媒体。
〔態様19〕
前記グラフィカル・ユーザー・インターフェースに与えられる前記スクリプティング命令が、JavaScript対応ディスプレイ環境における実行のために構成されたJavaScript命令である、態様14記載のコンピュータ可読記憶媒体。
〔態様20〕
ユーザーに対してコンテンツの第一のセットを出力するよう構成されている出力装置と;
コンテンツの前記第一のセットに関連付けられたテキストから関係したコンテンツを提供するよう構成されているコンテンツ処理システムとを有するシステムであって、
前記コンテンツ処理システムは:
コンテンツの前記第一のセットに関係したタームを判別するよう構成された自然言語処理コンポーネントであって、自然言語処理はスクリプティング・コマンドを使って実行される、自然言語処理コンポーネントと;
コンテンツの前記第一のセットに関係した前記タームを使って、コンテンツの前記第一のセットに関係したコンテンツの第二のセットを判別するよう構成されたコンテンツ検索コンポーネントと;
ユーザーに対してコンテンツの前記第二のセットを、マークアップ言語を使ってユーザーに対して動的に生成された表示を提供するユーザー・インターフェース内で提供するよう構成されているユーザー・インターフェース・コンポーネントとを含んでいる、
システム。
〔態様21〕
コンテンツの前記第一のセットおよびコンテンツの前記第一のセットに関連付けられた前記テキストを与える第一のコンテンツ源と;
コンテンツの前記第二のセットを与える第二のコンテンツ源とをさらに有する、態様20記載のシステム。
〔態様22〕
前記出力装置が、ユーザーに対して前記ユーザー・インターフェースおよびコンテンツの前記第二のセットを出力するようさらに構成されている、態様20記載のシステム。
〔態様23〕
ユーザーに対して前記ユーザー・インターフェースおよびコンテンツの前記第二のセットを出力するよう構成されている第二の出力装置をさらに有する、態様20記載のシステム。
〔態様24〕
前記コンテンツ検索および前記自然言語処理が、前記ユーザー・インターフェース内で実行されるスクリプティングを使って実行され、前記コンテンツ処理システムが前記出力装置のプロセッサ上で実行されるソフトウェア命令によって提供される、態様20記載のシステム。

Claims (22)

  1. 少なくとも一つのプロセッサと、複数の命令を記憶している少なくとも一つのメモリ・デバイスとを有する装置であって、前記複数の命令は、前記プロセッサによって実行されたときに、前記プロセッサに、動的ブラウザー・グラフィカル・ユーザー・インターフェースにおけるスクリプティング・コマンドを実行して:
    一つまたは複数のメディア・コンテンツ項目から得られたテキストの自然言語処理を実行してコンテキストに関連性のある複数のタームを同定し;
    前記コンテキストに関連性のあるタームを使って一つまたは複数のコンテンツ源から一つまたは複数の関係したコンテンツ項目を位置特定し;
    前記関係したコンテンツ項目を前記動的ブラウザー・グラフィカル・ユーザー・インターフェースにおいて表示する動作を実行させるものであ
    前記自然言語処理は:
    前記テキスト中の複数のターム候補を同定し;
    前記テキスト内での使用に基づいて前記ターム候補からコンテキストに関連性のある複数のタームを選択することを含み、
    前記テキスト中の前記複数のターム候補を同定することが:
    前記テキストにアクセスし;
    前記テキストに一つまたは複数の品詞をタグ付けし;
    前記テキストに、品詞ごとの単語の頻度に基づいてインデックス付けし;
    前記テキストの前記インデックス付けを使ってフレーズおよび固有名詞からターム候補を決定することを含み、
    前記ターム候補から前記コンテキストに関連性のある複数のタームを選択することが:
    前記テキスト内の前記ターム候補のコンテキストを決定し;
    前記テキスト内の一つまたは複数の他のターム候補と共通のコンテキストを有するターム候補を選択することを含む、
    装置。
  2. 前記複数の命令はさらに、前記プロセッサに、動的ブラウザー・グラフィカル・ユーザー・インターフェースにおける前記スクリプティング・コマンドを実行して:
    前記動的ブラウザー・グラフィカル・ユーザー・インターフェースにおいて前記メディア・コンテンツ項目を表示する動作を実行させる、
    請求項1記載の装置。
  3. 前記メディア・コンテンツ項目の表示が第二の装置を使ってユーザーに提供され、前記関係したコンテンツ項目の表示は前記メディア・コンテンツ項目の前記表示に協調させられる、請求項1記載の装置。
  4. 前記動的ブラウザー・グラフィカル・ユーザー・インターフェースにおいて実行される前記スクリプティング・コマンドはJavaScript命令を実行することによって実行され、前記動的ブラウザー・グラフィカル・ユーザー・インターフェースは、HTML5マークアップ言語標準に準拠する一つまたは複数のウェブページまたはウェブ・アプリケーションをレンダリングする、請求項1記載の装置。
  5. コンピューティング装置によって実行される方法であって:
    グラフィカル・ユーザー・インターフェース内でクライアント側スクリプティング・コマンドを実行することによってコンテンツと関連付けられたテキストの自然言語処理を実行する段階であって、前記自然言語処理は:
    前記テキスト中の複数のキー・ターム候補を同定し;
    前記テキスト内での使用に基づいて前記キー・ターム候補からコンテキストに依存する複数のキー・タームを選択することを含み、
    前記テキスト中の前記複数のキー・ターム候補を同定することが:
    前記テキストにアクセスし;
    前記テキストに一つまたは複数の品詞をタグ付けし;
    前記テキストに、品詞ごとの単語の頻度に基づいてインデックス付けし;
    前記テキストの前記インデックス付けを使ってフレーズおよび固有名詞からキー・ターム候補を決定することを含み、
    前記キー・ターム候補から前記コンテキストに依存するキー・タームを選択することが:
    前記テキスト内の前記キー・ターム候補のコンテキストを決定し;
    前記テキスト内の一つまたは複数の他のキー・ターム候補と共通のコンテキストを有するキー・ターム候補を選択することを含む、段階と;
    前記コンテキストに依存するキー・タームを使って一つまたは複数のコンテキスト源から関係したコンテンツを判別する段階と;
    前記グラフィカル・ユーザー・インターフェースにおいて前記関係したコンテンツをユーザーに対して表示する段階とを含む、
    方法。
  6. 前記グラフィカル・ユーザー・インターフェースがブラウザーであり、前記グラフィカル・ユーザー・インターフェースにおいて前記関係したコンテンツを表示する段階が、前記ブラウザーを使ってHTML5マークアップ言語標準に準拠するウェブページまたはウェブ・アプリケーションにおいて前記関係したコンテンツの表示を提供することを含む、請求項5記載の方法。
  7. 前記クライアント側スクリプティング・コマンドを実行することが、前記グラフィカル・ユーザー・インターフェース内で一つまたは複数のJavaScriptスクリプティング・コマンドを使って前記テキストの前記自然言語処理を実行することを含む、請求項5記載の方法。
  8. 前記グラフィカル・ユーザー・インターフェースにおいて前記関係したコンテンツをユーザーに対して表示する段階が前記コンテンツの表示と並行して行なわれる、請求項5記載の方法。
  9. 前記コンテンツおよび前記関係したコンテンツがそれぞれ前記グラフィカル・ユーザー・インターフェースにおいて表示され、前記グラフィカル・ユーザー・インターフェースはユーザーが操作できる同じ表示装置上に設けられる、請求項5記載の方法。
  10. 前記関係したコンテンツを判別する段階が、前記一つまたは複数のコンテンツ源からの前記関係したコンテンツの検索を実行することを含み、前記検索は前記コンテキストに依存するキー・タームを含む、請求項5記載の方法。
  11. 前記コンテンツがビデオを含み、前記コンテンツに関連するテキストが:ビデオ転記、字幕テキストまたは前記ビデオに関連付けられたクローズドキャプション・テキストの一つまたは複数を含む、請求項5記載の方法。
  12. コンピュータによって実行されたときに前記コンピュータにグラフィカル・ユーザー・インターフェースを提供させるコンピュータ可読命令を有するコンピュータ可読記憶媒体であって、前記グラフィカル・ユーザー・インターフェースは:
    前記グラフィカル・ユーザー・インターフェースに与えられるスクリプティング命令を使って、第一のコンテンツのセットに関連するテキストの自然言語処理を実行して、コンテキストに関連性のある複数のタームを抽出する段階であって、
    前記自然言語処理は:
    前記テキスト中の複数のターム候補を同定し;
    前記テキスト内での使用に基づいて前記ターム候補からコンテキストに関連性のある複数のタームを選択することを含み、
    前記テキスト中の前記複数のターム候補を同定することが:
    前記テキストにアクセスし;
    前記テキストに一つまたは複数の品詞をタグ付けし;
    前記テキストに、品詞ごとの単語の頻度に基づいてインデックス付けし;
    前記テキストの前記インデックス付けを使ってフレーズおよび固有名詞からターム候補を決定することを含み、
    前記ターム候補から前記コンテキストに関連性のある複数のタームを選択することが:
    前記テキスト内の前記ターム候補のコンテキストを決定し;
    前記テキスト内の一つまたは複数の他のターム候補と共通のコンテキストを有するターム候補を選択することを含む、段階と;
    前記コンテキストに関連性のあるタームを使って一つまたは複数のクエリーを実行して関係したコンテンツのセットを位置特定して取得する段階と;
    前記関係したコンテンツを前記グラフィカル・ユーザー・インターフェースにおいて表示する段階とを実行するよう構成されている、
    コンピュータ可読記憶媒体。
  13. 前記グラフィカル・ユーザー・インターフェースがブラウザーであり、前記関係したコンテンツの表示が、前記関係したコンテンツを含む一つまたは複数のウェブページをレンダリングすることによって提供され、前記関係したコンテンツを含む前記ウェブページは、HTML5マークアップ言語標準に準拠するユーザー対話ディスプレイを提供する、請求項12記載のコンピュータ可読記憶媒体。
  14. 前記命令がさらに、前記コンピュータに、前記ブラウザーにおいて前記第一のコンテンツを表示するよう構成された前記グラフィカル・ユーザー・インターフェースを提供させるものであり、
    前記第一のコンテンツの表示が、前記第一のコンテンツを含む一つまたは複数のウェブページまたはウェブ・アプリケーションをレンダリングすることによって提供され、前記ウェブページまたはウェブ・アプリケーションは、HTML5マークアップ言語標準に準拠するユーザー対話ディスプレイを提供する、請求項12記載のコンピュータ可読記憶媒体。
  15. 第一のコンテンツの前記セットに関連付けられた前記テキストが、前記コンテンツに関連付けられたリアルタイム・データストリームによって与えられる、請求項12記載のコンピュータ可読記憶媒体。
  16. 前記データストリームが:クローズドキャプション・テキスト、字幕テキストまたはメタデータの一つまたは複数から与えられる、請求項15記載のコンピュータ可読記憶媒体。
  17. 前記グラフィカル・ユーザー・インターフェースに与えられる前記スクリプティング命令が、JavaScript対応ディスプレイ環境における実行のために構成されたJavaScript命令である、請求項12記載のコンピュータ可読記憶媒体。
  18. ユーザーに対してコンテンツの第一のセットを出力するよう構成されている出力装置と;
    コンテンツの前記第一のセットに関連付けられたテキストから関係したコンテンツを提供するよう構成されているコンテンツ処理システムとを有するシステムであって、
    前記コンテンツ処理システムは:
    コンテンツの前記第一のセットに関係した、コンテキストに関連性のある複数のタームを判別するよう構成された自然言語処理コンポーネントであって、
    前記自然言語処理は:
    前記テキスト中の複数のターム候補を同定し;
    前記テキスト内での使用に基づいて前記ターム候補からコンテキストに関連性のある複数のタームを選択することを含み、
    前記テキスト中の前記複数のターム候補を同定することが:
    前記テキストにアクセスし;
    前記テキストに一つまたは複数の品詞をタグ付けし;
    前記テキストに、品詞ごとの単語の頻度に基づいてインデックス付けし;
    前記テキストの前記インデックス付けを使ってフレーズおよび固有名詞からターム候補を決定することを含み、
    前記ターム候補から前記コンテキストに関連性のある複数のタームを選択することが:
    前記テキスト内の前記ターム候補のコンテキストを決定し;
    前記テキスト内の一つまたは複数の他のターム候補と共通のコンテキストを有するターム候補を選択することを含む、自然言語処理はスクリプティング・コマンドを使って実行される自然言語処理コンポーネントと;
    コンテンツの前記第一のセットに関係した前記コンテキストに関連性のあるタームを使って、コンテンツの前記第一のセットに関係したコンテンツの第二のセットを判別するよう構成されたコンテンツ検索コンポーネントと;
    ユーザーに対してコンテンツの前記第二のセットを、マークアップ言語を使ってユーザーに対して動的に生成された表示を提供するユーザー・インターフェース内で提供するよう構成されているユーザー・インターフェース・コンポーネントとを含んでいる、
    システム。
  19. コンテンツの前記第一のセットおよびコンテンツの前記第一のセットに関連付けられた前記テキストを与える第一のコンテンツ源と;
    コンテンツの前記第二のセットを与える第二のコンテンツ源とをさらに有する、請求項18記載のシステム。
  20. 前記出力装置が、ユーザーに対して前記ユーザー・インターフェースおよびコンテンツの前記第二のセットを出力するようさらに構成されている、請求項19記載のシステム。
  21. ユーザーに対して前記ユーザー・インターフェースおよびコンテンツの前記第二のセットを出力するよう構成されている第二の出力装置をさらに有する、請求項19記載のシステム。
  22. 前記コンテンツ検索および前記自然言語処理が、前記ユーザー・インターフェース内で実行されるスクリプティングを使って実行され、前記コンテンツ処理システムが前記出力装置のプロセッサ上で実行されるソフトウェア命令によって提供される、請求項19記載のシステム。
JP2014548776A 2011-12-28 2011-12-28 データストリームのリアルタイム自然言語処理 Expired - Fee Related JP5922255B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/US2011/067623 WO2013100978A1 (en) 2011-12-28 2011-12-28 Real-time natural language processing of datastreams

Publications (2)

Publication Number Publication Date
JP2015501059A JP2015501059A (ja) 2015-01-08
JP5922255B2 true JP5922255B2 (ja) 2016-05-24

Family

ID=48698220

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014548776A Expired - Fee Related JP5922255B2 (ja) 2011-12-28 2011-12-28 データストリームのリアルタイム自然言語処理

Country Status (8)

Country Link
US (2) US9710461B2 (ja)
EP (2) EP3557442A1 (ja)
JP (1) JP5922255B2 (ja)
KR (4) KR102047200B1 (ja)
CN (2) CN107704449B (ja)
BR (1) BR112014016260A8 (ja)
TW (1) TWI493363B (ja)
WO (1) WO2013100978A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9710461B2 (en) 2011-12-28 2017-07-18 Intel Corporation Real-time natural language processing of datastreams

Families Citing this family (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9280520B2 (en) 2012-08-02 2016-03-08 American Express Travel Related Services Company, Inc. Systems and methods for semantic information retrieval
KR102081925B1 (ko) * 2012-08-29 2020-02-26 엘지전자 주식회사 디스플레이 디바이스 및 스피치 검색 방법
US9582572B2 (en) 2012-12-19 2017-02-28 Intel Corporation Personalized search library based on continual concept correlation
US9715533B2 (en) * 2013-07-02 2017-07-25 Ebay Inc. Multi-dimensional search
US20150149616A1 (en) * 2013-11-27 2015-05-28 Institute For Information Industry Server and share link management method thereof
FR3014279A1 (fr) * 2013-11-29 2015-06-05 Orange Fourniture d'acces a des contenus, en particulier a des articles de presse
US9594737B2 (en) * 2013-12-09 2017-03-14 Wolfram Alpha Llc Natural language-aided hypertext document authoring
US9615122B2 (en) 2014-01-30 2017-04-04 Echostar Technologies L.L.C. Methods and apparatus to synchronize second screen content with audio/video programming using closed captioning data
US9876848B1 (en) 2014-02-21 2018-01-23 Twitter, Inc. Television key phrase detection
EP2953085A1 (en) * 2014-06-05 2015-12-09 Mobli Technologies 2010 Ltd. Web document enhancement
US9760554B2 (en) 2014-10-31 2017-09-12 International Business Machines Corporation Incorporating content analytics and natural language processing into internet web browsers
US9916008B2 (en) 2015-01-12 2018-03-13 International Business Machines Corporation Microfluidics three-dimensional touch screen display
US10509829B2 (en) 2015-01-21 2019-12-17 Microsoft Technology Licensing, Llc Contextual search using natural language
US9984424B2 (en) * 2015-02-23 2018-05-29 International Business Machines Corporation Populating a new community for a social network
KR101785780B1 (ko) 2015-06-11 2017-10-16 한국 한의학 연구원 건강 정보 제공 시스템 및 방법
US10025773B2 (en) 2015-07-24 2018-07-17 International Business Machines Corporation System and method for natural language processing using synthetic text
CN106470349A (zh) * 2015-08-21 2017-03-01 中国科学院声学研究所 一种智能电视中html5视频的提取和操控优化方法
US20190197103A1 (en) * 2015-11-17 2019-06-27 Ubergrape Gmbh Asynchronous speech act detection in text-based messages
US10235367B2 (en) 2016-01-11 2019-03-19 Microsoft Technology Licensing, Llc Organization, retrieval, annotation and presentation of media data files using signals captured from a viewing environment
CN105578222B (zh) * 2016-02-01 2019-04-12 百度在线网络技术(北京)有限公司 一种信息推送方法和装置
US9965469B2 (en) 2016-03-23 2018-05-08 International Business Machines Corporation Dynamic token translation for network interfaces
KR102557574B1 (ko) * 2016-05-17 2023-07-20 엘지전자 주식회사 디지털 디바이스 및 그 제어 방법
US10904188B2 (en) * 2016-06-28 2021-01-26 International Business Machines Corporation Initiating an action based on a determined navigation path data structure
US9961100B2 (en) 2016-07-29 2018-05-01 Accenture Global Solutions Limited Network security analysis system
US10503832B2 (en) * 2016-07-29 2019-12-10 Rovi Guides, Inc. Systems and methods for disambiguating a term based on static and temporal knowledge graphs
WO2018031656A1 (en) 2016-08-09 2018-02-15 Ripcord, Inc. Systems and methods for contextual retrieval of electronic records
US11709996B2 (en) * 2016-12-30 2023-07-25 Meta Platforms, Inc. Suggesting captions for content
CN107678778B (zh) * 2017-03-14 2019-12-13 平安科技(深圳)有限公司 基于Hybrid的兼容方法、适配件、运行装置及系统
US10169770B2 (en) * 2017-04-10 2019-01-01 Wildfire Systems, Inc. Digital communications monetization system
US10540671B2 (en) 2017-04-10 2020-01-21 Wildfire Systems, Inc. Messaging gateway monetization system
US10229427B2 (en) * 2017-04-10 2019-03-12 Wildfire Systems, Inc. Virtual keyboard trackable referral system
US10643230B2 (en) 2017-04-10 2020-05-05 Wildfire Systems, Inc. Monetization system for images
US10733622B1 (en) 2017-04-10 2020-08-04 Wildfire Systems, Inc. Application user interface monetization system
CN111164676A (zh) 2017-11-15 2020-05-15 英特尔公司 经由环境语境采集进行的语音模型个性化
KR20190056119A (ko) * 2017-11-16 2019-05-24 삼성전자주식회사 디스플레이장치 및 그 제어방법
US11941033B2 (en) * 2017-11-27 2024-03-26 Affirm, Inc. Method and system for syntactic searching
US10496382B2 (en) * 2018-02-22 2019-12-03 Midea Group Co., Ltd. Machine generation of context-free grammar for intent deduction
US10824670B2 (en) * 2018-03-23 2020-11-03 nedl.com, Inc. Real-time audio stream search and presentation system
US11295783B2 (en) * 2018-04-05 2022-04-05 Tvu Networks Corporation Methods, apparatus, and systems for AI-assisted or automatic video production
US10930278B2 (en) * 2018-04-09 2021-02-23 Google Llc Trigger sound detection in ambient audio to provide related functionality on a user interface
TWI663594B (zh) * 2018-04-19 2019-06-21 陳伯豪 根據視訊或音訊之聲音提供語言學習資訊之行動裝置、伺服器及系統
US20190347068A1 (en) * 2018-05-10 2019-11-14 Microsoft Technology Licensing, Llc Personal history recall
US11455497B2 (en) 2018-07-23 2022-09-27 Accenture Global Solutions Limited Information transition management platform
CN109086397B (zh) * 2018-07-28 2022-05-17 重庆柚瓣家科技有限公司 基于查询维度的动态报表生成方法
KR101949154B1 (ko) * 2018-09-17 2019-02-18 (주)투비소프트 Json을 이용하여 데이터셋의 구조를 변환하는 전자 장치 및 그의 동작 방법
US10853398B2 (en) * 2018-11-13 2020-12-01 Adobe Inc. Generating three-dimensional digital content from natural language requests
US11170044B2 (en) 2019-01-02 2021-11-09 International Business Machines Corporation Personalized video and memories creation based on enriched images
US11195523B2 (en) * 2019-07-23 2021-12-07 Microsoft Technology Licensing, Llc Ambiguity resolution with dialogue search history
US11250872B2 (en) * 2019-12-14 2022-02-15 International Business Machines Corporation Using closed captions as parallel training data for customization of closed captioning systems
US11250128B2 (en) 2020-02-18 2022-02-15 Bank Of America Corporation System and method for detecting source code anomalies
US11176329B2 (en) 2020-02-18 2021-11-16 Bank Of America Corporation Source code compiler using natural language input
CN111445902B (zh) * 2020-03-27 2023-05-30 北京字节跳动网络技术有限公司 数据收集方法、装置、存储介质及电子设备
US11574217B2 (en) 2020-06-24 2023-02-07 Bank Of America Corporation Machine learning based identification and classification of database commands
EP3944234A1 (en) * 2020-07-24 2022-01-26 Atos Global IT Solutions and Services Private Limited Method for processing a video file comprising audio content and visual content comprising text content
KR102470248B1 (ko) 2021-02-08 2022-11-25 주식회사 페이커즈 위조품 식별을 위한 자연어 처리 방법 및 위조품 탐지 시스템
TWI823815B (zh) * 2023-05-10 2023-11-21 犀動智能科技股份有限公司 摘要產生方法及系統與電腦程式產品

Family Cites Families (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR0147210B1 (ko) * 1994-07-15 1998-09-15 이헌조 별도의 표시장치를 구비한 캡션 브이시알의 자막처리장치 및 자막처리방법
US6141678A (en) * 1998-04-29 2000-10-31 Webtv Networks, Inc. Presenting information relating to a program by recognizing text in closed captioning data
US6751776B1 (en) * 1999-08-06 2004-06-15 Nec Corporation Method and apparatus for personalized multimedia summarization based upon user specified theme
US6569206B1 (en) * 1999-10-29 2003-05-27 Verizon Laboratories Inc. Facilitation of hypervideo by automatic IR techniques in response to user requests
US7046914B2 (en) * 2001-05-01 2006-05-16 Koninklijke Philips Electronics N.V. Automatic content analysis and representation of multimedia presentations
TWI223162B (en) 2002-03-25 2004-11-01 Hsin-Chia Fu Method and computer system for automatic generation of multimedia WWW news contents from broadcast news video
GB0207791D0 (en) * 2002-04-04 2002-05-15 Koninkl Philips Electronics Nv Digital remote control device
CN101132528B (zh) * 2002-04-12 2011-08-03 三菱电机株式会社 元数据再生、分发、检索装置、元数据再生成条件设定装置
US20050073608A1 (en) * 2003-10-02 2005-04-07 Stone Christopher J. Method and system for passing closed caption data over a digital visual interface or high definition multimedia interface
US8126712B2 (en) * 2005-02-08 2012-02-28 Nippon Telegraph And Telephone Corporation Information communication terminal, information communication system, information communication method, and storage medium for storing an information communication program thereof for recognizing speech information
CN100517322C (zh) * 2006-02-10 2009-07-22 联想(北京)有限公司 媒体转换装置和方法
US8209724B2 (en) * 2007-04-25 2012-06-26 Samsung Electronics Co., Ltd. Method and system for providing access to information of potential interest to a user
US8200688B2 (en) * 2006-03-07 2012-06-12 Samsung Electronics Co., Ltd. Method and system for facilitating information searching on electronic devices
US20070244902A1 (en) * 2006-04-17 2007-10-18 Microsoft Corporation Internet search-based television
CN101021857A (zh) * 2006-10-20 2007-08-22 鲍东山 基于内容分析的视频搜索系统
US7640272B2 (en) * 2006-12-07 2009-12-29 Microsoft Corporation Using automated content analysis for audio/video content consumption
US20080162454A1 (en) * 2007-01-03 2008-07-03 Motorola, Inc. Method and apparatus for keyword-based media item transmission
US20080183681A1 (en) * 2007-01-29 2008-07-31 Samsung Electronics Co., Ltd. Method and system for facilitating information searching on electronic devices
US20080201434A1 (en) 2007-02-16 2008-08-21 Microsoft Corporation Context-Sensitive Searches and Functionality for Instant Messaging Applications
US20080235580A1 (en) * 2007-03-20 2008-09-25 Yahoo! Inc. Browser interpretable document for controlling a plurality of media players and systems and methods related thereto
US8005826B1 (en) * 2007-04-30 2011-08-23 Google Inc. Identifying media content in queries
US8484192B1 (en) * 2007-04-30 2013-07-09 Google Inc. Media search broadening
JP5196635B2 (ja) * 2007-08-28 2013-05-15 日本放送協会 ビデオコンテンツ再生端末およびビデオコンテンツ再生プログラム
US20090083260A1 (en) * 2007-09-21 2009-03-26 Your Truman Show, Inc. System and Method for Providing Community Network Based Video Searching and Correlation
KR101348598B1 (ko) * 2007-12-21 2014-01-07 삼성전자주식회사 디지털 티비 방송 제공 시스템과 디지털 티비 및 그 제어방법
US8793256B2 (en) * 2008-03-26 2014-07-29 Tout Industries, Inc. Method and apparatus for selecting related content for display in conjunction with a media
US8145648B2 (en) * 2008-09-03 2012-03-27 Samsung Electronics Co., Ltd. Semantic metadata creation for videos
US20100121973A1 (en) * 2008-11-12 2010-05-13 Yuliya Lobacheva Augmentation of streaming media
KR100973214B1 (ko) 2008-12-19 2010-07-30 엔에이치엔(주) 프로그램 방송 중 검색 서비스를 제공하는 방법 및 장치
JP5189481B2 (ja) 2008-12-26 2013-04-24 Kddi株式会社 映像関連情報提示装置、映像関連情報提示システムおよび映像関連情報提示装置の制御プログラム
JP5344937B2 (ja) 2009-01-20 2013-11-20 ヤフー株式会社 テレビ番組のメタ情報に基づく検索方法、検索システム、及び検索ターム生成装置
US20100211605A1 (en) * 2009-02-17 2010-08-19 Subhankar Ray Apparatus and method for unified web-search, selective broadcasting, natural language processing utilities, analysis, synthesis, and other applications for text, images, audios and videos, initiated by one or more interactions from users
WO2010132718A2 (en) * 2009-05-13 2010-11-18 Coincident.Tv , Inc. Playing and editing linked and annotated audiovisual works
US20110047163A1 (en) * 2009-08-24 2011-02-24 Google Inc. Relevance-Based Image Selection
WO2011053271A1 (en) * 2009-10-29 2011-05-05 Thomson Licensing Multiple-screen interactive screen architecture
US20110119595A1 (en) * 2009-11-19 2011-05-19 Telegent Systems USA, Inc. Apparatus and Method for Browser Based Integration of Broadcast Television and Internet Content
JP5617247B2 (ja) 2010-01-14 2014-11-05 ソニー株式会社 データ記憶装置およびプログラム
US8799765B1 (en) * 2010-02-01 2014-08-05 Inkling Systems, Inc. Systems for sharing annotations and location references for same for displaying the annotations in context with an electronic document
US8996496B2 (en) * 2010-02-18 2015-03-31 Mobitv, Inc. Retrieval and display of related content using text stream data feeds
US8918803B2 (en) * 2010-06-25 2014-12-23 At&T Intellectual Property I, Lp System and method for automatic identification of key phrases during a multimedia broadcast
KR101700365B1 (ko) * 2010-09-17 2017-02-14 삼성전자주식회사 미디어 컨텐츠 관련 정보 제공 방법, 이 방법을 수행할 수 있는 디바이스와 서버 및 저장 매체
US9659313B2 (en) * 2010-09-27 2017-05-23 Unisys Corporation Systems and methods for managing interactive features associated with multimedia content
KR102047200B1 (ko) 2011-12-28 2019-11-20 인텔 코포레이션 데이터 스트림들의 실시간 자연어 처리

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9710461B2 (en) 2011-12-28 2017-07-18 Intel Corporation Real-time natural language processing of datastreams
US10366169B2 (en) 2011-12-28 2019-07-30 Intel Corporation Real-time natural language processing of datastreams

Also Published As

Publication number Publication date
US20150019203A1 (en) 2015-01-15
EP2798529B1 (en) 2019-08-14
EP2798529A4 (en) 2015-11-04
US10366169B2 (en) 2019-07-30
TWI493363B (zh) 2015-07-21
JP2015501059A (ja) 2015-01-08
TW201346595A (zh) 2013-11-16
WO2013100978A1 (en) 2013-07-04
KR20160043132A (ko) 2016-04-20
CN104025077B (zh) 2017-10-27
KR20150091185A (ko) 2015-08-07
KR20180032665A (ko) 2018-03-30
EP3557442A1 (en) 2019-10-23
BR112014016260A2 (pt) 2017-06-13
EP2798529A1 (en) 2014-11-05
CN104025077A (zh) 2014-09-03
KR20140097516A (ko) 2014-08-06
CN107704449A (zh) 2018-02-16
BR112014016260A8 (pt) 2017-07-04
CN107704449B (zh) 2021-09-07
US20180067925A1 (en) 2018-03-08
US9710461B2 (en) 2017-07-18
KR102047200B1 (ko) 2019-11-20
KR101777981B1 (ko) 2017-09-13

Similar Documents

Publication Publication Date Title
JP5922255B2 (ja) データストリームのリアルタイム自然言語処理
US11636146B2 (en) Content analysis to enhance voice search
US10311101B2 (en) Methods, systems, and media for searching for video content
JP6015568B2 (ja) コンテンツ・リンクを生成する方法、装置およびプログラム
US20130308922A1 (en) Enhanced video discovery and productivity through accessibility
US10860638B2 (en) System and method for interactive searching of transcripts and associated audio/visual/textual/other data files
US9129009B2 (en) Related links
CN103984772B (zh) 文本检索字幕库生成方法和装置、视频检索方法和装置
US10360260B2 (en) System and method for semantic analysis of song lyrics in a media content environment
CN109558513B (zh) 一种内容推荐方法、装置、终端及存储介质
WO2013015852A9 (en) Systems and methods for providing information regarding semantic entities included in a page of content
US20120036144A1 (en) Information and recommendation device, method, and program
US20150161279A1 (en) Displaying Local Site Name Information with Search Results
WO2015157711A1 (en) Methods, systems, and media for searching for video content
KR101727821B1 (ko) 컨텐츠 내 단어에 대한 정답성 검색 결과를 제공하는 방법 및 시스템

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140619

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150522

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150602

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150828

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151124

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160222

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160315

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160413

R150 Certificate of patent or registration of utility model

Ref document number: 5922255

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees