[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

TWI524193B - 用於搜尋結果之語義目錄的電腦可讀取媒體及電腦實現方法 - Google Patents

用於搜尋結果之語義目錄的電腦可讀取媒體及電腦實現方法 Download PDF

Info

Publication number
TWI524193B
TWI524193B TW100103908A TW100103908A TWI524193B TW I524193 B TWI524193 B TW I524193B TW 100103908 A TW100103908 A TW 100103908A TW 100103908 A TW100103908 A TW 100103908A TW I524193 B TWI524193 B TW I524193B
Authority
TW
Taiwan
Prior art keywords
topic
file
topics
word
search
Prior art date
Application number
TW100103908A
Other languages
English (en)
Other versions
TW201145056A (en
Inventor
瓦得拉馬尼維斯瓦那司
索里瓦斯塔瓦阿勃夷奈
那吉姆崔伊克
蘇倫德蘭奧谷拉姆錢得拉西卡蘭
Original Assignee
微軟技術授權有限責任公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 微軟技術授權有限責任公司 filed Critical 微軟技術授權有限責任公司
Publication of TW201145056A publication Critical patent/TW201145056A/zh
Application granted granted Critical
Publication of TWI524193B publication Critical patent/TWI524193B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

用於搜尋結果之語義目錄的電腦可讀取媒體及電腦實現方法
關申請的交叉引用
本專利申請案之標的係關於美國專利申請案(發明名稱:Semantic Advertising Selection from Lateral Concepts and Topics)(尚未取得申請案號,代理人卷號:MFCP.153203)所揭之內容,該美國專利申請案係讓與(或具有讓與義務)給與本專利申請案相同之主體,且以引用之方式併入於本文。
本發明係關於用於搜尋結果之語義目錄。
儘管電腦系統可儲存大量資訊,然而對使用者而言,要找到特定資訊或有效率地搜尋有興趣的特定內容係困難的。目前存在的各種搜尋引擎,允許使用者藉由輸入其所關注的包含有一或多關鍵字的一搜尋查詢以搜尋資訊。當接收到一來自使用者的搜尋請求後,搜尋引擎依據該等關鍵字來識別相關的文件及(或)網頁。搜尋引擎常會回傳大量文件或網頁位址,而使用者接著必需過濾文件、網頁連結以及相關資訊列表,以找到所需的資訊。對使用者而言,此過程可能係麻煩、耗時且另人沮喪的。
搜尋引擎使用各種技術來幫助使用者導遊於搜尋結果中並找到相關文件。其中一方法係提供一主題目錄(table of content,TOC),該主題目錄包含與搜尋查詢相關的一主題列表。使用者可由主題目錄中選擇一主題,並查看與該選定主題相關的搜尋結果。在某些實現方式中,當使用者從該主題目錄中選擇不同的主題時,主題目錄係保持靜止,以允許使用者可在原始搜尋查詢的上下文範圍內導遊於不同組別的搜尋結果中。
主題目錄一般由搜尋引擎人員人為建立而成。特別是,搜尋引擎人員識別前端(top-end)查詢(即,對搜尋引擎而言具有最多搜尋量的搜尋查詢)且人為識別與每一搜尋查詢相關的主題。然而,此方法需要相當的人力,且人為建立針對軀幹(torso)及末端(tail-end)查詢(即,對搜尋引擎而言具有較少搜尋量的搜尋查詢)的主題目錄係無法實現的。在某些實例中,可基於演算法來針對一搜尋查詢決定一主題目錄,例如藉由識別該搜尋查詢所屬之領域(例如,汽車、經濟領域等),而依據該領域提供一主題目錄。然而,此方法對某些搜尋查詢而言可能係沒效率的。因此,針對某些搜尋查詢(例如,軀幹及末端查詢)所提供的主題目錄,不是不存在就是品質相當差。這會造成使用者具有不一致的搜尋經歷。
提供本發明內容係用以簡單介紹以下「實施方式」段落將進一步說明的多個選擇概念。本發明內容並非旨在識別本案所請求內容的關鍵及必要特徵,亦非旨在用於幫助決定本案所請求內容的範圍。
本發明之具體實施例係關於:回應於搜尋查詢,而識別語義概念為主題,並將其納入一主題目錄中。當接收到一搜尋查詢時,識別搜尋結果並建立一主題目錄,該目錄包括一主題列表以用於導遊於搜尋結果中。在某些具體實施例中,藉由分析主題本體(ontology)以識別與搜尋結果相關的主題,來識別主題目錄中之主題。在另外的具體實施例中,分析局部主題(partial topic)本體以識別相關的局部主題,並對其命名。在又另外的具體實施例中,從搜尋結果產生關鍵詞,並分析該等關鍵詞以識別關鍵詞主題。對經識別的主題進行排序,並選擇其中的主題以納入主題目錄中。
本發明之內容明確描述於此以符合法定要求。然而,此處之說明本身並非旨在用來限制此專利之範圍,而是發明人已考慮到所請求的發明內容亦可結合其它現有或未來的技術來以其它方式實現,而可包括類似於此處所描述的不同步驟或步驟之結合。此外,雖然此處之用語「步驟」及(或)「方塊」意味著使用不同的方法元素,除非有明確指出個別步驟之次序,該等用語不得解讀為暗示具有特定次序來執行此處所揭之各種步驟。
本發明之具體實施例一般揭示針對回應於一搜尋查詢之搜尋結果來建立一主題目錄(TOC)。當接收到一搜尋查詢時,獲取搜尋結果。此外,識別關於該搜尋查詢之主題及搜尋結果,並從經識別的主題建立一主題目錄。回應於該搜尋查詢而回傳一搜尋結果頁面,其中包括搜尋結果及所建立的主題目錄。使用者可自主題目錄選擇主題,以查看與每一主題相關的不同搜尋結果。在某些具體實施例中,當使用者從主題目錄中選擇不同主題以查看不同組別的搜尋結果時,主題目錄係靜止的,藉此允許使用者可在原始搜尋查詢的上下文範圍內導遊於不同搜尋結果中。
針對一搜尋查詢,可採本發明之各種具體實施例中的各種不同方法來識別要納入於一主題目錄內的主題。在某些具體實例中,當接收到一搜尋查詢時,決定針對該搜尋查詢之一本體映射是否已存在。例如,可人為針對匹配所接收到的搜尋查詢的一搜尋查詢產生多個主題。在另一實例中,匹配所接收到的搜尋查詢的一搜尋查詢可能先前已接收過,而因此先前已識別了相應主題並將其暫存起來。在這樣的具體實施例中,從現存本體映射獲得用於主題目錄之主題。在其它具體實施例中,針對搜尋查詢獲得搜尋結果,並將該等結果與主題本體及(或)局部主題本體進行比對,以識別相關主題。在另外的其它具體實施例中,分析搜尋結果以識別獨立的關鍵詞,並選擇關鍵詞主題。當識別出大量的主題後,對主題進行排序,選擇排序最前的幾個主題以用於建立針對該搜尋查詢的主題目錄。
因此,在一態樣中,本發明之一具體實施例揭示儲存有多數電腦可用指令的一或多電腦可讀取媒體,當該等指令由一或多運算裝置使用時,使該一或多運算裝置執行一方法。該方法包括接收一搜尋查詢,使用該搜尋查詢執行一搜尋,及從該搜尋接收複數個文件片段。該方法亦包括藉由將一或多文件片段與主題本體進行比對,來確認一第一組別的一或多候選主題。該方法更包括藉由將一或多文件片段與局部主題本體進行比對,來識別一第二組別的一或多候選主題。該方法亦包括藉由從一或多文件片段產生關鍵詞主題,來識別一第三組別的一或多候選主題。該方法更包括對該第一、第二、第三組別的候選主題進行排序,並基於排序結果選擇一或多主題。該方法又更包括回應於該搜尋查詢而提供一搜尋結果頁面,該搜尋結果頁面具有一主題目錄及一搜尋結果區域,該主題目錄包含該一或多主題,該搜尋結果區域用以呈現一或多搜尋結果。
在另一具體實施例中,本發明之一態樣揭示儲存有多數電腦可用指令的一或多電腦可讀取媒體,當該等指令由一或多運算裝置使用時,使該一或多運算裝置執行一方法。該方法包括接收一搜尋查詢並決定是否存在針對該搜尋查詢之一本體映射。若存在針對該搜尋查詢之一本體映射,則該方法包括基於該本體映射獲取一第一組別的主題,及將該第一組別的主題加至一主題列表中。該方法亦包括使用該搜尋查詢來執行一搜尋,以獲得複數搜尋結果,每一搜尋結果對應一文件片段,且接收至少一部分該等文件片段作為一文件集合,以進一步進行分析。該方法更包括將該文件集中每一文件片段與主題本體進行比對。針對決定為具有確認的(positive)主題識別結果的每一文件片段,該方法包括將該文件片段分配至一相應主題,並將該文件片段自該文件集合中移除。該方法亦包括將從主題本體所識別的至少一主題加至主題列表中。該方法更包括將仍留在該文件集合中的每一文件片段與局部主題本體進行比對。針對決定為具有確認的局部主題識別結果的每一文件片段,該方法包括將該文件片段分配至一相應局部主題,並將該文件片段自該文件集合中移除。該方法亦包括對分配到一或多文件片段的至少一局部主題進行命名,並將至少一經命名的局部主題加至主題列表中。該方法更包括從仍留在該文件集合中的文件片段來計算獨立的關鍵詞,將文件分配至獨立關鍵詞,識別至少一關鍵詞主題,及將該至少一關鍵詞主題加至主題列表。該方法更包括對該主題列表中之主題進行排序,基於該排序選擇多個主題,及使用所選的主題來建立一主題目錄。該方法又更包括回應於該搜尋查詢而提供一搜尋結果頁面,該搜尋結果頁面包括該主題目錄及一搜尋結果區域,該區域用以呈現多數搜尋結果。
本發明之另一具體實施例揭示一種用以從一組搜尋結果來識別多數主題以針對該等搜尋結果建立一主題目錄的方法。該方法包括接收一搜尋查詢,使用該搜尋查詢執行一搜尋,及從該搜尋接收複數個文件片段。該方法亦包括從至少一部分的該等文件片段來產生候選關鍵詞。該方法更包括評估候選關鍵詞之獨立性,合併相依的候選關鍵詞,及針對每一組相依的關鍵詞識別一最常出現的候選關鍵詞以產生複數個獨立關鍵詞。該方法更包括將一或多文件片段分配至每一獨立關鍵詞。該方法又更包括基於將文件片段分配至獨立關鍵詞,來選擇關鍵詞主題。
已簡要描述本發明之具體實施例之概觀,以下將說明可實現本發明之具體實施例的一示例性操作環境,以提供本發明各種態樣的一般性架構。一開始特別參照第1圖,其顯示用以實現本發明之具體實施例的一示例性操作環境,該操作環境係一般性地標示為運算裝置100。運算裝置100僅為一合適運算環境範例,並非旨在用以限制本發明之使用及功能範圍。運算裝置100不應視為必須依賴或需求所例示出的組件的任一者或其組合。
本發明可以由電腦或其它機器(諸如個人資料助理或其它手持裝置)執行的電腦程式碼或機器可用指令(包括諸如程式模組之類的電腦可執行指令)之一般架構進行描述。一般而言,程式模組(包括常式、程式、物件、組件、資料結構等)係指一種程式碼,其可執行特定任務或實現特定抽象資料類型。本發明可實施於多種系統配置中,包括手持裝置、消費性電子產品、通用電腦、專用運算裝置等。本發明亦可實施於分散式運算環境,在該環境中,由透過通訊網路鏈結的遠端處理裝置執行任務。
參照第1圖,運算裝置100包括一匯流排110,其可直接或間接耦接以下裝置:記憶體112、一或多處理器114、一或多顯示組件116、輸入/輸出埠118、輸入/輸出組件120、及一示例性電源供應122。匯流排110可代表一或多匯流排(諸如一位址匯流排、資料匯流排、或其結合者)。儘管第1圖之各種方塊為了簡明之故僅以線條表示,然而事實上這些方塊代表邏輯組件,而非真實的組件。例如,可將諸如顯示裝置之類的一顯示組件視為一輸入/輸出組件。此外,處理器具有記憶體。我們認知到這種配置屬於先前技藝之特性,且重申第1圖僅用以說明一示例性運算裝置,其可與本發明之一或多具體實施例結合使用。諸如「工作站」、「伺服器」、「膝上型電腦」、「手持裝置」等範疇在此並無差異,其皆納入第1圖之範圍而稱之為「運算裝置」。
運算裝置100典型地包括各種電腦可讀取媒體。電腦可讀取媒體可為可由運算裝置100存取的任何可用媒體,同時包括揮發性與非揮發性媒體、可移除與不可移除媒體,其以任何方法或技術實現以用於儲存資訊,諸如電腦可讀取指令、資料結構、程式模組或其它資料等。電腦可讀取媒體包括(但不限於)RAM、ROM、EEPROM、快閃記憶體或其它記憶體技術、CD-ROM、數位多功能碟片(DVD,“Digital versatile disk”)或其它光碟儲存、磁匣、磁帶、磁碟儲存或其它磁性儲存裝置,或任何其它可用於儲存所需資訊並可由運算裝置100存取之媒體。任何上述的組合亦應包含在電腦可讀取媒體的範疇內。
記憶體112包括型式為揮發性及(或)非揮發性記憶體的電腦儲存媒體。記憶體可為可移除、不可移除或其結合者。範例硬體裝置包括固態記憶體、硬碟、光碟驅動裝置等。運算裝置100包括一或多處理器,其自諸如記憶體112或輸入/輸出組件120之類的各種實體讀取資料。顯示組件116顯示資料指示予使用者或其它裝置。範例顯示組件包括一顯示裝置、揚聲器、列印組件、震動組件等。
輸入/輸出埠118允許運算裝置100邏輯地耦接至其它裝置,包括輸入/輸出組件120,某些係為內建。示例性組件包括一麥克風、操縱桿、遊戲板、衛星碟、掃瞄器、列表機、無線裝置等。
參照第2圖,其顯示一範例系統200之方塊圖,本發明之具體實施例可用於該系統中。應瞭解到此處所描述的此配置及其它配置僅係作為例示性說明用。其它配置及元件(例如,機器、介面、功能、次序及功能組等)可用於附加於或取代這些所示的配置及元件,且某些元件可整個被移除。此外,此處所描述的元件中之諸多者係功能性實體,其可實現成個別、分散組件或與其它組件配合作用,且以適當結合及在適當位置實現該等元件。此處所述的由一或多實體執行的各種功能,可由硬體、韌體及(或)軟體實現。例如,各種功能可由一處理器執行儲存在記憶體中的指令來實現。
系統200包括一使用者裝置202、一搜尋引擎204及一語意主題引擎206,及亦包括其它未圖示的組件。第2圖所示組件之每一者可為任何類型的運算裝置,例如參照第1圖所描述之運算裝置100。該等組件可經由網路208相互通訊,網路208可包括(但不限於)一或多區域網路(LAN)及(或)廣域網路(WAN)。此種網路環境常見於辦公室、企業化電腦網路、企業內網路及網際網路。應瞭解到,在本發明之範疇內,任何數量的使用者裝置、搜尋引擎、及語義主題引擎可用於系統200中,其每一者可包含單一裝置或多數裝置協同作用於一分散式環境中。例如,搜尋引擎204及語意主題引擎206可為一搜尋系統的一部分,該搜尋系統包括多數裝置配置於一分散式環境中,該等裝置全體提供此處所述之搜尋引擎及語義主題引擎之功能性。此外,其它未圖示之組件亦可納入於系統200內。
在本發明之某些具體實施例中,系統200包括一搜尋系統,其包括搜尋引擎204及語義主題引擎206,亦包括其它未圖示之組件。一使用者可利用使用者裝置202來輸入一搜尋查詢,並將該搜尋查詢送至該搜尋系統。
例如,使用者可利用使用者裝置202上的一網頁瀏覽器來進入該搜尋系統之一搜尋輸入網頁,並輸入一搜尋查詢。在另一實例中,使用者可經由一搜尋引擎工具列上提供的一搜尋輸入欄來輸入一搜尋查詢,該工具列係例如配置於一網頁瀏覽器內、使用者裝置202之桌面上或配置於其它位置處。本領域之熟習技藝者將認知到,在本發明之具體實施例的範疇內,亦可使用各種其它方法來提供一搜尋查詢。
當搜尋系統自一使用者裝置(諸如使用者裝置202)接收到一搜尋查詢時,搜尋引擎204將對一搜尋系統索引220、知識庫222及(或)由該搜尋系統維護的包含有可搜尋內容的其它資料儲存執行一搜尋。搜尋系統索引220一般可包含未結構化及(或)半結構化資料,而知識庫222一般可包含結構化資料。因此,搜尋引擎204回應於接收到的搜尋查詢而識別一數量的搜尋結果。此外,語義主題引擎206針對接收到的搜尋查詢進行作業,以識別用於建立主題目錄之相關主題。回應於該搜尋查詢,可提供一搜尋結果頁面予使用者裝置202,該頁面包括多數搜尋結果及一主題目錄,該主題目錄包含有由語義主題引擎206所識別的多數主題。
如第2圖所示,語義主題引擎206一般包括一本體映射組件210、一本體主題識別組件212、一本體局部主題識別組件214、一關鍵詞主題識別組件216、及一主題排序/選擇組件218。語義主題引擎206利用該等組件210、212、214及216中之任一者來識別語義主題。在本發明某些具體實施例中,可利用該等組件210、212、214及216中每一者來識別針對一特定搜尋查詢之主題,接著可由排序/選擇組件218對經識別的多數主題進行排序,並選擇某些主題以納入主題目錄中。在其它具體實施例中,可僅由組件210、212、214及216中的一部分組件來識別主題。例如,在一具體實施例中,一旦組件210、212、214及216中之一或多者識別出達一臨界數量的主題後,則其餘組件將不執行進一步的分析。在其它具體實施例中,語義主題引擎206可僅包括第2圖所示的組件210、212、214及216中之一部分組件。任何或所有此類變化都視為包含於本發明之具體實施例之範疇內。
當自一使用者裝置(諸如使用者裝置202)接收到一搜尋查詢時,本體映射組件210操作來識別是否已存在針對該搜尋查詢的一本體映射。例如,該搜尋查詢可為一前端搜尋查詢,針對此搜尋查詢,搜尋系統人員具有人為識別的可納入一主題目錄中的相關主題,以用於該搜尋查詢。在另一實例中,該接收到的搜尋查詢可對應到一搜尋查詢,針對此對應的搜尋查詢,相關的主題已被識別並暫存起來以用於該搜尋查詢。若本體映射組件210決定已存在針對一接收到的搜尋查詢的一本體映射,則基於該本體映射獲取主題。在某些具體實施例中,僅基於由本體映射組件210獲取的主題來建立一主題目錄。在其它具體實施例中,由其它組件212、214及216中一或多者識別額外的主題,以下將進一步詳細描述之。
本體主題識別組件212結合儲存在本體儲存組件224之一主題本體,來對一接收到的搜尋查詢進行作業,以識別針對該搜尋查詢之相關主題。本體儲存組件224可儲存一或多本體,其被本體主題識別組件212使用,以針對接收到的搜尋查詢將語意概念識別為主題。每一本體包括字及詞之一集合,用以定義多個概念及多個概念之間的關係。在某些具體實施例中,對搜尋系統索引220及(或)知識庫222執行一搜尋,以獲取針對該搜尋查詢之搜尋結果,且本體主題識別組件212結合該主題本體來分析搜尋結果,以識別可被納入於針對該搜尋查詢的一主題目錄中的相關主題。
本體局部主題識別組件214之功能類似於本體主題識別組件212,但其使用一局部主題本體而非一主題本體。此處所用之局部主題係指經局部命名的主題。每一局部主題包括一局部主題識別字,其可與一額外字或詞結合以產生可用於一主題目錄的一主題。例如,「reviews」可為一局部主題。當於上下文中進行分析時,局部主題識別字「reviews」可與額外字結合,例如可與「expert」或「user」結合,以產生主題「expert reviews」或「user reviews」。因此,一旦針對一搜尋查詢識別了局部主題,本體局部主題識別組件214或一相關聯組件將對該局部主題進行命名,以可將其納入於針對該搜尋查詢的一主題目錄中。
關鍵詞主題識別組件216分析針對一接收到的搜尋查詢的搜尋結果,以產生候選關鍵詞。一般而言,關鍵詞主題識別組件216從搜尋結果產生關鍵詞,並識別獨立關鍵詞。對該等獨立關鍵詞進行評估,以識別候選主題,以可將其納入於針對該搜尋查詢的一主題目錄中。
藉由本體映射組件210、本體主題識別組件212、本體局部主題識別組件214及(或)關鍵詞主題識別組件216,可針對一接收到的搜尋查詢識別一數量的主題。在某些實施例中,回應於該搜尋查詢,所有經識別的主題可被納入於一搜尋結果頁面上提供的主題目錄內。在其它實施例中,可識別大量的主題,而僅該等經識別主題的一子集被納入於該主題目錄內。主題排序/選擇組件218操作來對主題進行排序,並選擇其中的主題以納入主題目錄中。依據本發明之各種具體實施例,可使用多種不同參數來排序主題。在一實例中(僅為示例性而不具限制性),可基於每一主題分配到的文件總量來排序每一主題。一特定主題分配到愈大量的文件,則該主題具有愈前的排序。亦可基於一主題分配到的每一搜尋結果(或基於一組選擇的搜尋結果,例如前N個搜尋結果)的排序,來對該主題進行排序。每一搜尋結果的排序係對應到每一搜尋結果與該搜尋查詢的相關性。因此,一特定主題分配到相關性愈高的搜尋結果,則該主題具有愈前的排序。每一主題之長度(例如,字數)可進一步被用來排序主題。任何或所有此種變化都視為包含於本發明之具體實施例之範疇內。在對候選主題進行排序後,主題排序/選擇組件216選擇其中的主題以納入主題目錄中。
參照第3圖,其顯示依據本發明之一具體實施例之方法300之流程圖,方法300用以針對在一搜尋系統接收到的一搜尋查詢來建立一主題目錄。如方塊302所示,接收到一搜尋查詢。本領域之熟習技藝人士應認知到,搜尋查詢可包括由使用者輸入的一或多搜尋項(但在某些具體實施例中自動提供搜尋項)。此外,可以多種不同方式提供搜尋查詢。在一實例中(僅為示例性而不具限制性),使用者可利用一網頁以導遊至一搜尋引擎網頁,並在一輸入欄中輸入搜尋查詢。在另一實例中,使用者可輸入搜尋查詢至一搜尋引擎工具列提供的一輸入欄中,該工具列係例如位於一網頁瀏覽器內、該使用者之運算裝置的桌面上或位於其它位置。本領域之熟習技藝人士將認知到,在本發明之具體實施例之範疇內,亦可使用各種其它方法來提供一搜尋查詢。
依據第3圖所示之具體實施例,在方塊304,決定針對該搜尋查詢之一本體映射是否已存在。例如,該搜尋查詢可為一前端搜尋查詢,搜尋系統人員已針對該前端搜尋查詢人為識別針對該搜尋查詢之相關主題。或者,所接收到的搜尋查詢可對應至一搜尋查詢,此對應的搜尋查詢先前已由搜尋系統處理並已識別出針對該對應的搜尋查詢的相關主題,且該搜尋系統可能已將針對該對應的搜尋查詢的經識別的主題暫存起來。若在方塊306決定一本體映射已存在,則在方塊308獲取針對該搜尋查詢之主題。在某些具體實施例中,僅在方塊308獲取的主題被用來建立回應於該搜尋查詢的主題目錄,且處理程序到此結束。在這種具體實施例中,會產生一搜尋頁面,該頁面包括由方塊308獲取的主題所建立的一主題目錄。在其它具體實施例中,處理程序繼續進行至方塊310,以基於演算法識別額外的主題。
若在方塊306決定一針對該搜尋查詢之本體映射不存在(或若處理程序在方塊308處獲取主題後仍繼續進行),則使用該搜尋查詢執行一搜尋,如方塊310所示。回傳針對該搜尋查詢之搜尋結果,而在方塊312從搜尋結果接收前N個文件片段以作為一文件集合,以進行進一步分析。
如方塊314所示,將文件集合中每一文件片段與一主題本體(或一主題本體集合)進行比對,以識別每一文件片段是否映射到該本體中之一主題。在本發明之具體實施例之範疇內,存在多種方法來執行將一文件片段識別為與該主題本體中之一主題相關聯。在一具體實例中(僅為示例性而不具限制性),一文件片段基於該文件片段中包含之字而被轉換成一特徵向量,並將該特徵向量與本體中之主題進行比對,以決定該特徵向量與該等主題間之距離。藉由決定一特定文件片段的特徵向量係在一特定主題的一預定距離範圍內,來決定該文件片段具有確認的(positive)主題識別結果。在方塊316,基於對文件片段及本體的分析,一特定文件片段之主題識別結果若為確認的(positive),則將該文件片段分配至經識別的主題,如方塊318所示。此外,在方塊320,將該文件片段自文件集合中移除。
在針對一特定文件片段識別了一相關主題(例如,經由方塊316-320)或決定該本體中不存在任何主題係與一特定文件片段具有足夠相關性(例如,經由方塊316)後,在方塊322決定該經分析的文件片段是否為該文件集合中最末一個要進行分析的文件片段。若仍有額外的文件片段需進行分析,則重覆方塊316-322之處理程序,直到該文件集合中所有文件片段皆已和主題本體進行比對為止。在文件集合中所有文件片段皆已和主題本體進行比對之後,將從主題本體識別的主題加至一候選主題列表中以供後續考慮,如方塊324所示。在某些具體實施例中,將所有經識別的主題加至列表中。在其它具體實施例中,僅一部分的主題被加至列表中。例如,在某些具體實施例中,僅那些分配到一預定數量的文件片段的主題被加至主題列表中。
如方塊326所示,將文件集合中仍存留的文件片段之每一者與一局部主題本體(或一本體集合)進行比對。如前所述,一局部主題係為僅部分命名的一主題。每一局部主題包括一局部主題識別字,其可與一額外字或詞結合以產生一主題以用於一主題目錄中。
在方塊328,決定一特定文件片段是否與該局部主題本體中之一局部主題相關聯。在本發明之具體實施例之範疇內,存在多種方法來執行將一文件片段識別為與一局部主題相關聯。在一具體實例中(僅為示例性而不具限制性),一文件片段基於該文件片段中包含之字而被轉換成一特徵向量,並將該特徵向量與局部主題本體中之局部主題進行比對,以決定該特徵向量與該等局部主題間之距離。藉由決定一特定文件片段的特徵向量係在一特定局部主題的一預定距離範圍內,來決定該文件片段具有確認的(positive)局部主題識別結果。在方塊328,基於對文件片段及局部主題本體的分析,一特定文件片段之局部主題識別結果若為確認的(positive),則將該文件片段分配至經識別的局部主題,如方塊330所示。此外,在方塊332,將該文件片段自文件集合中移除。
在針對一特定文件片段識別了一相關局部主題(例如,經由方塊328-332)或決定該本體中不存在任何局部主題係與一特定文件片段具有足夠相關性(例如,經由方塊328)後,在方塊334決定該經分析的文件片段是否為該文件集合中最末一個要進行分析的文件片段。若仍有額外的文件片段需進行分析,則重覆方塊328-334之處理程序,直到該文件集合中所有文件片段皆已和局部主題本體進行比對為止。
在文件集合中每一存留下的文件片段皆已和局部主題本體進行比對之後,在方塊336對局部主題進行命名。在某些具體實施例中,對所有經識別的局部主題進行命名。在其它具體實施例中,僅對一部分的主題進行命名,其餘主題則不考慮作進一步分析。例如,在某些具體實施例中,僅對分配到一預定數量的文件片段的局部主題進行命名,並考慮對其作進一步分析。第4圖例示依據本發明之一具體實施例的一方法400流程圖,方法400用以對一局部主題進行命名。如方塊402所示,識別分配至該局部主題的文件片段內的局部主題識別字的出現。例如,局部主題識別字可為「reviews」,識別在文件片段中每一次該詞的出現。在方塊404,擷取該局部主題識別字周圍的一或多字及(或)詞。在方塊406,計數每一擷取的字及(或)詞的出現頻率。在某些具體實施例中,追蹤並計數每一擷取的字及(或)詞相對於該局部主題識別字的位置。特別是,一字或詞可能出現在該局部主題識別字之前或之後。搜尋系統可個別追蹤每一字及(或)詞出現在該局部主題識別字之前的次數,以及每一字及(或)詞出現在該局部主題識別字之後的次數。
當皆已對每一文件片段進行分析之後,選擇使用率最高的字或詞,如方塊408所示。此外,使用局部主題識別字及使用率最高的字或詞,來對局部主題進行命名,如方塊410所示。可依據所分析的文件片段文本中大多數出現的次序安排,來配置該局部主題識別字及使用率最高的字或詞的順序。例如,若所選的字或詞較常出現在該局部主題識別字之前而非之後,則局部主題之名稱會先包含該所選字或詞,之後再跟著該局部主題識別字。回到第3圖,將經命名的局部主題加至主題列表中,如方塊338所示。
在方塊340,在將文件片段與主題本體及局部主題本體進行比對之後,從文件集合中存留下的文件片段來產生獨立的關鍵詞。參照第5圖,其顯示依據本發明之一具體實施例之一方法500之流程圖,方法500用以從存留下的文件片段來計算獨立的關鍵詞。如方塊502所示,從文件集合中存留下的文件片段來產生候選關鍵詞。依據本發明之某些具體實施例,使用一基於馬可夫鏈(Markov chain)的方法來產生候選關鍵詞。
評估候選關鍵詞之獨立性,如方塊504所示。依據本發明之具體實施例,可使用多種度量來評估候選關鍵詞之獨立性。例如,可基於以下度量之任意結合來決定其獨立性:候選關鍵詞間共用的字的數量、分析關鍵詞中字的首字母縮略字(acronyms)、及候選關鍵詞間共用的文件的數量。
對每一群組的相依關鍵詞而言,在方塊506將相依的關鍵詞合併。藉此,從一群組的相依關鍵詞中選擇出現頻率最高的關鍵詞作為要進一步分析的關鍵詞,如方塊508所示。重覆前述的合併相依關鍵詞以識別要進一步分析的關鍵詞的程序,直到不存在任何相依關鍵詞為止。方法500的結果為得到一或多獨立關鍵詞的一集合,該關鍵詞集合將進一步被評估以作為可能的主題。
再次回到第3圖,從獨立關鍵詞識別候選主題之後,仍存留在文件集合中的文件片段被分配至關鍵詞主題,如方塊342所示。在本發明之具體實施例之範疇內,存在多種方法來執行將一文件片段識別為與一關鍵詞相關聯。在一具體實例中(僅為示例性而不具限制性),一文件片段基於該文件片段中包含之字而被轉換成一特徵向量,並將該特徵向量與關鍵詞進行比對,以決定該特徵向量與該等關鍵詞之距離。藉由決定一特定文件片段的特徵向量係在一特定關鍵詞的一預定距離範圍內,來決定該文件片段具有確認的(positive)關鍵詞識別結果。如方塊344所示,識別關鍵詞主題,並在方塊346將該等關鍵詞主題加至主題列表中。在某些具體實施例中,將所有獨立關鍵詞識別為關鍵詞主題,並將其加至主題列表中。在其它具體實施例中,僅一部分的該等關鍵詞被識別作為主題,而被加至主題列表中。例如,在某些具體實施例中,僅分配到一預定數量的文件片段的關鍵詞被識別作為關鍵詞主題,而被加至主題列表中。
上述的處理程序提供一列表的候選主題,其可包括經由一現存的本體映射、一主題本體分析、一局部主題本體分析、及(或)關鍵詞產生所識別的主題。在某些具體實施例中,可能會識別出比主題目錄中所需的還更大量的主題。因此,處理程序繼續將主題進行排序,並選擇其中的主題以納入主題目錄中。如方塊348所示,對候選主題進行排序。依據本發明之各種具體實施例,可使用多種不同參數來排序主題。在一實例中(僅為示例性而不具限制性),可基於每一候選主題分配到的文件總量來排序每一候選主題。一特定候選主題分配到愈大量的文件,則該候選主題具有愈前的排序。亦可基於一候選主題分配到的每一文件(或基於一組選擇的文件,例如前N個文件)的排序,來對該候選主題進行排序。每一文件的排序係對應到每一文件與該搜尋查詢的相關性。因此,一特定候選主題分配到相關性愈高的文件,則該候選主題具有愈前的排序。每一候選主題之長度(例如,字數)可進一步被用來排序候選主題。任何或所有此類變化都視為包含於本發明之具體實施例之範疇內。
如方塊350所示,基於排序以從該候選主題列表中選擇主題以納入主題目錄中,該主題目錄與搜尋結果係為回應搜尋查詢而一起被提供。在某些具體實施例中,選擇一預定數量的主題。例如,搜尋系統可選擇排序在最前的五個主題。在其它具體實施例中,可選擇其排序達到一預定或動態臨限門檻的主題。在另外的具體實施例中,選擇比其它主題排序更前許多的主題。於本發明之具體實施例中,可利用上述及(或)其它基於排序來選擇主題的方法的任意結合者。
如方塊352所示,基於所選擇的主題建立一主題目錄。此外,在方塊354,產生一搜尋結果頁面並回傳給輸入該搜尋查詢的使用者。依據本發明之一具體實施例,搜尋結果頁面包括針對該搜尋查詢的一搜尋結果列表。此外,該搜尋結果頁面包括主題目錄,其中包含由方塊350所選擇的多個主題。該主題目錄可顯示在靠近該等搜尋結果的一側部板區中,或顯示在該搜尋頁面之另一部分。
第6圖(作為一示例性實例)包括一範例營幕顯示,其圖示一搜尋結果頁面600,該頁面包括依據本發明之一具體實施例建立的一主題目錄。本領域之一般技藝人士將瞭解並認知到,第6圖之營幕顯示僅提供作為範例說明用,並非旨在各方面限制本發明之範疇。
如第6圖所示,回應於搜尋查詢602「薩馬米希娛樂(sammamish fun)」,已提供搜尋結果頁面600。回應於搜尋查詢602,搜尋結果頁面600包括一主題目錄604於左側板區。主題目錄604包括以下主題:地方列表(Local Listing)、遠足(Hiking)、划船(Boating)、薩馬米希煙火(Sammamish Fireworks)、線上交友(Online Date)、及長曲棍球(Lacrosse)。主題目錄604中所包括的主題,係針對搜尋查詢並基於此處所述的概念及本體實體分析以及關鍵詞擷取而識別的語意概念。搜尋結果頁面600亦包括一搜尋結果區606,用以顯示與搜尋查詢602相關的搜尋結果。在第6圖的營幕顯示中,「所有結果(All Results)」目前被顯示於搜尋結果區606中。若使用者從主題目錄604中選擇一主題,則有關所選定主題的搜尋結果會被顯示於搜尋結果區606中。如第6圖所示,搜尋結果頁面可包括其它特徵,例如相關的搜尋查詢608、搜尋歷史610及贊助廠商位址612。為了簡明目的,在搜尋結果頁面600中省略了這些區域之詳細內容。
可瞭解到,本發明之具體實施例將語義概念識別為主題,藉以為搜尋結果建立主題目錄。已參照特定具體實施例來描述本發明,該等具體實施例在各方面旨在作為示例性實例而不具限制性。其它替代實施例對本發明所屬領域之一般技藝人士而言係顯而易見的,而因此並非悖離本發明之範疇。
由以上說明可知,本發明相當適於達到前文所述之目標及目的,且所描述之系統及方法本身明顯具有其它優點。將瞭解到,某些特定特徵及次組合係有效的,亦可個別利用這些特定特徵或次組合,而毋需包含其它特徵及次組合。這是申請專利範圍所考慮到的而因此包含在申請專利範圍之範疇內。
100...運算裝置
110...匯流排
112...記憶體
114...處理器
116...顯示組件
118...輸入/輸出埠
120...輸入/輸出組件
122...電源供應
200...系統
202...使用者裝置
204...搜尋引擎
206...語意主題引擎
208...網路
210...本體映射組件
212...本體主題識別組件
214...本體局部主題識別組件
216...關鍵詞主題識別組件
218...主題排序/選擇組件
220...搜尋系統索引
222...知識庫
224...本體儲存組件
600...搜尋結果頁面
602...搜尋查詢
604...主題目錄
606...搜尋結果區
608...相關的搜尋查詢
610...搜尋歷史
612...贊助廠商位址
前文已參照所附圖式詳細描述本發明,其中:
第1圖係一示例性運算環境之方塊圖,其適於用來實現本發明之具體實施例;
第2圖係一示例性系統的方塊圖,本發明之具體實施例可利用於該系統中;
第3圖係依據本發明之一具體實施例的方法流程圖,該方法針對一搜尋查詢識別主題並建立一主題目錄;
第4圖係依據本發明之一具體實施例的方法流程圖,該方法用以命名一局部主題;
第5圖係依據本發明之一具體實施例的方法流程圖,該方法用以從文件片段計算獨立的關鍵詞;及
第6圖係依據本發明之一具體實施例的示例性營幕顯示,其顯示一搜尋結果頁面,該頁面具有建立的主題目錄。
200...系統
202...使用者裝置
204...搜尋引擎
206...語意主題引擎
208...網路
210...本體映射組件
212...本體主題識別組件
214...本體局部主題識別組件
216...關鍵詞主題識別組件
218...主題排序/選擇組件
220...搜尋系統索引
222...知識庫
224...本體儲存組件

Claims (19)

  1. 一或多電腦可讀取媒體,該電腦可讀取媒體並非訊號本身,其儲存有多數電腦可用指令,該等指令當被一或多運算裝置使用時,使該一或多運算裝置執行一方法,該方法包含以下步驟:接收一搜尋查詢;使用該搜尋查詢執行一搜尋;從該搜尋接收複數個文件片段;藉由將一或多文件片段與一主題本體進行比對,來識別一第一組的一或多候選主題,其中將該複數個文件片段之一或多文件片段與該主題本體進行比對的步驟,包含:基於每一文件片段中包含的字,為每一文件片段計算一特徵向量,且將每一特徵向量與該主題本體中之主題進行比對,且其中藉由決定一文件片段之特徵向量係在一特定主題之一預定距離內,決定該文件片段內之該等候選主題具有確認的主題識別結果;藉由將一或多文件片段與一局部主題本體進行比對,來識別一第二組的一或多候選主題;藉由從一或多文件片段產生關鍵詞主題,來識別一第三組的一或多候選主題;將來自該第一、第二及第三組的候選主題進行排序;基於該等候選主題的排序,選擇一或多主題;及回應於該搜尋查詢而提供一搜尋結果頁面,該搜尋結 果頁面具有一主題目錄及一搜尋結果區,該主題目錄包含該一或多主題,而該搜尋結果區用以顯示一或多搜尋結果。
  2. 如申請專利範圍第1項所述之一或多電腦可讀取媒體,其中藉由將一或多文件片段與一局部主題本體進行比對來識別一第二組的一或多候選主題的步驟,包含:識別一或多局部主題並對每一局部主題進行命名,其中一局部主題係由以下步驟進行命名:識別在一或多文件片段內用於該局部主題的一局部主題識別字的出現;在該一或多文件片段內的經識別的該局部主題識別字出現處,擷取出現在其附近處的字及(或)詞;計數每一擷取到的字及(或)詞的出現頻率;選擇一使用率最高的字或詞;及使用該局部主題識別字及該使用率最高的字或詞,來對該局部主題進行命名。
  3. 如申請專利範圍第1項所述之一或多電腦可讀取媒體,其中對一候選主題進行排序的步驟係基於選自以下之一或多者來達成:該候選主題分配到的文件的總量;該候選主題分配到的每一文件的排序;該主題分配到的一組選擇的文件的排序;及該候選主題的字長度。
  4. 如申請專利範圍第1項所述之一或多電腦可讀取媒體,其中基於該等候選主題的排序來選擇一或多主題的步驟,包含選自以下之一或多者:選擇一預定數量的主題;選擇其排序達到一預定臨限門檻的所有主題;及選擇具有比其它主題高得多的相關性的主題。
  5. 一或多電腦可讀取媒體,該電腦可讀取媒體並非訊號本身,其儲存有多數電腦可用指令,該等指令當被一或多運算裝置使用時,使該一或多運算裝置執行一方法,該方法包含以下步驟:接收一搜尋查詢;決定是否存在針對該搜尋查詢之一本體映射;若存在針對該搜尋查詢之一本體映射,則基於該本體映射獲取一第一組的主題,並將該第一組的主題加至一主題列表中;使用該搜尋查詢執行一搜尋以獲得複數個搜尋結果,每一搜尋結果對應至一文件片段;接收至少一部分的該等文件片段作為一文件集合,以進行進一步分析;將該文件集合中之每一文件片段與一主題本體進行比對,其中將該文件集合中之每一文件片段與該主題本體進行比對的步驟,包含:基於每一文件片段中包含的字,為每一文件片段計算一特徵向量,且將每一特徵向量與該主題本體中之主題進行比對,且其中藉由決定一文件 片段之特徵向量係在一特定主題之一預定距離內,決定該文件片段具有確認的主題識別結果;針對決定為具有確認的(positive)主題識別結果的每一文件片段,將該文件片段分配至一對應主題,並自該文件集合中移除該文件片段;將從該主題本體識別的至少一主題加至該主題列表中;將仍存留在該文件集合中的每一文件片段與一局部主題本體進行比對;針對決定為具有確認的局部主題識別結果的每一文件片段,將該文件片段分配至一對應局部主題,並自該文件集合中移除該文件片段;對分配到一或多文件片段的至少一局部主題進行命名;將至少一經命名的局部主題加至該主題列表;從仍存留在該文件集合中的文件片段,計算獨立關鍵詞;將文件分配至獨立關鍵詞;識別至少一關鍵詞主題;將該至少一關鍵詞主題加至該主題列表;排序該主題列表內的主題;基於該排序來選擇主題;使用該選定主題來建立一主題目錄;及回應於該搜尋查詢而提供一搜尋結果頁面,該搜尋結 果頁面包括該主題目錄及一搜尋結果區,該搜尋結果區用以顯示搜尋結果。
  6. 如申請專利範圍第5項所述之一或多電腦可讀取媒體,其中接收至少一部分的該等文件片段作為一文件集合以進行進一步分析的步驟,包含:接收與具有與該搜尋查詢最高相關性的一預定數量的搜尋結果相對應的文件集合。
  7. 如申請專利範圍第5項所述之一或多電腦可讀取媒體,其中將從該主題本體識別的至少一主題加至該主題列表中的步驟,包含:將分配到多於一預定數量的文件片段的每一主題加至其中。
  8. 如申請專利範圍第5項所述之一或多電腦可讀取媒體,其中將仍存留在該文件集合中的每一文件片段與一局部主題本體進行比對的步驟,包含:基於每一文件片段中包含的字,為每一文件片段計算一特徵向量,且將每一特徵向量與該局部主題本體中之局部主題進行比對,其中藉由決定一文件片段之特徵向量係在一特定局部主題之一預定距離內,決定該文件片段具有確認的局部主題識別結果。
  9. 如申請專利範圍第5項所述之一或多電腦可讀取媒 體,其中對分配到一或多文件片段的至少一局部主題進行命名的步驟,包含:對分配到多於一預定數量的文件片段的每一局部主題進行命名。
  10. 如申請專利範圍第5項所述之一或多電腦可讀取媒體,其中對一局部主題進行命名的步驟包含:識別該局部主題之一局部主題識別字係存在於分配至該局部主題的一或多文件片段內;在該一或多文件片段內的該經識別的該局部主題識別字出現處,擷取出現在其附近處的字及(或)詞;計數每一擷取到的字及(或)詞之出現頻率;選擇一使用率最高的字或詞;及使用該局部主題識別字及該使用率最高的字或詞,來對該局部主題進行命名。
  11. 如申請專利範圍第10項所述之一或多電腦可讀取媒體,其中計數每一擷取到的字及(或)詞之出現頻率的步驟,包括:追蹤每一擷取到的字及(或)詞相對於該局部識別字之位置,且其中對該局部主題進行命名的步驟,包含:基於該使用率最高的字或詞的位置資訊,來排列該局部主題識別字及該使用率最高的字或詞。
  12. 如申請專利範圍第5項所述之一或多電腦可讀取媒體,其中識別至少一關鍵詞主題的步驟,包含:識別 分配到多於一預定數量的文件片段的每一關鍵詞以作為一關鍵詞主題。
  13. 如申請專利範圍第5項所述之一或多電腦可讀取媒體,其中基於選自以下一或多者來排序一主題:該主題分配到的文件總數量;該主題分配到的每一文件的排序;該主題分配到的一組選擇的文件的排序;及該主題的字長度。
  14. 如申請專利範圍第5項所述之一或多電腦可讀取媒體,其中基於排序來選擇主題的步驟包含選自以下一或多者:選擇一預定數量的主題;選擇其排序滿足一預定臨限門檻的所有主題;及選擇具有比其它主題高得多的相關性的主題。
  15. 一種藉由一或多計算裝置所執行的電腦實現方法,該方法包含以下步驟:接收一搜尋查詢;使用該搜尋查詢執行一搜尋;從該搜尋接收複數個文件片段;藉由將一或多文件片段與一主題本體進行比對,來識別一第一組的一或多候選主題,其中將該複數個文件片段之各個文件片段與該主題本體進行比對的步驟,包含:基於每一文件片段中包含的字,為每一文件片段計 算一特徵向量,且將每一特徵向量與該主題本體中之主題進行比對,且其中藉由決定一文件片段之特徵向量係在一特定主題之一預定距離內,決定該文件片段內之該等候選主題具有確認的主題識別結果;藉由將一或多文件片段與一局部主題本體進行比對,來識別一第二組的一或多候選主題;藉由從一或多文件片段產生關鍵詞主題,來識別一第三組的一或多候選主題;將來自該第一、第二及第三組的候選主題進行排序;基於該等候選主題的排序,選擇一或多主題;及回應於該搜尋查詢而提供一搜尋結果頁面,該搜尋結果頁面具有一主題目錄及一搜尋結果區,該主題目錄包含該一或多主題,而該搜尋結果區用以顯示一或多搜尋結果。
  16. 如申請專利範圍第15項所述之電腦實現方法,其中藉由將一或多文件片段與一局部主題本體進行比對來識別一第二組的一或多候選主題的步驟,包含:識別一或多局部主題並對每一局部主題進行命名,其中一局部主題係由以下步驟進行命名:識別在一或多文件片段內用於該局部主題的一局部主題識別字的出現;擷取出現在該一或多文件片段內的經識別的該局部主題識別字出現處附近的字及(或)詞; 計數每一擷取到的字及(或)詞的出現頻率;選擇一使用率最高的字或詞;及使用該局部主題識別字及該使用率最高的字或詞,來對該局部主題進行命名。
  17. 如申請專利範圍第15項所述之電腦實現方法,其中對一候選主題進行排序的步驟係基於選自以下之一或多者來達成:該候選主題分配到的文件的總量;該候選主題分配到的每一文件的排序;該主題分配到的一組選擇的文件的排序;及該候選主題的字長度。
  18. 如申請專利範圍第15項所述之電腦實現方法,其中基於該等候選主題的排序來選擇一或多主題的步驟,包含選自以下之一或多者:選擇一預定數量的主題;選擇其排序達到一預定臨限門檻的所有主題;及選擇具有相較其它主題而言明顯較高之相關性的主題。
  19. 如申請專利範圍第15項所述之電腦實現方法,其中將該一或多文件片段與該局部主題本體進行比對的步驟,包含:基於每一文件片段中包含的字,為該一或多文件片段計算一特徵向量,且將每一特徵向量與該局部主題本體中之局部主題進行比對,且其中藉由決定一文件片段之特徵向量係在一特定局部主題之一預定距離 內,決定該文件片段內之該一或多候選主題之第二集合具有確認的局部主題識別結果。
TW100103908A 2010-02-05 2011-02-01 用於搜尋結果之語義目錄的電腦可讀取媒體及電腦實現方法 TWI524193B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US12/701,338 US8150859B2 (en) 2010-02-05 2010-02-05 Semantic table of contents for search results

Publications (2)

Publication Number Publication Date
TW201145056A TW201145056A (en) 2011-12-16
TWI524193B true TWI524193B (zh) 2016-03-01

Family

ID=44354507

Family Applications (1)

Application Number Title Priority Date Filing Date
TW100103908A TWI524193B (zh) 2010-02-05 2011-02-01 用於搜尋結果之語義目錄的電腦可讀取媒體及電腦實現方法

Country Status (5)

Country Link
US (2) US8150859B2 (zh)
CN (1) CN102725759B (zh)
HK (1) HK1173817A1 (zh)
TW (1) TWI524193B (zh)
WO (1) WO2011097066A2 (zh)

Families Citing this family (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7584208B2 (en) 2002-11-20 2009-09-01 Radar Networks, Inc. Methods and systems for managing offers and requests in a network
US7640267B2 (en) * 2002-11-20 2009-12-29 Radar Networks, Inc. Methods and systems for managing entities in a computing device using semantic objects
US7433876B2 (en) * 2004-02-23 2008-10-07 Radar Networks, Inc. Semantic web portal and platform
WO2008021832A2 (en) * 2006-08-09 2008-02-21 Radar Networks, Inc. Harvesting data from page
US20090076887A1 (en) * 2007-09-16 2009-03-19 Nova Spivack System And Method Of Collecting Market-Related Data Via A Web-Based Networking Environment
US20090106307A1 (en) * 2007-10-18 2009-04-23 Nova Spivack System of a knowledge management and networking environment and method for providing advanced functions therefor
US20100004975A1 (en) * 2008-07-03 2010-01-07 Scott White System and method for leveraging proximity data in a web-based socially-enabled knowledge networking environment
US8521731B2 (en) * 2008-07-09 2013-08-27 Yahoo! Inc. Systems and methods for query expansion in sponsored search
US8862579B2 (en) * 2009-04-15 2014-10-14 Vcvc Iii Llc Search and search optimization using a pattern of a location identifier
WO2010120929A2 (en) * 2009-04-15 2010-10-21 Evri Inc. Generating user-customized search results and building a semantics-enhanced search engine
US10628847B2 (en) * 2009-04-15 2020-04-21 Fiver Llc Search-enhanced semantic advertising
US8200617B2 (en) 2009-04-15 2012-06-12 Evri, Inc. Automatic mapping of a location identifier pattern of an object to a semantic type using object metadata
US11023675B1 (en) * 2009-11-03 2021-06-01 Alphasense OY User interface for use with a search engine for searching financial related documents
US8983989B2 (en) 2010-02-05 2015-03-17 Microsoft Technology Licensing, Llc Contextual queries
US8903794B2 (en) * 2010-02-05 2014-12-02 Microsoft Corporation Generating and presenting lateral concepts
US20110231395A1 (en) * 2010-03-19 2011-09-22 Microsoft Corporation Presenting answers
US8788260B2 (en) * 2010-05-11 2014-07-22 Microsoft Corporation Generating snippets based on content features
US20110302149A1 (en) * 2010-06-07 2011-12-08 Microsoft Corporation Identifying dominant concepts across multiple sources
US20120278318A1 (en) * 2011-05-01 2012-11-01 Reznik Alan M Systems and methods for facilitating enhancements to electronic group searches
US11841912B2 (en) 2011-05-01 2023-12-12 Twittle Search Limited Liability Company System for applying natural language processing and inputs of a group of users to infer commonly desired search results
US9043350B2 (en) * 2011-09-22 2015-05-26 Microsoft Technology Licensing, Llc Providing topic based search guidance
US9152953B2 (en) * 2012-02-10 2015-10-06 International Business Machines Corporation Multi-tiered approach to E-mail prioritization
US9256862B2 (en) * 2012-02-10 2016-02-09 International Business Machines Corporation Multi-tiered approach to E-mail prioritization
US8548973B1 (en) 2012-05-15 2013-10-01 International Business Machines Corporation Method and apparatus for filtering search results
US8843483B2 (en) 2012-05-29 2014-09-23 International Business Machines Corporation Method and system for interactive search result filter
US10002164B2 (en) * 2012-06-01 2018-06-19 Ansys, Inc. Systems and methods for context based search of simulation objects
US9684717B2 (en) * 2012-06-18 2017-06-20 Sap Se Semantic search for business entities
TW201403528A (zh) * 2012-07-10 2014-01-16 Telexpress Corp 用於諮詢服務系統之關鍵字管理系統及其方法
US9336297B2 (en) * 2012-08-02 2016-05-10 Paypal, Inc. Content inversion for user searches and product recommendations systems and methods
US9922120B2 (en) 2012-08-24 2018-03-20 Microsoft Technology Licensing, Llc Online learning of click-through rates on federated search results
US8898154B2 (en) * 2012-09-19 2014-11-25 International Business Machines Corporation Ranking answers to a conceptual query
US8935272B2 (en) 2013-03-17 2015-01-13 Alation, Inc. Curated answers community automatically populated through user query monitoring
WO2014172314A1 (en) * 2013-04-15 2014-10-23 Chacha Search, Inc. Method and system of assigning topics to answerers
US9779182B2 (en) 2013-06-07 2017-10-03 Microsoft Technology Licensing, Llc Semantic grouping in search
US9535983B2 (en) * 2013-10-29 2017-01-03 Microsoft Technology Licensing, Llc Text sample entry group formulation
US20150356171A1 (en) * 2014-06-05 2015-12-10 Harmon.Ie R&D Ltd. System and method for cross-cloud topic matching
US9940365B2 (en) 2014-07-08 2018-04-10 Microsoft Technology Licensing, Llc Ranking tables for keyword search
US10592539B1 (en) * 2014-07-11 2020-03-17 Twitter, Inc. Trends in a messaging platform
CN105786936A (zh) 2014-12-23 2016-07-20 阿里巴巴集团控股有限公司 用于对搜索数据进行处理的方法及设备
US10733221B2 (en) * 2016-03-30 2020-08-04 Microsoft Technology Licensing, Llc Scalable mining of trending insights from text
US10817511B2 (en) 2016-06-30 2020-10-27 Intel Corporation Search dimensionality expansion
CN110892399B (zh) 2017-06-16 2023-05-09 爱思唯尔有限公司 自动生成主题内容摘要的系统和方法
US10725918B2 (en) 2017-09-19 2020-07-28 International Business Machines Corporation Table of contents cache entry having a pointer for a range of addresses
US11061575B2 (en) 2017-09-19 2021-07-13 International Business Machines Corporation Read-only table of contents register
US10713050B2 (en) 2017-09-19 2020-07-14 International Business Machines Corporation Replacing Table of Contents (TOC)-setting instructions in code with TOC predicting instructions
US10620955B2 (en) 2017-09-19 2020-04-14 International Business Machines Corporation Predicting a table of contents pointer value responsive to branching to a subroutine
US10896030B2 (en) 2017-09-19 2021-01-19 International Business Machines Corporation Code generation relating to providing table of contents pointer values
US10884929B2 (en) 2017-09-19 2021-01-05 International Business Machines Corporation Set table of contents (TOC) register instruction
US10705973B2 (en) 2017-09-19 2020-07-07 International Business Machines Corporation Initializing a data structure for use in predicting table of contents pointer values
US10997228B2 (en) 2017-10-26 2021-05-04 International Business Machines Corporation Comparing tables with semantic vectors
IL258689A (en) 2018-04-12 2018-05-31 Browarnik Abel A system and method for computerized semantic indexing and searching
US11423073B2 (en) 2018-11-16 2022-08-23 Microsoft Technology Licensing, Llc System and management of semantic indicators during document presentations
CN110032622B (zh) * 2018-11-28 2023-07-14 创新先进技术有限公司 关键词确定方法、装置、设备及计算机可读存储介质
CN109635197B (zh) * 2018-12-17 2021-08-24 北京百度网讯科技有限公司 搜索方法、装置、电子设备及存储介质
US20240005094A1 (en) * 2022-06-29 2024-01-04 Microsoft Technology Licensing, Llc Hierarchical ontology matching with self-supervision

Family Cites Families (122)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5758257A (en) * 1994-11-29 1998-05-26 Herz; Frederick System and method for scheduling broadcast of and access to video programs and other data using customer profiles
US6460034B1 (en) * 1997-05-21 2002-10-01 Oracle Corporation Document knowledge base research and retrieval system
US6038560A (en) * 1997-05-21 2000-03-14 Oracle Corporation Concept knowledge base search and retrieval system
US8396824B2 (en) * 1998-05-28 2013-03-12 Qps Tech. Limited Liability Company Automatic data categorization with optimally spaced semantic seed terms
US7152031B1 (en) * 2000-02-25 2006-12-19 Novell, Inc. Construction, manipulation, and comparison of a multi-dimensional semantic space
US6167368A (en) * 1998-08-14 2000-12-26 The Trustees Of Columbia University In The City Of New York Method and system for indentifying significant topics of a document
US6363378B1 (en) * 1998-10-13 2002-03-26 Oracle Corporation Ranking of query feedback terms in an information retrieval system
US6510406B1 (en) * 1999-03-23 2003-01-21 Mathsoft, Inc. Inverse inference engine for high performance web search
US6473730B1 (en) * 1999-04-12 2002-10-29 The Trustees Of Columbia University In The City Of New York Method and system for topical segmentation, segment significance and segment function
US7275061B1 (en) * 2000-04-13 2007-09-25 Indraweb.Com, Inc. Systems and methods for employing an orthogonal corpus for document indexing
EP1124189A4 (en) 1999-06-04 2004-07-21 Seiko Epson Corp DOCUMENT SORTING PROCESS, DOCUMENT SORTING AND RECORDING MEDIUM ON WHICH THE DOCUMENT SORTING PROGRAM IS RECORDED
US8051104B2 (en) * 1999-09-22 2011-11-01 Google Inc. Editing a network of interconnected concepts
US6820111B1 (en) * 1999-12-07 2004-11-16 Microsoft Corporation Computer user interface architecture that saves a user's non-linear navigation history and intelligently maintains that history
JP2003519840A (ja) 2000-01-06 2003-06-24 アイゴットペイン.コム,インコーポレイティド 意思決定のシステムおよび方法
US6567805B1 (en) * 2000-05-15 2003-05-20 International Business Machines Corporation Interactive automated response system
US6675159B1 (en) * 2000-07-27 2004-01-06 Science Applic Int Corp Concept-based search and retrieval system
AU2001280998A1 (en) 2000-08-03 2002-02-18 Bruce A. Epstein Information collaboration and reliability assessment
US20030217052A1 (en) * 2000-08-24 2003-11-20 Celebros Ltd. Search engine method and apparatus
US6560600B1 (en) * 2000-10-25 2003-05-06 Alta Vista Company Method and apparatus for ranking Web page search results
US6823333B2 (en) * 2001-03-02 2004-11-23 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration System, method and apparatus for conducting a keyterm search
US20040030741A1 (en) * 2001-04-02 2004-02-12 Wolton Richard Ernest Method and apparatus for search, visual navigation, analysis and retrieval of information from networks with remote notification and content delivery
US20080016036A1 (en) * 2005-10-11 2008-01-17 Nosa Omoigui Information nervous system
US7089226B1 (en) * 2001-06-28 2006-08-08 Microsoft Corporation System, representation, and method providing multilevel information retrieval with clarification dialog
US20050108200A1 (en) * 2001-07-04 2005-05-19 Frank Meik Category based, extensible and interactive system for document retrieval
US20050022114A1 (en) * 2001-08-13 2005-01-27 Xerox Corporation Meta-document management system with personality identifiers
US7225183B2 (en) * 2002-01-28 2007-05-29 Ipxl, Inc. Ontology-based information management system and method
US7153137B2 (en) * 2002-02-11 2006-12-26 Sap Ag Offline e-courses
US20060004732A1 (en) * 2002-02-26 2006-01-05 Odom Paul S Search engine methods and systems for generating relevant search results and advertisements
US8229957B2 (en) * 2005-04-22 2012-07-24 Google, Inc. Categorizing objects, such as documents and/or clusters, with respect to a taxonomy and data structures derived from such categorization
US20090254510A1 (en) 2006-07-27 2009-10-08 Nosa Omoigui Information nervous system
ITFI20020113A1 (it) 2002-06-26 2003-12-29 Perini Fabio Spa Dispositivo goffratore e laminatore con gruppo di cilindri goffratoriintercambiabile
US7225407B2 (en) * 2002-06-28 2007-05-29 Microsoft Corporation Resource browser sessions search
US20040003351A1 (en) * 2002-06-28 2004-01-01 Microsoft Corporation Navigating a resource browser session
US20040015483A1 (en) * 2002-07-16 2004-01-22 Hogan Ronald W. Document tracking system and method
US6886010B2 (en) * 2002-09-30 2005-04-26 The United States Of America As Represented By The Secretary Of The Navy Method for data and text mining and literature-based discovery
FR2847056B1 (fr) 2002-11-08 2006-03-03 Surgiview Procede et systeme de traitement de donnees d'evaluation
US20040169688A1 (en) * 2003-02-27 2004-09-02 Microsoft Corporation Multi-directional display and navigation of hierarchical data and optimization of display area consumption
US7774333B2 (en) * 2003-08-21 2010-08-10 Idia Inc. System and method for associating queries and documents with contextual advertisements
US8086619B2 (en) * 2003-09-05 2011-12-27 Google Inc. System and method for providing search query refinements
US7584181B2 (en) * 2003-09-30 2009-09-01 Microsoft Corporation Implicit links search enhancement system and method for search engines using implicit links generated by mining user access patterns
US7240049B2 (en) * 2003-11-12 2007-07-03 Yahoo! Inc. Systems and methods for search query processing using trend analysis
US7383171B2 (en) * 2003-12-05 2008-06-03 Xerox Corporation Semantic stenography using short note input data
US7774721B2 (en) * 2003-12-15 2010-08-10 Microsoft Corporation Intelligent backward resource navigation
US20060106793A1 (en) * 2003-12-29 2006-05-18 Ping Liang Internet and computer information retrieval and mining with intelligent conceptual filtering, visualization and automation
US20050149510A1 (en) * 2004-01-07 2005-07-07 Uri Shafrir Concept mining and concept discovery-semantic search tool for large digital databases
US7167866B2 (en) * 2004-01-23 2007-01-23 Microsoft Corporation Selective multi level expansion of data base via pivot point data
GB0407816D0 (en) * 2004-04-06 2004-05-12 British Telecomm Information retrieval
US7448047B2 (en) * 2004-04-29 2008-11-04 Sybase, Inc. Database system with methodology for providing stored procedures as web services
US8977859B2 (en) 2004-05-04 2015-03-10 Elsevier, Inc. Systems and methods for data compression and decompression
RU2355022C2 (ru) * 2004-07-01 2009-05-10 Нокиа Корпорейшн Способ, устройство и компьютерный программный продукт для использования онтологии контекстов при персонализации приложения для мобильного устройства
US7617176B2 (en) * 2004-07-13 2009-11-10 Microsoft Corporation Query-based snippet clustering for search result grouping
US7536408B2 (en) * 2004-07-26 2009-05-19 Google Inc. Phrase-based indexing in an information retrieval system
US7426507B1 (en) * 2004-07-26 2008-09-16 Google, Inc. Automatic taxonomy generation in search results using phrases
US7580921B2 (en) * 2004-07-26 2009-08-25 Google Inc. Phrase identification in an information retrieval system
US7603349B1 (en) 2004-07-29 2009-10-13 Yahoo! Inc. User interfaces for search systems using in-line contextual queries
US20060047691A1 (en) * 2004-08-31 2006-03-02 Microsoft Corporation Creating a document index from a flex- and Yacc-generated named entity recognizer
US20060069617A1 (en) * 2004-09-27 2006-03-30 Scott Milener Method and apparatus for prefetching electronic data for enhanced browsing
US20070011155A1 (en) 2004-09-29 2007-01-11 Sarkar Pte. Ltd. System for communication and collaboration
US7565627B2 (en) * 2004-09-30 2009-07-21 Microsoft Corporation Query graphs indicating related queries
US7523085B2 (en) * 2004-09-30 2009-04-21 Buzzmetrics, Ltd An Israel Corporation Topical sentiments in electronically stored communications
CN1609859A (zh) * 2004-11-26 2005-04-27 孙斌 搜索结果聚类的方法
CA2500573A1 (en) * 2005-03-14 2006-09-14 Oculus Info Inc. Advances in nspace - system and method for information analysis
WO2006062868A2 (en) * 2004-12-06 2006-06-15 Yahoo! Inc. Systems and methods for managing and using multiple concept networks for assisted search processing
CA2596279A1 (en) 2005-01-28 2006-08-10 Aol Llc Web query classification
US7577646B2 (en) * 2005-05-02 2009-08-18 Microsoft Corporation Method for finding semantically related search engine queries
US20060287919A1 (en) * 2005-06-02 2006-12-21 Blue Mustard Llc Advertising search system and method
US20060287983A1 (en) * 2005-06-16 2006-12-21 Microsoft Corporation Avoiding slow sections in an information search
US7668825B2 (en) * 2005-08-26 2010-02-23 Convera Corporation Search system and method
US20070094256A1 (en) * 2005-09-02 2007-04-26 Hite Thomas D System and method for integrating and adopting a service-oriented architecture
US8688673B2 (en) 2005-09-27 2014-04-01 Sarkar Pte Ltd System for communication and collaboration
US8903810B2 (en) * 2005-12-05 2014-12-02 Collarity, Inc. Techniques for ranking search results
US20070174255A1 (en) * 2005-12-22 2007-07-26 Entrieva, Inc. Analyzing content to determine context and serving relevant content based on the context
EP1843256A1 (en) 2006-04-03 2007-10-10 British Telecmmunications public limited campany Ranking of entities associated with stored content
CN101512521B (zh) 2006-06-02 2013-01-16 Tti发明有限责任公司 基于概念对语音文档的跨媒体索引和检索
US7996440B2 (en) * 2006-06-05 2011-08-09 Accenture Global Services Limited Extraction of attributes and values from natural language documents
CA2549536C (en) * 2006-06-06 2012-12-04 University Of Regina Method and apparatus for construction and use of concept knowledge base
CN101079024B (zh) * 2006-06-19 2010-06-16 腾讯科技(深圳)有限公司 一种专业词表动态生成系统和方法
US20080033932A1 (en) * 2006-06-27 2008-02-07 Regents Of The University Of Minnesota Concept-aware ranking of electronic documents within a computer network
US7668813B2 (en) * 2006-08-11 2010-02-23 Yahoo! Inc. Techniques for searching future events
US7693865B2 (en) * 2006-08-30 2010-04-06 Yahoo! Inc. Techniques for navigational query identification
US20100036797A1 (en) 2006-08-31 2010-02-11 The Regents Of The University Of California Semantic search engine
CN101169780A (zh) * 2006-10-25 2008-04-30 华为技术有限公司 一种基于语义本体的检索系统和方法
US9817902B2 (en) * 2006-10-27 2017-11-14 Netseer Acquisition, Inc. Methods and apparatus for matching relevant content to user intention
US8924197B2 (en) * 2006-10-31 2014-12-30 Semantifi, Inc. System and method for converting a natural language query into a logical query
US20090234814A1 (en) * 2006-12-12 2009-09-17 Marco Boerries Configuring a search engine results page with environment-specific information
KR100837751B1 (ko) 2006-12-12 2008-06-13 엔에이치엔(주) 문서 집합을 기반으로 단어 간의 연관도를 측정하는 방법및 상기 방법을 수행하는 시스템
US7809719B2 (en) * 2007-02-08 2010-10-05 Microsoft Corporation Predicting textual candidates
US7788269B2 (en) * 2007-03-30 2010-08-31 International Business Machines Corporation Integration of predefined multi-dimensional and flexibly-ordered dynamic search interfaces
US20080256056A1 (en) * 2007-04-10 2008-10-16 Yahoo! Inc. System for building a data structure representing a network of users and advertisers
CN100592293C (zh) * 2007-04-28 2010-02-24 李树德 基于智能本体的知识搜索引擎及其实现方法
JP5241828B2 (ja) * 2007-06-14 2013-07-17 グーグル・インコーポレーテッド 辞書の単語及び熟語の判定
US7970721B2 (en) 2007-06-15 2011-06-28 Microsoft Corporation Learning and reasoning from web projections
US8122360B2 (en) * 2007-06-27 2012-02-21 Kosmix Corporation Automatic selection of user-oriented web content
US20090006358A1 (en) * 2007-06-27 2009-01-01 Microsoft Corporation Search results
US8205166B2 (en) * 2007-07-20 2012-06-19 International Business Machines Corporation Methods for organizing information accessed through a web browser
US20100131085A1 (en) * 2007-09-07 2010-05-27 Ryan Steelberg System and method for on-demand delivery of audio content for use with entertainment creatives
JP2009080624A (ja) * 2007-09-26 2009-04-16 Toshiba Corp 情報表示装置、方法及びプログラム
US20090089078A1 (en) * 2007-09-28 2009-04-02 Great-Circle Technologies, Inc. Bundling of automated work flow
US8862608B2 (en) * 2007-11-13 2014-10-14 Wal-Mart Stores, Inc. Information retrieval using category as a consideration
US8452768B2 (en) * 2007-12-17 2013-05-28 Yahoo! Inc. Using user search behavior to plan online advertising campaigns
US10002189B2 (en) * 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US8694526B2 (en) 2008-03-18 2014-04-08 Google Inc. Apparatus and method for displaying search results using tabs
US20090254574A1 (en) * 2008-04-04 2009-10-08 University Of Surrey Method and apparatus for producing an ontology representing devices and services currently available to a device within a pervasive computing environment
JP5150341B2 (ja) 2008-04-10 2013-02-20 株式会社東芝 データ作成装置及び方法
US8805844B2 (en) 2008-08-04 2014-08-12 Liveperson, Inc. Expert search
US10311445B2 (en) * 2008-08-20 2019-06-04 Palo Alto Research Center Incorporated Inference detection enabled by internet advertising
US8671096B2 (en) * 2008-10-24 2014-03-11 International Business Machines Corporation Methods and apparatus for context-sensitive information retrieval based on interactive user notes
US20100138402A1 (en) 2008-12-02 2010-06-03 Chacha Search, Inc. Method and system for improving utilization of human searchers
EP2446364B1 (en) 2009-06-22 2019-09-04 Commonwealth Scientific and Industrial Research Organisation Method and system for ontology-driven querying and programming of sensors
US8180768B2 (en) 2009-08-13 2012-05-15 Politecnico Di Milano Method for extracting, merging and ranking search engine results
EP2629211A1 (en) 2009-08-21 2013-08-21 Mikko Kalervo Väänänen Method and means for data searching and language translation
WO2011022867A1 (en) 2009-08-24 2011-03-03 Hewlett-Packard Development Company, L.P. Method and apparatus for searching electronic documents
US20110125734A1 (en) 2009-11-23 2011-05-26 International Business Machines Corporation Questions and answers generation
US20110131157A1 (en) 2009-11-28 2011-06-02 Yahoo! Inc. System and method for predicting context-dependent term importance of search queries
US20110131205A1 (en) 2009-11-28 2011-06-02 Yahoo! Inc. System and method to identify context-dependent term importance of queries for predicting relevant search advertisements
US8983989B2 (en) 2010-02-05 2015-03-17 Microsoft Technology Licensing, Llc Contextual queries
US8260664B2 (en) 2010-02-05 2012-09-04 Microsoft Corporation Semantic advertising selection from lateral concepts and topics
US8903794B2 (en) 2010-02-05 2014-12-02 Microsoft Corporation Generating and presenting lateral concepts
US20110231395A1 (en) 2010-03-19 2011-09-22 Microsoft Corporation Presenting answers
US9361387B2 (en) 2010-04-22 2016-06-07 Microsoft Technology Licensing, Llc Context-based services
US8572076B2 (en) 2010-04-22 2013-10-29 Microsoft Corporation Location context mining
US20110307460A1 (en) 2010-06-09 2011-12-15 Microsoft Corporation Navigating relationships among entities

Also Published As

Publication number Publication date
US20120246155A1 (en) 2012-09-27
US8326842B2 (en) 2012-12-04
TW201145056A (en) 2011-12-16
WO2011097066A3 (en) 2011-11-24
US8150859B2 (en) 2012-04-03
CN102725759A (zh) 2012-10-10
HK1173817A1 (zh) 2013-05-24
CN102725759B (zh) 2015-11-25
US20110196875A1 (en) 2011-08-11
WO2011097066A2 (en) 2011-08-11

Similar Documents

Publication Publication Date Title
TWI524193B (zh) 用於搜尋結果之語義目錄的電腦可讀取媒體及電腦實現方法
JP5536907B2 (ja) 個別化されたタグのランク付けのためのシステム、方法、およびコンピュータ・プログラム
US8914720B2 (en) Method and system for constructing a document redundancy graph
JP5575902B2 (ja) クエリのセマンティックパターンに基づく情報検索
US7624102B2 (en) System and method for grouping by attribute
CA2790421C (en) Indexing and searching employing virtual documents
JP5616444B2 (ja) 文書インデックス化およびデータクエリングのための方法およびシステム
US8458187B2 (en) Methods and systems for visualizing topic location in a document redundancy graph
CN105512180B (zh) 一种搜索推荐方法及装置
CN106095738B (zh) 推荐表单片段
CN108334632B (zh) 实体推荐方法、装置、计算机设备和计算机可读存储介质
JP5329540B2 (ja) ユーザ中心の情報探索方法、コンピュータ読み取り可能な記録媒体およびユーザ中心の情報探索システム
KR20110050478A (ko) 검색 질의에 응답하여 디스커션 스레드에 대한 포스트를 제공하는 방법 및 시스템
WO2008106668A1 (en) User query mining for advertising matching
US20110208715A1 (en) Automatically mining intents of a group of queries
US8234584B2 (en) Computer system, information collection support device, and method for supporting information collection
US8904272B2 (en) Method of multi-document aggregation and presentation
JP4912384B2 (ja) 文書検索装置、文書検索方法、および文書検索プログラム
JP2000331020A (ja) 情報参照方法,情報参照装置および情報参照プログラムを格納した記憶媒体
CN108470046B (zh) 基于新闻事件搜索语句的新闻事件排序方法及系统
JP5127553B2 (ja) 情報処理装置、情報処理方法、プログラム及び記録媒体
JP5589009B2 (ja) 推薦クエリ抽出装置及び方法及びプログラム
JP2007164633A (ja) コンテンツ検索方法及び装置及びプログラム
JP2009146013A (ja) コンテンツ検索方法及び装置並びにプログラム
JP2004192368A (ja) 関連分類抽出方法及び装置

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees