TWI475412B - 數位內容次序調整方法和數位內容匯流器 - Google Patents
數位內容次序調整方法和數位內容匯流器 Download PDFInfo
- Publication number
- TWI475412B TWI475412B TW101111679A TW101111679A TWI475412B TW I475412 B TWI475412 B TW I475412B TW 101111679 A TW101111679 A TW 101111679A TW 101111679 A TW101111679 A TW 101111679A TW I475412 B TWI475412 B TW I475412B
- Authority
- TW
- Taiwan
- Prior art keywords
- user
- group
- digital content
- content
- preference
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 44
- 230000006855 networking Effects 0.000 claims description 12
- 230000003993 interaction Effects 0.000 claims description 9
- 230000002452 interceptive effect Effects 0.000 claims description 8
- 230000004044 response Effects 0.000 claims description 3
- 230000006399 behavior Effects 0.000 description 67
- 238000004364 calculation method Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 241000227653 Lycopersicon Species 0.000 description 4
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000002776 aggregation Effects 0.000 description 3
- 238000004220 aggregation Methods 0.000 description 3
- 235000015067 sauces Nutrition 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 235000013305 food Nutrition 0.000 description 2
- 235000013372 meat Nutrition 0.000 description 2
- 235000012149 noodles Nutrition 0.000 description 2
- 235000013580 sausages Nutrition 0.000 description 2
- 238000010187 selection method Methods 0.000 description 2
- 235000013547 stew Nutrition 0.000 description 2
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 238000003646 Spearman's rank correlation coefficient Methods 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 238000009833 condensation Methods 0.000 description 1
- 230000005494 condensation Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000011273 social behavior Effects 0.000 description 1
- 230000003997 social interaction Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本揭露是有關於一種依據使用者的偏好和社群關係的數位內容(digital content)次序調整方法和數位內容匯流器(digital content aggregator)。
隨著iPad的風行,Flipboard這類串流式數位內容匯流媒體相繼現身。Flipboard是iPad的一款應用程式,使用者可以訂閱多個內容來源(content source),每個內容來源可提供許多數位內容。如果內容來源是電子雜誌,其數位內容就是雜誌中的文章。如果內容來源是臉書(Facebook)、推特(Twitter)或噗浪(Plurk)之類的社群網站,其數位內容就是使用者發表的短句、文章、靜態圖片或動態影片。由於這些數位內容隨時間而不斷產生,不斷發表,所以可稱為內容串流(content stream)。Flipboard是將每個訂閱的內容來源視為一本虛擬雜誌,例如臉書和推特各為一本雜誌。雜誌風格的數位內容呈現方式使Flipboard普遍受到大眾的愛用,然而如果訂閱的內容來源過多,會造成資訊過載(information overload)的問題。
為解決資訊過載的問題,另一個應用程式Zite提出個人化的解決方案。Zite的使用者可以設定自己想訂閱的主題,例如汽車、寵物或美食等等。此外Zite也會觀察使用者的閱覽行為,藉由觀察使用者點擊觀看或不點擊觀看哪些題材、文章長度如何、和使用者的閱讀時間長度等,不斷了解使用者的興趣,藉此提供個人化的數位內容的呈現次序。
本揭露提供一種數位內容次序調整方法和數位內容匯流器(digital content aggregator),可分析使用者的閱覽行為記錄(reading behavior log)且/或社群行為記錄(social behavior log),得知使用者關於一個或多個內容串流其中的數位內容的偏好因素。
本揭露提供的數位內容次序調整方法和數位內容匯流器可將上述的一個或多個內容串流組合成一個匯流串流(aggregated stream),並根據上述數位內容的時間因素,以及使用者關於上述數位內容的偏好因素,決定上述數位內容在匯流串流中的次序。這樣的次序調整可讓使用者優先看到最新鮮、最相關和最感興趣的數位內容,可避免眾多內容來源所造成的資訊過載。
為讓本揭露之上述特徵能更明顯易懂,下文特舉實施例,並配合所附圖式作詳細說明如下。
圖1是依照本揭露一實施例的一種數位內容匯流器120的示意圖。圖2、圖5A至圖5D以及圖6是數位內容匯流器所執行的數位內容次序調整方法的流程圖,其中圖2繪示主要步驟,圖5A至圖5D和圖6繪示進一步的細節。
本實施例中,可以有一個或多個內容來源,例如內容來源111~113,提供一個或多個內容串流給數位內容匯流器120。上述內容來源可以是社群網站、新聞網站或電子雜誌等數位內容提供者。數位內容匯流器120執行圖2的步驟220,將上述內容串流組合成一個匯流串流,提供給閱覽器(viewer) 130顯示,以供使用者點閱瀏覽。在組合內容串流時,數位內容匯流器120根據上述內容串流其中的數位內容的時間因素,以及使用者關於上述數位內容的偏好因素,決定上述數位內容在匯流串流中的次序。這次序也就是閱覽器130呈現給使用者的顯示次序。上述的時間因素至少包括上述數位內容的發表時間和有效期間其中之一。上述的偏好因素至少包括使用者關於上述數位內容的偏好和社群關係其中之一。
數位內容匯流器120可以為多位使用者提供上述的數位內容整合與排序服務。數位內容匯流器120可依照步驟220將個別使用者訂閱的內容串流組合成匯流串流,並調整其中的數位內容的次序,然後提供此匯流串流以供該使用者的閱覽器顯示。為了使數位內容匯流器120能分析使用者的偏好,閱覽器會記錄所屬使用者對上述數位內容的閱覽行為,將此閱覽行為記錄提供給數位內容匯流器120。為了分析使用者的社群關係,數位內容匯流器120會自使用者加入的一個或多個社群網站,例如社群網站141~143,取得使用者的社群行為記錄。
數位內容匯流器120包括偏好分析模組121和次序調整模組123。偏好分析模組121根據一或多個使用者的閱覽行為記錄且/或社群行為記錄,分析上述使用者關於上述內容串流的數位內容的偏好因素,將分析結果存入資料庫122。偏好分析模組121以遞增(incremental)方式產生上述的分析結果,也就是每隔一段預設時間(例如五分鐘)分析最近一段預設時間(例如九十天)內的閱覽行為記錄且/或社群行為記錄,並根據閱覽行為記錄和社群行為記錄之變動部分,每次逐步更新上述分析結果。次序調整模組123將上述內容串流組合成一個匯流串流,並根據上述數位內容的時間因素,以及使用者的上述偏好因素,決定上述數位內容在匯流串流中的次序。次序調整模組123以即時(real time)方式進行上述內容串流的組合與排序。也就是說,次序調整模組123只在閱覽器130被使用來閱覽數位內容時才進行上述內容串流的組合與排序。
圖3是數位內容匯流器120的另一個示意圖。偏好分析模組121可包括圖3的數位內容分析模組321、閱覽行為分析模組322、使用者分群模組323、以及社群關係分析模組324。資料庫311~313分別儲存上述的內容串流、閱覽行為記錄、以及社群行為記錄,以供數位內容分析模組321、閱覽行為分析模組322、以及社群關係分析模組324使用。資料庫122可包括圖3的資料庫331~333,資料庫331~333分別儲存數位內容分析模組321、使用者分群模組323、以及社群關係分析模組324所產生的資料,以供次序調整模組123使用。
資料庫311~313和331~333可以是數位內容匯流器120其中的一部分,也可以獨立於數位內容匯流器120之外。本揭露並不限定使用資料庫,在其他實施例中,資料庫311~313和331~333所儲存的資料可以改用檔案或其他種類的資料結構儲存於硬碟或記憶體等儲存裝置之中。上述儲存裝置可以獨立於圖3的各模組之外,也可以是圖3的一個或多個模組的一部分。
閱覽器130可以是硬體或軟體,例如可連接網路的智慧型手機、平板電腦、筆記型電腦或個人電腦等電子裝置,或以上電子裝置其中的應用程式。數位內容匯流器120也可以是硬體或軟體,例如可連接網路的伺服器或此伺服器其中的軟體。如果數位內容匯流器120是硬體,則圖3所示的次序調整模組123、數位內容分析模組321、閱覽行為分析模組322、使用者分群模組323、以及社群關係分析模組324都可以是硬體模組或軟體模組。如果數位內容匯流器120是軟體,則圖3所示的次序調整模組123、數位內容分析模組321、閱覽行為分析模組322、使用者分群模組323、以及社群關係分析模組324就是其中的軟體模組。
數位內容分析模組321可分析並擷取上述內容串流的數位內容的發表時間、長度、型態與特徵等資訊,並且將這些資訊存入資料庫331,以供次序調整模組123使用。上述的長度是指文章的文字長度或動態影片的時間長度,諸如此類。型態是指純文字、音樂、圖文或影音等媒體型態。至於特徵則視數位內容的型態而定。對於文章而言,其特徵是指文章之中的關鍵字。對於音樂,其特徵可包含(但不限於)旋律、曲調、演唱者或樂器等等。對於靜態圖片,其特徵可以是圖片中的物件或輪廓,例如房屋、車輛、窗戶、輪胎、男人或女人等各種人物、或貓狗等各種動物。對於動態影片,其特徵可包含(但不限於)影片中的物件、動作、影片類別、導演或演員等等。以上各種特徵可用現有的特徵萃取演算法取得,或由上傳者標註(tagging)。
閱覽行為分析模組322根據使用者在閱覽行為記錄中對上述數位內容的點閱行為以及上述數位內容的特徵而產生使用者的偏好模式(preference pattern),這個偏好模式代表使用者個人對於數位內容的偏好。本實施例的使用者偏好模式包括該使用者在閱覽行為記錄中點閱過的數位內容的特徵與上述特徵的分數。分數的計算方式是將使用者的點閱行為分為一個或多個種類,將點閱行為的每個種類對應一個預設的分數。當閱覽行為分析模組322分析某一使用者的閱覽行為記錄時,每當該使用者在閱覽行為記錄中點閱一個數位內容,閱覽行為分析模組322就將該數位內容的特徵加入該使用者的偏好模式,並且將該使用者對該數位內容的點閱行為的種類的分數,累加至該數位內容的特徵在該使用者的偏好模式中的分數。
舉例而言,可將使用者的閱覽行為分為表1所示的四種,並將這四種行為對應表1所示的預設分數。這些閱覽行為都來自使用者的閱覽行為記錄。
一開始,使用者的偏好模式是空白的。若該使用者在閱覽行為記錄中點閱某一篇文章,而此文章的特徵包括{食譜、番茄、肉醬、義大利麵},則閱覽行為分析模組322會將{食譜、番茄、肉醬、義大利麵}這四個特徵加入該使用者的偏好模式,而且將這四個特徵在該使用者的偏好模式中的分數加一。此時該使用者的偏好模式如表2所示。
接下來,若該使用者在閱覽行為記錄中給某一篇文章按「讚」,而此文章的特徵包括{嬰兒、副食品、食譜},則閱覽行為分析模組322會將{嬰兒、副食品、食譜}這三個特徵加入該使用者的偏好模式,然後將這三個特徵在該使用者的偏好模式中的分數加二。此時該使用者的偏好模式如表3所示。
接下來,若該使用者在閱覽行為記錄中分享某一篇文章,而此文章的特徵包括{肉醬、番茄、香腸、燉肉},則閱覽行為分析模組322會將{肉醬、番茄、香腸、燉肉}這四個特徵加入該使用者的偏好模式,然後將這四個特徵在該使用者的偏好模式中的分數加三。此時該使用者的偏好模式如表4所示。
從這個範例可以看出,一個使用者的偏好模式中的特徵,就是這個使用者在閱覽行為記錄中閱覽過的數位內容的特徵的聯集。當閱覽行為分析模組322以上述方式將某一使用者的閱覽行為記錄分析完畢,就可以得到該使用者的偏好模式。
當閱覽行為分析模組322分析過一或多個使用者的閱覽行為記錄之後,使用者分群模組323自閱覽行為分析模組322取得這些使用者的偏好模式,根據一個遞增階層式分群演算法(incremental hierarchical clustering algorithm)和這些使用者的偏好模式建立一個群組樹,將使用者分別加入群組樹之中的群組,同時計算各群組使用者之共同偏好特徵。
圖4A是本實施例的一個群組樹的範例。圖4A的群組樹包括多個節點R、C1
、C2
、D1
~D7
、E1
和E2
。每個節點都是一個群組(cluster),而所謂群組就是偏好相近的使用者所組成的同好團體。群組之中可以包括子群組(child cluster),也就是同好團體之中的進一步劃分,例如群組C1
包括子群組D1
~D4
,群組D3
包括子群組E1
和E2
。因此群組C1
可稱為D1
~D4
的父群組(parent cluster),群組D3
可稱為E1
和E2
的父群組。根群組是群組樹的根節點(root node),例如圖4A的根群組R,根群組包括所有使用者。內群組就是群組樹的內節點(inner node),例如內群組C1
、C2
和D3
。一個內群組所包括的使用者是其子群組的使用者的聯集。葉群組就是群組樹的葉節點(leaf node),例如葉群組D1
~D2
、D4
~D7
和E1
~E2
。使用者的實際歸屬關係是在葉群組。
圖5A至圖5D繪示本實施例的使用者分群模組323所執行的遞增階層式分群演算法,但本揭露不以此為限,根據其他的遞增階層式分群演算法也能達到建構群組樹並且將使用者分群的目的。
上述的遞增階層式分群演算法其中的遞增(incremental)是指不需要在每次分析閱覽行為記錄之後重建群組樹,而是只需要在第一次分析時建立群組樹,接下來的每一次分析過後只需要對每一個使用者執行圖5A的流程。圖5A的流程會逐一檢查每一個使用者的狀況,若該使用者已存在於群組樹中,則檢查是否要改變該使用者所屬的群組,若該使用者尚未加入群組樹,則根據該使用者的偏好模式將該使用者加入群組樹的一個葉群組。
在說明圖5A的流程之前,必須先說明使用者分群模組323如何計算相似度(similarity)。在本實施例中,使用者分群模組323可計算三種相似度,分別是兩個使用者之間的相似度、一個使用者和一個群組之間的相似度、以及兩個群組之間的相似度。
兩個使用者之間的相似度可根據兩個使用者的偏好模式而計算產生。目前已經有多種方法可用來計算兩個使用者的相似度或距離,例如歐氏距離(Euclidean distance)、馬氏距離(Mahalanobis distance)、漢默距離(Hamming distance)、皮爾森相關度(Pearson correlation coefficient)、史匹爾曼階級相關係數(Spearman's rank correlation coefficient)、以及餘弦相似度(cosine similarity)。若計算出來的是距離,取其倒數就是相似度。以下說明的計算方法是根據漢默距離,但本揭露不以此為限,在其他實施例中可改用其他計算方法。
假設要計算使用者A和B的相似度。首先將使用者A和B的偏好模式其中的特徵依照至少一個預設的臨界值區分為多個集合。例如依照臨界值t1
,t2
,t3
,...,ti
將使用者A的偏好模式的特徵分為i+1個集合sA1
,sA2
,sA3
,...,sA(i+1)
,其中i為正整數,sA1
是使用者A的偏好模式的特徵其中分數小於t1
者所組成的集合,sA2
是使用者A的偏好模式的特徵其中分數大於或等於t1
而且小於t2
者所組成的集合,sA3
是使用者A的偏好模式的特徵其中分數大於或等於t2
而且小於t3
者所組成的集合,依此類推,sA
(i+1
)是使用者A的偏好模式的特徵其中分數大於或等於ti
者所組成的集合。同理,可依照臨界值t1
,t2
,t3
,...,ti
將使用者B的偏好模式的特徵分為i+1個集合sB1
,sB2
,sB3
,...,sB(i+1)
。
使用者A和B的相似度可用下列公式計算
其中wj
是sAj
和sBj
所對應的權重,權重wj
都是預設值,Simj
是sAj
和sBj
的相似度。若sAj
和sBj
這兩個集合的特徵數量總和不為零,則Simj
可用下列公式計算
其中count()是括號其中的集合的特徵數量。若sAj
和sBj
這兩個集合的特徵數量總和為零,則Simj
等於1。
在本揭露的其他實施例中,上述的相似度公式可以做一點變化,如下
公式(3)比公式(1)多出w0
和Sim0
,其中w0
是特徵集合sA0
和sB0
所對應的預設權重,Sim0
是特徵集合sA0
和sB0
的相似度,sA0
是使用者A的偏好模式的所有特徵的集合,sB0
是使用者B的偏好模式的所有特徵的集合。Sim0
的計算方式和其餘的Simj
相同。
一個使用者和一個群組的相似度是根據該使用者的偏好模式和該群組其中至少一個使用者的偏好模式而產生,例如可根據該群組的使用者的偏好模式產生該群組本身的偏好模式,這個群組本身的偏好模式就是該群組使用者之共同偏好特徵,然後利用該使用者的偏好模式和該群組的偏好模式來計算該使用者和該群組的相似度。
舉例而言,若用上述方式將某群組C其中每一個使用者U的偏好模式的特徵依照預設的臨界值t1
,t2
,t3
,...,ti
區分為i+1個集合sU1
,sU2
,sU3
,...,sU(i+1)
,則群組C的偏好模式可由集合sC1
,sC2
,sC3
,...,sC(i+1)
組成。若有一個特徵存在於群組C的超過一個預設比例的使用者的sU1
之中,則將此特徵加入群組C的集合sC1
,若有一個特徵存在於群組C的超過上述預設比例的使用者的sU2
之中,則將此特徵加入群組C的集合sC2
,依此類推。以此方式過濾群組C的所有使用者的所有特徵,就可得到群組C的偏好模式。
由於群組的偏好模式的格式和使用者相同,所以可使用上述的公式(1)或(3)計算一個使用者和一個群組之間的相似度。
本揭露的使用者和群組之間的相似度並不限於上述的計算法,在其他實施例中可以改用其他方式來計算使用者和群組之間的相似度。以計算使用者A和群組C的相似度為例,可在群組C選取一個使用者B做為群組C的代表使用者,然後計算使用者A、B之間的相似度,做為使用者A和群組C的相似度。群組C的代表使用者B有多種選取方式,例如可選取最先加入群組C的使用者,或選取群組C其中偏好模式和群組C本身的偏好模式最相似的使用者,或在群組C當中用亂數選取一個使用者,作為代表使用者B。
至於兩個群組之間的相似度,有兩種計算方式。第一種方式是計算兩個群組本身的偏好模式的相似度,做為兩個群組之間的相似度。第二種方式是計算兩個群組的代表使用者的相似度,做為兩個群組之間的相似度。
以下說明圖5A的流程,使用者分群模組323可以在閱覽行為分析模組322分析過一或多個使用者的閱覽行為記錄並得到這些使用者的偏好模式之後,對每一個上述使用者執行圖5A的流程。
首先,在步驟502檢查使用者是否已存在於群組樹中。如果已經存在,則在步驟504檢查該使用者和該使用者原先所屬的群組的相似度是否大於預設的層級臨界值TL
。層級臨界值TL
的下標字L表示群組樹的層級,根群組R的層級等於0,根群組R的子群組的層級等於1,再向下的群組的層級就逐級遞增。在步驟504,L等於該使用者所屬群組的層級。層級臨界值TL
是層級L的遞增函數,例如,TL
可以是等差級數、等比級數、以指數式成長的級數,或以上級數的變化或組合。
如果該使用者和原先所屬群組的相似度大於預設的臨界值,則該使用者可以繼續留在原先所屬的群組中,因為使用者的偏好模式可能有變化,所以必須在步驟506更新該使用者原先所屬群組的偏好模式。
另一方面,如果該使用者和原先所屬群組的相似度不大於預設的臨界值,則在步驟508自該使用者原先所屬的群組移除該使用者,在步驟510更新該使用者原先所屬群組的偏好模式,並且在步驟512執行圖5B的流程以在群組樹中尋找該使用者所屬的群組。
回到步驟502,如果該使用者尚不存在於群組樹中,則直接在步驟512執行圖5B的流程以在群組樹中尋找該使用者所屬的群組。
圖5B繪示步驟512的詳細流程,此流程使用一個臨時變數C*表示使用者目前可能加入的群組。首先,在步驟522將C*設定為群組樹的根群組R。在步驟524檢查群組樹是否僅有根群組R,如果是,表示此群組樹是在初始狀態,還沒有任何使用者加入群組樹。所以流程進入步驟526,在群組C*之下新增一個子群組C',在步驟528將C*設定為C',然後進入步驟542。
在步驟524的檢查中,如果群組樹除了根群組R以外還包括其他群組,則進入步驟530,檢查C*是否有任何子群組。如果沒有,則流程進入步驟542。如果有,則在步驟532計算該使用者和C*的每一個子群組Cj
的相似度,然後在步驟534檢查下列不等式是否成立。
其中max表示最大值,Pi
是該使用者,Sim(Pi
,Cj
)就是該使用者Pi
和子群組Cj
的相似度,TL+1
是上述的層級臨界值,L等於群組C*所在的層級。不等式(4)的意思是該使用者和每一個子群組Cj
的相似度其中最高的相似度是否小於層級臨界值TL+1
。如果不等式(4)不成立,則在步驟536將C*設定為子群組Cj
之中和該使用者的相似度最高者,然後返回步驟530。反之如果不等式(4)成立,則進入步驟538,在群組C*之下新增子群組C',在步驟540將C*設定為C',然後進入步驟542。
在步驟542,將該使用者加入群組C*,並更新群組C*的偏好模式,C*成為該使用者所屬的群組。然後在步驟544設定群組C*的代表使用者。如前所述,代表使用者有多種選取方法,例如可選取最先加入群組C*的使用者,或選取群組C*其中偏好模式和群組C*本身的偏好模式最相似的使用者,或在群組C*當中用亂數選取一個使用者,作為C*的代表使用者。若以最先加入的使用者做為C*的代表使用者,則後面有新使用者加入時,代表使用者就不需要重新設定。
接下來,在步驟546檢查C*的父群組是否符合凝聚條件,也就是檢查C*的父群組的子群組數量是否大於預設的凝聚臨界值TB
。如果是,則在步驟548對C*的父群組執行如圖5C所示的凝聚(agglomerate)程序,否則流程直接進入步驟550。接下來,在步驟550檢查群組C*是否符合分裂條件,也就是檢查群組C*的使用者數量是否大於預設的分裂臨界值TF
,如果是,則對C*執行如圖5D所示的分裂(split)程序,將群組C*一分為二。
總而言之,圖5B的流程是自群組樹的根群組開始,比較該使用者和群組樹的群組的相似度,根據上述比較決定一條路徑,逐層向下,最後到達一個葉群組或新增一個葉群組,並且以最後到達的葉群組或新增的葉群組作為該使用者所屬的群組。至於上述的凝聚程序和分裂程序,則是對群組樹本身的調整,細節如下。
圖5C繪示上述的凝聚程序的流程,請參照圖4B,凝聚程序是針對包含過多子群組的群組。舉例來說,如果群組C有太多子群組,則可在群組C之下新增子群組C1
和C2
,將群組C原有的子群組分別依附在C1
和C2
之下。
以下說明凝聚程序的流程。首先在步驟562接收輸入群組C。若凝聚程序是在圖5B的步驟548執行,則群組C就是步驟548的群組C*的父群組。若凝聚程序是在圖5D的步驟596執行,則群組C就是步驟596的群組Cp。
然後在步驟564,移除群組C的所有子群組,將這些子群組加入一個臨時串列t。在步驟566,在群組C之下新增兩個子群組C1
和C2
。在步驟568,以任意方式從臨時串列t的所有子群組的代表使用者之中選取一個代表使用者A,例如可用亂數選取代表使用者A。然後在步驟570,將使用者A設定為群組C1
的代表使用者,將使用者A在臨時串列t當中所屬的子群組CA
自t移除並加入群組C1
,也就是使群組CA
成為C1
的子群組之一。
接下來,在步驟572,從臨時串列t的所有子群組的代表使用者之中選取和代表使用者A的相似度最低的代表使用者B。然後在步驟574,將使用者B設定為群組C2
的代表使用者,將使用者B在臨時串列t當中所屬的子群組CB
自t移除並加入群組C2
,也就是使群組CB
成為C2
的子群組之一。
接下來,在步驟576,對於臨時串列t當中剩餘的每一群組C*,比較群組C*和群組CA
之間的相似度以及群組C*和群組CB
之間的相似度。若群組C*和群組CA
之間的相似度較高,則將群組C*加入群組C1
,也就是使群組C*成為C1
的子群組之一。若群組C*和群組CB
之間的相似度較高,則將群組C*加入群組C2
,也就是使群組C*成為C2
的子群組之一。然後在步驟578更新兩群組C1
和C2
的偏好模式。
圖5D繪示上述的分裂程序的流程,請參照圖4C,分裂程序是針對包含過多使用者的群組。舉例來說,如果群組C有太多使用者,則可將群組C分裂為群組C1
和C2
。
以下說明分裂程序的流程。首先在步驟582接收輸入群組C。若分裂程序是在圖5B的步驟552執行,則群組C就是步驟552的群組C*。
然後,在步驟584將群組C自其父群組Cp之下移除。在步驟586,在群組Cp之下新增子群組C1
和C2
。在步驟588,以任意方式自群組C選取一個使用者A,將使用者A加入群組C1
,作為C1
的代表使用者。自群組C選取使用者A的方式不限,例如可選取第一個加入群組C的使用者,或用亂數自群組C選取一個使用者。然後在步驟590,在群組C當中找出和使用者A的相似度最低的使用者B,將使用者B加入C2
作為C2
的代表使用者。
接下來,在步驟592,對群組C的每一其餘使用者X,比較使用者X和使用者A的相似度以及使用者X和使用者B的相似度。若使用者X和使用者A的相似度較高,則將使用者X加入群組C1
,反之則將使用者X加入群組C2
。然後更新群組C1
和C2
的偏好模式。
接下來,在步驟594檢查群組C的父群組Cp是否符合凝聚條件,也就是檢查Cp的子群組數量是否大於預設的凝聚臨界值TB
。如果是,則在步驟596對群組Cp執行如圖5C所示的凝聚程序。
一個群組的偏好模式可包括在該群組的使用者的偏好模式中分布比例大於或等於一個預設臨界值的特徵,以及這些特徵的分布比例。例如,若有一個特徵出現在該群組的83%的使用者的偏好模式中,則此特徵的分佈比例就是0.83。使用者分群模組323將每一個使用者的偏好模式、上述的群組樹、以及每一個群組的偏好模式存放在資料庫332,以供次序調整模組123使用。
上述的遞增階層式分群演算法所建構完成的群組樹可持續使用,當某一個使用者的閱覽行為記錄改變時,使用者分群模組323可檢查該使用者和所屬群組的相似度是否仍然大於或等於預設的層級臨界值TL
。如果該使用者和所屬群組的相似度已經低於層級臨界值TL
,則使用者分群模組323將該使用者自該群組刪除,更新該群組的偏好模式,並且將該使用者重新加入群組樹。若該使用者和所屬群組的相似度仍大於或等於層級臨界值TL
,則只要更新所屬群組之偏好模式即可。這樣可降低重新建構群組樹的頻率以提高效率。
社群關係分析模組324可在社群行為記錄中分析並擷取使用者在社群網站的一個或多個朋友和該使用者的互動行為。從這些互動行為可得知該使用者的好友的偏好。
更具體的說,社群關係分析模組324可分析某一使用者的社群行為記錄,並記錄特定的數位內容是否為該使用者的朋友發表、是否受該使用者的朋友推薦、以及是否受該使用者的朋友回應、轉載或引用,但不限這些社群行為。社群關係分析模組324也可以根據社群行為記錄,分析並記錄該使用者對朋友過去發表的數位內容的互動行為,例如按「讚」、留言或分享,計算使用者與朋友間的社群關係分數,進而影響數位內容的推薦程度。社群關係分析模組324將上述的分析結果存入資料庫333,以供次序調整模組123使用。
次序調整模組123根據資料庫331~333所儲存的分析結果,執行圖6的方法流程,將來自一個或多個內容來源的一個或多個內容串流組成一個匯流串流,並調整其中的數位內容的次序。圖7可說是圖6的方法流程的示意圖,也可說是圖6的方法流程的一個範例。圖7繪示三個內容串流701~703,內容串流701~703上方有多個黑點表示內容串流701~703的數位內容本身與其發表時間,例如黑點751即代表內容串流701的一個數位內容本身,以及此數位內容的發表時間。每個黑點右邊有一條橫線表示數位內容的有效期間,例如橫線752表示數位內容751的有效期間。時間軸770表示從過去到現在的時間,越向右邊表示越接近現在時間。
以下說明圖6流程。首先,次序調整模組123在步驟620將每一個內容串流701~703切分為多個區段,例如內容串流701~703的第一個區段分別是711~713。圖7之中,ΔT
是每一個內容串流的時間長度,而Δt
是每一個區段的時間長度。每個內容串流701~703是由多個區段組成,次序調整模組123輸出的匯流串流740同樣是由多個區段組成。對於正整數i,匯流串流740的第i個區段和每一個內容串流701~703的第i個區段皆有相同的起始時間和結束時間。
每個區段可包括一個或多個數位內容,例如內容串流701的第一個區段711包括數位內容761和762。在本實施例中,有兩種方式可決定數位內容所歸屬的區段。第一種方式是每一個區段包括該區段所屬的內容串流其中,有效期間起始於該區段的數位內容,上述有效期間的起始時間就是數位內容的發表時間。例如內容串流701的第三個區段包括數位內容751。第二種方式是每一個區段包括該區段所屬的內容串流其中,有效期間結束於該區段的數位內容,例如內容串流701的第一個區段包括數位內容751。有效期間可根據內容來源的更新頻率或數位內容的長度來設定。對於更新頻率較低的內容來源或較長的數位內容,可設定較長的有效期間,讓使用者有較長的時間可閱覽。
接下來,次序調整模組123在步驟640對每一個上述區段,根據使用者關於該區段的數位內容的偏好因素,決定該區段的數位內容的次序。為了決定上述次序,次序調整模組123為每一個數位內容計算一個對應的總體偏好分數(total preference score),並且將每一個區段內的數位內容分別根據總體偏好分數排序,總體偏好分數越高的數位內容次序越前面。總體偏好分數的計算公式如下:
TPS=Ω×(WΩ
+WL
PL
+WT
PT
+WR
PR
)...........(5)
WΩ
+WL
+WT
+WR
=1........................................(6)
其中TPS就是總體偏好分數。Ω是使用者對於數位內容的特徵偏好分數,可表示使用者與其同好群組偏愛具有哪些特徵的數位內容。PL
是使用者對於數位內容的長度偏好分數,表示使用者偏愛哪一種長度的數位內容,例如短句、短文章或長文章。PT
是使用者對於數位內容的型態偏好分數,表示使用者偏愛哪一種媒體型態的數位內容,例如純文字、音樂、圖文或影音。PR
是使用者對於數位內容的社群關係分數,表示使用者和社群網站上的朋友的互動是否緊密,以及是否偏好同樣的數位內容。WΩ
、WL
、WT
以及WR
是預設的權重。
本實施例的總體偏好分數TPS是使用Ω、PL
、PT
以及PR
這四項分數來計算,但本揭露並不以此為限,在其他實施例中可以簡化公式(5)和(6),只用Ω、PL
、PT
以及PR
這四項分數其中的一至三項來計算總體偏好分數TPS。以下說明次序調整模組123如何計算這四項分數。
特徵偏好分數Ω可以等於Ω1
、Ω2
或Ω1
+Ω2
。Ω1
和Ω2
的計算公式如下。
公式(7)其中,Q1
是此數位內容的特徵和閱覽此數位內容的使用者的偏好模式的特徵的交集,xi
是Q1
其中的特徵,xi
.pt是特徵xi
在該使用者的偏好模式之中的分數。c是預設常數,例如0、1、或其他數值。
公式(8)其中,Q2
是此數位內容的特徵和閱覽此數位內容的使用者所屬的群組的偏好模式的特徵的交集,xj
是Q2
其中的特徵,xj
.sup是特徵xj
在該群組的偏好模式之中的分布比例。
為了計算長度偏好分數PL
和型態偏好分數PT
,可將數位內容分為多個長度種類,例如短、中、長,並且將數位內容分為多個型態種類,例如短訊息、純文字、圖文、音樂、影音。長度偏好分數PL
可以是此數位內容所屬的長度種類在閱覽此數位內容的使用者的閱覽行為記錄其中的所有數位內容之中所佔的比例。型態偏好分數PT
可以是此數位內容所屬的型態種類在閱覽此數位內容的使用者的閱覽行為記錄其中的所有數位內容之中所佔的比例。
社群關係分數PR
可根據此數位內容是否受使用者的朋友推薦以及該使用者對朋友過去發表的數位內容的互動行為的種類而產生。本實施例的社群關係分數PR
的計算公式如下。
其中F是該使用者在社群網站的朋友的集合。變數Ii
是根據該使用者與其朋友i關於此數位內容的互動而產生,細節後述。RSCi
是該使用者的朋友i對該使用者的相對社群緊密度(relative social closeness),計算方式如下。
首先,可將該使用者對朋友過去發表的數位內容的互動行為分為幾個種類,分別為每一個互動行為種類設定一個分數,例如表5所示。
以該使用者的朋友B為例,將該使用者的社群行為記錄中,該使用者在社群網站上對朋友B過去發表的數位內容的每一個互動行為所對應的分數全部累加,可得到朋友B對該使用者的社群緊密度SCB
。其他朋友對該使用者的社群緊密度可用同樣方式計算。然後可用下列公式計算朋友B對該使用者的相對社群緊密度RSCB
。
其中F是該使用者的朋友的集合,SCi
是朋友i對該使用者的社群緊密度。
本實施例中,有兩種方式可計算公式(9)的變數Ii
。第一種方式使用在數位內容來自非社群網站,例如新聞網站或電子雜誌時。第一種方式是根據此數位內容是否受該使用者的朋友i推薦。而所謂推薦是指朋友i在閱覽器130上閱覽此數位內容時,針對此數位內容按「讚」,或類似的動作。例如,若此數位內容受朋友i推薦,則Ii
等於1,否則Ii
等於0。
第二種方式是根據此數位內容是否為朋友i在社群網站上發表或分享,以及此數位內容是否在社群網站上受朋友i回應。例如,若此數位內容為朋友i發表或分享或受到朋友i的任何回應,則Ii
等於1。若此數位內容不為朋友i發表或分享,而且沒受到朋友i的任何回應,則Ii
等於0。此外,如果此數位內容是由朋友i發表或分享,則可將朋友i對該使用者的社群緊密度SCi
乘上一個預設倍數,例如兩倍。
次序調整模組123可根據公式(9)計算社群關係分數PR
。或者,社群關係分析模組324可負責公式(9)的部份或全部計算,然後將計算成果存放在資料庫333,以供次序調整模組123取用。
接下來,次序調整模組123在步驟660用內容串流701~703的區段組成匯流串流740。匯流串流740包括多個區段,而且對於任一正整數i,匯流串流740的第i個區段是由內容串流701~703的第i個區段所組成。如圖7所繪示的範例,內容串流701~703的第一個區段711~713經過步驟640的計算總體偏好分數和排序後,分別成為區段721~723,然後次序調整模組123將區段721~723組成匯流串流740的第一個區段731。匯流串流740的其他區段依此類推。
次序調整模組123可根據閱覽行為記錄中,使用者對於每一個內容串流的數位內容的點閱次數,決定來自不同內容串流的數位內容在匯流串流中的次序。舉例來說,假設在某一個使用者的閱覽行為記錄中,該使用者對於內容串流701~703的數位內容的點閱次數分別是C1
、C2
、C3
,則可計算內容串流701~703的點閱機率P1
、P2
、P3
如下。
P1
=C1
/(C1
+C2
+C3
)..........................................(11)
P2
=C2
/(C1
+C2
+C3
)..........................................(12)
P3
=C3
/(C1
+C2
+C3
)..........................................(13)
然後用下列公式計算另一組機率P1
’、P2
’和P3
’
Pk
’=μ/n+(1-μ)×Pk
...............................................(14)
其中n是內容串流數量,對於圖7的內容串流701~703來說,n等於3。k是1至n的整數。依據公式(14),機率Pk
’是平均機率1/n和點閱機率Pk
的加權平均,這兩個機率的權值由變異因子μ決定。變異因子μ可以是0至1的任意實數,例如0.2。變異因子μ可防止使用者只看某幾種內容來源就難以接收到其他內容來源的推薦,導致沒看過的內容來源就永遠排在最後而難以改變。
對於匯流串流740的第i個區段(i為正整數),次序調整模組123可用亂數選擇內容串流701~703其中之一,上述亂數選擇內容串流701~703的機率分別是P1
’、P2
’、P3
’。然後將內容串流701~703的每個區段視為佇列(queue),取出被選中的內容串流的第i個區段的第一個數位內容,也就是總體偏好分數最高的數位內容,使該數位內容成為匯流串流740的第i個區段的第一個數位內容。然後用同一亂數選擇內容串流701~703其中之一,取出被選中的內容串流的第i個區段的第一個數位內容,使該數位內容成為匯流串流740的第i個區段的第二個數位內容,依此類推,直到內容串流701~703的第i個區段都成為空佇列。這樣可將內容串流701~703的第i個區段的數位內容全部併入匯流串流740的第i個區段。
次序調整模組123用以上方式產生匯流串流740的每一個區段,然後輸出匯流串流740供閱覽器130顯示。閱覽器130依照數位內容在匯流串流740中的次序顯示上述數位內容。雖然圖7繪示三個內容串流701~703,但本揭露並不限於此,在其他實施例中,數位內容匯流器120可對任意數量的一個或多個內容串流進行排序與組合。
以上實施例提出一種可感知使用者偏好的數位內容次序調整方法和數位內容匯流器,以使用者的個人偏好為主,同好群組的熱門偏好為輔,並納入社群關係,可在維持數位內容新鮮度的前提下調整數位內容的呈現次序。串流式數位內容的特點在於內容隨時間不斷產生,議題不斷變化,長度、型態、發文者各不相同。以上實施例所提供的數位內容次序調整方法和數位內容匯流器可整合不同來源的資訊,讓使用者在每次閱覽時,只需翻閱前幾頁即可閱覽大部分近期有趣的主題,可讓使用者在輕鬆的閱讀狀態下取得最新最有興趣的資訊。
雖然本揭露已以實施例揭露如上,然其並非用以限定本揭露,任何所屬技術領域中具有通常知識者,在不脫離本揭露之精神和範圍內,當可作些許之更動與潤飾,故本揭露之保護範圍當視後附之申請專利範圍所界定者為準。
111~113...內容來源
120...數位內容匯流器
121...偏好分析模組
122...資料庫
123...次序調整模組
130...閱覽器
141~143...社群網站
220...流程步驟
311~313...資料庫
321...數位內容分析模組
322...閱覽行為分析模組
323...使用者分群模組
324...社群關係分析模組
331~333...資料庫
502~596、620~660...流程步驟
701~703...內容串流
711~713、721~723...內容串流的區段
731...匯流串流的區段
740...匯流串流
751...數位內容的發表時間
752...數位內容的有效期間
761、762...數位內容
770...時間軸
C、C1
~C2
、Cp、D1
~D7
、E1
~E2
、R...使用者群組
圖1是依照本揭露一實施例的一種數位內容匯流器的示意圖。
圖2是依照本揭露一實施例的一種數位內容次序調整方法的流程圖。
圖3是依照本揭露一實施例的一種數位內容匯流器的示意圖。
圖4A至圖4C是依照本揭露一實施例的群組樹的示意圖。
圖5A至圖6是依照本揭露一實施例的一種數位內容次序調整方法的流程圖。
圖7是依照本揭露一實施例的一種數位內容次序調整方法的示意圖。
111~113...內容來源
120...數位內容匯流器
121...偏好分析模組
122...資料庫
123...次序調整模組
130...閱覽器
141~143...社群網站
Claims (20)
- 一種數位內容次序調整方法,包括:將至少一內容串流組合成一匯流串流,並根據上述至少一內容串流的數位內容的時間因素,以及一使用者關於上述數位內容的偏好因素,決定上述數位內容在該匯流串流中的次序。
- 如申請專利範圍第1項所述之數位內容次序調整方法,其中該時間因素至少包括上述數位內容的發表時間和有效期間其中之一,而且該數位內容次序調整方法更包括:將每一上述內容串流切分為多個區段,每一上述區段包括該區段所屬的該內容串流中有效期間起始於該區段或結束於該區段的數位內容;對上述至少一區段,根據該使用者關於該區段的數位內容的偏好因素,決定該區段的數位內容的次序;以及用上述至少一內容串流的上述多個區段組成該匯流串流,其中該匯流串流包括多個區段,而且該匯流串流的第i個區段是由每一上述內容串流的第i個區段所組成,i為正整數。
- 如申請專利範圍第2項所述之數位內容次序調整方法,其中該匯流串流的第i個區段和每一上述內容串流的第i個區段皆有相同的起始時間和結束時間,而且來自不同內容串流的數位內容在該匯流串流的次序是根據該使用者對於每一上述內容串流的數位內容的點閱次數而決定。
- 如申請專利範圍第2項所述之數位內容次序調整方法,其中該偏好因素至少包括該使用者關於上述數位內容的偏好和社群關係其中之一,而且決定上述至少一區段的數位內容的次序的步驟包括:計算該區段的一第一數位內容的一總體偏好分數;以及根據該總體偏好分數決定該第一數位內容在該區段的次序,其中該總體偏好分數是至少根據該使用者對於該第一數位內容的一特徵偏好分數、一長度偏好分數、一型態偏好分數、以及一社群關係分數其中之一而產生;該特徵偏好分數是根據該第一數位內容的特徵和該使用者的偏好模式而產生,該使用者的偏好模式是根據該使用者對上述至少一內容串流的數位內容的點閱行為以及上述至少一內容串流的數位內容的特徵而產生;上述至少一內容串流的數位內容分屬多個長度種類和多個型態種類,該長度偏好分數是根據該第一數位內容所屬的長度種類在所有上述數位內容中所佔比例而產生,該型態偏好分數是根據該第一數位內容所屬的型態種類在所有上述數位內容中所佔比例而產生;該社群關係分數是根據該使用者在一社群網站的至少一朋友和該使用者的關於該第一數位內容的互動行為而產生。
- 如申請專利範圍第4項所述之數位內容次序調整方法,其中該使用者的偏好模式包括該使用者點閱過的數位內容的特徵與上述特徵的分數,該使用者的上述點閱行為分為至少一種類,上述點閱行為的每一種類對應一分數,該數位內容次序調整方法更包括:當該使用者點閱一第二數位內容,則將該第二數位內容的至少一特徵加入該使用者的偏好模式,並且將該使用者對該第二數位內容的點閱行為的種類的分數,累加至上述至少一特徵在該使用者的偏好模式中的分數。
- 如申請專利範圍第5項所述之數位內容次序調整方法,更包括:根據一遞增階層式分群演算法,決定該使用者在一群組樹之中所屬的一第一群組;以及更新該第一群組的偏好模式,其中該第一群組的偏好模式包括在該第一群組的使用者的偏好模式中分布比例大於或等於一第一臨界值的特徵,以及上述特徵的分布比例。
- 如申請專利範圍第6項所述之數位內容次序調整方法,其中該特徵偏好分數等於一第一數值、一第二數值、或該第一數值加上該第二數值,該第一數值是根據該第一數位內容的特徵與該使用者的偏好模式中的特徵的交集其中至少一特徵的分數而產生,該第二數值是根據該第一數位內容的特徵與該第一群組的偏好模式中的特徵的交集其中至少一特徵的分布比例而產生。
- 如申請專利範圍第6項所述之數位內容次序調整方法,其中根據該遞增階層式分群演算法決定該第一群組的步驟包括:若該使用者已存在於該群組樹中,而且該使用者和該使用者原先所屬的一第二群組的相似度大於一第二臨界值,則該第一群組即為該第二群組;若該使用者已存在於該群組樹中,而且該使用者和該第二群組的相似度小於或等於該第二臨界值,則自該第二群組移除該使用者,更新該第二群組的偏好模式,並在該群組樹中尋找該第一群組;以及若該使用者不存在於該群組樹中,則在該群組樹中尋找該第一群組,其中,在該群組樹中尋找該第一群組的步驟包括:在該群組樹中,自該群組樹的根群組開始,比較該使用者和該群組樹的群組的相似度,根據上述比較決定一路徑,逐層向下,到達一第一葉群組或新增一第二葉群組,該第一群組即為該第一葉群組或該第二葉群組,其中該使用者和該群組樹中任一群組的相似度是根據該使用者的偏好模式和該任一群組其中至少一使用者的偏好模式而產生。
- 如申請專利範圍第4項所述之數位內容次序調整方法,其中該社群關係分數是根據該第一數位內容是否受上述朋友推薦以及該使用者對上述朋友過去發表的數位內容的互動行為的種類而產生。
- 如申請專利範圍第4項所述之數位內容次序調整方法,其中該社群關係分數是根據該第一數位內容是否為上述朋友發表或分享、該第一數位內容是否受上述朋友回應、以及該使用者對上述朋友過去發表的數位內容的互動行為的種類而產生。
- 一種數位內容匯流器,包括:一偏好分析模組,根據一閱覽行為記錄且/或一社群行為記錄,分析一使用者關於至少一內容串流的數位內容的偏好因素;以及一次序調整模組,將上述至少一內容串流組合成一匯流串流,並根據上述數位內容的時間因素,以及該偏好因素,決定上述數位內容在該匯流串流中的次序。
- 如申請專利範圍第11項所述之數位內容匯流器,其中該時間因素至少包括上述數位內容的發表時間和有效期間其中之一,該次序調整模組將每一上述內容串流切分為多個區段,每一上述區段包括該區段所屬的該內容串流中有效期間起始於該區段或結束於該區段的數位內容;該次序調整模組對上述至少一區段,根據該使用者關於該區段的數位內容的偏好因素,決定該區段的數位內容的次序;該次序調整模組用上述至少一內容串流的上述多個區段組成該匯流串流,該匯流串流包括多個區段,而且該匯流串流的第i個區段是由每一上述內容串流的第i個區段所組成,i為正整數。
- 如申請專利範圍第12項所述之數位內容匯流器,其中該匯流串流的第i個區段和每一上述內容串流的第i個區段皆有相同的起始時間和結束時間,而且該次序調整模組根據該閱覽行為記錄中,該使用者對於每一上述內容串流的數位內容的點閱次數,決定來自不同內容串流的數位內容在該匯流串流的次序。
- 如申請專利範圍第12項所述之數位內容匯流器,其中該偏好因素至少包括該使用者關於上述數位內容的偏好和社群關係其中之一,而且該偏好分析模組包括:一數位內容分析模組,分析並擷取上述至少一內容串流的數位內容的發表時間、長度、型態與特徵;一閱覽行為分析模組,根據該使用者在該閱覽行為記錄中對上述至少一內容串流的數位內容的點閱行為以及上述至少一內容串流的數位內容的特徵而產生該使用者的偏好模式;一社群關係分析模組,在該社群行為記錄中分析並擷取該使用者在一社群網站的至少一朋友和該使用者的互動行為,其中該次序調整模組計算該區段的一第一數位內容的一總體偏好分數,並根據該總體偏好分數決定該第一數位內容在該區段的次序,該總體偏好分數是至少根據該使用者對於該第一數位內容的一特徵偏好分數、一長度偏好分數、一型態偏好分數、以及一社群關係分數其中之一而產生;該次序調整模組根據該第一數位內容的特徵和該使用者的偏好模式而產生該特徵偏好分數;上述至少一內容串流的數位內容分屬多個長度種類和多個型態種類,該次序調整模組根據該第一數位內容所屬的長度種類在所有上述數位內容中所佔比例而產生該長度偏好分數,並根據該第一數位內容所屬的型態種類在所有上述數位內容中所佔比例而產生該型態偏好分數;該次序調整模組根據該使用者的上述互動行為而產生該社群關係分數。
- 如申請專利範圍第14項所述之數位內容匯流器,其中該使用者的偏好模式包括該使用者在該閱覽行為記錄中點閱過的數位內容的特徵與上述特徵的分數,該使用者的上述點閱行為分為至少一種類,上述點閱行為的每一種類對應一分數;當該使用者在該閱覽行為記錄中點閱一第二數位內容,則該閱覽行為分析模組將該第二數位內容的至少一特徵加入該使用者的偏好模式,並且將該使用者對該第二數位內容的點閱行為的種類的分數,累加至上述至少一特徵在該使用者的偏好模式中的分數。
- 如申請專利範圍第15項所述之數位內容匯流器,其中該偏好分析模組更包括:一使用者分群模組,根據一遞增階層式分群演算法,決定該使用者在一群組樹之中所屬的一第一群組,並更新該第一群組的偏好模式,其中該第一群組的偏好模式包括在該第一群組的使用者的偏好模式中分布比例大於或等於一第一臨界值的特徵,以及上述特徵的分布比例。
- 如申請專利範圍第16項所述之數位內容匯流器,其中該特徵偏好分數等於一第一數值、一第二數值、或該第一數值加上該第二數值,該第一數值是根據該第一數位內容的特徵與該使用者的偏好模式中的特徵的交集其中至少一特徵的分數而產生,該第二數值是根據該第一數位內容的特徵與該第一群組的偏好模式中的特徵的交集其中至少一特徵的分布比例而產生。
- 如申請專利範圍第16項所述之數位內容匯流器,其中若該使用者已存在於該群組樹中,而且該使用者和該使用者原先所屬的一第二群組的相似度大於一第二臨界值,則該第一群組即為該第二群組;若該使用者已存在於該群組樹中,而且該使用者和該第二群組的相似度小於或等於該第二臨界值,則該使用者分群模組自該第二群組移除該使用者,更新該第二群組的偏好模式,並在該群組樹中尋找該第一群組;若該使用者不存在於該群組樹中,則該使用者分群模組在該群組樹中尋找該第一群組;其中,為了在該群組樹中尋找該第一群組,該使用者分群模組在該群組樹中,自該群組樹的根群組開始,比較該使用者和該群組樹的群組的相似度,根據上述比較決定一路徑,逐層向下,到達一第一葉群組或新增一第二葉群組,該第一群組即為該第一葉群組或該第二葉群組,其中該使用者和該群組樹中任一群組的相似度是根據該使用者的偏好模式和該任一群組其中至少一使用者的偏好模式而產生。
- 如申請專利範圍第14項所述之數位內容匯流器,其中該社群關係分析模組根據該社群行為記錄分析並記錄該第一數位內容是否受上述朋友推薦以及該使用者對上述朋友過去發表的數位內容的互動行為;該社群關係分數是根據該第一數位內容是否受上述朋友推薦以及該使用者對上述朋友過去發表的數位內容的互動行為的種類而產生。
- 如申請專利範圍第14項所述之數位內容匯流器,其中該社群關係分析模組根據該社群行為記錄分析並記錄該第一數位內容是否為上述朋友發表、該第一數位內容是否受上述朋友回應、以及該使用者對上述朋友過去發表的數位內容的互動行為;該社群關係分數是根據該第一數位內容是否為上述朋友發表或分享、該第一數位內容是否受上述朋友回應、以及該使用者對上述朋友過去發表的數位內容的互動行為的種類而產生。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW101111679A TWI475412B (zh) | 2012-04-02 | 2012-04-02 | 數位內容次序調整方法和數位內容匯流器 |
US13/488,460 US20130262966A1 (en) | 2012-04-02 | 2012-06-05 | Digital content reordering method and digital content aggregator |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW101111679A TWI475412B (zh) | 2012-04-02 | 2012-04-02 | 數位內容次序調整方法和數位內容匯流器 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201342088A TW201342088A (zh) | 2013-10-16 |
TWI475412B true TWI475412B (zh) | 2015-03-01 |
Family
ID=49236757
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW101111679A TWI475412B (zh) | 2012-04-02 | 2012-04-02 | 數位內容次序調整方法和數位內容匯流器 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20130262966A1 (zh) |
TW (1) | TWI475412B (zh) |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10657168B2 (en) | 2006-10-24 | 2020-05-19 | Slacker, Inc. | Methods and systems for personalized rendering of digital media content |
WO2008109889A1 (en) | 2007-03-08 | 2008-09-12 | Slacker, Inc. | System and method for personalizing playback content through interaction with a playback device |
EP2737432A4 (en) * | 2011-07-29 | 2015-03-25 | Hewlett Packard Development Co | REGROUPING INCREMENTAL IMAGES |
US10275463B2 (en) * | 2013-03-15 | 2019-04-30 | Slacker, Inc. | System and method for scoring and ranking digital content based on activity of network users |
US20140280213A1 (en) * | 2013-03-15 | 2014-09-18 | Slacker, Inc. | System and method for scoring and ranking digital content based on activity of network users |
US9463383B2 (en) * | 2013-08-22 | 2016-10-11 | Pf Loop Inc. | Computer system and method for generating, exchanging, and valuing social currency |
US9990440B2 (en) * | 2013-12-30 | 2018-06-05 | Oath Inc. | Smart content pre-loading on client devices |
US20150248425A1 (en) * | 2014-02-28 | 2015-09-03 | Flipboard, Inc. | Recommending Content to Digital Magazine Server Users Based on Content Inclusion in Digital Magazines |
US10361979B2 (en) | 2014-08-08 | 2019-07-23 | Pf Loop Inc. | Computer system and method for adding attributes to an electronic message on behalf of the message's sender |
CN106570008B (zh) | 2015-10-09 | 2020-03-27 | 阿里巴巴集团控股有限公司 | 推荐方法及装置 |
US10152547B2 (en) * | 2016-02-05 | 2018-12-11 | Flipboard, Inc. | Pattern matching for content in digital magazine |
US20190207946A1 (en) * | 2016-12-20 | 2019-07-04 | Google Inc. | Conditional provision of access by interactive assistant modules |
US10725988B2 (en) | 2017-02-09 | 2020-07-28 | Micron Technology, Inc. | KVS tree |
US10706106B2 (en) | 2017-02-09 | 2020-07-07 | Micron Technology, Inc. | Merge tree modifications for maintenance operations |
US10706105B2 (en) | 2017-02-09 | 2020-07-07 | Micron Technology, Inc. | Merge tree garbage metrics |
US10719495B2 (en) * | 2017-02-09 | 2020-07-21 | Micron Technology, Inc. | Stream selection for multi-stream storage devices |
US11436417B2 (en) | 2017-05-15 | 2022-09-06 | Google Llc | Providing access to user-controlled resources by automated assistants |
US10127227B1 (en) | 2017-05-15 | 2018-11-13 | Google Llc | Providing access to user-controlled resources by automated assistants |
EP4418146A1 (en) | 2018-08-07 | 2024-08-21 | Google Llc | Assembling and evaluating automated assistant responses for privacy concerns |
US10915546B2 (en) | 2018-10-10 | 2021-02-09 | Micron Technology, Inc. | Counter-based compaction of key-value store tree data block |
US11100071B2 (en) | 2018-10-10 | 2021-08-24 | Micron Technology, Inc. | Key-value store tree data block spill with compaction |
US11048755B2 (en) | 2018-12-14 | 2021-06-29 | Micron Technology, Inc. | Key-value store tree with selective use of key portion |
US10852978B2 (en) | 2018-12-14 | 2020-12-01 | Micron Technology, Inc. | Key-value store using journaling with selective data storage format |
US10936661B2 (en) | 2018-12-26 | 2021-03-02 | Micron Technology, Inc. | Data tree with order-based node traversal |
CN111859208A (zh) * | 2019-04-25 | 2020-10-30 | 北京小米移动软件有限公司 | 显示方法、装置及存储介质 |
CN110765230B (zh) * | 2019-09-03 | 2022-08-09 | 平安科技(深圳)有限公司 | 一种法律文本存储方法、装置、可读存储介质及终端设备 |
US20230035274A1 (en) * | 2021-08-01 | 2023-02-02 | Authomize Ltd. | Methods and Systems for Classification of Sensitive Electronic Resources |
CN117093781B (zh) * | 2023-10-19 | 2024-01-23 | 北京小糖科技有限责任公司 | 面向推荐系统的排序打散方法、装置、电子设备及介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080172606A1 (en) * | 2006-12-27 | 2008-07-17 | Generate, Inc. | System and Method for Related Information Search and Presentation from User Interface Content |
TW200923813A (en) * | 2007-11-27 | 2009-06-01 | Inst Information Industry | Advertisement selection systems and methods for internet articles |
TW200951840A (en) * | 2008-06-10 | 2009-12-16 | Acer Inc | Managing method for managing documents according to preferred degrees of a user towards related titles |
TWM394515U (en) * | 2010-03-19 | 2010-12-11 | Geoinfor Scientek Consultant Inc | eBook advertising platform |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6904463B1 (en) * | 2000-12-05 | 2005-06-07 | Cisco Technology, Inc. | System for improving delivery of content by reordering after grouping components homogeneously within content stream based upon categories defined by content preferences |
US20050138049A1 (en) * | 2003-12-22 | 2005-06-23 | Greg Linden | Method for personalized news |
WO2007099540A2 (en) * | 2006-03-01 | 2007-09-07 | Green Vision Systems Ltd. | Processing and analyzing hyper-spectral image data and information via dynamic database updating |
US7774294B2 (en) * | 2006-03-06 | 2010-08-10 | Veveo, Inc. | Methods and systems for selecting and presenting content based on learned periodicity of user content selection |
US7873982B2 (en) * | 2006-06-22 | 2011-01-18 | Tivo Inc. | Method and apparatus for creating and viewing customized multimedia segments |
TW200816044A (en) * | 2006-07-07 | 2008-04-01 | Attensa Inc | Analysis and selective display of RSS feeds |
US8500450B1 (en) * | 2007-07-17 | 2013-08-06 | Taylor Associates/Communications, Inc. | Computer-implemented method of improving reading skills |
US8631015B2 (en) * | 2007-09-06 | 2014-01-14 | Linkedin Corporation | Detecting associates |
US20090070346A1 (en) * | 2007-09-06 | 2009-03-12 | Antonio Savona | Systems and methods for clustering information |
US9348912B2 (en) * | 2007-10-18 | 2016-05-24 | Microsoft Technology Licensing, Llc | Document length as a static relevance feature for ranking search results |
US20090228774A1 (en) * | 2008-03-06 | 2009-09-10 | Joseph Matheny | System for coordinating the presentation of digital content data feeds |
US8539359B2 (en) * | 2009-02-11 | 2013-09-17 | Jeffrey A. Rapaport | Social network driven indexing system for instantly clustering people with concurrent focus on same topic into on-topic chat rooms and/or for generating on-topic search results tailored to user preferences regarding topic |
US8145623B1 (en) * | 2009-05-01 | 2012-03-27 | Google Inc. | Query ranking based on query clustering and categorization |
US8555173B2 (en) * | 2009-05-31 | 2013-10-08 | Linkedin Corporation | Recommendation engine |
US8402495B1 (en) * | 2010-06-07 | 2013-03-19 | Purplecomm Inc. | Content sequence technology |
US9326116B2 (en) * | 2010-08-24 | 2016-04-26 | Rhonda Enterprises, Llc | Systems and methods for suggesting a pause position within electronic text |
US9237377B2 (en) * | 2011-07-06 | 2016-01-12 | Symphony Advanced Media | Media content synchronized advertising platform apparatuses and systems |
US9495711B2 (en) * | 2010-11-19 | 2016-11-15 | Microsoft Technology Licensing, Llc | Invite abuse prevention |
US8788925B1 (en) * | 2011-07-21 | 2014-07-22 | Flipboard, Inc. | Authorized syndicated descriptions of linked web content displayed with links in user-generated content |
EP2737432A4 (en) * | 2011-07-29 | 2015-03-25 | Hewlett Packard Development Co | REGROUPING INCREMENTAL IMAGES |
US10061860B2 (en) * | 2011-07-29 | 2018-08-28 | Oath Inc. | Method and system for personalizing web page layout |
US8463795B2 (en) * | 2011-10-18 | 2013-06-11 | Filpboard, Inc. | Relevance-based aggregated social feeds |
US9135344B2 (en) * | 2011-12-20 | 2015-09-15 | Bitly, Inc. | System and method providing search results based on user interaction with content |
WO2013100904A1 (en) * | 2011-12-27 | 2013-07-04 | Intel Corporation | Method, device, and system for generating and analyzing digital readable media consumption data |
-
2012
- 2012-04-02 TW TW101111679A patent/TWI475412B/zh active
- 2012-06-05 US US13/488,460 patent/US20130262966A1/en not_active Abandoned
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080172606A1 (en) * | 2006-12-27 | 2008-07-17 | Generate, Inc. | System and Method for Related Information Search and Presentation from User Interface Content |
TW200923813A (en) * | 2007-11-27 | 2009-06-01 | Inst Information Industry | Advertisement selection systems and methods for internet articles |
TW200951840A (en) * | 2008-06-10 | 2009-12-16 | Acer Inc | Managing method for managing documents according to preferred degrees of a user towards related titles |
TWM394515U (en) * | 2010-03-19 | 2010-12-11 | Geoinfor Scientek Consultant Inc | eBook advertising platform |
Also Published As
Publication number | Publication date |
---|---|
TW201342088A (zh) | 2013-10-16 |
US20130262966A1 (en) | 2013-10-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI475412B (zh) | 數位內容次序調整方法和數位內容匯流器 | |
JP7154334B2 (ja) | ライブストリームコンテンツを推奨するための機械学習の使用 | |
TWI636416B (zh) | 內容個人化之多相排序方法和系統 | |
US9552555B1 (en) | Methods, systems, and media for recommending content items based on topics | |
Tinati et al. | Identifying communicator roles in twitter | |
US9405746B2 (en) | User behavior models based on source domain | |
Cufoglu | User profiling-a short review | |
JP6316409B2 (ja) | トピックに関連付けられているコンテンツ・アイテムのフィードを複数のコンテンツ・ソースから生成する | |
CN102054003B (zh) | 网络信息推荐、建立网络资源索引的方法及系统 | |
US8326880B2 (en) | Summarizing streams of information | |
US20120072283A1 (en) | Mobile application recommendation system and method | |
US20110288935A1 (en) | Optimizing targeted advertisement distribution | |
KR20160057475A (ko) | 소셜 데이터를 능동적으로 획득하기 위한 시스템 및 방법 | |
WO2009023070A1 (en) | Systems and methods for keyword selection in a web-based social network | |
CN107679239B (zh) | 一种基于用户行为的个性化社区推荐方法 | |
US20230090175A1 (en) | Contextual situation analysis | |
CN113609374A (zh) | 基于内容推送的数据处理方法、装置、设备及存储介质 | |
CN104424210A (zh) | 一种信息推荐方法、系统及服务器 | |
KR20170120661A (ko) | 인간의 개입 없이 알고리즘적으로 어린이들에게 적절한 콘텐츠의 식별 | |
WO2023231542A1 (zh) | 表示信息的确定方法、装置、设备及存储介质 | |
JP2017059057A (ja) | 推定装置、推定方法及び推定プログラム | |
EP3400538A1 (en) | Methods, systems and media for identifying categories for a content item and organizing content items by categories for presentation | |
US8745074B1 (en) | Method and system for evaluating content via a computer network | |
US11568451B2 (en) | Dual-optimization of targeted digital assets under volume and position constraints | |
CN109299368B (zh) | 一种用于环境信息资源ai智能个性化推荐的方法及系统 |