[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

TWI775050B - 訓練資料處理方法與電子裝置 - Google Patents

訓練資料處理方法與電子裝置 Download PDF

Info

Publication number
TWI775050B
TWI775050B TW109105456A TW109105456A TWI775050B TW I775050 B TWI775050 B TW I775050B TW 109105456 A TW109105456 A TW 109105456A TW 109105456 A TW109105456 A TW 109105456A TW I775050 B TWI775050 B TW I775050B
Authority
TW
Taiwan
Prior art keywords
disease
time point
data
time
medical history
Prior art date
Application number
TW109105456A
Other languages
English (en)
Other versions
TW202133186A (zh
Inventor
陳陪蓉
蔡宗憲
陳亮恭
彭莉甯
蕭斐元
黃世宗
Original Assignee
宏碁股份有限公司
國立陽明大學
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 宏碁股份有限公司, 國立陽明大學 filed Critical 宏碁股份有限公司
Priority to TW109105456A priority Critical patent/TWI775050B/zh
Priority to US16/843,917 priority patent/US11996195B2/en
Priority to EP20172308.7A priority patent/EP3869514A1/en
Publication of TW202133186A publication Critical patent/TW202133186A/zh
Application granted granted Critical
Publication of TWI775050B publication Critical patent/TWI775050B/zh
Priority to US18/631,048 priority patent/US20240257978A1/en

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/40Detecting, measuring or recording for evaluating the nervous system
    • A61B5/4076Diagnosing or monitoring particular conditions of the nervous system
    • A61B5/4088Diagnosing of monitoring cognitive diseases, e.g. Alzheimer, prion diseases or dementia
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/48Other medical applications
    • A61B5/4842Monitoring progression or stage of a disease
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7264Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
    • A61B5/7267Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems involving training the classification device
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/60ICT specially adapted for the handling or processing of medical references relating to pathologies

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Surgery (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Artificial Intelligence (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Neurology (AREA)
  • Psychiatry (AREA)
  • Physiology (AREA)
  • Psychology (AREA)
  • Hospice & Palliative Care (AREA)
  • Neurosurgery (AREA)
  • Developmental Disabilities (AREA)
  • Child & Adolescent Psychology (AREA)
  • Evolutionary Computation (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Signal Processing (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Communication Control (AREA)

Abstract

訓練資料處理方法與電子裝置。所述方法包括:獲得包括一使用者所罹患的至少一第一疾病的一病史資料;根據一目標疾病設置多個疾病種類;設置一時間區間;從所述病史資料中獲得位於所述時間區間內的至少一第二疾病;根據所述疾病種類對所述第二疾病執行一前處理操作以獲得一處理後資料;以及將所述處理後資料輸入至一神經網路以訓練所述神經網路。

Description

訓練資料處理方法與電子裝置
本發明是有關於一種訓練資料處理方法與電子裝置。
失智症等疾病,在確診的數年或更早以前發生的其他疾病,可能是失智症的前兆。因此,如何利用疾病的歷史資料預測是否有可能罹患失智症,是本領域技術人員所欲解決的問題之一。
本發明提供一種訓練資料處理方法與電子裝置,可以讓所建立的神經網路模型的預測效果較傳統機器學習方法佳。
本發明提出一種訓練資料處理方法,用於一電子裝置,所述方法包括:獲得包括一使用者所罹患的至少一第一疾病的一病史資料;根據一目標疾病設置多個疾病種類;設置一時間區間;從所述病史資料中獲得位於所述時間區間內的至少一第二疾病; 根據所述疾病種類對所述第二疾病執行一前處理操作以獲得一處理後資料;以及將所述處理後資料輸入至一神經網路以訓練所述神經網路。
本發明提出一種電子裝置,包括:輸入電路與處理器。所述輸入電路獲得包括一使用者所罹患的至少一第一疾病的一病史資料。所述處理器根據一目標疾病設置多個疾病種類。所述處理器設置一時間區間。所述處理器從所述病史資料中獲得位於所述時間區間內的至少一第二疾病。所述處理器根據所述疾病種類對所述第二疾病執行一前處理操作以獲得一處理後資料。所述處理器將所述處理後資料輸入至一神經網路以訓練所述神經網路。
基於上述,本發明的訓練資料處理方法與電子裝置用以將用以訓練模型的資料進行前處理,使得使用處理後的資料所建立的神經網路模型的預測效果較傳統機器學習方法佳,並且讓所建立的模型的應用情境符合真實使用情境。
S101、S103、S105、S107、S109、S111:步驟
t0~t4、k:時間點
X、Z:年
DD:病史資料
D1、D2:時間區間內的疾病
E1、E2:詞頻資訊
圖1是依照本發明的一實施例的訓練資料處理方法的示意圖。
圖2A與圖2B是依照本發明的一實施例所繪示的時間區間的示意圖。
圖3是依照本發明的一實施例所繪示的詞頻資訊的產生的示 意圖。
本發明的模型訓練方法適用於一電子裝置(未繪示)。電子裝置包括輸入電路(未繪示)與處理器(未繪示)。輸入電路耦接至處理器。輸入電路例如是用於從電子裝置外部或其他來源取得相關資料的輸入介面或電路,在此並不設限。
處理器可以是中央處理單元(Central Processing Unit,CPU),或是其他可程式化之一般用途或特殊用途的微處理器(Microprocessor)、數位信號處理器(Digital Signal Processor,DSP)、可程式化控制器、特殊應用積體電路(Application Specific Integrated Circuit,ASIC)或其他類似元件或上述元件的組合。
此外,電子裝置還可以包括儲存電路(未繪示)。儲存電路可以是任何型態的固定或可移動隨機存取記憶體(random access memory,RAM)、唯讀記憶體(read-only memory,ROM)、快閃記憶體(flash memory)或類似元件或上述元件的組合。
在本範例實施例中,電子裝置的儲存電路中儲存有多個程式碼片段,在上述程式碼片段被安裝後,會由處理器來執行。例如,儲存電路中包括多個模組,藉由這些模組來分別執行應用於電子裝置的各個運作,其中各模組是由一或多個程式碼片段所組成。然而本發明不限於此,電子裝置的各個運作也可以是使用其他硬體形式的方式來實現。
圖1是依照本發明的一實施例的訓練資料處理方法的示意圖。特別是,使用本發明所訓練出的模型(或神經網路)可以用以預測一受測者是否會罹患一目標疾病或罹患此目標疾病的機率。
詳細來說,請參照圖1,首先,輸入電路會獲得包括一使用者所罹患的疾病(亦稱為,第一疾病)的病史資料(步驟S101)。之後,處理器會根據目標疾病設置多個疾病種類(步驟S103)。以下以目標疾病為失智症進行說明,但本發明並不用於限定目標疾病為何。
更詳細來說,處理器會將多種預設疾病轉換成多種類別資料(或多個種類)。處理器會依據欲預測的目標疾病,選取醫學領域中相關程度較高並且數量適中的疾病所對應的疾病種類。例如,處理器可以依據欲預測的目標疾病從前述多種類別資料進行篩選(例如,刪除或加入某些疾病)以得出步驟S103最後使用的疾病種類。須注意的是,當疾病種類的數量太小時,疾病資訊會不足以預測目標疾病;而當疾病種類的數量太大時則是會讓雜訊變多,使得預測準確率反而降低。
舉例來說,假設目標疾病為失智症,處理器可以選擇CCS單階診斷(CCS single level diagnoses)疾病分類,其中共有285種疾病。處理器可以在步驟S103中設置此258種疾病所對應的疾病種類。
在步驟S103後,處理器會設置一時間區間(步驟S105),並且從病史資料中獲得位於前述時間區間內的第二疾病(步驟 S107)。處理器會根據前述的疾病種類對第二疾病執行前處理操作以獲得處理後資料(步驟S109)。最後,處理器會將處理後資料輸入至神經網路以訓練此神經網路(步驟S111)。
舉例來說,圖2A與圖2B是依照本發明的一實施例所繪示的時間區間的示意圖。須說明的是,在步驟S101所取得病史資料所屬的使用者可能是罹患目標疾病或未罹患目標疾病。而針對此兩種不同的使用者,可以使用不同的方式來獲得時間區間中的第二疾病。
舉例來說,請參照圖2A,圖2A是描述如何定義時間區間以使用此時間區間從罹患目標疾病的使用者的病史資料中取得第二疾病的範例。如圖2A所示,時間點t0例如是使用者罹患(或第一次被診斷出)目標疾病的時間點,時間點t1(亦稱為,第一時間點)距離時間點t0為Z年(即,時間點t1為時間點t0的Z年前),且時間點t2(亦稱為,第二時間點)距離時間點t1為X年(即,時間點t2為時間點t1的X年前),Z與X為正數,此設計可因應實際情境需求中,時間單位可能是數年或數個月等。而圖2A中用以取得第二疾病的時間區間是介於時間點t1以及時間點t2之間。
此外,請參照圖2B,圖2B是描述如何定義時間區間以使用此時間區間從未罹患目標疾病的使用者的病史資料中取得第二疾病的範例。如圖2B所示,時間點k例如是獲得使用者的病史資料的時間點,時間點t3(亦稱為,第三時間點)距離時間點k為Z年(即,時間點t3為時間點k的Z年前),且時間點t4(亦稱為,第 四時間點)距離時間點t3為X年(即,時間點t4為時間點t3的X年前),Z與X為正數,此設計可因應實際情境需求中,時間單位可能是數年或數個月等。而圖2B中用以取得第二疾病的時間區間是介於時間點t3以及時間點t4之間。然而須注意的是,在其他實施例中,時間點t3可以是早於時間點k的其他任意時間點。
須說明的是,上述時間區間的定義方式的意義在於若觀察起點(例如,時間點t1)太早,罹患目標疾病的使用者可能身體狀況差異尚未出現,病史無法用以建模預測;而觀察起點(例如,時間點t1)太晚的話,即使成功預測,距離罹患目標疾病已近,亦無法達到事先預防目標疾病之功效。在本實施例中,由於目標疾病為失智症,處理器可以將前述的Z值設定為5,並將前述的X值設定為1。也就是說,以圖2A的範例為例,時間區間是位於罹患失智症的時間點t0的前五年至前六年之間。
在此說明如何從病史資料中獲得位於時間區間內的第二疾病。在此可以分為兩種方式:(1)疾病序列;以及(2)詞頻資訊等兩種不同的方式,以下分別進行說明。
[疾病序列]
疾病序列的產生方式可以有兩種。在一實施例中,處理器會根據病史資料中的每一疾病(即,第一疾病)的最早發生時間,從此些疾病中找出位於時間區間內的疾病。並從時間區間內的疾病找出由至少一疾病(亦稱為,第二疾病)所組成的疾病序列。特別是,在此疾病序列中的第二疾病是依照最早發生時間排序,第二 疾病的數量小於或等於一預設數量,且第二疾病中的每一疾病僅出現一次。
舉例來說,假設預設數量為5,並且假設某人病史中在時間區間內所看診(或患病)的先後「病2→病2→病1→病2→病4→病3→病3」。若使用最早發生時間排序則可以得到「病2→病1→病4→病3」的疾病序列。而在此序列中,疾病的數量(即,4)會小於預設數量(即,5)。而且在此疾病序列中,每一疾病僅出現一次。
第二種方式,處理器會根據病史資料中每一疾病的所有發生時間,從此些疾病中找出位於時間區間內的疾病,並且依照發生時間先後進行排序。此方式產生的疾病序列中的疾病可能重複。
此外,在一實施例中,處理器會刪除病史資料中部分疾病(亦稱為,第三疾病)以獲得由多個疾病(例如,前述的第二疾病)所組成的疾病序列。其中,第三疾病的發生時間是早於疾病序列中的疾病的發生時間。在疾病序列中的疾病是依照最早發生時間排序,且疾病序列中疾病的數量是小於或等於一預設數量。
舉例來說,假設預設數量為5,並且假設採取前述第二種方式,某人病史中在時間區間內所看診(或患病)的先後為「病2→病2→病1→病2→病4→病3→病3」,由於病史資料中的疾病(或看診)數量(即,7)大於預設數量,處理器例如可以刪除病史資料中較早出現的疾病「病2→病2」而得到「病1→病2→病4→病3→病3」的疾病序列。
在經由前述方式獲得時間區間內的第二疾病後,可以在步驟S109中根據疾病種類將疾病序列中的第二疾病編碼為一維或二維的編碼後資料(或稱為,向量),並將所述編碼後資料作為處理後資料,並在步驟S111中將此處理後資料輸入至神經網路以訓練神經網路。
在此以將第二疾病編碼為一維的編碼後資料為例進行說明。假設疾病類別總共有5種,且「病1」、「病2」、「病3」、「病4」與「病5」會被分別定義為「[1,0,0,0,0]」、「[0,1,0,0,0]」、「[0,0,1,0,0]」、「[0,0,0,1,0]」與「[0,0,0,0,1]」。假設經由前述方式所獲得的疾病序列為「病2→病1→病4→病3」,則處理器可以將疾病序列轉換為:「[0,1,0,0,0]→[1,0,0,0,0]→[0,0,0,1,0]→[0,0,1,0,0]」,並將進而將而產生一維資料「[0,1,0,0,0,1,0,0,0,0,0,0,0,1,0,0,0,1,0,0]」。之後,可以將此一維資料輸入至以一維資料作為輸入的神經網路。
在此以將第二疾病編碼為二維的編碼後資料為例進行說明。假設疾病類別總共有5種,且「病1」、「病2」、「病3」、「病4」與「病5」會被分別定義為「[1,0,0,0,0]」、「[0,1,0,0,0]」、「[0,0,1,0,0]」、「[0,0,0,1,0]」與「[0,0,0,0,1]」。假設經由前述方式所獲得的疾病序列為「病2→病1→病4→病3」,則處理器可以將疾病序列轉換為:「[0,1,0,0,0]→[1,0,0,0,0]→[0,0,0,1,0]→[0,0,1,0,0]」,並進而產生如下述矩陣的二維資料:
Figure 109105456-A0305-02-0011-1
之後,可以將此二維資料輸入至以二維資料作為輸入的神經網路(例如,LSTM)。
特別是,由於上述的一維或二維資料是依照時間先後順序的方式來編碼各個疾病,而在編碼後的資料中仍會保留各個疾病間的先後關係。
而在訓練神經網路的過程中,例如可以使用Sentence embedding的方法,設置轉換後向量長度M,與神經網路(例如,LSTM)一起訓練。
[詞頻資訊]
圖3是依照本發明的一實施例所繪示的詞頻資訊的產生的示意圖。
請參照圖3,在一實施例中,處理器可以直接取病史資料DD中位於前述時間區間內的疾病D1~D2作為構成前述疾病序列的第二疾病。處理器會對此些疾病D1~D2加權後(在此不限權重),將此些疾病視為字詞(word)並使用TF-IDF演算法分別轉換為詞頻資訊E1~E2。
須說明的是,本發明並不用於限定如何對疾病加權。在一實施例中,可以基於是否曾經看過診進行加權。例如,看診過的疾病的權重可以被設為1,否則=0。
在另一實施例中,可以基於看診過的次數進行加權。假 設某人病史為:「病2→病2→病1→病2→病4→病3→病3」,則此人病1的權重值為1,病2的權重值為3,病3的權重值為2,病4的權重值為1。
在另一實施例中,可以基於其他病史資訊進行加權。其他病史資料如:個別疾病用藥量、手術資訊、標誌慢性病、其他處置等等,在此並不作限制。
在另一實施例中,也可以使用疾病用藥量進行加權。假設某甲、乙、丙三人曾看過糖尿病,用藥量分別為2單位、1單位、3單位,則三人的糖尿病權重分別為2、1、3。
在另一實施例中,也可以先以其他機器學習方法排序疾病重要性,再以此重要性進行加權。
在分別將加權後的第二疾病轉換為詞頻資訊後,處理器會將詞頻資訊作為處理後資料,並將此處理後資料輸入至神經網路以訓練神經網路。特別是,詞頻資訊的格式通常符合一般機器學習輸入資料格式,故可直接輸入神經網路進行訓練。
在經由上述方式將神經網路訓練完成後,當神經網路收到一受測者的病史資料時,可以藉由此神經網路判斷是否會罹患目標疾病(例如,失智症)或罹患目標疾病的機率。
綜上所述,本發明的訓練資料處理方法與電子裝置用以將用以訓練模型的資料進行前處理,使得使用處理後的資料所建立的神經網路模型的預測效果較傳統機器學習方法佳,並且讓所建立的模型的應用情境符合真實使用情境。
S101、S103、S105、S107、S109、S111:步驟

Claims (14)

  1. 一種訓練資料處理方法,用於一電子裝置,所述方法包括:獲得包括一使用者所罹患的至少一第一疾病的一病史資料;根據一目標疾病設置多個疾病種類;設置一時間區間;從所述病史資料中獲得位於所述時間區間內的至少一第二疾病;根據所述疾病種類對所述第二疾病執行一前處理操作以獲得一處理後資料;以及將所述處理後資料輸入至一神經網路以訓練所述神經網路,其中所述神經網路用以預測所述使用者是否會罹患所述目標疾病或罹患所述目標疾病的一機率。
  2. 如請求項1所述的訓練資料處理方法,其中所述使用者罹患所述目標疾病,所述時間區間介於一第一時間點以及一第二時間點之間,所述第一時間點為罹患所述目標疾病的時間點的Z年前,且所述第二時間點為所述第一時間點的X年前,Z與X為正數。
  3. 如請求項1所述的訓練資料處理方法,其中所述使用者未罹患所述目標疾病,其中所述時間區間介於一第三時間點以及一第四時間點之間,所述第三時間點為獲得所述病史資料的時 間點的Z年前或一任意時間點,且所述第四時間點為所述第三時間點的X年前,Z與X為正數。
  4. 如請求項1所述的訓練資料處理方法,其中從所述病史資料中獲得位於所述時間區間內的所述第二疾病的步驟包括:根據每一所述第一疾病的最早發生時間從所述第一疾病中獲得由所述第二疾病所組成的一疾病序列,其中在所述疾病序列中的所述第二疾病依照最早發生時間排序,所述第二疾病的數量小於或等於一預設數量,且所述第二疾病中的每一疾病僅出現一次。
  5. 如請求項1所述的訓練資料處理方法,其中從所述病史資料中獲得位於所述時間區間內的所述第二疾病的步驟包括:刪除所述病史資料中的至少一第三疾病以獲得由所述第二疾病所組成的一疾病序列,其中所述第三疾病的發生時間早於所述第二疾病的發生時間,在所述疾病序列中的所述第二疾病依照最早發生時間排序,所述第二疾病的數量小於或等於一預設數量。
  6. 如請求項5所述的訓練資料處理方法,其中根據所述疾病種類對所述第二疾病執行所述前處理操作以獲得所述處理後資料的步驟包括:根據所述疾病種類將所述疾病序列中的所述第二疾病編碼為一維或二維的編碼後資料,並將所述編碼後資料作為所述處理後資料。
  7. 如請求項1所述的訓練資料處理方法,其中根據所述疾病種類對所述第二疾病執行所述前處理操作以獲得所述處理後資料的步驟包括:對每一所述第二疾病加權;分別將加權後的所述第二疾病轉換為至少一詞頻資訊,並將所述詞頻資訊作為所述處理後資料。
  8. 一種電子裝置,包括:一輸入電路;以及一處理器,耦接至所述輸入電路,其中所述輸入電路獲得包括一使用者所罹患的至少一第一疾病的一病史資料,所述處理器根據一目標疾病設置多個疾病種類,所述處理器設置一時間區間,所述處理器從所述病史資料中獲得位於所述時間區間內的至少一第二疾病,所述處理器根據所述疾病種類對所述第二疾病執行一前處理操作以獲得一處理後資料,所述處理器將所述處理後資料輸入至一神經網路以訓練所述神經網路,其中所述神經網路用以預測所述使用者是否會罹患所述目標疾病或罹患所述目標疾病的一機率。
  9. 如請求項8所述的電子裝置,其中所述使用者罹患所述目標疾病,所述時間區間介於一第一時間點以及一第二時間點 之間,所述第一時間點為罹患所述目標疾病的時間點的Z年前,且所述第二時間點為所述第一時間點的X年前,Z與X為正數。
  10. 如請求項8所述的電子裝置,其中所述使用者未罹患所述目標疾病,其中所述時間區間介於一第三時間點以及一第四時間點之間,所述第三時間點為獲得所述病史資料的時間點的Z年前或一任意時間點,且所述第四時間點為所述第三時間點的X年前,Z與X為正數。
  11. 如請求項8所述的電子裝置,其中在從所述病史資料中獲得位於所述時間區間內的所述第二疾病的運作中,所述處理器根據每一所述第一疾病的最早發生時間從所述第一疾病中獲得由所述第二疾病所組成的一疾病序列,其中在所述疾病序列中的所述第二疾病依照最早發生時間排序,所述第二疾病的數量小於或等於一預設數量,且所述第二疾病中的每一疾病僅出現一次。
  12. 如請求項8所述的電子裝置,其中在從所述病史資料中獲得位於所述時間區間內的所述第二疾病的運作中,所述處理器刪除所述病史資料中的至少一第三疾病以獲得由所述第二疾病所組成的一疾病序列,其中所述第三疾病的發生時間早於所述第二疾病的發生時間,在所述疾病序列中的所述第二疾病依照最早發生時間排序,所述第二疾病的數量小於或等於一預設數量。
  13. 如請求項12所述的電子裝置,其中在根據所述疾病種類對所述第二疾病執行所述前處理操作以獲得所述處理後資料的運作中,所述處理器根據所述疾病種類將所述疾病序列中的所述第二疾病編碼為一維或二維的編碼後資料,並將所述編碼後資料作為所述處理後資料。
  14. 如請求項8所述的電子裝置,其中在根據所述疾病種類對所述第二疾病執行所述前處理操作以獲得所述處理後資料的運作中,所述處理器對每一所述第二疾病加權,所述處理器分別將加權後的所述第二疾病轉換為至少一詞頻資訊,並將所述詞頻資訊作為所述處理後資料。
TW109105456A 2020-02-20 2020-02-20 訓練資料處理方法與電子裝置 TWI775050B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
TW109105456A TWI775050B (zh) 2020-02-20 2020-02-20 訓練資料處理方法與電子裝置
US16/843,917 US11996195B2 (en) 2020-02-20 2020-04-09 Training data processing method and electronic device
EP20172308.7A EP3869514A1 (en) 2020-02-20 2020-04-30 Training data processing method and electronic device
US18/631,048 US20240257978A1 (en) 2020-02-20 2024-04-10 Training data processing method and electronic device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW109105456A TWI775050B (zh) 2020-02-20 2020-02-20 訓練資料處理方法與電子裝置

Publications (2)

Publication Number Publication Date
TW202133186A TW202133186A (zh) 2021-09-01
TWI775050B true TWI775050B (zh) 2022-08-21

Family

ID=70482323

Family Applications (1)

Application Number Title Priority Date Filing Date
TW109105456A TWI775050B (zh) 2020-02-20 2020-02-20 訓練資料處理方法與電子裝置

Country Status (3)

Country Link
US (2) US11996195B2 (zh)
EP (1) EP3869514A1 (zh)
TW (1) TWI775050B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW201944429A (zh) * 2018-03-04 2019-11-16 美商阿奇力互動實驗室公司 針對免疫調節及神經退化性失調的認知篩檢、監測和認知處理

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8200506B2 (en) * 2006-12-19 2012-06-12 Accenture Global Services Limited Integrated health management platform
CN106778014B (zh) 2016-12-29 2020-06-16 浙江大学 一种基于循环神经网络的患病风险预测建模方法
CN107403072A (zh) 2017-08-07 2017-11-28 北京工业大学 一种基于机器学习的2型糖尿病预测预警方法
CN111492437A (zh) * 2017-12-29 2020-08-04 英泰曲尔德直线有限公司 支持医学决策的方法和系统
KR101881731B1 (ko) 2018-02-27 2018-07-25 한국과학기술정보연구원 기계 학습을 통한 치매 예측용 데이터 처리 장치 및 그 방법, 이를 수록한 기록 매체
US11101039B2 (en) * 2018-03-02 2021-08-24 Jack Albright Machine-learning-based forecasting of the progression of Alzheimer's disease
CN109326353B (zh) 2018-10-29 2020-11-27 南京医基云医疗数据研究院有限公司 预测疾病终点事件的方法、装置及电子设备

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW201944429A (zh) * 2018-03-04 2019-11-16 美商阿奇力互動實驗室公司 針對免疫調節及神經退化性失調的認知篩檢、監測和認知處理

Also Published As

Publication number Publication date
EP3869514A1 (en) 2021-08-25
US20240257978A1 (en) 2024-08-01
TW202133186A (zh) 2021-09-01
US11996195B2 (en) 2024-05-28
US20210265058A1 (en) 2021-08-26

Similar Documents

Publication Publication Date Title
US11922348B2 (en) Generating final abnormality data for medical scans based on utilizing a set of sub-models
CN108491497B (zh) 基于生成式对抗网络技术的医疗文本生成方法
KR102190299B1 (ko) 인공신경망을 이용한 위암의 예후 예측 방법, 장치 및 프로그램
CN107016438B (zh) 一种基于中医辨证人工神经网络算法模型的系统
Yu et al. Predicting hospital readmission: a joint ensemble-learning model
US20160026917A1 (en) Ranking of random batches to identify predictive features
CN116910172B (zh) 基于人工智能的随访量表生成方法及系统
CN113889262B (zh) 基于模型的数据预测方法、装置、计算机设备和存储介质
US20240161035A1 (en) Multi-model medical scan analysis system and methods for use therewith
Kumar et al. COV‐DLS: prediction of COVID‐19 from X‐rays using enhanced deep transfer learning techniques
Khaniki et al. Enhancing pneumonia detection using vision transformer with dynamic mapping re-attention mechanism
Li et al. Disease identification in potato leaves using swin transformer
Wajgi et al. Optimized tuberculosis classification system for chest X‐ray images: Fusing hyperparameter tuning with transfer learning approaches
TWI775050B (zh) 訓練資料處理方法與電子裝置
Desai et al. A transfer learning based approach for classification of COVID-19 and pneumonia in CT scan imaging
Yan Gingivitis detection by fractional Fourier entropy with optimization of hidden neurons
CN113035334A (zh) 鼻腔nkt细胞淋巴瘤放疗靶区自动勾画方法和装置
Haripriya et al. Performance analysis of machine learning classification approaches for monkey pox disease prediction
Domyati et al. Robust detection of cardiac disease using machine learning algorithms: Robust detection
Mangalmurti et al. COVID-19 and other lung disease detection using VGG19 pretrained features and support vector machine
Mahendra et al. Optimizing convolutional neural network by using genetic algorithm for COVID-19 detection in chest X-ray image
CN113593698B (zh) 一种基于图注意网络的中医证型识别方法
Hsu et al. Predicting thorax diseases with NIH chest X-rays
Kumar et al. Sequential Transfer Learning Model for Pneumonia Detection Using Chest X-ray Images
Xie et al. Predicting the risk of stroke based on imbalanced data set with missing data

Legal Events

Date Code Title Description
GD4A Issue of patent certificate for granted invention patent