JP2024038396A - Image analysis method, image analysis device, and program - Google Patents
Image analysis method, image analysis device, and program Download PDFInfo
- Publication number
- JP2024038396A JP2024038396A JP2024004675A JP2024004675A JP2024038396A JP 2024038396 A JP2024038396 A JP 2024038396A JP 2024004675 A JP2024004675 A JP 2024004675A JP 2024004675 A JP2024004675 A JP 2024004675A JP 2024038396 A JP2024038396 A JP 2024038396A
- Authority
- JP
- Japan
- Prior art keywords
- image
- tissue
- analysis
- deep learning
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003703 image analysis method Methods 0.000 title claims abstract description 42
- 238000010191 image analysis Methods 0.000 title claims description 127
- 206010028980 Neoplasm Diseases 0.000 claims abstract description 262
- 238000004458 analytical method Methods 0.000 claims abstract description 253
- 238000013135 deep learning Methods 0.000 claims abstract description 190
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 155
- 238000013528 artificial neural network Methods 0.000 claims abstract description 102
- 238000012549 training Methods 0.000 claims description 439
- 238000000034 method Methods 0.000 claims description 101
- 230000008569 process Effects 0.000 claims description 57
- 230000006870 function Effects 0.000 claims description 47
- 238000003860 storage Methods 0.000 claims description 42
- 239000003086 colorant Substances 0.000 claims description 40
- 238000003384 imaging method Methods 0.000 claims description 36
- 238000010186 staining Methods 0.000 claims description 26
- 238000003745 diagnosis Methods 0.000 claims description 24
- 230000004913 activation Effects 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 8
- 210000001519 tissue Anatomy 0.000 description 267
- 238000012545 processing Methods 0.000 description 224
- 238000010586 diagram Methods 0.000 description 66
- 201000011510 cancer Diseases 0.000 description 16
- 210000004027 cell Anatomy 0.000 description 14
- 238000004364 calculation method Methods 0.000 description 13
- 238000001514 detection method Methods 0.000 description 12
- 208000005718 Stomach Neoplasms Diseases 0.000 description 11
- 206010017758 gastric cancer Diseases 0.000 description 11
- 230000008520 organization Effects 0.000 description 11
- 201000011549 stomach cancer Diseases 0.000 description 11
- WZUVPPKBWHMQCE-UHFFFAOYSA-N Haematoxylin Chemical compound C12=CC(O)=C(O)C=C2CC2(O)C1C1=CC=C(O)C(O)=C1OC2 WZUVPPKBWHMQCE-UHFFFAOYSA-N 0.000 description 10
- 238000011478 gradient descent method Methods 0.000 description 7
- 210000003855 cell nucleus Anatomy 0.000 description 6
- 238000007490 hematoxylin and eosin (H&E) staining Methods 0.000 description 6
- 210000004882 non-tumor cell Anatomy 0.000 description 6
- 210000004881 tumor cell Anatomy 0.000 description 6
- 230000001575 pathological effect Effects 0.000 description 5
- 238000012333 histopathological diagnosis Methods 0.000 description 4
- 238000012216 screening Methods 0.000 description 4
- 230000035945 sensitivity Effects 0.000 description 4
- 239000011521 glass Substances 0.000 description 3
- 239000004973 liquid crystal related substance Substances 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000010827 pathological analysis Methods 0.000 description 3
- 238000001356 surgical procedure Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 206010006187 Breast cancer Diseases 0.000 description 2
- 208000026310 Breast neoplasm Diseases 0.000 description 2
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 2
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 2
- 206010060862 Prostate cancer Diseases 0.000 description 2
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000002496 gastric effect Effects 0.000 description 2
- 238000012886 linear function Methods 0.000 description 2
- 201000007270 liver cancer Diseases 0.000 description 2
- 208000014018 liver neoplasm Diseases 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 230000003211 malignant effect Effects 0.000 description 2
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012758 nuclear staining Methods 0.000 description 2
- 210000004940 nucleus Anatomy 0.000 description 2
- 201000002528 pancreatic cancer Diseases 0.000 description 2
- 208000008443 pancreatic carcinoma Diseases 0.000 description 2
- 230000000241 respiratory effect Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 206010005003 Bladder cancer Diseases 0.000 description 1
- 201000009030 Carcinoma Diseases 0.000 description 1
- 102000008186 Collagen Human genes 0.000 description 1
- 108010035532 Collagen Proteins 0.000 description 1
- 206010009944 Colon cancer Diseases 0.000 description 1
- 208000001333 Colorectal Neoplasms Diseases 0.000 description 1
- 206010061825 Duodenal neoplasm Diseases 0.000 description 1
- 206010062767 Hypophysitis Diseases 0.000 description 1
- 102000004856 Lectins Human genes 0.000 description 1
- 108090001090 Lectins Proteins 0.000 description 1
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 1
- 208000007433 Lymphatic Metastasis Diseases 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 206010033128 Ovarian cancer Diseases 0.000 description 1
- 206010061535 Ovarian neoplasm Diseases 0.000 description 1
- 208000006994 Precancerous Conditions Diseases 0.000 description 1
- 208000015634 Rectal Neoplasms Diseases 0.000 description 1
- 208000009125 Sigmoid Neoplasms Diseases 0.000 description 1
- 208000000453 Skin Neoplasms Diseases 0.000 description 1
- 206010054184 Small intestine carcinoma Diseases 0.000 description 1
- 208000024770 Thyroid neoplasm Diseases 0.000 description 1
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 description 1
- 208000009956 adenocarcinoma Diseases 0.000 description 1
- 210000004100 adrenal gland Anatomy 0.000 description 1
- 210000000436 anus Anatomy 0.000 description 1
- 210000001815 ascending colon Anatomy 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 210000000621 bronchi Anatomy 0.000 description 1
- 210000004534 cecum Anatomy 0.000 description 1
- 210000003169 central nervous system Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 229920001436 collagen Polymers 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 210000001198 duodenum Anatomy 0.000 description 1
- 201000000312 duodenum cancer Diseases 0.000 description 1
- 210000000750 endocrine system Anatomy 0.000 description 1
- YQGOJNYOYNNSMM-UHFFFAOYSA-N eosin Chemical compound [Na+].OC(=O)C1=CC=CC=C1C1=C2C=C(Br)C(=O)C(Br)=C2OC2=C(Br)C(O)=C(Br)C=C21 YQGOJNYOYNNSMM-UHFFFAOYSA-N 0.000 description 1
- 210000003238 esophagus Anatomy 0.000 description 1
- 210000004996 female reproductive system Anatomy 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000000834 fixative Substances 0.000 description 1
- 238000002073 fluorescence micrograph Methods 0.000 description 1
- 238000012252 genetic analysis Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 210000003016 hypothalamus Anatomy 0.000 description 1
- 210000003405 ileum Anatomy 0.000 description 1
- 238000012744 immunostaining Methods 0.000 description 1
- 210000001630 jejunum Anatomy 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 208000003849 large cell carcinoma Diseases 0.000 description 1
- 239000002523 lectin Substances 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 201000005202 lung cancer Diseases 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 210000001989 nasopharynx Anatomy 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 210000003101 oviduct Anatomy 0.000 description 1
- 239000012188 paraffin wax Substances 0.000 description 1
- 210000002990 parathyroid gland Anatomy 0.000 description 1
- 210000003635 pituitary gland Anatomy 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 206010038038 rectal cancer Diseases 0.000 description 1
- 210000000664 rectum Anatomy 0.000 description 1
- 201000001275 rectum cancer Diseases 0.000 description 1
- 238000002271 resection Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 210000001599 sigmoid colon Anatomy 0.000 description 1
- 201000003825 sigmoid colon cancer Diseases 0.000 description 1
- 201000000849 skin cancer Diseases 0.000 description 1
- 208000000649 small cell carcinoma Diseases 0.000 description 1
- 210000004872 soft tissue Anatomy 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 206010041823 squamous cell carcinoma Diseases 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 201000002510 thyroid cancer Diseases 0.000 description 1
- 210000001685 thyroid gland Anatomy 0.000 description 1
- 210000003437 trachea Anatomy 0.000 description 1
- 210000003384 transverse colon Anatomy 0.000 description 1
- 210000000626 ureter Anatomy 0.000 description 1
- 210000003932 urinary bladder Anatomy 0.000 description 1
- 201000005112 urinary bladder cancer Diseases 0.000 description 1
- 230000002485 urinary effect Effects 0.000 description 1
- 210000004291 uterus Anatomy 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Landscapes
- Investigating Or Analysing Biological Materials (AREA)
- Image Analysis (AREA)
Abstract
Description
本明細書には、画像解析方法、画像解析装置、プログラム、学習済み深層学習アルゴリズムの製造方法および学習済み深層学習アルゴリズムが開示される。より詳細には、解析対象の組織の画像について、解析用データに含まれる領域が腫瘍領域であるか否かを示すデータを生成することを含む画像解析方法、画像解析装置、プログラム、学習済み深層学習アルゴリズムの製造方法および学習済み深層学習アルゴリズム等が開示される。 This specification discloses an image analysis method, an image analysis device, a program, a method for manufacturing a trained deep learning algorithm, and a trained deep learning algorithm. More specifically, an image analysis method, an image analysis device, a program, and a learned deep layer include generating data indicating whether or not a region included in analysis data is a tumor region for an image of a tissue to be analyzed. A method for manufacturing a learning algorithm, a trained deep learning algorithm, and the like are disclosed.
特許文献1には、病理組織画像において組織像を、正常、良性腫瘍、前癌状態および癌状態の4つのグループに分類し、判定する画像診断支援装置が開示されている。画像分類手段は、画像データから注視領域を抽出し、注視領域の特徴を示す特徴量を算出し、算出した特徴量に基づいてグループの分類を行う。特徴量は、細胞核における単位面積あたりの塊の密度、塊面積の密度、塊の面積、塊の太さ、および塊の長さなどである。画像判定手段は、このような特徴量と判定結果との関係を学習し、学習済みの学習パラメータに基づいて判定を行う。学習は、サポートベクターマシンなどの学習アルゴリズムを用いて、機械学習を実行する。 Patent Document 1 discloses an image diagnosis support device that classifies and determines tissue images in pathological tissue images into four groups: normal, benign tumor, precancerous state, and cancerous state. The image classification means extracts a region of interest from the image data, calculates a feature amount representing the feature of the region of interest, and classifies the image into groups based on the calculated feature amount. The feature amounts include the density of the clump per unit area in the cell nucleus, the density of the clump area, the area of the clump, the thickness of the clump, and the length of the clump. The image determination means learns the relationship between such feature amounts and determination results, and performs determination based on learned learning parameters. Machine learning is performed using a learning algorithm such as support vector machine.
悪性腫瘍であるか否かを確定診断する際に、病理組織標本を用いた病理組織診断が行われる。また病理組織診断は、手術中に悪性腫瘍を含む組織の切除部位を決定するための術中迅速診断として行われることも少なくない。術中迅速診断は、手術中に患者の患部を切開した状態で待機させ、腫瘍が悪性であるか、切除した組織の断端に腫瘍が残っていないか、リンパ節転移があるか等の判断を病理組織診断により行うものである。術中迅速診断の結果により、待機している患者のその後の手術の方向性が決められる。 When definitively diagnosing whether a tumor is malignant or not, histopathological diagnosis using a histopathological specimen is performed. Furthermore, histopathological diagnosis is often performed as a quick intraoperative diagnosis to determine the resection site of tissue containing a malignant tumor during surgery. Rapid intraoperative diagnosis involves having the patient stand by while an incision is made in the affected area during surgery, and determining whether the tumor is malignant, whether there is any tumor remaining in the resected tissue margin, and whether there is lymph node metastasis. This is done through histopathological diagnosis. The results of the intraoperative rapid diagnosis will determine the direction of subsequent surgery for the waiting patient.
病理組織診断は、医師、特に病理医が顕微鏡等により組織標本を観察して診断するが、組織標本の観察により正確な確定診断を行えるようになるためには、長い期間、熟練した病理専門医の元で、様々な症例の組織標本の観察を繰り返す必要があり、病理医の育成にも膨大な時間を要している。 Histopathological diagnosis is performed by a doctor, especially a pathologist, by observing tissue specimens using a microscope, etc., but in order to be able to make an accurate and definitive diagnosis by observing tissue specimens, it takes a long period of time for a skilled pathologist to make a diagnosis. Initially, it is necessary to repeatedly observe tissue specimens from various cases, and it takes an enormous amount of time to train pathologists.
病理医の不足は深刻であり、病理医が不足している結果、患者の悪性腫瘍の確定診断が遅れ、治療開始が遅れる、あるいは確定診断を待たずに治療を開始するという状態も危惧されている。また、通常の組織診断と術中迅速診断との両方が、少ない病理医に集中するために、一人の病理医の業務量が膨大となり、病理医自身の労務状態も問題となっている。しかし、現在のところこの問題の解消策は見つかっていない。 There is a serious shortage of pathologists, and as a result of the shortage, there are concerns that a definitive diagnosis of a patient's malignant tumor will be delayed, and the start of treatment will be delayed, or that treatment may be started without waiting for a definitive diagnosis. There is. In addition, because both normal tissue diagnosis and intraoperative rapid diagnosis are concentrated on a small number of pathologists, the workload of each pathologist becomes enormous, and the working conditions of the pathologists themselves are also becoming a problem. However, no solution to this problem has been found so far.
したがって、病理組織診断を装置がサポートできるようになることは、特にその診断が人の目による判断に近いほど、病理医不足の解消、および病理医の労務状態の改善に大きく貢献すると考えられる。 Therefore, it is thought that the ability of a device to support pathological tissue diagnosis will greatly contribute to resolving the shortage of pathologists and improving the working conditions of pathologists, especially as the diagnosis is closer to judgment made by the human eye.
装置が病理組織診断をサポートするという点において、上述の特許文献1に記載の発明では、機械学習による画像解析に基づいて標本組織の病理判定を行っている。この方法では、特徴量を人の手で作成する必要がある。特徴量を人の手で作成する方法には、その人の力量が画像解析の性能に大きく影響を与えるという問題がある。さらに、特許文献1に記載の発明は、顕微鏡で強拡大された組織標本の画像内の細胞核1つ1つに対して癌細胞の核であるか否かの判定を行う。したがって、標本1枚の全体について解析しようとすると長い解析時間を要するという問題がある。 In terms of the device supporting pathological tissue diagnosis, the invention described in Patent Document 1 described above performs pathological determination of sample tissue based on image analysis using machine learning. This method requires the feature values to be created manually. The problem with methods of manually creating feature amounts is that the ability of the person greatly affects the performance of image analysis. Further, the invention described in Patent Document 1 determines whether each cell nucleus in an image of a tissue specimen strongly magnified with a microscope is a nucleus of a cancer cell. Therefore, there is a problem in that it takes a long time to analyze an entire specimen.
したがって、個々の細胞について癌細胞の核であるか否かを病理医や機械学習アルゴリズムによって判定する前に、1枚の標本に含まれる組織全体を観察し、その標本のどの部位に腫瘍組織が含まれるかをスクリーニングすることは、1枚の標本に対する病理診断にかかる時間を短縮する一助となる。 Therefore, before a pathologist or machine learning algorithm determines whether an individual cell is the nucleus of a cancer cell, it is necessary to observe the entire tissue contained in a single specimen and determine which part of the specimen contains tumor tissue. Screening for the presence of such substances helps reduce the time required for pathological diagnosis of a single specimen.
本発明は、解析対象の組織が解析用データに含まれる領域が腫瘍領域であるか否かを示すデータを生成する画像解析方法、画像解析装置、およびプログラムを提供することを課題とする。 SUMMARY OF THE INVENTION An object of the present invention is to provide an image analysis method, an image analysis device, and a program that generate data indicating whether or not a region of a tissue to be analyzed that is included in analysis data is a tumor region.
上記の課題を解決するために、本発明の一態様に係る画像解析方法は、ニューラルネットワーク構造の深層学習アルゴリズム(60)を用いて、組織の画像を解析する画像解析方法であって、組織の種類に応じて生成された複数の深層学習アルゴリズム(60)から、解析対象の組織の種類に対応する前記深層学習アルゴリズム(60)を選択し、前記解析対象の組織を含む解析対象画像(78)から解析用データ(80)を生成し、前記解析用データ(80)を、選択された前記深層学習アルゴリズム(60)に入力し、前記解析用データ(80)が入力された前記深層学習アルゴリズム(60)から出力される解析結果に基づき、腫瘍領域とそれ以外の領域とを識別可能に前記解析対象の組織の画像を表示する、ことを含む。 In order to solve the above problems, an image analysis method according to one aspect of the present invention is an image analysis method that analyzes an image of a tissue using a deep learning algorithm (60) having a neural network structure. The deep learning algorithm (60) corresponding to the type of tissue to be analyzed is selected from a plurality of deep learning algorithms (60) generated according to the type, and an analysis target image (78) containing the tissue to be analyzed is created. generate analysis data (80) from the analysis data (80), input the analysis data (80) to the selected deep learning algorithm (60), and input the analysis data (80) to the deep learning algorithm (60). 60), displaying an image of the tissue to be analyzed in such a manner that a tumor region and other regions can be distinguished from each other.
データベース(105)に前記複数の深層学習アルゴリズム(60)が記憶されており、前記解析対象の組織の種類に対応する前記深層学習アルゴリズム(60)が、前記データベース(105)に記憶された前記複数の深層学習アルゴリズム(60)から選択されてもよい。 The plurality of deep learning algorithms (60) are stored in the database (105), and the deep learning algorithm (60) corresponding to the type of tissue to be analyzed is one of the plurality of deep learning algorithms (60) stored in the database (105). deep learning algorithms (60).
前記複数の深層学習アルゴリズム(60)のそれぞれは、組織の種類と対応付けられて前記データベース(105)に記憶されていてもよい。 Each of the plurality of deep learning algorithms (60) may be stored in the database (105) in association with a type of tissue.
前記複数の深層学習アルゴリズム(60)の少なくとも1つは、1つの組織の種類と対応付けられて前記データベース(105)に記憶されていてもよい。 At least one of the plurality of deep learning algorithms (60) may be stored in the database (105) in association with one tissue type.
ユーザによる入力部(26)を介した操作に基づいて、前記解析対象の組織の種類に対応する前記深層学習アルゴリズム(60)が選択されてもよい。 The deep learning algorithm (60) corresponding to the type of tissue to be analyzed may be selected based on a user's operation via the input unit (26).
前記画像解析方法は、前記深層学習アルゴリズム(60)から出力される解析結果に基づき、腫瘍領域とそれ以外の領域とを識別可能に表示するための描画処理を前記解析対象画像(78)に施すことをさらに含んでもよい。 The image analysis method performs a drawing process on the analysis target image (78) to display a tumor region and other regions in a distinguishable manner based on the analysis result output from the deep learning algorithm (60). It may further include.
前記描画処理は、前記腫瘍領域とそれ以外の領域とを異なる色で描画する処理を含んでもよい。 The drawing process may include a process of drawing the tumor area and other areas in different colors.
前記解析対象画像(78)が、組織診断用標本の画像であり、前記解析対象画像(78)が2以上の原色を組み合わせた色相を含んでもよい。 The analysis target image (78) may be an image of a specimen for tissue diagnosis, and the analysis target image (78) may include a hue that is a combination of two or more primary colors.
前記解析対象画像(78)が、前記解析対象の組織を3倍から20倍に拡大して撮像された画像であってもよい。 The image to be analyzed (78) may be an image obtained by enlarging the tissue to be analyzed from 3 times to 20 times.
前記解析用データ(80)は、前記解析対象画像から切り出された画像に対応し、前記解析対象画像(78)から複数生成されてもよい。 The analysis data (80) corresponds to an image cut out from the analysis target image, and may be generated in plural from the analysis target image (78).
前記解析対象画像(78)が、組織診断用標本の画像であり、前記組織診断用標本が染色された標本であり、前記解析対象画像(78)は、前記染色された標本を顕微鏡の明視野下で撮像した画像であってもよい。 The image to be analyzed (78) is an image of a specimen for tissue diagnosis, the specimen for tissue diagnosis is a stained specimen, and the image to be analyzed (78) is an image of the stained specimen in the bright field of a microscope. It may be an image taken below.
前記深層学習アルゴリズム(60)の学習に用いられる訓練データが、個体から採取された腫瘍領域を含む組織の標本に対して明視野観察用染色を施して作製された標本の染色像を顕微鏡の明視野下で撮像した明視野画像に基づいて生成されていてもよい。 The training data used for learning the deep learning algorithm (60) is a stained image of a specimen prepared by performing bright field observation staining on a tissue specimen including a tumor region collected from an individual. It may be generated based on a bright field image captured under a visual field.
前記ニューラルネットワーク(50)の出力層(50b)がソフトマックス関数を活性化関数とするノードであってもよい。 The output layer (50b) of the neural network (50) may be a node whose activation function is a softmax function.
上記の課題を解決するために、本発明の一態様に係る画像解析装置(200)は、ニューラルネットワーク構造の深層学習アルゴリズム(60)を用いて、組織の画像を解析する画像解析装置であって、表示部(27)と、組織の種類に応じて生成された複数の深層学習アルゴリズム(60)から、解析対象の組織の種類に対応する前記深層学習アルゴリズム(60)を選択し、前記解析対象の組織を含む解析対象画像(78)から解析用データ(80)を生成し、前記解析用データ(80)を、選択された前記深層学習アルゴリズム(60)に入力し、前記解析用データ(80)が入力された前記深層学習アルゴリズム(60)から出力される解析結果に基づき、腫瘍領域とそれ以外の領域とを識別可能に前記解析対象の組織の画像を前記表示部(27)に表示する、制御部(20)を備える。 In order to solve the above problems, an image analysis device (200) according to one aspect of the present invention is an image analysis device that analyzes tissue images using a deep learning algorithm (60) having a neural network structure. , selects the deep learning algorithm (60) corresponding to the type of tissue to be analyzed from a plurality of deep learning algorithms (60) generated according to the type of tissue, and selects the deep learning algorithm (60) corresponding to the type of tissue to be analyzed. Analysis data (80) is generated from the analysis target image (78) including the tissue, the analysis data (80) is input to the selected deep learning algorithm (60), and the analysis data (80) is ), an image of the tissue to be analyzed is displayed on the display unit (27) in such a way that tumor regions and other regions can be distinguished from each other based on the analysis results output from the deep learning algorithm (60) into which , a control section (20).
前記画像解析装置(200)は、前記複数の深層学習アルゴリズム(60)を記憶する記憶部(23)をさらに備え、前記制御部(20)は、前記解析対象の組織の種類に対応する前記深層学習アルゴリズム(60)を、前記記憶部(23)に記憶された前記複数の深層学習アルゴリズム(60)から選択してもよい。 The image analysis device (200) further includes a storage unit (23) that stores the plurality of deep learning algorithms (60), and the control unit (20) is configured to store the deep learning algorithms (23) corresponding to the type of tissue to be analyzed. The learning algorithm (60) may be selected from the plurality of deep learning algorithms (60) stored in the storage unit (23).
前記記憶部(23)は、前記複数の深層学習アルゴリズム(60)のそれぞれを、組織の種類と対応付けて記憶してもよい。 The storage unit (23) may store each of the plurality of deep learning algorithms (60) in association with the type of tissue.
前記記憶部(23)は、前記複数の深層学習アルゴリズム(60)の少なくとも1つを、1つの組織の種類と対応付けて記憶してもよい。 The storage unit (23) may store at least one of the plurality of deep learning algorithms (60) in association with one tissue type.
前記画像解析装置(200)は、ユーザにより操作される入力部(26)をさらに備え、前記制御部(20)は、前記入力部(26)を介した操作に基づいて、前記解析対象の組織の種類に対応する前記深層学習アルゴリズム(60)を選択してもよい。 The image analysis device (200) further includes an input section (26) operated by a user, and the control section (20) controls the analysis target tissue based on the operation via the input section (26). The deep learning algorithm (60) corresponding to the type may be selected.
前記制御部(20)は、生成された前記解析用データに基づき、腫瘍領域とそれ以外の領域とを識別可能に表示するための描画処理を前記解析対象画像(78)に施してもよい。 The control unit (20) may perform a drawing process on the analysis target image (78) to display a tumor region and other regions in a distinguishable manner based on the generated analysis data.
前記描画処理は、前記腫瘍領域とそれ以外の領域とを異なる色で描画する処理を含んでもよい。 The drawing process may include a process of drawing the tumor area and other areas in different colors.
前記解析用データ(80)は、前記解析対象画像から切り出された画像に対応し、前記解析対象画像(78)から複数生成されてもよい。 The analysis data (80) corresponds to an image cut out from the analysis target image, and may be generated in plural from the analysis target image (78).
上記の課題を解決するために、本発明の一態様に係るコンピュータプログラムは、ニューラルネットワーク構造の深層学習アルゴリズム(60)を用いて、組織の画像を解析するコンピュータプログラムであって、コンピュータに、組織の種類に応じて生成された複数の深層学習アルゴリズム(60)から、解析対象の組織の種類に対応する前記深層学習アルゴリズム(60)を選択する処理と、前記解析対象の組織を含む解析対象画像(78)から解析用データ(80)を生成する処理と、前記解析用データ(80)を、選択された前記深層学習アルゴリズム(60)に入力する処理と、前記解析用データ(80)が入力された前記深層学習アルゴリズム(60)から出力される解析結果に基づき、腫瘍領域とそれ以外の領域とを識別可能に前記解析対象の組織の画像を表示する処理と、を実行させる。 In order to solve the above problems, a computer program according to one aspect of the present invention is a computer program that analyzes an image of a tissue using a deep learning algorithm (60) having a neural network structure. A process of selecting the deep learning algorithm (60) corresponding to the type of tissue to be analyzed from a plurality of deep learning algorithms (60) generated according to the type of the tissue, and an analysis target image including the tissue to be analyzed. (78) to generate analysis data (80); input the analysis data (80) into the selected deep learning algorithm (60); and input the analysis data (80). Based on the analysis result output from the deep learning algorithm (60), a process of displaying an image of the tissue to be analyzed in such a manner that a tumor region and other regions can be distinguished is executed.
標本に含まれる組織全体を観察し、その標本のどの部位に腫瘍組織が含まれるかスクリーニングするためのデータを生成することができる。 It is possible to observe the entire tissue contained in a specimen and generate data for screening which part of the specimen contains tumor tissue.
以下、本発明の概要および実施の形態を、添付の図面を参照して詳細に説明する。なお、以下の説明および図面において、同じ符号は同じまたは類似の構成要素を示すこととし、よって、同じまたは類似の構成要素に関する説明を省略する。 DESCRIPTION OF THE PREFERRED EMBODIMENTS An outline and embodiments of the present invention will be described in detail below with reference to the accompanying drawings. Note that in the following description and drawings, the same reference numerals indicate the same or similar components, and therefore, explanations regarding the same or similar components will be omitted.
画像解析方法は、組織の画像を解析する。前記画像解析方法は、ニューラルネットワーク構造の、好ましくは、畳み込みニューラルネットワーク構造の深層学習アルゴリズムを用いる。前記画像解析方法は、解析用データに含まれる領域が腫瘍領域であるか否かを示すデータを生成することを含む。 The image analysis method analyzes images of tissue. The image analysis method uses a deep learning algorithm of a neural network structure, preferably a convolutional neural network structure. The image analysis method includes generating data indicating whether a region included in the analysis data is a tumor region.
本発明において、組織または細胞の画像は、組織試料の標本または細胞を含む試料の標本から取得される画像である。組織試料の標本または細胞を含む試料の標本は、個体から採取される。個体は、特に制限されないが、好ましくは哺乳類であり、より好ましくはヒトである。前記個体から試料が採取される際に、個体が生きているか死亡しているかは問わない。前記組織は、個体内に存在するものである限り、制限されない。前記個体から採取された組織としては、外科的な切除組織、生検組織等を挙げることができる。前記腫瘍は上皮性および非上皮性のいずれであってもよい。前記腫瘍として好ましくは悪性上皮性腫瘍である。悪性腫瘍は、特に制限されないが、悪性腫瘍としては、例えば、気管、気管支又は肺等から発生する呼吸器系悪性腫瘍;上咽頭、食道、胃、十二指腸、空腸、回腸、盲腸、虫垂、上行結腸、横行結腸、S状結腸、直腸又は肛門部等から発生する消化管系悪性腫瘍;肝臓癌;膵臓癌;膀胱、尿管又は腎臓から発生する泌尿器系悪性腫瘍;卵巣、卵管および子宮等から発生する女性生殖器系悪性腫瘍;乳癌;前立腺癌;皮膚癌;視床下部、下垂体、甲状腺、副甲状腺、副腎等の内分泌系悪性腫瘍;中枢神経系悪性腫瘍;骨軟部組織から発生する悪性腫瘍等の固形腫瘍が挙げられる。より好ましくは、肺癌(扁平上皮癌、小細胞癌、大細胞癌、腺癌)等の呼吸器系上皮性悪性腫瘍;胃癌、十二指腸癌、大腸癌(S状結腸癌、直腸癌等)等の消化管系上皮性悪性腫瘍;肝臓癌;膵臓癌;膀胱癌;甲状腺癌;卵巣癌;乳癌;前立腺癌を挙げることができる。最も好ましくは、胃癌である。 In the present invention, an image of a tissue or a cell is an image obtained from a tissue sample specimen or a sample specimen containing cells. A specimen of a tissue sample or a specimen containing cells is taken from an individual. Although the individual is not particularly limited, it is preferably a mammal, more preferably a human. It does not matter whether the individual is alive or dead when the sample is taken from the individual. The tissue is not limited as long as it exists within an individual. Examples of the tissue collected from the individual include surgically excised tissue, biopsy tissue, and the like. The tumor may be either epithelial or non-epithelial. The tumor is preferably a malignant epithelial tumor. Although malignant tumors are not particularly limited, examples of malignant tumors include respiratory malignant tumors arising from the trachea, bronchi, or lungs; nasopharynx, esophagus, stomach, duodenum, jejunum, ileum, cecum, appendix, and ascending colon. , gastrointestinal malignant tumors arising from the transverse colon, sigmoid colon, rectum, or anus; liver cancer; pancreatic cancer; urinary system malignant tumors arising from the bladder, ureter, or kidney; ovaries, fallopian tubes, uterus, etc. Malignant tumors of the female reproductive system that occur; breast cancer; prostate cancer; skin cancer; malignant tumors of the endocrine system such as the hypothalamus, pituitary gland, thyroid, parathyroid gland, and adrenal gland; malignant tumors of the central nervous system; malignant tumors that arise from bone and soft tissue, etc. solid tumors. More preferably, respiratory epithelial malignant tumors such as lung cancer (squamous cell carcinoma, small cell carcinoma, large cell carcinoma, adenocarcinoma); gastric cancer, duodenal cancer, colorectal cancer (sigmoid colon cancer, rectal cancer, etc.), etc. Examples include gastrointestinal epithelial malignant tumors; liver cancer; pancreatic cancer; bladder cancer; thyroid cancer; ovarian cancer; breast cancer; and prostate cancer. Most preferred is gastric cancer.
前記標本は、前記組織を顕微鏡等で観察ができるように加工した状態のもの、例えばプレパラートを意図する。前記標本は、公知の方法に従って作製することができる。例えば、組織標本の場合には、前記個体から組織を採取した後に、所定の固定液(ホルマリン固定等)で組織を固定し、その固定組織をパラフィン包埋し、パラフィン包埋組織を薄切する。薄切切片をスライドグラスにのせる。切片がのったスライドグラスに対して光学顕微鏡での観察のため、すなわち明視野観察のための染色を施し、所定の封入処理をして標本が完成する。組織標本の典型例は、組織診断用標本(病理標本)であり、染色は、へマトキシリン・エオジン(HE)染色である。 The specimen is intended to be one in which the tissue has been processed so that it can be observed with a microscope, for example, a preparation. The specimen can be prepared according to a known method. For example, in the case of a tissue specimen, after collecting the tissue from the individual, the tissue is fixed with a predetermined fixative (formalin fixation, etc.), the fixed tissue is embedded in paraffin, and the paraffin-embedded tissue is sliced. . Place the thin section on a glass slide. The glass slide on which the section is mounted is stained for observation with an optical microscope, that is, for bright field observation, and the specimen is completed by a predetermined mounting process. A typical example of a tissue specimen is a specimen for tissue diagnosis (pathological specimen), and the staining is hematoxylin and eosin (HE) staining.
HE染色の核染色はヘマトキシリンである。ヘマトキシリンは、組織細胞染色において核染色剤として幅広く使用されている(例えば、免疫染色、レクチン染色、糖染色、脂肪染色、膠原線維染色等)。このため、本発明は、このようなヘマトキシリンを核染色に使う標本全般において、適用が可能である。 The nuclear stain for HE staining is hematoxylin. Hematoxylin is widely used as a nuclear stain in tissue cell staining (eg, immunostaining, lectin staining, sugar staining, fat staining, collagen fiber staining, etc.). Therefore, the present invention can be applied to all kinds of specimens in which hematoxylin is used for nuclear staining.
前記画像解析には、訓練用画像を用いて訓練された深層学習アルゴリズムを用いる。前記画像解析は、前記標本から取得した、解析対象の組織を含む解析対象画像から解析データを生成する。前記解析データを、前記深層学習アルゴリズムに入力し、前記解析対象画像内に存在する組織が解析用データに含まれる領域が腫瘍領域であるか否かを示すデータを生成する。解析用データに含まれる領域が腫瘍領域であるか否かを示すデータとは、判別対象にある組織に含まれる複数の注目画素を含む領域が、腫瘍組織を含む可能性および/または非腫瘍領域である可能性を示すデータである。解析用データに含まれる領域が腫瘍領域であるか否かを示すデータは、腫瘍領域を含むことと非腫瘍領域であることを区別できるラベル値、表示等であり得る。 The image analysis uses a deep learning algorithm trained using training images. The image analysis generates analysis data from an analysis target image that includes a tissue to be analyzed and is acquired from the specimen. The analysis data is input to the deep learning algorithm to generate data indicating whether or not a region in which the tissue present in the analysis target image is included in the analysis data is a tumor region. Data indicating whether or not a region included in the analysis data is a tumor region means that there is a possibility that the region including multiple pixels of interest included in the tissue to be determined contains tumor tissue and/or a non-tumor region. This is data indicating the possibility that The data indicating whether or not a region included in the analysis data is a tumor region may be a label value, a display, etc. that can distinguish whether a region includes a tumor region or a non-tumor region.
前記訓練用画像は、学習対象となる標本の複数の領域から取得される。好ましくは、前記訓練用画像は、学習対象となる組織に含まれる複数の層構造から層構造ごとに腫瘍領域を含む領域、非腫瘍領域を含む領域、および組織を含まない領域より取得される。 The training images are acquired from a plurality of regions of a sample to be studied. Preferably, the training images are acquired from a region including a tumor region, a region including a non-tumor region, and a region not including tissue for each layer structure from a plurality of layer structures included in the tissue to be learned.
例えば、第1の訓練用画像70R1は、個体から採取された組織に含まれる、腫瘍領域を含む領域から取得された画像である。この画像は、顕微鏡観察により、組織構造が認識できるように染色された標本から取得される。前記染色は、組織構造が認識できる限り制限されないが、好ましくは明視野観察用の染色である。前記明視野観察用染色は、少なくとも細胞核と細胞核以外の部位が、色相で区別可能に染色できる限り制限されない。前記標本が哺乳類の組織標本である場合には、例えば、HE染色を挙げることができる。 For example, the first training image 70R1 is an image acquired from a region including a tumor region included in tissue collected from an individual. This image is obtained by microscopic observation from a specimen that has been stained so that its tissue structure can be recognized. The staining is not limited as long as the tissue structure can be recognized, but staining for bright field observation is preferable. The staining for bright field observation is not limited as long as at least the cell nucleus and a region other than the cell nucleus can be stained in a distinguishable manner by hue. When the specimen is a mammalian tissue specimen, for example, HE staining can be used.
第1の訓練用画像70R1からは、第1の訓練データ74R1と、第1の予備訓練データ70R1Lが生成される。第1の訓練データ74R1は、第1の訓練用画像70R1に含まれる色相を原色毎に分離した単一色画像に関する情報である。第1の予備訓練データ70R1Lは、第1の訓練用画像70R1に含まれている組織の領域が、腫瘍領域を含むことを示す二値化データ(ラベル値)として生成される。第1の訓練用画像70R1に含まれる組織の領域が腫瘍領域を含むか否かは、例えば病理医等による標本観察により判定される。ここで、前記訓練用画像に含まれる組織の領域において、腫瘍細胞と、非腫瘍細胞と、細胞以外の組織の領域とが混在する場合がある。この場合、前記訓練用画像に含まれる組織の領域が、例えば前記訓練用画像に含まれる組織の領域全体の面積を100%とした際に、腫瘍細胞がその全体の面積の約10%以上、約20%以上、約30%以上、約40%以上、約50%以上、約60%以上、約70%以上、約80%以上、または約90%以上を占める場合に、腫瘍領域を含むと判定することができる。好ましくは、約40%以上、約50%以上、約60%以上、約70%以上、約80%以上、または約90%以上を占める場合に、腫瘍領域を含むと判定することができる。前記訓練用画像に含まれる組織の領域全体の面積(100%)から非腫瘍細胞および細胞以外の組織(非腫瘍領域)が占める割合を減じた値を前記腫瘍細胞が組織全体の面積を占める割合として決定してもよい。 First training data 74R1 and first preliminary training data 70R1L are generated from the first training image 70R1. The first training data 74R1 is information regarding a single color image in which the hues included in the first training image 70R1 are separated for each primary color. The first preliminary training data 70R1L is generated as binarized data (label value) indicating that the tissue region included in the first training image 70R1 includes a tumor region. Whether or not the tissue region included in the first training image 70R1 includes a tumor region is determined by, for example, specimen observation by a pathologist or the like. Here, in the tissue region included in the training image, tumor cells, non-tumor cells, and regions of tissue other than cells may coexist. In this case, the tissue region included in the training image is such that, for example, when the area of the entire tissue region included in the training image is 100%, tumor cells occupy approximately 10% or more of the total area; Includes a tumor region if it occupies about 20% or more, about 30% or more, about 40% or more, about 50% or more, about 60% or more, about 70% or more, about 80% or more, or about 90% or more can be determined. Preferably, it can be determined that a tumor region is included when it occupies about 40% or more, about 50% or more, about 60% or more, about 70% or more, about 80% or more, or about 90% or more. The ratio of the tumor cells to the total area of the tissue is calculated by subtracting the ratio of non-tumor cells and tissues other than cells (non-tumor area) from the area (100%) of the entire tissue region included in the training image. It may be determined as
前記訓練用画像に含まれる第2の訓練用画像70R2は、非腫瘍領域を含む組織の領域(好ましくは、非腫瘍細胞と細胞以外の組織の領域とを含む領域)から取得された画像である。この画像は、顕微鏡観察により、組織構造が認識できるように染色された標本から取得される。前記染色は、組織構造が認識できる限り制限されないが、好ましくは明視野観察用の染色である。前記明視野観察用染色は、少なくとも細胞核と細胞核以外の部位が、色相で区別可能に染色できる限り制限されない。前記標本が哺乳類の組織標本である場合には、例えば、HE染色を挙げることができる。前記染色は、第1の訓練用画像70R1を取得した標本と同じものであることが好ましい。 The second training image 70R2 included in the training images is an image acquired from a tissue region including a non-tumor region (preferably a region including non-tumor cells and a region of tissue other than cells). . This image is obtained by microscopic observation from a specimen that has been stained so that its tissue structure can be recognized. The staining is not limited as long as the tissue structure can be recognized, but staining for bright field observation is preferable. The staining for bright field observation is not limited as long as at least the cell nucleus and a region other than the cell nucleus can be stained in a distinguishable manner by hue. When the specimen is a mammalian tissue specimen, for example, HE staining can be used. Preferably, the staining is the same as that of the specimen from which the first training image 70R1 was obtained.
第2の訓練用画像70R2からは、第2の訓練データ74R2と、第2の予備訓練データ70R2Lが生成される。第2の訓練データ74R2は、第2の訓練用画像70R2に含まれる色相を原色毎に分離した単一色画像に関する情報である。第2の予備訓練データ70R2Lは、第2の訓練用画像70R2に含まれている組織の領域が、非腫瘍領域を含むことを示す二値化データ(ラベル値)である。第2の訓練用画像70R2に含まれる組織の領域が非腫瘍領域を含むか否かは、例えば病理医等による標本観察により判定される。ここで、前記訓練用画像に含まれる組織の領域において、腫瘍細胞と、非腫瘍細胞と、細胞以外の組織の領域が混在する場合がある。この場合、前記訓練用画像に含まれる組織の領域が、例えば前記訓練用画像に含まれる組織の領域全体の面積を100%とした際に、非腫瘍細胞と細胞以外の組織の領域(非腫瘍領域)とが組織全体の面積の約10%以上、約20%以上、約30%以上、約40%以上、約50%以上、約60%以上、約70%以上、約80%以上、約90%以上、または100%を占める場合に、非腫瘍領域を含むと判定することができる。好ましくは、約40%以上、約50%以上、約60%以上、約70%以上、約80%以上、約90%以上、または100%を占める場合に、非腫瘍領域を含むと判定することができる。前記第2の訓練用画像70R2に含まれる組織の領域全体の面積(100%)から腫瘍領域が占める割合を減じた値を前記非腫瘍細胞と細胞以外の組織の領域とが組織全体の面積を占める割合として決定してもよい。 Second training data 74R2 and second preliminary training data 70R2L are generated from the second training image 70R2. The second training data 74R2 is information regarding a single color image in which the hues included in the second training image 70R2 are separated for each primary color. The second preliminary training data 70R2L is binarized data (label value) indicating that the tissue region included in the second training image 70R2 includes a non-tumor region. Whether or not the tissue region included in the second training image 70R2 includes a non-tumor region is determined by, for example, specimen observation by a pathologist or the like. Here, in the tissue region included in the training image, tumor cells, non-tumor cells, and regions of tissue other than cells may coexist. In this case, the area of tissue included in the training image is defined as non-tumor cells and areas of tissue other than cells (non-tumor area) is about 10% or more, about 20% or more, about 30% or more, about 40% or more, about 50% or more, about 60% or more, about 70% or more, about 80% or more, about If it occupies 90% or more or 100%, it can be determined that a non-tumor area is included. Preferably, it is determined that a non-tumor region is included if it occupies about 40% or more, about 50% or more, about 60% or more, about 70% or more, about 80% or more, about 90% or more, or 100%. Can be done. The area of the entire tissue including the non-tumor cells and non-cell tissue is calculated by subtracting the proportion occupied by the tumor region from the area (100%) of the entire tissue region included in the second training image 70R2. It may also be determined as a percentage.
前記訓練用画像に含まれる第3の訓練用画像70R3は、第1の訓練用画像70R1、および/または第2の訓練用画像70R2を取得した標本における組織を含まない領域(非組織領域ともいう)から取得された画像である。 The third training image 70R3 included in the training images is an area that does not include tissue (also referred to as a non-tissue area) in the sample from which the first training image 70R1 and/or the second training image 70R2 was obtained. This is an image obtained from ).
第3訓練用画像からは、第3の訓練データ74R3と、第3の予備訓練データ70R3Lが生成される。第3の訓練データ74R3は、第3の訓練用画像70R3に含まれる色相を原色毎に分離した単一色画像に関する情報である。第3の予備訓練データ70R2Lは、第3の訓練用画像70R3に含まれている領域が、組織を含まない領域であることであることを示す二値化データ(ラベル値)である。第3の訓練用画像70R3に含まれる領域は、例えば病理医等による標本観察により判定される。ここで、前記訓練用画像には、組織の領域と背景(例えば、プレパラートのガラス部分)の領域とが混在する場合がある。この場合、前記訓練用画像に含まれる背景の領域が、例えば前記1枚の訓練用画像に含まれる領域全体の面積を100%とした際に、背景の領域が約90%以上、約91%以上、約92%以上、約93%以上、約94%以上、約95%以上、約96%以上、約97%以上、約98%以上、または約99%以上を占める場合、あるいは背景の領域が100%を占める場合に、組織を含まない領域であると判定することができる。好ましくは、背景の領域が約95%以上、約96%以上、約97%以上、約98%以上、または約99%以上を占める場合、あるいは背景の領域が100%を占める場合に、組織を含まない領域であると判定することができる。 Third training data 74R3 and third preliminary training data 70R3L are generated from the third training image. The third training data 74R3 is information regarding a single color image in which the hues included in the third training image 70R3 are separated for each primary color. The third preliminary training data 70R2L is binarized data (label value) indicating that the region included in the third training image 70R3 is a region that does not include tissue. The area included in the third training image 70R3 is determined by, for example, specimen observation by a pathologist or the like. Here, the training image may include a tissue region and a background region (for example, a glass portion of a slide). In this case, the background area included in the training image is about 90% or more, about 91%, for example, when the area of the entire area included in the one training image is 100%. or more than about 92%, about 93% or more, about 94% or more, about 95% or more, about 96% or more, about 97% or more, about 98% or more, or about 99% or more, or the background area occupies 100%, it can be determined that the area does not contain tissue. Preferably, the tissue is grown when the background area occupies about 95% or more, about 96% or more, about 97% or more, about 98% or more, or about 99% or more, or when the background area occupies 100%. It can be determined that the area does not include the above.
各訓練用画像は、訓練用の組織標本を、例えば5倍から20倍に拡大した画像として取得されることが好ましい。判別精度の点から、30倍以上、特に40倍以上に拡大した画像は、訓練用画像としては不向きである。 It is preferable that each training image is obtained as an image of a training tissue specimen enlarged, for example, from 5 times to 20 times. From the viewpoint of discrimination accuracy, images enlarged 30 times or more, particularly 40 times or more, are not suitable as training images.
第1の訓練データ74R1および第1の予備訓練データ70R1Lからは腫瘍領域訓練データが生成され、第2の訓練データ74R2および第2の予備訓練データ70R2Lからは非腫瘍領域訓練データが生成され、第3の訓練データ74R3および第3の予備訓練データ70R2Lからは非組織領域訓練データが生成される。腫瘍領域訓練データ、非腫瘍領域訓練データおよび非組織領域訓練データを併せて訓練データと呼ぶことがある。 Tumor region training data is generated from the first training data 74R1 and the first preliminary training data 70R1L, non-tumor region training data is generated from the second training data 74R2 and the second preliminary training data 70R2L, and the first training data 74R1 and the first preliminary training data 70R1L generate tumor region training data. Non-organized region training data is generated from the third training data 74R3 and the third preliminary training data 70R2L. Tumor region training data, non-tumor region training data, and non-tissue region training data may be collectively referred to as training data.
本発明の概要および実施の形態では、HE染色された組織標本を撮像した画像内に含まれる組織が腫瘍領域、非腫瘍領域および非組織領域を含むことを、深層学習アルゴリズムによって判別する場合を一例として説明する。 In the outline and embodiments of the present invention, an example will be described in which a deep learning algorithm is used to determine whether tissues included in an image obtained by capturing an HE-stained tissue specimen include a tumor region, a non-tumor region, and a non-tissue region. It will be explained as follows.
[深層学習方法および画像解析方法の概要]
はじめに、深層学習方法について説明する。
[Overview of deep learning methods and image analysis methods]
First, we will explain the deep learning method.
・深層学習方法の概要
図1を用いて、第1の訓練データ74R1、第1の予備訓練データ70R1Lおよび腫瘍領域訓練データ75R1の概要を説明する。図1には、スライドイメージスキャナにより取得した組織標本のホールスライドイメージ70W1を使ったニューラルネットワークへの訓練データの入力例を示す。ホールスライドイメージ70W1は明視野観察用染色としてHE染色を施して作製された標本を明視野で撮像した組織標本のスライドイメージを示す。ホールスライドイメージ70W2は、病理医によりホールスライドイメージ70W1において腫瘍領域を含む部分を病理医が実線で囲って指定した画像である。ホールスライドイメージ70W3は、ホールスライドイメージ70W2を訓練用画像として分割(例えば、512分割)した像を示す。ホールスライドイメージ70W3内の記号R1で示された四角枠で囲まれた領域は、図1に示す第1の訓練用画像70R1として使用する領域を示す。記号R2で示された四角枠で囲まれた領域は、図2に示す第2の訓練用画像70R2として使用する領域を示す。記号R3で示された四角枠で囲まれた領域は、図3に示す第3の訓練用画像70R3として使用する領域を示す。第1の訓練用画像70R1が腫瘍領域を含むこと、第2の訓練用画像70R2が非腫瘍領域を含むこと、および第3の訓練用画像70R3が組織を含まない領域であることは、それぞれの訓練画像を取得する前に判定していてもよく、それぞれの訓練画像を取得してから判定してもよい。
- Outline of deep learning method The outline of the first training data 74R1, the first preliminary training data 70R1L, and the tumor region training data 75R1 will be explained using FIG. FIG. 1 shows an example of inputting training data to a neural network using a whole slide image 70W1 of a tissue specimen obtained by a slide image scanner. The whole slide image 70W1 is a slide image of a tissue specimen obtained by imaging a specimen prepared by applying HE staining as a bright field observation stain in a bright field. The whole slide image 70W2 is an image in which the pathologist has designated a portion of the whole slide image 70W1 that includes the tumor region by surrounding it with a solid line. The whole slide image 70W3 is an image obtained by dividing the whole slide image 70W2 as a training image (for example, into 512 parts). An area surrounded by a rectangular frame indicated by the symbol R1 in the hole slide image 70W3 indicates an area used as the first training image 70R1 shown in FIG. 1. The area surrounded by a rectangular frame indicated by the symbol R2 indicates an area used as the second training image 70R2 shown in FIG. 2. The area surrounded by a rectangular frame indicated by symbol R3 indicates an area used as the third training image 70R3 shown in FIG. 3. The fact that the first training image 70R1 includes a tumor region, that the second training image 70R2 includes a non-tumor region, and that the third training image 70R3 is a region that does not include tissue means that each The determination may be made before acquiring the training images, or after acquiring each training image.
図1において、第1の訓練用画像70R1は、HE染色した標本を明視野観察下で例えばカラー画像として撮像しているため、第1の訓練用画像70R1には複数の色相が含まれる。 In FIG. 1, the first training image 70R1 is obtained by capturing an HE-stained specimen as a color image under bright-field observation, and therefore includes a plurality of hues.
第1の訓練用画像70R1は、例えば公知の光学顕微鏡、蛍光顕微鏡またはバーチャルスライドスキャナ等の画像取得装置を用いて、予め取得することができる。例示的には、本実施形態において画像取得装置から取得されるカラー撮像は、カラースペースがRGBの24ビットカラーであることが好ましい。RGBの24ビットカラーでは、赤色、緑色および青色のそれぞれの濃さ(色濃度)を、8ビット(256段階)の階調で表すことが好ましい。第1の訓練用画像70R1は、1以上の原色を含む画像であればよい。第1の訓練用画像70R1に対応して、第1の訓練データ74R1が生成される。 The first training image 70R1 can be acquired in advance using, for example, an image acquisition device such as a known optical microscope, fluorescence microscope, or virtual slide scanner. Illustratively, in the present embodiment, it is preferable that the color image acquired from the image acquisition device is a 24-bit color image with a color space of RGB. In 24-bit RGB color, it is preferable that the depth (color density) of each of red, green, and blue be represented by 8-bit (256 levels) gradations. The first training image 70R1 may be an image containing one or more primary colors. First training data 74R1 is generated corresponding to the first training image 70R1.
本発明において、色相は、例示的には、光の3原色の組み合わせ、または色の3原色の組み合わせで規定される。第1の訓練データ74R1は、第1の訓練用画像70R1から生成される、第1の訓練用画像70R1に現れる色相を個々の原色に分離して原色毎に生成し、その濃度に応じた符号で表されたデータである。図1では光の3原色である赤(R)、緑(G)、青(B)の原色毎に分離した単一色の濃淡で示された画像(以下、「単一色画像」ともいう)72R1R,72R1G,72R1Bを得る。 In the present invention, hue is illustratively defined by a combination of three primary colors of light or a combination of three primary colors of color. The first training data 74R1 is generated from the first training image 70R1 by separating the hue appearing in the first training image 70R1 into individual primary colors, and generating a code for each primary color according to the density. This is the data expressed as . In Figure 1, an image (hereinafter also referred to as a "single-color image") 72R1R is shown in shading of a single color separated for each of the three primary colors of light, red (R), green (G), and blue (B). , 72R1G and 72R1B are obtained.
単一色画像72R1R,72R1G,72R1B上の各画素について各色の色濃度を符号化し、画像全体をR、G、B毎の各画像について、画素毎の色濃度に対応した符号化図(以下、「色濃度符号化図」ともいう)72R1r,72R1g,72R1bを生成する。色濃度は、各色256段階を示す数値で符号化しても良い。また、色濃度は、各色256段階を示す数値に対して、さらに前処理を行って、各画素における色濃度を例えば、値0から値7の8段階で示す数字で符号化してもよい。図1に例示的に示すR、G、B各色の単一色画像から生成された色濃度符号化図72R1r,72R1g,72R1bは、説明の便宜上、各画素における色濃度を値0から値7の8段階の符号で表している。図1に示す色濃度符号化図72R1r,72R1g,72R1bから画素毎にR、G、Bの色濃度値が組み合わされた第1の訓練データ74R1が生成される。色濃度を示す符号は、本明細書において色濃度値ともいう。また、第1の訓練データ74R1として、色濃度符号化図に替えて、各画素に対応した色濃度値の行列を生成してもよい。 The color density of each color is encoded for each pixel on the single color images 72R1R, 72R1G, and 72R1B, and the entire image is converted into an encoding diagram (hereinafter referred to as " 72R1r, 72R1g, and 72R1b are generated. The color density may be encoded as a numerical value indicating 256 levels for each color. Furthermore, the color density may be further preprocessed on the numerical values indicating 256 levels of each color, and the color density at each pixel may be encoded by numbers indicating 8 levels from value 0 to value 7, for example. For convenience of explanation, the color density encoding diagrams 72R1r, 72R1g, and 72R1b generated from single-color images of R, G, and B shown as an example in FIG. It is expressed by a stage code. First training data 74R1 in which R, G, and B color density values are combined for each pixel is generated from the color density encoding diagrams 72R1r, 72R1g, and 72R1b shown in FIG. The code indicating color density is also referred to as color density value in this specification. Further, as the first training data 74R1, a matrix of color density values corresponding to each pixel may be generated instead of the color density encoded diagram.
図1において、第1の予備訓練データ70R1Lは、第1の訓練用画像70R1に含まれている組織が、腫瘍領域を含むことを示すデータである。例えば、第1の訓練用画像70R1は、全領域が病理医の判定により腫瘍領域であると判定されているため第1の訓練用画像70R1には、後述する所定の画素数の領域毎に腫瘍領域を含むことを示すラベル値として同じ数値、例えば「1」が付され、第1の予備訓練データ70R1Lとなる。 In FIG. 1, the first preliminary training data 70R1L is data indicating that the tissue included in the first training image 70R1 includes a tumor region. For example, in the first training image 70R1, since the entire region is determined to be a tumor region by a pathologist, the first training image 70R1 includes a tumor region for each region of a predetermined number of pixels, which will be described later. The same numerical value, for example, "1" is assigned as a label value indicating that the region is included, and the data becomes first preliminary training data 70R1L.
深層学習方法では、図1に示す第1の訓練データ74R1および第1の予備訓練データ70R1Lから腫瘍領域訓練データ75R1を生成する。そして、腫瘍領域訓練データ75R1の各画素の色濃度値データ76(第1の訓練データ74R1から得られる)を入力層50aとし、ラベル値77R1(第1の予備訓練データ70R1Lから得られる)を出力層50bとするニューラルネットワーク50に学習させる。 In the deep learning method, tumor region training data 75R1 is generated from first training data 74R1 and first preliminary training data 70R1L shown in FIG. Then, the color density value data 76 (obtained from the first training data 74R1) of each pixel of the tumor region training data 75R1 is used as the input layer 50a, and the label value 77R1 (obtained from the first preliminary training data 70R1L) is output. The neural network 50 serving as the layer 50b is caused to learn.
次に、図2を用いて、第2の訓練データ74R2、第2の予備訓練データ70R2Lおよび非腫瘍領域訓練データ75R2の概要を説明する。図2において、ホールスライドイメージ70W1、ホールスライドイメージ70W2、およびホールスライドイメージ70W3は図1と同様であるため、第2の訓練用画像70R2には、第1の訓練用画像70R1と同様に複数の色相が含まれる。 Next, an outline of the second training data 74R2, the second preliminary training data 70R2L, and the non-tumor region training data 75R2 will be explained using FIG. In FIG. 2, the whole slide image 70W1, the whole slide image 70W2, and the whole slide image 70W3 are the same as those in FIG. Contains hue.
第2の訓練用画像70R2は、腫瘍領域を含む組織に替えて非腫瘍領域含む組織を用いる以外は、第1の訓練用画像70R1と同様の方法で取得される。第2の訓練用画像70R2に対応して、第2の訓練データ74R2が生成される。 The second training image 70R2 is obtained in the same manner as the first training image 70R1, except that tissue including a non-tumor region is used instead of tissue including a tumor region. Second training data 74R2 is generated corresponding to the second training image 70R2.
第2の訓練データ74R2は、腫瘍領域を含む組織に替えて非腫瘍領域含む組織を用いる以外は、第1の訓練データ74R1と同様の方法で生成される。図2に示す色濃度符号化図72R2r,72R2g,72R2bから画素毎にR、G、Bの色濃度値が組み合わされた第2の訓練データ74R2が生成される。 The second training data 74R2 is generated in the same manner as the first training data 74R1, except that tissue including a non-tumor region is used instead of tissue including a tumor region. Second training data 74R2 in which R, G, and B color density values are combined for each pixel is generated from the color density encoding diagrams 72R2r, 72R2g, and 72R2b shown in FIG.
図2において、第2の予備訓練データ70R2Lは、第2の訓練用画像70R2が、非腫瘍領域を含むことを示すデータである。第2の訓練用画像70R2は全領域が病理医の判定により非腫瘍領域であると判定されているため、第2の訓練用画像70R2には、後述する所定の画素数の領域毎に非腫瘍領域を含むことを示すラベル値として同じ数値、例えば「2」が付され、第2の予備訓練データ70R2Lとなる。非腫瘍領域を含む領域であることを示すラベル値は、腫瘍領域を含む領域および組織を含まない領域を示すラベル値と区別できる限り制限されない。 In FIG. 2, the second preliminary training data 70R2L is data indicating that the second training image 70R2 includes a non-tumor region. Since the entire region of the second training image 70R2 is determined to be a non-tumor region by the pathologist, the second training image 70R2 includes non-tumor regions for each region of a predetermined number of pixels, which will be described later. The same numerical value, for example, "2" is assigned as a label value indicating that the area is included, and the data becomes second preliminary training data 70R2L. A label value indicating a region including a non-tumor region is not limited as long as it can be distinguished from a label value indicating a region including a tumor region and a region not including tissue.
深層学習方法では、図2に示す第2の訓練データ74R2および第2の予備訓練データ70R2Lから非腫瘍領域訓練データ75R2を生成する。そして、非腫瘍領域訓練データ75R2の各画素の色濃度値データ76(第2の訓練データ74R2から得られる)を入力層50aとし、ラベル値77R2(第2の予備訓練データ70R2Lから得られる)を出力層50bとするニューラルネットワーク50に学習させる。 In the deep learning method, non-tumor region training data 75R2 is generated from second training data 74R2 and second preliminary training data 70R2L shown in FIG. Then, the color density value data 76 (obtained from the second training data 74R2) of each pixel of the non-tumor region training data 75R2 is used as the input layer 50a, and the label value 77R2 (obtained from the second preliminary training data 70R2L) is set as the input layer 50a. The neural network 50 serving as the output layer 50b is made to learn.
次に、図3を用いて、第3の訓練データ74R3、第3の予備訓練データ70R3Lおよび非組織領域訓練データ75R3の概要を説明する。図3において、ホールスライドイメージ70W1、ホールスライドイメージ70W2、およびホールスライドイメージ70W3は図1と同様であるため、第3の訓練用画像70R3には、第1の訓練用画像70R1と同様に複数の色相が含まれる。 Next, an outline of the third training data 74R3, the third preliminary training data 70R3L, and the non-organized region training data 75R3 will be explained using FIG. In FIG. 3, the hole slide image 70W1, the hole slide image 70W2, and the hole slide image 70W3 are the same as in FIG. Contains hue.
第3の訓練用画像70R3は、腫瘍領域を含む領域に替えて組織を含まない領域を用いる以外は、第1の訓練用画像70R1と同様の方法で取得される。第3の訓練用画像70R3に対応して、第3の訓練データ74R3が生成される。 The third training image 70R3 is obtained in the same manner as the first training image 70R1, except that a region that does not include tissue is used instead of a region that includes a tumor region. Third training data 74R3 is generated corresponding to the third training image 70R3.
第3の訓練データ74R3は、腫瘍領域を含む領域に替えて組織を含まない領域を用いる以外は、第1の訓練データ74R1と同様の方法で生成される。図3に示す色濃度符号化図72R3r,72R3g,72R3bから画素毎にR、G、Bの色濃度値が組み合わされた第3の訓練データ74R3が生成される。 The third training data 74R3 is generated in the same manner as the first training data 74R1, except that a region containing no tissue is used instead of a region containing a tumor region. Third training data 74R3 in which R, G, and B color density values are combined for each pixel is generated from the color density encoding diagrams 72R3r, 72R3g, and 72R3b shown in FIG.
図3において、第3の予備訓練データ70R3Lは、第3の訓練用画像70R3に含まれている領域が、組織を含まない領域であることを示すデータである。第3の訓練用画像70R3は全領域が病理医の判定により非組織領域であると判定されているため、第3の訓練用画像70R3には、後述する所定の画素数の領域毎に組織を含まない領域であることを示すラベル値として同じ数値、例えば「0」が付され、第3の予備訓練データ70R3Lとなる。組織を含まない領域であることを示すラベル値は、腫瘍領域を含む領域および非腫瘍領域を含む領域を示す数値とは区別される。 In FIG. 3, the third preliminary training data 70R3L is data indicating that the region included in the third training image 70R3 is a region that does not include tissue. Since the entire region of the third training image 70R3 has been determined by the pathologist to be a non-tissue region, the third training image 70R3 includes tissues in each region of a predetermined number of pixels, which will be described later. The same numerical value, for example "0", is assigned as a label value indicating that the area is not included, and becomes third preliminary training data 70R3L. A label value indicating that the region does not contain tissue is distinguished from a numerical value indicating a region containing a tumor region and a region containing a non-tumor region.
深層学習方法では、図3に示す第3の訓練データ74R3および第3の予備訓練データ70R3Lから非組織領域訓練データ75R3を生成するそして、非組織領域訓練データ75R3の各画素の色濃度値データ76(第3の訓練データ74R3から得られる)を入力層50aとし、ラベル値77R3(第3の予備訓練データ70R3Lから得られる)を出力層50bとするニューラルネットワーク50に学習させる。 In the deep learning method, non-organized region training data 75R3 is generated from the third training data 74R3 and third preliminary training data 70R3L shown in FIG. (obtained from the third training data 74R3) as the input layer 50a, and the label value 77R3 (obtained from the third preliminary training data 70R3L) as the output layer 50b.
図4(a)、(b)を参照して、腫瘍領域訓練データ75R1の生成方法を説明する。図4(a)に示す第1の訓練データ74R1は、所定の画素数の腫瘍領域の色濃度符号化図72R1r,72R1g,72R1bのそれぞれの色濃度値を組み合わせたデータである。本明細書において、第1の訓練データ74R1の各画素の位置は、便宜上列を左からl1、l2・・・li、行を上からm1、m2・・・mjで表す。第1の訓練データ74R1は、図4(a)では、その画像サイズ(訓練データ1つあたりの大きさ)が説明の便宜のために簡素化されており、第1の訓練データ74R1が、縦方向9画素および横方向9画素の合計81画素を有する。すなわち、各画素の位置は、列を左からl1、l2・・・l9、行を上からm1、m2・・・m9で表す。図4(a)に示す3つの値が、各画素におけるR、G、B各色の色濃度値である。例示的には、3つの値は、左から、赤(R)、緑(G)および青(B)の順序で格納されている。第1の訓練データ74R1の各画素の色濃度値は便宜的に値0から値7の8段階で示されている。これは、画像の前処理の一例として、撮像された際に256段階で表されている各色の画像72R1R,72R1G,72R1Bの明るさを、8段階の色濃度値にそれぞれ変換する処理である。色濃度値は、例えば最も低い明るさ(RGBカラー256段階で表した時の輝度値が低い階調群)を色濃度値0とし、明るさの程度が高くなるに従い徐々に高い値を割り当ててゆき、最も高い明るさ(RGBカラー256段階で表した時の輝度値が高い階調群)を色濃度値7とする。 A method of generating the tumor region training data 75R1 will be described with reference to FIGS. 4(a) and 4(b). The first training data 74R1 shown in FIG. 4A is data that combines the color density values of the color density encoded diagrams 72R1r, 72R1g, and 72R1b of a tumor region with a predetermined number of pixels. In this specification, for convenience, the position of each pixel in the first training data 74R1 is expressed by l 1 , l 2 . . . l i in columns from the left, and m 1 , m 2 . . In FIG. 4A, the image size (size per training data) of the first training data 74R1 is simplified for convenience of explanation, and the first training data 74R1 is vertically It has a total of 81 pixels, 9 pixels in the direction and 9 pixels in the horizontal direction. That is, the position of each pixel is represented by columns l 1 , l 2 . . . l 9 from the left, and rows m 1 , m 2 . . . m 9 from the top. The three values shown in FIG. 4A are the color density values of R, G, and B in each pixel. Illustratively, the three values are stored in the order of red (R), green (G), and blue (B) from the left. The color density value of each pixel of the first training data 74R1 is shown in eight levels from value 0 to value 7 for convenience. This is an example of image preprocessing, in which the brightness of each color image 72R1R, 72R1G, 72R1B, which is expressed in 256 levels when captured, is converted into color density values in 8 levels. As for the color density value, for example, the lowest brightness (a gradation group with a low brightness value when expressed in 256 RGB color levels) is set to a color density value of 0, and gradually higher values are assigned as the degree of brightness increases. Then, the highest brightness (gradation group with a high brightness value when expressed in 256 RGB color levels) is set to a color density value of 7.
図1および図4(b)に示す腫瘍領域訓練データ75R1は、図4(a)に示す第1の訓練データ74R1を所定数の画素からなる領域(以下、「ウィンドウサイズ」と記載する)で切り出したデータに第1の予備訓練データ70R1Lのラベル値に対応するラベル値77R1を付したものである。ウィンドウサイズの腫瘍領域訓練データ75R1も、説明の便宜のために3×3画素(l1:l3,m1:m3)に簡素化して示すが、各画素の位置は、便宜上列を左からl1、l2・・・li、行を上からm1、m2・・・mjで表す。実際の好ましいウィンドウサイズは、例示的には125×125画素(i=125、j=125)、150×150画素(i=150、j=150)、166×166画素(i=166、j=166)、180×180画素(i=180、j=180)、200×200画素(i=200、j=200)、220×220画素(i=220、j=220)、250×250画素(i=250、j=250)程度が、学習効率の点から好ましい。より好ましくは、ウィンドウサイズは200×200画素程度である。ウィンドウサイズは、たとえば60μm×60μm以上500μm×500μm以下の範囲である。好ましくは、60μm×60μm、100μm×100μm、150μm×150μm、200μm×200μm、250μm×250μm、300μm×300μm、350μm×350μm、400μm×400μm、450μm×450μm、500μm×500μmである。より好ましくは、200μm×200μm~400μm×400μmである。例えば、図4(b)に示すように、第1の訓練データ74R1の左端から3×3画素のウィンドウW1(l1:l3,m1:m3)を設定し、第1の訓練データ74R1に対して左から右にウィンドウW1を移動させる。ウィンドウW1は(l1:l3,m1:m3)の腫瘍領域訓練データ75R1を切り出した後、第1の予備訓練データ70R1Lのラベル値に対応するラベル値77R1を腫瘍領域訓練データ75R1に付す。ウィンドウW1は点線で示す腫瘍領域訓練データ74R1の次のウィンドウ(l4:l6,m4:m6)に移動し、(l4:l6,m4:m6)をウィンドウサイズの腫瘍領域訓練データ75R1として切り出す。新たに切り出された腫瘍領域訓練データ75R1に第1の予備訓練データ70R1Lのラベル値に対応するラベル値77R1を付す。この操作を、繰り返し、複数のウィンドウサイズの腫瘍領域訓練データ75R1を第1の訓練データ74R1から切り出す。切り出したウィンドウサイズの腫瘍領域訓練データ75R1は第1の予備訓練データ70R1Lのラベル値に対応するラベル値77R1が付され図1に示すニューラルネットワーク50の学習に用いられる。 The tumor region training data 75R1 shown in FIGS. 1 and 4(b) is based on the first training data 74R1 shown in FIG. A label value 77R1 corresponding to the label value of the first preliminary training data 70R1L is attached to the cut-out data. The window-sized tumor region training data 75R1 is also shown simplified to 3×3 pixels (l 1 :l 3 , m 1 :m 3 ) for convenience of explanation, but the position of each pixel is shown with the column on the left for convenience. From l 1 , l 2 ... l i , the rows are represented by m 1 , m 2 ... m j from the top. Actual preferred window sizes are illustratively 125 x 125 pixels (i = 125, j = 125), 150 x 150 pixels (i = 150, j = 150), 166 x 166 pixels (i = 166, j = 166), 180 x 180 pixels (i = 180, j = 180), 200 x 200 pixels (i = 200, j = 200), 220 x 220 pixels (i = 220, j = 220), 250 x 250 pixels ( i=250, j=250) is preferable in terms of learning efficiency. More preferably, the window size is about 200×200 pixels. The window size is, for example, in a range of 60 μm×60 μm or more and 500 μm×500 μm or less. Preferably 60 μm x 60 μm, 100 μm x 100 μm, 150 μm x 150 μm, 200 μm x 200 μm, 250 μm x 300 μm, 300 μm x 300 μm, 350 μm x 350 μm, 400 μm x 400 μm, 450 μm x 450 μm x 450 μm. , 500 μm x 500 μm. More preferably, the size is 200 μm×200 μm to 400 μm×400 μm. For example, as shown in FIG. 4(b), a 3×3 pixel window W1 (l 1 :l 3 , m 1 :m 3 ) is set from the left end of the first training data 74R1, and the first training data The window W1 is moved from left to right with respect to 74R1. After cutting out the tumor region training data 75R1 of (l 1 :l 3 , m 1 :m 3 ) in the window W1, the label value 77R1 corresponding to the label value of the first preliminary training data 70R1L is added to the tumor region training data 75R1. attach The window W1 is moved to the next window (l 4 :l 6 ,m 4 :m 6 ) of the tumor region training data 74R1 shown by the dotted line, and the window size of (l 4 :l 6 ,m 4 :m 6 ) is changed to the tumor area of the window size. It is extracted as region training data 75R1. A label value 77R1 corresponding to the label value of the first preliminary training data 70R1L is attached to the newly extracted tumor region training data 75R1. This operation is repeated to cut out tumor region training data 75R1 of a plurality of window sizes from the first training data 74R1. The tumor region training data 75R1 of the cut out window size is given a label value 77R1 corresponding to the label value of the first preliminary training data 70R1L, and is used for learning of the neural network 50 shown in FIG. 1.
図1に示すように、ニューラルネットワーク50の入力層50aのノード数は、入力されるウィンドウサイズの腫瘍領域訓練データ75R1の画素数と画像に含まれる原色の数(例えば光の三原色であれば、R、G、Bの3つ)との積に対応している。ウィンドウサイズの腫瘍領域訓練データ75R1の各画素の色濃度値データ76をニューラルネットワークの入力層50aとし、第1の予備訓練データ70R1Lに対応するラベル値77R1をニューラルネットワークの出力層50bとして、ニューラルネットワーク50に学習させる。各画素の色濃度値データ76は、腫瘍領域訓練データ75R1の各画素のR、G、B各色の色濃度値の集合データである。例示として、ウィンドウサイズの腫瘍領域訓練データ75R1が3×3画素である場合には、各画素についてR、G、B毎に1つずつの色濃度値が与えられるので、色濃度値データ76の色濃度値数は「27」(3×3×3=27)となり、ニューラルネットワーク50の入力層50aのノード数も「27」となる。 As shown in FIG. 1, the number of nodes in the input layer 50a of the neural network 50 is determined by the number of pixels of the tumor region training data 75R1 of the input window size and the number of primary colors included in the image (for example, in the case of the three primary colors of light, R, G, and B). The color density value data 76 of each pixel of the window-sized tumor region training data 75R1 is used as the input layer 50a of the neural network, and the label value 77R1 corresponding to the first preliminary training data 70R1L is used as the output layer 50b of the neural network. 50 to learn. The color density value data 76 of each pixel is a collection of color density values of each color of R, G, and B of each pixel of the tumor region training data 75R1. As an example, if the window size tumor region training data 75R1 is 3 x 3 pixels, one color density value is given for each R, G, and B for each pixel, so the color density value data 76 is The number of color density values is "27" (3x3x3=27), and the number of nodes in the input layer 50a of the neural network 50 is also "27".
このように、ニューラルネットワーク50に入力するウィンドウサイズの腫瘍領域訓練データ75R1は、ユーザが作成することなく、コンピュータが自動的に作成することができる。これにより、ニューラルネットワーク50の効率的な深層学習が促進される。 In this way, the window-sized tumor region training data 75R1 to be input to the neural network 50 can be automatically created by the computer without being created by the user. This facilitates efficient deep learning of the neural network 50.
図4(b)に示すように、初期状態において、ウィンドウW1は、第1の訓練データ74R1の左上角に位置している。以後、ウィンドウW1によってウィンドウサイズの腫瘍領域訓練データ75R1を切り出し、ニューラルネットワーク50の学習を行う度に、ウィンドウW1の位置を移動させる。具体的には、ウィンドウW1が第1の訓練データ74R1の例えば全ての画素を走査するように、ウィンドウW1を移動させる。これにより、第1の訓練データ74R1の全ての画素から切り出されたウィンドウサイズの腫瘍領域訓練データ75R1が、ニューラルネットワーク50の学習に用いられる。よってニューラルネットワーク50の学習の程度を向上でき、深層学習の結果、図6に示すニューラルネットワーク60構造を有する深層学習アルゴリズムが得られる。 As shown in FIG. 4(b), in the initial state, the window W1 is located at the upper left corner of the first training data 74R1. Thereafter, the tumor region training data 75R1 of the window size is cut out using the window W1, and the position of the window W1 is moved every time the neural network 50 is trained. Specifically, the window W1 is moved so that the window W1 scans, for example, all pixels of the first training data 74R1. Thereby, the tumor region training data 75R1 of the window size cut out from all pixels of the first training data 74R1 is used for learning of the neural network 50. Therefore, the degree of learning of the neural network 50 can be improved, and as a result of deep learning, a deep learning algorithm having the structure of the neural network 60 shown in FIG. 6 can be obtained.
図5(a)には、第2の訓練データ74R2を示す。第2の訓練データ74R2から非腫瘍領域訓練データ75R2を生成する方法は、第1の訓練データ74R1および第1の予備訓練データ70R1Lに替えて、第2の訓練データ74R2および第2の予備訓練データ70R2Lを使用する点を除き、腫瘍領域訓練データ75R1と同様である。非腫瘍領域訓練データ75R2に付される第2の予備訓練データ70R2Lのラベル値に対応するラベル値77R2が、図2に示す出力層50bに入力される。 FIG. 5(a) shows second training data 74R2. The method of generating non-tumor region training data 75R2 from the second training data 74R2 is to replace the first training data 74R1 and the first preliminary training data 70R1L with the second training data 74R2 and the second preliminary training data. This is similar to the tumor region training data 75R1 except that 70R2L is used. A label value 77R2 corresponding to the label value of the second preliminary training data 70R2L attached to the non-tumor region training data 75R2 is input to the output layer 50b shown in FIG. 2.
図5(b)には、第3の訓練データ74R3を示す。第3の訓練データ74R3から非組織領域訓練データ75R3を生成する方法は、第1の訓練データ74R1および第1の予備訓練データ70R1Lに替えて、第3の訓練データ74R3および第3の予備訓練データ70R3Lを使用する点を除き、腫瘍領域訓練データ75R1と同様である。非組織領域訓練データ75R3に付される第3の予備訓練データ70R3Lのラベル値に対応するラベル値77R3が、図3に示す出力層50bに入力される。 FIG. 5(b) shows third training data 74R3. The method of generating the non-organized region training data 75R3 from the third training data 74R3 is to replace the first training data 74R1 and the first preliminary training data 70R1L with the third training data 74R3 and the third preliminary training data. This is similar to the tumor region training data 75R1 except that 70R3L is used. A label value 77R3 corresponding to the label value of the third preliminary training data 70R3L attached to the non-organized region training data 75R3 is input to the output layer 50b shown in FIG. 3.
各領域訓練データは、10枚以上、20枚以上、50枚以上、100枚以上の各領域の訓練用画像を使って生成することが好ましい。 It is preferable that each region training data is generated using 10 or more, 20 or more, 50 or more, or 100 or more training images of each region.
・画像解析方法の概要 図6に示すように、画像解析方法では、解析対象の組織を含む標本を撮像した解析対象画像(明視野画像)78から、解析用データ80を生成する。前記標本は、第1の訓練用画像と同じ染色が施されていることが好ましい。解析対象画像78も、例えば公知の顕微鏡またはバーチャルスライドスキャナ等を用いて、例えばカラー画像として取得することができる。解析対象画像78は、訓練用画像と同程度または同じ拡大倍率で取得されることが好ましい。解析対象画像(明視野画像)78は、1以上の原色を含む画像であればよい。カラーの解析対象画像78を、各画素についてR、G、B各色の色濃度値で符号化すると、画像全体をR、G、B毎に各画素における色濃度値の符号化図として表すことができる(解析用色濃度符号化図79r,79g,79b)。解析用色濃度符号化図79r,79g,79bから画素毎にR、G、Bの色濃度値が組み合わされた解析対象データ(図示せず)が生成される。図6に例示的に示すR、G、B各色の単一色画像における色濃度の符号を示す色濃度符号化図79r,79g,79bは、3原色の各画像79R,79G,79Bに代えて、値0から値7の8段階の符号で表された色濃度値を表示している。本明細書において、解析対象データの各画素の位置は、便宜上列を左からl1、l2・・・li、行を上からm1、m2・・・mjで表す。 - Outline of image analysis method As shown in FIG. 6, in the image analysis method, analysis data 80 is generated from an analysis target image (bright field image) 78 obtained by capturing a specimen including a tissue to be analyzed. Preferably, the specimen is stained with the same staining as the first training image. The image to be analyzed 78 can also be obtained as a color image using, for example, a known microscope or virtual slide scanner. It is preferable that the analysis target image 78 is acquired at the same degree or the same magnification as the training image. The image to be analyzed (bright field image) 78 may be any image containing one or more primary colors. When the color analysis target image 78 is encoded using the color density values of R, G, and B for each pixel, the entire image can be represented as an encoded diagram of the color density values of each pixel for each R, G, and B. (Analytical color density encoding diagrams 79r, 79g, 79b). Analysis target data (not shown) in which R, G, and B color density values are combined for each pixel is generated from the analytical color density coding diagrams 79r, 79g, and 79b. The color density coding diagrams 79r, 79g, and 79b showing the signs of color density in the single color images of each of R, G, and B, exemplarily shown in FIG. Color density values are displayed using codes in eight stages from value 0 to value 7. In this specification, for convenience, the position of each pixel of the data to be analyzed is represented by columns l 1 , l 2 . . . l i from the left, and rows m 1 , m 2 .
解析用データ80は、解析対象データを所定の画素数の領域(すなわち、上記各領域訓練データと同じウィンドウサイズ)で切り出したデータであり、解析対象画像78に含まれている組織の色濃度値を含むデータである。図6では、ウィンドウサイズの解析用データ80も、腫瘍領域訓練データ75R1、非腫瘍領域訓練データ75R2および非組織領域訓練データ75R3と同様に、説明の便宜のために3×3画素に簡素化して示すが、実際の好ましいウィンドウサイズは、腫瘍領域訓練データ75R1、非腫瘍領域訓練データ75R2および非組織領域訓練データ75R3と同様である。例えば、3×3画素のウィンドウW2を設定し、解析対象データに対してウィンドウW2を移動させる。ウィンドウW2は、解析対象データ中の所定数の画素を含んでおり、解析対象データを、各領域訓練データと同様の方法で例えば3×3画素の黒枠で示すウィンドウW2によって切り出すと、ウィンドウサイズの解析用データ80が得られる。各領域訓練データと同様の方法で、複数の解析用データ80が、解析対象データから、ウィンドウサイズに対応する所定の画素数の領域毎に生成される。解析対象データ、ウィンドウサイズの解析用データ80においても、腫瘍領域訓練データ75R1、非腫瘍領域訓練データ75R2および非組織領域訓練データ75R3と同様に、各画素について、色濃度値が赤(R)、緑(G)および青(B)の順序で格納されている。 The analysis data 80 is data obtained by cutting out the analysis target data into a region with a predetermined number of pixels (that is, the same window size as the training data for each region described above), and the color density value of the tissue included in the analysis target image 78. This is data that includes. In FIG. 6, window size analysis data 80 is also simplified to 3×3 pixels for convenience of explanation, similar to tumor region training data 75R1, non-tumor region training data 75R2, and non-tissue region training data 75R3. As shown, the actual preferred window size is similar to tumor region training data 75R1, non-tumor region training data 75R2, and non-tissue region training data 75R3. For example, a 3×3 pixel window W2 is set and the window W2 is moved relative to the data to be analyzed. The window W2 includes a predetermined number of pixels in the data to be analyzed, and if the data to be analyzed is cut out using the window W2 indicated by a black frame of, for example, 3 x 3 pixels in the same manner as the training data for each region, the window size is Analysis data 80 is obtained. A plurality of pieces of analysis data 80 are generated from the data to be analyzed for each area of a predetermined number of pixels corresponding to the window size in the same manner as the training data for each area. In the analysis target data and window size analysis data 80, the color density value of each pixel is red (R), similarly to the tumor region training data 75R1, non-tumor region training data 75R2, and non-tissue region training data 75R3. They are stored in the order of green (G) and blue (B).
画像解析方法では、図1から図3に示すウィンドウサイズの腫瘍領域訓練データ75R1、非腫瘍領域訓練データ75R2および非組織領域訓練データ75R3を用いて学習させたニューラルネットワークを有する深層学習アルゴリズム60を用いて、解析用データ80を処理する。解析用データ80を処理することによって、解析対象の組織における解析用データに含まれる領域が腫瘍領域であるか否かを示すデータ83を生成する。 The image analysis method uses a deep learning algorithm 60 having a neural network trained using tumor region training data 75R1, non-tumor region training data 75R2, and non-tissue region training data 75R3 with window sizes shown in FIGS. 1 to 3. Then, the analysis data 80 is processed. By processing the analysis data 80, data 83 indicating whether or not a region included in the analysis data in the tissue to be analyzed is a tumor region is generated.
再び図6を参照し、R、G、B各色の色濃度符号化図79r,79g,79bに基づき生成された解析対象データから切り出された解析用データ80が深層学習アルゴリズムを構成するニューラルネットワーク60に入力される。ニューラルネットワーク60の入力層60aのノード数は、入力される画素数と画像に含まれる原色の数との積に対応している。解析用データ80の各画素の色濃度値データ81を、ニューラルネットワーク60に入力すると、出力層60bからは、解析用データ80の推定値82(3値)が出力される。例えば推定値が1の場合は解析用データ80を構成する所定画素数の領域(画素領域)が腫瘍領域を含むことを示し、推定値が2の場合は前記画素領域が非腫瘍領域を含むことを示し、推定値が0の場合は前記画素領域が非組織領域であることを示す。すなわち、ニューラルネットワーク60の出力層60bから出力される推定値82は、解析対象画像の前記画素領域毎に生成されるラベル値であり、解析対象画像における解析用データに含まれる領域が腫瘍領域であるか否かを示すデータである。推定値82は、ニューラルネットワークに関する後述する説明ではクラスとも呼ばれる。ニューラルネットワーク60は、入力された解析用データ80に対し、解析用データ80に含まれる所定数の画素の色濃度値データ81に基づいて、腫瘍領域を含むことを示すラベル値、非腫瘍領域を含むことを示すラベル値、または非組織領域を示すラベル値を生成する。言い替えると、ニューラルネットワーク60は、解析用データ80を、解析対象画像に含まれる注目画素領域の状態(腫瘍化しているか、腫瘍化していないか、組織ではないか)を示すクラスに分類する。ここで、各画素の色濃度値データ81は、解析用データ80の各画素のR、G、B各色の色濃度値の集合データである。 Referring again to FIG. 6, the analysis data 80 cut out from the analysis target data generated based on the color density encoding diagrams 79r, 79g, and 79b for each of R, G, and B colors forms a neural network 60 that constitutes a deep learning algorithm. is input. The number of nodes in the input layer 60a of the neural network 60 corresponds to the product of the number of input pixels and the number of primary colors included in the image. When the color density value data 81 of each pixel of the analysis data 80 is input to the neural network 60, the estimated value 82 (ternary value) of the analysis data 80 is output from the output layer 60b. For example, an estimated value of 1 indicates that a region (pixel region) of a predetermined number of pixels constituting the analysis data 80 includes a tumor region, and an estimated value of 2 indicates that the pixel region includes a non-tumor region. , and when the estimated value is 0, it indicates that the pixel region is a non-tissue region. That is, the estimated value 82 outputted from the output layer 60b of the neural network 60 is a label value generated for each pixel region of the image to be analyzed, and the estimated value 82 is a label value generated for each pixel region of the image to be analyzed, and the region included in the analysis data in the image to be analyzed is a tumor region. This is data indicating whether or not there is. The estimated value 82 is also referred to as a class in the following description of the neural network. The neural network 60 assigns a label value indicating that a tumor region is included and a non-tumor region to the input analysis data 80 based on color density value data 81 of a predetermined number of pixels included in the analysis data 80. Generate a label value to indicate containment or a label value to indicate non-tissue region. In other words, the neural network 60 classifies the analysis data 80 into classes indicating the state of the pixel region of interest included in the analysis target image (tumor, non-tumor, tissue). Here, the color density value data 81 of each pixel is a collection of color density values of each of the R, G, and B colors of each pixel of the analysis data 80.
以後、ウィンドウW2が解析対象データの全ての画素を走査するように、ウィンドウW2を所定画素数の領域単位で移動させながら、解析用データ80をウィンドウサイズで切り出す。切り出された解析用データ80を、ニューラルネットワーク60に入力する。これにより、解析対象画像における組織の解析用データに含まれる領域が腫瘍領域であるか否かを示すデータに基づいて、ラベル値83を得る。図6に示す例では、ラベル値83についてさらに領域検出処理を行うことにより、領域を示す領域強調画像84を得る。領域検出処理は、具体的には、例えば推定値82に応じて各領域を検出する処理となり、実際に推定値82が「1」の画素領域を腫瘍領域と、推定値82が「2」の画素領域を非腫瘍領域と、推定値82が0の画素領域を非組織領域と判別する処理となる。領域強調画像84は、画像解析処理により検出された領域を、ラベル値83を色(腫瘍領域を白、非腫瘍領域をグレー、非組織領域を黒)で表した図である。また、各領域を判別した後に、腫瘍領域と、それ以外の領域(すなわち、非腫瘍領域および/又は非組織領域)とを識別可能に表示装置に表示させる処理を行ってもよい。例えば、腫瘍領域を色で塗りつぶす、腫瘍領域とそれ以外の領域との間に線を描画する等の処理を行い、これらを表示装置に識別可能に表示する。また、非腫瘍領域および/又は非組織領域についても識別可能に表示装置に表示させる処理を行ってもよい。 Thereafter, the analysis data 80 is cut out at the window size while moving the window W2 in units of a predetermined number of pixels so that the window W2 scans all pixels of the data to be analyzed. The extracted analysis data 80 is input to the neural network 60. As a result, a label value 83 is obtained based on data indicating whether the region included in the tissue analysis data in the image to be analyzed is a tumor region. In the example shown in FIG. 6, by further performing region detection processing on the label value 83, a region-enhanced image 84 indicating the region is obtained. Specifically, the area detection process is a process of detecting each area according to the estimated value 82, for example, and actually identifies a pixel area where the estimated value 82 is "1" as a tumor area, and a pixel area where the estimated value 82 is "2". This is a process for determining a pixel region as a non-tumor region and a pixel region for which the estimated value 82 is 0 as a non-tissue region. The region-enhanced image 84 is a diagram in which regions detected by the image analysis process are represented by label values 83 in colors (white for tumor regions, gray for non-tumor regions, and black for non-tissue regions). Further, after each region is discriminated, processing may be performed to display the tumor region and other regions (namely, non-tumor region and/or non-tissue region) on the display device in a distinguishable manner. For example, processing such as filling the tumor region with color or drawing lines between the tumor region and other regions is performed, and these are displayed on the display device in a distinguishable manner. Further, a process may be performed to display the non-tumor region and/or the non-tissue region in a distinguishable manner on the display device.
<第1の実施形態>
第1の実施形態では、上述の概要で説明した深層学習方法および画像解析方法を実施するシステムの構成について、具体的に説明する。
<First embodiment>
In the first embodiment, the configuration of a system that implements the deep learning method and image analysis method described in the above overview will be specifically described.
[構成の概要]
図7を参照すると、第1の実施形態に係る画像解析システムは、深層学習装置100Aと、画像解析装置200Aとを備える。ベンダ側装置100は深層学習装置100Aとして動作し、ユーザ側装置200は画像解析装置200Aとして動作する。深層学習装置100Aは、ニューラルネットワーク50に訓練データを使って学習させ、訓練データによって訓練された深層学習アルゴリズム60をユーザに提供する。学習済みのニューラルネットワーク60から構成される深層学習アルゴリズムは、記憶媒体98またはネットワーク99を通じて、深層学習装置100Aから画像解析装置200Aに提供される。画像解析装置200Aは、学習済みのニューラルネットワーク60から構成される深層学習アルゴリズムを用いて解析対象の画像の解析を行う。
[Configuration overview]
Referring to FIG. 7, the image analysis system according to the first embodiment includes a deep learning device 100A and an image analysis device 200A. The vendor device 100 operates as a deep learning device 100A, and the user device 200 operates as an image analysis device 200A. The deep learning device 100A causes the neural network 50 to learn using training data, and provides the user with a deep learning algorithm 60 trained using the training data. The deep learning algorithm composed of the trained neural network 60 is provided from the deep learning device 100A to the image analysis device 200A via the storage medium 98 or the network 99. The image analysis device 200A analyzes the image to be analyzed using a deep learning algorithm configured by the trained neural network 60.
深層学習装置100Aは、例えば汎用コンピュータで構成されており、後述するフローチャートに基づいて、深層学習処理を行う。画像解析装置200Aは、例えば汎用コンピュータで構成されており、後述するフローチャートに基づいて、画像解析処理を行う。記憶媒体98は、例えばDVD-ROMやUSBメモリ等の、コンピュータ読み取り可能であって非一時的な有形の記憶媒体である。 The deep learning device 100A is composed of, for example, a general-purpose computer, and performs deep learning processing based on a flowchart described later. The image analysis device 200A is composed of, for example, a general-purpose computer, and performs image analysis processing based on a flowchart described later. The storage medium 98 is a computer-readable non-transitory tangible storage medium such as a DVD-ROM or a USB memory.
深層学習装置100Aは撮像装置300に接続されている。撮像装置300は、撮像素子301と、蛍光顕微鏡302とを備え、ステージ309上にセットされた学習用の標本308の、明視野画像および蛍光画像を撮像する。学習用の標本308は、上述の染色が施されている。深層学習装置100Aは、撮像装置300によって撮像された訓練用画像を取得する。 The deep learning device 100A is connected to the imaging device 300. The imaging device 300 includes an imaging element 301 and a fluorescence microscope 302, and captures a bright field image and a fluorescence image of a learning specimen 308 set on a stage 309. The learning specimen 308 is stained as described above. The deep learning device 100A acquires training images captured by the imaging device 300.
画像解析装置200Aは撮像装置400に接続されている。撮像装置400は、撮像素子401と、蛍光顕微鏡402とを備え、ステージ409上にセットされた解析対象の標本408の、明視野画像を撮像する。解析対象の標本408は、上述の通り予め染色されている。画像解析装置200Aは、撮像装置400によって撮像された解析対象画像78を取得する。 Image analysis device 200A is connected to imaging device 400. The imaging device 400 includes an imaging device 401 and a fluorescence microscope 402, and captures a bright field image of a specimen 408 to be analyzed set on a stage 409. The specimen 408 to be analyzed has been stained in advance as described above. The image analysis device 200A acquires an analysis target image 78 captured by the imaging device 400.
撮像装置300,400には、標本を撮像する機能を有する、公知の蛍光顕微鏡またはバーチャルスライドスキャナ等を用いることができる。撮像装置400は、標本を撮像する機能を有する限り、光学顕微鏡であっても良い。 As the imaging devices 300 and 400, a known fluorescence microscope, virtual slide scanner, or the like, which has a function of imaging a specimen, can be used. The imaging device 400 may be an optical microscope as long as it has the function of imaging a specimen.
[ハードウェア構成]
図8を参照すると、ベンダ側装置100(100A,100B)は、処理部10(10A,10B)と、入力部16と、出力部17とを備える。
[Hardware configuration]
Referring to FIG. 8, the vendor device 100 (100A, 100B) includes a processing section 10 (10A, 10B), an input section 16, and an output section 17.
処理部10は、後述するデータ処理を行うCPU(Central Processing Unit)11と、データ処理の作業領域に使用するメモリ12と、後述するプログラムおよび処理データを記憶する記憶部13と、各部の間でデータを伝送するバス14と、外部機器とのデータの入出力を行うインタフェース部15と、GPU(Graphics Processing Unit)19とを備えている。入力部16および出力部17は、処理部10に接続されている。例示的には、入力部16はキーボードまたはマウス等の入力装置であり、出力部17は液晶ディスプレイ等の表示装置である。GPU19は、CPU11が行う演算処理(例えば、並列演算処理)を補助するアクセラレータとして機能する。すなわち以下の説明においてCPU11が行う処理とは、CPU11がGPU19をアクセラレータとして用いて行う処理も含むことを意味する。 The processing unit 10 includes a CPU (Central Processing Unit) 11 that performs data processing, which will be described later, a memory 12 that is used as a work area for data processing, and a storage unit 13 that stores programs and processing data that will be described later. It includes a bus 14 for transmitting data, an interface section 15 for inputting and outputting data to and from external devices, and a GPU (Graphics Processing Unit) 19. The input section 16 and the output section 17 are connected to the processing section 10. Illustratively, the input unit 16 is an input device such as a keyboard or a mouse, and the output unit 17 is a display device such as a liquid crystal display. The GPU 19 functions as an accelerator that assists the arithmetic processing (for example, parallel arithmetic processing) performed by the CPU 11. That is, in the following description, the processing performed by the CPU 11 includes the processing performed by the CPU 11 using the GPU 19 as an accelerator.
また、処理部10は、以下の図10で説明する各ステップの処理を行うために、本発明に係るプログラムおよび学習前のニューラルネットワーク50を、例えば実行形式で記憶部13に予め記憶している。実行形式は、例えばプログラミング言語からコンパイラにより変換されて生成される形式である。処理部10は、記憶部13に記憶したプログラムおよび学習前のニューラルネットワーク50を使用して処理を行う。 Further, the processing unit 10 stores in advance the program according to the present invention and the pre-learning neural network 50 in the storage unit 13 in an executable format, for example, in order to process each step described in FIG. 10 below. . The executable format is, for example, a format generated by converting a programming language with a compiler. The processing unit 10 performs processing using the program stored in the storage unit 13 and the pre-learning neural network 50.
以下の説明においては、特に断らない限り、処理部10が行う処理は、記憶部13またはメモリ12に格納されたプログラムおよびニューラルネットワーク50に基づいて、CPU11が行う処理を意味する。CPU11はメモリ12を作業領域として必要なデータ(処理途中の中間データ等)を一時記憶し、記憶部13に演算結果等の長期保存するデータを適宜記憶する。 In the following description, unless otherwise specified, the processing performed by the processing unit 10 means the processing performed by the CPU 11 based on the program stored in the storage unit 13 or the memory 12 and the neural network 50. The CPU 11 uses the memory 12 as a work area to temporarily store necessary data (intermediate data during processing, etc.), and appropriately stores long-term storage data such as calculation results in the storage unit 13.
図9を参照すると、ユーザ側装置200(200A,200B,200C)は、処理部20(20A,20B,20C)と、入力部26と、出力部27とを備える。 Referring to FIG. 9, the user device 200 (200A, 200B, 200C) includes a processing section 20 (20A, 20B, 20C), an input section 26, and an output section 27.
処理部20は、後述するデータ処理を行うCPU(Central Processing Unit)21と、データ処理の作業領域に使用するメモリ22と、後述するプログラムおよび処理データを記憶する記憶部23と、各部の間でデータを伝送するバス24と、外部機器とのデータの入出力を行うインタフェース部25と、GPU(Graphics Processing Unit)29とを備えている。入力部26および出力部27は、処理部20に接続されている。例示的には、入力部26はキーボードまたはマウス等の入力装置であり、出力部27は液晶ディスプレイ等の表示装置である。GPU29は、CPU21が行う演算処理(例えば、並列演算処理)を補助するアクセラレータとして機能する。すなわち以下の説明においてCPU21が行う処理とは、CPU21がGPU29をアクセラレータとして用いて行う処理も含むことを意味する。 The processing unit 20 includes a CPU (Central Processing Unit) 21 that performs data processing, which will be described later, a memory 22, which is used as a work area for data processing, and a storage unit 23, which stores programs and processing data, which will be described later. It includes a bus 24 for transmitting data, an interface section 25 for inputting and outputting data to and from external devices, and a GPU (Graphics Processing Unit) 29. The input section 26 and the output section 27 are connected to the processing section 20. Illustratively, the input unit 26 is an input device such as a keyboard or a mouse, and the output unit 27 is a display device such as a liquid crystal display. The GPU 29 functions as an accelerator that assists the arithmetic processing (for example, parallel arithmetic processing) performed by the CPU 21. That is, in the following description, the processing performed by the CPU 21 includes the processing performed by the CPU 21 using the GPU 29 as an accelerator.
また、処理部20は、以下の図14で説明する各ステップの処理を行うために、本発明に係るプログラムおよび学習済みのニューラルネットワーク構造の深層学習アルゴリズム60を、例えば実行形式で記憶部23に予め記憶している。実行形式は、例えばプログラミング言語からコンパイラにより変換されて生成される形式である。処理部20は、記憶部23に記憶したプログラムおよび深層学習アルゴリズム60を使用して処理を行う。 Further, the processing unit 20 stores the program according to the present invention and the deep learning algorithm 60 of the learned neural network structure in the storage unit 23 in an executable format, for example, in order to process each step described in FIG. 14 below. I remember it in advance. The executable format is, for example, a format generated by converting a programming language with a compiler. The processing unit 20 performs processing using the program stored in the storage unit 23 and the deep learning algorithm 60.
以下の説明においては、特に断らない限り、処理部20が行う処理は、記憶部23またはメモリ22に格納されたプログラムおよび深層学習アルゴリズム60に基づいて、実際には処理部20のCPU21が行う処理を意味する。CPU21はメモリ22を作業領域として必要なデータ(処理途中の中間データ等)を一時記憶し、記憶部23に演算結果等の長期保存するデータを適宜記憶する。 In the following description, unless otherwise specified, the processing performed by the processing unit 20 is actually the processing performed by the CPU 21 of the processing unit 20 based on the program and deep learning algorithm 60 stored in the storage unit 23 or memory 22. means. The CPU 21 uses the memory 22 as a work area to temporarily store necessary data (intermediate data during processing, etc.), and appropriately stores long-term storage data such as calculation results in the storage unit 23.
[機能ブロックおよび処理手順]
・深層学習処理
図10を参照すると、第1の実施形態に係る深層学習装置100Aの処理部10Aは、訓練データ生成部101と、訓練データ入力部102と、アルゴリズム更新部103とを備える。これらの機能ブロックは、コンピュータに深層学習処理を実行させるプログラムを、処理部10Aの記憶部13またはメモリ12にインストールし、このプログラムをCPU11が実行することにより実現される。ウィンドウサイズデータベース104と、アルゴリズムデータベース105とは、処理部10Aの記憶部13またはメモリ12に記憶される。
[Functional blocks and processing procedures]
- Deep Learning Processing Referring to FIG. 10, the processing unit 10A of the deep learning device 100A according to the first embodiment includes a training data generation unit 101, a training data input unit 102, and an algorithm update unit 103. These functional blocks are realized by installing a program that causes a computer to execute deep learning processing in the storage unit 13 or memory 12 of the processing unit 10A, and having the CPU 11 execute this program. The window size database 104 and the algorithm database 105 are stored in the storage unit 13 or memory 12 of the processing unit 10A.
学習用の標本の第1の訓練用画像70R1、第2の訓練用画像70R2、第3の訓練用画像70R3は、撮像装置300によって予め撮像され、処理部10Aの記憶部13またはメモリ12に予め記憶されていることとする。ニューラルネットワーク50は、例えば解析対象の標本が由来する組織の種別(例えば組織名)と対応付けられて、アルゴリズムデータベース105に予め格納されている。 The first training image 70R1, second training image 70R2, and third training image 70R3 of the learning sample are captured in advance by the imaging device 300 and stored in the storage unit 13 or memory 12 of the processing unit 10A in advance. It is assumed that it is remembered. The neural network 50 is stored in advance in the algorithm database 105 in association with, for example, the type of tissue (eg, tissue name) from which the sample to be analyzed comes from.
深層学習装置100Aの処理部10Aは、図11に示す処理を行う。図10に示す各機能ブロックを用いて説明すると、ステップS10からS12、S17およびS18の処理は、訓練データ生成部101が行う。ステップS14の処理は、訓練データ入力部102が行う。ステップS15およびS16の処理は、アルゴリズム更新部103が行う。 The processing unit 10A of the deep learning device 100A performs the processing shown in FIG. 11. Explaining using each functional block shown in FIG. 10, the training data generation unit 101 performs the processing from steps S10 to S12, S17, and S18. The process of step S14 is performed by the training data input unit 102. The processing in steps S15 and S16 is performed by the algorithm updating unit 103.
以下に説明するステップS10からS18では、第1の訓練用画像70R1と、第2の訓練用画像70R2と、第3の訓練用画像70R3とを用いた深層学習処理を説明する。 In steps S10 to S18 described below, deep learning processing using the first training image 70R1, the second training image 70R2, and the third training image 70R3 will be described.
処理部10Aは、深層学習方法の概要に記載の方法に準じて、腫瘍領域訓練データ75R1、非腫瘍領域訓練データ75R2および非組織領域訓練データ75R3を生成するための深層学習処理を行う。処理部10Aは、例えば、病理医等による入力部16からの操作により、第1の訓練用画像70R1の領域を含む広い領域の画像(ホールスライドイメージ70W1)を、出力部17に表示する。判定を行う病理医等は、出力部17に表示されたホールスライドイメージ70W1の画像を目視で確認する。病理医等は、腫瘍領域を含むと判定したホールスライドイメージ70W1中の領域を、例えば入力部16を介して指定し、ホールスライドイメージ70W1に例えば赤色等の実線で囲む。病理医等は、非腫瘍領域および非組織領域についても、同様に、ホールスライドイメージ70W1中の領域について、例えば赤色とは異なる青色、緑色等の実線で囲む。処理部10Aは、ホールスライドイメージ70W1を出力部17に表示して病理医により判断してもらうことに代えて、判定済みのホールスライドイメージ70W2を、I/F部15を介して例えばネットワーク99を介して取得してもよい。病理医等は、訓練用画像として好ましい画素にホールスライドイメージ70W2を分割してもよい。 The processing unit 10A performs deep learning processing to generate tumor region training data 75R1, non-tumor region training data 75R2, and non-tissue region training data 75R3 according to the method described in the overview of deep learning methods. The processing unit 10A displays, on the output unit 17, an image of a wide area (whole slide image 70W1) including the area of the first training image 70R1, based on an operation from the input unit 16 by a pathologist or the like, for example. A pathologist or the like who makes the determination visually confirms the whole slide image 70W1 displayed on the output unit 17. The pathologist or the like specifies, for example, via the input unit 16, an area in the whole slide image 70W1 that has been determined to include a tumor area, and surrounds the area in the whole slide image 70W1 with a solid line of, for example, red. Similarly, the pathologist and the like surround non-tumor areas and non-tissue areas in the whole slide image 70W1 with solid lines in blue, green, etc., which are different from red, for example. Instead of displaying the whole slide image 70W1 on the output unit 17 for judgment by a pathologist, the processing unit 10A displays the judged whole slide image 70W2 via the I/F unit 15, for example, on the network 99. It may also be obtained via A pathologist or the like may divide the whole slide image 70W2 into pixels preferable as a training image.
処理部10Aは、病理医等の入力部16からの指定により、ホールスライドイメージ70W2中に赤色の実線で囲まれている領域から取得された第1の訓練用画像70R1を所定の画素数を含むように切り出す。同様に、非腫瘍領域および非組織領域と判定された部分からも、第2の訓練用画像70R2、第3の訓練用画像70R3のそれぞれを、所定の画素の領域を含むように切り出す。 The processing unit 10A, based on the designation from the input unit 16 of a pathologist or the like, converts the first training image 70R1 acquired from the area surrounded by the solid red line in the whole slide image 70W2 to include a predetermined number of pixels. Cut it out like this. Similarly, the second training image 70R2 and the third training image 70R3 are each cut out from the portion determined to be a non-tumor region and a non-tissue region so as to include a predetermined pixel region.
ステップS10において、処理部10Aは、切り出された第1の訓練用画像70R1からR、G、B各色の色濃度符号化図72R1r,72R1g,72R1bを生成する。色濃度符号化図72R1r,72R1g,72R1bは、第1の訓練用画像70R1の各画素のR、G、B各色の色濃度値を段階的に表す符号を各画素に付すことにより生成する。本実施形態では、色濃度値を値0から値255の256階調で表すとして各R、G、B階調画像について色濃度符号化図72R1r,72R1g,72R1bを生成する。色濃度値の割り当ては、例えば最も低い明るさを色濃度値0とし、明るさの程度が高くなるに従い徐々に高い値を割り当ててゆき、最も高い明るさを色濃度値255とする。処理部10Aは、色濃度符号化図72R1r,72R1g,72R1bから画素毎にR、G,Bの色濃度値を付した第1の訓練データ74R1を生成する。処理部10Aは、第1の訓練用画像70R1の各画素に腫瘍領域であることを示すラベル値である「1」を対応させた第1の予備訓練データ70R1Lを生成する。 In step S10, the processing unit 10A generates color density encoded diagrams 72R1r, 72R1g, and 72R1b for each of R, G, and B colors from the extracted first training image 70R1. The color density encoding diagrams 72R1r, 72R1g, and 72R1b are generated by attaching codes to each pixel that stepwise represent the color density values of R, G, and B of each pixel of the first training image 70R1. In this embodiment, color density encoded diagrams 72R1r, 72R1g, and 72R1b are generated for each R, G, and B gradation image, assuming that color density values are represented by 256 gradations from value 0 to value 255. As for the assignment of color density values, for example, the lowest brightness is assigned a color density value of 0, and as the level of brightness increases, gradually higher values are assigned, and the highest brightness is assigned a color density value of 255. The processing unit 10A generates first training data 74R1 in which R, G, and B color density values are attached to each pixel from the color density encoded diagrams 72R1r, 72R1g, and 72R1b. The processing unit 10A generates first preliminary training data 70R1L in which each pixel of the first training image 70R1 is associated with a label value "1" indicating a tumor region.
ステップS11において、処理部10Aは、第2の訓練用画像70R2からステップS10と同様の方法により第2の訓練データ74R2を生成する。処理部10Aは、第2の訓練用画像70R2の各画素に非腫瘍領域であることを示すラベル値である「2」を対応させた第2の予備訓練データ70R2Lを生成する。 In step S11, the processing unit 10A generates second training data 74R2 from the second training image 70R2 using a method similar to step S10. The processing unit 10A generates second preliminary training data 70R2L in which each pixel of the second training image 70R2 is associated with a label value "2" indicating that it is a non-tumor region.
ステップS12において、処理部10Aは、第3の訓練用画像70R3からステップS10と同様の方法により第3の訓練データ74R3を生成する。処理部10Aは、第3の訓練用画像70R3の各画素に非組織領域であることを示すラベル値である「0」を対応させた第3の予備訓練データ70R3Lを生成する。 In step S12, the processing unit 10A generates third training data 74R3 from the third training image 70R3 using the same method as in step S10. The processing unit 10A generates third preliminary training data 70R3L in which each pixel of the third training image 70R3 is associated with a label value "0" indicating that it is a non-tissue region.
ステップS10からステップS12は同時に行ってもよく、順不同であってもよい。 Steps S10 to S12 may be performed simultaneously or in random order.
ステップS13において、処理部10Aは、入力部16を通じて、深層学習装置100A側のユーザからの、学習用の組織の種別の入力を受け付ける。処理部10Aは、入力された組織の種別に基づき、ウィンドウサイズデータベース104(ウィンドウサイズDB104)を参照して、ウィンドウサイズを設定し、アルゴリズムデータベース105(アルゴリズムDB105)を参照して、学習に用いるニューラルネットワーク50を設定する。ウィンドウサイズは例えば200×200画素とする。ウィンドウサイズは、1回の入力時にニューラルネットワーク50に入力する訓練データの単位であり、ウィンドウサイズの各領域に対応する訓練データの画素数と画像に含まれる色の原色の数との積が、入力層50aのノード数に対応している。ウィンドウサイズは組織の種別と対応付けられて、ウィンドウサイズデータベース104内に予め記憶されている。 In step S13, the processing unit 10A receives an input of the type of organization for learning from the user of the deep learning device 100A through the input unit 16. Based on the input tissue type, the processing unit 10A refers to the window size database 104 (window size DB 104) to set the window size, refers to the algorithm database 105 (algorithm DB 105), and sets the neural Set up the network 50. The window size is, for example, 200×200 pixels. The window size is a unit of training data input to the neural network 50 at one time of input, and the product of the number of pixels of the training data corresponding to each region of the window size and the number of primary colors included in the image is: This corresponds to the number of nodes in the input layer 50a. The window size is stored in advance in the window size database 104 in association with the type of organization.
ステップS14において、処理部10Aは、各領域に対応する訓練データから、ウィンドウサイズの腫瘍領域訓練データ75R1、非腫瘍領域訓練データ75R2および非組織領域訓練データ75R3を生成する。具体的には、上述の「深層学習方法の概要」において、図4(a)、(b)を参照して説明したように、第1の訓練データ74R1および第1の予備訓練データ70R1Lから、ウィンドウW1によってウィンドウサイズの腫瘍領域訓練データ75R1を作成する。処理部10Aは、第2の訓練データ74R2および第2の予備訓練データ70R2Lから、ウィンドウサイズの非腫瘍領域訓練データ75R2を生成する。具体的には、上述の「深層学習方法の概要」において、図4(a)、(b)および図5(a)を参照して説明したように、第2の訓練データ74R2および第2の予備訓練データ70R2Lから、ウィンドウW1によってウィンドウサイズの非腫瘍領域訓練データ75R2を作成する。処理部10Aは、第3の訓練データ74R3および第3の予備訓練データ70R3Lから、ウィンドウサイズの非組織領域訓練データ75R3を生成する。具体的には、上述の「深層学習方法の概要」において、図4(a)、(b)および図5(b)を参照して説明したように、第3の訓練データ74R3および第3の予備訓練データ70R3Lから、ウィンドウW1によってウィンドウサイズの非組織領域訓練データ75R3を作成する。 In step S14, the processing unit 10A generates window-sized tumor region training data 75R1, non-tumor region training data 75R2, and non-tissue region training data 75R3 from the training data corresponding to each region. Specifically, as explained in the above-mentioned "Overview of deep learning method" with reference to FIGS. 4(a) and 4(b), from the first training data 74R1 and the first preliminary training data 70R1L, Tumor region training data 75R1 of window size is created using window W1. The processing unit 10A generates window-sized non-tumor region training data 75R2 from the second training data 74R2 and the second preliminary training data 70R2L. Specifically, as explained in the above-mentioned "Outline of deep learning method" with reference to FIGS. 4(a), (b), and FIG. 5(a), the second training data 74R2 and the second From the preliminary training data 70R2L, non-tumor region training data 75R2 having a window size of window W1 is created. The processing unit 10A generates window-sized non-organized region training data 75R3 from the third training data 74R3 and the third preliminary training data 70R3L. Specifically, as explained with reference to FIGS. 4(a), (b) and FIG. 5(b) in the above-mentioned "Outline of deep learning method", the third training data 74R3 and the third From the preliminary training data 70R3L, non-organized region training data 75R3 having a window size of window W1 is created.
図11に示すステップS15において、処理部10Aは、ウィンドウサイズの腫瘍領域訓練データ75R1、非腫瘍領域訓練データ75R2および非組織領域訓練データ75R3を用いて、ニューラルネットワーク50を学習させる。ニューラルネットワーク50の学習結果は、ウィンドウサイズの腫瘍領域訓練データ75R1、非腫瘍領域訓練データ75R2および非組織領域訓練データ75R3を用いてニューラルネットワーク50を学習させる度に蓄積される。 In step S15 shown in FIG. 11, the processing unit 10A causes the neural network 50 to learn using the window-sized tumor region training data 75R1, non-tumor region training data 75R2, and non-tissue region training data 75R3. The learning results of the neural network 50 are accumulated each time the neural network 50 is trained using the window-sized tumor region training data 75R1, non-tumor region training data 75R2, and non-tissue region training data 75R3.
実施形態に係る画像解析方法では、畳み込みニューラルネットワークを使用しており、確率的勾配降下法を用いるため、ステップS16において、処理部10Aは、予め定められた所定の試行回数分の学習結果が蓄積されているか否かを判断する。学習結果が所定の試行回数分蓄積されている場合、処理部10AはステップS17の処理を行い、学習結果が所定の試行回数分蓄積されていない場合、処理部10AはステップS18の処理を行う。 Since the image analysis method according to the embodiment uses a convolutional neural network and uses a stochastic gradient descent method, in step S16, the processing unit 10A accumulates learning results for a predetermined number of trials. Determine whether or not. If the learning results have been accumulated for the predetermined number of trials, the processing unit 10A performs the process of step S17, and if the learning results have not been accumulated for the predetermined number of trials, the processing unit 10A performs the process of step S18.
学習結果が所定の試行回数分蓄積されている場合、ステップS17において、処理部10Aは、ステップS15において蓄積しておいた学習結果を用いて、ニューラルネットワーク50の結合重みwを更新する。実施形態に係る画像解析方法では、確率的勾配降下法を用いるため、所定の試行回数分の学習結果が蓄積した段階で、ニューラルネットワーク50の結合重みwを更新する。結合重みwを更新する処理は、具体的には、後述の(式11)および(式12)に示される、勾配降下法による計算を実施する処理である。 If the learning results have been accumulated for the predetermined number of trials, in step S17, the processing unit 10A updates the connection weight w of the neural network 50 using the learning results accumulated in step S15. Since the image analysis method according to the embodiment uses the stochastic gradient descent method, the connection weight w of the neural network 50 is updated at the stage when learning results for a predetermined number of trials have been accumulated. Specifically, the process of updating the connection weight w is a process of performing calculations using the gradient descent method, as shown in (Equation 11) and (Equation 12), which will be described later.
ステップS17において、処理部10Aは、第1の訓練データ74R1、第2の訓練データ74R2および第3の訓練データ74R3のそれぞれについて各領域訓練データ内の規定数の画素を処理したか否かを判断する。各領域訓練データの規定数の画素について、ステップS15からステップS17の一連の処理がなされている場合は、深層学習処理を終了する。ニューラルネットワークの学習は、必ずしも各訓練データ内の全ての画素に対して行う必要は無く、処理部10Aは、各訓練データ内の一部の画素、すなわち規定数の画素に対して処理をし学習を行うことができる。規定数の画素は、各領域訓練データ内の全ての画素であってもよい。 In step S17, the processing unit 10A determines whether a specified number of pixels in each region training data have been processed for each of the first training data 74R1, the second training data 74R2, and the third training data 74R3. do. If the series of processes from step S15 to step S17 have been performed on the specified number of pixels of each region training data, the deep learning process is ended. Learning of the neural network does not necessarily need to be performed on all pixels in each training data, and the processing unit 10A performs learning by processing some pixels in each training data, that is, a specified number of pixels. It can be performed. The specified number of pixels may be all pixels within each region training data.
各領域訓練データ内の規定数の画素が処理されていない場合は、処理部10Aは、ステップS19において、図4(b)に示すように、第1の訓練データ74R1内、第2の訓練データ74R2内または第3の訓練データ74R3内において、ウィンドウの位置を移動させる。その後、処理部10Aは、移動後の新たなウィンドウ位置において、ステップS14からステップS16の一連の処理を行う。すなわち、処理部10Aは、ステップS14において、移動後の新たなウィンドウ位置において第1の訓練データ74R1、第2の訓練データ74R2および第3の訓練データ74R3のそれぞれについてウィンドウサイズの各領域訓練データ75R1,75R2,75R3を切り出し、各領域を示すラベル値を付す。引き続き、処理部10Aは、ステップS15において、新たに切り出したウィンドウサイズの各領域訓練データ75R1,75R2,75R3を用いて、ニューラルネットワーク50を学習させる。ステップS16において、所定の試行回数分の学習結果が蓄積されている場合は、処理部10Aは、ステップS17において、ニューラルネットワーク50の結合重みwを更新する。このようなウィンドウサイズ毎のニューラルネットワーク50の学習を、第1の訓練データ74R1、第2の訓練データ74R2および第3の訓練データ74R3のそれぞれについて規定数の画素に対して行う。 If the specified number of pixels in each area training data have not been processed, the processing unit 10A, in step S19, processes the first training data 74R1, the second training data The position of the window is moved within 74R2 or within the third training data 74R3. Thereafter, the processing unit 10A performs a series of processes from step S14 to step S16 at the new window position after the movement. That is, in step S14, the processing unit 10A sets each area training data 75R1 of the window size for each of the first training data 74R1, the second training data 74R2, and the third training data 74R3 at the new window position after the movement. , 75R2, and 75R3 are cut out, and a label value indicating each area is attached. Subsequently, in step S15, the processing unit 10A causes the neural network 50 to learn using the training data 75R1, 75R2, and 75R3 for each region of the newly cut out window size. If the learning results for the predetermined number of trials have been accumulated in step S16, the processing unit 10A updates the connection weight w of the neural network 50 in step S17. Such learning of the neural network 50 for each window size is performed for a specified number of pixels for each of the first training data 74R1, the second training data 74R2, and the third training data 74R3.
以上説明した、ステップS10からS19の深層学習処理を、さらに別途取得された第1の訓練用画像70R1と、第2の訓練用画像70R2と、第3の訓練用画像70R3に対して繰り返し行うことにより、ニューラルネットワーク50の学習の程度を向上させる。これにより、図5に示すニューラルネットワーク構造の深層学習アルゴリズム60を得る。 The deep learning processing from steps S10 to S19 described above is repeatedly performed on the separately acquired first training image 70R1, second training image 70R2, and third training image 70R3. This improves the degree of learning of the neural network 50. As a result, a deep learning algorithm 60 having a neural network structure shown in FIG. 5 is obtained.
・ニューラルネットワークの構造
図12(a)に示すように、第1の実施形態では、深層学習タイプのニューラルネットワークを用いる。深層学習タイプのニューラルネットワークは、図12に示すニューラルネットワーク50のように、入力層50aと、出力層50bと、入力層50aおよび出力層50bの間の中間層50cとを備え、中間層50cが複数の層で構成されている。中間層50cを構成する層の数は、例えば5層以上とすることができる。
- Structure of Neural Network As shown in FIG. 12(a), the first embodiment uses a deep learning type neural network. A deep learning type neural network, like a neural network 50 shown in FIG. 12, includes an input layer 50a, an output layer 50b, and an intermediate layer 50c between the input layer 50a and the output layer 50b. Consists of multiple layers. The number of layers constituting the intermediate layer 50c can be, for example, five or more.
ニューラルネットワーク50では、層状に配置された複数のノード89が、層間において結合されている。これにより、情報が入力側の層50aから出力側の層50bに、図中矢印Dに示す一方向のみに伝播する。本実施形態では、入力層50aのノード数は、入力される画像の画素数すなわち図3(c)に示すウィンドウW1の画素数と各画素に含まれる色の原色の数との積に対応している。入力層50aに画像の画素データ(色濃度値)を入力することができるので、ユーザは入力画像から特徴量を別途算出することなく、入力画像を入力層50aに入力することができる。 In the neural network 50, a plurality of nodes 89 arranged in layers are connected between the layers. As a result, information propagates from the input side layer 50a to the output side layer 50b in only one direction shown by arrow D in the figure. In this embodiment, the number of nodes in the input layer 50a corresponds to the product of the number of pixels of the input image, that is, the number of pixels of the window W1 shown in FIG. 3(c), and the number of primary colors included in each pixel. ing. Since pixel data (color density values) of an image can be input to the input layer 50a, the user can input the input image to the input layer 50a without separately calculating feature amounts from the input image.
・各ノードにおける演算
図12(b)は、各ノードにおける演算を示す模式図である。各ノード89では、複数の入力を受け取り、1つの出力(z)を計算する。図12(b)に示す例の場合、ノード89は4つの入力を受け取る。ノード89が受け取る総入力(u)は、以下の(式1)で表される。
-Calculation at each node FIG. 12(b) is a schematic diagram showing the calculation at each node. Each node 89 receives multiple inputs and calculates one output (z). In the example shown in FIG. 12(b), node 89 receives four inputs. The total input (u) received by the node 89 is expressed by the following (Equation 1).
各入力には、それぞれ異なる重みが掛けられる。(式1)中、bはバイアスと呼ばれる値である。ノードの出力(z)は、(式1)で表される総入力(u)に対する所定の関数fの出力となり、以下の(式2)で表される。関数fは活性化関数と呼ばれる。 Each input is given a different weight. In (Formula 1), b is a value called bias. The output (z) of the node is the output of a predetermined function f for the total input (u) expressed by (Formula 1), and is expressed by (Formula 2) below. The function f is called an activation function.
図12(c)は、ノード間の演算を示す模式図である。ニューラルネットワーク50では、(式1)で表される総入力(u)に対して、(式2)で表される結果(z)を出力するノードが層状に並べられている。前の層のノードの出力が、次の層のノードの入力となる。図12(c)に示す例では、図中左側の層のノード89aの出力が、図中右側の層のノード89bの入力となる。右側の層の各ノード89bは、それぞれ、左側の層のノード89aからの出力を受け取る。左側の層の各ノード89aと右側の層の各ノード89bとの間の各結合には、異なる重みが掛けられる。左側の層の複数のノード89aのそれぞれの出力をx1~x4とすると、右側の層の3つのノード89bのそれぞれに対する入力は、以下の(式3-1)~(式3-3)で表される。 FIG. 12(c) is a schematic diagram showing operations between nodes. In the neural network 50, nodes that output a result (z) expressed by (Formula 2) with respect to a total input (u) expressed by (Formula 1) are arranged in a layered manner. The output of the node in the previous layer becomes the input to the node in the next layer. In the example shown in FIG. 12(c), the output of the node 89a on the left layer in the figure becomes the input to the node 89b on the right layer in the figure. Each node 89b in the right layer receives an output from node 89a in the left layer. Each connection between each node 89a in the left layer and each node 89b in the right layer is given a different weight. If the outputs of the plurality of nodes 89a in the left layer are x 1 to x 4 , the inputs to each of the three nodes 89b in the right layer are as follows (Equation 3-1) to (Equation 3-3) It is expressed as
これら(式3-1)~(式3-3)を一般化すると、(式3-4)となる。ここで、i=1,・・・I、j=1,・・・Jである。 When these (Formula 3-1) to (Formula 3-3) are generalized, (Formula 3-4) is obtained. Here, i=1,...I, and j=1,...J.
・活性化関数
実施形態に係る画像解析方法では、活性化関数として、正規化線形関数(rectified linear unit function)を用いる。正規化線形関数は以下の(式5)で表される。
- Activation Function In the image analysis method according to the embodiment, a rectified linear unit function is used as the activation function. The normalized linear function is expressed by the following (Equation 5).
(式5)は、z=uの線形関数のうち、u<0の部分をu=0とする関数である。図12(c)に示す例では、j=1のノードの出力は、(式5)により、以下の式で表される。 (Equation 5) is a function in which the part where u<0 is set to u=0 among the linear functions of z=u. In the example shown in FIG. 12(c), the output of the node with j=1 is expressed by the following equation using (Equation 5).
・ニューラルネットワークの学習
ニューラルネットワークを用いて表現される関数をy(x:w)とおくと、関数y(x:w)は、ニューラルネットワークのパラメータwを変化させると変化する。入力xに対してニューラルネットワークがより好適なパラメータwを選択するように、関数y(x:w)を調整することを、ニューラルネットワークの学習と呼ぶ。ニューラルネットワークを用いて表現される関数の入力と出力との組が複数与えられているとする。ある入力xに対する望ましい出力をdとすると、入出力の組は、{(x1,d1),(x2,d2),・・・,(xn,dn)}と与えられる。(x,d)で表される各組の集合を、訓練データと呼ぶ。具体的には、図3(b)に示す、R、G、B各色の単一色画像における画素毎の色濃度値と真値像のラベルとの組、の集合が、図3(a)に示す訓練データである。
-Learning of a neural network Letting y(x:w) be a function expressed using a neural network, the function y(x:w) changes when the parameter w of the neural network is changed. Adjusting the function y(x:w) so that the neural network selects a more suitable parameter w for the input x is called learning of the neural network. Assume that multiple pairs of input and output of a function expressed using a neural network are given. When the desired output for a certain input x is d, the input/output pair is given as {(x 1 , d 1 ), (x 2 , d 2 ), . . . , (x n , d n )}. Each set of pairs represented by (x, d) is called training data. Specifically, a set of pairs of color density values and true value image labels for each pixel in a single color image of R, G, and B shown in FIG. 3(b) is shown in FIG. 3(a). This is the training data shown.
ニューラルネットワークの学習とは、どのような入出力の組(xn,dn)に対しても、入力xnを与えたときのニューラルネットワークの出力y(xn:w)が、出力dnになるべく近づくように重みwを調整することを意味する。誤差関数(error function)とは、ニューラルネットワークを用いて表現される関数と訓練データとの近さ Neural network learning means that for any input/output pair (x n , d n ), the output y (x n :w) of the neural network when input x n is given is the output d n This means adjusting the weight w so that it is as close as possible. The error function is the closeness between the function expressed using a neural network and the training data.
を測る尺度である。誤差関数は損失関数(loss function)とも呼ばれる。実施形態に係る画像解析方法において用いる誤差関数E(w)は、以下の(式6)で表される。(式6)は交差エントロピー(cross entropy)と呼ばれる。 It is a scale to measure. The error function is also called a loss function. The error function E(w) used in the image analysis method according to the embodiment is expressed by the following (Equation 6). (Formula 6) is called cross entropy.
(式6)の交差エントロピーの算出方法を説明する。実施形態に係る画像解析方法において用いるニューラルネットワーク50の出力層50bでは、すなわちニューラルネットワークの最終層では、入力xを内容に応じて有限個のクラスに分類するための活性化関数を用いる。活性化関数はソフトマックス関数(softmax function)と呼ばれ、以下の(式7)で表される。なお、出力層50bには、クラス数kと同数のノードが並べられているとする。出力層Lの各ノードk(k=1,・・・K)の総入力uは、前層L-1の出力から、uk (L)で与えられるとする。これにより、出力層のk番目のノードの出力は以下の(式7)で表される。 A method for calculating the cross entropy of (Equation 6) will be explained. In the output layer 50b of the neural network 50 used in the image analysis method according to the embodiment, that is, in the final layer of the neural network, an activation function is used to classify the input x into a finite number of classes according to the content. The activation function is called a softmax function and is expressed by the following (Equation 7). It is assumed that the same number of nodes as the number of classes k are arranged in the output layer 50b. It is assumed that the total input u of each node k (k=1, . . . K) of the output layer L is given by u k (L) from the output of the previous layer L-1. As a result, the output of the k-th node of the output layer is expressed by the following (Equation 7).
(式7)がソフトマックス関数である。(式7)で決まる出力y1,・・・,yKの総和は常に1となる。 (Formula 7) is the softmax function. The sum of the outputs y 1 , . . . , y K determined by (Equation 7) is always 1.
各クラスをC1,・・・,CKと表すと、出力層Lのノードkの出力yk(すなわちuk (L))は、与えられた入力xがクラスCkに属する確率を表す。以下の(式8)を参照されたい。入力xは、(式8)で表される確率が最大になるクラスに分類される。 If each class is represented as C 1 , ..., CK , then the output y k (i.e. u k (L) ) of node k of output layer L represents the probability that a given input x belongs to class C k . Please refer to (Equation 8) below. The input x is classified into the class in which the probability expressed by (Equation 8) is maximized.
ニューラルネットワークの学習では、ニューラルネットワークで表される関数を、各クラスの事後確率(posterior probability)のモデルとみなし、そのような確率モデルの下で、訓練データに対する重みwの尤度(likelihood)を評価し、尤度を最大化するような重みwを選択する。 In learning a neural network, the function represented by the neural network is regarded as a model of the posterior probability of each class, and under such a probability model, the likelihood of the weight w for the training data is calculated as follows: evaluate and select the weight w that maximizes the likelihood.
(式7)のソフトマックス関数による目標出力dnを、出力が正解のクラスである場合のみ1とし、出力がそれ以外の場合は0になるとする。目標出力をdn=[dn1,・・・,dnK]というベクトル形式で表すと、例えば入力xnの正解クラスがC3である場合、目標出力dn3のみが1となり、それ以外の目標出力は0となる。このように符号化すると、事後分布(posterior)は以下の(式9)で表される。 It is assumed that the target output d n by the softmax function in (Equation 7) is set to 1 only when the output is in the correct class, and is set to 0 otherwise. If the target output is expressed in a vector format d n = [d n1 ,..., d nK ], for example, if the correct class of input x n is C 3 , only the target output d n3 will be 1, and the other The target output becomes 0. When encoded in this way, the posterior distribution is expressed by the following (Equation 9).
訓練データ{(xn,dn)}(n=1,・・・,N)に対する重みwの尤度L(w)は、以下の(式10)で表される。尤度L(w)の対数をとり符号を反転すると、(式6)の誤差関数が導出される。 The likelihood L(w) of the weight w for the training data {(x n , d n )} (n=1, . . . , N) is expressed by the following (Equation 10). By taking the logarithm of the likelihood L(w) and inverting its sign, the error function of (Equation 6) is derived.
学習は、訓練データを基に計算される誤差関数E(w)を、ニューラルネットワークのパラメータwについて最小化することを意味する。実施形態に係る画像解析方法では、誤差関数E(w)は(式6)で表される。 Learning means minimizing the error function E(w) calculated based on training data with respect to the parameter w of the neural network. In the image analysis method according to the embodiment, the error function E(w) is expressed by (Equation 6).
誤差関数E(w)をパラメータwについて最小化することは、関数E(w)の局所的な極小点を求めることと同じ意味である。パラメータwはノード間の結合の重みである。重みwの極小点は、任意の初期値を出発点として、パラメータwを繰り返し更新する反復計算によって求められる。このような計算の一例には、勾配降下法(gradient descent method)がある。 Minimizing the error function E(w) with respect to the parameter w has the same meaning as finding a local minimum point of the function E(w). The parameter w is the weight of connections between nodes. The minimum point of the weight w is determined by an iterative calculation in which the parameter w is repeatedly updated using an arbitrary initial value as a starting point. An example of such a calculation is a gradient descent method.
勾配降下法では、次の(式11)で表されるベクトルを用いる。 The gradient descent method uses a vector expressed by the following (Equation 11).
勾配降下法では、現在のパラメータwの値を負の勾配方向(すなわち-∇E)に移動させる処理を何度も繰り返す。現在の重みをw(t)とし、移動後の重みをw(t+1)とすると、勾配降下法による演算は、以下の(式12)で表される。値tは、パラメータwを移動させた回数を意味する。 In the gradient descent method, the process of moving the current value of the parameter w in the negative gradient direction (ie, −∇E) is repeated many times. When the current weight is w (t) and the weight after movement is w (t+1) , the calculation by the gradient descent method is expressed by the following (Equation 12). The value t means the number of times the parameter w has been moved.
記号
なお、(式12)による演算は、全ての訓練データ(n=1,・・・,N)に対して実施してもよく、一部の訓練データのみに対して実施してもよい。一部の訓練データのみに対して行う勾配降下法は、確率的勾配降下法(stochastic gradient descent)と呼ばれる。実施形態に係る画像解析方法では、確率的勾配降下法を用いる。 Note that the calculation according to (Equation 12) may be performed on all training data (n=1, . . . , N), or may be performed on only some training data. Gradient descent performed only on a portion of the training data is called stochastic gradient descent. The image analysis method according to the embodiment uses stochastic gradient descent.
・画像解析処理
図13を参照すると、第1の実施形態に係る画像解析装置200Aの処理部20Aは、解析用データ生成部201と、解析用データ入力部202と、解析部203と、領域検出部204とを備える。これらの機能ブロックは、本発明に係るコンピュータに画像解析処理を実行させるプログラムを、処理部20Aの記憶部23またはメモリ22にインストールし、このプログラムをCPU21が実行することにより実現される。ウィンドウサイズデータベース104と、アルゴリズムデータベース105とは、記憶媒体98またはネットワーク99を通じて深層学習装置100Aから提供され、処理部20Aの記憶部23またはメモリ22に記憶される。
- Image analysis processing Referring to FIG. 13, the processing unit 20A of the image analysis apparatus 200A according to the first embodiment includes an analysis data generation unit 201, an analysis data input unit 202, an analysis unit 203, and a region detection unit 20A. 204. These functional blocks are realized by installing a program that causes a computer according to the present invention to execute image analysis processing in the storage unit 23 or memory 22 of the processing unit 20A, and having the CPU 21 execute this program. The window size database 104 and the algorithm database 105 are provided from the deep learning device 100A via the storage medium 98 or the network 99, and are stored in the storage unit 23 or memory 22 of the processing unit 20A.
解析対象の組織の解析対象画像78は、撮像装置400によって予め撮像され、処理部20Aの記憶部23またはメモリ22に予め記憶されていることとする。学習済みの結合重みwを含む深層学習アルゴリズム60は、解析対象の組織の標本が由来する組織の種類と対応付けられてアルゴリズムデータベース105に格納されており、コンピュータに画像解析処理を実行させるプログラムの一部であるプログラムモジュールとして機能する。すなわち、深層学習アルゴリズム60は、CPUおよびメモリを備えるコンピュータにて用いられ、解析対象の組織において各領域を示すデータを出力するという、使用目的に応じた特有の情報の演算または加工を実行するよう、コンピュータを機能させる。具体的には、処理部20AのCPU21は、記憶部23またはメモリ22に記憶された深層学習アルゴリズム60に規定されているアルゴリズムに従って、学習済みの結合重みwに基づくニューラルネットワーク60の演算を行う。処理部20AのCPU21は、入力層60aに入力された、解析対象の組織を撮像した解析対象画像78に対して演算を行い、出力層60bから、解析対象の組織において各領域を示すデータである3値画像83を出力する。 It is assumed that an analysis target image 78 of a tissue to be analyzed is captured in advance by the imaging device 400 and stored in advance in the storage unit 23 or memory 22 of the processing unit 20A. The deep learning algorithm 60 including the learned connection weights w is stored in the algorithm database 105 in association with the type of tissue from which the tissue sample to be analyzed comes from, and is used as a program for causing a computer to perform image analysis processing. Functions as a part of a program module. That is, the deep learning algorithm 60 is used in a computer equipped with a CPU and memory, and is designed to perform calculations or processing of information specific to the purpose of use, such as outputting data indicating each region in the tissue to be analyzed. , make the computer work. Specifically, the CPU 21 of the processing unit 20A performs calculations of the neural network 60 based on the learned connection weights w according to the algorithm defined in the deep learning algorithm 60 stored in the storage unit 23 or the memory 22. The CPU 21 of the processing unit 20A performs calculations on the analysis target image 78 of the tissue to be analyzed, which is input to the input layer 60a, and outputs data indicating each region in the tissue to be analyzed from the output layer 60b. A ternary image 83 is output.
図14を参照すると、画像解析装置200Aの処理部20Aは、図13に示す処理を行う。図13に示す各機能ブロックを用いて説明すると、ステップS21およびS22の処理は、解析用データ生成部201が行う。ステップS23,S24,S26およびS27の処理は、解析用データ入力部202が行う。ステップS25およびS28の処理は、解析部203が行う。ステップS29の処理は、領域検出部204が行う。 Referring to FIG. 14, the processing unit 20A of the image analysis device 200A performs the processing shown in FIG. 13. Explaining using each functional block shown in FIG. 13, the processing of steps S21 and S22 is performed by the analysis data generation unit 201. The processing of steps S23, S24, S26, and S27 is performed by the analysis data input unit 202. The processing in steps S25 and S28 is performed by the analysis unit 203. The process in step S29 is performed by the area detection unit 204.
ステップS21において、処理部20Aは、例えば、ユーザ等が入力部26から入力した処理開始の指令により、入力された解析対象画像78からR、G、B各色の色濃度符号化図79r,79g,79bを生成する。色濃度符号化図79r,79g,79bから画素毎にR、G、B各色の色濃度値を組み合わせた解析対象データが生成される。色濃度符号化図79r,79g,79bの生成方法は、図11に示す深層学習処理時におけるステップS10での生成方法と同様である。 In step S21, the processing unit 20A, in response to a command to start processing input by a user or the like from the input unit 26, generates color density encoded diagrams 79r, 79g of R, G, and B colors from the input analysis target image 78, for example. Generate 79b. Data to be analyzed is generated by combining the color density values of R, G, and B colors for each pixel from the color density encoded diagrams 79r, 79g, and 79b. The method of generating the color density encoded diagrams 79r, 79g, and 79b is the same as the method of generating them in step S10 during the deep learning process shown in FIG. 11.
図14に示すステップS22において、処理部20Aは、入力部26を通じて、解析条件として、画像解析装置200A側のユーザからの、組織の種別の入力を受け付ける。処理部20Aは、入力された組織の種別に基づき、ウィンドウサイズデータベース104およびアルゴリズムデータベース105を参照して、解析に用いるウィンドウサイズを設定し、解析に用いる深層学習アルゴリズム60を取得する。ウィンドウサイズは、1回の入力時にニューラルネットワーク60に入力する解析用データの単位であり、ウィンドウサイズの解析用データ80の画素数と画像に含まれる色の原色の数との積が、入力層60aのノード数に対応している。ウィンドウサイズは組織の種別と対応付けられて、ウィンドウサイズデータベース104内に予め記憶されている。ウィンドウサイズは、図6に示すウィンドウW2のように、例えば3×3画素である。深層学習アルゴリズム60も、組織の種別と対応付けられて、図13に示すアルゴリズムデータベース105内に予め記憶されている。 In step S22 shown in FIG. 14, the processing unit 20A receives an input of the type of tissue from the user of the image analysis device 200A as an analysis condition through the input unit 26. Based on the input tissue type, the processing unit 20A refers to the window size database 104 and the algorithm database 105, sets a window size to be used for analysis, and obtains a deep learning algorithm 60 to be used for analysis. The window size is a unit of analysis data input to the neural network 60 at one time of input, and the product of the number of pixels of the window size analysis data 80 and the number of primary colors included in the image is This corresponds to the number of nodes of 60a. The window size is stored in advance in the window size database 104 in association with the type of organization. The window size is, for example, 3×3 pixels, as shown in window W2 shown in FIG. The deep learning algorithm 60 is also stored in advance in the algorithm database 105 shown in FIG. 13 in association with the type of organization.
図14に示すステップS23において、処理部20Aは、色濃度符号化図79r,79g,79bから画素毎にR、G、B各色の色濃度値を組み合わせた解析対象データを生成し、さらにウィンドウサイズの解析用データ80を生成する。 In step S23 shown in FIG. 14, the processing unit 20A generates data to be analyzed by combining the color density values of R, G, and B for each pixel from the color density encoding diagrams 79r, 79g, and 79b, and further The analysis data 80 is generated.
ステップS24において、処理部20Aは、図5に示す解析用データ80を、深層学習アルゴリズム60に入力する。ウィンドウの初期位置は、深層学習処理時におけるステップS14と同様に、例えばウィンドウ内の3×3画素に位置する画素が、解析対象データの左上角に対応する位置である。処理部20Aは、ウィンドウサイズの解析用データ80に含まれる、3×3画素×3原色の合計27個の色濃度値のデータ81を入力層60aに入力すると、深層学習アルゴリズム60は、出力層60bに判別結果82を出力する。 In step S24, the processing unit 20A inputs the analysis data 80 shown in FIG. 5 to the deep learning algorithm 60. The initial position of the window is, for example, a position where a 3×3 pixel within the window corresponds to the upper left corner of the data to be analyzed, as in step S14 during deep learning processing. When the processing unit 20A inputs a total of 27 color density value data 81 of 3 x 3 pixels x 3 primary colors included in the window size analysis data 80 to the input layer 60a, the deep learning algorithm 60 inputs the data 81 to the output layer. The determination result 82 is output to 60b.
図14に示すステップS25において、処理部20Aは、図5に示す出力層60bに出力される判別結果82を記憶する。判別結果82は、解析対象データの各画素領域についての推定値(0、1、2の3値のいずれか)である。 In step S25 shown in FIG. 14, the processing unit 20A stores the determination result 82 output to the output layer 60b shown in FIG. The determination result 82 is an estimated value (one of the three values 0, 1, and 2) for each pixel region of the data to be analyzed.
図14に示すステップS26において、処理部20Aは、入力画像内の全ての画素を処理したか否かを判断する。入力画像は、図6に示す色濃度符号化図79r,79g,79bであり、解析対象データ内の全ての画素について、図14に示すステップS23からステップS25の一連の処理がなされている場合は、ステップS28の処理を行う。 In step S26 shown in FIG. 14, the processing unit 20A determines whether all pixels in the input image have been processed. The input images are color density encoded diagrams 79r, 79g, and 79b shown in FIG. 6, and if all pixels in the data to be analyzed have been subjected to the series of processes from step S23 to step S25 shown in FIG. , performs the process of step S28.
解析対象データ内の全ての画素が処理されていない場合は、処理部20Aは、ステップS27において、深層学習処理時におけるステップS20と同様に、図5に示す色濃度符号化図79r,79g,79b内において、ウィンドウW2を所定の画素数の単位で移動させる。その後、処理部20Aは、移動後の新たなウィンドウW2の位置において、ステップS23からステップS25の一連の処理を行う。処理部20Aは、ステップS25において、移動後の新たなウィンドウ位置に対応する、判別結果82を記憶する。このようなウィンドウサイズ毎の判別結果82の記憶を、解析対象画像内の全ての画素に対して行うことにより、解析結果の3値画像83が得られる。解析結果の3値画像83の画像サイズは、解析対象画像の画像サイズと同じである。ここで、3値画像83には、推定値の値2、値1および値0が各画素に付された数値データであってもよく、推定値の値2、値1および値0に代えて、例えば値2、値1および値0のそれぞれに対応付けた表示色で示した画像であっても良い。 If all the pixels in the data to be analyzed have not been processed, in step S27, the processing unit 20A converts the color density encoding diagrams 79r, 79g, 79b shown in FIG. The window W2 is moved in units of a predetermined number of pixels. Thereafter, the processing unit 20A performs a series of processes from step S23 to step S25 at the new position of the window W2 after the movement. In step S25, the processing unit 20A stores the determination result 82 corresponding to the new window position after the movement. By storing such determination results 82 for each window size for all pixels in the image to be analyzed, a ternary image 83 as an analysis result is obtained. The image size of the ternary image 83 as the analysis result is the same as the image size of the analysis target image. Here, the ternary image 83 may be numerical data in which the estimated values 2, 1, and 0 are attached to each pixel, and instead of the estimated values 2, 1, and 0. For example, it may be an image shown in display colors corresponding to value 2, value 1, and value 0, respectively.
図14に示すステップS28では、処理部20Aは、解析結果の3値画像83を出力部27に出力する。 In step S28 shown in FIG. 14, the processing unit 20A outputs the ternary image 83 as the analysis result to the output unit 27.
ステップS29では、ステップS28に引き続き、処理部20Aは、解析結果の3値画像83についてさらに、領域検出処理を行う。3値画像83において、腫瘍領域と、非腫瘍領域と、非組織領域とは、3値で区別して表されている。 In step S29, subsequent to step S28, the processing unit 20A further performs area detection processing on the ternary image 83 as the analysis result. In the ternary image 83, a tumor region, a non-tumor region, and a non-tissue region are distinguished and expressed using ternary values.
任意ではあるが、処理部20Aは、得られた各領域を、解析対象の解析対象画像78に重ねることにより、領域強調画像84を作成する。処理部20Aは、作成した領域強調画像84を出力部27に出力し、画像解析処理を終了する。 Although optional, the processing unit 20A creates a region-enhanced image 84 by superimposing each obtained region on the analysis target image 78 to be analyzed. The processing unit 20A outputs the created region-enhanced image 84 to the output unit 27, and ends the image analysis process.
任意ではあるが、処理部20Aは、解析対象画像78に含まれる組織において、腫瘍領域がどの程度含まれているか算出してもよい。例えば、解析対象画像78に含まれる組織に該当する画素数、すなわち腫瘍領域および非腫瘍領域と判定された画素数の合計(組織領域総画素数)を100%とした場合に、腫瘍領域と判定された画素数が何%を占めるかを算出することにより、腫瘍領域の含有率を算出することができる。また、総画素数から腫瘍領域と判定された画素数を減じることにより、または組織領域総画素数)を100%とした場合に、非腫瘍領域と判定された画素数が何%を占めるかを算出することにより、非腫瘍領域の含有率を算出することができる。そして、腫瘍領域の含有率と非腫瘍領域の含有率との比率を算出してもよい。前記算出された値は、出力部27に出力されてもよい。また、算出された値は、領域強調画像84と共に出力部27に出力されてもよい。 Although optional, the processing unit 20A may calculate how much of the tumor region is included in the tissue included in the analysis target image 78. For example, if the number of pixels corresponding to the tissue included in the analysis target image 78, that is, the total number of pixels determined to be a tumor region and a non-tumor region (total number of pixels in the tissue region), is determined to be a tumor region. By calculating the percentage occupied by the number of pixels, the content rate of the tumor region can be calculated. In addition, by subtracting the number of pixels determined to be tumor regions from the total number of pixels, or when the total number of pixels determined to be tissue regions is set to 100%, the percentage of pixels determined to be non-tumor regions can be calculated. By calculating, the content rate of the non-tumor region can be calculated. Then, the ratio between the content rate of the tumor region and the content rate of the non-tumor region may be calculated. The calculated value may be output to the output section 27. Further, the calculated value may be output to the output unit 27 together with the region-enhanced image 84.
このように腫瘍領域の含有率を算出することは、がん組織の遺伝子解析等に用いられる組織が検査に適した腫瘍組織を含んでいるかスクリーニングする上で有用である。 Calculating the content of the tumor region in this way is useful in screening whether the tissue used for genetic analysis of cancer tissue, etc. contains tumor tissue suitable for testing.
以上、画像解析装置200Aのユーザは、解析対象の組織の解析対象画像78を画像解析装置200Aに入力することにより、解析結果として、3値画像83を取得することができる。3値画像83は、解析対象の標本における、腫瘍領域と、非腫瘍領域と、非組織領域とを表しており、ユーザは、解析対象の標本において、各領域を判別することが可能となる。 As described above, the user of the image analysis apparatus 200A can obtain the ternary image 83 as an analysis result by inputting the analysis target image 78 of the tissue to be analyzed into the image analysis apparatus 200A. The ternary image 83 represents a tumor region, a non-tumor region, and a non-tissue region in the specimen to be analyzed, and allows the user to distinguish each region in the specimen to be analyzed.
さらに、画像解析装置200Aのユーザは、解析結果として、領域強調画像84を取得することができる。領域強調画像84は、例えば、解析対象の解析対象画像78に、各領域を色で塗りつぶすことにより生成される。また、別の態様では、各領域の境界線を重ねることにより生成されている。これにより、ユーザは、解析対象の組織において、各領域を一目で把握することが可能となる。 Further, the user of the image analysis device 200A can obtain a region-enhanced image 84 as an analysis result. The region-enhanced image 84 is generated, for example, by filling each region of the analysis target image 78 with a color. In another aspect, the area is generated by overlapping the boundaries of each area. This allows the user to grasp each area at a glance in the tissue to be analyzed.
解析対象の標本において腫瘍領域、および/または非腫瘍領域を示すことは、組織診断に先立って解析対象組織における腫瘍領域をスクリーニングし、標本観察効率を上げる一助となる。 Indicating the tumor region and/or non-tumor region in the specimen to be analyzed helps to screen the tumor region in the tissue to be analyzed prior to tissue diagnosis and increases sample observation efficiency.
<第2の実施形態>
以下、第1の実施形態に係る画像解析システムと相違する点について、第2の実施形態に係る画像解析システムを説明する。
<Second embodiment>
Hereinafter, the image analysis system according to the second embodiment will be described with respect to the differences from the image analysis system according to the first embodiment.
[構成の概要]
図15を参照すると、第2の実施形態に係る画像解析システムは、ユーザ側装置200を備え、ユーザ側装置200が、統合型の画像解析装置200Bとして動作する。画像解析装置200Bは、例えば汎用コンピュータで構成されており、第1の実施形態において説明した深層学習処理および画像解析処理の両方の処理を行う。つまり、第2の実施形態に係る画像解析システムは、ユーザ側で深層学習および画像解析を行う、スタンドアロン型のシステムである。第2の実施形態に係る画像解析システムは、ユーザ側に設置された統合型の画像解析装置200Bが、第1の実施形態に係る深層学習装置100Aおよび画像解析装置200Aの両方の機能を担う点において、第1の実施形態に係る画像解析システムと異なる。
[Configuration overview]
Referring to FIG. 15, the image analysis system according to the second embodiment includes a user device 200, and the user device 200 operates as an integrated image analysis device 200B. The image analysis device 200B is composed of, for example, a general-purpose computer, and performs both the deep learning processing and the image analysis processing described in the first embodiment. In other words, the image analysis system according to the second embodiment is a stand-alone system in which deep learning and image analysis are performed on the user side. In the image analysis system according to the second embodiment, an integrated image analysis device 200B installed on the user side has the functions of both the deep learning device 100A and the image analysis device 200A according to the first embodiment. This is different from the image analysis system according to the first embodiment.
画像解析装置200Bは撮像装置400に接続されている。撮像装置400は、深層学習処理時には、学習用の組織の訓練用画像を取得し、画像解析処理時には、解析対象の組織の解析対象画像78を取得する。 Image analysis device 200B is connected to imaging device 400. The imaging device 400 acquires a training image of a tissue for learning during deep learning processing, and acquires an analysis target image 78 of a tissue to be analyzed during image analysis processing.
[ハードウェア構成]
画像解析装置200Bのハードウェア構成は、図9に示すユーザ側装置200のハードウェア構成と同様である。
[Hardware configuration]
The hardware configuration of the image analysis device 200B is similar to the hardware configuration of the user-side device 200 shown in FIG.
[機能ブロックおよび処理手順]
図16を参照すると、第2の実施形態に係る画像解析装置200Bの処理部20Bは、訓練データ生成部101と、訓練データ入力部102と、アルゴリズム更新部103と、解析用データ生成部201と、解析用データ入力部202と、解析部203と、領域検出部204とを備える。これらの機能ブロックは、コンピュータに深層学習処理および画像解析処理を実行させるプログラムを、処理部20Bの記憶部23またはメモリ22にインストールし、このプログラムをCPU21が実行することにより実現される。ウィンドウサイズデータベース104と、アルゴリズムデータベース105とは、処理部20Bの記憶部23またはメモリ22に記憶され、どちらも深層学習時および画像解析処理時に共通して使用される。学習済みのニューラルネットワーク60は、組織の種別または細胞を含む試料の種別と対応付けられて、アルゴリズムデータベース105に予め格納されており、深層学習処理により結合重みwが更新されて、深層学習アルゴリズム60として、アルゴリズムデータベース105に格納される。なお、訓練用画像である第1の訓練用画像70R1、第2の訓練用画像70R2、第3の訓練用画像70R3は、撮像装置400によって予め撮像され、処理部20Bの記憶部23またはメモリ22に予め記憶されていることとする。解析対象の標本の解析対象画像78も、撮像装置400によって予め撮像され、処理部20Bの記憶部23またはメモリ22に予め記憶されていることとする。
[Functional blocks and processing procedures]
Referring to FIG. 16, the processing unit 20B of the image analysis device 200B according to the second embodiment includes a training data generation unit 101, a training data input unit 102, an algorithm update unit 103, and an analysis data generation unit 201. , an analysis data input section 202, an analysis section 203, and a region detection section 204. These functional blocks are realized by installing a program that causes a computer to execute deep learning processing and image analysis processing in the storage unit 23 or memory 22 of the processing unit 20B, and having the CPU 21 execute this program. The window size database 104 and the algorithm database 105 are stored in the storage unit 23 or memory 22 of the processing unit 20B, and both are used in common during deep learning and image analysis processing. The trained neural network 60 is stored in advance in the algorithm database 105 in association with the type of tissue or the type of sample containing cells, and the connection weights w are updated by deep learning processing, and the deep learning algorithm 60 It is stored in the algorithm database 105 as follows. Note that the first training image 70R1, second training image 70R2, and third training image 70R3, which are training images, are captured in advance by the imaging device 400, and are stored in the storage unit 23 or memory 22 of the processing unit 20B. is stored in advance. It is assumed that an analysis target image 78 of a specimen to be analyzed is also captured in advance by the imaging device 400 and stored in advance in the storage unit 23 or the memory 22 of the processing unit 20B.
画像解析装置200Bの処理部20Bは、深層学習処理時には、図11に示す処理を行い、画像解析処理時には、図14に示す処理を行う。図16に示す各機能ブロックを用いて説明すると、深層学習処理時には、ステップS10からS12、S14、S18およびS19の処理は、訓練データ生成部101が行う。ステップS13の処理は、訓練データ入力部102が行う。ステップS16およびS17の処理は、アルゴリズム更新部103が行う。画像解析処理時には、ステップS21およびS22の処理は、解析用データ生成部201が行う。ステップS23,S24,S26およびS27の処理は、解析用データ入力部202が行う。ステップS25およびS28の処理は、解析部203が行う。ステップS29の処理は、領域検出部204が行う。 The processing unit 20B of the image analysis device 200B performs the processing shown in FIG. 11 during deep learning processing, and performs the processing shown in FIG. 14 during image analysis processing. Explaining using each functional block shown in FIG. 16, during deep learning processing, the training data generation unit 101 performs the processing from steps S10 to S12, S14, S18, and S19. The process of step S13 is performed by the training data input unit 102. The processing in steps S16 and S17 is performed by the algorithm updating unit 103. During image analysis processing, the processing of steps S21 and S22 is performed by the analysis data generation unit 201. The processing of steps S23, S24, S26, and S27 is performed by the analysis data input unit 202. The processing in steps S25 and S28 is performed by the analysis unit 203. The process in step S29 is performed by the area detection unit 204.
第2の実施形態に係る画像解析装置200Bが行う深層学習処理の手順および画像解析処理の手順は、第1の実施形態に係る深層学習装置100Aおよび画像解析装置200Aがそれぞれ行う手順と同様である。なお、第2の実施形態に係る画像解析装置200Bは、次の点において第1の実施形態に係る深層学習装置100Aおよび画像解析装置200Aと異なる。 The deep learning processing procedure and the image analysis processing procedure performed by the image analysis device 200B according to the second embodiment are similar to the procedures performed by the deep learning device 100A and the image analysis device 200A according to the first embodiment, respectively. . Note that the image analysis device 200B according to the second embodiment differs from the deep learning device 100A and the image analysis device 200A according to the first embodiment in the following points.
深層学習処理時のステップS13において、処理部20Bは、入力部26を通じて、画像解析装置200Bのユーザからの、学習用の組織の種別の入力を受け付ける。処理部20Bは、入力された組織の種別に基づき、ウィンドウサイズデータベース104を参照して、ウィンドウサイズを設定し、アルゴリズムデータベース105を参照して、学習に用いるニューラルネットワーク50を設定する。 In step S13 during deep learning processing, the processing unit 20B receives an input of the type of tissue for learning from the user of the image analysis device 200B through the input unit 26. Based on the input tissue type, the processing unit 20B refers to the window size database 104 to set the window size, and refers to the algorithm database 105 to set the neural network 50 used for learning.
以上、画像解析装置200Bのユーザは、解析対象画像78を画像解析装置200Bに入力することにより、解析結果として、3値画像83を取得することができる。さらに、画像解析装置200Bのユーザは、解析結果として、領域強調画像84を取得することができる。 As described above, the user of the image analysis device 200B can obtain the ternary image 83 as an analysis result by inputting the analysis target image 78 into the image analysis device 200B. Furthermore, the user of the image analysis device 200B can obtain a region-enhanced image 84 as an analysis result.
第2の実施形態に係る画像解析装置200Bによると、ユーザは、自身が選択した種類の組織を、学習用の組織として用いることができる。これは、ニューラルネットワーク50の学習がベンダ側任せではなく、ユーザ自身がニューラルネットワーク50の学習の程度を向上できることを意味する。 According to the image analysis device 200B according to the second embodiment, the user can use the type of tissue selected by the user as a learning tissue. This means that the learning of the neural network 50 is not left to the vendor, but the user himself can improve the learning level of the neural network 50.
<第3の実施形態>
以下、第2の実施形態に係る画像解析システムと相違する点について、第3の実施形態に係る画像解析システムを説明する。
<Third embodiment>
Hereinafter, the image analysis system according to the third embodiment will be described with respect to the differences from the image analysis system according to the second embodiment.
[構成の概要]
図17を参照すると、第3の実施形態に係る画像解析システムは、ベンダ側装置100と、ユーザ側装置200とを備える。ベンダ側装置100は統合型の画像解析装置100Bとして動作し、ユーザ側装置200は端末装置200Cとして動作する。画像解析装置100Bは、例えば汎用コンピュータで構成されており、第1の実施形態において説明した深層学習処理および画像解析処理の両方の処理を行う、クラウドサーバ側の装置である。端末装置200Cは、例えば汎用コンピュータで構成されており、ネットワーク99を通じて、解析対象の画像を画像解析装置100Bに送信し、ネットワーク99を通じて、解析結果の画像を画像解析装置100Bから受信する、ユーザ側の端末装置である。
[Configuration overview]
Referring to FIG. 17, the image analysis system according to the third embodiment includes a vendor device 100 and a user device 200. The vendor device 100 operates as an integrated image analysis device 100B, and the user device 200 operates as a terminal device 200C. The image analysis device 100B is configured of, for example, a general-purpose computer, and is a device on the cloud server side that performs both the deep learning processing and the image analysis processing described in the first embodiment. The terminal device 200C is composed of, for example, a general-purpose computer, and is a user side that transmits an image to be analyzed to the image analysis device 100B through the network 99, and receives an image resulting from the analysis from the image analysis device 100B through the network 99. This is a terminal device.
第3の実施形態に係る画像解析システムは、ベンダ側に設置された統合型の画像解析装置100Bが、第1の実施形態に係る深層学習装置100Aおよび画像解析装置200Aの両方の機能を担う点において、第2の実施形態に係る画像解析システムと同様である。一方、第3の実施形態に係る画像解析システムは、端末装置200Cを備え、解析対象の画像の入力インタフェースと、解析結果の画像の出力インタフェースとをユーザ側の端末装置200Cに提供する点において、第2の実施形態に係る画像解析システムと異なる。つまり、第3の実施形態に係る画像解析システムは、深層学習処理および画像解析処理を行うベンダ側が、解析対象の画像および解析結果の画像の入出力インタフェースをユーザ側に提供する、クラウドサービス型のシステムである。 In the image analysis system according to the third embodiment, an integrated image analysis device 100B installed on the vendor side has the functions of both the deep learning device 100A and the image analysis device 200A according to the first embodiment. This is the same as the image analysis system according to the second embodiment. On the other hand, the image analysis system according to the third embodiment includes a terminal device 200C, and provides the user-side terminal device 200C with an input interface for an image to be analyzed and an output interface for an image as an analysis result. This is different from the image analysis system according to the second embodiment. In other words, the image analysis system according to the third embodiment is a cloud service type in which a vendor side that performs deep learning processing and image analysis processing provides an input/output interface for images to be analyzed and images of analysis results to the user side. It is a system.
画像解析装置100Bは撮像装置300に接続されており、撮像装置300によって撮像される、学習用の組織の訓練用画像を取得する。 The image analysis device 100B is connected to the imaging device 300, and acquires training images of the learning tissue captured by the imaging device 300.
端末装置200Cは撮像装置400に接続されており、撮像装置400によって撮像される、解析対象の組織の解析対象画像78を取得する。 The terminal device 200C is connected to the imaging device 400, and acquires an analysis target image 78 of the tissue to be analyzed, which is captured by the imaging device 400.
[ハードウェア構成]
画像解析装置100Bのハードウェア構成は、図7に示すベンダ側装置100のハードウェア構成と同様である。端末装置200Cのハードウェア構成は、図9に示すユーザ側装置200のハードウェア構成と同様である。
[Hardware configuration]
The hardware configuration of the image analysis device 100B is similar to the hardware configuration of the vendor-side device 100 shown in FIG. The hardware configuration of the terminal device 200C is similar to the hardware configuration of the user side device 200 shown in FIG.
[機能ブロックおよび処理手順]
図18を参照すると、第3の実施形態に係る画像解析装置100Bの処理部10Bは、訓練データ生成部101と、訓練データ入力部102と、アルゴリズム更新部103と、解析用データ生成部201と、解析用データ入力部202と、解析部203と、領域検出部204とを備える。これらの機能ブロックは、コンピュータに深層学習処理および画像解析処理を実行させるプログラムを、処理部10Bの記憶部13またはメモリ12にインストールし、このプログラムをCPU11が実行することにより実現される。ウィンドウサイズデータベース104と、アルゴリズムデータベース105とは、処理部10Bの記憶部13またはメモリ12に記憶され、どちらも深層学習時および画像解析処理時に共通して使用される。ニューラルネットワーク50は、組織の種別と対応付けられて、アルゴリズムデータベース105に予め格納されており、深層学習処理により結合重みwが更新されて、深層学習アルゴリズム60として、アルゴリズムデータベース105に格納される。
[Functional blocks and processing procedures]
Referring to FIG. 18, the processing unit 10B of the image analysis apparatus 100B according to the third embodiment includes a training data generation unit 101, a training data input unit 102, an algorithm update unit 103, and an analysis data generation unit 201. , an analysis data input section 202, an analysis section 203, and a region detection section 204. These functional blocks are realized by installing a program that causes a computer to execute deep learning processing and image analysis processing in the storage unit 13 or memory 12 of the processing unit 10B, and having the CPU 11 execute this program. The window size database 104 and the algorithm database 105 are stored in the storage unit 13 or the memory 12 of the processing unit 10B, and both are used in common during deep learning and image analysis processing. The neural network 50 is stored in advance in the algorithm database 105 in association with the type of tissue, and the connection weights w are updated by deep learning processing and stored in the algorithm database 105 as the deep learning algorithm 60.
なお、訓練用画像である第1の訓練用画像70R1、第2の訓練用画像70R2、第3の訓練用画像70R3は、撮像装置300によって予め撮像され、処理部10Bの記憶部13またはメモリ12に予め記憶されていることとする。解析対象の組織の解析対象画像78も、撮像装置400によって予め撮像され、端末装置200Cの処理部20Cの記憶部23またはメモリ22に予め記憶されていることとする。 Note that the first training image 70R1, second training image 70R2, and third training image 70R3, which are training images, are captured in advance by the imaging device 300, and are stored in the storage unit 13 or memory 12 of the processing unit 10B. is stored in advance. It is assumed that an analysis target image 78 of a tissue to be analyzed is also captured in advance by the imaging device 400 and stored in advance in the storage unit 23 or memory 22 of the processing unit 20C of the terminal device 200C.
画像解析装置100Bの処理部10Bは、深層学習処理時には、図11に示す処理を行い、画像解析処理時には、図14に示す処理を行う。図18に示す各機能ブロックを用いて説明すると、深層学習処理時には、ステップS10からS12、S14、S18およびS19の処理は、訓練データ生成部101が行う。ステップS13の処理は、訓練データ入力部102が行う。ステップS16およびS17の処理は、アルゴリズム更新部103が行う。画像解析処理時には、ステップS21およびS22の処理は、解析用データ生成部201が行う。ステップS23,S24,S26およびS27の処理は、解析用データ入力部202が行う。ステップS25およびS28の処理は、解析部203が行う。ステップS29の処理は、領域検出部204が行う。 The processing unit 10B of the image analysis device 100B performs the processing shown in FIG. 11 during deep learning processing, and performs the processing shown in FIG. 14 during image analysis processing. To explain using each functional block shown in FIG. 18, during deep learning processing, the training data generation unit 101 performs the processing from steps S10 to S12, S14, S18, and S19. The process of step S13 is performed by the training data input unit 102. The processing in steps S16 and S17 is performed by the algorithm updating unit 103. During image analysis processing, the processing of steps S21 and S22 is performed by the analysis data generation unit 201. The processing of steps S23, S24, S26, and S27 is performed by the analysis data input unit 202. The processing in steps S25 and S28 is performed by the analysis unit 203. The process in step S29 is performed by the area detection unit 204.
第3の実施形態に係る画像解析装置100Bが行う深層学習処理の手順および画像解析処理の手順は、第1の実施形態に係る深層学習装置100Aおよび画像解析装置200Aがそれぞれ行う手順と同様である。なお、第3の実施形態に係る画像解析装置100Bは、次の4つの点において第1の実施形態に係る深層学習装置100Aおよび画像解析装置200Aと異なる。 The deep learning processing procedure and the image analysis processing procedure performed by the image analysis device 100B according to the third embodiment are similar to the procedures performed by the deep learning device 100A and the image analysis device 200A according to the first embodiment, respectively. . Note that the image analysis device 100B according to the third embodiment differs from the deep learning device 100A and the image analysis device 200A according to the first embodiment in the following four points.
図14に示す画像解析処理時のステップS21において、処理部10Bは、解析対象の組織の解析対象画像78を、ユーザ側の端末装置200Cから受信し、受信した解析対象画像78からR、G、B各色の色濃度符号化図79r,79g,79bを生成する。色濃度符号化図79r,79g,79bおよび解析対象データの生成方法は、図11に示す深層学習処理時におけるステップS10での生成方法と同様である。 In step S21 during the image analysis process shown in FIG. 14, the processing unit 10B receives the analysis target image 78 of the tissue to be analyzed from the user's terminal device 200C, and from the received analysis target image 78, R, G, Color density encoded diagrams 79r, 79g, and 79b for each B color are generated. The method of generating the color density encoding diagrams 79r, 79g, and 79b and the data to be analyzed is the same as the method of generating them in step S10 during the deep learning process shown in FIG. 11.
図14に示す画像解析処理時のステップS22において、処理部10Bは、端末装置200Cの入力部26を通じて、解析条件として、端末装置200Cのユーザからの、組織の種別の入力を受け付ける。処理部10Bは、入力された組織の種別に基づき、ウィンドウサイズデータベース104およびアルゴリズムデータベース105を参照して、解析に用いるウィンドウサイズを設定し、解析に用いる深層学習アルゴリズム60を取得する。 In step S22 during the image analysis process shown in FIG. 14, the processing unit 10B receives an input of the type of organization from the user of the terminal device 200C as an analysis condition through the input unit 26 of the terminal device 200C. Based on the input tissue type, the processing unit 10B refers to the window size database 104 and the algorithm database 105, sets the window size to be used in the analysis, and obtains the deep learning algorithm 60 to be used in the analysis.
画像解析処理時のステップS28において、処理部10Bは、解析結果の3値画像83を、ユーザ側の端末装置200Cに送信する。ユーザ側の端末装置200Cでは、処理部20Cが、受信した解析結果の3画像83を出力部27に出力する。 In step S28 during the image analysis process, the processing unit 10B transmits the ternary image 83 as the analysis result to the user's terminal device 200C. In the user's terminal device 200C, the processing unit 20C outputs the three images 83 of the received analysis results to the output unit 27.
画像解析処理時のステップS29において、処理部10Bは、ステップS28に引き続き、解析結果の3値画像83についてさらに、核領域の検出処理を行う。任意のステップとして、処理部10Bは、得られた各領域を、解析対象の解析対象画像78に重ねることにより、領域強調画像84を作成する。処理部10Bは、作成した領域強調画像84を、ユーザ側の端末装置200Cに送信する。ユーザ側の端末装置200Cでは、処理部20Cが、受信した領域強調画像84を出力部27に出力し、画像解析処理を終了する。 In step S29 during image analysis processing, the processing unit 10B further performs nuclear region detection processing on the ternary image 83 as the analysis result, subsequent to step S28. As an optional step, the processing unit 10B creates a region-enhanced image 84 by superimposing each obtained region on the analysis target image 78 to be analyzed. The processing unit 10B transmits the created region-enhanced image 84 to the user's terminal device 200C. In the user's terminal device 200C, the processing unit 20C outputs the received region-enhanced image 84 to the output unit 27, and ends the image analysis process.
以上、端末装置200Cのユーザは、解析対象の組織の解析対象画像78を画像解析装置100Bに送信することにより、解析結果として、3値画像83を取得することができる。さらに、端末装置200Cのユーザは、解析結果として、領域強調画像84を取得することができる。 As described above, the user of the terminal device 200C can obtain the ternary image 83 as an analysis result by transmitting the analysis target image 78 of the tissue to be analyzed to the image analysis apparatus 100B. Further, the user of the terminal device 200C can obtain the region-enhanced image 84 as an analysis result.
第3の実施形態に係る画像解析装置100Bによると、ユーザは、ウィンドウサイズデータベース104およびアルゴリズムデータベース105を深層学習装置100Aから取得することなく、画像解析処理の結果を享受することができる。これにより、解析対象の組織を解析するサービスとして、腫瘍領域および/または非腫瘍領域を判別し各組織における腫瘍領域をスクリーニングするサービスを、クラウドサービスとして提供することができる。 According to the image analysis device 100B according to the third embodiment, the user can enjoy the results of image analysis processing without acquiring the window size database 104 and the algorithm database 105 from the deep learning device 100A. Thereby, as a service for analyzing a tissue to be analyzed, a service for determining tumor regions and/or non-tumor regions and screening tumor regions in each tissue can be provided as a cloud service.
[コンピュータプログラム]
本発明の実施形態には、前記ステップS10からS20を処理部10A,20B,10Bに実行させ、学習済み深層学習アルゴリズムの生成するコンピュータプログラムおよびその製品が含まれる。また、本発明の実施形態には、前記ステップS21からS29を処理部10A,20B,10Bに実行させ、コンピュータを個体から採取された組織の画像を解析するために機能させるコンピュータプログラムおよびその製品が含まれる。
[Computer program]
Embodiments of the present invention include a computer program that causes the processing units 10A, 20B, and 10B to execute steps S10 to S20 and generates a trained deep learning algorithm, and products thereof. Further, an embodiment of the present invention includes a computer program and product thereof that causes the processing units 10A, 20B, and 10B to execute the steps S21 to S29 and causes the computer to function to analyze images of tissues collected from an individual. included.
[その他の形態]
以上、本発明を概要および特定の実施形態によって説明したが、本発明は上記した概要および各実施形態に限定されるものではない。
[Other forms]
Although the present invention has been described above using the outline and specific embodiments, the present invention is not limited to the above-described outline and each embodiment.
上記第1から第3の実施形態では、ステップS13において、処理部10A,20B,10Bは、ウィンドウサイズデータベース104を参照して、ウィンドウサイズの画素数を設定しているが、オペレータまたはユーザがウィンドウサイズを直接設定してもよい。この場合、ウィンドウサイズデータベース104は不要となる。 In the first to third embodiments described above, in step S13, the processing units 10A, 20B, and 10B refer to the window size database 104 to set the number of pixels of the window size. You can also set the size directly. In this case, the window size database 104 becomes unnecessary.
上記第1から第3の実施形態では、ステップS13において、処理部10A,20B,10Bは、入力された組織の種別に基づいて、ウィンドウサイズの画素数を設定しているが、組織の種別の入力に代えて、組織のサイズを入力してもよい。処理部10A,20B,10Bは、入力された組織のサイズに基づいて、ウィンドウサイズデータベース104を参照して、ウィンドウサイズの画素数を設定すればよい。ステップS22においてもステップS13と同様に、組織の種別の入力に代えて、組織のサイズを入力してもよい。処理部20A,20B,10Bは、入力された組織のサイズに基づいて、ウィンドウサイズデータベース104およびアルゴリズムデータベース105を参照して、ウィンドウサイズの画素数を設定し、ニューラルネットワーク60を取得すればよい。 In the first to third embodiments described above, in step S13, the processing units 10A, 20B, and 10B set the number of pixels of the window size based on the input tissue type. Instead of the input, the size of the organization may be input. The processing units 10A, 20B, and 10B may refer to the window size database 104 and set the number of pixels of the window size based on the input tissue size. In step S22, as in step S13, instead of inputting the type of organization, the size of the organization may be input. The processing units 20A, 20B, and 10B refer to the window size database 104 and the algorithm database 105 based on the input tissue size, set the number of pixels of the window size, and acquire the neural network 60.
組織のサイズを入力する態様については、サイズを数値として直接入力してもよいし、例えば入力のユーザインタフェースをプルダウンメニューとして、ユーザが入力しようとするサイズに対応する、所定の数値範囲をユーザに選択させて入力してもよい。 Regarding the mode of inputting the size of the organization, the size may be input directly as a numerical value, or, for example, the input user interface may be set as a pull-down menu to prompt the user for a predetermined range of numerical values corresponding to the size that the user is trying to input. You may select and input.
また、ステップS13およびステップS22において、組織の種別または組織のサイズに加えて、訓練用画像、および解析対象画像78を撮像した際の撮像倍率を入力してもよい。撮像倍率を入力する態様については、倍率を数値として直接入力してもよいし、例えば入力のユーザインタフェースをプルダウンメニューとして、ユーザが入力しようとする倍率に対応する、所定の数値範囲をユーザに選択させて入力してもよい。 Furthermore, in step S13 and step S22, in addition to the tissue type or tissue size, the imaging magnification at which the training image and the analysis target image 78 were captured may be input. Regarding the mode of inputting the imaging magnification, the magnification may be directly input as a numerical value, or, for example, the input user interface may be set as a pull-down menu and the user can select a predetermined range of numerical values corresponding to the magnification that the user wants to input. You can also input it by
上記第1から第3の実施形態では、深層学習処理時および画像解析処理時において、説明の便宜のためにウィンドウサイズを3×3画素と設定しているが、ウィンドウサイズの画素数はこれに限定されない。ウィンドウサイズは、例えば組織の種別に応じて設定してもよい。この場合、ウィンドウサイズの画素数と画像に含まれる色の原色の数との積が、ニューラルネットワーク50,60の入力層50a,60aのノード数に対応していればよい。 In the first to third embodiments above, the window size is set to 3 x 3 pixels for the convenience of explanation during deep learning processing and image analysis processing, but the number of pixels in the window size is set to 3 x 3 pixels for convenience of explanation. Not limited. The window size may be set depending on the type of organization, for example. In this case, it is sufficient that the product of the number of pixels of the window size and the number of primary colors included in the image corresponds to the number of nodes in the input layers 50a and 60a of the neural networks 50 and 60.
上記第1から第3の実施形態では、ステップS17において、処理部10A,20B,10Bは、深層学習アルゴリズム60を、組織の種別と一対一に対応付けて、アルゴリズムデータベース105に記憶している。これに代えて、ステップS17において、処理部10A,20B,10Bは、1つの深層学習アルゴリズム60に、複数の組織の種別を対応付けて、アルゴリズムデータベース105に記憶してもよい。 In the first to third embodiments described above, in step S17, the processing units 10A, 20B, and 10B store the deep learning algorithm 60 in the algorithm database 105 in one-to-one correspondence with the type of organization. Alternatively, in step S17, the processing units 10A, 20B, and 10B may store one deep learning algorithm 60 in association with a plurality of tissue types in the algorithm database 105.
上記第1から第3の実施形態では、色相は、光の3原色の組み合わせ、または色の3原色の組み合わせで規定されているが、色相の数は3つに限定されない。色相の数は、赤(R),緑(G),青(B)に黄(Y)を加えた4原色としても良いし、赤(R),緑(G),青(B)の3原色からいずれか1つの色相を減らした2原色としてもよい。あるいは、赤(R),緑(G),青(B)の3原色のいずれか1つ(例えば緑(G))のみの1原色としてもよい。例えば公知の顕微鏡またはバーチャルスライドスキャナ等を用いて取得される訓練用画像70R1,70R2,70R3および解析対象画像78も、赤(R),緑(G),青(B)の3原色のカラー画像に限定されず、2原色のカラー画像であってもよく、1以上の原色を含む画像であればよい。 In the first to third embodiments described above, the hue is defined by a combination of three primary colors of light or a combination of three primary colors of color, but the number of hues is not limited to three. The number of hues may be the four primary colors of red (R), green (G), blue (B) plus yellow (Y), or the three primary colors of red (R), green (G), and blue (B). It is also possible to use two primary colors obtained by subtracting one of the hues from the primary colors. Alternatively, only one of the three primary colors red (R), green (G), and blue (B) (for example, green (G)) may be used. For example, the training images 70R1, 70R2, 70R3 and the analysis target image 78 acquired using a known microscope or virtual slide scanner are also color images of the three primary colors of red (R), green (G), and blue (B). The image is not limited to , and may be a color image of two primary colors, as long as it includes one or more primary colors.
上記第1から第3の実施形態では、ステップS10において、処理部10A,20B,10Bは、訓練用画像の各色濃度符号化図(色濃度符号化図70R1r,70R1g,70R1b、色濃度符号化図70R2r,70R2g,70R2b、色濃度符号化図70R3r,70R3g,70R3b)を各原色の8ビット(256段階)の単一色画像として生成しているが、各色濃度符号化図を作成する際の原色の階調は、8ビットに制限されない。各色濃度符号化図の階調は、スライドイメージスキャナの撮像条件に依存してもよい。例えば、1ビット以上であり2ビット、4ビット、16ビット、24ビットの画像であってもよい。同様に、ステップS21において、処理部20A,20B,10Bは、色濃度符号化図79r,79g,79b各原色の単一色画像として生成しているが、色濃度符号化図を作成する際の原色の階調は3階調に制限されない。色濃度符号化図を作成する際の原色は、8ビットに制限されない。色濃度符号化図79r,79g,79bの階調は、スライドイメージスキャナの撮像条件に依存してもよい。例えば、1ビット以上であり2ビット、4ビット、16ビット、24ビットの画像であってもよい。訓練用画像の各色濃度符号化図および色濃度符号化図79r,79g,79bの階調は、全てが同じ階調であることが好ましい。 In the first to third embodiments described above, in step S10, the processing units 10A, 20B, and 10B each color density encoded diagram (color density encoded diagram 70R1r, 70R1g, 70R1b, color density encoded diagram 70R1b, color density encoded diagram 70R2r, 70R2g, 70R2b, color density encoded diagrams 70R3r, 70R3g, 70R3b) are generated as 8-bit (256 steps) single color images of each primary color, but the primary color when creating each color density encoded diagram is Gradation is not limited to 8 bits. The gradation of each color density encoded map may depend on the imaging conditions of the slide image scanner. For example, the image may be one bit or more, and may be a 2-bit, 4-bit, 16-bit, or 24-bit image. Similarly, in step S21, the processing units 20A, 20B, and 10B generate the color density encoded diagrams 79r, 79g, and 79b as single color images of each primary color. The gradations are not limited to three gradations. The primary colors used when creating a color density encoded diagram are not limited to 8 bits. The gradations of the color density encoded diagrams 79r, 79g, and 79b may depend on the imaging conditions of the slide image scanner. For example, the image may be one bit or more, and may be a 2-bit, 4-bit, 16-bit, or 24-bit image. It is preferable that the gradations of each color density encoded diagram and the color density encoded diagrams 79r, 79g, and 79b of the training image are all the same gradation.
上記第1から第3の実施形態では、ステップS10において、処理部10A,20B,10Bは、訓練用画像から、各色濃度符号化図を生成しているが、予め各画素が階調に応じて符号化された行列表を訓練用画像として用いてもよい。処理部10A,20B,10Bは、訓練用画像を各色濃度符号化図として、例えばバーチャルスライドスキャナ等から直接取得してもよい。同様に、ステップS21において、処理部20A,20B,10Bは、解析対象画像78からR、G、B各色の色濃度符号化図79r,79g,79bを生成しているが、予め各画素が階調に応じて符号化された行列表を解析用画像として用いてもよい。すなわち、処理部20A,20B,10Bは、色濃度符号化図79r,79g,79bを、例えばバーチャルスライドスキャナ等から直接取得してもよい。 In the first to third embodiments described above, in step S10, the processing units 10A, 20B, and 10B generate each color density encoded diagram from the training image. A coded matrix table may be used as a training image. The processing units 10A, 20B, and 10B may directly acquire training images as color density encoded images from, for example, a virtual slide scanner. Similarly, in step S21, the processing units 20A, 20B, and 10B generate color density encoded diagrams 79r, 79g, and 79b for each color of R, G, and B from the analysis target image 78, but each pixel is A matrix table encoded according to the key may be used as an analysis image. That is, the processing units 20A, 20B, and 10B may directly acquire the color density encoded diagrams 79r, 79g, and 79b from, for example, a virtual slide scanner.
上記第1から第3の実施形態では、訓練用画像から各色濃度符号化図を生成する際のカラースペースにはRGBを用いているが、カラースペースはRGBに制限されない。RGB以外にも、YUV、CMY、およびCIE L*a*b*等の種々のカラースペースを用いることができる。 In the first to third embodiments described above, RGB is used as the color space when generating each color density encoded diagram from the training image, but the color space is not limited to RGB. In addition to RGB, various color spaces such as YUV, CMY, and CIE L * a * b * can be used.
上記第1から第3の実施形態では、各領域訓練データおよび解析用データ80において、各画素について濃度値が赤(R),緑(G),青(B)の順番で格納されているが、濃度値を格納および取り扱う順番はこれに限定されない。例えば濃度値は、青(B),緑(G),赤(R)の順番で格納されていてもよく、各領域訓練データにおける濃度値の並び順と、解析用データ80における濃度値の並び順とが同じであればよい。 In the first to third embodiments described above, in each region training data and analysis data 80, the density values for each pixel are stored in the order of red (R), green (G), and blue (B). , the order in which the density values are stored and handled is not limited to this. For example, the density values may be stored in the order of blue (B), green (G), and red (R), and the order of arrangement of density values in each region training data and the arrangement of density values in analysis data 80 It is sufficient if the order is the same.
上記第1から第3の実施形態では、処理部10A,10Bは一体の装置として実現されているが、処理部10A,10Bは一体の装置である必要はなく、CPU11、メモリ12、記憶部13等が別所に配置され、これらがネットワークで接続されていてもよい。処理部10A,10Bと、入力部16と、出力部17とについても、一ヶ所に配置される必要は必ずしもなく、それぞれ別所に配置されて互いにネットワークで通信可能に接続されていてもよい。処理部20A,20B,20Cについても処理部10A,10Bと同様である。 In the first to third embodiments described above, the processing units 10A and 10B are realized as an integrated device, but the processing units 10A and 10B do not need to be integrated devices, and include the CPU 11, memory 12, storage unit 13, etc. may be placed in separate locations and connected via a network. The processing units 10A, 10B, the input unit 16, and the output unit 17 do not necessarily need to be placed in one place, but may be placed in separate places and connected to each other so as to be communicable via a network. The processing units 20A, 20B, and 20C are also similar to the processing units 10A and 10B.
上記第1から第3の実施形態では、訓練データ生成部101、訓練データ入力部102、アルゴリズム更新部103、解析用データ生成部201、解析用データ入力部202、解析部203および領域検出部204の各機能ブロックは、単一のCPU11または単一のCPU21において実行されているが、これら各機能ブロックは単一のCPUにおいて実行される必要は必ずしもなく、複数のCPUで分散して実行されてもよい。また、これら各機能ブロックは、複数のGPUで分散して実行されてもよいし、複数のCPUと複数のGPUとで分散して実行されてもよい。 In the first to third embodiments described above, a training data generation section 101, a training data input section 102, an algorithm update section 103, an analysis data generation section 201, an analysis data input section 202, an analysis section 203, and a region detection section 204. Each functional block is executed on a single CPU 11 or a single CPU 21, but each of these functional blocks does not necessarily need to be executed on a single CPU, but may be executed in a distributed manner on multiple CPUs. Good too. Further, each of these functional blocks may be executed in a distributed manner by a plurality of GPUs, or may be executed in a distributed manner by a plurality of CPUs and a plurality of GPUs.
上記第2および第3の実施形態では、図11および図14で説明する各ステップの処理を行うためのプログラムを記憶部13,23に予め記憶している。これに代えて、プログラムは、例えばDVD-ROMやUSBメモリ等の、コンピュータ読み取り可能であって非一時的な有形の記憶媒体98から処理部10B,20Bにインストールしてもよい。または、処理部10B,20Bをネットワーク99と接続し、ネットワーク99を介して例えば外部のサーバ(図示せず)からプログラムをダウンロードしてインストールしてもよい。 In the second and third embodiments described above, programs for performing the processing of each step explained in FIGS. 11 and 14 are stored in advance in the storage units 13 and 23. Alternatively, the program may be installed in the processing unit 10B, 20B from a computer-readable, non-transitory tangible storage medium 98, such as a DVD-ROM or a USB memory. Alternatively, the processing units 10B and 20B may be connected to the network 99, and a program may be downloaded and installed from, for example, an external server (not shown) via the network 99.
上記第1から第3の実施形態では、入力部16,26はキーボードまたはマウス等の入力装置であり、出力部17,27は液晶ディスプレイ等の表示装置として実現されている。これに代えて、入力部16、26と出力部17、27とを一体化してタッチパネル式の表示装置として実現してもよい。または、出力部17,27をプリンター等で構成し、解析結果の3値画像83または領域強調画像84を印刷して出力してもよい。 In the first to third embodiments described above, the input units 16 and 26 are input devices such as a keyboard or a mouse, and the output units 17 and 27 are realized as display devices such as a liquid crystal display. Alternatively, the input sections 16, 26 and the output sections 17, 27 may be integrated into a touch panel type display device. Alternatively, the output units 17 and 27 may be configured with a printer or the like, and the ternary image 83 or the region-enhanced image 84 resulting from the analysis may be printed and output.
上記第1から第3の実施形態では、撮像装置300は、深層学習装置100Aまたは画像解析装置100Bと直接接続されているが、撮像装置300は、ネットワーク99を介して深層学習装置100Aまたは画像解析装置100Bと接続されていてもよい。撮像装置400についても同様に、撮像装置400は、画像解析装置200Aまたは画像解析装置200Bと直接接続されているが、撮像装置400は、ネットワーク99を介して画像解析装置200Aまたは画像解析装置200Bと接続されていてもよい。 In the first to third embodiments described above, the imaging device 300 is directly connected to the deep learning device 100A or the image analysis device 100B; It may be connected to the device 100B. Similarly, the imaging device 400 is directly connected to the image analysis device 200A or the image analysis device 200B, but the imaging device 400 is connected to the image analysis device 200A or the image analysis device 200B via the network 99. May be connected.
<学習済み深層学習アルゴリズムの検証>
上記第2の実施形態に示すスタンドアロン型のシステムにて、深層学習処理および画像解析処理を行った。学習の対象とする組織として、腫瘍領域と正常領域を含むヒト胃がん組織を用いた。学習済みの深層学習アルゴリズムを作成するにあたり、組織標本の拡大倍率を1倍、3倍、5倍、10倍、20倍、および40倍と変化させて訓練用画像を撮像し、異なる拡大倍率の訓練用画像を用いた訓練データをニューラルネットワークに学習させ、解析結果の正確性を確認した。
学習データおよび解析データの詳細は、次の通りであった。
学習データ:106枚のホールスライドイメージ
検証用解析データ:45枚のホールスライドイメージ
<Verification of trained deep learning algorithm>
Deep learning processing and image analysis processing were performed using the stand-alone system shown in the second embodiment. Human gastric cancer tissue, which includes a tumor region and a normal region, was used as the tissue to be studied. To create a trained deep learning algorithm, training images were taken with the tissue sample magnified at different magnifications of 1x, 3x, 5x, 10x, 20x, and 40x. The neural network was trained on training data using training images, and the accuracy of the analysis results was confirmed.
The details of the learning data and analysis data were as follows.
Learning data: 106 hole slide images Verification analysis data: 45 hole slide images
[訓練データの作成および学習]
HE染色した胃がん組織の明視野画像のホールスライドイメージを、バーチャルスライドスキャナ(NanoZoomer-XR、(Hamamatsu Photonics;スキャン分解能:20倍モードスキャン時0.46 μm/pixel、40倍モードスキャン時0.23 μm/pixel))を用いてカラー撮像した。撮像倍率は1倍、3倍、5倍、10倍、20倍、および40倍とした。学習対象の組織を含むホールスライドイメージ上で、病理医が腫瘍領域、非腫瘍領域、および非組織領域を指定した。各領域が指定されたホールスライドイメージを上記の条件で分割し、訓練用画像とした。個々の訓練用画像について腫瘍領域であるか、非腫瘍領域であるか、非組織領域であるかを決定した。その際、腫瘍領域と非腫瘍領域が混在する組織の領域については、訓練用画像内の組織領域に該当する画素数のうち、腫瘍領域と指定された画素数が50%以上を占める場合には腫瘍領域とした。また、訓練用画像内の組織領域に該当する画素数のうち、非腫瘍領域と指定された画素数が占める割合が100%の場合には非腫瘍領域とした。非組織領域と組織領域が混在する訓練用画像については、組織領域が訓練用画像の画素数の0%である場合に非組織領域とし、それ以外は組織領域とした。腫瘍領域、非腫瘍領域、非組織領域と判定されたそれぞれの訓練用画像の各画素について、各領域を区別するラベル値(腫瘍領域は「1」、非腫瘍領域は「2」、非組織領域は「0」)を付与し、第1の予備訓練データ70R1L、第2の予備訓練データ70R2Lおよび第3の予備訓練データ70R2Lを生成した。腫瘍領域と判定された訓練用画像を第1の訓練用画像とし、非腫瘍領域と判定された訓練用画像を第2の訓練用画像70R2とし、非組織領域と判定された訓練用画像を第3の訓練用画像70R3とした。各訓練用画像についてR、G、B各色の色濃度値を8ビットで階調化して、R、G、B各色の色濃度符号化図を生成し、作成したR、G、B各色の色濃度符号化図を組み合わせて第1の訓練データ74R1、第2の訓練データ74R2、第3の訓練データ74R3のそれぞれを生成した。
[Creating training data and learning]
A whole slide image of a bright field image of HE-stained gastric cancer tissue was scanned using a virtual slide scanner (NanoZoomer-XR, (Hamamatsu Photonics; scanning resolution: 0.46 μm/pixel when scanning in 20x mode, 0.23 μm/pixel when scanning in 40x mode). ) was used to capture color images. The imaging magnification was 1x, 3x, 5x, 10x, 20x, and 40x. A pathologist designated a tumor region, a non-tumor region, and a non-tissue region on a whole slide image containing the tissue to be studied. A whole slide image in which each region was designated was divided according to the above conditions and used as a training image. It was determined whether each training image was a tumor region, a non-tumor region, or a non-tissue region. At that time, for tissue regions where tumor regions and non-tumor regions coexist, if the number of pixels designated as tumor regions occupies 50% or more of the number of pixels corresponding to tissue regions in the training image, It was defined as the tumor area. Furthermore, if the number of pixels designated as a non-tumor region accounts for 100% of the number of pixels corresponding to a tissue region in the training image, the region is determined to be a non-tumor region. For training images in which non-tissue areas and tissue areas coexist, if the tissue area is 0% of the number of pixels of the training image, it is considered a non-tissue area, and other areas are considered tissue areas. For each pixel of each training image determined to be a tumor region, non-tumor region, or non-tissue region, a label value that distinguishes each region (“1” for a tumor region, “2” for a non-tumor region, a non-tissue region was assigned "0"), and the first preliminary training data 70R1L, the second preliminary training data 70R2L, and the third preliminary training data 70R2L were generated. The training image determined to be a tumor region is set as the first training image, the training image determined to be a non-tumor region is set as the second training image 70R2, and the training image determined to be a non-tissue region is set as the first training image. 3 as the training image 70R3. For each training image, the color density values of each color of R, G, and B are gradated using 8 bits to generate a color density encoded diagram of each color of R, G, and B. The density coded maps were combined to generate first training data 74R1, second training data 74R2, and third training data 74R3, respectively.
その後、第1の訓練データ74R1と第1の予備訓練データ70R1Lとを組み合わせて腫瘍領域訓練データを作成した。第2の訓練データ74R2と第2の予備訓練データ70R2Lとを組み合わせて非腫瘍領域訓練データを作成した。第3の訓練データ74R3と第3の予備訓練データ70R2Lとを組み合わせて非組織領域訓練データを作成した。作成した各領域訓練データを200×200画素のウィンドウサイズに分割し、分割したウィンドウサイズの訓練データを入力層として、ニューラルネットワークを学習させた。 Thereafter, tumor region training data was created by combining the first training data 74R1 and the first preliminary training data 70R1L. Non-tumor region training data was created by combining the second training data 74R2 and the second preliminary training data 70R2L. Non-organized region training data was created by combining the third training data 74R3 and the third preliminary training data 70R2L. The created training data for each region was divided into a window size of 200 x 200 pixels, and a neural network was trained using the training data of the divided window size as an input layer.
各領域訓練データは組織標本の拡大倍率毎に生成し、拡大倍率毎にニューラルネットワークを学習させた。 Training data for each region was generated for each magnification of the tissue specimen, and the neural network was trained for each magnification.
[解析対象画像の作成]
訓練データと同様に、HE染色したヒト胃がん組織の明視野画像のホールスライドイメージを、バーチャルスライドスキャナを用いてカラー撮像し解析用画像を得た。撮像倍率は1倍、3倍、5倍、10倍、20倍、および40倍とした。その後、撮像した解析用画像をもとにR、G、B各色の色濃度符号化図を作成し、作成したR、G、B各色の色濃度符号化図を組み合わせて解析対象データを生成した。解析対象データは、拡大倍率毎に生成した。
[Create image to be analyzed]
Similar to the training data, a whole slide image of a bright field image of HE-stained human gastric cancer tissue was imaged in color using a virtual slide scanner to obtain an image for analysis. The imaging magnification was 1x, 3x, 5x, 10x, 20x, and 40x. Thereafter, color density coding diagrams for each color of R, G, and B were created based on the captured analysis images, and data to be analyzed was generated by combining the created color density coding diagrams for each color of R, G, and B. . Data to be analyzed was generated for each magnification.
[解析結果]
解析対象データから200×200画素のウィンドウサイズの解析用データを作成し、解析用データを、拡大倍率に対応した学習済みのニューラルネットワークに入力した。ニューラルネットワークから出力される解析結果をもとに、腫瘍領域と、非腫瘍領域と、非組織領域(背景)とに分類し、解析処理により得られた腫瘍領域を白で表示し、非腫瘍領域をグレーで表示し、非組織領域を黒で表示するように処理した。解析結果を図19に示す。
[Analysis result]
Data for analysis with a window size of 200 x 200 pixels was created from the data to be analyzed, and the data for analysis was input into a trained neural network corresponding to the magnification. Based on the analysis results output from the neural network, it is classified into tumor areas, non-tumor areas, and non-tissue areas (background), and the tumor areas obtained through the analysis process are displayed in white, and the non-tumor areas are are displayed in gray, and non-tissue areas are displayed in black. The analysis results are shown in FIG. 19.
図19中、(a)は、胃がん組織をHE染色して撮像した明視野画像のホールスライドイメージであり、解析対象の画像である。(b)は、ホールスライドイメージの腫瘍領域を病理医が指定し実線で囲った像である。(c)は、拡大倍率1倍の訓練用画像と解析用画像を用いた解析結果を示す。病理医が指定した各領域を正確に示すことはできなかった。(d)は、拡大倍率5倍の訓練用画像と解析用画像を用いた解析結果を示す。病理医が指定した腫瘍領域を腫瘍領域として概ね判別することができた。また、病理医が指定した非腫瘍領域を非腫瘍領域として概ね判別することができた。病理医が指定した非組織領域を非組織領域として概ね判別することができた。(e)は、拡大倍率40倍の訓練用画像と解析用画像を用いた解析結果を示す。病理医が指定した腫瘍領域を腫瘍領域としてある程度判別することができた。しかし、病理医が非腫瘍領域と指定した領域において、腫瘍領域と判定される領域が増えており、非腫瘍領域を腫瘍領域と誤判定する割合が高くなっていた。 In FIG. 19, (a) is a whole slide image of a bright field image obtained by staining gastric cancer tissue with HE, and is an image to be analyzed. (b) is a whole slide image in which a tumor region is designated by a pathologist and surrounded by a solid line. (c) shows an analysis result using a training image and an analysis image with a magnification of 1x. It was not possible to accurately indicate each area designated by the pathologist. (d) shows an analysis result using a training image and an analysis image with a magnification of 5 times. The tumor area designated by the pathologist could generally be determined as a tumor area. Furthermore, the non-tumor region specified by the pathologist could generally be determined as a non-tumor region. The non-tissue area designated by the pathologist could generally be determined as a non-tissue area. (e) shows an analysis result using a training image and an analysis image with a magnification of 40 times. The tumor area specified by the pathologist could be determined to some extent as a tumor area. However, in areas designated as non-tumor areas by pathologists, the number of areas determined to be tumor areas was increasing, and the rate of erroneously determining non-tumor areas as tumor areas was high.
以上の結果から、訓練用画像および解析用画像を取得する際の拡大倍率は低すぎても高すぎても誤判定の原因となることが示された。 The above results indicate that either too low or too high a magnification when acquiring training images and analysis images causes erroneous determinations.
図20中、(a)は、図19とは異なる胃がん組織をHE染色して撮像した明視野画像のホールスライドイメージであり、解析対象の画像である。(b)は、ホールスライドイメージの腫瘍領域を病理医が指定し実線で囲った像である。(c)は、拡大倍率5倍の訓練用画像と解析用画像を用いた解析結果を示す。病理医が指定した腫瘍領域を腫瘍領域として概ね判別することができた。また、病理医が指定した非腫瘍領域を非腫瘍領域として概ね判別することができた。病理医が指定した非組織領域を非組織領域として概ね判別することができた。(d)は、拡大倍率20倍の訓練用画像と解析用画像を用いた解析結果を示す。拡大倍率5倍の場合と同様に、病理医が指定した各領域を概ね判別することができた。 In FIG. 20, (a) is a whole slide image of a bright field image obtained by staining gastric cancer tissue with HE, which is different from that shown in FIG. 19, and is the image to be analyzed. (b) is a whole slide image in which a tumor region is designated by a pathologist and surrounded by a solid line. (c) shows an analysis result using a training image and an analysis image with a magnification of 5 times. The tumor area designated by the pathologist could generally be determined as a tumor area. Furthermore, the non-tumor region specified by the pathologist could generally be determined as a non-tumor region. The non-tissue area designated by the pathologist could generally be determined as a non-tissue area. (d) shows an analysis result using a training image and an analysis image with a magnification of 20 times. As with the case of 5x magnification, each region specified by the pathologist could be generally distinguished.
拡大倍率5倍の解析用画像について、下式にしたがって、ホールスライドイメージ1枚に存在する組織領域における腫瘍領域の含有率を算出した。 Regarding the image for analysis at a magnification of 5 times, the content rate of the tumor region in the tissue region present in one whole slide image was calculated according to the following formula.
腫瘍領域の含有率(%)={[腫瘍領域と判定された画素数]/[(腫瘍領域と判定された画素数)+(非腫瘍領域と判定された画素数)]}×100 Content rate of tumor area (%) = {[Number of pixels determined to be a tumor area]/[(Number of pixels determined to be a tumor area) + (Number of pixels determined to be a non-tumor area)]}×100
腫瘍領域の含有率は54.5%であった。 The tumor area content was 54.5%.
また、図21に各拡大倍率の感度(a)および陽性的中率(b)を示す。この結果から、訓練用画像および解析用画像を取得する際の組織標本の拡大倍率は、5から20倍が適切であると考えられた。また、図21にウィンドウサイズの画素数の違いによる感度(c)および陽性的中率(d)の変化を示す。解析用画像は拡大倍率5倍で撮像した。ウィンドウサイズの画素数は、125×125画素から200×200画素が好ましいと考えられた。 Furthermore, FIG. 21 shows the sensitivity (a) and positive predictive value (b) of each magnification. From this result, it was considered that a magnification of 5 to 20 times is appropriate for the tissue sample when acquiring images for training and images for analysis. Furthermore, FIG. 21 shows changes in sensitivity (c) and positive predictive value (d) due to differences in the number of pixels in the window size. Images for analysis were taken at a magnification of 5 times. It was considered that the number of pixels of the window size is preferably from 125 x 125 pixels to 200 x 200 pixels.
今回1枚のホールスライドイメージの解析時間は、数分~30分程度であった。 The analysis time for one whole slide image was approximately several to 30 minutes.
<付記事項>
ある実施形態は、ニューラルネットワーク構造の深層学習アルゴリズム(60)を用いて、組織の画像を解析する画像解析方法に関する。前記画像解析方法では、解析対象の組織を含む解析対象画像(78)から解析用データ(80)を生成し、解析用データ(80)を、深層学習アルゴリズム(60)に入力し、深層学習アルゴリズム(60)によって、解析用データに含まれる領域が腫瘍領域であるか否かを示すデータを生成してもよい。本発明によれば、解析対象の組織における解析用データに含まれる領域が腫瘍領域であるか否かを示すデータを生成することができる。
<Additional notes>
An embodiment relates to an image analysis method for analyzing tissue images using a deep learning algorithm (60) having a neural network structure. In the image analysis method, analysis data (80) is generated from an analysis target image (78) including a tissue to be analyzed, and the analysis data (80) is input to a deep learning algorithm (60). (60) may generate data indicating whether the region included in the analysis data is a tumor region. According to the present invention, it is possible to generate data indicating whether a region included in analysis data in a tissue to be analyzed is a tumor region.
前記実施形態において、好ましくは、解析用データに含まれる領域が腫瘍領域であるか否かを示すデータは、腫瘍領域の領域を示すデータである。この実施形態により、ユーザが一目で解析対象の組織における腫瘍領域を把握することができる。 In the embodiment, preferably, the data indicating whether the area included in the analysis data is a tumor area is data indicating an area of the tumor area. This embodiment allows the user to grasp the tumor region in the tissue to be analyzed at a glance.
前記実施形態において、好ましくは、前記解析対象画像は、組織診断用標本の画像であり、2以上の原色を組み合わせた色相を含む。この実施形態により、病理診断を一助することができる。 In the embodiment, preferably, the image to be analyzed is an image of a specimen for tissue diagnosis, and includes a hue that is a combination of two or more primary colors. This embodiment can assist in pathological diagnosis.
前記実施形態において、好ましくは、前記解析対象画像は、前記解析対象の組織を3倍から20倍に拡大して撮像された画像である。前記実施形態において、解析対象画像に含まれる領域の大きさが、200μm×200μm以上400μm×400μm以下である。これらの実施形態により、より精度の高い判別を行うことができる。 In the embodiment, preferably, the image to be analyzed is an image obtained by enlarging the tissue to be analyzed from 3 times to 20 times. In the embodiment, the size of the area included in the image to be analyzed is greater than or equal to 200 μm×200 μm and less than or equal to 400 μm×400 μm. These embodiments enable more accurate discrimination.
前記実施形態において、好ましくは、解析用データに含まれる領域が腫瘍領域であるか否かを示すデータに基づいて、腫瘍細胞の領域とそれ以外の領域とを区別して提示するためのデータを生成する。この実施形態により、ユーザが一目で解析対象の組織における腫瘍領域を把握することができる。 In the embodiment, preferably, data for distinguishing and presenting tumor cell regions and other regions is generated based on data indicating whether or not a region included in the analysis data is a tumor region. do. This embodiment allows the user to grasp the tumor region in the tissue to be analyzed at a glance.
前記実施形態において、好ましくは、解析用データに含まれる領域が腫瘍領域であるか否かを示すデータに基づいて、腫瘍細胞の領域とそれ以外の領域との境界を示すデータを生成する。この実施形態により、ユーザが一目で解析対象の組織における腫瘍領域と非腫瘍領域の境界を把握することができる。 In the embodiment, preferably, data indicating the boundary between the tumor cell area and other areas is generated based on data indicating whether the area included in the analysis data is a tumor area. This embodiment allows the user to grasp at a glance the boundary between the tumor region and non-tumor region in the tissue to be analyzed.
前記実施形態において、好ましくは、解析用データに含まれる領域が腫瘍領域であるか否かを示すデータに基づいて、前記解析対象の組織における腫瘍領域の含有率を示すデータを生成する。この実施形態により、ユーザが解析対象の組織における腫瘍領域の含有率を把握することができる。 In the embodiment, preferably, data indicating the content rate of the tumor region in the tissue to be analyzed is generated based on data indicating whether the region included in the analysis data is a tumor region. This embodiment allows the user to grasp the content rate of tumor regions in the tissue to be analyzed.
前記実施形態において、好ましくは、解析用データに含まれる領域が腫瘍領域であるか否かを示すデータに基づいて、前記解析対象の組織における腫瘍領域と非腫瘍領域の比率を示すデータを生成する。この実施形態により、ユーザが解析対象の組織における腫瘍領域の含有率を把握することができる。また、遺伝子検査等に使用されるサンプルが適切に採取されているか知ることができる。 In the embodiment, preferably, data indicating a ratio of a tumor area to a non-tumor area in the tissue to be analyzed is generated based on data indicating whether a region included in the analysis data is a tumor area. . This embodiment allows the user to grasp the content rate of tumor regions in the tissue to be analyzed. In addition, it is possible to know whether samples used for genetic testing, etc. are being collected appropriately.
前記実施態様により、好ましくは、1つの解析対象画像について、腫瘍領域と、非腫瘍領域と、組織を含まない領域とを区別して提示するためのデータを生成する。この実施形態により、ユーザが一目で解析対象の組織における腫瘍領域の有無を把握することができる。 According to the above-mentioned embodiment, data for distinguishing and presenting a tumor region, a non-tumor region, and a region not containing tissue is preferably generated for one analysis target image. This embodiment allows the user to grasp at a glance the presence or absence of a tumor region in the tissue to be analyzed.
前記実施形態において、好ましくは、1つの解析対象画像について所定画素数の領域毎に応じた複数の解析用データを生成する。この実施形態により、解析対象の組織の広い範囲について、精度よく解析を行うことができる。 In the embodiment, preferably, a plurality of pieces of analysis data are generated for each region of a predetermined number of pixels for one image to be analyzed. According to this embodiment, it is possible to accurately analyze a wide range of tissues to be analyzed.
前記実施形態において、好ましくは、深層学習アルゴリズム(60)は、入力された前記解析用データに対し前記所定画素数の領域が腫瘍領域および非腫瘍領域から選択される少なくとも一方を含むことを示すラベルを生成する。 In the embodiment, preferably, the deep learning algorithm (60) applies a label to the input analysis data indicating that the region of the predetermined number of pixels includes at least one selected from a tumor region and a non-tumor region. generate.
前記実施形態において、好ましくは、ニューラルネットワーク(50)の入力層(50a)のノード数が、解析用データ(80)の前記所定画素数と前記組み合わせた原色の数との積に対応している。この実施形態により、精度の高い解析を行うことができる。 In the embodiment, preferably, the number of nodes in the input layer (50a) of the neural network (50) corresponds to the product of the predetermined number of pixels of the analysis data (80) and the number of combined primary colors. . This embodiment allows highly accurate analysis to be performed.
前記実施形態において、好ましくは、前記標本が染色された標本であり、前記解析対象画像は、前記染色された標本を顕微鏡の明視野下で撮像した画像である。この実施形態により、病理診断を一助することができる。 In the embodiment, preferably, the specimen is a stained specimen, and the image to be analyzed is an image of the stained specimen taken under a bright field of a microscope. This embodiment can assist in pathological diagnosis.
前記実施形態において、好ましくは、前記深層学習アルゴリズムの学習に用いられる訓練データが、個体から採取された腫瘍領域を含む組織の標本に対して明視野観察用染色を施して作製された標本の染色像を顕微鏡の明視野下で撮像した明視野画像に基づいて生成されている。この実施形態により、組織診断を一助することができる。 In the embodiment, preferably, the training data used for learning the deep learning algorithm is staining of a specimen prepared by applying bright field observation staining to a tissue specimen including a tumor region collected from an individual. The image is generated based on a bright field image taken under the bright field of a microscope. This embodiment can aid in tissue diagnosis.
前記実施形態において、好ましくは、前記明視野観察用染色は、核染色にヘマトキシリンを用いる。より好ましくは、前記明視野観察用染色が、ヘマトキシリン・エオジン染色(HE染色)である。この実施形態により、組織診断として汎用性の高い検査を網羅することができる。 In the embodiment, preferably, the staining for bright field observation uses hematoxylin for nuclear staining. More preferably, the staining for bright field observation is hematoxylin and eosin staining (HE staining). This embodiment makes it possible to cover highly versatile tests for tissue diagnosis.
前記実施形態において、好ましくは、前記訓練データが、前記明視野画像から判定された、腫瘍領域であることを示すラベル値を含む。より好ましくは、前記訓練データが、前記ラベル値を前記明視野画像の所定画素数の領域毎に含む。この実施形態により、腫瘍領域の訓練データを生成することができる。 In the embodiment, preferably the training data includes a label value determined from the bright field image indicating a tumor region. More preferably, the training data includes the label value for each area of a predetermined number of pixels of the bright field image. This embodiment allows the generation of training data for tumor regions.
前記実施形態において、好ましくは、前記訓練データが、前記明視野画像における所定画素数の領域毎に生成されている。この態様により、深層学習アルゴリズム(50)の学習効率を上げることができる。 In the embodiment, preferably, the training data is generated for each region of a predetermined number of pixels in the bright field image. This aspect makes it possible to increase the learning efficiency of the deep learning algorithm (50).
前記実施形態において、好ましくは、前記深層学習アルゴリズムが、前記解析用データを、前記解析対象画像に含まれる組織が腫瘍領域であることを示すクラスに分類する。 In the embodiment, preferably, the deep learning algorithm classifies the analysis data into a class indicating that the tissue included in the analysis target image is a tumor region.
前記実施形態において、好ましくは、前記ニューラルネットワーク(50)の出力層(50b)がソフトマックス関数を活性化関数とするノードである。この実施形態により、学習効率および解析精度を上げることができる。 In the embodiment, preferably, the output layer (50b) of the neural network (50) is a node whose activation function is a softmax function. This embodiment can improve learning efficiency and analysis accuracy.
前記実施形態において、好ましくは、前記深層学習アルゴリズムは、解析用データ(78)が入力される度に、前記解析対象画像に含まれる組織が腫瘍領域であることを示すデータを所定画素数の領域毎に生成する。この実施形態により、解析効率を上げることができる。 In the embodiment, preferably, the deep learning algorithm extracts data indicating that the tissue included in the analysis target image is a tumor region into an area of a predetermined number of pixels each time the analysis data (78) is input. generated every time. This embodiment allows for increased analysis efficiency.
前記実施形態において、好ましくは、深層学習アルゴリズム(60)が、前記組織の種類に応じて生成されている。さらに、好ましくは、前記組織の種類に応じて複数の前記深層学習アルゴリズムの中から選択された、前記解析対象の組織の種類に対応する前記深層学習アルゴリズムを用いて、前記解析用データを処理する。この実施形態により、解析精度を上げることができる。 In said embodiment, preferably a deep learning algorithm (60) is generated depending on the type of tissue. Furthermore, preferably, the analysis data is processed using the deep learning algorithm corresponding to the type of tissue to be analyzed, which is selected from the plurality of deep learning algorithms according to the type of tissue. . This embodiment can improve analysis accuracy.
ある実施形態は、ニューラルネットワーク構造の深層学習アルゴリズム(60)を用いて、組織の画像を解析する画像解析装置(100)に関する。前記解析装置は、解析対象の組織を含む解析対象画像(78)から解析用データ(80)を生成し、解析用データ(80)を、深層学習アルゴリズム(50)に入力し、深層学習アルゴリズム(50)によって、前記解析用データに含まれる領域が腫瘍領域であるか否かを示すデータを生成する処理部(10)を備えてもよい。 One embodiment relates to an image analysis device (100) that analyzes tissue images using a deep learning algorithm (60) with a neural network structure. The analysis device generates analysis data (80) from an analysis target image (78) including a tissue to be analyzed, inputs the analysis data (80) to a deep learning algorithm (50), and inputs the analysis data (80) to a deep learning algorithm (50). 50) may include a processing unit (10) that generates data indicating whether or not a region included in the analysis data is a tumor region.
ある実施形態は、ニューラルネットワーク構造の深層学習アルゴリズム(60)を用いて、組織の画像を解析するコンピュータプログラムに関する。前記コンピュータに、解析対象の組織を含む解析対象画像(78)から解析用データ(80)を生成する処理と、解析用データ(80)を、深層学習アルゴリズム(60)に入力する処理と、深層学習アルゴリズム(60)によって、前記解析用データに含まれる領域が腫瘍領域であるか否かを示すデータを生成する処理と、を実行させてもよい。 Certain embodiments relate to a computer program that analyzes images of tissue using a deep learning algorithm (60) in a neural network structure. The computer includes a process of generating analysis data (80) from an analysis target image (78) including a tissue to be analyzed, a process of inputting the analysis data (80) into a deep learning algorithm (60), and a process of inputting the analysis data (80) into a deep learning algorithm (60). The learning algorithm (60) may perform a process of generating data indicating whether the region included in the analysis data is a tumor region.
ある実施態様は、深層学習アルゴリズム(50)の学習に用いられる訓練データを訓練用の組織標本から取得した訓練用画像に基づいて生成するステップと、前記訓練データをニューラルネットワーク(50)に学習させる学習させるステップと、を含み、前記生成ステップは、腫瘍領域を撮像した第1の訓練用画像(70R1)に対応する第1の訓練データ(74R1)を取得する第1の取得ステップと、非腫瘍領域を撮像した第2の訓練用画像(70R2)に対応する第2の訓練データ(74R2)を取得する第2の取得ステップと、組織を含まない領域を撮像した第3の訓練用画像(70R3)に対応する第3の訓練データ(74R3)を取得する第3の取得ステップと、を含み、前記学習ステップは、前記第1の訓練データ(74R1)が、腫瘍領域であることをニューラルネットワーク(50)に学習させる第1の学習ステップと、前記第2の訓練データ(74R2)が、非腫瘍領域であることをニューラルネットワーク(50)に学習させる第2の学習ステップと、前記第3の訓練データ(74R3)が、組織を含まない領域であることをニューラルネットワーク(50)に学習させる第3の学習ステップと、を含む、学習済み深層学習アルゴリズムの生成方法に関する。好ましくは、前記第1の訓練データ(74R1)と、第2の訓練データ(74R2)と、第3の訓練データ(74R3)とをニューラルネットワーク(50)の入力層(50a)とし、腫瘍領域であることと、非腫瘍領域であることと、組織を含まない領域であることとをそれぞれ前記第1の訓練データ(74R1)と、第2の訓練データ(74R2)と、第3の訓練データ(74R3)とに対応するニューラルネットワーク(50)の出力層(50b)とする。さらに好ましくは、前記第1の取得ステップの前に、前記第1の訓練用画像(70R1)から、前記第1の訓練データ(74R1)を生成するステップと、前記第2の取得ステップの前に、前記第2の訓練用画像(70R2)から、前記第2の訓練データ(74R2)を生成するステップと、前記第3の取得ステップの前に、前記第3の訓練用画像(70R3)から、前記第3の訓練データ(74R3)を生成するステップと、をさらに含んでもよい。本実施形態によれば、解析対象の組織が、腫瘍領域および非腫瘍領域から選択される少なくとも一方を含むことを判別する、学習済み深層学習アルゴリズムの生成することができる。 An embodiment includes the step of generating training data used for learning the deep learning algorithm (50) based on a training image obtained from a training tissue sample, and causing the neural network (50) to learn the training data. a learning step, and the generation step includes a first acquisition step of acquiring first training data (74R1) corresponding to a first training image (70R1) that captures a tumor region; A second acquisition step of acquiring second training data (74R2) corresponding to a second training image (70R2) that captures a region, and a third training image (70R3) that captures a region that does not include tissue. ), the learning step includes a third acquisition step of acquiring third training data (74R3) corresponding to 50), a second learning step in which the neural network (50) learns that the second training data (74R2) is a non-tumor region, and the third training step. The present invention relates to a method for generating a trained deep learning algorithm, including a third learning step of causing a neural network (50) to learn that the data (74R3) is a region that does not include tissue. Preferably, the first training data (74R1), the second training data (74R2), and the third training data (74R3) are used as the input layer (50a) of the neural network (50), and The first training data (74R1), the second training data (74R2), and the third training data (74R2) respectively indicate that the area is a non-tumor area, and that the area does not contain tissue. 74R3) is the output layer (50b) of the neural network (50). More preferably, before the first acquisition step, a step of generating the first training data (74R1) from the first training image (70R1), and before the second acquisition step, , from the second training image (70R2), before the step of generating the second training data (74R2), and before the third acquisition step, from the third training image (70R3), The method may further include a step of generating the third training data (74R3). According to the present embodiment, it is possible to generate a trained deep learning algorithm that determines that the tissue to be analyzed includes at least one selected from a tumor region and a non-tumor region.
前記生成方法において、好ましくは、前記訓練用画像が、個体から採取された組織に対して明視野観察用染色を施して作製された標本の染色像を顕微鏡の明視野下で撮像した明視野画像である。 In the generation method, preferably, the training image is a bright field image obtained by capturing a stained image of a specimen prepared by performing bright field observation staining on a tissue collected from an individual under the bright field of a microscope. It is.
ある実施形態は、第1の訓練データ(74R1)と、第2の訓練データ(74R2)と、第3の訓練データ(74R3)とをニューラルネットワーク(50)の入力層(50a)とし、腫瘍領域であることと、非腫瘍領域であることと、組織を含まない領域であることとをそれぞれ前記第1の訓練データ(74R1)と、第2の訓練データ(74R2)と、第3の訓練データ(74R3)とに対応するニューラルネットワーク(50)の出力層(50b)として学習させた深層学習アルゴリズムであって、前記第1の訓練データ(74R1)は、訓練用の組織の腫瘍領域を撮像した第1の訓練用画像(70R1)から生成され、前記第2の訓練データ(74R2)は、訓練用の組織の非腫瘍領域を撮像した第2の訓練用画像(70R2)から生成され、前記第3の訓練データ(74R3)は、組織を含まない領域を撮像した第3の訓練用画像(70R3)から生成される、学習済み深層学習アルゴリズム(60)であってもよい。 In one embodiment, the first training data (74R1), the second training data (74R2), and the third training data (74R3) are used as the input layer (50a) of the neural network (50), and the tumor region The first training data (74R1), the second training data (74R2), and the third training data indicate that the area is a non-tumor area, the area is a non-tumor area, and the area does not contain tissue, respectively. (74R3) is a deep learning algorithm trained as an output layer (50b) of a neural network (50) corresponding to The second training data (74R2) is generated from the first training image (70R1), and the second training data (74R2) is generated from the second training image (70R2) capturing a non-tumor region of the training tissue. The third training data (74R3) may be a trained deep learning algorithm (60) generated from a third training image (70R3) that captures a region that does not include tissue.
10(10A,10B) 処理部
20(20A,20B,20C) 処理部
11,21 CPU
12,22 メモリ
13,23 記録部
14,24 バス
15,25 インタフェース部
16,26 入力部
17,27 出力部
19,29 GPU
50 ニューラルネットワーク(深層学習アルゴリズム)
50a 入力層
50b 出力層
50c 中間層
60 学習済みのニューラルネットワーク(学習済みの深層学習アルゴリズム)
60a 入力層
60b 出力層
60c 中間層
70W1 ホールスライドイメージ
70W2 ホールスライドイメージ
70W3 ホールスライドイメージ
70R1L 第1の予備訓練データ
70R2L 第2の予備訓練データ
70R3L 第3の予備訓練データ
72R1r,72R1g,72R1b 色濃度符号化図
72R2r,72R2g,72R2b 色濃度符号化図
72R3r,72R3g,72R3b 色濃度符号化図
74R1,74R2,74R3 訓練データ
75R1,75R2,75R3 ウィンドウサイズの訓練データ
76 色濃度値
77R1,77R2,77R3 真値像のラベル値
78 解析対象の明視野画像
79r,79g,79b 解析対象の色濃度符号化図
80 解析用データ
81 色濃度値
82 判別結果(画素の推定値)
83 解析結果の3値画像
84 領域強調画像
89(89a,89b) ノード
98 記録媒体
99 ネットワーク
100 ベンダ側装置
100A 深層学習装置
100B 統合型の画像解析装置
101 訓練データ生成部
102 訓練データ入力部
103 アルゴリズム更新部
104 ウィンドウサイズデータベース
105 アルゴリズムデータベース
200 ユーザ側装置
200A 画像解析装置
200B 統合型の画像解析装置
200C 端末装置
201 解析用データ生成部
202 解析用データ入力部
203 解析部
204 領域検出部
300,400 撮像装置
301,401 撮像素子
308,408 試料組織
309,409 ステージ
W1 ウィンドウ
W2 ウィンドウ
10 (10A, 10B) Processing unit 20 (20A, 20B, 20C) Processing unit 11, 21 CPU
12, 22 Memory 13, 23 Recording section 14, 24 Bus 15, 25 Interface section 16, 26 Input section 17, 27 Output section 19, 29 GPU
50 Neural network (deep learning algorithm)
50a Input layer 50b Output layer 50c Middle layer 60 Trained neural network (trained deep learning algorithm)
60a Input layer 60b Output layer 60c Intermediate layer 70W1 Hole slide image 70W2 Hole slide image 70W3 Hole slide image 70R1L First preliminary training data 70R2L Second preliminary training data 70R3L Third preliminary training data 72R1r, 72R1g, 72R1b Color density code Color density encoding diagrams 72R2r, 72R2g, 72R2b Color density encoding diagrams 72R3r, 72R3g, 72R3b Color density encoding diagrams 74R1, 74R2, 74R3 Training data 75R1, 75R2, 75R3 Window size training data 76 Color density values 77R1, 77R2, 77R3 True value Image label value 78 Bright field images to be analyzed 79r, 79g, 79b Color density encoding diagram for analysis target 80 Data for analysis 81 Color density value 82 Discrimination result (estimated value of pixel)
83 Analysis result ternary image 84 Region-enhanced image 89 (89a, 89b) Node 98 Recording medium 99 Network 100 Vendor device 100A Deep learning device 100B Integrated image analysis device 101 Training data generation unit 102 Training data input unit 103 Algorithm Update unit 104 Window size database 105 Algorithm database 200 User device 200A Image analysis device 200B Integrated image analysis device 200C Terminal device 201 Analysis data generation unit 202 Analysis data input unit 203 Analysis unit 204 Region detection unit 300, 400 Imaging Apparatus 301, 401 Image sensor 308, 408 Sample tissue 309, 409 Stage W1 Window W2 Window
Claims (22)
組織の種類に応じて生成された複数の深層学習アルゴリズムから、解析対象の組織の種類に対応する前記深層学習アルゴリズムを選択し、
前記解析対象の組織を含む解析対象画像から解析用データを生成し、
前記解析用データを、選択された前記深層学習アルゴリズムに入力し、
前記解析用データが入力された前記深層学習アルゴリズムから出力される解析結果に基づき、腫瘍領域とそれ以外の領域とを識別可能に前記解析対象の組織の画像を表示する、ことを含む、
画像解析方法。 An image analysis method for analyzing tissue images using a deep learning algorithm with a neural network structure,
Selecting the deep learning algorithm corresponding to the type of tissue to be analyzed from a plurality of deep learning algorithms generated according to the type of tissue,
Generating analysis data from the analysis target image including the analysis target tissue,
inputting the analysis data to the selected deep learning algorithm;
Displaying an image of the tissue to be analyzed so that a tumor region and other regions can be distinguished based on an analysis result output from the deep learning algorithm into which the analysis data has been input;
Image analysis method.
前記解析対象の組織の種類に対応する前記深層学習アルゴリズムが、前記データベースに記憶された前記複数の深層学習アルゴリズムから選択される、請求項1に記載の画像解析方法。 the plurality of deep learning algorithms are stored in a database;
The image analysis method according to claim 1, wherein the deep learning algorithm corresponding to the type of tissue to be analyzed is selected from the plurality of deep learning algorithms stored in the database.
表示部と、
組織の種類に応じて生成された複数の深層学習アルゴリズムから、解析対象の組織の種類に対応する前記深層学習アルゴリズムを選択し、前記解析対象の組織を含む解析対象画像から解析用データを生成し、前記解析用データを、選択された前記深層学習アルゴリズムに入力し、前記解析用データが入力された前記深層学習アルゴリズムから出力される解析結果に基づき、腫瘍領域とそれ以外の領域とを識別可能に前記解析対象の組織の画像を前記表示部に表示する、制御部を備える、
画像解析装置。 An image analysis device that analyzes tissue images using a deep learning algorithm with a neural network structure,
A display section;
The deep learning algorithm corresponding to the type of tissue to be analyzed is selected from a plurality of deep learning algorithms generated according to the type of tissue, and data for analysis is generated from the image to be analyzed including the tissue to be analyzed. , the analysis data is input to the selected deep learning algorithm, and based on the analysis result output from the deep learning algorithm into which the analysis data is input, tumor regions and other regions can be distinguished. a control unit configured to display an image of the tissue to be analyzed on the display unit;
Image analysis device.
前記制御部は、前記解析対象の組織の種類に対応する前記深層学習アルゴリズムを、前記記憶部に記憶された前記複数の深層学習アルゴリズムから選択する、請求項14に記載の画像解析装置。 further comprising a storage unit that stores the plurality of deep learning algorithms,
The image analysis apparatus according to claim 14, wherein the control unit selects the deep learning algorithm corresponding to the type of tissue to be analyzed from the plurality of deep learning algorithms stored in the storage unit.
前記制御部は、前記入力部を介した操作に基づいて、前記解析対象の組織の種類に対応する前記深層学習アルゴリズムを選択する、請求項14乃至17のいずれか1項に記載の画像解析装置。 further comprising an input section operated by a user,
The image analysis device according to any one of claims 14 to 17, wherein the control unit selects the deep learning algorithm corresponding to the type of tissue to be analyzed based on an operation via the input unit. .
コンピュータに、
組織の種類に応じて生成された複数の深層学習アルゴリズムから、解析対象の組織の種類に対応する前記深層学習アルゴリズムを選択する処理と、
前記解析対象の組織を含む解析対象画像から解析用データを生成する処理と、
前記解析用データを、選択された前記深層学習アルゴリズムに入力する処理と、
前記解析用データが入力された前記深層学習アルゴリズムから出力される解析結果に基づき、腫瘍領域とそれ以外の領域とを識別可能に前記解析対象の組織の画像を表示する処理と、を実行させる、
コンピュータプログラム。 A computer program that analyzes tissue images using a deep learning algorithm with a neural network structure,
to the computer,
a process of selecting the deep learning algorithm corresponding to the type of tissue to be analyzed from a plurality of deep learning algorithms generated according to the type of tissue;
A process of generating analysis data from the analysis target image including the analysis target tissue;
a process of inputting the analysis data to the selected deep learning algorithm;
Displaying an image of the tissue to be analyzed in such a way that a tumor region and other regions can be distinguished based on an analysis result output from the deep learning algorithm into which the analysis data has been input;
computer program.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2024004675A JP2024038396A (en) | 2018-02-27 | 2024-01-16 | Image analysis method, image analysis device, and program |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018032761A JP7217589B2 (en) | 2018-02-27 | 2018-02-27 | Image analysis method, image analysis device, program, method for manufacturing trained deep learning algorithm, and trained deep learning algorithm |
JP2023008540A JP7458519B2 (en) | 2018-02-27 | 2023-01-24 | Image analysis method, image analysis device, program, method for producing trained deep learning algorithm, and trained deep learning algorithm |
JP2024004675A JP2024038396A (en) | 2018-02-27 | 2024-01-16 | Image analysis method, image analysis device, and program |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023008540A Division JP7458519B2 (en) | 2018-02-27 | 2023-01-24 | Image analysis method, image analysis device, program, method for producing trained deep learning algorithm, and trained deep learning algorithm |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2024038396A true JP2024038396A (en) | 2024-03-19 |
Family
ID=67850414
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018032761A Active JP7217589B2 (en) | 2018-02-27 | 2018-02-27 | Image analysis method, image analysis device, program, method for manufacturing trained deep learning algorithm, and trained deep learning algorithm |
JP2023008540A Active JP7458519B2 (en) | 2018-02-27 | 2023-01-24 | Image analysis method, image analysis device, program, method for producing trained deep learning algorithm, and trained deep learning algorithm |
JP2024004675A Pending JP2024038396A (en) | 2018-02-27 | 2024-01-16 | Image analysis method, image analysis device, and program |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018032761A Active JP7217589B2 (en) | 2018-02-27 | 2018-02-27 | Image analysis method, image analysis device, program, method for manufacturing trained deep learning algorithm, and trained deep learning algorithm |
JP2023008540A Active JP7458519B2 (en) | 2018-02-27 | 2023-01-24 | Image analysis method, image analysis device, program, method for producing trained deep learning algorithm, and trained deep learning algorithm |
Country Status (1)
Country | Link |
---|---|
JP (3) | JP7217589B2 (en) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7350595B2 (en) * | 2019-10-01 | 2023-09-26 | キヤノンメディカルシステムズ株式会社 | Image processing device, medical image diagnostic device, and image processing program |
CN113710166A (en) * | 2020-03-19 | 2021-11-26 | 艾多特公司 | Carotid artery ultrasonic diagnosis system |
KR102408405B1 (en) * | 2020-03-19 | 2022-06-15 | 주식회사 아이도트 | System for diagnosing the carotid artery |
JPWO2022049663A1 (en) * | 2020-09-02 | 2022-03-10 | ||
CN112019827B (en) * | 2020-09-02 | 2022-01-25 | 上海网达软件股份有限公司 | Method, device, equipment and storage medium for enhancing video image color |
KR102250219B1 (en) * | 2020-09-15 | 2021-05-11 | 주식회사 아이도트 | Ultrasound diagnostic system |
KR20220042558A (en) * | 2020-09-28 | 2022-04-05 | 주식회사 딥바이오 | Method for displaying diagnosis result of pathological image and computing system performing the same |
KR102499143B1 (en) * | 2020-11-27 | 2023-02-14 | (의)삼성의료재단 | Measurement method of intima-media thickness of artery and device therefore |
KR102684355B1 (en) * | 2020-12-24 | 2024-07-18 | (주)제이엘케이 | Prostate cancer pathological images report system based on artificial intelligence |
KR102316525B1 (en) * | 2021-03-08 | 2021-10-22 | 주식회사 딥바이오 | Method for training artificial neural network for detecting prostate cancer from TURP pathological image, and computing system performing the same |
KR102354476B1 (en) * | 2021-03-15 | 2022-01-21 | 주식회사 딥바이오 | Providing method and system for diagnosing lesions of bladder |
KR102485414B1 (en) * | 2021-12-13 | 2023-01-06 | 주식회사 딥바이오 | Method for training artificial neural network providing result of diagnosis for pathological specimen, and computing system performing the same |
JP7557499B2 (en) * | 2022-05-31 | 2024-09-27 | 楽天グループ株式会社 | Method for predicting data from an image, computer system, and computer readable medium |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1444600A1 (en) | 2001-11-16 | 2004-08-11 | Yuan Yan Chen | Pausible neural network with supervised and unsupervised cluster analysis |
JP5478618B2 (en) | 2008-07-03 | 2014-04-23 | エヌイーシー ラボラトリーズ アメリカ インク | Epithelial layer detector and related method |
JP5321145B2 (en) | 2009-03-04 | 2013-10-23 | 日本電気株式会社 | Image diagnosis support apparatus, image diagnosis support method, image diagnosis support program, and storage medium thereof |
JP5547597B2 (en) | 2010-09-29 | 2014-07-16 | 大日本スクリーン製造株式会社 | Pathological diagnosis support device, pathological diagnosis support method, control program for pathological diagnosis support, and recording medium recording the control program |
CA2932892C (en) | 2014-01-28 | 2020-09-22 | Ventana Medical Systems, Inc. | Adaptive classification for whole slide tissue segmentation |
EP3146463B1 (en) | 2014-05-23 | 2020-05-13 | Ventana Medical Systems, Inc. | Systems and methods for detection of biological structures and/or patterns in images |
JP2017045430A (en) | 2015-08-28 | 2017-03-02 | パナソニックIpマネジメント株式会社 | Image processing device, image processing system, image processing method and program |
WO2017150194A1 (en) | 2016-03-04 | 2017-09-08 | コニカミノルタ株式会社 | Image processing device, image processing method, and program |
WO2017201540A1 (en) | 2016-05-20 | 2017-11-23 | Techcyte, Inc. | Machine learning classification of particles or substances in digital microscopy images |
CA3021481A1 (en) | 2016-07-29 | 2018-02-01 | Novadaq Technologies ULC | Methods and systems for characterizing tissue of a subject utilizing machine learning |
JP7076698B2 (en) | 2017-11-17 | 2022-05-30 | 国立研究開発法人国立がん研究センター | Image analysis method, image analysis device, program, learned deep learning algorithm manufacturing method and learned deep learning algorithm |
-
2018
- 2018-02-27 JP JP2018032761A patent/JP7217589B2/en active Active
-
2023
- 2023-01-24 JP JP2023008540A patent/JP7458519B2/en active Active
-
2024
- 2024-01-16 JP JP2024004675A patent/JP2024038396A/en active Pending
Also Published As
Publication number | Publication date |
---|---|
JP2023065352A (en) | 2023-05-12 |
JP7217589B2 (en) | 2023-02-03 |
JP2019148473A (en) | 2019-09-05 |
JP7458519B2 (en) | 2024-03-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7458519B2 (en) | Image analysis method, image analysis device, program, method for producing trained deep learning algorithm, and trained deep learning algorithm | |
US20230419696A1 (en) | Image analysis method, apparatus, program, and learned deep learning algorithm | |
JP7076698B2 (en) | Image analysis method, image analysis device, program, learned deep learning algorithm manufacturing method and learned deep learning algorithm | |
EP3531339B1 (en) | Image analysis method, image analysis apparatus and learned deep layer learning algorithm manufacturing method | |
CN110023994B (en) | Histopathological image analysis | |
US20050265588A1 (en) | Method and system for digital image based flourescent in situ hybridization (FISH) analysis | |
WO2017221592A1 (en) | Image processing device, image processing method, and image processing program | |
US11989882B2 (en) | Histological image analysis | |
Shakhawat et al. | Automatic grading of invasive breast cancer patients for the decision of therapeutic plan | |
EP3576096A1 (en) | Sensitivity analysis for digital pathology |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240116 |