JP4688467B2 - Method for searching structure of receptor-ligand stable complex - Google Patents
Method for searching structure of receptor-ligand stable complex Download PDFInfo
- Publication number
- JP4688467B2 JP4688467B2 JP2004301616A JP2004301616A JP4688467B2 JP 4688467 B2 JP4688467 B2 JP 4688467B2 JP 2004301616 A JP2004301616 A JP 2004301616A JP 2004301616 A JP2004301616 A JP 2004301616A JP 4688467 B2 JP4688467 B2 JP 4688467B2
- Authority
- JP
- Japan
- Prior art keywords
- ligand
- receptor
- dummy
- atom
- atoms
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 239000003446 ligand Substances 0.000 title claims description 132
- 238000000034 method Methods 0.000 title claims description 92
- 238000004364 calculation method Methods 0.000 claims description 24
- 238000000324 molecular mechanic Methods 0.000 claims description 15
- 230000003993 interaction Effects 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 3
- 230000010365 information processing Effects 0.000 claims description 2
- 125000004429 atom Chemical group 0.000 description 95
- 102000005962 receptors Human genes 0.000 description 61
- 108020003175 receptors Proteins 0.000 description 61
- 229920001222 biopolymer Polymers 0.000 description 13
- 230000006870 function Effects 0.000 description 12
- 239000000126 substance Substances 0.000 description 11
- 229910052739 hydrogen Inorganic materials 0.000 description 10
- 239000001257 hydrogen Substances 0.000 description 10
- 230000008569 process Effects 0.000 description 10
- 108090000623 proteins and genes Proteins 0.000 description 8
- 238000003032 molecular docking Methods 0.000 description 7
- 102000004169 proteins and genes Human genes 0.000 description 7
- 238000011160 research Methods 0.000 description 6
- 150000001875 compounds Chemical class 0.000 description 5
- 238000007876 drug discovery Methods 0.000 description 5
- 125000004435 hydrogen atom Chemical group [H]* 0.000 description 5
- 230000000144 pharmacologic effect Effects 0.000 description 5
- DODQJNMQWMSYGS-QPLCGJKRSA-N 4-[(z)-1-[4-[2-(dimethylamino)ethoxy]phenyl]-1-phenylbut-1-en-2-yl]phenol Chemical compound C=1C=C(O)C=CC=1C(/CC)=C(C=1C=CC(OCCN(C)C)=CC=1)/C1=CC=CC=C1 DODQJNMQWMSYGS-QPLCGJKRSA-N 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 239000003814 drug Substances 0.000 description 4
- 239000013543 active substance Substances 0.000 description 3
- 229910052799 carbon Inorganic materials 0.000 description 3
- 239000013078 crystal Substances 0.000 description 3
- 229940079593 drug Drugs 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 125000005842 heteroatom Chemical group 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 125000004432 carbon atom Chemical group C* 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 102000015694 estrogen receptors Human genes 0.000 description 2
- 108010038795 estrogen receptors Proteins 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000003112 inhibitor Substances 0.000 description 2
- 230000009878 intermolecular interaction Effects 0.000 description 2
- 108020004707 nucleic acids Proteins 0.000 description 2
- 102000039446 nucleic acids Human genes 0.000 description 2
- 150000007523 nucleic acids Chemical class 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000001988 toxicity Effects 0.000 description 2
- 231100000419 toxicity Toxicity 0.000 description 2
- 238000003041 virtual screening Methods 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- 239000003905 agrochemical Substances 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000000975 bioactive effect Effects 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000009918 complex formation Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 125000000524 functional group Chemical group 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000000329 molecular dynamics simulation Methods 0.000 description 1
- 238000000302 molecular modelling Methods 0.000 description 1
- 229930014626 natural product Natural products 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 238000002922 simulated annealing Methods 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/50—Molecular design, e.g. of drugs
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
- G16B15/30—Drug targeting using structural data; Docking or binding prediction
Landscapes
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Pharmacology & Pharmacy (AREA)
- Crystallography & Structural Chemistry (AREA)
- Medicinal Chemistry (AREA)
- Bioinformatics & Computational Biology (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Medical Informatics (AREA)
- Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
本発明は、医薬、農薬などの生理活性物質の分子設計に利用できる受容体分子とリガンド分子の安定複合体構造を見出すための計算機を利用した探索方法に関する。本発明はまた、当該方法を実行するためのプログラムに関する。 The present invention relates to a search method using a computer for finding a stable complex structure of a receptor molecule and a ligand molecule that can be used for molecular design of physiologically active substances such as pharmaceuticals and agricultural chemicals. The present invention also relates to a program for executing the method.
薬物や生理活性物質の多くは、受容体となる生体高分子(タンパク質、核酸及びそれらを含む複合体)と、特定の部位で結合することによりその薬理活性ないしは毒性を発現する。
受容体の候補となる生体高分子の構造に関しては、 X 線や NMR などの分析機器とその結果を解析するソフトウェアの進歩により、従来に増して短期間で構造決定がなされるようになり、プロテインデータバンクなどのデータベースに登録されて公開されている。また一方、遺伝子の全塩基配列の解読が現実のものとなり、計算機を利用した分子モデリングの技術の進歩により、実験的に構造が確定されていない生体高分子についても、ある程度の立体構造を推定することが可能となっている。
Many drugs and physiologically active substances exhibit their pharmacological activity or toxicity by binding to a biopolymer (protein, nucleic acid and complex containing them) serving as a receptor at a specific site.
With regard to the structure of biopolymers that are candidates for receptors, the progress of analytical equipment such as X-rays and NMR and the software that analyzes the results enables structural determination to be made in a shorter period of time than ever before. It is registered and published in a database such as a data bank. On the other hand, deciphering the entire base sequence of a gene becomes a reality, and due to advances in molecular modeling technology using computers, a certain degree of three-dimensional structure is estimated even for biopolymers whose structure has not been experimentally determined It is possible.
このような生体高分子に結合する比較的低分子量の薬物、阻害剤などの化合物は、一般にリガンドと呼ばれ、ターゲットとなる受容体と安定な結合体を形成する可能性のあるリガンドを効率的に見出すことが、創薬研究において重要な基礎となる。生体高分子とリガンドの原子座標を入力し、生体高分子内のおおまかな結合部位(結合ポケット)を指定した上で、計算機を利用して受容体との妥当な結合様式を見出し、また、この計算を複数のリガンドに対して連続的に適用することにより、結合する可能性のあるリガンドを発見するあるいは、結合する可能性のない化合物をふるい落とすという計算方法は、計算機を利用した創薬研究の効率化の方法として広く知られている。これらの計算方法は、一般にドッキングスタディと呼ばれ、ある程度の精度を犠牲にして、多数のリガンドを高速で比較する場合は、バーチャルスクリーニングとも呼ばれる。また、このように受容体の三次元構造をもとにしてリガンドの分子を設計する研究手法は、構造依存創薬とも総称される。これらの方法を現実の分子系に適用するためには、(i)座標空間の効率的な探索、(ii)結合様式の妥当性を評価するための評価基準の2つを満たすアルゴリズムの開発が必須であり、それぞれ多くの方法が提案されている。しかしながら、複雑なリガンド分子の配座のみならず、その分子が受容体中で存在し得る相対的な位置まで含めた自由度を考慮すると、(i)で探索すべき空間の自由度は膨大なものとなり、完全に網羅的な探索を行うことは、現在の計算機能力をもってしても現実的ではない。また、(ii)の基準を数値化するための評価関数に関しても、完全なものはまだない。このように、計算による完全な探索は、理論的にみて限界があることは明らかではあるが、創薬研究の初期段階でこのような方法を活用することにより実際の合成実験および薬理活性試験の数を減らすことは、開発期間の短縮、 R&D の低コスト化にきわめて有効であるため、多くの研究がなされており(特許文献1または非特許文献1)、主なものは、ソフトウェア パッケージとして公開ないし市販されている(Tripos 社製 FlexX、Accelrys 社製 C2-LigandFit、 Schlodinger 社製 Glide など)。
上述のように、一般にドッキング スタディは、リガンドの配座とそのリガンドが存在
し得る座標の組み合わせからなる無限の自由度を、いかに効率的に簡略化し、全ての座標空間を探索したと同等の効果を短時間であげることが、計算の速度と精度を上げるために必須の要件となっている。
As mentioned above, docking studies generally have the same effect as exploring all coordinate spaces, effectively simplifying the infinite degree of freedom that consists of a combination of ligand conformations and the coordinates in which the ligand can exist. It is an indispensable requirement to increase the calculation speed and accuracy.
特許第2621842号明細書では、その第1図に示されるように、受容体(生体高分子)の水素結合性官能基の水素結合の相手となりうるヘテロ原子の位置に設定したダミー原子をクラスタリングし、これと、予め配座解析されたリガンドの水素結合性ヘテロ原子からなる水素結合性部分とが一致するかどうかを水素結合様式及び配座に基づいて判定することを特徴とする受容体−リガンド安定複合体構造探索方法が開示されている。
しかしながらこの手法は、(i)一致する水素結合性部分の数が多い系では計算時間が非常に長くなる、(ii)水素結合様式にのみ注目して分類するため、受容体構造から推定される水素結合様式がリガンドと僅かに異なるだけで、実際には複合体として存在し得るリガンド構造を見逃したり、水素結合性ヘテロ原子以外の原子が受容体原子とぶつかる構造を生成してしまう場合がある。これらは、受容体の化学的な特徴に基づく仮定(受容体構造の簡略化)に起因する本質的な問題であり、回避するためには、研究者が経験をもとにマニュアルで重要な部分構造のみを選択ないしは定義しなおすことが必要であり、計算機による全自動のドッキングスタディを行う方法としては、適用範囲に限界がある。
このような状況から、リガンドと受容体の間に働く分子間相互作用を水素結合様式に限定するよりも、むしろ単純に結合ポケットの形状に適合するリガンドの候補構造を効率的に見出すことができれば、全自動のドッキングスタディを行うためには望ましい手法となると考えられる。
In Patent No. 2621842, as shown in FIG. 1, clustering of dummy atoms set at the position of a heteroatom that can be a hydrogen bonding partner of a hydrogen bonding functional group of a receptor (biopolymer) is performed. And a receptor-ligand characterized in that it is determined based on the hydrogen bonding mode and conformation whether or not this matches with a hydrogen bonding part consisting of a hydrogen bonding hetero atom of a ligand that has been conformationally analyzed. A stable complex structure search method is disclosed.
However, this method is (i) the calculation time becomes very long in a system with many matching hydrogen bonding moieties, and (ii) the classification is focused on the hydrogen bonding mode, so it is estimated from the receptor structure. The hydrogen bonding mode is slightly different from that of the ligand, and may actually miss the ligand structure that may exist as a complex, or may generate a structure in which atoms other than hydrogen-bonding heteroatoms collide with the acceptor atom. . These are essential problems due to assumptions based on the chemical characteristics of the receptor (simplification of the receptor structure). It is necessary to select or redefine only the structure, and there is a limit to the scope of application as a fully automatic docking study by a computer.
Given this situation, rather than limiting the intermolecular interaction between the ligand and the receptor to the hydrogen bonding mode, it would be possible to efficiently find a candidate ligand structure that simply conforms to the shape of the binding pocket. It is considered to be a desirable method for conducting a fully automatic docking study.
上述のような状況に鑑み、本発明者らは、鋭意検討の結果、生体高分子内の結合ポケットの位置推定と、その結合ポケット内に結合しうるリガンドの候補構造を、ポケット内でリガンド原子が存在し得る座標とその周囲の受容体原子の位置に、仮想的なダミー原子を規定し、予め計算化学的方法により発生させたリガンドの多様な配座を、このダミー原子モデルと適合するように配置することによって、受容体中でリガンドが安定複合体として存在する可能性のある配置を短時間で精度よく推定する方法の開発に成功した。さらに、この配置推定を、予め発生させておいた多様なリガンドの配座について連続的に行うことで、配座と結合様式を同時に決定することができることを見出し、本発明を完成するに至った。 In view of the situation as described above, the present inventors, as a result of intensive studies, estimated the position of the binding pocket in the biopolymer and determined the candidate structure of the ligand that can be bound in the binding pocket as a ligand atom in the pocket. A virtual dummy atom is defined at the coordinates where the can exist and the position of the surrounding acceptor atom, and various conformations of the ligand generated by a computational chemical method in advance are adapted to this dummy atom model. In this way, we have succeeded in developing a method for accurately estimating the arrangement in which a ligand may exist as a stable complex in a receptor in a short time. Furthermore, the present inventors have found that the conformation and the binding mode can be determined simultaneously by continuously performing this configuration estimation on the conformations of various ligands that have been generated in advance, leading to the completion of the present invention. .
すなわち本発明は、以下のとおりである。
(1)計算機を利用して受容体とリガンドとの安定複合体構造を探索する方法であって、受容体とリガンドとの組み合わせについて以下の第一工程から第七工程を実行することにより、受容体とリガンドが安定して存在し得る構造を特定することを特徴とする方法:
(a)リガンドがとりうる立体配座を網羅的に発生させる第一工程、
(b)受容体の3次元構造モデルにおいて、半径0.5 〜 5 Å の球が受容体分子内の少なくとも4つの重原子と接触して存在し得る座標を、幾何学的な方法により網羅的に探索し、その座標位置に半径1 〜 3 Å のダミー原子Sを配置する第二工程、
(c)ダミー原子Sを座標を基準にクラスタリングすることにより、少なくとも1つのダミー原子を含む結合ポケットを設定する第三工程、
(d)第三工程で規定された結合ポケットにおいて、ダミー原子Sの周囲3 〜 20Åの範囲に存在する受容体の重原子を選択し、その座標位置に、−3 Å < r < −0.5 Å の範囲の仮想的な半径rを持つダミー原子Xを設定する第四工程、
(e)第一工程で発生させたリガンド立体配座中の一つの重原子が、第二工程で規定されたダミー原子Sからランダムに選択された一つと重なるように、リガンド分子をランダムに回転及び平行移動させる第五工程、
(f)リガンド原子とダミー原子S及びXとの重なりの程度をスコアとして算出し、リガンド分子全体を回転及び平行移動させることにより、スコアが極大となる配座を選択する第六工程、
(g)第五工程から第六工程を繰り返し、安定な複合体を形成する受容体とリガンドの相対的な配座を選択する第七工程。
(2)前記第三工程において、さらに、結合ポケット内のダミー原子S間の距離を全て算出し、互いに0.1〜2.0Å以内に近接するダミー原子が複数存在する場合、そのうちの1つを残して近接する他のダミー原子を削除することを特徴とする、(1)の受容体−リガンド安定複合体構造探索方法。
(3)前記第六工程において、リガンド原子として、リガンド内の重原子のみを考慮することを特徴とする、(1)の受容体−リガンド安定複合体構造探索方法。
(4)さらに、前記第七工程で得られたリガンドの配置を初期構造として、分子力学計算により受容体との相互作用エネルギー的に安定な構造を求めることを特徴とする、(1)の受容体−リガンド安定複合体構造探索方法。
(5) 受容体とリガンドの安定複合体構造を探索するための処理を情報処理装置に実行させるためのプログラムであって、以下の手順を実行させるプログラム:
(a)リガンドがとりうる立体配座を網羅的に発生させる第一の手順、
(b)受容体の3次元構造モデルにおいて、半径0.5 〜 5 Åの球が受容体分子内の少なくとも4つの重原子と接触して存在し得る座標を、幾何学的な方法により網羅的に探索し、その座標位置に半径1 〜 3 Å のダミー原子Sを配置する第二の手順、
(c)ダミー原子Sを座標を基準にクラスタリングすることにより、少なくとも1つのダミー原子を含む結合ポケットを設定する第三の手順、
(d)第三の手順により規定された結合ポケットにおいて、ダミー原子Sの周囲3 〜 20 Åの範囲に存在する受容体の重原子を選択し、その座標位置に、−3 Å < r < −0.5 Å の範囲の仮想的な半径rを持つダミー原子Xを設定する第四の手順、
(e)第一の手順により発生させたリガンド立体配座中の一つの重原子が、第二の手順により規定されたダミー原子Sからランダムに選択された一つと重なるように、リガンド分子をランダムに回転及び平行移動させる第五の手順、
(f)リガンド原子とダミー原子S及びXとの重なりの程度をスコアとして算出し、リガンド分子全体を回転及び平行移動させることにより、スコアが極大となる配座を選択する第六の手順、
(g)第五の手順および第六の手順による処理を繰り返し、安定な複合体を形成する受容体とリガンドの相対的な配座を選択する第七の手順。
(6)さらに、前記第七の手順によって得られたリガンドの配置を初期構造として、分子力学計算により受容体との相互作用エネルギー的に安定な構造を求める手順を有する、(5)のプログラム。
That is, the present invention is as follows.
(1) A method for searching for a stable complex structure of a receptor and a ligand using a computer, wherein a combination of a receptor and a ligand is received by executing the following first to seventh steps. A method characterized by identifying a structure in which a body and a ligand can exist stably:
(A) a first step of comprehensively generating conformations that can be taken by a ligand;
(B) In a three-dimensional structural model of the receptor, a coordinate method is used to comprehensively search for coordinates where a sphere with a radius of 0.5 to 5 接触 can be in contact with at least four heavy atoms in the receptor molecule. A second step of arranging a dummy atom S having a radius of 1 to 3 Å at the coordinate position,
(C) a third step of setting a bond pocket including at least one dummy atom by clustering the dummy atoms S on the basis of coordinates;
(D) In the binding pocket specified in the third step, select the acceptor heavy atom existing in the range of 3 to 20 mm around the dummy atom S, and set −3 Å <r <−0.5 に at the coordinate position. A fourth step of setting a dummy atom X having a virtual radius r in the range of
(E) Randomly rotate the ligand molecule so that one heavy atom in the ligand conformation generated in the first step overlaps one randomly selected from the dummy atoms S defined in the second step And a fifth step of translating,
(F) calculating the degree of overlap between the ligand atom and the dummy atoms S and X as a score, and rotating and translating the entire ligand molecule to select a conformation that maximizes the score;
(G) A seventh step in which the fifth to sixth steps are repeated to select the relative conformation of the receptor and the ligand that form a stable complex.
(2) In the third step, furthermore, all the distances between the dummy atoms S in the binding pocket are calculated, and when there are a plurality of dummy atoms close to each other within 0.1 to 2.0 mm, one of them is left. 2. The method for searching a receptor-ligand stable complex structure according to (1) , wherein other adjacent dummy atoms are deleted.
(3) The method for searching a receptor-ligand stable complex structure according to (1) , wherein in the sixth step, only heavy atoms in the ligand are considered as ligand atoms.
(4) Further, the arrangement of the ligands obtained in the seventh step as an initial structure, and obtains the interaction energetically stable structure of the receptor by molecular mechanics calculations, acceptance (1) Body-ligand stable complex structure search method.
(5) A program for causing an information processing apparatus to execute processing for searching for a stable complex structure of a receptor and a ligand, and for executing the following procedure:
(A) a first procedure for comprehensively generating possible conformations of a ligand;
(B) In a three-dimensional structure model of the receptor, a coordinate method is used to comprehensively search for coordinates where a sphere with a radius of 0.5 to 5 mm can be in contact with at least four heavy atoms in the receptor molecule. And a second procedure for arranging a dummy atom S having a radius of 1 to 3 に at the coordinate position,
(C) a third procedure for setting a bond pocket including at least one dummy atom by clustering the dummy atoms S on the basis of coordinates;
(D) In the binding pocket defined by the third procedure, select the acceptor heavy atom in the range of 3 to 20 Å around the dummy atom S, and set −3 Å <r <− A fourth procedure to set a dummy atom X with a virtual radius r in the range 0.5 、
(E) Randomize the ligand molecules so that one heavy atom in the ligand conformation generated by the first procedure overlaps one randomly selected from the dummy atoms S defined by the second procedure. The fifth step of rotating and translating to
(F) a sixth procedure for calculating the degree of overlap between the ligand atom and the dummy atoms S and X as a score, and selecting the conformation that maximizes the score by rotating and translating the entire ligand molecule;
(G) A seventh procedure in which the treatment by the fifth procedure and the sixth procedure is repeated, and the relative conformation of the receptor and the ligand forming a stable complex is selected.
(6) The program according to (5) , further including a procedure for obtaining a structure that is stable in terms of interaction energy with a receptor by molecular mechanics calculation using the arrangement of the ligand obtained by the seventh procedure as an initial structure.
以上のように、本発明は、計算機を利用したドッキングスタディにおいて、受容体とリガンドの構造のみから自動的に安定複合体構造を短時間で特定するものである。しかも、使用者の経験や知識に頼ることなく、網羅的に構造を探索するにもかかわらず、バーチャルスクリーニングにも適用できる高速化を達成しており、汎用的かつ強力なドッキング手法を提供する。
本発明で開示された新規な探索方法を用いることにより、結合部位が特定されていない受容体に対してさえも短時間で安定複合体構造を特定することが可能となる。したがって、新規生理活性物質の開発のみならず、既知のリガンドが他の受容体と安定複合体を形成するかどうかを検討することにより、新たな薬理活性を見出し、あるいは副作用や毒性をもたらす可能性を事前に推定することができるため、創薬研究のコストと時間を大幅に改善することが可能となる。
As described above, in the docking study using a computer, the present invention automatically specifies a stable complex structure in a short time from only the structure of a receptor and a ligand. Moreover, despite the exhaustive search of the structure without relying on the user's experience and knowledge, the speedup applicable to virtual screening has been achieved, and a versatile and powerful docking technique is provided.
By using the novel search method disclosed in the present invention, it is possible to specify a stable complex structure in a short time even for a receptor whose binding site is not specified. Therefore, not only the development of new bioactive substances, but also the possibility of finding new pharmacological activities or causing side effects and toxicity by examining whether known ligands form stable complexes with other receptors. Therefore, the cost and time of drug discovery research can be greatly improved.
本発明において受容体とはリガンドが結合できる物質であれば特に制限されず、タンパク質、核酸、糖などの高分子化合物が挙げられるが、タンパク質が好ましい。尚、受容体は天然のものであっても、それらが改変されたもの、またはそれらを模倣して合成された人工のものであってもよい。受容体は、3次元構造が明らかにされているもの、または3次元構造が既知の受容体の構造に基づき、3次元構造を容易に推定できるものが好ましい。受容体としてタンパク質を用いる場合は、タンパク質の3次元構造は、例えば、プロテインデータバンクジャパン(PDB、 http://pdbj.protein.osaka-u.ac.jp/)から得ることができる。なお、本発明において解析に用いる受容体は1種類でも複数種類でもよい。 In the present invention, the receptor is not particularly limited as long as it is a substance capable of binding a ligand, and examples thereof include high molecular compounds such as proteins, nucleic acids, and sugars. The receptors may be natural ones, modified ones thereof, or artificial ones synthesized by imitating them. The receptor preferably has a known three-dimensional structure or can easily estimate a three-dimensional structure based on the structure of a receptor having a known three-dimensional structure. When a protein is used as a receptor, the three-dimensional structure of the protein can be obtained from, for example, Protein Data Bank Japan (PDB, http://pdbj.protein.osaka-u.ac.jp/). In the present invention, one or more receptors may be used for analysis.
また、リガンドとは一般に受容体に比べて小さな分子であり、天然物、化学合成された物質に関わらず、受容体内の特定の部位に、特異的に結合する化合物全般を含む概念である。リガンドには例えば、薬物、または酵素の基質もしくは阻害剤などが含まれる。一般に、リガンドとは受容体の活性部位に結合して薬理作用を発揮するものをいう場合があるが、本発明においては、リガンドは受容体と安定な複合体を成しうるものであればよく、必ずしも活性部位に結合して薬理作用を発揮するものでなくてもよい。
また、ダミー原子とは、計算機上で分子構造を扱う上で、空間上の相対的な位置への分子の移動や重ね合わせなどの処理を行う際の基準とするために、大きさや質量などが任意に設定され、一般にポテンシャルパラメータを持たない仮想的な原子を意味する。
また結合ポケットとは、生体高分子の分子表面に観察される、リガンド分子が結合し得る程度の大きさをもつ内孔ないしは窪みをいう。
A ligand is generally a small molecule compared to a receptor, and is a concept that includes all compounds that specifically bind to a specific site in a receptor, regardless of whether it is a natural product or a chemically synthesized substance. Ligands include, for example, drugs or enzyme substrates or inhibitors. In general, a ligand sometimes refers to a substance that binds to an active site of a receptor and exerts a pharmacological action. However, in the present invention, a ligand may be any substance that can form a stable complex with a receptor. However, it is not always necessary to bind to the active site and exert a pharmacological action.
In addition, the dummy atom has a size, mass, etc. in order to use it as a standard for processing such as movement and superposition of molecules to relative positions in space when handling molecular structures on a computer. It is a virtual atom that is arbitrarily set and generally has no potential parameter.
The binding pocket refers to an inner hole or depression that is observed on the molecular surface of the biopolymer and has a size that allows ligand molecules to bind.
本発明の方法を図1のフローチャートを参照しながら、工程ごとに説明する。第1の工程では、まずリガンドのとりうる立体配座を網羅的に発生させる。リガンドは単一のリガンドを用いてもよいし、複数のリガンドを用いてもよい。
リガンドが取り得る多様な配座を効率的に発生させる手法としては、既知のさまざまな方法をとることができる。例えば、リガンド内の回転可能な結合について、順次一定の角度で回転させ、網羅的に全ての構造を発生させるシステマチック サーチ、二面角や原子座標をランダムに変更し、次いで分子力学計算による構造最適化を行うストキャスティックサーチ(Ferguson, D.M., Raber, D.J., J. Am. Chem. Soc. 111, 4371-4378 (1989))、高温における短時間の分子動力学計算と分子力学計算による構造最適化を繰り返し、長時間の観察により得られるであろう多様な配座をサンプリングするシミュレーティド アニーリング(Nilges, M., et al., FEBS Lett., 239, 129-136 (1988))などが挙げられる。また、これらの手法を拡張した市販プログラム、例えばカナダ Chemical Computing Group 社製 MOE(商品名)における Conformation Import 機能、 Accelrys 社製 CATALYST(商品名)に搭載されたポーリング法(Smellie, A., Teig, S.L., and Towbin, P., J. Comp. Chem., 16, 171-187 (1995))などを使用することにより、短時間で多様な配座空間を探索することができる。
The method of the present invention will be described step by step with reference to the flowchart of FIG. In the first step, first, the conformation that the ligand can take is comprehensively generated. A single ligand may be used as the ligand, or a plurality of ligands may be used.
Various known methods can be used as a method for efficiently generating various conformations that can be taken by the ligand. For example, for a rotatable bond in a ligand, it is sequentially rotated at a certain angle to comprehensively generate all structures, randomly changing dihedral angles and atomic coordinates, and then structure by molecular mechanics calculation Stochastic search for optimization (Ferguson, DM, Raber, DJ, J. Am. Chem. Soc. 111, 4371-4378 (1989)), structural optimization by short-term molecular dynamics and molecular mechanics calculations at high temperatures And simulated annealing (Nilges, M., et al., FEBS Lett., 239, 129-136 (1988)) that samples various conformations that may be obtained by long-term observation Can be mentioned. In addition, commercial programs that extend these methods, such as the Conformation Import function in MOE (trade name) manufactured by Canada Chemical Computing Group, and the polling method (Smellie, A., Teig, SL, and Towbin, P., J. Comp. Chem., 16, 171-187 (1995)) can be used to search various conformational spaces in a short time.
第二工程では、受容体の3次元構造モデルにおいて、一定の大きさの球が受容体分子内の少なくとも4つの重原子と接触して存在し得る座標を、幾何学的な方法により網羅的に探索し、その座標位置に半径1 〜 3 Å 程度のダミー原子Sを配置する。
受容体中の任意の4つの重原子と接触して存在し得る仮想的な球の座標を網羅的に探索する幾何学的な方法としては、Edelsbrunner らによる方法(Edelsbrunner, H., et al.,Proceedings of the 28th Hawaii International Conference on Systems Science. 256-264 (1995))及び、このアルゴリズムをもとにした Chemical Computing Group 社製 MOE
に搭載された Alpha Site Finder が挙げられる。
この手法で使用されるアルファ球と称する仮想的な球の大きさは、好ましくは半径0.5 〜 5 Å、さらに好ましくは、1〜2Å である。このようにして決定された球の中心座標は、生体高分子中の少なくとも4つの原子と近接していることから、生体高分子の窪みの中にあり、かつリガンドの重原子が存在し得る十分な空間の中心であるとみなすことができ
る。
次にこの座標位置に半径1 〜 3 Å 程度のダミー原子Sを配置する。ダミー原子Sは前記座標位置に任意に設定することができ、また複数設定してもよい。
In the second step, in the three-dimensional structural model of the receptor, coordinates that a sphere of a certain size can exist in contact with at least four heavy atoms in the receptor molecule are comprehensively determined by a geometric method. Search and place a dummy atom S with a radius of 1 to 3 Å at the coordinate position.
As a geometric method for exhaustively searching for the coordinates of a hypothetical sphere that may exist in contact with any four heavy atoms in the receptor, the method by Edelsbrunner et al. (Edelsbrunner, H., et al. , Proceedings of the 28th Hawaii International Conference on Systems Science. 256-264 (1995)) and MOE manufactured by Chemical Computing Group based on this algorithm
The Alpha Site Finder installed in the.
The size of a hypothetical sphere called an alpha sphere used in this method is preferably a radius of 0.5 to 5 mm, more preferably 1 to 2 mm. Since the center coordinates of the sphere thus determined are close to at least four atoms in the biopolymer, it is in the depression of the biopolymer and sufficient for the heavy atoms of the ligand to be present. It can be regarded as the center of a simple space.
Next, a dummy atom S having a radius of 1 to 3 に is placed at this coordinate position. The dummy atoms S can be arbitrarily set at the coordinate position, or a plurality of dummy atoms may be set.
第三工程では、ダミー原子Sを座標を基準にクラスタリングすることにより、少なくとも1つのダミー原子を含む結合ポケットを設定する。クラスタリングはダミー原子の座標を基準にして行うことができる。例えば、 1.0〜5.0 Å以内、好ましくは 1.5〜3.5 Å以内の距離にあるダミー原子を一まとめにすることによってクラスタリングを行うことができる。
第三工程においては、複数のダミー原子Sを含む結合ポケットについて、結合ポケット内のダミー原子S間の距離を全て算出し、互いに0.1〜2.0Å以内に近接する複数のダミー原子が存在する場合、1つを残して近接する他のダミー原子を削除することが好ましい。
In the third step, a bond pocket including at least one dummy atom is set by clustering the dummy atoms S on the basis of coordinates. Clustering can be performed based on the coordinates of the dummy atoms. For example, clustering can be performed by grouping together dummy atoms within a distance of 1.0 to 5.0 mm, preferably 1.5 to 3.5 mm.
In the third step, for a bond pocket containing a plurality of dummy atoms S, all distances between the dummy atoms S in the bond pocket are calculated, and when there are a plurality of dummy atoms close to each other within 0.1 to 2.0 mm, It is preferable to delete other dummy atoms in the vicinity, leaving one.
受容体とリガンドが安定な複合体を形成するためには、リガンドを構成する原子が受容体と重ならない配座を取りうることが重要である。このことを考慮するため、第四工程では、第三工程で規定された結合ポケットにおいて、ダミー原子Sの周囲3 〜 20 Å 程度の範囲に存在する受容体の重原子を選択し、その座標位置に、−3 Å < r < −0.5 Å の範囲の仮想的な半径rを持つダミー原子Xを設定する。 In order for a receptor and a ligand to form a stable complex, it is important that the atoms constituting the ligand can adopt a conformation that does not overlap with the receptor. In order to take this into consideration, in the fourth step, acceptor heavy atoms existing in the range of about 3 to 20 周 囲 around the dummy atom S in the binding pocket defined in the third step are selected, and their coordinate positions are selected. To set a dummy atom X with a virtual radius r in the range −3 Å <r <−0.5 Å.
次いで、上記第二〜第四工程で設定されたダミー原子群に、第一工程で配座が決定されたリガンドを重ね合わせ、その重なりの程度を見積もることにより、結合ポケットへのリガンド形状の適合性を評価する。 Next, the ligand shape conformed in the first step is superimposed on the dummy atom group set in the second to fourth steps, and the degree of the overlap is estimated, thereby matching the ligand shape to the binding pocket. Assess sex.
具体的には、第五工程で、第一工程で発生させたリガンド立体配座中の一つの重原子が、第二工程で規定されたダミー原子Sからランダムに選択された一つと重なるように、リガンド分子をランダムに回転及び平行移動させる。
第六工程では、リガンド原子とダミー原子S及びXとの重なりの程度をスコアとして算出し、リガンド分子全体を回転及び平行移動させることにより、スコアが極大となる配座を選択する。なお、この工程においてはリガンド原子として、リガンド内の重原子のみを考慮することが好ましい。
第七工程では第五工程から第六工程を繰り返し、受容体と安定な複合体を形成するリガンドの相対的な配座を選択する。
Specifically, in the fifth step, one heavy atom in the ligand conformation generated in the first step overlaps with one randomly selected from the dummy atoms S defined in the second step. Rotate and translate the ligand molecule randomly.
In the sixth step, the degree of overlap between the ligand atom and the dummy atoms S and X is calculated as a score, and the conformation that maximizes the score is selected by rotating and translating the entire ligand molecule. In this step, it is preferable to consider only heavy atoms in the ligand as ligand atoms.
In the seventh step, the fifth to sixth steps are repeated to select the relative conformation of the ligand that forms a stable complex with the receptor.
異なる分子について静電荷と体積の重なりを極大化させる方法としては、 Kearsley と
Smith の SEAL 法 (Kearsley, S., & Smith, G.M., Tetrahedron Computer Methodology, 3, 615-633, (1990)) がある。
重なりの程度は、ダミー原子とリガンド原子の距離dと、原子の半径rの関数として、たとえば、下記のような関数で定義することで、容易に算出することができる。
Smith's SEAL method (Kearsley, S., & Smith, GM, Tetrahedron Computer Methodology, 3, 615-633, (1990)).
The degree of overlap can be easily calculated by defining, for example, the following function as a function of the distance d between the dummy atom and the ligand atom and the radius r of the atom.
この関数は、 α が小さいほど遠くの原子間の重なりの影響は小さくなる。 α の値は、一般的には 0.1〜 1、好ましくは、 0.3〜0.7 を用いる。また、dが小さいほど大きな値を与え、 d = 0 のとき、設定された原子半径の積、 ri × rj の値をとる。従って、f
の値が極大化するようにリガンドの分子を並行及び回転移動させることで、より重なりの大きな配置を見出すことができる。なお、実際のプログラミングにあたっては、一般的な数値解析法を用いることにより、fに−1をかけた値を極小化する条件を探索する方法を採用することもできる。
さらに、ここで、ダミー原子Xは、仮想的に負の値の半径をもつと規定されているため、Xと重なるリガンド原子があれば、その重なりの程度に応じてfの値に負の寄与をすることになる。したがって、リガンド分子を構成する各原子のダミー原子Sとダミー原子Xへの重なりの程度の総和を算出し、その値を極大化することにより、受容体中の活性ポケットの形状に適合し、かつ壁とぶつかることが少ないリガンドの配置を同時に見出すことができる。
なお、ここで使用される−fを極小化するための数値解析法としては、Steepest Descent (SD)法、Conjugate Gradients (CG)法、Newton Rapthon法(NR)、Truncated Newton (TN)法などがあり、これらを単独で、ないしは2つ以上を組み合わせて連続的に実行することにより、短時間で極小値を得ることができる。
この計算により出力される安定複合体の候補となるリガンド構造は、活性ポケットの壁面へ多少重なるところがあったとしても、リガンド分子全体としては、活性ポケットによく適合した形状をとる。
In this function, the effect of overlap between distant atoms becomes smaller as α is smaller. The value of α is generally 0.1 to 1, preferably 0.3 to 0.7. Also, the smaller d is, the larger the value is given. When d = 0, the product of the set atomic radii, r i × r j , is taken. Therefore, f
By moving the ligand molecules in parallel and rotationally so that the value of is maximized, a more overlapping arrangement can be found. In actual programming, it is also possible to employ a method for searching for a condition for minimizing a value obtained by multiplying f by −1 by using a general numerical analysis method.
Furthermore, here, since the dummy atom X is stipulated to have a virtually negative radius, if there is a ligand atom overlapping with X, negative contribution to the value of f depends on the degree of overlap. Will do. Therefore, by calculating the sum of the degree of overlap of each atom constituting the ligand molecule to the dummy atom S and the dummy atom X, and maximizing the value, it is adapted to the shape of the active pocket in the receptor, and It is possible to simultaneously find the arrangement of ligands that do not hit the wall.
The numerical analysis methods used to minimize -f used here include the Steepest Descent (SD) method, the Conjugate Gradients (CG) method, the Newton Rapthon method (NR), and the Truncated Newton (TN) method. There is a minimum value can be obtained in a short time by continuously executing these alone or in combination of two or more.
The ligand structure that is a candidate for a stable complex that is output by this calculation takes a shape that fits well into the active pocket as a whole of the ligand molecule, even if there is a slight overlap with the wall surface of the active pocket.
受容体の構造は、必ずしも固定したものではなく、リガンドとの複合体形成によって受容体の構造も多少は変化しうる。また、X 線、 NMR などの手法で得られる受容体の座標は、通常のタンパク質で、 1 〜 3 Å 程度の誤差があることも周知の事実である。
従って、本発明の方法により得られるリガンドの構造は、最安定な複合体構造を見出すための初期構造として妥当なものと考えられるが、必要に応じて分子力学計算により、受容体構造とともに微調整することができる。具体的には、第七工程で得られたリガンド構造のリストに対して、分子力学計算によって、リガンド−受容体複合体構造の最適化を行うことにより、安定な複合体構造を決定することができる。分子力学計算における精度は、使用する力場に依存するため、ドッキングの計算においては生体高分子と低分子であるリガンドのいずれにも対応するパラメータをもつ力場を使用することが必要となる。一般に入手できる力場としては、 CVFF(P. Douber-Osguthorpe et al,,Proteins: Struct. Funct. Genet., vol. 4, p31, 1988)、 CFF(M.J.Hwang et al, J.Am. Chem. Soc., vol 116, p2515, 1994)、 OPLS-AA(Jorgensen W. L., et al,,J. Am. Chem. Soc., vol. 117, p11225-11236, 1996)、 MMFF94、 MMFF94s、 MMFF94x(いずれもT.A.Halgren, J. Comp. Chem. vol. 17, No. 5&6, p490, 1996) などが挙げられる。また、これらのパラメータを含む分子力学計算エンジンとしては、 Discover (登録商標、Accelrys Inc.(米))、 CHARMM (Cornell W. D., et al,,J. Am. Chem. Soc., vol. 117, p5179, 1995)、 MOE-Minimizer(商標、Chemical Computing Group Inc.(加))、 Direct Force Field (商標、Aeon Technology, Inc.(米))などが挙げられるが、これらに限定されるものではない。
さらに、第一工程から第七工程までを、ないしは、その後に続く分子力学計算工程までを、複数のリガンドおよび/または複数の受容体について連続的に実行し、受容体とリガンドが安定して存在し得る構造を特定することにより、新規生理活性物質の候補化合物の発見、あるいはリガンドが結合し得る受容体の既知の機能から、リガンドの生理活性の推定を行うことができる。
The structure of the receptor is not necessarily fixed, and the structure of the receptor may change somewhat due to complex formation with the ligand. It is also a well-known fact that the coordinates of the receptor obtained by techniques such as X-ray and NMR are normal proteins and have an error of about 1 to 3 Å.
Therefore, the ligand structure obtained by the method of the present invention is considered to be appropriate as an initial structure for finding the most stable complex structure. However, if necessary, it can be fine-tuned together with the receptor structure by molecular mechanics calculation. can do. Specifically, a stable complex structure can be determined by optimizing the ligand-receptor complex structure by molecular mechanics calculation on the list of ligand structures obtained in the seventh step. it can. Since the accuracy in molecular mechanics calculation depends on the force field to be used, it is necessary to use a force field having parameters corresponding to both the biopolymer and the low-molecular ligand in the docking calculation. Commonly available force fields include CVFF (P. Douber-Osguthorpe et al ,, Proteins: Struct. Funct. Genet., Vol. 4, p31, 1988), CFF (MJHwang et al, J. Am. Chem. Soc , vol 116, p2515, 1994), OPLS-AA (Jorgensen WL, et al ,, J. Am. Chem. Soc., vol. 117, p11225-11236, 1996), MMFF94, MMFF94s, MMFF94x (all TAHalgren , J. Comp. Chem. Vol. 17, No. 5 & 6, p490, 1996). In addition, molecular mechanics calculation engines including these parameters include Discover (registered trademark, Accelrys Inc. (USA)), CHARMM (Cornell WD, et al ,, J. Am. Chem. Soc., Vol. 117, p5179. , 1995), MOE-Minimizer (trademark, Chemical Computing Group Inc. (Canada)), Direct Force Field (trademark, Aeon Technology, Inc. (US)), etc., but are not limited thereto.
Furthermore, the first step to the seventh step or the subsequent molecular mechanics calculation step are continuously performed for a plurality of ligands and / or a plurality of receptors, so that the receptors and the ligands exist stably. By specifying a possible structure, the biological activity of the ligand can be estimated from the discovery of a candidate compound for a novel physiologically active substance or the known function of a receptor to which the ligand can bind.
本発明は、通常、受容体及びリガンドの座標、元素名など計算機上で分子の三次元構造を再現するに十分なデータを含むファイルに対して、本発明で規定された工程を適当なコンピュータ言語で記述したプログラムを実行することにより実施する。コンピュータ言語としては、 C, C++, FORTRAN, JAVA, SVL(CCG 社 Scientific Vector Language) など、通常科学計算に使用される言語であれば、特に規定しない。また、本発明を実施するためのプログラムとしては、全工程を記述した一貫したプログラムを使用するばかりでなく、各工程ないしはその一部を実施する機能を有する公開されたプログラムを組み合わせて
、当該機能を実現する関数等を呼び出すようなスクリプトをまとめたものも使用可能である。
The present invention usually applies the process defined by the present invention to an appropriate computer language for a file containing sufficient data to reproduce the three-dimensional structure of a molecule on a computer, such as receptor and ligand coordinates, element names, etc. This is implemented by executing the program described in. The computer language is not particularly defined as long as it is a language normally used for scientific calculation, such as C, C ++, FORTRAN, JAVA, SVL (CCG Scientific Vector Language). In addition, as a program for carrying out the present invention, not only a consistent program that describes all the processes is used, but also a combination of published programs that have a function of performing each process or a part thereof, It is also possible to use a script that calls a function that implements the above.
本発明の方法の有効性を示すために、本発明の工程を連続的に実行することの可能なプログラムを作成し、三次元構造が既知の複合体について、受容体とリガンドを分離した上でこのプログラムを適用し、既知のリガンド−受容体複合体構造を短時間で再現し得ることを確認した。
なお、ここでは、ケミカルコンピューティンググループ社(加)製計算化学システムMOE(2004.03 版)に搭載された言語 SVL と関数を使用してプログラムを作成した。分子力学計算では、生体高分子はもとより、広範囲のリガンドに対するパラメータを有し、複合体の構造再現精度が高いメルク力場(MMFF94x)を使用した。それでも不足するパラメータに対しては、このメルク力場を補完するルール依存力場を用いることにより、どのような分子間相互作用も自動的に計算できるようにした。
In order to show the effectiveness of the method of the present invention, a program capable of continuously executing the steps of the present invention is created, and a receptor and a ligand are separated from a complex having a known three-dimensional structure. By applying this program, it was confirmed that a known ligand-receptor complex structure can be reproduced in a short time.
Here, the program was created using the language SVL and functions installed in the computational chemistry system MOE (2004.03 version) manufactured by Chemical Computing Group, Inc. In molecular mechanics calculations, we used Merck force field (MMFF94x), which has parameters for a wide range of ligands as well as biopolymers and has high structure reproducibility. For parameters that are still insufficient, a rule-dependent force field that complements this Merck force field can be used to automatically calculate any intermolecular interaction.
PDB に登録されている複合体の内、エントリー 1AQW、1C5C、1CBS、1CVU、1D0L、1D3D、1D3P、1DG5、1EI1、1BXO、1CKP、1DD7、1F0R、1F0S、1LIC、3ERT について実施した。ここでは、 3ERT のエストロゲンレセプタとリガンド OHT (4-Hydroxy-tamoxifen)の複合体を例にとって手順を説明する。
なお、プロテインデータバンクに登録された立体構造は、 X 線により決定されたものであり、水素原子の座標は含まれていない。本発明の方法を適用する前に、この構造を、
MOE に読み込み、水素原子を付加した上で、分子力学計算により水素原子の位置を決定した。このとき、実験により得られた構造を保持するべく、水素以外の原子の座標は固定して、水素原子の位置のみ分子力学計算による最適化を行った。
Of the complexes registered in the PDB, entries 1AQW, 1C5C, 1CBS, 1CVU, 1D0L, 1D3D, 1D3P, 1DG5, 1EI1, 1BXO, 1CKP, 1DD7, 1F0R, 1F0S, 1LIC, 3ERT were conducted. Here, the procedure is explained using a complex of 3ERT estrogen receptor and ligand OHT (4-Hydroxy-tamoxifen) as an example.
The three-dimensional structure registered in the protein data bank is determined by X-ray and does not include the coordinates of hydrogen atoms. Before applying the method of the present invention, this structure is
After reading into MOE, adding hydrogen atoms, the position of hydrogen atoms was determined by molecular mechanics calculation. At this time, in order to maintain the structure obtained by the experiment, the coordinates of atoms other than hydrogen were fixed, and only the position of the hydrogen atom was optimized by molecular mechanics calculation.
第一工程は、MOEに搭載されたConformation_Import 関数を使用し、リガンド OHT が取り得る配座を網羅的に発生させ、エネルギーの低い順に100種類を保存した(図2)。 In the first step, the conformation_import function installed in the MOE was used to comprehensively generate conformations that can be taken by the ligand OHT, and 100 types were stored in ascending order of energy (Fig. 2).
第二、第三工程の結合ポケットの探索、ダミー原子の配置、クラスタリングは、 Edelsbrunner らの方法(Edelsbrunner, H., et al., 1995)を拡張した MOE-Alpha Site Finder 機能を使用して、半径 1.4 〜 1.8 Å の球が入りうる座標を決定し、その全ての位置に、エネルギーを持たない、炭素原子と同じ半径をもつダミー原子を配置した。 このダミー原子間の距離を全て測定し、 2.5 Å 以内の距離にあるものを一まとめにして、それぞれ結合ポケットとした。この系では、 21個のグループ(クラスター)に分割された(図3)。このうち、最も大きなポケットに含まれるダミー原子以外は、全て削除した。
第三工程ではまた、このダミー原子間の距離を全て測定し、全てのダミー原子が、0.8 Å以内の距離に他のダミー原子が一つも存在しないように、余分なダミー原子を削除した。
The search for bond pockets, dummy atom placement, and clustering in the second and third steps are performed using the MOE-Alpha Site Finder function, which is an extension of Edelsbrunner et al. (Edelsbrunner, H., et al., 1995). Coordinates that can enter a sphere with a radius of 1.4 to 1.8 入 り were determined, and dummy atoms with the same radius as the carbon atoms, without energy, were placed at all positions. All the distances between the dummy atoms were measured, and those within a distance of 2.5 に し て were grouped into a binding pocket. In this system, it was divided into 21 groups (clusters) (Fig. 3). Of these, all but the dummy atoms contained in the largest pocket were deleted.
In the third step, all the distances between the dummy atoms were also measured, and the extra dummy atoms were deleted so that all the dummy atoms had no other dummy atoms within a distance of 0.8 mm.
第四工程では、排除体積領域として、全てのダミー原子から 4.5 Å 以内の距離にある受容体の水素原子以外の原子の座標を検出し、それぞれの座標上に、その重原子の座標と同じ絶対値で、符号が負となる半径をもつ仮想的なダミー原子を配置した(図4)。 In the fourth step, as the excluded volume region, the coordinates of atoms other than the hydrogen atom of the acceptor that are within a distance of 4.5 か ら from all dummy atoms are detected, and on each coordinate, the same absolute coordinates as those of the heavy atoms are detected. A virtual dummy atom having a radius whose value is negative is arranged (FIG. 4).
第一工程で発生させた最もエネルギーが低い配座について、第五、第六工程に従ってこのダミー原子モデルと重ね合わせを行い、安定複合体となる可能性のある配置を50見出した(図5)。
ついで、そのリガンド構造と第一工程で得られたほかのコンフォメーションのRMSD(平均二乗距離の平方根)を算出し、最も構造が異なるコンフォメーションについて、同様に第五、第六工程を実施した。 この操作を繰り返し、200の初期構造が出力されるまで続けた。
The conformation with the lowest energy generated in the first step was overlaid with this dummy atom model according to the fifth and sixth steps, and 50 arrangements that could become stable complexes were found (FIG. 5). .
Next, RMSD (square root of mean square distance) of the ligand structure and other conformations obtained in the first step was calculated, and the fifth and sixth steps were similarly performed for the conformations having the most different structures. This operation was repeated until 200 initial structures were output.
この初期構造のリストを、スコアfの大きさで並べ替え、スコアが良い100構造のみについて、順次、受容体の中に配置し、分子力学計算による構造最適化を行った。リガンドの内部エネルギーと、リガンドと受容体の相互作用エネルギーの合計が小さいものほど、複合体として安定と考えられるため、この合計エネルギーの最も小さいものから順に並べ替え、構造を観察した。 この系において、合計エネルギーの最も低い構造は、X線結晶構造解析により決定されたデータと比較して、重原子の RMSD が 0.59 となり、実験データをよく再現していることを確認した(図5)。 This list of initial structures was rearranged according to the size of the score f, and only 100 structures with good scores were sequentially placed in the receptor, and the structure was optimized by molecular mechanics calculation. The smaller the total of the internal energy of the ligand and the interaction energy of the ligand and the receptor, the more stable the complex, so the structures were rearranged in order from the lowest total energy. In this system, the structure with the lowest total energy has an RMSD of 0.59 compared to the data determined by X-ray crystal structure analysis, confirming that the experimental data is well reproduced (Fig. 5). ).
また、同様の方法によって他のリガンドと受容体の組合せについても解析した。結果を表1に示した。Best RMSD は、計算結果と X 線結晶構造とのリガンドの重原子間の距離の2乗平均の平方根の中で最も良いもの、 Etotalは、その構造の全相互作用エネルギーとリガンドの内部エネルギーの和、 Score は、その構造のスコアf、 Best RMSD No. in Scoreは、 RMSD が 最もよい構造の Score での順位、 Best RMSD No. in Etotal は、RMSD が 最もよい構造の Etotal での順位、 Time は、 Intel Xeon 3.06 GHz × 2 マシンで計算にかかった時間を示している。
これによれば、本発明の方法によって得られたBest RMSDの構造は、スコア f やEtotalにおいても上位にランクされ、本発明の方法を用いることにより、リガンドと受容体の複合体構造を短時間で正確に予測できることがわかった。
In addition, combinations of other ligands and receptors were also analyzed by the same method. The results are shown in Table 1. Best RMSD is the best square root of the root mean square of the distance between the ligand's heavy atoms in the calculated results and the X-ray crystal structure. Etotal is the sum of the total interaction energy of the structure and the internal energy of the ligand. , Score is the score of the structure f, Best RMSD No. in Score is the rank in the score of the structure with the best RMSD, Best RMSD No. in Etotal is the rank in the Etotal of the structure with the best RMSD, and Time is Shows the time taken to calculate on an Intel Xeon 3.06 GHz x 2 machine.
According to this, the structure of the Best RMSD obtained by the method of the present invention is ranked higher in the scores f and Etotal, and the complex structure of the ligand and the receptor can be reduced in a short time by using the method of the present invention. It was found that it can be predicted accurately.
Claims (6)
(a)リガンドがとりうる立体配座を網羅的に発生させる第一工程、
(b)受容体の3次元構造モデルにおいて、半径0.5 〜 5 Å の球が受容体分子内の少なくとも4つの重原子と接触して存在し得る座標を、幾何学的な方法により網羅的に探索し、その座標位置に半径1 〜 3 Å のダミー原子Sを配置する第二工程、
(c)ダミー原子Sを座標を基準にクラスタリングすることにより、少なくとも1つのダミー原子を含む結合ポケットを設定する第三工程、
(d)第三工程で規定された結合ポケットにおいて、ダミー原子Sの周囲3 〜 20 Åの範囲に存在する受容体の重原子を選択し、その座標位置に、−3 Å < r < −0.5 Å の範囲の仮想的な半径rを持つダミー原子Xを設定する第四工程、
(e)第一工程で発生させたリガンド立体配座中の一つの重原子が、第二工程で規定されたダミー原子Sからランダムに選択された一つと重なるように、リガンド分子をランダムに回転及び平行移動させる第五工程、
(f)リガンド原子とダミー原子S及びXとの重なりの程度をスコアとして算出し、リガンド分子全体を回転及び平行移動させることにより、スコアが極大となる配座を選択する第六工程、
(g)第五工程から第六工程を繰り返し、安定な複合体を形成する受容体とリガンドの相対的な配座を選択する第七工程。 A method of searching for a stable complex structure of a receptor and a ligand using a computer, wherein the receptor and the ligand are performed by performing the following first to seventh steps for the combination of the receptor and the ligand. A method characterized by identifying structures in which can exist stably:
(A) a first step of comprehensively generating conformations that can be taken by a ligand;
(B) In a three-dimensional structural model of the receptor, a coordinate method is used to comprehensively search for coordinates where a sphere with a radius of 0.5 to 5 接触 can be in contact with at least four heavy atoms in the receptor molecule. A second step of arranging a dummy atom S having a radius of 1 to 3 Å at the coordinate position,
(C) a third step of setting a bond pocket including at least one dummy atom by clustering the dummy atoms S on the basis of coordinates;
(D) In the binding pocket defined in the third step, select the acceptor heavy atom in the range of 3 to 20 周 囲 around the dummy atom S, and set −3 Å <r <−0.5 at the coordinate position. A fourth step of setting a dummy atom X having a virtual radius r in the range of Å
(E) Randomly rotate the ligand molecule so that one heavy atom in the ligand conformation generated in the first step overlaps one randomly selected from the dummy atoms S defined in the second step And a fifth step of translating,
(F) calculating the degree of overlap between the ligand atom and the dummy atoms S and X as a score, and rotating and translating the entire ligand molecule to select a conformation that maximizes the score;
(G) A seventh step in which the fifth to sixth steps are repeated to select the relative conformation of the receptor and the ligand that form a stable complex.
(a)リガンドがとりうる立体配座を網羅的に発生させる第一の手順、
(b)受容体の3次元構造モデルにおいて、半径0.5 〜 5 Å の球が受容体分子内の少なくとも4つの重原子と接触して存在し得る座標を、幾何学的な方法により網羅的に探索し、その座標位置に半径1 〜 3 Å のダミー原子Sを配置する第二の手順、
(c)ダミー原子Sを座標を基準にクラスタリングすることにより、少なくとも1つのダミー原子を含む結合ポケットを設定する第三の手順、
(d)第三の手順により規定された結合ポケットにおいて、ダミー原子Sの周囲3 〜 20 Åの範囲に存在する受容体の重原子を選択し、その座標位置に、−3 Å < r < −0.5 Å の範囲の仮想的な半径rを持つダミー原子Xを設定する第四の手順、
(e)第一の手順により発生させたリガンド立体配座中の一つの重原子が、第二の手順により規定されたダミー原子Sからランダムに選択された一つと重なるように、リガンド分子をランダムに回転及び平行移動させる第五の手順、
(f)リガンド原子とダミー原子S及びXとの重なりの程度をスコアとして算出し、リガンド分子全体を回転及び平行移動させることにより、スコアが極大となる配座を選択する第六の手順、
(g)第五の手順および第六の手順による処理を繰り返し、安定な複合体を形成する受容体とリガンドの相対的な配座を選択する第七の手順。 A program for causing an information processing apparatus to execute processing for searching for a stable complex structure of a receptor and a ligand, and for executing the following procedure:
(A) a first procedure for comprehensively generating possible conformations of a ligand;
(B) In a three-dimensional structural model of the receptor, a coordinate method is used to comprehensively search for coordinates where a sphere with a radius of 0.5 to 5 接触 can be in contact with at least four heavy atoms in the receptor molecule. And a second procedure for arranging a dummy atom S having a radius of 1 to 3 に at the coordinate position,
(C) a third procedure for setting a bond pocket including at least one dummy atom by clustering the dummy atoms S on the basis of coordinates;
(D) In the binding pocket defined by the third procedure, select the acceptor heavy atom in the range of 3 to 20 Å around the dummy atom S, and set −3 Å <r <− A fourth procedure to set a dummy atom X with a virtual radius r in the range 0.5 、
(E) Randomize the ligand molecules so that one heavy atom in the ligand conformation generated by the first procedure overlaps one randomly selected from the dummy atoms S defined by the second procedure. The fifth step of rotating and translating to
(F) a sixth procedure for calculating the degree of overlap between the ligand atom and the dummy atoms S and X as a score, and selecting the conformation that maximizes the score by rotating and translating the entire ligand molecule;
(G) A seventh procedure in which the treatment by the fifth procedure and the sixth procedure is repeated, and the relative conformation of the receptor and the ligand forming a stable complex is selected.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004301616A JP4688467B2 (en) | 2004-10-15 | 2004-10-15 | Method for searching structure of receptor-ligand stable complex |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004301616A JP4688467B2 (en) | 2004-10-15 | 2004-10-15 | Method for searching structure of receptor-ligand stable complex |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2006113878A JP2006113878A (en) | 2006-04-27 |
JP2006113878A5 JP2006113878A5 (en) | 2008-04-10 |
JP4688467B2 true JP4688467B2 (en) | 2011-05-25 |
Family
ID=36382347
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004301616A Expired - Lifetime JP4688467B2 (en) | 2004-10-15 | 2004-10-15 | Method for searching structure of receptor-ligand stable complex |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4688467B2 (en) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5142179B2 (en) * | 2006-04-28 | 2013-02-13 | 一徳 辻 | Prediction method of interaction sites in biopolymers |
US20090006059A1 (en) * | 2007-06-27 | 2009-01-01 | Nidhi Arora | Systems and methods for mapping binding site volumes in macromolecules |
JP6311320B2 (en) * | 2014-01-15 | 2018-04-18 | 富士通株式会社 | CONNECTION STRUCTURE CALCULATION METHOD, CALCULATION DEVICE, PROGRAM, AND RECORDING MEDIUM |
JP6610182B2 (en) * | 2015-11-09 | 2019-11-27 | 富士通株式会社 | Binding free energy calculation pre-processing method, binding free energy calculation method and apparatus, and program |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1993020525A1 (en) * | 1992-03-27 | 1993-10-14 | Akiko Itai | Method of searching the structure of stable biopolymer-ligand molecule composite |
JPH06503908A (en) * | 1991-06-17 | 1994-04-28 | トリポス アソシエイツ インコーポレーテッド | Comparative molecular field analysis method |
WO1996013785A1 (en) * | 1994-10-31 | 1996-05-09 | Akiko Itai | Method of retrieving novel ligand compounds from three-dimensional structure database |
-
2004
- 2004-10-15 JP JP2004301616A patent/JP4688467B2/en not_active Expired - Lifetime
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06503908A (en) * | 1991-06-17 | 1994-04-28 | トリポス アソシエイツ インコーポレーテッド | Comparative molecular field analysis method |
WO1993020525A1 (en) * | 1992-03-27 | 1993-10-14 | Akiko Itai | Method of searching the structure of stable biopolymer-ligand molecule composite |
WO1996013785A1 (en) * | 1994-10-31 | 1996-05-09 | Akiko Itai | Method of retrieving novel ligand compounds from three-dimensional structure database |
Also Published As
Publication number | Publication date |
---|---|
JP2006113878A (en) | 2006-04-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ericksen et al. | Machine learning consensus scoring improves performance across targets in structure-based virtual screening | |
Holtje et al. | Molecular modeling | |
Kitchen et al. | Docking and scoring in virtual screening for drug discovery: methods and applications | |
von Korff et al. | Comparison of ligand-and structure-based virtual screening on the DUD data set | |
Li et al. | Comparative assessment of scoring functions on an updated benchmark: 2. Evaluation methods and general results | |
Cross et al. | Comparison of several molecular docking programs: pose prediction and virtual screening accuracy | |
Tian et al. | Assessing an ensemble docking-based virtual screening strategy for kinase targets by considering protein flexibility | |
Wadood et al. | In-silico drug design: An approach which revolutionarised the drug discovery process | |
Biesiada et al. | Survey of public domain software for docking simulations and virtual screening | |
Hoffer et al. | S4MPLE–sampler for multiple protein–ligand entities: Simultaneous docking of several entities | |
US10002228B2 (en) | Method for binding site identification by molecular dynamics simulation (silcs: site identification by ligand competitive saturation) | |
Krumrine et al. | Principles and methods of docking and ligand design | |
SK4682003A3 (en) | Method of operating a computer system to perform a discrete substructural analysis | |
Chen et al. | Prediction of protein pairs sharing common active ligands using protein sequence, structure, and ligand similarity | |
Meier et al. | ParaDockS: a framework for molecular docking with population-based metaheuristics | |
Schultz et al. | Application and assessment of deep learning for the generation of potential NMDA receptor antagonists | |
US6671628B2 (en) | Methods for identifying a molecule that may bind to a target molecule | |
US20090006040A1 (en) | Systems and Methods for Representing Protein Binding Sites and Identifying Molecules with Biological Activity | |
Szwabowski et al. | Application of computational methods for class A GPCR Ligand discovery | |
Pan et al. | Free energy-based conformational search algorithm using the movable type sampling method | |
JP4688467B2 (en) | Method for searching structure of receptor-ligand stable complex | |
Yu et al. | Computational approaches for the design of protein–protein interaction inhibitors | |
SHARMA et al. | Molecular docking: an explanatory approach in structure-based drug designing and discovery | |
JP2005018447A (en) | Method for searcing acceptor-ligand stable complex structure | |
Mishra et al. | Computational docking technique for drug discovery: A review |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071002 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080221 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101019 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101208 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110125 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110215 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4688467 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140225 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |