Search
Search

연구성과물 검색 타이틀 이미지

HOME ICON HOME > Search by Achievements Type > Reports View

Reports Detailed Information

https://www.krm.or.kr/krmts/link.html?dbGubun=SD&m201_id=10011260&local_id=10017564
단백질 접힘 구조 예측의 효율적 계산을 위한 자료구조와 알고리즘 연구
Reports NRF is supported by Research Projects( 단백질 접힘 구조 예측의 효율적 계산을 위한 자료구조와 알고리즘 연구 | 2006 Year 신청요강 다운로드 PDF다운로드 | 신하용(한국과학기술원) ) data is submitted to the NRF Project Results
Researcher who has been awarded a research grant by Humanities and Social Studies Support Program of NRF has to submit an end product within 6 months(* depend on the form of business)
사업별 신청요강보기
  • Researchers have entered the information directly to the NRF of Korea research support system
Project Number D00336
Year(selected) 2006 Year
the present condition of Project 종료
State of proposition 재단승인
Completion Date 2008년 02월 28일
Year type 결과보고
Year(final report) 2008년
Research Summary
  • Korean
  • DNA에 저장된 유전정보에 따라 단백질을 합성하고, 단백질 분자는 특정한 3차원적 구조를 만들어서 생물학적 기능을 하게 된다. Human Genome Project를 통하여 DNA의 염기서열은 대부분 얻게 되었으며, 이로부터 단백질을 구성하는 아미노산의 서열도 획득이 가능하지만, 아미노산 서열로부터 단백질의 3차원적 구조를 계산하는 단백질 접힘예측 (Protein folding prediction) 문제는 매우 중요하면서도 요원한 과제로 남아있다. 단백질은 생체내의 여러 가지 중요한 기능을 담당하는 거대 분자로, 포함된 원자의 수가 매우 많아서, 그들 간의 상호작용으로 결정되는 3차원 구조를 예측하는 데에 계산량이 감당할 수 없이 많기 때문이다. 본 연구에서는 단백질 접힘예측 계산을 촉진하기 위한 다중해상도 표현법과 병렬계산 구조를 제시하고 있다. 다중해상도 표현은 단백질을 구성하는 원자들을 계층적으로 grouping하여 처음에는 큰 덩어리 수준에서 대강의 위치를 계산한 후, 차차 해상도를 높여가며 보다 정밀한 계산을 함으로써, 계산량을 줄이면서 정확한 구조를 예측하도록 하자는 것이 핵심 개념이다. 단백질에 대한 다중해상도 모델로 본 연구에서는 두가지 방법을 제시하고 있다. 첫번째는 단백질을 구성하는 backbone원자들을 중심으로 간략화시키는 backbone 간략화 모델이다. 이 방법은 단순성이 최대의 장점이나 단백질의 접힘에 중요한 역할을 하는 곁가지를 무시하기 때문에 정밀도에 문제가 있을 수 있다. 두번째 방법은 단백질을 구성하는 원자들간의 bond중 자유회전이 가능한 bond에서 분할한 단편(fragment)들로 grouping하는 단편계층화 모델이다. 하나의 단편내의 원자들은 비교적 견고하게 결합되어 있기 때문에 공간상에서 rigid motion을 할 것으로 기대가 되고, 따라서 단편들을 하나의 덩어리로 취급하는 것은 자연스러운 간략화라 할 수 있겠다.
    본 연구의 두번째 내용은 앞서 설명한 다중해상도 모델을 바탕으로 한 계산 방법의 설계이다. 이를 위하여 본 연구에서는 병렬처리가 가능한 접힘계산 소프트웨어를 설계하였으며, 전반적 architecture와 상세설계가 제시되었다. 본 연구의 결과를 기반으로 추후 단백질 접힘예측 연구가 가속될 것으로 기대된다.
  • English
  • Genetic information encoded in DNA is translated to protein synthesis. Polypeptide chain is formed into a specific 3-dimensional structure to perform biological functions. Human genome project produced most of base pair sequence in DNA, and hence the sequence of amino acids in proteins have become readily available. However, the prediction of 3-dimensional structure from the amino acid sequence still remains far from being reasonably accurate. The most important macro-molecule in cells of living organism is protein, which consists of numerous atoms. It goes beyond the limit of the most advanced computing machine in modern era to predict (in ab initio manner) the structure of protein which is determined by the inter-atomic forces of a protein molecule and the environment. In this research, proposed are multi-resolution models and a parallel computing architecture to facilitate computation of protein folding prediction. Multi-resolution representation is to make hierarchical grouping of atoms in protein molecule, so that initial configuration is computed at coarse grained level, then the configuration is refined at the finer level. This will drastically reduce computation. This research proposes two models of multi-resolution representation. First approach is backbone simplification model which extracts backbone atoms first, then group k adjacent atoms as a macro-atom. Simplicity is the biggest benefit of backbone simplification model, however, it may lose accuracy because it ignores the side-chains which are believed to play important roles in forming the 3-dimensional structure of protein. The second approach is fragment tree model. In this model, a protein molecule is partitioned at every bond which allow free rotation. Each partition is called a fragment. Since atoms in a fragment are tightly coupled to form a rigid body, it is a natural simplification to treat a fragment as a macro-atom.
    The second contents of this research is the design of parallel computation structure based on the above mentioned multi-resolution models. Architecture and detailed design of parallel computation model for protein folding prediction is proposed in terms of UML (Unified Modeling Language).
    In the future, hopefully folding prediction is to be expedited by used of the result from this research.
Research result report
  • Abstract
  • DNA에 저장된 유전정보에 따라 단백질을 합성하고, 단백질 분자는 특정한 3차원적 구조를 만들어서 생물학적 기능을 하게 된다. Human Genome Project를 통하여 DNA의 염기서열은 대부분 얻게 되었으며, 이로부터 단백질을 구성하는 아미노산의 서열도 획득이 가능하지만, 아미노산 서열로 부터 단백질의 3차원적 구조를 계산하는 단백질 접힘예측 (Protein folding prediction) 문제는 매우 중요하면서도 요원한 과제로 남아있다. 단백질은 생체내의 여러가지 중요한 기능을 담당하는 거대 분자로, 포함된 원자의 수가 매우 많아서, 그들 간의 상호작용으로 결정되는 3차원 구조를 예측하는 데에 계산량이 감당할 수 없이 많기 때문인다. 본 연구에서는 단백질 접힘예측 계산을 촉진하기 위한 다중해상도 표현법과 병렬계산 구조를 제시하고 있다. 다중해상도 표현은 단백질을 구성하는 원자들을 계층적으로 grouping하여 처음에는 큰 덩어리 수준에서 대강의 위치를 계산한 후, 차차 해상도를 높여가며 보다 정밀한 계산을 함으로써, 계산량을 줄이면서 정확한 구조를 예측하도록 하자는 것이 핵심 개념이다. 단백질에 대한 다중해상도 모델로 본 연구에서는 두가지 방법을 제시하고 있다. 첫번째는 단백질을 구성하는 backbone원자들을 중심으로 간략화시키는 backbone 간략화 모델이다. 이 방법은 단순성이 최대의 장점이나 단백질의 접힘에 중요한 역할을 하는 곁가지를 무시하기 때문에 정밀도에 문제가 있을 수 있다. 두번째 방법은 단백질을 구성하는 원자들간의 bond중 자유회전이 가능한 bond에서 분할한 단편(fragment)들로 grouping하는 단편계층화 모델이다. 하나의 단편내의 원자들은 비교적 견고하게 결합되어 있기 때문에 공간상에서 rigid motion을 할 것으로 기대가 되고, 따라서 단편들을 하나의 덩어리로 취급하는 것은 자연스러운 간략화라 할 수 있겠다.
    본 연구의 두번째 내용은 앞서 설명한 다중해상도 모델을 바탕으로 한 계산 방법의 설계이다. 이를 위하여 본 연구에서는 병렬처리가 가능한 접힘계산 소프트웨어를 설계하였으며, 전반적 architecture와 상세설계가 제시되었다.
    본 연구의 결과를 기반으로 추후 단백질 접힘예측 연구가 가속될 것으로 기대된다.
  • Research result and Utilization method
  • 본 연구의 결과는 두가지로 나뉜다.
    1. 단백질 접힘예측 계산을 위한 다중해상도모델 제시
    다중해상도 표현은 단백질을 구성하는 원자들을 계층적으로 grouping하여 처음에는 큰 덩어리 수준에서 대강의 위치를 계산한 후, 차차 해상도를 높여가며 보다 정밀한 계산을 함으로써, 계산량을 줄이면서 정확한 구조를 예측하도록 하자는 것이 핵심 개념이다. 단백질에 대한 다중해상도 모델로 본 연구에서는 두가지 방법을 제시하고 있다. 첫번째는 단백질을 구성하는 backbone원자들을 중심으로 간략화시키는 backbone 간략화 모델이다. 이 방법은 단순성이 최대의 장점이나 단백질의 접힘에 중요한 역할을 하는 곁가지를 무시하기 때문에 정밀도에 문제가 있을 수 있다. 두번째 방법은 단백질을 구성하는 원자들간의 bond중 자유회전이 가능한 bond에서 분할한 단편(fragment)들로 grouping하는 단편계층화 모델이다. 하나의 단편내의 원자들은 비교적 견고하게 결합되어 있기 때문에 공간상에서 rigid motion을 할 것으로 기대가 되고, 따라사 단편들을 하나의 덩어리로 취급하는 것은 자연스러운 간략화라 할 수 있겠다.
    2. 병렬처리 계산구조의 제시 : 앞서 설명한 다중해상도 모델을 바탕으로 한 계산 방법의 설계이다. 이를 위하여 본 연구에서는 병렬처리가 가능한 접힘계산 소프트웨어를 설계하였으며, 전반적 architecture와 상세설계 결과 (UML로 기술된 package diagram, class diagram, sequence diagram)이 제시되었다.
    본 연구의 결과를 기반으로 추후 단백질 접힘예측 연구가 가속될 것으로 기대된다.
    또한 접힘예측에 관한 새로운 idea를 손쉽게 구현해 볼 수 있는 testbed framework으로 활용될 수 있다.
  • Index terms
  • 단백질 접힘, Protein folding, 다중해상도, 병렬처리
  • List of digital content of this reports
데이터를 로딩중 입니다.
  • This document, it is necessary to display the original author and you do not have permission
    to use copyrighted material for-profit
  • In addition , it does not allow the change or secondary writings of work
데이터 이용 만족도
자료이용후 의견
입력
트위터 페이스북
NRF Daejeon
(34113) 201, Gajeong-ro, Yuseong-gu, Daejeon, Korea
Tel: 82-42-869-6114 / Fax: 82-42-869-6777
NRF Seoul
(06792) 25, Heonreung-ro, Seocho-gu, Seoul, Korea
Tel: 82-2-3460-5500 / Fax: 82-2-3460-5759
KRM Help Center
Tel : 042-710-4360
E-mail : krmcenter@nrf.re.kr / Fax : 042-861-4380