보고서 상세정보

https://www.krm.or.kr/krmts/link.html?dbGubun=SD&m201_id=10011260&local_id=10017564

https://www.krm.or.kr/krmts/link.html?dbGubun=SD&m201_id=10011260&local_id=10017564

단백질 접힘 구조 예측의 효율적 계산을 위한 자료구조와 알고리즘 연구

이 보고서는 한국연구재단(NRF, National Research Foundation of Korea)이 지원한 연구과제( 단백질 접힘 구조 예측의 효율적 계산을 위한 자료구조와 알고리즘 연구 | 2006 년 신청요강 다운로드

| 신하용(한국과학기술원)

) 연구결과물 로 제출된 자료입니다.

한국연구재단 인문사회연구지원사업을 통해 연구비를 지원받은 연구자는 연구기간 종료 후 6개월 이내에 결과보고서를 제출하여야 합니다.(*사업유형에 따라 결과보고서 제출 시기가 다를 수 있음.)

연구자가 한국연구재단 연구지원시스템에 직접 입력한 정보입니다.

연구과제번호	D00336
선정년도	2006 년
과제진행현황	종료
제출상태	재단승인
등록완료일	2008년 02월 28일
연차구분	결과보고
결과보고년도	2008년

결과보고시 연구요약문

국문
DNA에 저장된 유전정보에 따라 단백질을 합성하고, 단백질 분자는 특정한 3차원적 구조를 만들어서 생물학적 기능을 하게 된다. Human Genome Project를 통하여 DNA의 염기서열은 대부분 얻게 되었으며, 이로부터 단백질을 구성하는 아미노산의 서열도 획득이 가능하지만 ...

DNA에 저장된 유전정보에 따라 단백질을 합성하고, 단백질 분자는 특정한 3차원적 구조를 만들어서 생물학적 기능을 하게 된다. Human Genome Project를 통하여 DNA의 염기서열은 대부분 얻게 되었으며, 이로부터 단백질을 구성하는 아미노산의 서열도 획득이 가능하지만, 아미노산 서열로부터 단백질의 3차원적 구조를 계산하는 단백질 접힘예측 (Protein folding prediction) 문제는 매우 중요하면서도 요원한 과제로 남아있다. 단백질은 생체내의 여러 가지 중요한 기능을 담당하는 거대 분자로, 포함된 원자의 수가 매우 많아서, 그들 간의 상호작용으로 결정되는 3차원 구조를 예측하는 데에 계산량이 감당할 수 없이 많기 때문이다. 본 연구에서는 단백질 접힘예측 계산을 촉진하기 위한 다중해상도 표현법과 병렬계산 구조를 제시하고 있다. 다중해상도 표현은 단백질을 구성하는 원자들을 계층적으로 grouping하여 처음에는 큰 덩어리 수준에서 대강의 위치를 계산한 후, 차차 해상도를 높여가며 보다 정밀한 계산을 함으로써, 계산량을 줄이면서 정확한 구조를 예측하도록 하자는 것이 핵심 개념이다. 단백질에 대한 다중해상도 모델로 본 연구에서는 두가지 방법을 제시하고 있다. 첫번째는 단백질을 구성하는 backbone원자들을 중심으로 간략화시키는 backbone 간략화 모델이다. 이 방법은 단순성이 최대의 장점이나 단백질의 접힘에 중요한 역할을 하는 곁가지를 무시하기 때문에 정밀도에 문제가 있을 수 있다. 두번째 방법은 단백질을 구성하는 원자들간의 bond중 자유회전이 가능한 bond에서 분할한 단편(fragment)들로 grouping하는 단편계층화 모델이다. 하나의 단편내의 원자들은 비교적 견고하게 결합되어 있기 때문에 공간상에서 rigid motion을 할 것으로 기대가 되고, 따라서 단편들을 하나의 덩어리로 취급하는 것은 자연스러운 간략화라 할 수 있겠다.
본 연구의 두번째 내용은 앞서 설명한 다중해상도 모델을 바탕으로 한 계산 방법의 설계이다. 이를 위하여 본 연구에서는 병렬처리가 가능한 접힘계산 소프트웨어를 설계하였으며, 전반적 architecture와 상세설계가 제시되었다. 본 연구의 결과를 기반으로 추후 단백질 접힘예측 연구가 가속될 것으로 기대된다.

영문
Genetic information encoded in DNA is translated to protein synthesis. Polypeptide chain is formed into a specific 3-dimensional structure to perform biological functions. Human genome project produced most of base pair sequence in DNA, and hence the ...

Genetic information encoded in DNA is translated to protein synthesis. Polypeptide chain is formed into a specific 3-dimensional structure to perform biological functions. Human genome project produced most of base pair sequence in DNA, and hence the sequence of amino acids in proteins have become readily available. However, the prediction of 3-dimensional structure from the amino acid sequence still remains far from being reasonably accurate. The most important macro-molecule in cells of living organism is protein, which consists of numerous atoms. It goes beyond the limit of the most advanced computing machine in modern era to predict (in ab initio manner) the structure of protein which is determined by the inter-atomic forces of a protein molecule and the environment. In this research, proposed are multi-resolution models and a parallel computing architecture to facilitate computation of protein folding prediction. Multi-resolution representation is to make hierarchical grouping of atoms in protein molecule, so that initial configuration is computed at coarse grained level, then the configuration is refined at the finer level. This will drastically reduce computation. This research proposes two models of multi-resolution representation. First approach is backbone simplification model which extracts backbone atoms first, then group k adjacent atoms as a macro-atom. Simplicity is the biggest benefit of backbone simplification model, however, it may lose accuracy because it ignores the side-chains which are believed to play important roles in forming the 3-dimensional structure of protein. The second approach is fragment tree model. In this model, a protein molecule is partitioned at every bond which allow free rotation. Each partition is called a fragment. Since atoms in a fragment are tightly coupled to form a rigid body, it is a natural simplification to treat a fragment as a macro-atom.
The second contents of this research is the design of parallel computation structure based on the above mentioned multi-resolution models. Architecture and detailed design of parallel computation model for protein folding prediction is proposed in terms of UML (Unified Modeling Language).
In the future, hopefully folding prediction is to be expedited by used of the result from this research.

연구결과보고서

초록
DNA에 저장된 유전정보에 따라 단백질을 합성하고, 단백질 분자는 특정한 3차원적 구조를 만들어서 생물학적 기능을 하게 된다. Human Genome Project를 통하여 DNA의 염기서열은 대부분 얻게 되었으며, 이로부터 단백질을 구성하는 아미노산의 서열도 획득이 가능하지만 ...

DNA에 저장된 유전정보에 따라 단백질을 합성하고, 단백질 분자는 특정한 3차원적 구조를 만들어서 생물학적 기능을 하게 된다. Human Genome Project를 통하여 DNA의 염기서열은 대부분 얻게 되었으며, 이로부터 단백질을 구성하는 아미노산의 서열도 획득이 가능하지만, 아미노산 서열로 부터 단백질의 3차원적 구조를 계산하는 단백질 접힘예측 (Protein folding prediction) 문제는 매우 중요하면서도 요원한 과제로 남아있다. 단백질은 생체내의 여러가지 중요한 기능을 담당하는 거대 분자로, 포함된 원자의 수가 매우 많아서, 그들 간의 상호작용으로 결정되는 3차원 구조를 예측하는 데에 계산량이 감당할 수 없이 많기 때문인다. 본 연구에서는 단백질 접힘예측 계산을 촉진하기 위한 다중해상도 표현법과 병렬계산 구조를 제시하고 있다. 다중해상도 표현은 단백질을 구성하는 원자들을 계층적으로 grouping하여 처음에는 큰 덩어리 수준에서 대강의 위치를 계산한 후, 차차 해상도를 높여가며 보다 정밀한 계산을 함으로써, 계산량을 줄이면서 정확한 구조를 예측하도록 하자는 것이 핵심 개념이다. 단백질에 대한 다중해상도 모델로 본 연구에서는 두가지 방법을 제시하고 있다. 첫번째는 단백질을 구성하는 backbone원자들을 중심으로 간략화시키는 backbone 간략화 모델이다. 이 방법은 단순성이 최대의 장점이나 단백질의 접힘에 중요한 역할을 하는 곁가지를 무시하기 때문에 정밀도에 문제가 있을 수 있다. 두번째 방법은 단백질을 구성하는 원자들간의 bond중 자유회전이 가능한 bond에서 분할한 단편(fragment)들로 grouping하는 단편계층화 모델이다. 하나의 단편내의 원자들은 비교적 견고하게 결합되어 있기 때문에 공간상에서 rigid motion을 할 것으로 기대가 되고, 따라서 단편들을 하나의 덩어리로 취급하는 것은 자연스러운 간략화라 할 수 있겠다.
본 연구의 두번째 내용은 앞서 설명한 다중해상도 모델을 바탕으로 한 계산 방법의 설계이다. 이를 위하여 본 연구에서는 병렬처리가 가능한 접힘계산 소프트웨어를 설계하였으며, 전반적 architecture와 상세설계가 제시되었다.
본 연구의 결과를 기반으로 추후 단백질 접힘예측 연구가 가속될 것으로 기대된다.

연구결과 및 활용방안
본 연구의 결과는 두가지로 나뉜다.
1. 단백질 접힘예측 계산을 위한 다중해상도모델 제시
다중해상도 표현은 단백질을 구성하는 원자들을 계층적으로 grouping하여 처음에는 큰 덩어리 수준에서 대강의 위치를 계산한 후, 차차 해상도를 높여가며 보다 정밀한 계산을 ...

본 연구의 결과는 두가지로 나뉜다.
1. 단백질 접힘예측 계산을 위한 다중해상도모델 제시
다중해상도 표현은 단백질을 구성하는 원자들을 계층적으로 grouping하여 처음에는 큰 덩어리 수준에서 대강의 위치를 계산한 후, 차차 해상도를 높여가며 보다 정밀한 계산을 함으로써, 계산량을 줄이면서 정확한 구조를 예측하도록 하자는 것이 핵심 개념이다. 단백질에 대한 다중해상도 모델로 본 연구에서는 두가지 방법을 제시하고 있다. 첫번째는 단백질을 구성하는 backbone원자들을 중심으로 간략화시키는 backbone 간략화 모델이다. 이 방법은 단순성이 최대의 장점이나 단백질의 접힘에 중요한 역할을 하는 곁가지를 무시하기 때문에 정밀도에 문제가 있을 수 있다. 두번째 방법은 단백질을 구성하는 원자들간의 bond중 자유회전이 가능한 bond에서 분할한 단편(fragment)들로 grouping하는 단편계층화 모델이다. 하나의 단편내의 원자들은 비교적 견고하게 결합되어 있기 때문에 공간상에서 rigid motion을 할 것으로 기대가 되고, 따라사 단편들을 하나의 덩어리로 취급하는 것은 자연스러운 간략화라 할 수 있겠다.
2. 병렬처리 계산구조의 제시 : 앞서 설명한 다중해상도 모델을 바탕으로 한 계산 방법의 설계이다. 이를 위하여 본 연구에서는 병렬처리가 가능한 접힘계산 소프트웨어를 설계하였으며, 전반적 architecture와 상세설계 결과 (UML로 기술된 package diagram, class diagram, sequence diagram)이 제시되었다.
본 연구의 결과를 기반으로 추후 단백질 접힘예측 연구가 가속될 것으로 기대된다.
또한 접힘예측에 관한 새로운 idea를 손쉽게 구현해 볼 수 있는 testbed framework으로 활용될 수 있다.

색인어
단백질 접힘, Protein folding, 다중해상도, 병렬처리

이 연구과제의 신청시 심사신청분야(최대 3순위까지 신청 가능)
1순위 : 공학 > 산업공학 > 컴퓨터통합생산시스템 > CAD/CAM
2순위 : 공학 > 기계공학 > 생산및설계공학 > CAD/CAM
3순위 : 공학 > 컴퓨터학 > 컴퓨터그래픽스 > 컴퓨터그래픽스응용

이 보고서에 대한 디지털 콘텐츠 목록

본 자료는 원작자를 표시해야 하며 영리목적의 저작물 이용을 허락하지 않습니다.
또한 저작물의 변경 또는 2차 저작을 허락하지 않습니다.