정보

생물학적 네트워크(단백질 네트워크)에서 상호작용의 유형은 무엇입니까?

생물학적 네트워크(단백질 네트워크)에서 상호작용의 유형은 무엇입니까?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

KGML 파일에서 유전자 또는 단백질 간의 관계 유형은 정확히 활성화, 억제, 발현, 억제, 간접 효과, 상태 변화, 결합/회합, 해리, 인산화, 탈인산화, 글리코실화, 유비퀴틴화 및 메틸화입니다. 이러한 상호 작용에 대해 더 알고 싶습니다. 이러한 상호 작용이 의미하는 바를 깊이 이해할 수 있는 특정 출처가 있습니까?


그들 대부분은 꽤 자명합니다. 일부 단백질에 대한 많은 특정 생물학이 아직 제대로 조사되지 않았기 때문에 KEGG 경로는 종종 모호합니다. 때로는 두 단백질이 실제로 하는 일이 아니라 연관된다는 사실만 알 때가 있습니다.

둘 사이의 관계는 하나의 기능을 알 때 예측하기가 더 쉽습니다. 키나아제와 상호작용하는 단백질은 ~ 할 것 같은 상기 키나제에 의해 인산화된다. 많은 관계가 다음과 관련이 있습니다. 번역 후 수정 (글리코실화, 인산화, 유비퀴틴화, 아세틸화, 메틸화 등) 한 단백질이 다른 단백질로 만들어집니다. Wikipedia에는 ​​실제로 많은 예제와 함께 이에 대한 적절한 개요가 있습니다.

다른 몇 가지 관계는 다음과 관련이 있습니다. 단백질 활성 또는 발현 조절. 이것은 내가 위에서 말한 것과 어느 정도 일치합니다. 일부 단백질은 인산화 또는 탈메틸화 등의 경우에만 활성화됩니다. 다른 효소는 인 그룹을 제거하여 억제를 유발할 수 있습니다. 다른 것들은 여전히 ​​단백질과 직접 상호작용하여 기질이나 표적에 결합하는 것을 억제할 수 있습니다. 아마도 결합은 한 단백질이 정상적으로 결합할 수 없을 때 기질에 결합할 수 있도록 하는 구조적 변화를 유도할 수 있습니다. 일부 단백질은 특정 유전자의 발현을 활성화하거나 억제하는 전사 인자로 기능하여 간접적으로 단백질 수준에 영향을 미칩니다.

모든 종류의 가능성이 있습니다. KGML 파일은 최소한 두 단백질 간의 상호 작용이 각각에 어떻게 영향을 미칠 수 있는지에 대한 표시를 제공하는 방식으로 이를 나타내려고 합니다. 나는 그것이 약간의 통찰력을 제공하기를 바랍니다.


생물학적 네트워크: 물리적 원리에서 생물학적 통찰력까지

2003년 11월 13-16일 미국 애틀랜타에서 열린 제4차 Georgia Tech 및 UGA 생물정보학 국제회의 'Biological Networks: From Genomics to Epidemiology'에 대한 보고서입니다.

제4차 Georgia Tech International Conference on Bioinformatics는 'Biological Networks: Genomics to Epidemiology'라는 제목으로 생물학 네트워크를 이해하기 위해 노력하는 물리학자, 수학자, 컴퓨터 과학자 및 생물학자들로 구성된 학제 간 그룹을 구성했습니다. 이 회의는 Mark Borodovsky(미국 애틀랜타 조지아 공과 대학)와 Eugene Koonin(미국 베데스다 국립 생명 공학 정보 센터)에 의해 조직되었으며 주로 생물학적 네트워크의 컴퓨터 재구성, 분석 및 시뮬레이션의 세 가지 활성 연구 영역을 다뤘습니다. 다양한 유전체학과 '인터랙토믹스(interactomics)' 프로젝트에서 나온 실험 데이터의 홍수는 세 개의 초점 영역이 현재 결과와 출판물의 기하급수적인 성장을 경험하고 있음을 의미합니다. 회의의 전산적 풍미에도 불구하고 대다수의 참가자가 실험 실험실과 협력하거나 데이터를 직접 사용하기 때문에 이론과 실험 사이의 생산적인 상호 작용이 분명했습니다.

프레젠테이션에서는 단백질-단백질-상호작용, 유전, 조절 및 대사와 같은 여러 유형의 생물학적 네트워크를 다뤘습니다. 이러한 유형의 네트워크는 서로 다른 셀룰러 프로세스를 나타내지만 모두 공통의 조직 및 기능 원칙을 공유합니다. 회의에서 분자 네트워크는 전체 네트워크 수준에서 생물학적 경로 및 모듈을 통해 기본 토폴로지 모티프 수준에 이르기까지 다양한 공간 규모에서 연구되었습니다. 여러 흥미로운 회담에서 이 분야의 빠른 발전을 강조했습니다.

Adam Arkin(University of California, Berkeley, USA)은 비선형 역학 및 게임 이론의 방법을 사용하여 확률적 환경에서 박테리아 성장을 위한 최적의 진화 전략을 결정할 수 있는 방법을 설명했습니다. 그는 생물학적 과정의 고유한 확률론이 어떻게 박테리아가 불확실한 환경에서 생존하는 데 도움이 될 수 있는지를 보여주었습니다. Arkin은 또한 다양한 박테리아의 주화성 모듈에 대한 포괄적인 비교 분석을 제시했습니다. 박테리아 사이의 주화성 모듈 구조의 변화는 주화성 반응을 정의하는 운동 매개변수에 대한 민감도의 차이로 이어집니다. 모듈은 일반적으로 모듈의 '진화성'을 증가시킬 수 있는 몇 가지 '중요한' 매개변수에만 민감하며, 다른 매개변수에 대한 둔감함은 해로운 돌연변이의 영향에 대한 견고성과 내성을 보장합니다. 부품 목록의 비교뿐만 아니라 상세한 동적 분석을 포함하는 유사한 연구가 비교 유전체학의 중요한 다음 단계를 나타낼 가능성이 있습니다.

생물학적 네트워크의 통계적 분석을 개척한 Albert-Laszlo Barabasi(University of Notre Dame, USA)는 어떻게 규모 없는 행동이 광범위한 네트워크에서 공유되는지 설명했습니다. 규모가 없는 네트워크에는 일반적으로 고도로 보존되고 필수 단백질을 나타내는 고도로 연결된 허브가 포함됩니다. Barabasi는 정적 네트워크 외에도 공동 발현 네트워크 및 대사 플럭스에 의해 형성된 네트워크와 같은 여러 동적 생물학적 네트워크도 규모가 없는 특성을 나타낸다는 것을 보여주었습니다. 그는 또한 생물학적 네트워크가 높은 수준의 모듈성을 나타내며 고도로 상호 연결된 모듈이 계층적으로 더 큰 구조로 구성되어 있음을 보여주었습니다. 관련 분석에서 Ricard Solé(University Pompeu Fabra, Spain, Barcelona)는 규모가 없는 분포 및 모듈성과 같은 생물학적 네트워크의 중요한 속성이 네트워크 진화 규칙의 부산물로 나타날 수 있음을 보여주었습니다. 기능 선택의 결과. Martijn Huynen(네덜란드 Nijmegen 대학)은 또한 선택이 없는 단순한 기계론적 모델이 생물학적 네트워크의 관찰된 아키텍처를 설명할 수 있는 방법을 보여주었습니다.

Andreas Wagner(University of New Mexico, Albuquerque, USA)는 생물학적 네트워크의 진화와 견고성에 대한 흥미로운 질문에 대해 연설했습니다. 그는 단백질 네트워크가 상호 작용 파트너의 변화, 세포 위치 파악 및 조절 측면에서 어떻게 진화하는지 보여주었습니다. Sergei Maslov(Brookhaven National Laboratory, Upton, USA)도 단백질-단백질 상호작용과 조절 네트워크 사이의 진화 속도에서 흥미로운 차이를 보여주었습니다. 생물학적 네트워크의 중요한 속성은 유전적 돌연변이에 대한 견고성입니다. 유해한 돌연변이에 대한 강건성은 유전자 복제에 의해 유발될 수 있습니다. 한 사본의 기능 상실은 다른 사본에 의해 보상될 수 있습니다. 또는 대체 대사 경로의 사용과 같은 더 복잡한 네트워크 효과에 의해 발생할 수 있습니다. Wagner는 다음과 같은 몇 가지 증거를 제시했습니다. 사카로마이세스 세레비지애 유전자 결실의 25-50%는 중복 유전자에 의해 보상됩니다. Wagner와 Maslov는 모두 다음을 기반으로 한 결과를 보여주었습니다. Caenorhabditis elegans 최근 RNA 간섭(RNAi)을 사용하여 얻은 '삭제'는 대규모 실험 프로젝트의 데이터가 현재 생물학적 네트워크 구성의 원리를 조사하는 데 사용되는 속도를 보여줍니다.

Joel Bader(Johns Hopkins University, Baltimore, USA)는 2개의 하이브리드 단백질-단백질 상호작용 지도에 대한 최근 발표된 연구를 발표했습니다. 초파리 멜라노가스터. 이 플라이 맵은 20,000개 이상의 상호작용을 포함하며 다세포 유기체에 대한 최초의 인터랙션 맵입니다. 중요하게도, 2-하이브리드 방법은 상당한 수의 가양성 및 음성을 포함하는 것으로 알려져 있기 때문에 Bader는 높은 신뢰도의 상호 작용을 감지하는 계산 방법을 제시했습니다. 결과 높은 신뢰도의 지도에는 4,679개의 단백질과 4,780개의 상호 작용이 포함되어 있습니다. NS D. 멜라노가스터 상호작용 맵은 풍부한 정보 소스를 나타내며 앞으로 몇 년 동안 확실히 분석될 것입니다. 이 네트워크의 초기 분석은 생물학적 네트워크에서 일반적으로 관찰되는 멱법칙 분포에서 벗어나는 것으로 나타났습니다. 또한, 통계 분석은 단백질 복합체를 나타내는 단거리 구조와 복잡한 상호 연결을 나타내는 더 큰 구성 요소라는 두 가지 수준의 네트워크 조직을 보여줍니다.

Leonid Mirny(Massachusetts Institute of Technology, Cambridge, USA)는 효모 단백질-단백질 상호작용 네트워크에 유사한 조직이 있음을 보여주고 그러한 구조를 식별하기 위한 몇 가지 알고리즘을 제시했습니다. 중요하게도, 쌍별 단백질-단백질 상호작용과 같은 정적 데이터에서 파생된 구조는 모든 단백질이 동시에 함께 모이는 단백질 복합체(예: 리보솜 또는 스플라이세오솜) 또는 다른 상호작용이 실현되는 동적 기능 모듈에 해당할 수 있습니다. 다른 시간에, 예를 들어 신호 경로 또는 세포 주기 제어 모듈. Mirny는 또한 이러한 간단한 모듈이 신호의 중요하지 않은 필터링을 달성할 수 있다는 점을 강조하는 세포 신호 전달 경로의 확률적 시뮬레이션을 제시했습니다.

현대 유기체에 널리 퍼져 있는 규제 네트워크를 조사하면서 고대 규제 상호 작용을 연구하는 것도 흥미롭습니다. 리보스위치는 작은 분자를 결합하고 mRNA 형태를 변경할 수 있는 mRNA의 공간 구조이며, 가장 오래된 유전자 발현 조절 시스템을 나타낼 수 있습니다. 리보스위치에 대한 흥미로운 연구는 Mikhail Gelfand(Center GosNIIGenetika, Moscow, Russia)에 의해 발표되었으며, 그의 그룹의 연구는 리보스위치가 전사와 번역을 모두 조절함으로써 단백질 농도를 조절하는 것으로 보인다는 것을 보여줍니다. 리보스위치는 예를 들어 비타민, 아미노산 및 퓨린의 대사를 조절하는 것으로 밝혀졌으며 매우 큰 계통 발생 거리에 걸쳐 보존됩니다. Gelfand는 또한 리보스위치와 관련된 규제 네트워크의 진화에 대한 초기 작업을 발표했습니다.

시퀀싱된 게놈에서 관찰된 단백질 도메인 패밀리의 분포를 설명하려는 목표는 Koonin과 동료들이 BDIM(Birth, Death, and Innovation Model)을 개발하도록 이끌었습니다. BDIM의 매개변수를 변경함으로써 연구자들은 다양한 진화 과정이 관찰된 도메인 패밀리 분포를 어떻게 형성하는지 조사할 수 있습니다. 가장 단순한 선형 BDIM은 게놈에서 관찰된 도메인 패밀리 크기 분포에 매우 적합하지만 모델에 확률성을 도입하면 진화 시간이 엄청나게 길어집니다. Koonin은 모델의 변화가 진화를 가속화할 수 있는 방법을 보여주었습니다. 인 실리코.


추상적 인

단백질 네트워크의 위상 특성과 기능적 특징 사이의 관계를 찾는 것이 시스템 생물학의 오랜 목표였습니다. 그러나 네트워크 연구에서 대부분의 초점은 고도로 연결된 단백질("허브")에 있었습니다. 보완적인 개념으로 병목 현상을 중간 중심성이 높은 단백질로 정의할 수 있습니다(즉, 고속도로 지도의 주요 교량 및 터널과 유사한 "최단 경로"가 많은 네트워크 노드). 병목 현상은 실제로 놀라운 기능 및 동적 특성을 가진 핵심 연결 단백질입니다. 특히 필수 단백질일 가능성이 더 큽니다. 사실, 규제 및 기타 지시된 네트워크에서 중간성(즉, "병목성")은 정도(즉, "허브성")보다 본질적인 훨씬 더 중요한 지표입니다. 또한 병목 현상은 상호 작용 네트워크의 동적 구성 요소에 해당합니다. 병목 현상이 없는 경우보다 인접 항목과의 공동 표현이 훨씬 덜하여 표현 역학이 네트워크 토폴로지에 연결되어 있음을 의미합니다.


유전자 온톨로지 및 경로 분석

위에서 논의한 바와 같이 대부분의 게놈 전체 'omics' 실험의 초기 출력은 관심 조건에서 크게 변경된 유전자(또는 그 산물)의 목록입니다. 일반적으로 이러한 데이터 세트 조사의 첫 번째 단계는 유전자 목록이 특정 생물학적 프로세스 또는 기능에 대해 통계적으로 풍부해졌는지 여부를 결정하는 기능적 풍부화 분석입니다. 예를 들어, Gene Ontology(GO) 컨소시엄은 분자 기능, 생물학적 과정 또는 세포 구성 요소의 관점에서 유전자 및 암호화된 제품을 설명하기 위한 용어의 통제된 계층적 어휘를 제공합니다[1]. GO 농축 분석은 공개적으로 사용 가능한 많은 도구(http://geneontology.org/page/go-enrichment-analysis) 중 하나를 사용하여 수행할 수 있으며 이러한 분석은 다음에서 더 널리 퍼져 있는 GO 용어의 발생에 대한 유전자 목록을 검사합니다. 쿼리 유전자 목록이 우연히 예상보다 더 많이 발생합니다(통계적 유의성을 평가하기 위해 적절한 배경 또는 '우주'를 사용하는 것이 필수적이라는 점에 유의하는 것이 중요합니다)[2]. 이러한 과도하게 표현된 용어는 관심 조건에서 우선적으로 그리고 차등적으로 조절되는 이전에 인식되지 않은 생물학적 과정(개별 유전자와 반대)을 강조할 수 있습니다. 강점이자 한계인 GO의 특징은 계층 구조입니다. GO 농축 분석[3]에서 이러한 구조를 설명하기 위한 노력이 있었지만 통계적 농축에 가장 책임이 있는 계층 구조 수준을 결정하는 것은 여전히 ​​어려울 수 있습니다. 종종 가장 풍부한 용어는 새로운 기능적 통찰력을 알려주는 데 제한적으로 사용할 수 있는 광범위한 기능적 범주입니다.

세포에서 생물학적 경로는 신호(수용체에 의해 종종 수신됨)를 출력 반응(예: 전사 인자의 활성화 및 다운스트림 유전자 발현)으로 변환하는 역할을 하는 생화학적 엔진입니다. 따라서 경로 주석을 기반으로 하는 강화 분석에는 특정 조건에서 수행되는 중요한 프로세스와 관련하여 보다 직접적으로 관련성이 있고 해석 가능한 정보가 포함될 수 있습니다. KEGG[5], Reactome[6], WikiPathways[7, 8], InnateDB[9] 또는 DAVID[10]에서 구현된 것과 같은 over-representation 방법을 포함하여 다양한 경로 분석 방법을 사용할 수 있습니다[4]. 유전자 세트 농축에 기반한 보다 정량적인 방법[11]과 모든 유전자가 다른 경로를 구별하는 동일한 능력을 가지고 있지 않다는 사실을 설명하려는 보다 최근의 방법[12]이 있습니다.

강력하지만 경로 분석 방법에도 한계가 있습니다. 첫째, 대부분의 유전자는 표준 경로에 할당되지 않았습니다(예: 인간의 85% 이상). 앙상블 유전자는 어떤 KEGG 경로에도 매핑되지 않음), 두 번째로, 있는 경우 잘 연구된 신호 경로에 대한 큰 편향이 있습니다[13]. 따라서 경로 분석은 우리가 이미 알고 있는 것에 대해서는 많은 것을 알려줄 수 있지만 관심 있는 유전자 사이 또는 실제로 경로 자체 사이의 새롭고 예상치 못한 관계에 대해서는 덜 알려줍니다.


질병 유발 유전자 예측

생체 분자 상호 작용 네트워크가 인간 질병 연구에 정보를 제공한 두 번째 영역은 새로운 질병 관련 유전자를 예측하는 것입니다. 이 연구의 주요 가정은 질병 유발 유전자의 네트워크 이웃이 동일하거나 유사한 질병을 유발할 가능성이 있다는 것입니다(Goh et al. 2007 Oti and Brunner 2007). 이 개념은 그림 2에 나와 있습니다.

유전자 표현형 네트워크. 결합된 유전자–유전자, 유전자–표현형 및 표현형–표현형 상호작용 네트워크가 표시됩니다. 이 가상의 예에서 질병 1, 2, 3은 알려진 원인 유전자(각각 유전자 A, C, E)를 가지고 있으며, 모두 확인된 원인 유전자가 없는 질병 4와 표현형으로 관련되어 있습니다. 이 경우와 같이 알려진 원인 유전자가 기능적으로 밀접하게 관련되어 있으면 표현형 관련 질병의 알려진 유전자와 밀접한 기능적 관계로 인해 후보 유전자(유전자 B 및 D)가 질병 4에 대한 가설을 세울 수 있습니다. 다양한 굵기의 검은 선은 각각 질병과 유전자 간의 표현형 및 기능적 유사성의 정도를 나타냅니다. Oti 및 Brunner(2007)에서 복제하고 Blackwell Publishing Ltd. © 2007(www.blackwell-synergy.com)의 허가를 받아 재인쇄했습니다.

Oti et al. (2006)은 원인 유전자 중 일부가 확인된 유전적 이질성 질병에 대한 질병 유발 유전자 예측을 목표로 하고 다른 유전적 요인에 대해서는 유전자좌 정보만 사용할 수 있었습니다. 이 시나리오는 일반적으로 여러 중요한 유전자좌가 발견되지만(질병과 관련된 다형성 마커를 포함) 대규모 유전자 연관 연구의 전형이지만 각 유전자좌의 특정 원인 유전자는 쉽게 식별되지 않습니다. 주어진 질병에 대해 Oti et al. (2006)은 새로운 질병 유전자를 중요한 유전자좌 중 하나에 속하고 질병을 유발하는 것으로 이미 잘 알려진 유전자와 단백질 상호작용을 갖는 것으로 예측했습니다. 그들은 이 방법을 사용한 예측이 동일한 유전자좌에서 유전자를 무작위로 선택하는 것과 비교하여 실제 질병 유발 유전자가 10배 풍부하다는 것을 보여주었습니다.

Franke et al. (2006)은 유사한 원칙을 기반으로 Prioritizer 알고리즘을 고안했습니다. 그들의 알고리즘은 추가 서열 또는 연관 분석을 위해 여러 감수성 유전자좌에서 후보 질병 유발 유전자 세트의 순위를 매깁니다. 이를 위해 그들은 알려진 분자 상호 작용과 계산적으로 예측된 ​​기능 관계를 기반으로 기능적 인간 유전자 네트워크를 구축했습니다. 네트워크는 하나의 장애에 대한 원인 유전자가 몇 가지 별개의 생물학적 경로에만 관련될 것이라고 가정하고 상호 작용을 기반으로 후보 유전자의 순위를 지정하는 데 사용되었습니다. 이 가정은 다른 감수성 유전자좌의 유전자가 클러스터링되어 무작위 기대치보다 질병 유전자 사이의 네트워크 거리(박스 1 참조)가 더 짧음을 의미합니다.

마지막으로, Lage et al. (2007)은 예측 작업을 해결하기 위해 여러 관련 질병에 대한 정보를 사용하여 위의 작업을 확장했습니다. 특히, 그들은 표현형 유사성 점수를 고안하고 유사한 표현형과 관련된 유전자를 가진 단백질 복합체를 찾는 데 사용했습니다. 단백질 복합체에 대한 검색은 보고된 상호작용 및 모델 유기체에서 전달된 상호작용을 포함하여 단백질 상호작용 네트워크에서 수행되었습니다. 각 후보 단백질은 그 단백질 및 그 직접적인 네트워크 이웃과 관련된 질병의 표현형 유사성 점수에 의해 순위가 매겨졌습니다. 고득점 후보에 대한 생물학적 해석은 이 단백질이 관심 장애의 분자 병리학에 관련될 가능성이 있다는 것이었습니다. 왜냐하면 일부 단백질이 고도로 관여하는 것으로 알려진 높은 신뢰도의 후보 복합체의 일부이기 때문입니다. 유사한(또는 동일한) 장애.

따라서 네트워크에서 서로 가까운 단백질이 유사한 질병을 유발한다는 생각은 질병 유전자를 찾는 데 점점 더 중요한 요소가 되고 있습니다. 서로 다른 접근 방식은 서로 다른 종류의 통합 데이터를 사용하여 예측 문제를 해결하지만 모두 물리적 또는 기능적 네트워크에서 알려진 질병 유전자 세트와 함께 후보 유전자 세트를 중첩하는 것을 포함합니다. 질병 유전자에 대한 사전 지식에 의존하지 않는 접근 방식은 아직 개발되지 않았습니다.


3가지 제안 방법

MOMA 및 선형 MOMA 알고리즘[ 27, 28 ]은 PPI 네트워크용 여러 MDSet을 생성하기 위해 식 (1)의 ILP 모델을 확장하기 위해 대사 네트워크에서 채택되었으며, 여기서 이러한 MDSet 중 하나 이상이 생물학적 기능을 가질 수 있습니다. MOMA 알고리즘은 대사 모델의 제약 기반 재구성 및 분석(COBRA)에서 유명한 알고리즘이기 때문에[ 36 ], 저자는 개발된 모델을 PPI 네트워크를 지배하기 위한 제약 기반 모델이라고 불렀습니다(https://github.com/Alofairi1976/ MOIA). 주로 MDSet 중 가장 많은 수의 차이를 갖는 MDSet을 생성하는 것이 목표였습니다. 이러한 다양한 MDSet을 사용하여 효과적인 단백질을 반영하고 PPI 네트워크에 대한 중요한 정보를 얻는 중요한 노드를 식별할 수 있습니다. 예를 들어, 그림 2의 네트워크에는 10개의 MDSet가 있지만 그림 2(b, c)에 표시된 이러한 MDSet 중 2개만 그림 2(d)에서 빨간색으로 표시된 것처럼 임계 집합을 찾는 데 충분합니다.

제안된 방법은 그림 3과 같이 세 가지 주요 단계로 구성됩니다. 첫 번째 단계는 PPI 데이터 수집, 단백질 선택 및 그래프 구현(인접 행렬)을 포함하는 적절한 데이터 전처리 기술을 사용하여 주어진 데이터 세트를 개선합니다. 두 번째 단계는 3개의 개발된 모델에서 하나의 모델을 사용하는 것입니다. 가장 다른 두 가지 MDSet(2MD-MDSet) 모델은 반복 MDSet(ITR-MDSet) 모델과 사용자 정의 MDSet(URD-MDSet) 모델입니다. 2MD-MDSets 모델은 이러한 MDSet 간의 최대 수의 다른 노드와 동시에 두 개의 MDSet을 생성하는 것을 목표로 합니다. ITR-MDSets 모델은 다양한 MDSets를 생성하는 데 사용할 수 있습니다. URD-MDSet 모델은 사용자가 결정한 특정 노드를 포함하는 MDSet을 생성할 수 있습니다. 제안된 MOIA 방법의 세 번째 단계에서는 얻어진 결과를 논의하고 해석한다. 이러한 결과에는 k-임계, 간헐 및 중복 집합 단백질을 결정하는 데 사용되는 다양한 기준에 따라 생성된 여러 MDSet이 포함됩니다. 이 연구에서 저자는 PPI 네트워크에서 ( k − 1 ) -임계 세트라고 부르는 것의 중요성을 강조합니다. 다음 하위 섹션에서는 [ 8 ]의 Basic-MDSet 모델에 대해 설명합니다. 그런 다음 나머지 하위 섹션에서 제안된 모델을 소개합니다. 여기서 제안하는 알고리즘을 표현하기 위해 다음과 같은 표기법을 정의한다.

I n × n : 주대각선에 1이 있고 다른 곳에 0이 있는 n xn 단위 행렬.

J n × m : 모든 n xm 항목이 1인 1로 구성된 행렬입니다.

O n × m : 모든 n xm 항목이 0인 0으로 구성된 행렬입니다.

A n × n : 모든 n xm 항목이 이진 0 또는 1인 인접 행렬입니다.

X Y : 모든 요소의 집합은 벡터 X에 속하지만 벡터 Y에는 속하지 않습니다.

X ∪ Y : 벡터 X 와 Y 의 합집합입니다.

| 엑스 | : 벡터 X 의 크기, 1의 개수.

제안하는 MOIA 방법의 구조. (a) 간단한 그래프는 최소 지배 집합(MDSet) 노드 또는 단백질의 유형을 보여줍니다. (b) 모델의 결과와 함께 개발된 모델을 설명하는 MOIA 파이프라인

3.1 ILP 기반 Basic-MDSet 모델

Wuchty [ 8 ]는 다음과 같이 PPI 네트워크의 MDSet 문제에 대한 최적의 솔루션을 찾기 위해 ILP 기반 모델 [ 22 ]을 적용했습니다. 식 (1)에서 문제의 솔루션은 이진 벡터 x 입니다. 여기서 xi = 1인 경우 i는 생성된 MDSet에 속하고 그렇지 않으면 xi = 0입니다. 알고리즘 1은 식 (1)에서 제안된 모델의 구현을 변환하는 데 사용되는 단계를 설명하는 의사 코드를 도입합니다.

알고리즘 1. 기본-MDSet 모델

1.1. 노드 수 n과 데이터 파일을 읽습니다.

1.2. 인접 행렬 An×n을 생성합니다.

2. 식 (1)에 설명된 대로 모델을 작성합니다.

3. MDSet M=Solver(C,A,Lc,Uc,Lx,Ux)를 계산합니다.

3.2 2MD-MDSets 모델

알고리즘 2는 식 (3)에서 제안된 모델을 번역하는 데 사용되는 단계를 설명하는 의사 코드를 도입합니다.

알고리즘 2. 2MD-MDSets 모델

1.1. 노드 수 n과 데이터 파일을 읽습니다.

1.2. 인접 행렬 An×n을 생성합니다.

2. 알고리즘 1을 호출하여 MDSet M을 찾고 크기 |M|을 계산합니다.

3. 식 (3)에 설명된 대로 모델을 구축합니다.

3.2. BigA=[An×nOn×nOn×nOn×nAn×nOn×nJ1×nO1×nO1×nO1×nJ1×nO1×nIn×nIn×nIn×nIn×nIn×n−In×n] 설정

3.3. BigLc=[Jn×1Jn×1|M||M|On×1On×1] 및 BigUc=[nJn×1nJn×1|M||M|2Jn×12Jn×1]로 설정

3.4. BigLx=O3n×1 및 BigUx=J3n×1로 설정

4. BigM=Solver(BigC,BigA,BigLc,BigUc,BigLx,BigUx) 집합을 계산합니다.

5. BigM에서 MDSet M1 및 M2를 추출합니다. 여기서 BigM=[M1M2O1×n]입니다.

6. 두 개의 MDSet M1 및M2를 반환합니다.

3.3 ITR-MDSets 모델

알고리즘 3은 식 (4)에서 제안된 모델을 번역하기 위해 사용하는 단계를 설명하는 의사 코드를 도입합니다.

알고리즘 3. ITR-MDSets 모델

1.1. 노드 수 n과 데이터 파일을 읽습니다.

1.2. 인접 행렬 An×n을 생성합니다.

2. 알고리즘 2를 사용하여 두 개의 MDSet M1 및 M2를 찾습니다.

3. X=O1×n,Xnew=M1∪M2를 설정하고 카운터 l=3을 설정합니다.

4. |Xnew|>0 동안 단계 4.1–4.8을 반복합니다.

4.2. 방정식 (4)에 설명된 대로 모델을 빌드합니다.

4.4. BigA=[An×nOn×nJ1×nO1×nIn×nIn×nIn×n−In×n] 설정

4.5. BigLc=[Jn×1|M1|On×1−XT] 및 BigUc=[nJn×1|M1|2−XTJn×1]로 설정

4.6. BigLx=O2n×1 및 BigUx=J2n×1로 설정

4.7. BigM=Solver(BigC,BigA,BigLc,BigUc,BigLx,BigUx) 집합을 계산합니다.

4.8. BigM에서 MDSets M1을 추출합니다. 여기서 BigM=[O1×nM1]입니다.

5. X와 여러 MDSet M1,M2,M3,…,Mk를 반환합니다.

여기에서 X 및 여러 MDSets, M 1 , M 2 , M 3 , … , M k 를 찾은 후 다음 단계를 구현하여 대상 PPI 네트워크의 모든 단백질을 분류할 수 있습니다.

k 임계 집합 = ∩ i Mi 는 모든 MDSet M 1 , M 2 , M 3 , … , M k 의 교집합입니다.

( k − 1 ) -임계 집합 = ∑ i ∩ j ≠ i M j 는 ( k − 1 ) MDSet에 존재하는 모든 노드의 집합입니다.

간헐적 집합 = ∪ i Mi 는 모든 MDSet M 1 , M 2 , M 3 , … , M k 의 합집합입니다.

중복 집합은 간헐 집합의 보완입니다.

3.4 URD-MDSet 모델

알고리즘 4는 일부 특정 노드를 피하여 대상 MDSet을 생성하는 데 필요한 단계를 설명합니다.

알고리즘 4. URD-MDSet 모델

1.1. 노드 수 n과 데이터 파일을 읽습니다.

1.2. 인접 행렬 An×n을 생성합니다.

1.3. 가능하면 대상 MDSet에서 피할 모든 노드의 벡터를 X로 읽습니다.

2. 알고리즘 1을 사용하여 MDSet M을 찾습니다.

3. 식 (4)에 설명된 대로 모델을 구축합니다.

3.2. BigA=[An×nOn×nJ1×nO1×nIn×nIn×nIn×n−In×n] 설정

3.3. BigLc=[Jn×1|M|On×1−XT] 및 BigUc=[nJn×1|M|2−XTJn×1] 설정

3.4. BigLx=O2n×1 및 BigUx=J2n×1로 설정

4. BigM=Solver(BigC,BigA,BigLc,BigUc,BigLx,BigUx) 집합을 계산합니다.

5. BigM에서 MDSet M1을 추출합니다. 여기서 BigM=[O1×nM1]입니다.


저자 소개

포크 슈라이버 10년 이상 생물정보학 분야에서 일한 컴퓨터 과학자입니다. 그의 현재 연구 분야에는 생명과학 분야의 생물학적 네트워크 그래프 알고리즘과 데이터 탐색 및 정보 시각화의 모델링, 분석 및 시각화가 포함됩니다. 2003년부터 그는 라이프니츠 식물 유전학 및 작물 연구 연구소의 네트워크 분석 연구 그룹을 이끌고 있습니다. 그는 2007년 독일 Martin Luther University Halle-Wittenberg의 생물정보학 교수로 임명되었습니다.


참고문헌

Hartwell, L. H., Hopfield, J. J., Leibler, S. & Murray, A. W. 분자에서 모듈 세포 생물학까지. 자연 402, C47–C52(1999). 이 영향력 있는 개념 문서는 생물학적 기능의 모듈식 구성을 강력하게 주장합니다.

Hasty, J., McMillen, D. & Collins, J. J. Engineered 유전자 회로. 자연 420, 224–230 (2002).

Kitano, H. 전산 시스템 생물학. 자연 420, 206–210 (2002).

Koonin, E.V., Wolf, Y.I. & Karev, G.P. 단백질 우주의 구조와 게놈 진화. 자연 420, 218–223 (2002).

Oltvai, Z.N. & Barabási, A. -L. 삶의 복잡성 피라미드. 과학 298, 763–764 (2002).

Wall, M. E., Hlavacek, W. S. & Savageau, M.A. 유전자 회로 설계: 박테리아의 교훈. 네이처 목사 Genet. 5, 34–42 (2004).

Bray, D. 분자 네트워크: 하향식 보기. 과학 301, 1864–1865 (2003).

Alon, U. 생물학적 네트워크: 엔지니어로서의 땜장이. 과학 301, 1866–1867 (2003).

Albert, R. & Barabási, A. -L. 복잡한 네트워크의 통계 역학. 목사님 물리. 74, 47–97 (2002).

Dorogovtsev, S.N. & Mendes, J.F. 네트워크의 진화: 생물학적 그물에서 인터넷과 WWW로. (옥스포드 대학 출판부, 옥스포드, 2003).

Bornholdt, S. & Schuster, H.G. 그래프와 네트워크 핸드북: 게놈에서 인터넷으로 (Wiley-VCH, 베를린, 독일, 2003).

Strogatz, S. H. 복잡한 네트워크 탐색. 자연 410, 268–276 (2001).

볼로바스, B. 랜덤 그래프 (Academic Press, 런던, 1985).

Erdös, P. & Rényi, A. 랜덤 그래프의 진화에 대하여. 공공 수학. Inst. 헝. 아카드. 과학. 5, 17–61 (1960).

바라바시, A. -L. & Albert, R. 랜덤 네트워크에서 스케일링의 출현. 과학 286, 509–512 (1999). 본 논문에서는 규모가 없는 네트워크의 개념을 소개하고 그 출현 메커니즘을 제안하였다.

Jung, H., Tombor, B., Albert, R., Oltvai, Z. N. & Barabási, A. -L. 대사 네트워크의 대규모 조직. 자연 407, 651–654 (2000).

Wagner, A. & Fell, D.A. 큰 신진대사 네트워크 안의 작은 세계. 절차 R. Soc. 런던. NS 268, 1803–1810 (2001). 참고 문헌 16과 17은 규모가 없는 특성을 보여주는 대사 네트워크의 대규모 조직에 대한 첫 번째 보고서를 제공합니다.

Jung, H., Mason, S.P., Barabási, A. -L. & Oltvai, Z. N. 단백질 네트워크의 치사율 및 중심성. 자연 411, 41–42 (2001).

Wagner, A. 효모 단백질 상호작용 네트워크는 빠르게 진화하고 중복 유전자가 거의 없습니다. 몰. 바이올. 진화 18, 1283–1292 (2001).

Giot, L. et al. 의 단백질 상호작용 지도 초파리 멜라노가스터. 과학 302, 1727–1736 (2003).

Li, S. et al. 후생 동물의 상호 작용 네트워크의지도, C. 엘레간스. 과학 2004년 1월 2일 (doi:10.1126/science.1091403)

Yook, S. -H., Oltvai, Z.N. & Barabási, A. -L. 단백질 상호 작용 네트워크의 기능 및 위상 특성화. 단백질체학 (신문에서).

Uetz, P. et al. 단백질-단백질 상호작용에 대한 포괄적인 분석 사카로마이세스 세레비지애. 자연 403, 623–627 (2000).

Ito, T. et al. 효모 단백질 인터랙톰을 탐색하기 위한 포괄적인 2-하이브리드 분석. 절차 나틀 아카드. 과학. 미국 98, 4569–4574 (2001).

Featherstone, D. E. & Broadie, K. Wrestling with pleiotropy: 효모 유전자 발현 네트워크의 게놈 및 위상 분석. 생물에세이 24, 267–274 (2002).

Agrawal, H. 유전자 발현 데이터로 구성된 네트워크의 극단적인 자기 조직화. 물리. 레트 목사 89, 268702 (2002).

Wuchty, S. 단백질 도메인 네트워크에서 규모가 없는 행동. 몰. 바이올. 진화 18, 1694–1702 (2001).

Apic, G., Gough, J. & Teichmann, S.A. 도메인 조합에 대한 통찰력. 생물정보학 17, S83–S89(2001).

Shen-Orr, S. S., Milo, R., Mangan, S. & Alon, U. 전사 조절 네트워크의 네트워크 모티브 대장균. 네이처 제넷. 31, 64–68 (2002).

Milo, R., Shen-Orr, S. S., Itzkovitz, S., Kashtan, N. & Alon, U. 네트워크 모티브: 복잡한 네트워크의 간단한 빌딩 블록. 과학 298, 824–827 (2002). 참고 문헌 29와 30은 생물학적 및 비생물학적 네트워크에서 모티프의 개념을 소개합니다.

Vogelstein, B., Lane, D. & Levine, A. J. 서핑 p53 네트워크. 자연 408, 307–310 (2000).

Milgram, S. 작은 세계 문제. 사이코. 오늘 2, 60 (1967).

Watts, D. J. & Strogatz, S. H. '작은 세계' 네트워크의 집단 역학. 자연 393, 440–442 (1998).

Chung, F. & Lu, L. 주어진 예상 각도로 무작위 그래프의 평균 거리. 절차 나틀 아카드. 과학. 미국 99, 15879–15882 (2002).

Cohen, R. & Havlin, S. 규모가 없는 네트워크는 초소형입니다. 물리. 레트 목사 90, 058701 (2003).

Maslov, S. & Sneppen, K. 단백질 네트워크 토폴로지의 특이성과 안정성. 과학 296, 910–913 (2002). 이 논문은 단백질 상호작용 네트워크에서 고도로 연결된 노드가 덜 연결된 단백질에 연결되는 경향이 있다고 보고하며, 이는 소위 disassorative property입니다.

Pastor-Satorras, R., Vázquez, A. & Vespignani, A. 인터넷의 동적 및 상관 속성. 물리. 레트 목사 87, 258701 (2001).

Newman, M.E.J. 네트워크에서의 조합 혼합. 물리. 레트 목사 89, 208701 (2002).

Rzhetsky, A. & Gomez, S. M. 규모가 없는 분자 네트워크의 탄생과 게놈당 고유한 DNA 및 단백질 도메인 수. 생물정보학 17, 988–996 (2001).

Qian, J., Luscombe, N. M. & Gerstein, M. 게놈에서 단백질 패밀리 및 접힘 발생: 멱법칙 행동 및 진화 모델. J. 몰. 바이올. 313, 673–681 (2001).

Bhan, A., Galas, D.J. & Dewey, T.G. 유전자 발현 네트워크의 복제 성장 모델. 생물정보학 18, 1486–1493 (2002).

Pastor-Satorras, R., Smith, E. & Sole, R. 유전자 복제를 통한 단백질 상호작용 네트워크의 진화. J. 테어. 바이올. 222, 199–210 (2003).

Vazquez, A., Flammini, A., Maritan, A. & Vespignani, A. 단백질 상호 작용 네트워크 모델링. 컴플렉스 1, 38–44 (2003).

Kim, J., Krapivsky, P. L., Kahng, B. & Redner, S. 무한차 침투 및 단백질 상호작용 네트워크의 거대한 변동. 물리. E. Stat 목사. Nonlin. Soft Matter Phys. 66, 055101 (2002).

Wagner, A. How the global structure of protein interaction networks evolves. 절차 R. Soc. 런던. NS 270, 457–466 (2003).

Eisenberg, E. & Levanon, E. Y. Preferential attachment in the protein network evolution. 물리. 레트 목사 91, 138701 (2003).

Ravasz, E. & Barabási, A. -L. Hierarchical organization in complex networks. 물리. Rev. E. Stat. Nonlin. Soft Matter Phys. 67, 026112 (2003).

Alberts, B. The cell as a collection of protein machines: preparing the next generation of molecular biologists. 92, 291–294 (1998).

Simon, I. et al. Serial regulation of transcriptional regulators in the yeast cell cycle. 106, 697–708 (2001).

Tyson, J. J., Csikasz-Nagy, A. & Novak, B. The dynamics of cell cycle regulation. 생물에세이 24, 1095–1109 (2002).

McAdams, H. H. & Shapiro, L. A bacterial cell-cycle regulatory network operating in time and space. 과학 301, 1874–1877 (2003).

Bhalla, U. S., Ram, P. T. & Iyengar, R. MAP kinase phosphatase as a locus of flexibility in a mitogen-activated protein kinase signaling network. 과학 297, 1018–1023 (2002).

Ravasz, E., Somera, A. L., Mongru, D. A., Oltvai, Z. N. & Barabási, A. -L. Hierarchical organization of modularity in metabolic networks. 과학 297, 1551–1555 (2002). This paper introduced the concept of hierarchical networks, specifically in the context of metabolism.

Itzkovitz, S., Milo, R., Kashtan, N., Ziv, G. & Alon, U. Subgraphs in random networks. 물리. Rev. E. Stat. Nonlin. Soft Matter Phys. 68, 026127 (2003).

Wuchty, S., Oltvai, Z. N. & Barabási, A. -L. Evolutionary conservation of motif constituents within the yeast protein interaction network. 네이처 제넷. 35, 176–179 (2003).

Conant, G. C. & Wagner, A. Convergent evolution of gene circuits. 네이처 제넷. 34, 264–246 (2003).

Hinman, V. F., Nguyen, A. T., Cameron, R. A. & Davidson, E. H. Developmental gene regulatory network architecture across 500 million years of echinoderm evolution. 절차 나틀 아카드. 과학. 미국 100, 13356–13361 (2003).

Dorogovtsev, S. N., Goltsev, A. V. & Mendes, J. F. F. Pseudofractal scale-free web. 물리. Rev. E. Stat. Nonlin. Soft Matter Phys. 65, 066122 (2002).

Schuster, S., Pfeiffer, T., Moldenhauer, F., Koch, I. & Dandekar, T. Exploring the pathway structure of metabolism: decomposition into subnetworks and application to 마이코플라스마 폐렴. 생물정보학. 18, 351–361 (2002).

Snel, B., Bork, P. & Huynen, M. A. The identification of functional modules from the genomic association of genes. 절차 나틀 아카드. 과학. 미국 99, 5890–5895 (2002).

Girvan, M. & Newman, M. E. J. Community structure in social and biological networks. 절차 나틀 아카드. 과학. 미국 99, 7821–7826 (2002).

Holme, P., Huss, M. & Jeong, H. Subnetwork hierarchies of biochemical pathways. 생물정보학 19, 532–538 (2003).

Rives, A. W. & Galitski, T. Modular organization of cellular networks. 절차 나틀 아카드. 과학. 미국 100, 1128–1133 (2003).

Spirin, V. & Mirny, L. A. Protein complexes and functional modules in molecular networks. 절차 나틀 아카드. 과학. 미국 100, 12123–12128 (2003).

Ihmels, J. et al. Revealing modular organization in the yeast transcriptional network. 네이처 제넷. 31, 370–377 (2002).

Bader, G. D. & Hogue, C. W. Analyzing yeast protein-protein interaction data obtained from different sources. Nature Biotechnol. 20, 991–997 (2002).

Stuart, J. M., Segal, E., Koller, D. & Kim, S. K. A gene-coexpression network for global discovery of conserved genetic modules. 과학 302, 249–255 (2003).

Tornow, S. & Mewes, H. W. Functional modules by relating protein interaction networks and gene expression. 핵산 해상도 31, 6283–6289 (2003).

Jansen, R. et al. A Bayesian networks approach for predicting protein–protein interactions from genomic data. 과학 302, 449–453 (2003).

Bar-Joseph, Z. et al. Computational discovery of gene modules and regulatory networks. Nature Biotechnol. 21, 1337–1342 (2003).

Albert, R., Jeong, H. & Barabási, A. -L. Error and attack tolerance of complex networks. 자연 406, 378–382 (2000). This paper addresses the topological robustness and vulnerability of complex networks.

Winzeler, E. A. et al. Functional characterization of the S. 세레비지애 genome by gene deletion and parallel analysis. 과학 285, 901–906 (1999).

Giaever, G. et al. Functional profiling of the 사카로마이세스 세레비지애 게놈. 자연 418, 387–391 (2002).

Gerdes, S. Y. et al. Experimental determination and system-level analysis of essential genes in 대장균 MG1655. J. Bacteriol. 185, 5673–5684 (2003).

Yu, B. J. et al. Minimization of the 대장균 genome using a Tn5-targeted Cre/loxP excision system. Nature Biotechnol. 20, 1018–1023 (2002).

Kolisnychenko, V. et al. Engineering a reduced 대장균 게놈. 게놈 해상도 12, 640–647 (2002).

Fraser, H. B., Hirsh, A. E., Steinmetz, L. M., Scharfe, C. & Feldman, M. W. Evolutionary rate in the protein interaction network. 과학 296, 750–752 (2002).

Krylov, D. M., Wolf, Y. I., Rogozin, I. B. & Koonin, E. V. Gene loss, protein sequence divergence, gene dispensability, expression level, and interactivity are correlated in eukaryotic evolution. 게놈 해상도 13, 2229–2235 (2003).

Dezso, Z., Oltvai, Z. N. & Barabási, A. -L. Bioinformatics analysis of experimentally determined protein complexes in the yeast, 사카로마이세스 세레비지애. 게놈 해상도 13, 2450–2454 (2003).

Barkai, N. & Leibler, S. Robustness in simple biochemical networks. 자연 387, 913–917 (1997).

Alon, U., Surette, M. G., Barkai, N. & Leibler, S. Robustness in bacterial chemotaxis. 자연 397, 168–171 (1999). References 80 and 81 represents the first theoretical/experimental study on the functional robustness of a cellular sub-network, focusing on the bacterial chemotaxis receptor module.

von Dassow, G., Meir, E., Munro, E. M. & Odell, G. M. The segment polarity network is a robust developmental module. 자연 406, 188–192 (2000).

Albert, R. & Othmer, H. G. The topology of the regulatory interactions predicts the expression pattern of the segment polarity genes in 초파리 멜라노가스터. J. 테어. 바이올. 223, 1–18 (2003).

Kirschner, M. & Gerhart, J. Evolvability. 절차 나틀 아카드. 과학. 미국 95, 8420–8427 (1998).

Savageau, M. Biochemical Systems Analysis: a Study of Function and Design in Molecular Biology (Addison-Wesley, Reading, 1976).

Fell, D. A. 대사 조절 이해하기 (Portland, London, 1997).

Schilling, C. H. & Palsson, B. O. The underlying pathway structure of biochemical reaction networks. 절차 나틀 아카드. 과학. 미국 95, 4193–4198 (1998).

Segre, D., Vitkup, D. & Church, G. M. Analysis of optimality in natural and perturbed metabolic networks. 절차 나틀 아카드. 과학. 미국 99, 15112–15117 (2002).

Edwards, J. S., Ibarra, R. U. & Palsson, B.O. 인 실리코 predictions of 대장균 대사 능력은 실험 데이터와 일치합니다. Nature Biotechnol. 19, 125–130 (2001).

Ibarra, R. U., Edwards, J. S. & Palsson, B. O. 대장균 K-12 undergoes adaptive evolution to achieve 인 실리코 predicted optimal growth. 자연 420, 186–189 (2002). After their theoretical work on flux–balance analysis, the authors of references 89 and 90 show its relevance to predicting experimentally observable metabolic flux values.

Almaas, E., Kovács, B., Vicsek, T., Oltvai, Z. N. & Barabási, A. -L. Global organization of metabolic fluxes in 대장균. 자연, (in the press).

de la Fuente, A., Brazhnik, P. & Mendes, P. Linking the genes: inferring quantitative gene networks from microarray data. 트렌드 제넷. 18, 395–398 (2002).

Kuznetsov, V. A., Knott, G. D. & Bonner, R. F. General statistics of stochastic processes of gene expression in eucaryotic cells. 유전학 161, 1321–1332 (2002).

Farkas, I. J., Jeong, H., Vicsek, T., Barabási, A. -L. & Oltvai, Z. N. The topology of the transcription regulatory network in the yeast, 사카로마이세스 세레비지애. Physica A 318, 601–612 (2003).

Grigoriev, A. A relationship between gene expression and protein interactions on the proteome scale: analysis of the bacteriophage T7 and the yeast 사카로마이세스 세레비지애. 핵산 해상도 29, 3513–3519 (2001).

Ge, H., Liu, Z., Church, G. M. & Vidal, M. Correlation between transcriptome and interactome mapping data from 사카로마이세스 세레비지애. 네이처 제넷. 29, 482–486 (2001).

Jansen, R., Greenbaum, D. & Gerstein, M. Relating whole-genome expression data with protein-protein interactions. 게놈 해상도 12, 37–46 (2002).

Goh, K. I., Kahng, B. & Kim, D. Fluctuation-driven dynamics of the internet topology. 물리. 레트 목사 88, 108701 (2002).

Braunstein, L. A., Buldyrev, S. V., Cohen, R., Havlin, S. & Stanley, H. E. Optimal paths in disordered complex networks. 물리. 레트 목사 91, 168701 (2003).

Menezes, M. A. & Barabási, A. -L. Fluctuations in network dynamics. 물리. 레트 목사 (신문에서).

Elowitz, M. B., Levine, A. J., Siggia, E. D. & Swain, P. S. Stochastic gene expression in a single cell. 과학 297, 1183–1186 (2002).

Zeitlinger, J. et al. Program-specific distribution of a transcription factor dependent on partner transcription factor and MAPK signaling. 113, 395–404 (2003).

Ideker, T. et al. Integrated genomic and proteomic analyses of a systematically perturbed metabolic network. 과학 292, 929–934 (2001).

Danial, N. N. et al. BAD and glucokinase reside in a mitochondrial complex that integrates glycolysis and apoptosis. 자연 424, 952–956 (2003).

Alizadeh, A. A. et al. Distinct types of diffuse large B-cell lymphoma identified by gene expression profiling. 자연 403, 503–511 (2000).

Emmerling, M. et al. Metabolic flux responses to pyruvate kinase knockout in 대장균. J Bacteriol 184, 152–164 (2002).


추상적 인

The modern synthesis of evolutionary theory and genetics has enabled us to discover underlying molecular mechanisms of organismal evolution. We know that in order to maximize an organism's fitness in a particular environment, individual interactions among components of protein and nucleic acid networks need to be optimized by natural selection, or sometimes through random processes, as the organism responds to changes and/or challenges in the environment. Despite the significant role of molecular networks in determining an organism's adaptation to its environment, we still do not know how such inter- and intra-molecular interactions within networks change over time and contribute to an organism's evolvability while maintaining overall network functions. One way to address this challenge is to identify connections between molecular networks and their host organisms, to manipulate these connections, and then attempt to understand how such perturbations influence molecular dynamics of the network and thus influence evolutionary paths and organismal fitness. In the present review, we discuss how integrating evolutionary history with experimental systems that combine tools drawn from molecular evolution, synthetic biology and biochemistry allow us to identify the underlying mechanisms of organismal evolution, particularly from the perspective of protein interaction networks.


Systems biology and metabolic networks predict heterosis

When genetically distant individuals are crossed, their offspring often show greater vigour than their parents for quantitative traits. For example, growth is faster, age of reproduction is earlier, fertility is higher and resistance to disease is stronger. This phenomenon, called heterosis, has been exploited by humans in animal and plant breeding and has implications for evolutionary biology.

The introduction of cross-pollinated (hybrid) plants was one of the most important innovations in agriculture and global food security. Most annual crops show heterosis. Hybrid maize, for example, can yield twice as much as the parent plants. The growth rate of some hybrid yeasts exceeds that of parental strains by more than an order of magnitude.

So far heterosis has been used without full knowledge of the underlying genetic or molecular principles. Because the effects of heterosis can be so impressive, such an understanding could greatly advance breeding. Most recent studies of heterosis have focused on detecting quantitative trait loci (QTL) – sections of DNA that correlate with variation in a trait. QTL are used to explore genetic effects or to search for expression of transcripts or proteins in hybrids in the hope of identifying molecular mechanisms for heterosis in particular traits.

However, descriptive approaches like this cannot provide a general and biologically realistic model accounting for the pervasiveness of heterosis. This is where a systemic approach based on metabolic network modelling is proving useful.

Systems and network biology
Heterosis has inspired many genetic, genomic and molecular studies, but has less often been investigated from the perspective of systems biology, Prof Dominique de Vienne’s focus. Systems biologists model complex biological systems, such as molecules and their interactions within a living cell, rather than looking at isolated parts.

Related to this is network biology enabling the representation and analysis of biological systems with tools derived from graph theory, which uses mathematical structures to model multiple relations between objects, and topology, which considers the arrangement of the elements of a network.

Network analysis works with the complexity of the network to extract meaningful information that you would not have if individual components were examined separately. The data explosion from the ‘omics’ era of biological research has led to more systemic approaches to data analysis and a move away from single gene/protein studies.

Adding the ending ‘omics’ to a molecular term implies a comprehensive assessment of a set of molecules. Genomics, the first omics approach, focused on entire genomes as opposed to genetics which looks at individual variants or single genes. Quantitative proteomics provides expression data for hundreds of proteins, including enzymes, while metabolomics techniques can access thousands of metabolites.

Heterosis has inspired genetic, genomic and molecular studies, but has less often been investigated from the perspective of systems biology.

Complex information like this can be represented by networks to model the biological system of interest. Some of the most common types of biological networks are protein–protein interaction networks, metabolic networks, genetic interaction networks, gene/transcriptional regulatory networks and cell signalling networks: heterosis could emerge from all these networks.

Studying genotype–phenotype relationships
The genetic makeup of an individual, its ‘genotype’, determines its characteristics or ‘phenotype’ in a given environment. The genotype–phenotype relationship is of fundamental interest to breeders as it describes how genetic polymorphism causes phenotypic variation. Genetic polymorphism due to mutations in the genotype produces the variety of forms seen in populations.

Heterosis in action. The middle plant is the offspring of the two plants on either side: its increased vigor is clear. Photo Credit: Julie B. Fiévet

If the genotype–phenotype relationships were linear (proportionality between genotype and phenotype values), offspring would have intermediate trait values compared to their parents, not better ones. Actually, the cellular processes involved in biological functions and structures are complex, and the relationship between measurable parameters at genotype and phenotype levels is often found to be non-linear. Network models in systems biology are typically highly non-linear and can be used effectively to study phenotype responses to genotype variation.

Dominique de Vienne and colleagues suggest that heterosis is an emergent property of living systems resulting from non-linear relationships between genotypic variables and phenotypes or between different phenotypic levels, from the molecular to the individual. They use a systemic approach to show that the key to understanding heterosis may lie in the ‘law of diminishing returns’.

This ‘law’ states that in all productive processes, adding more of one factor while holding all others constant, will eventually yield lower incremental returns. In biological terms, when the concentration or activity of a cellular component increases gradually, the effect on the phenotype is at first high but then begins to fade away.

Mathematic modelling of physiological dominance suggested that heterosis is an intrinsic property of non-linear relationships between traits.

For example, if the concentration of an enzyme in a metabolic network increases, the metabolic flux (rate of synthesis of molecules catalysed by enzymes) through this network initially grows rapidly, then slows down as the enzyme concentration goes up. Thus the kinetics (or rates) of biochemical and molecular reactions are intrinsically non-linearly related to enzyme concentrations.

Non-linear genotype–phenotype relationship is the key of heterosis
Non-linearity has been demonstrated at different levels of organisation, from genetic transcription/translation to fitness-related characteristics. When considering one locus, it appears to explain the dominance of the most active allele over the least active, as proposed as early as 1934 by Sewall Wright, a famous American evolutionary geneticist.

Improvements in technology have advanced crop breeding. LuckyStep/Shutterstock.com

When the trait is controlled by many loci, which is the most common situation, heterosis arises as a consequence of two linked phenomena. First, the slightly deleterious recessive alleles of one parent are complemented by superior dominant alleles of the other parent. The hybrid can therefore have a higher value than both parents, and so hybrid vigour is expected to be stronger when the parents are genetically distant due to better complementarity. This model, likewise, explains inbreeding depression as the accumulation of deleterious recessive alleles at homozygous loci, i.e., loci with identical alleles. Second, the non-linearity results in epistasis, meaning that the effect of substituting one allele for another is dependent on the genotype at other loci. This genetic effect also plays a role in heterosis.

Dominique de Vienne and colleagues have mathematically formalised and validated the dominance/epistasis model of heterosis experimentally using in vitro and in silico (computer simulated) genetics. They have worked with the glycolytic pathway in yeast to look at metabolic flux prediction and optimisation in relation to heterosis.

They first reconstituted in vitro the four-enzyme upstream segment of the glycolysis pathway, simulating genetic variability by varying enzyme concentrations in test tubes. “Hybrids” were obtained by mixing the content of “parental” tubes, and their fluxes were measured. They found that usually the phenotypic value of a hybrid is higher than the average of its parents, and in some cases higher than that of the best parent.

Then they used mathematical modelling. Modelling metabolic networks relies on mathematical tools and specialised computer programs. But identifying and estimating the many enzyme parameters for biochemical processes is difficult. So, modelling efforts based on conceptual shortcuts are essential to simulate complex cellular behaviours from a smaller amount of biological data.

A simplified formalism based on metabolic control analysis was used to derive global parameters that accounted for the kinetic behaviour of four enzymes from the upstream part of glycolysis. According to the structure of the pathway and the position of the enzyme in the pathway, just one or two parameters per enzyme were sufficient.

Genetic variability was created by varying in silico enzyme concentrations. The virtual parents were crossed to get hybrids, the flux of which was computed. Again the curvature of the relationship describing the genotype–phenotype relationship resulted in heterosis. This result is robust, as it was confirmed by explicit modelling of the whole glycolysis and a similar in silico genetics approach.

This mechanism for heterosis is valid beyond the metabolic systems. In another recent work, Dominique de Vienne, co-author François Vasseur and colleagues successfully predicted the amplitude of heterosis for two fitness-related traits – growth rate and fruit number – in series of hybrids among accessions of Arabidopsis thaliana, a valuable model plant for studies of growth and development and the first plant genome to be fully sequenced.

The traits of interest were non-linearly related to individual biomass, in the same way that metabolic fluxes are non-linearly related to enzyme concentrations. This non-linearity forces hybrids to deviate from the average value of their parents, which leads to their better vigour. Mathematical modelling made it possible to predict up to 75% of the amplitude of heterosis while the genetic distance between parents explained at best 7% of heterosis.

Both mathematical and experimental results suggested that the appearance of heterosis in hybrids is a systemic property emerging from biological complexity. These findings were consistent with various observations in quantitative and evolutionary genetics, and provide a model unifying the genetic effects underlying heterosis. The geometric view of genotype–phenotype relationship in crop plants has potential for predicting heterosis in traits affecting yield and environmental stability.

개인 응답

How has the field of plant genetics changed since you began working in it?

Since I began working in plant genetics, there has been spectacular evolution of techniques available for the biologist. Robots for high-throughput genotyping and phenotyping, mass spectrometers for proteomics and metabolomics, increasingly powerful computers, etc., make it possible to accumulate and analyse huge amounts of data in a relatively short time. It is now possible to map finely and identify QTL for traits at all levels of biological organisation, from transcript/protein/metabolite abundances to fitness components, and to better understand the genomic bases of phenotypic trait variation. For the breeder, marker-assisted or genomic selection allows more efficient selection methods to be implemented.



코멘트:

  1. Milosh

    I congratulate, it is simply excellent thought

  2. Faektilar

    오히려 유용한 문구에 동의합니다

  3. Kazit

    포럼에서 멈추고이 주제를 보았습니다. 내가 도와 줄 수 있니?

  4. Ahmad

    나는 당신이 착각하고 있다고 생각합니다. 논의할 것을 제안합니다. PM에 나에게 편지를 쓰십시오.

  5. Dennys

    당신이 옳지 않습니다. 확실해. 나는 그것을 증명할 수있다. PM에 쓰십시오.



메시지 쓰기