정보

인간 게놈의 돌연변이율에는 얼마나 많은 변화가 있습니까?

인간 게놈의 돌연변이율에는 얼마나 많은 변화가 있습니까?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

인간의 평균 돌연변이율은 약 $2.5 cdot 10^{-8}$로 추정됩니다(Nachman and Crowell, 2000). 물론 이 돌연변이는 서열에 따라 다릅니다.

인간 게놈에서 돌연변이율의 변이가 얼마나 되는지에 대한 아이디어를 알려주실 수 있습니까?

이러한 변형을 표현하는 방법은 여러 가지가 있습니다. 가장 낮은 돌연변이 비율과 가장 높은 돌연변이 비율을 제공하거나 전체 게놈 또는 무작위로 선택된 시퀀스에 대한 돌연변이 비율 맵을 표시할 수 있습니다.


멋진 질문입니다. 불행히도 나는 완전한 답을 가지고 있지 않습니다. 내가 할 수 있는 최선은 일부 문헌을 요약하는 것입니다. 그래도 논의하고 싶다면 더 찾아보고 싶습니다. 또한 답변이 다소 흩어져 있는 점 죄송합니다. 이미 이 모든 사실을 알고 계셨다면 사과드립니다!

내가 제안할 한 가지는 이것이 인간 게놈에 대해 단독으로 수행하기 어렵다는 것입니다. 따라서 많은 문헌이 다른 동물에도 영향을 미치는 이유입니다.

어쨌든 이 주제에 대한 문헌은 매우 광범위하므로 이것이 빙산의 일각에 불과하다고 생각합니다. 그래도 도움이 되기를 바랍니다.


첫째, 귀하가 관심을 가질 만한 두 가지 게놈 돌연변이 비율 지도를 알고 있습니다(귀하의 질문에서 제안한 대로). 하나에 인간의 드 노보 돌연변이의 게놈 전체 패턴 및 특성 Francioli et al은 인간의 새로운 돌연변이를 조사하고(분명히 생식계열 돌연변이에 더 관심이 있음) 암의 돌연변이 이질성과 새로운 암 유전자 탐색 Lawrence et al, (당연히) 체세포 돌연변이율과 그로 인한 발암물질에 관한 것입니다.

비록 완전히 인간에 국한된 것은 아니지만 훌륭한 리뷰는 포유류 게놈에 걸친 돌연변이 비율의 변화 Hodgkinson과 Eyre-Walker. 그들은 다음 사항에 주목합니다.

  • 소규모 효과: G & C는 A & T보다 더 많이 돌연변이되고, CG 디뉴클레오티드는 비암호화 DNA의 더 높은 돌연변이와 높은 상관관계가 있으며, SNP에 민감한 초돌연변이 부위(종에 걸쳐 보존됨)가 있는 것으로 보입니다. 이러한 효과는 게놈 전반에 걸쳐서도 다양합니다. 실제로, 미토콘드리아 DNA의 특정 영역은 또한 매우 가변적인 돌연변이 비율을 가지고 있습니다. 이상하게도 GC가 풍부한 섬은 더 적은 돌연변이 가능(특정 돌연변이 유형의 경우), 특히 메틸화된 뉴클레오타이드 근처에 있는 뉴클레오타이드에 영향을 미칠 수 있습니다.

  • 전사 부위: 체세포는 전사되지 않은 부위보다 전사된 부위의 돌연변이율이 낮습니다. 생식 조직에는 흥미로운 효과가 있습니다. 특정 유형 전사 시작 부위에서 멀어질수록 돌연변이가 증가하지만 다른 곳에서는 증가하지 않습니다.

  • 기타 돌연변이: indel 돌연변이는 점 돌연변이와 함께 발생하는 경향이 있습니다.

  • 돌연변이 비율은 여러 척도에서 공간적으로 상관됩니다.

  • 염색체: 인간의 경우 Y 염색체가 가장 변이가 심한 것으로 보이며 그 다음이 X, 그 다음이 상염색체입니다. 상염색체 간의 돌연변이율에도 차이가 있으며, 하지만 에 의해 가려진 것으로 보입니다. 인트라-상염색체 돌연변이율.

논문에서 명시적으로 언급하지는 않았지만 직관적이고 때로는 암시적으로 코딩 및 조절 영역(예: 인핸서, 프로모터 등)의 돌연변이 비율이 더 낮습니다.

또 다른 논문은 국부 돌연변이율과 그 결정 요인의 진화 Terekhanova et al. 그들은 영장류(분명히 인간을 포함)의 국부적 돌연변이 비율이 게놈 전체에 걸쳐 높은 상관관계가 있다는 점에 주목합니다. 이 상관관계는 진화적 거리가 멀어짐에 따라 약해집니다(예: 인간에서 마우스로). 그들은 또한 지역 돌연변이율에 대한 몇 가지 게놈 특징의 영향을 조사합니다.

인간에게는 없지만 비무작위 돌연변이 비율의 증거는 진화적 위험 관리 전략을 시사합니다 Martincorena et al은 E. Coli 게놈 전반에 걸친 돌연변이 비율을 조사하여 엄청난 다양성, 특히 고도로 발현된 유전자에서 더 낮은 비율을 발견했습니다.

우리는 아직 염색질 구조가 많이 나타나는 것을 보지 못했기 때문에 멋진 논문을 지적하고 싶습니다. 게놈의 돌연변이율 변화에 대한 염색질 조직의 영향 마코바와 하디슨. 거기에서 그들은 다른 유형의 돌연변이가 열린 염색질과 닫힌 염색질 상태에 따라 다르게 영향을 받는다는 것을 발견했습니다. 대략적으로, 닫힌 염색질은 염기 치환을 촉진하는 반면, 삽입결실은 열린 염색질이 있는 영역에서 더 자주 발생합니다.

마지막으로 Eyre-Walker와 Eyre-Walker는 돌연변이 가변성을 평가하는 데 있어 몇 가지 어려움을 설명합니다. 인간 게놈에 따른 돌연변이율의 변이를 얼마나 설명할 수 있습니까?


일부 관련 작업

생식계열 세포의 돌연변이율에 대해서는 구체적으로 다음을 참조하십시오.

  • 인간의 생식계열 돌연변이의 속성과 비율 캠벨과 아이클러

  • 인간 생식계열의 돌연변이율 변화의 결정인자 Segurel 외

  • 인간 가족 내 및 인간 가족 간의 게놈 전체 돌연변이 비율의 변화 콘래드 외

이는 게놈 전반에 걸친 돌연변이 가변성의 일부 패턴을 설명하지만 종종 개인 간 요인에 더 관심이 있습니다.

또한 돌연변이 비율을 살펴보기 위해 비교 유전체학을 사용하는 두 개의 초기 논문이 있습니다.

  • 포유류 게놈의 돌연변이율 Kumar와 Subramanian에 의해

  • 인간 게놈의 결정론적 돌연변이 비율 변화 스미스 외

종간 비교에 중점을 두지만 구성적 차이(예: GC 풍부함)도 논의합니다.


돌연변이: 운전자 대 승객

스콧 W. 피라이노, . Simon J. Furney , 암 백과사전(제3판), 2019년

게놈 돌연변이 비율에 영향을 미치는 요인

체세포 돌연변이 비율은 게놈의 영역에 따라 상당히 다릅니다. 이러한 변이에 기여하는 요인을 이해하는 것은 드라이버 유전자를 검출하는 방법에 필수적이며 암 생물학을 이해하는 관점에서도 독립적입니다(그림 3). 게놈 돌연변이율과 관련된 첫 번째 게놈 특징 중 하나는 유전자 발현 수준입니다. 고도로 전사된 유전자는 일반적으로 약하게 발현된 유전자에 비해 낮은 돌연변이율을 보입니다. 또한 유전자의 전사된 가닥은 전사되지 않은 가닥에 비해 돌연변이 비율이 더 낮다는 사실이 밝혀졌으며, 이는 돌연변이 비율에 대한 유전자 발현의 영향이 전사 결합 뉴클레오티드 절단 복구로 인한 것일 수 있음을 시사하는 것으로 해석되었습니다.

그림 3. 많은 요인이 개별 암 게놈 내에서 그리고 개인 전반에 걸쳐 돌연변이 비율에 영향을 미칩니다. 여기에서는 환경 노출, DNA 복제 및 복구에 영향을 미치는 요인, 게놈 전반에 걸쳐 다양한 기능의 세 가지 범주에서 돌연변이 비율에 영향을 미치는 요인의 몇 가지 예를 제공합니다.

Piraino, S. W., Furney, S. J. (2016)에서. 엑솜 너머: 암에서 비암호화 체세포 돌연변이의 역할. 종양학 연보 27(2), 240–248.

DNA 복구는 암 게놈의 돌연변이율 변이의 중심 요인으로 부상했습니다. 게놈 전반에 걸친 돌연변이율의 가변성을 특성화하려는 초기 노력은 염색질 상태와 관련된 염색질 마커가 특히 암 게놈 돌연변이율과 관련된 것으로 확인되었습니다. 닫힌 염색질의 마커는 일반적으로 더 높은 돌연변이율과 연관되어 있는 반면, 열린 염색질 상태는 더 낮은 돌연변이율과 연관되어 있습니다. 이 관찰된 연관성은 염색질 상태가 돌연변이 비율의 맥락에서 기본 DNA에 대한 DNA 복구 기계의 접근과 연결되었을 때 기계론적 해석을 받았습니다. 불일치 복구 능력이 있는 종양은 게놈 전반에 걸쳐 상당한 돌연변이율 가변성을 나타내지만, 불일치 복구 결함 종양에서는 이러한 가변성이 상당히 감소된다는 것이 관찰되었다. 돌연변이 비율과 염색질 상태의 관찰된 연관성과 결합하여, 이러한 결과는 열린 염색질 상태가 DNA를 수리에 더 유용하게 만들어 DNA 수리가 능숙할 때 이 영역에서 돌연변이 비율이 더 낮은 모델을 제안합니다.

다른 연구에서는 보다 특정한 염색질 상호작용에서 DNA 복구와 염색질 상태의 상호작용에 대한 그럴듯한 역할을 제안했습니다. 감소된 돌연변이 비율은 DNase I 과민성 부위에서 관찰되었으며, 이 저돌연변이는 뉴클레오타이드 절제 수리가 부족한 종양에서는 나타나지 않으며, 이는 다시 한 번 돌연변이 비율에 영향을 미치는 요인으로 개방 염색질의 수리 기계에 더 쉽게 접근할 수 있음을 시사합니다. DNase I 과민증 부위는 감소된 돌연변이율을 나타내지만, 단백질 결합의 실제 부위에서는 증가된 돌연변이율이 관찰되었습니다. 전사 인자 결합 부위는 절제 복구 시퀀싱에 의해 측정된 바와 같이 감소된 절제 복구 활성과 일치하며, 측면 영역에 비해 이러한 부위의 과도한 돌연변이율은 XPC-결핍 피부암에서 중단되며, 이는 이러한 돌연변이율 가변성이 DNA 복구 인자. 결장직장암에서 CTCF 결합 부위에는 과도한 돌연변이가 있는 반면, POLE의 교정 활성을 방해하는 돌연변이를 보유하는 결장직장 종양은 실제로 배경 돌연변이에 비해 이 부위에서 돌연변이가 더 적으며, 이는 다시 단백질 결합과 DNA 복구 사이의 상호작용을 내포합니다.

암 게놈 내 및 암 게놈 간의 돌연변이율 변동성을 이해하는 것은 드라이버 유전자의 검출에 중요한 의미를 갖습니다. 드라이버 유전자 발견에 사용할 수 있는 돌연변이의 수는 드라이버 유전자를 감지하는 능력에 영향을 미칩니다. 돌연변이 비율 변동성은 분석에서 "위양성"으로 이어질 수도 있습니다. 이 유전자는 돌연변이 비율이 높지만 드라이버 유전자가 아닙니다. 돌연변이율에 영향을 미치는 요인을 설명하면 통계적 방법의 성능을 개선하고 위양성 가능성을 줄이는 데 도움이 될 수 있습니다. 최근에는 변형률의 모델링되지 않은 변동이 존재하는 경우 성능을 향상시킬 수 있는 방법으로 원시 비율이 아닌 다른 유형의 돌연변이 비율을 사용하는 비율 측정 방법이 제안되었습니다.

게놈 전반에 걸쳐 변하는 것 외에도 돌연변이 비율은 개인에 따라 상당히 다양합니다. 담배 연기, 자외선 및 아리스토로크산과 같은 환경 노출은 암 게놈의 돌연변이율을 증가시킬 수 있습니다. 개인의 돌연변이 비율은 또한 특정 세포 과정의 활동 변동성에 의해 영향을 받습니다. 다음 섹션에서 우리는 돌연변이 비율의 이질성에 기여하는 환경 및 내인성 주도 돌연변이 과정 중 일부에 대해 논의합니다.


인간 돌연변이율 밝혀졌다

차세대 시퀀싱은 현재까지 가장 정확한 추정치를 제공합니다.

인간의 DNA가 한 세대에서 다음 세대로 전달될 때마다 Y 염색체의 DNA 시퀀싱 분석에 따르면 100-200개의 새로운 돌연변이가 축적됩니다.

인간 돌연변이율을 직접 측정한 첫 번째 수치인 이 수치는 3천만 염기쌍 중 하나의 돌연변이에 해당하며 종 비교 및 ​​희귀 질환 선별 검사에서 얻은 이전 추정치와 일치합니다.

추정치를 내놓은 영국-중국 연구팀은 먼 친척이었던 중국 시골에 사는 두 남자의 Y염색체에서 천만 염기쌍의 염기서열을 분석했다. 이 남성들은 200년 이상 전에 태어난 일반 친척으로부터 동일한 조상 남성 전용 염색체를 물려받았습니다. 이후 13세대에 걸쳐 이 Y 염색체는 드문 DNA 복사 실수에도 불구하고 아버지에서 아들로 충실하게 전달되었습니다.

연구진은 두 사람에게서 채취한 세포를 배양해 차세대 염기서열 분석 기술을 이용해 23개의 후보 돌연변이를 찾아냈다. 그런 다음 그들은 전통적인 시퀀싱 기술을 사용하여 이러한 돌연변이 중 12개를 검증했습니다. 그러나 이러한 돌연변이 중 8개는 세포 배양 과정에서 발생하여 유전 가능한 진정한 돌연변이는 4개뿐이었습니다. 그 결과를 전체 게놈으로 외삽하면 3천만 염기쌍 중 1개 정도의 돌연변이 비율을 얻을 수 있습니다.

Wellcome Trust Sanger의 크리스 타일러-스미스(Chris Tyler-Smith)는 "새로운 시퀀싱 기술을 적용한 것이 신뢰할 수 있는 결과를 제공하고 돌연변이율에 사용했던 수치가 거의 맞는다는 사실이 매우 안심이 되었습니다."라고 말했습니다. 이번 연구를 주도한 영국 힝스턴 연구소(Institute in Hinxton, UK)는 현재 생물학 1 .

Tyler-Smith는 돌연변이율의 직접적인 측정이 인간이 아프리카에서 처음으로 이주했을 때와 같은 진화론적 과거의 사건을 이전의 방법보다 더 정확하게 추론하는 데 사용할 수 있다고 말합니다. 그러나 그것이 가능하기 전에 연구원들은 보다 정확한 추정이 필요할 것이라고 프랑스 리옹 대학의 진화생물학자인 Laurent Duret은 말합니다. "돌연변이 비율에 대한 신뢰 구간은 여전히 ​​상당히 넓습니다."라고 그는 말합니다. 다른 가족의 먼 남성 사촌으로부터 더 많은 Y 염색체 쌍을 시퀀싱하면 보다 강력한 측정을 제공하고 돌연변이 비율이 개인마다 어떻게 다른지 밝혀야 한다고 Duret은 덧붙였습니다.

대부분의 Y 염색체는 다른 염색체와 섞이지 않기 때문에 돌연변이율을 더 쉽게 추정할 수 있습니다. 그러나 돌연변이 비율은 다른 염색체에서 다소 다를 수 있다고 영국 브라이튼에 있는 서식스 대학의 진화 생물학자인 Adam Eyre-Walker가 지적합니다. 1000 Genomes Project와 같이 부모와 자손의 시퀀싱을 포함하는 다른 프로젝트는 나머지 게놈에서 DNA가 어떻게 변하는지 조명하기 시작해야 합니다.

"나는 이것이 같은 종류의 일을 하게 될 많은 논문들 중 단지 첫 번째일 뿐이라고 확신합니다."라고 Tyler-Smith는 말합니다.


해로운 돌연변이의 지속성

저희를 위해 글을 쓰시겠습니까? 글쎄, 우리는 소문을 퍼뜨리고 싶은 좋은 작가를 찾고 있습니다. 연락주시면 상담해드리겠습니다.

유해한 특성에도 불구하고 유해한 유전자가 유기체의 게놈에 남아 있는 이유는 무엇입니까? 이것은 이러한 돌연변이의 제거 속도가 나타나는 속도에 비해 낮을 수 있는 것과 같은 여러 가지 이유 때문일 수 있습니다. 기타 가능한 이유는 다음과 같습니다.

이형접합체의 장점

이것은 유전자의 두 가지 다른 사본(야생형 및 돌연변이체)을 소유하는 것이 해로운 것이 아니라 유기체에 유익한 상태입니다. 예를 들어 헤모글로빈 유전자에서 돌연변이가 발생하여 겸상 적혈구 빈혈(SCA)이라는 상태가 발생합니다. 이 경우 돌연변이 대립유전자에 대한 동형접합체는 해로운 영향을 미칠 것입니다. 즉, 개인은 SCA를 앓게 됩니다(모든 RBC는 낫 모양입니다). 그러나 개인이 이형 접합체인 경우 상태의 열성 특성으로 인해 해당 상태의 보인자(적혈구의 부분 겸상)가 됩니다. 적혈구를 감염시키고 산소를 박탈하는 말라리아 기생충 P. falciparum이 겸상 적혈구를 감염시킬 수 없어 말라리아 감염을 일으키기 때문에 이것은 유익합니다. 다시 말해, 보균자의 적혈구가 부분적으로 낫을 하면 말라리아에 면역이 됩니다. 반면에, 야생형 동형 접합체 개체는 말라리아 감염에 취약할 것입니다.

생식 건강에 영향 없음

어떤 경우에는 돌연변이의 해로운 영향이 유기체의 생식 단계가 이미 경과한 후기 단계에서 나타납니다. 따라서 돌연변이는 유해한 특성에도 불구하고 번식 단계에서 영향을 미치거나 나타나지 않기 때문에 유전됩니다. 헌팅턴병을 유발하는 HD 유전자에서 볼 수 있는 트리뉴클레오티드 반복 돌연변이가 그 예입니다. 이 경우 질병의 영향은 40세 이후에 나타나며 그 때까지 개체는 이미 이 유해한 돌연변이를 번식하여 자손에게 전달합니다. 이것이 개인의 건강에 영향을 주지만 개인의 생식 건강에는 영향을 미치지 않고 단지 수명을 단축시키기 때문에 지속됩니다.

돌연변이에 의해 유지됨

일부 돌연변이는 유기체 게놈에 의한 제거 노력에도 불구하고 특정 유전자에서 계속 발생할 수 있습니다. 이것은 유전자의 극도의 돌연변이 특성 때문일 수 있으며, 또한 유전자가 (다른 우발적 오류의 유도를 방지하기 위해) 변조하기에는 너무 중요하기 때문일 수 있습니다. 이것의 예는 돌연변이될 때 신경계의 종양을 일으키는 신경섬유종증이라는 상태를 유발하는 NF 유전자입니다. 여기서 돌연변이를 제거하는 것은 어려울 수 있습니다. 왜냐하면 유전자 서열의 원치 않는 파괴는 더 많은 손상을 일으킬 것이기 때문입니다. 또한 이 돌연변이가 제거되더라도 이 유전자는 새로운 돌연변이를 가진 배우자 4,000명당 거의 1명꼴로 돌연변이하는 경향이 있습니다.

유전자 흐름에 의해 유지됨

이것은 동일한 위치로 이주한 다른 집단에 의해 도입된 집단에서 돌연변이된 유전자 사본의 유행을 나타냅니다. 위에서 언급했듯이 SCA 돌연변이는 아프리카 대륙의 경우와 마찬가지로 말라리아가 만연한 지역에 유용합니다. 그러나 이 지역에 거주하는 보균자가 말라리아 발병률이 낮은 다른 국가로 이주하면서 SCA 돌연변이가 해당 국가의 인구에 도입되었습니다. 따라서 인간 이동은 아프리카에서 말라리아 발병률이 없는 이 돌연변이가 순전히 해로운 다른 국가로 유전 물질의 흐름을 가져왔습니다.

게놈의 배수성

해로운 돌연변이는 일반적으로 본질적으로 열성입니다. 반수체 유기체에 해로운 돌연변이가 있으면 그 효과를 쉽게 관찰할 수 있어 유기체의 적합성을 손상시키고 그 결과 죽음을 초래할 수 있습니다. 그러나 유기체가 유전자의 다중 대립유전자를 갖는 이배체 또는 배수체인 경우, 완전한 기능을 갖는 야생형 대립유전자의 존재에 의해 유해한 효과가 억제되거나 무시될 수 있습니다. 이렇게 하면 돌연변이된 대립유전자의 발현이 방지되지만 제거되지 않아 개체군에 지속되어 동일한 대립유전자를 가진 두 개체가 번식하여 돌연변이의 해로운 영향을 받는 자손을 낳을 때까지 계속됩니다.

교정 메커니즘과 함께 세포 복구 기계가 돌연변이를 제거하려고 시도하지만 특정 돌연변이는 수정되지 않거나 적극적으로 보존됩니다(위에서 설명한 대로). 이러한 방식으로 여러 세대에 걸쳐 돌연변이가 축적되면 Muller’s 래칫이라는 효과가 나타나 해당 유기체의 종의 멸종으로 이어질 수 있습니다. 이 효과는 종의 멸종과 멸종 위기에 처한 종의 보존 노력과 관련하여 연구 된 원리입니다.

관련 게시물

유전자 서열의 변화인 돌연변이는 그 효과에 따라 유익한 것, 해로운 것, 중립적인 것 등 여러 가지로 나뉜다. 우리는 유익한 돌연변이 및 헬립에 대해 논의하기 위해 여기에 있습니다.

생식계열과 체세포 돌연변이의 주요 차이점은 유전 여부에 있습니다. 하지만 더 많은 것이 있습니다. 이 BiologyWise 게시물은 체계적인 비교 및 ​​도움말을 제공합니다.

억제 영역은 디스크 확산 방법의 도움으로 발견됩니다. 이 BiologyWise 게시물은&hellip에 영향을 줄 수 있는 다양한 매개변수에 대한 정보와 정의를 제공합니다.


비정상적인 DNA 접힘은 돌연변이 비율을 증가시킵니다

새로운 연구에 따르면 인간 게놈의 최대 13%를 포함하는 고전적인 이중 나선(비 B DNA)이 아닌 다른 형태로 접히는 DNA는 비 B 모티프 자체와 그 모티프 모두에서 뉴클레오티드 치환 비율을 증가시킵니다. 측면 지역. 이러한 상승된 돌연변이 비율은 게놈 전반에 걸친 돌연변이 비율의 지역적 변이의 주요 원인입니다. 출처: Wilfried Guiblet 및 Dani Zemba, 펜실베이니아 주

고전적인 이중 나선이 아닌 다른 형태로 접힐 수 있는 DNA 서열은 인간 게놈의 다른 영역보다 돌연변이율이 더 높은 경향이 있습니다. Penn State 과학자 팀의 새로운 연구에 따르면 이러한 염기서열의 증가된 돌연변이 비율은 게놈 전체에 걸친 돌연변이 비율의 지역적 변이를 결정하는 데 중요한 역할을 합니다. 돌연변이 비율의 지역적 변이의 패턴과 원인을 해독하는 것은 진화를 이해하고 질병을 유발할 수 있는 새로운 돌연변이의 위치를 ​​예측하는 데 모두 중요합니다.

연구를 설명하는 논문은 저널에서 온라인으로 볼 수 있습니다. 핵산 연구.

"대부분의 경우 우리는 DNA를 고전적인 이중 나선으로 생각하며 이 기본 형태를 'B-DNA'라고 부릅니다."라고 당시 펜실베니아 주립대 대학원생이었던 Wilfried Guiblet가 말했습니다. 연구 및 현재 국립 암 연구소의 박사후 연구원입니다. "그러나 인간 게놈의 최대 13%가 '비-B DNA'라고 불리는 다른 형태로 접힐 수 있습니다. 우리는 이 non-B DNA가 게놈의 다른 영역에서 돌연변이 비율에서 볼 수 있는 변이에서 어떤 역할을 하는지 탐구하고 싶었습니다."

비-B DNA는 기본 DNA 서열에 따라 다양한 형태로 접힐 수 있습니다. 예에는 G-quadruplexes, Z-DNA, H-DNA, 미끄러진 가닥 및 기타 다양한 형태가 포함됩니다. 최근 연구에 따르면 non-B DNA는 게놈 복제 및 DNA의 RNA로의 전사를 포함하여 세포 과정에서 중요한 역할을 하며 non-B 서열의 돌연변이는 유전 질환과 관련이 있음이 밝혀졌습니다.

"이전 연구에서 우리는 세포에서와 유사한 DNA 복사 과정을 사용하는 DNA 시퀀싱 기기의 인공 시스템에서 중합 동안 비 B DNA에서 오류율이 더 높다는 것을 보여주었습니다."라고 Verne M. 펜실베니아 주립대학 생명과학부 윌라만 의장이자 연구팀의 리더 중 한 명. "시퀀싱 과정에서 DNA를 복제하는 효소가 non-B DNA를 통해 읽기가 더 어렵기 때문이라고 생각합니다. 여기서 우리는 유사한 현상이 살아있는 세포에 존재하는지 확인하고 싶었습니다."

팀은 두 가지 다른 시간 척도에서 B DNA와 B가 아닌 DNA 간의 돌연변이 비율을 비교했습니다. 비교적 최근의 변화를 살펴보기 위해 그들은 인간 DNA 서열의 기존 데이터베이스를 사용하여 인간마다 다른 개별 뉴클레오티드(DNA 알파벳의 문자)를 식별했습니다. 이러한 "단일 염기 다형성"(SNP)은 과거의 어느 시점에서 적어도 한 개인에게 돌연변이가 발생한 인간 게놈의 위치를 ​​나타냅니다. 더 많은 고대 변화를 살펴보기 위해 연구팀은 인간 게놈 서열을 오랑우탄 게놈과 비교하기도 했다.

그들은 또한 비-B DNA가 인접하거나 더 멀리 떨어진 뉴클레오티드에서 돌연변이율에 영향을 미치는지 여부를 테스트하기 위해 인간 게놈을 따라 여러 공간 규모를 조사했습니다.

공동 연구책임자인 Marzia A. Cremona는 "B DNA와 B가 아닌 DNA 간의 돌연변이 비율의 차이를 식별하기 위해 '기능적 데이터 분석'의 통계 도구를 사용하여 데이터를 개별 데이터 포인트를 보는 대신 곡선으로 비교했습니다. 논문의 첫 번째 저자이자 연구 당시 펜실베이니아 주립대의 박사후 연구원이자 현재 캐나다 퀘벡에 있는 라발 대학교의 조교수입니다. "이러한 방법은 B-DNA 대조군에 대해 다양한 유형의 비-B DNA에 대한 돌연변이 비율을 대조할 수 있는 통계적 능력을 제공합니다."

대부분의 유형의 비 B DNA에 대해 팀은 돌연변이 비율이 증가했음을 발견했습니다. 그 차이는 non-B DNA 돌연변이 비율이 주변 환경의 지역적 변이에 영향을 미치기에 충분했습니다. 이러한 차이는 또한 수백만 개의 뉴클레오티드 규모에서 게놈을 따라 볼 수 있는 변이의 상당 부분을 설명하는 데 도움이 되었습니다.

펜실베니아 주립대학 생명과학통계의 헉 의장이자 리더 중 한 명인 프란체스카 키아로몬테(Francesca Chiaromonte)는 “게놈 전체에 걸친 돌연변이 비율의 지역적 변이에 영향을 미치는 알려진 모든 요인을 볼 때 비 B DNA가 가장 큰 기여를 한다”고 말했다. 연구팀의. "우리는 오랫동안 다양한 각도에서 돌연변이 비율의 지역적 변이를 연구해 왔습니다. 비 B DNA가 이러한 변이의 주요 원인이라는 사실은 중요한 발견입니다."

펜실베니아 주립 의과대학 병리학 및 생화학 및 분자생물학 교수이자 이 논문의 저자이자 이 팀의 오랜 협력자인 펜실베니아 주립 암 연구소의 크리스틴 에커트(Kristin Eckert) 교수는 "우리의 결과는 중요한 의학적 의미를 갖는다"고 말했다. "예를 들어, 인간 유전학자는 인간 유전 질환에 대한 후보 유전 변이를 평가할 때 비-B DNA를 형성할 수 있는 유전자좌의 가능성을 고려해야 합니다. 우리의 현재 및 미래 연구는 비-B에서 돌연변이율 증가 배후의 기계적 기반을 푸는 데 초점을 맞추고 있습니다. DNA."

결과는 또한 진화론적 의미를 갖습니다.

펜실베이니아 주립대 생물학과 조교수인 황 이페이(Yi-Fei Huang)는 "자연 선택이 게놈의 변이에 영향을 줄 수 있다는 것을 알고 있기 때문에 이 연구에서는 선택의 영향을 받지 않는다고 생각하는 게놈 영역만 조사했다"고 말했다. 그리고 연구팀의 리더 중 한 명. "이를 통해 우리는 미래에 이러한 서열에서 자연 선택의 특징을 식별하는 데 도움이 될 수 있는 각 유형의 비 B DNA에 대한 기준 돌연변이 비율을 설정할 수 있습니다."

증가된 돌연변이율 때문에 비-B DNA 서열은 진화적 변화의 궁극적인 근원인 유전적 변이의 중요한 근원이 될 수 있습니다.

펜실베니아 주립 암 연구소(Penn State Cancer Institute) 연구원인 마코바(Makova)는 "돌연변이는 일반적으로 매우 드문 것으로 생각되어 다른 개인에게서 동일한 돌연변이를 볼 때 그 개인이 둘 모두에게 돌연변이를 전달한 조상을 공유했다고 가정합니다."라고 말했습니다. "그러나 돌연변이 비율이 이러한 비 B DNA 영역 중 일부에서 너무 높아서 동일한 돌연변이가 여러 다른 개인에서 독립적으로 발생할 수 있습니다. 이것이 사실이라면 진화에 대한 우리의 생각이 바뀔 것입니다."


유전자 대 게놈 크기

진핵 생물에서 관찰된 역설이 있습니다. 즉, 게놈을 구성하는 유전자의 수가 게놈 크기와 상관관계가 없다는 것입니다. 즉, 게놈 크기는 단백질 코딩 유전자의 총 수를 감안할 때 예상되는 것보다 훨씬 큽니다. 게놈 크기는 복제, 삽입 또는 배수체화에 의해 증가할 수 있으며 재조합 과정은 DNA 손실 또는 획득으로 이어질 수 있습니다. 삭제로 인해 게놈이 축소될 수도 있습니다.

그림 (PageIndex<1>): 게놈의 유전자 변이: 이 그림은 각 유전자 산물의 기능별로 분류된 인간 게놈을 나타내며, 유전자의 수와 전체 유전자의 백분율로 표시됩니다. 중요한 것은 게놈 크기가 반드시 복잡성과 상관관계가 있는 것은 아니라는 점입니다.

이러한 유전자 붕괴의 유명한 예는 나병의 원인균인 Mycobacterium leprae의 게놈입니다. M.leprae는 가유전자의 형성으로 인해 시간이 지남에 따라 많은 기능을 하는 유전자를 잃었습니다. 이것은 가장 가까운 조상 Mycobacterium tuberculosis를 보면 분명합니다. M. leprae는 숙주 내부에 살고 복제하며 이러한 배열로 인해 한때 숙주 외부에서 살고 번성할 수 있었던 많은 유전자가 필요하지 않습니다. 따라서 시간이 지남에 따라 이러한 유전자는 돌연변이와 같은 메커니즘을 통해 기능을 상실하여 유사 유전자가 됩니다. DNA 복제를 훨씬 빠르고 에너지 효율적으로 만들기 때문에 유기체가 비필수 유전자를 제거하는 것이 유익합니다.

시간이 지남에 따라 게놈 크기가 증가하는 예는 사상 식물 병원체에서 볼 수 있습니다. 이러한 식물 병원체 게놈은 반복 주도 확장으로 인해 수년에 걸쳐 더 커졌습니다. 반복이 풍부한 영역에는 숙주 상호작용 단백질을 코딩하는 유전자가 포함되어 있습니다. 이러한 영역에 점점 더 많은 반복이 추가됨에 따라 식물은 돌연변이 및 기타 형태의 유전적 재조합을 통해 새로운 독성 인자를 개발할 가능성을 높입니다. 이러한 방식으로 이러한 식물 병원체는 더 큰 게놈을 갖는 것이 유리합니다.


체세포 돌연변이

이전의 논의는 유전 가능한 생식계열 돌연변이에 초점을 맞추었으며, 그 누적 표현형 효과는 다음 세대에서만 표현됩니다. 더 많은 수의 관련 세포와 더 높은 기본 돌연변이 비율로 인해 일상적인 웰빙에 영향을 미치는 체세포 돌연변이의 경우 상황이 극적으로 다릅니다. 체세포 돌연변이는 유전되지 않지만 DNA 복제 및 복구 기계가 두 유형의 세포 간에 공유되기 때문에 생식계열 돌연변이 비율과 잠재적으로 중요한 진화적 연결이 있습니다. 돌연변이 비율의 진화에 대한 실질적인 이론은 돌연변이 대립 유전자가 재조합 및 분리에 의해 분리될 때까지 돌연변이 대립 유전자와 일시적으로 연관되어 있는 간접적인 결과에 초점을 맞추지만(Kimura 1967 Dawson 1999 Lynch 2010), 이는 돌연변이 비율에 대한 선택이 상대적으로 약합니다. 큰 다세포 종의 경우 체세포 돌연변이의 직접적인 영향이 돌연변이 비율에 대한 선택의 주요 원천일 수 있습니다(Crow 1986 Lynch 2008 Erickson 2010).

체세포 돌연변이의 많은 결과 중 하나는 암이지만, 그러한 영향은 다른 신체적, 심리적 장애로 확대되는 것이 거의 확실합니다. 서로 다른 조직 사이에서 암의 평생 위험에 대한 변동의 대부분이 자가 재생 계통의 세포 분열 수의 변동과 관련되어 있음을 관찰하여 Tomasetti와 Vogelstein(2015)은 대부분의 암이 확률론적 도달의 피할 수 없는 결과라고 주장했습니다. 정상 세포의 배경 복제 오류(외인성 및 피할 수 있는 발암성 요인에 대한 반응보다는). 돌연변이가 DNA 복제와 관련되어 있다는 이 생각은 종 간, 같은 종의 수컷과 암컷, 그리고 연령대가 다른 수컷 사이의 생식계열 돌연변이율의 변이가 부분적으로는 생식계열 세포분열 수의 변이에 기인한다는 것을 시사하는 연구에서 우선합니다. (Drost and Lee 1995 Crow 2000 Wilson Sayres et al. 2011). 그럼에도 불구하고 대부분의 암은 예측할 수 없고 따라서 예방할 수 없다는 Tomasetti와 Vogelstein의 결론은 상당한 논란을 불러일으켰습니다.예를 들어, 알비니 et al. 2015 와인버그와 제이킨 2015).

이러한 참여 토론은 다세포 조직 내 체세포 돌연변이의 모자이크 특성으로 인해 달성하기 어려운 체세포 돌연변이의 배경 비율에 대한 정량적 정보의 필요성을 분명히 합니다. 4가지 인간 조직 유형의 표현형에 대한 마커 유전자좌를 기반으로 한 초기 간접 추정은 생식계열에 비해 세포 분열당 염기 치환 돌연변이 비율의 증가를 시사했습니다(Lynch 2009, 2010). 전체 엑솜 시퀀싱에 기반한 보다 최근의 결과는 뇌, 림프구, 결장 상피 및 피부 세포에 대한 팽창을 암시하고 팽창시킵니다(Tomasetti et al. 2013 로다토 et al. 2015 마틴코레나 et al. 2015). 증가된 체세포 돌연변이율을 생성하는 메커니즘은 여전히 ​​불분명하지만(가능한 설명에는 증가된 세포 분열 수, 수리 기계 구성요소의 변경된 발현, 대사의 돌연변이 부산물 수준 증가 포함) 이 점. 데이터를 이용할 수 있는 다른 모든 종에서 체세포 돌연변이 비율은 생식선 수준의 돌연변이 비율보다 훨씬 높습니다(Lynch 2009, 2010).

체세포 돌연변이율의 인플레이션을 가정하면(위 추정치의 평균), 평균 성인 세포는 다음을 포함합니다. 드 노보 돌연변이. 이것들이 모두 독립적인 것은 아니지만 인체의 세포와 함께 성인이 가지고 있는 돌연변이의 총 수는 수천 개의 세포에서 모든 뉴클레오티드 부위가 돌연변이된 순서대로 될 것입니다. 그러한 돌연변이의 많은 부분은 완전히 무해할 수 있지만 적합성에 영향을 미치는 인간 게놈의 부분이 1%만큼 작더라도(Lindblad-Toh et al. 2011 키틀리 2012 랜드 et al. 2014), 피할 수 없는 결론은 노화된 인간에서 바람직하지 않은 영향을 미치는 체세포 돌연변이의 축적을 피할 수 있는 방법이 없다는 것입니다. 따라서 적어도 근원을 제거하는 한 암과의 전쟁은 이길 수 없는 것처럼 보입니다.

이것은 우리가 환경 돌연변이원의 발생을 줄이는 목표를 포기해야 한다는 것을 말하는 것이 아닙니다. 실제로, 기준 인간 돌연변이 비율이 시간이 지남에 따라 증가할 가능성(아래에서 논의되는 이유 때문에)은 이미 위태로운 상황을 더욱 악화시킬 수 있는 모든 외부 요인을 최소화해야 할 필요성을 반대하는 강력한 주장을 촉발합니다. 의학적 검진 및 중재에 일반적으로 사용되는 절차가 주요 돌연변이원에 대한 노출을 증가시키는 부작용이 있다는 점에 특히 주의해야 합니다. 예를 들어, X선 조사를 포함하는 컴퓨터 단층촬영(CAT 스캔)의 사용은 지난 20년 동안 가임 연령 또는 그 이전의 환자와 함께 극적으로 증가했습니다(Kocher et al. 2011 베르달 et al. 2013) 및 투여된 방사선은 체세포 돌연변이율에 영향을 미치는 것으로 알려진 수준보다 훨씬 높습니다(Leuraud). et al. 2015). 두 번째 잠재적인 우려는 항생제의 매우 광범위한 적용과 관련이 있습니다. 치사량 이하의 항생제가 스트레스 반응을 유도하여 표적 세균의 돌연변이율을 간접적으로 증가시키는 것으로 알려져 있습니다(Kohanski et al. 2010 Andersson and Hughes 2014), 그러나 이들 및 대부분의 일반적으로 적용되는 의약품에 대해 우리는 진핵 숙주 세포의 뉴클레오티드 수준에서 DNA 안정성에 미치는 영향에 대해 거의 알지 못합니다.


추상적 인

영장류 진화의 사건은 종종 단위 시간당 일정한 대체 비율을 가정하여 날짜를 지정하지만 이 가정의 타당성은 여전히 ​​불분명합니다. 포유류 중 연간 대체율에 상당한 변동이 있음은 잘 알려져 있습니다. 그러한 변이는 생활사 특성의 차이에서 예상되며, 이는 영장류에서도 발견되어야 함을 시사합니다. 이러한 고려 사항에 동기를 부여하여 우리는 OWM(Old World Monkeys), NWM(New World Monkeys) 및 유인원을 포함한 10개 영장류 종의 전체 게놈을 분석합니다. CpG 사이트. 우리는 유인원보다 호미노이드-NWM 조상에서 NWM으로 이어지는 계보에서 대체율이 최대 64% 더 높다는 것을 발견했습니다. 유인원의 경우 인간보다 침팬지가 ~2%, 고릴라가 ~7% 더 높습니다. 편향된 유전자 변환의 대상이 되는 치환 유형은 그렇지 않은 것보다 종 간에 더 많은 변이를 나타내지 않습니다. 모든 돌연변이 유형이 유사하게 행동하는 것은 아니지만 특히 CpG 부위의 전이는 다른 유형보다 더 시계 같은 행동을 나타내며, 아마도 그들의 비복제 기원 때문일 것입니다. 따라서 총 비율뿐만 아니라 돌연변이 스펙트럼도 영장류마다 다릅니다. 이 발견은 영장류 진화의 사건이 CpG 전환을 사용하여 가장 확실하게 연대측정된다는 것을 시사합니다. 이 접근 방식을 사용하여 인간과 침팬지의 발산 시간은 1,210만 년, 인간과 고릴라의 발산 시간은 1,510만 년으로 추정됩니다.

생식선 돌연변이는 개인과 종 간의 유전적 차이의 궁극적인 원인입니다. 이는 DNA 복제의 오류(예: 염기쌍의 우연한 잘못된 결합) 또는 복제 시점까지 복구되지 않는 손상(예: 메틸화된 CpG 부위의 자발적인 탈아미노화)의 조합에서 발생하는 것으로 생각됩니다(1). 돌연변이가 중립적이라면(즉, 적합도에 영향을 미치지 않음) 돌연변이가 발생하는 비율은 대체율(2)과 같습니다. 중요한 결과는 돌연변이 비율이 시간이 지남에 따라 일정하게 유지된다면 대체 비율도 마찬가지로 일정해야 한다는 것입니다.

대체율의 불변성에 대한 이러한 가정은 유전 데이터에서 추론된 사건의 날짜를 결정하는 분자 시계를 제공함으로써 진화 유전학에서 근본적인 역할을 합니다(3). 특히 화석 기록이 없는 인간 진화의 중요한 사건(예: 인간과 침팬지가 갈라졌을 때, 해부학적으로 현대인이 아프리카를 떠났을 때)은 당대의 가계도나 계통발생학적 분석에서 얻은 돌연변이 비율을 사용하여 연대를 계산합니다. 수백만 년 동안 변하지 않았습니다(4).

그러나 우리는 포유류 계통발생과 다른 분류군에 대한 연구를 통해 단위 시간당 대체율에 상당한 변동이 있을 수 있음을 알고 있습니다(5 ⇓ –7). 특히, 세대 시간이 짧은 종(즉, 평균 생식 연령)이 돌연변이율이 높다는 관찰에 기초하여 대체율에 대한 "세대 시간 효과"에 대한 잘 알려진 가설이 있습니다(8). 예를 들어, 생쥐는 인간의 ~29년에 비해 몇 개월(~10–12개월)의 생성 시간을 가지며(9), 연간 대체율이 2~3배 더 높습니다(8). 보다 일반적으로 32개의 포유류 종을 대상으로 한 조사에서 생식 기간이 대체율 변동의 가장 강력한 예측 인자임을 발견했습니다(5).

A generation time effect has also been suggested in humans, motivated by the observation that the yearly mutation rate estimated by sequencing human and chimpanzee pedigrees [∼0.4 × 10 −9 per base pair per year (10, 11)] is approximately twofold lower than the mutation rate inferred from the number of substitutions observed between primates (1). Substitution-derived estimates of mutation rates are highly dependent on dating evolutionary lineages from the fossil record, and so are subject to considerable uncertainty. Nonetheless, one way to reconcile pedigree and substitution-derived estimates of the mutation rate would be to postulate that the generation time has increased toward the present, and led to a decrease in the yearly mutation rate (12).

Whether the association between generation time and substitution rates is causal remains unclear, however correlated traits such as metabolic rate (13), body size (14), and sperm competition (15) may also affect substitution rates. For instance, the metabolic rate hypothesis posits that species with higher basal metabolic rates are subject to higher rates of oxidative stress, and hence have a higher mutation rate (13). Body mass has been shown to be negatively correlated to substitution rates, such that smaller animals tend to have higher substitution rates (13). Sexual selection on mating systems may also affect substitution rates, as more intense sperm competition leads to selection for higher sperm counts, leading to more cell divisions per unit time during spermatogenesis and a higher male mutation rate (15).

That said, an effect of life history traits such as generation time on the yearly mutation rate is expected from first principles, given our understanding of oogenesis and spermatogenesis (16, 17). In mammals, oogonial divisions are completed by the birth of the future mother, whereas the spermatogonial stem cells continue to divide postpuberty (16). Thus, the total number of replication-driven mutations inherited by a diploid offspring accrues in a piecewise linear manner with parental age, with the number depending on the number of cell divisions in each developmental stage, as well as the per cell division mutation rates (1, 17). These considerations indicate that changes in generation time, onset of puberty, and rate of spermatogenesis should all influence yearly mutation rates (1, 17).

Importantly, then, primates are well known to differ with regard to most of these traits. In addition to huge variation in body size and metabolic rates, generation time varies almost 10-fold, with the shortest generation time observed in prosimians [∼3 y in galago and mouse lemurs (18)] and the longest generation time observed in humans (∼29 y). Species also differ in the strength of sperm competition and rates of spermatogenesis: monkeys have a shorter spermatogenetic division, and thus consequently produce more sperm per unit time than do apes (19). Thus, even if the per cell division mutation rate remained constant, we should expect differences in yearly mutation rates among species.

Although the factors discussed thus far apply to all sites, variation in substitution rates among species also depends on the type of mutation and the genomic context (i.e., flanking sequence) in which it occurs (6). For example, in mammals, CpG transitions show the least amount of variation in substitution rates among species (6). A plausible explanation is the source of mutations, as transitions at methylated CpG sites are thought to occur primarily through spontaneous deamination if they arise at a constant rate and their repair is inefficient relative to the cell cycle length, as is thought to be the case, then their mutation rate should depend largely on absolute time, rather than the number of cell divisions (20 ⇓ –22).

In addition, even substitutions that have no effect on fitness may vary in their rate of accumulation among lineages because of biased gene conversion (BGC), the bias toward strong (S: G or C) rather than weak (W: A or T) bases that occurs in the repair of double-strand breaks (23). This phenomenon leads to the increased probability of fixation of S alleles (and loss of W alleles) in regions of higher recombination, and can therefore change substitution rates relative to mutation rates (23, 24). The strength of BGC is a function of the degree of bias, the local recombination rate, and the effective population size of the species (23). The latter varies by three- to fourfold among primates (25), and the fine-scale recombination landscape is also likely to differ substantially across species (26).

Empirically, the extent to which substitution rates vary among primate lineages remains unclear. Kim et al. (27) compared two hominoids (human and chimpanzee) and two Old World Monkeys (OWMs baboon and rhesus macaque). Assuming that the average divergence time of the two pairs of species is identical, they reported that substitution rates at transitions at non-CpG sites differ by ∼31% between hominoids and OWMs, whereas rates of CpG transitions are almost identical (27). In turn, Elango et al. (28) found that the human branch is ∼2% shorter than that in chimpanzee (considering the rates from the human–chimpanzee ancestor), and ∼11% shorter than in gorilla (considering rates from the human–gorilla ancestor). Although these comparisons suggest that substitution rates are evolving across primates, they are based on limited data, make strong assumptions about divergence times, and rely on parsimony-based approaches that may underestimate substitution rates for divergent species, notably at CpG sites (29). We therefore revisit these questions using whole-genome sequence alignments of 10 primates, allowing for variable substitution rates along different lineages and explicitly modeling the context dependency of CpG substitutions.


Unusual DNA folding increases the rates of mutations

DNA sequences that can fold into shapes other than the classic double helix tend to have higher mutation rates than other regions in the human genome. New research shows that the elevated mutation rate in these sequences plays a major role in determining regional variation in mutation rates across the genome. Deciphering the patterns and causes of regional variation in mutation rates is important both for understanding evolution and for predicting sites of new mutations that could lead to disease.

A paper describing the research by a team of Penn State scientists is available online in the journal 핵산 연구.

"Most of the time we think about DNA as the classic double helix this basic form is referred to as 'B-DNA,'" said Wilfried Guiblet, co-first author of the paper, a graduate student at Penn State at the time of research and now a postdoctoral scholar at the National Cancer Institute. "But, as much as 13% of the human genome can fold into different conformations called 'non-B DNA.' We wanted to explore what role, if any, this non-B DNA played in variation that we see in mutation rates among different regions of the genome."

Non-B DNA can fold into a number of different conformations depending on the underlying DNA sequence. Examples include G-quadruplexes, Z-DNA, H-DNA, slipped strands, and various other conformations. Recent research has revealed that non-B DNA plays critical roles in cellular processes, including the replication of the genome and the transcription of DNA into RNA, and that mutations in non-B sequences are associated with genetic diseases.

"In a previous study, we showed that in the artificial system of a DNA sequencing instrument, which uses similar DNA copying processes as in the cell, error rates were higher in non-B DNA during polymerization," said Kateryna Makova, Verne M. Willaman Chair of Life Sciences at Penn State and one of the leaders of the research team. "We think that this is because the enzyme that copies DNA during sequencing has a harder time reading through non-B DNA. Here we wanted to see if a similar phenomenon exists in living cells."

The team compared mutation rates between B- and non-B DNA at two different timescales. To look at relatively recent changes, they used an existing database of human DNA sequences to identify individual nucleotides -- letters in the DNA alphabet -- that varied among humans. These 'single nucleotide polymorphisms' (SNPs) represent places in the human genome where at some point in the past a mutation occurred in at least one individual. To look at more ancient changes, the team also compared the human genome sequence to the genome of the orangutan.

They also investigated multiple spatial scales along the human genome, to test whether non-B DNA influenced mutation rates at nucleotides adjacent to it and further away.

"To identify differences in mutation rates between B- and non-B DNA we used statistical tools from 'functional data analysis' in which we compare the data as curves rather than looking at individual data points," said Marzia A. Cremona, co-first author of the paper, a postdoctoral researcher at Penn State at the time of the research and now an assistant professor at Université Laval in Quebec, Canada. "These methods give us the statistical power to contrast mutation rates for the various types of non-B DNA against B-DNA controls."

For most types of non-B DNA, the team found increased mutation rates. The differences were enough that non-B DNA mutation rates impacted regional variation in their immediate surroundings. These differences also helped explain a large portion of the variation that can be seen along the genome at the scale of millions of nucleotides.

"When we look at all the known factors that influence regional variation in mutation rates across the genome, non-B DNA is the largest contributor," said Francesca Chiaromonte, Huck Chair in Statistics for the Life Sciences at Penn State and one of the leaders of the research team. "We've been studying regional variation in mutation rates for a long time from a lot of different angles. The fact that non-B DNA is such a major contributor to this variation is an important discovery."

"Our results have critical medical implications," said Kristin Eckert, professor of pathology and biochemistry and molecular biology at Penn State College of Medicine, Penn State Cancer Institute Researcher, an author on the paper, and the team's long-time collaborator. "For example, human geneticists should consider the potential of a locus to form non-B DNA when evaluating candidate genetic variants for human genetic diseases. Our current and future research is focused on unraveling the mechanistic basis behind the elevated mutation rates at non-B DNA."

The results also have evolutionary implications.

"We know that natural selection can impact variation in the genome, so for this study we only looked at regions of the genome that we think are not under the influence of selection," said Yi-Fei Huang, assistant professor of biology at Penn State and one of the leaders of the research team. "This allows us to establish a baseline mutation rate for each type of non-B DNA that in the future we could potentially use to help identify signatures of natural selection in these sequences."

Because of their increased mutation rates, non-B DNA sequences could be an important source of genetic variation, which is the ultimate source of evolutionary change.

"Mutations are usually thought to be so rare, that when we see the same mutation in different individuals, the assumption is that those individuals shared an ancestor who passed the mutation to them both," said Makova, a Penn State Cancer Institute researcher. "But it's possible that the mutation rate is so high in some of these non-B DNA regions that the same mutation could occur independently in several different individuals. If this is true, it would change how we think about evolution."


인간 게놈

De Novo 돌연변이

While much emphasis is placed on inherited genome variation , all such variation had to originate as 드 노보, or new, changes occurring in germ cells. At that point, such a variant would be quite rare in the population (occurring just once), and its ultimate frequency in the population over time depends on chance and on the principles of Mendelian inheritance and population genetics (see Chapter 3 ). While there have been many efforts to estimate the human mutation rate, the ability to sequence genomes directly provides a robust method for measuring such rates genome-wide, by, for example, comparing the sequence of an offspring’s genome (or a portion of that genome) with that of his or her parents ( Conrad et al., 2011 Roach et al., 2010 ).

Such studies have determined the germline base substitution mutation rate to be

10 −8 /bp/generation. Thus, any individual carries an estimated 30–70 new mutations per genome that were not present in the genomes of his or her parents. This rate, however, varies from gene to gene around the genome, and perhaps from population to population or even individual to individual ( Conrad et al., 2011 ). Overall, the rate, combined with considerations of population growth and dynamics, predicts that there must be an enormous number of relatively new (and thus rare) mutations in the current worldwide population of 7 billion individuals, a prediction confirmed by resequencing of genes from some 13,000 individuals ( Coventry et al., 2010 ).

Conceptually similar studies have explored 드 노보 mutations in CNVs, where the generation of a new length variant depends on recombination, rather than on errors in DNA synthesis to generate a new basepair (see Chapter 10 ). Indeed, the measured rate of formation of new CNVs (

1.2 × 10 −2 /genome/transmission) is orders of magnitude higher than that of base substitutions ( Itsara et al., 2011 ).

Mutations also occur in somatic cells, and one would predict that, in fact, every cell in an individual has a slightly different version of his or her genome, depending on the number of cell divisions that have occurred since conception to the time of sample acquisition. In highly proliferative tissues, such as intestinal epithelial cells or hematopoietic cells, such genomic heterogeneity is particularly likely to be apparent. However, most such mutations are not typically detected, since one usually sequences DNA from collections of many millions of cells in such a collection, the most prevalent base at any position in the genome will be the one present at conception and rare somatic mutations will be largely invisible and unascertained. New methods to sequence DNA from single cells are under development, which will provide an opportunity to explore the nature of genomic sequence heterogeneity in different cell and tissue types and across the lifespan ( Kalisky et al., 2011 ).

An exception to the expectation that 드 노보 somatic mutations will be typically undetectable within any multi-cell DNA sample is in cancer, in which the mutational basis for the origins of cancer and the clonal nature of tumor evolution drives certain somatic changes to be present in essentially all the cells of a tumor. Indeed, 1000 to 10,000 somatic mutations (and sometimes many more) are readily found in the genomes of most adult cancers, with mutation frequencies and patterns specific to different cancer types ( Meyerson et al., 2010 Stratton, 2011 ). In principle, such studies can point to critical genes (“driver” mutations) and/or novel gene fusion products that will inform understanding of a given cancer’s molecular, genetic, and genomic etiology. To date, this sequence-based approach has identified over 200,000 mutations in hundreds of whole cancer genomes, pointing to nearly 500 somatically mutated cancer genes that contribute to neoplastic change in one or more types of cancer. Impressively, this suggests that as many as 2% of the protein-coding genes in the human genome can, when mutated in particular ways, predispose a cell to become cancerous ( Meyerson et al., 2010 ). An online catalog of somatic mutations in cancer is maintained by the Sanger Institute in the UK ( Forbes et al., 2011 ) ( Table 1.2 ).


비디오 보기: 휴먼 게놈 프로젝트13년 만에 성공한 유전체 읽기! 차이나는 클라스 94회 (할 수있다 2022).


코멘트:

  1. Lenard

    어떤 말 ... 훌륭합니다, 훌륭한 문장

  2. Enkoodabooaoo

    그렇지 않은 것은 모두 간단합니다

  3. Shawe

    글쎄, 사실, 당신이 쓴 많은 것들이 그다지 좋아하지 않습니다 ... 글쎄, 좋아요, 그것은 중요하지 않습니다.

  4. Rodes

    개입하여 죄송합니다. 그는 다른 솔루션을 제안하고 싶습니다.

  5. Devine

    더 잘 쓸 수 있었다



메시지 쓰기