정보

하나의 단백질을 인코딩하는 다중 전사체

하나의 단백질을 인코딩하는 다중 전사체



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

DNA가 단백질로 바뀌는 과정을 더 잘 이해하려고 합니다.

따라서 유전자가 있을 때 5'에서 3' 말단으로 읽혀지고 엑손만 mRNA로 번역됩니다. 단일 유전자는 여러 엑손을 가질 수 있으며 대체 스플라이싱을 사용하여 다른 전사체를 생성할 수 있습니다. 전사체는 아미노산으로 번역되는 mRNA(반드시 맞을 필요는 없습니까? 다른 종류의 RNA도 포함합니까?)를 생성할 수 있습니다. 마지막으로 기능성 단백질로 접힙니다.

여기서 내 질문은 동일한 단백질을 인코딩하는 다른 전사체(예: 다른 유전자)가 있습니까?


하나의 단백질을 인코딩하는 다중 전사체 - 생물학

이 섹션이 끝나면 다음을 수행할 수 있습니다.

  • 원핵생물 전사의 여러 단계 나열
  • 원핵생물 전사에서 프로모터의 역할 토론
  • 전사가 종료되는 방법과 시기를 설명합니다.

박테리아와 고세균을 포함하는 원핵생물은 정의상 막 결합 핵과 기타 소기관이 없는 대부분 단세포 유기체입니다. 박테리아 염색체는 진핵생물 염색체와 달리 히스톤 단백질 주위에 조직화되지 않은 닫힌 원입니다. 원핵생물의 DNA가 있는 세포의 중앙 영역을 핵양체 영역이라고 합니다. 또한, 원핵생물에는 종종 하나 또는 몇 개의 유전자만 포함할 수 있는 더 짧은 원형 DNA 분자인 플라스미드가 풍부합니다. 플라스미드는 세포 분열 동안 세균 염색체와 독립적으로 전달될 수 있으며 종종 항생제 내성과 관련된 특성과 같은 특성을 가지고 있습니다.

원핵생물(및 진핵생물)의 전사는 mRNA 합성 영역에서 부분적으로 풀리기 위해 DNA 이중 나선이 필요합니다. 풀리는 영역을 전사 거품이라고 합니다. 전사는 항상 각 유전자에 대해 동일한 DNA 가닥에서 진행되며, 이를 주형 가닥이라고 합니다. mRNA 산물은 주형 가닥에 상보적이며 비주형 가닥 또는 코딩 가닥이라고 하는 다른 DNA 가닥과 거의 동일합니다. 유일한 뉴클레오티드 차이점은 mRNA에서 모든 T 뉴클레오티드가 U 뉴클레오티드로 대체된다는 것입니다((그림)). RNA 이중 나선에서 A는 DNA 이중 나선에서 A-T 짝짓기에서와 같이 두 개의 수소 결합을 통해 U에 결합할 수 있습니다.

그림 1. 메신저 RNA는 DNA의 코딩 가닥에 있는 단백질 코딩 정보의 사본으로, 코딩 서열에서 RNA의 U가 T로 치환됩니다. 그러나 새로운 RNA 뉴클레오타이드는 주형 가닥의 뉴클레오타이드와 염기쌍을 형성합니다. RNA는 효소 RNA 중합효소를 사용하여 5′-3′ 방향으로 합성됩니다. 템플릿을 읽을 때 DNA는 중합효소보다 먼저 풀린 다음 뒤로 되감습니다.

첫 번째 5′ mRNA 뉴클레오티드가 전사되는 부위에 해당하는 DNA 이중 나선의 뉴클레오티드 쌍을 +1 부위 또는 개시 부위라고 합니다. 개시 부위에 선행하는 뉴클레오티드는 "-"로 표시되며 다음과 같이 지정됩니다. 업스트림 뉴클레오티드. 반대로, 개시 부위 다음에 오는 뉴클레오티드는 "+" 번호로 표시되며 다운스트림 뉴클레오티드.

원핵생물에서 전사 개시

원핵생물은 막으로 둘러싸인 핵이 없습니다. 따라서 전사, 번역 및 mRNA 분해 과정이 모두 동시에 발생할 수 있습니다. 박테리아 단백질의 세포 내 수준은 동일한 DNA 주형에서 동시에 발생하는 여러 전사 및 번역 이벤트에 의해 빠르게 증폭될 수 있습니다. 원핵생물 게놈은 매우 조밀하고 원핵생물 전사체는 종종 하나 이상의 유전자 또는 시스트론(단일 단백질에 대한 코딩 서열)을 포함합니다. 그런 다음 폴리시스트론 mRNA는 번역되어 한 종류 이상의 단백질을 생성합니다.

여기에서 우리의 논의는 이 과정을 설명함으로써 전사를 예시할 것입니다. 대장균, 잘 연구된 eubacterial 종. 전사 간에 약간의 차이가 있지만 대장균 고세균에서의 전사, 이해 대장균 전사는 거의 모든 박테리아 종에 적용될 수 있습니다.

원핵생물 RNA 중합효소

원핵생물은 동일한 RNA 중합효소를 사용하여 모든 유전자를 전사합니다. 에 대장균, 중합효소는 5개의 폴리펩타이드 서브유닛으로 구성되며, 그 중 2개는 동일합니다. 이 소단위 중 4개는 다음으로 표시됩니다. α, α, β, 그리고 β‘, 폴리머라제 코어 효소를 포함한다. 이 소단위체는 유전자가 전사될 때마다 조립되고 전사가 완료되면 분해됩니다. 각 소단위는 고유한 역할을 가지고 있습니다. α- DNA에 중합효소를 조립하는 데 필요한 소단위체 β- subunit은 초기 mRNA 분자의 일부가 될 ribonucleoside triphosphate와 결합하고 β‘ 소단위는 DNA 주형 가닥에 결합합니다. 다섯 번째 소단위, σ, 전사 개시에만 관여합니다. 중합효소가 적절한 개시 부위에서 mRNA를 합성하기 시작하도록 전사 특이성을 부여합니다. 없이 σ, 핵심 효소는 무작위 위치에서 전사하고 특정 단백질 횡설수설한 mRNA 분자를 생성합니다. 5개의 모든 소단위로 구성된 중합효소를 완전효소(holoenzyme)라고 합니다.

원핵생물 프로모터

프로모터는 RNA 중합효소를 포함한 전사 기구가 결합하여 전사를 시작하는 DNA 서열입니다. 대부분의 경우 프로모터는 조절하는 유전자의 상류에 존재합니다. 프로모터의 특정 서열은 해당 유전자가 항상 전사되는지, 일부 전사되는지 또는 드물게 전사되는지를 결정하기 때문에 매우 중요합니다. 프로모터는 원핵 생물의 게놈에 따라 다르지만 많은 종에서 몇 가지 요소가 진화적으로 보존됩니다. 개시 지점 상류의 -10 및 -35 영역에는 두 개의 프로모터 컨센서스 서열, 또는 모든 프로모터 및 다양한 박테리아 종에서 유사한 영역((그림)). -10 영역이라고 하는 -10 서열은 공통 서열 TATAAT를 갖는다. -35 서열은 합의 서열 TTGACA를 ​​갖는다. 이러한 합의 시퀀스는 다음으로 인식되고 바인딩됩니다. σ. 이 상호작용이 이루어지면 핵심 효소의 소단위체가 그 부위에 결합합니다. A-T가 풍부한 -10 영역은 DNA 주형의 풀림을 촉진하고 여러 개의 포스포디에스테르 결합이 만들어집니다. 전사 개시 단계는 만들어지고 방출되는 대략 10개의 뉴클레오티드의 중합체인 중단된 전사체의 생산으로 끝납니다.

그림 2. 원핵생물 RNA 중합효소의 σ 소단위는 전사 시작 부위의 상류 프로모터 영역에서 발견되는 공통 서열을 인식한다. σ 소단위체는 전사가 시작된 후 중합효소에서 해리됩니다.

학습 링크

전사의 첫 번째 부분과 TATA 상자의 기본 시퀀스 반복을 보려면 이 MolecularMovies 애니메이션을 보십시오.

원핵생물의 신장과 종결

전사 연장 단계는 σ 중합효소의 소단위체. 해리 σ 코어 효소가 DNA 주형을 따라 진행하여 초당 약 40개 뉴클레오티드의 속도로 5′에서 3′ 방향으로 mRNA를 합성합니다. 신장이 진행됨에 따라 DNA는 핵심 효소 앞에서 지속적으로 풀리고 그 뒤에서 되감습니다. DNA와 RNA 사이의 염기쌍은 mRNA 합성 성분의 안정성을 유지할 만큼 충분히 안정적이지 않습니다. 대신, RNA 중합효소는 연장이 조기에 중단되지 않도록 DNA 주형과 초기 RNA 가닥 사이의 안정적인 링커 역할을 합니다.

원핵생물 종결 신호

일단 유전자가 전사되면, 원핵생물 중합효소는 DNA 주형에서 분리되고 새로 만들어진 mRNA를 유리시키도록 지시해야 합니다. 전사되는 유전자에 따라 두 종류의 종결 신호가 있습니다. 하나는 단백질 기반이고 다른 하나는 RNA 기반입니다. Rho 의존적 종결은 성장하는 mRNA 사슬에서 중합효소 뒤를 따라가는 rho 단백질에 의해 제어됩니다. 유전자의 끝 부분에서 중합효소는 DNA 주형에서 일련의 G 뉴클레오티드를 만나 멈추게 됩니다. 결과적으로 rho 단백질은 중합효소와 충돌합니다. rho와의 상호 작용은 전사 거품에서 mRNA를 방출합니다.

Rho-독립적 종결은 DNA 주형 가닥의 특정 서열에 의해 제어됩니다. 중합효소가 전사되는 유전자의 끝 부분에 가까워지면 C-G 뉴클레오티드가 풍부한 영역을 만난다. mRNA는 스스로 접히고 상보적인 CG 뉴클레오타이드가 서로 결합합니다. 그 결과 A-T 뉴클레오티드가 풍부한 영역을 전사하기 시작하자마자 중합효소가 멈추게 하는 안정적인 헤어핀이 생성됩니다. mRNA 전사체의 상보적인 UA 영역은 주형 DNA와 약한 상호작용만을 형성합니다. 이것은 정지된 중합효소와 결합되어 핵심 효소가 새로운 mRNA 전사체를 분리하고 유리시키기에 충분한 불안정성을 유도합니다.

종료되면 전사 프로세스가 완료됩니다. 종결이 일어날 때쯤이면, 이러한 과정이 동시에 일어날 수 있기 때문에 원핵생물 전사체는 암호화된 단백질의 수많은 사본의 합성을 시작하는 데 이미 사용되었을 것입니다. 이러한 모든 과정이 동일한 5′에서 3′ 방향으로 일어나기 때문에 전사, 번역, 심지어 mRNA 분해까지의 통합이 가능하고 원핵 세포에는 막 구획화가 없기 때문에 가능하다((그림)). 대조적으로, 진핵 세포에서 핵의 존재는 동시 전사 및 번역을 배제합니다.

그림 3. 다수의 중합효소는 단일 박테리아 유전자를 전사할 수 있는 반면 다수의 리보솜은 mRNA 전사체를 폴리펩티드로 동시에 번역합니다. 이러한 방식으로 특정 단백질은 박테리아 세포에서 빠르게 고농도에 도달할 수 있습니다.

학습 링크

원핵생물 전사 과정을 보려면 이 BioStudio 애니메이션을 방문하십시오.

섹션 요약

원핵생물에서 mRNA 합성은 RNA 중합효소를 모집하는 두 개의 공통 서열을 포함하는 DNA 주형의 프로모터 서열에서 시작됩니다. 원핵생물 중합효소는 4개의 단백질 소단위의 핵심 효소와 σ 개시에만 도움이 되는 단백질. Elongation은 초당 40개 뉴클레오티드의 속도로 5′에서 3′ 방향으로 mRNA를 합성합니다. 종결은 mRNA를 해방하고 rho 단백질 상호작용 또는 mRNA 헤어핀의 형성에 의해 발생합니다.

질문 검토

어떤 소단위 대장균 중합효소는 전사에 특이성을 부여합니까?


칠성 성선 자극 호르몬 방출 호르몬-I 전구체를 인코딩하는 다중 전사체

칠성 칠성새 프리프로-성선 자극 호르몬 방출 호르몬-I(칠성장어 GnRH-I)를 암호화하는 cDNA가 분리되어 바다 칠성새인 페트로미존 마리누스(Agnathan)에서 시퀀싱되었습니다. 칠성장어 GnRH-I 전구체는 척추동물의 고대 혈통에서 처음으로 확인되었으며 다른 척추동물 GnRH 전구체와 동일한 전체 세 부분으로 구성된 구조를 가지고 있습니다. 칠성장어 GnRH-I의 아미노산 서열과 처리 부위(Gly-Lys-Arg)는 5억 년의 진화 동안 고도로 보존되어 있으며 네발동물 및 경골 GnRH 전구체의 아미노산 서열과 비교하여 60-70% 동일합니다. 대조적으로, GnRH 관련 펩티드 영역은 확인된 모든 척추동물 전구체와 비교하여 20% 미만의 동일성으로 현저하게 분기됩니다. 일반적으로 1개 및 단일 경우 2개의 전사체를 갖는 다른 모든 알려진 척추동물 GnRH 전구체와 달리 3개의 별개의 전사체가 칠성에서 분리되고 시퀀싱되었습니다. GAP49, GAP50 및 GAP58로 명명된 칠성 GnRH-I 전사체는 GAP 코딩 서열의 길이가 다르며 단일 유전자의 산물인 것으로 입증되었습니다. 칠성장어 GnRH-I 유전자 인트론-2 스플라이스 접합부의 분석은 교대 스플라이싱이 다른 칠성장어 GnRH-I 전사체를 생성한다는 것을 보여주었습니다. Lamprey GnRH-I는 조상 유전자 조절 메커니즘을 반영할 수 있는 다중 전사체를 생성하기 위해 스플라이스 서열 변이체를 활용하는 것으로 입증된 최초의 GnRH 유전자입니다.


논의

본 연구에서 우리는 마우스에 대한 자세한 분석을 수행했습니다. Tln2 400kb 이상에 걸쳐 있음을 보여주었습니다. 이것은 첫 번째 코딩 엑손의 236kb 상류에 위치한 CpG 섬과 관련된 새로운 프로모터의 존재로 인해 이전에 보고된 것보다 훨씬 큽니다. 이 프로모터는 Tln2 다수의 5′-엑손을 포함하는 mRNA는 ∼ 200kb에 흩어져 있으며, 그 중 어느 것도 나머지와 프레임 내 ORF를 생성하지 않습니다. Tln2 코딩 시퀀스. 우리는 그것들이 5′-UTR 엑손이라고 결론지었습니다. 이러한 번역되지 않은 엑손은 대체 스플라이싱의 대상이 되며, 이는 아마도 여러 개의 큰 Tln2 전사체는 노던 블롯에서 검출될 수 있습니다[12,24]. 마우스 5′-UTR에서 파생된 가장 작은 RT-PCR 앰플리콘은 엑손 𢄧, 𢄥 및 𢄢로 구성됩니다. 이것이 전장 단백질을 암호화하는 서열에 연결될 때, 9.2kb 전사체를 생성하는 반면, Tln2 인증된 모든 5′-UTR 엑손(𢄧, 𢄥, 𢄢 및 0)을 포함하는 성적표의 길이는 약 10kb입니다. 이들은 노던 블롯에서 검출된 9.5kb 및 10kb 전사체와 크기가 유사합니다[12,24]. 그러나 우리는 5′-UTR 엑손의 대체 스플라이싱의 전체 범위를 아직 결정하지 못했습니다. 성체 마우스 조직에서 엑손 𢄤 및 𢄡을 포함하는 전사체를 검출하지 못하는 것은(그림 S1) 이들의 포함이 조직 특이적 및/또는 발달적으로 조절됨을 시사합니다. 에 포함된 적이 있는지에 대한 의문도 제기한다. Tln2 CpG 섬에서 시작되는 성적표. 흥미롭게도, 엑손 𢄤 및 𢄡은 각각 마우스 배반포 및 13일 된 배아 심장에서 유래된 EST에서 가장 많은 5′ 서열이며(그림 1A), 이는 주변에 대체 전사 시작 부위가 있을 수 있음을 시사합니다. 엑손 𢄤 및 𢄡.

인간에 대하여 TLN2, 이전 연구에서는 전사가 첫 번째 코딩 엑손의 첫 번째 염기에서 시작된다고 가정했습니다[25]. 그러나 우리는 마우스에서 관찰된 5′-UTR 엑손 중 일부가 인간 TLN2, 그리고 그 큰 TLN2 전사체는 인간 조직에 존재합니다. 또한, RT-PCR과 인간 섬유아세포 및 심장 mRNA를 사용하여 엑손 𢄧을 엑손 1에 연결하는 새로운 5′-UTR 엑손을 추가로 감지했습니다. 따라서 인간의 5′-UTR TLN2 모든 5′-UTR 엑손이 인간과 마우스 사이에서 보존되지는 않지만 유사하게 복잡합니다(그림 S2). 이러한 복잡한 교대로 접합된 5′-UTR의 역할은 불분명하지만 종 간의 보존은 중요한 기능적 역할을 암시합니다. 예를 들어, 본질적으로 또는 세포 신호에 반응하여 서로 다른 수준에서 해당 전사체의 안정성을 조절할 수 있습니다[38,39].

마우스 데이터는 주요 Tln2 프로모터는 이들 5′-UTR 엑손의 상류에 있는 CpG 섬과 연관되어 있으며, 이는 모든 포유동물에서 보존되어 있습니다. NS 인 실리코 이 프로모터의 특성화는 폴리머라제 II 프로모터가 일반적으로 프로모터의 특이성을 정의하는 공간적 조직(프레임워크)이 있는 다중 TF-결합 부위를 포함한다는 근거를 기반으로 합니다[28,29]. 이 엄격한 접근 방식을 사용하여 포유동물에서 보존되고 유비쿼터스적으로 발현되는 TF 핵 호흡 인자 1, E2F, cAMP 반응성 요소 결합 단백질 및 ETS-1에 대한 결합 부위의 공통 프레임워크를 포함하는 최소 코어 프로모터를 확인했습니다. 그러나 위의 TF 중 ETS-1만이 이전에 메탈로프로테아제의 전사 조절을 통해 세포 접착과 관련이 있었습니다[40]. 분명히, 규제에서 이러한 TF의 역할을 확인하려면 추가 실험 작업이 필요합니다. Tln2 표현. 흥미롭게도 인간의 경우 보존된 최소 프로모터로 정의한 영역이 유일한 TLN2 프로모터의 특징적인 염색질 특징을 지닌 서열[41](그림 S4).

원위 CpG 영역에 주요 성분이 포함되어 있다는 직접적인 실험적 증거 Tln2 프로모터는 인트론 𢄣에 유전자 트랩이 삽입된 쥐를 대상으로 한 연구에서 비롯됩니다. 결과는 성체 조직에서 발현되는 대부분의 탈린 2가 엑손 𢄣의 상류를 개시하는 전사체로부터 유래된다는 것을 입증한다. 그러나 유전자 트랩 삽입은 talin 2 발현을 완전히 제거하는 데 실패했으며 잔류 talin 2의 수준은 조직마다 다양했습니다. 이것은 유전자 트랩 주변의 스플라이싱 때문일 수 있으며, 효율성은 조직마다 다를 수 있거나 삽입 후 조직 특이적 프로모터의 존재에 따라 달라질 수 있습니다. 실제로, 인간의 근육 특이적 프로모터의 존재 TLN2 저자는 개별 TF 결합 부위만 확인했지만 엑손 1의 ATG 바로 상류가 보고되었습니다[25]. 인 실리코 보존된 클러스터보다는 이 프로모터가 진짜라면, 우리의 데이터는 이것이 골격근에 사용되는 유일한 프로모터가 아니라는 것을 분명히 보여줍니다(그림 1B, ​, 4D 4D 및 S2B).

다음 단계의 복잡성은 추가 요소의 존재에 있습니다. Tln2 쇼트를 일으키는 발기인 Tln2 특정 조직의 전사체, 그 증거는 원래 고환과 신장의 북부 반점을 기반으로 했습니다[12]. 우리는 두 개의 짧은 Tln2 성인 고환으로 제한되고 첫 번째 코딩 엑손(엑손 25c)의 대체 스플라이싱으로 인해 5′-말단에서 다른 성적표. 이것은 전장 talin 2의 잔기 1121� 및 1153�에 걸쳐 있는 2개의 짧은 talin 2 isoforms의 발현을 초래해야 하며, 주목할만한 차이점은 전자가 엑손에 의해 암호화된 독특한 30개 아미노산 N-말단 확장을 포함한다는 점입니다. 25c(도 2 및 ​ 및 6). 6). 우리는 고환에서 우세한 talin 2 isoform이 150kDa의 분자량을 가지며 그 발현이 생쥐의 사춘기 발병과 관련이 있음을 웨스턴 블롯팅으로 확인했습니다. 또한, 고환 특이적 전사 시작 부위(인트론 28, 도 2 참조)의 하류에 유전자 트랩의 삽입에 의해 생성된 β-갈락토시다제–talin 2 리포터의 분석은 사춘기에서 Ts-talin 2의 상향 조절이 상관관계가 있음을 보여주었다. 초기 연장 정자의 세포질과 핵이 제거된 소포에서 강력하고 국부적인 X-gal 염색의 출현으로 잔류/세포질체를 연상시킨다[37]. 따라서 우리는 Ts-talin 2가 정소 상피를 통한 정자 신장 및/또는 이동의 조절에서 핵심적인 역할을 할 수 있다고 제안합니다. 이러한 과정은 늘어나는 정자와 주변 세르톨리 세포의 정점 외질 분화(ES) 사이의 세포 접촉을 포함하는 것으로 생각됩니다. 다양한 라미닌 이소폼, 인테그린, 이종이량체, F-액틴 및 기타 세포골격 및 신호전달 분자가 정자의 양쪽에 연루되어 있지만 흥미롭게도 세포외 라미닌과 세포질 사이의 링커 단백질 길쭉한 정자는 현재 알려져 있지 않습니다 [42,43]. Ts-talin 2가 정자 형성에 중요하다면 인트론 28의 유전자 트랩 삽입에 대해 동형 접합체인 마우스에서 정자 형성에 결함이 있음을 예측할 수 있으며, 이는 Ts-talin 2 수준의 극적인 감소를 초래합니다. 생존 가능하고 비옥하다 [24]. 삽입 부위에 대한 정량적 RT-PCR과 웨스턴 블롯을 주의 깊게 조사한 결과, 유전자 트랩의 하류에서 전사가 여전히 발생하고 Ts-talin 2의 낮은 수준이 이 마우스의 고환에 여전히 존재함을 보여줍니다(데이터는 표시되지 않음 ). 따라서 유전자 트랩은 null 대립유전자라기 보다는 hypomorphic일 수 있으며 이러한 마우스의 표현형에 대한 보다 철저한 조사가 필요합니다.

두 번째 짧은 Tln2 여기에서 확인된 전사체는 고유한 5′ 비암호화 엑손(34b)을 포함하며 주로 신장에서 발견되지만 독점적인 것은 아닙니다. Western blotting을 사용하여 해당 90kDa 단백질이 신장에서 발현됨을 확인했지만 배아 또는 성인 신장 상피 세포주(NRK, HEK-293, Cos-7 데이터는 표시되지 않음) 또는 다른 조직에서는 검출되지 않았습니다. . 그러나 다른 조직에서 해당하는 짧은 전사체의 발현은 단백질(들)이 낮은 수준으로, 아마도 세포의 하위 집합에 존재할 수 있음을 시사합니다. 단백질은 잔기 1608�에 걸쳐 있을 것으로 예상되며, 따라서 전장 탈린 2의 N-말단 영역이 결여되어 있다(도 6).

최근 연구에 따르면 talin 1의 N-말단 FERM 도메인은 integrin 활성화 [44,45]와 세포질 talin 1을 자가 억제된 형태로 유지하는 것으로 생각되는 분자 내 헤드 상호 작용 모두에서 중요합니다. 결합 사이트는 마스크됩니다[46](BT Goult, N. Bate, NJ Anthis, KL Wegener, AR Gingras, B. Patel, IL Barsukov, ID Campbell, GCK Roberts & DR Critchley, 미공개 결과). 분명히, 이러한 조절 기능은 고환과 신장 짧은 탈린 2 동형 모두에서 손실되었으며, 고환에서는 ES 접합부의 독특한 구조와 분자 구성을 고려할 때 필요하지 않을 수 있습니다[42,43]. 그러나 두 아이소폼 모두 막대에 두 번째 인테그린 결합 부위와 고도로 보존된 C-말단 액틴 결합 부위 및 여러 빈쿨린 결합 부위를 포함하므로(그림 6), 따라서 여전히 인테그린을 액틴 세포골격.

최근 마이크로RNA의 존재에 대한 증거가 밝혀졌습니다. 미르-190, 마우스의 인트론 51 내 감각 방향 Tln2 (앙상블, 게놈 방출 50, 유전자 ENSMUSG00000076379, 좌표 염색체 9: 67 084 458� 084 542). 미르-190 순서와 위치 모두에서 고도로 보존됩니다. 탈린 2 지금까지 분석된 모든 척추동물에서. 그것은 또한 존재하고 독특한 것에서 표현됩니다. 탈린 곤충의 유전자 (12 초파리 종 [47] 및 꿀벌, 아피스 멜리페라 [48]), 따라서 조상 사이의 관계를 확인 탈린 유전자와 탈린 2 [13]. 하지만, 미르-190 에 부재하다 Caenorhabditis elegans 게놈, 그것을 나타내는 미르-190 절지동물 혈통에 처음 나타났고 척색동물 전체에 걸쳐 유지되었습니다. 재미있게, 미르-190 마우스 고환과 신장에서 발현된다[49,50]. 여기서 두 가지 Tln2 짧은 전사체는 다양한 인간 세포주에서 뿐만 아니라[50] 고도로 발현되며, 원발성 골수섬유증 환자[51]에서 상향 조절됩니다. 같이 미르-190, 많은 인트론 마이크로RNA[52]와 같이 더 큰 일차 전사체의 일부로 전사되기 때문에 짧은 기능 중 하나가 Tln2 성적표는 생산하는 것입니다 미르-190. 흥미롭게도 36개 중에서 미르-190 적어도 2개의 다른 예측 알고리즘에 공통적이고 포유동물에 보존된 표적 유전자[51], 12는 세포 접착 또는 관련 과정에 관여하는 유전자입니다. ARP 2/3 컴플렉스의 구성원(ACTR3 그리고 ARPC5), 카데린(CDH2, PCDH9), 미오신 VA(MYO5A), 디스트로글리칸 및 어트랙틴 전구체(DAG1 그리고 ATRN), 뉴로파신(NFASC), 히알루로난 합성효소(HAS2), 그리고 KRAS2. 분명히, 의 기원을 확립하는 것이 중요할 것입니다. 미르-190 전사체 및 이들의 발현 프로파일, 표적 및 기능.

짧은 talin isoforms 외에도 우리는 4개의 대안적으로 접합된 것을 확인했습니다. 탈린 2 성적표. 엑손 43은 하나의 변이체에서 건너뛰고, 탈린 1 및 탈린 2 서열의 비교(74% 동일성)는 이것이 탈린 1 막대의 나선 45 및 나선 46에 해당하는 잔기 1912�을 삭제한다는 것을 보여줍니다(단백질 데이터 은행 ID: 2b0h). Helix 46은 talin[10]에 있는 수많은 vinculin 결합 부위(VBS3 그림 6) 중 하나를 포함하며, 이 부위의 삭제는 이 부위를 파괴할 것으로 예측됩니다. 불행히도, 분자량(5.46kDa)의 차이로 인해 전체 길이의 talin 2에서 분리할 수 없기 때문에 Western blotting으로 해당 단백질을 검출할 수 없었습니다. 탈린 2 뇌에서 발현되고 다른 조직에서는 낮은 수준으로 발현되는 전사체. 마우스와 인간 사이에 완전히 보존된 엑손 54b에 의해 암호화된 추가 15개 아미노산[13]은 탈린 막대의 나선 61의 N-말단 영역에 삽입됩니다. talin 1에서 이 나선은 C-말단 액틴 결합 부위를 형성하는 5개 나선 번들의 일부이며[53], 따라서 삽입은 중요한 기능적 의미를 가질 수 있습니다(그림 6). 분명히, 해당 단백질이 실제로 뇌에서 발현되는지 여부를 확인하려면 추가 아미노산 서열에 대한 항체가 필요합니다.

요약하면, 우리의 결과는 포유류의 복잡성을 보여줍니다. 탈린 2 유전자는 조직 특이적 방식으로 발현되는 적어도 3가지 다른 단백질 동형의 존재에 대한 직접적인 증거를 제공합니다. 더욱이, 4개의 대체 접합 이벤트의 발생은 talin 2 isoforms의 수가 실제로 훨씬 더 많을 가능성을 높입니다. 따라서, 우리는 현재 3개의 짧은 단백질 이소형 외에 6개의 talin 2 변이체의 존재를 예측합니다(그림 6). 이는 면역국소화 및 생화학적 연구를 위해 가능한 경우 이소형 특이적 talin 2 항체를 사용해야 할 필요성을 강조합니다. 결과는 또한 talin 2의 표현과 기능을 정의하기 위한 실험의 설계와 해석에 중요한 의미를 갖습니다. 첫째, 여러 가지가 있기 때문에 Tln2 프로모터, 리포터로 유전자 트랩 사용 Tln2 표현 패턴은 신중하게 고려해야 합니다. 둘째, 사실 Tln2 유전자 트랩이 탈린 2 발현을 제거하지 못함은 엑손 건너뛰기가 설계에 문제를 일으킬 수 있음을 나타냅니다 Tln2 돌연변이 대립유전자. 셋째, 엑손 25b 또는 엑손 34b의 다운스트림에 있는 작은 간섭 RNA의 사용은 talin 2의 전장 및 더 짧은 변이체 모두의 발현에 영향을 미치므로 피해야 합니다. 대신 전사체 특이적 엑손(예: 25b, 25c 또는 34b) 및/또는 프로모터가 바람직할 수 있습니다. 넷째, microRNA의 존재 미르-190 3′ 지역 내 Tln2/TLN2 유전자는 그 기능에 대해 의문을 제기합니다. Tln2 전사체, 그리고 그들이 인코딩하는 단백질 이소폼(isoform)이 포함되며, 녹아웃 전략 설계 시에도 고려해야 합니다.


감사의 말

연구 전반에 걸쳐 유용한 의견과 제안을 해주신 Saghatelian 연구소와 RNase I 소화 조건에 대한 조언을 해주신 N. Ingolia에 감사드립니다. 우리는 또한 RNA-seq 라이브러리의 준비와 Ribo-seq 및 RNA-seq 라이브러리의 고처리량 시퀀싱을 위해 M. Ku, N. Hah 및 Salk Institute Next Generation Sequencing Core에 감사드립니다. 이 연구는 NIH/NIGMS(R01 GM102491, AS), Leona M. 및 Harry B. Helmsley 자선 신탁 보조금(AS), Dr Frederick Paulsen Chair/Ferring Pharmaceuticals(AS), NIH/NIGMS 박사후 연구원(F32 GM123685, TFM), 의학 연구를 위한 George E. Hewitt 재단(QC) 및 Pioneer Fellowship(DT). 이 작업은 또한 NIH-NCICCSG(P30 014195) 및 Chapman 재단의 자금 지원을 받아 Razavi Newman 통합 유전체학 및 생물정보학 핵심 및 Salk 연구소의 차세대 시퀀싱 핵심 시설에 의해 지원되었습니다.


수천 개의 전사된 코딩 및 비코딩 영역을 스크리닝하면 RNA 중합효소 II 신장 가능성의 서열 결정인자가 밝혀집니다.

유기체의 성장과 발달은 단백질 코딩 유전자로부터 메신저 RNA(mRNA)의 적절한 레퍼토리를 합성하는 RNA 중합효소 II(RNAPII)에 의존합니다. 전체 길이 전사체의 생산적 연장은 mRNA 기능에 필수적이지만, 결합된 RNAPII 분자가 조기에 종결할지 또는 전사적으로 전사할지 여부를 결정하는 것은 제대로 이해되지 않은 채로 남아 있습니다. 특히, RNAPII 합성 RNA 1 전반에 걸친 전사 개시를 위한 일반적인 프로세스에도 불구하고, RNAPII는 상류 안티센스 RNA(uaRNA) 및 인핸서 RNA(eRNA) 2와 같은 비코딩 RNA를 전사할 때 종결에 매우 민감하며, 이는 RNAPII 동안 차이가 발생함을 시사합니다. 연장. 신장 가능성에 대한 전사된 서열의 영향을 조사하기 위해, 우리는 고처리량 시퀀싱(INSERT-seq)을 사용하여 RNA 및 T 번역의 발현에 대한 수천 개의 IN 통합 S 서열의 효과를 스크리닝하는 방법을 개발했습니다. 우리는 특정 서열 모티프보다 uaRNA 및 eRNA에서 더 높은 AT 함량이 이러한 전사체에서 RNAPII 종결 경향의 기초가 된다는 것을 발견했습니다. 또한, 우리는 5' 스플라이스 사이트가 폴리아데닐화 신호가 없는 경우에도 스플라이싱 의존적 및 자율적, 스플라이싱 독립적인 전사 자극을 모두 발휘함을 보여줍니다. 함께, 우리의 결과는 mRNA 및 비코딩 RNA 좌위에서 유전자 출력을 지시하는 전사된 서열의 강력한 역할을 밝히고 이러한 기여를 밝히는 방향으로 INSERT-seq의 힘을 보여줍니다.


진핵생물 전사의 특징

  • 진핵생물의 전사는 핵 내에서 일어나고 mRNA는 번역을 위해 핵에서 세포질로 이동합니다.
  • RNA 중합효소에 의한 RNA 합성의 개시는 전사 시작 부위의 5' 쪽에 프로모터 부위의 존재에 의해 지시됩니다.
  • RNA 중합효소는 DNA 주형의 한 가닥인 안티센스(-) 가닥을 전사합니다.
  • RNA 합성에는 프라이머가 필요하지 않습니다.
  • RNA 합성은 들어오는 리보뉴클레오시드 5-트리포스페이트의 알파-인 원자에서 성장하는 RNA 사슬의 3-OH에 의한 친핵성 공격을 촉매하는 RNA 중합효소와 함께 5' → 3' 방향으로 발생합니다.
  • 진핵생물의 mRNA는 성숙이라고 하는 과정인 1차 RNA 전사체에서 처리됩니다.

RNA에 암호화된 단백질 접힘의 '리듬', 생물학자들이 발견

연구원 Sebastian Pechmann과 Judith Frydman

(Phys.org) - 여러 RNA 서열이 동일한 아미노산을 암호화할 수 있지만, 각각의 "최적성"의 차이로 인해 단백질 번역이 느려지거나 가속화됩니다. 스탠포드 생물학자들은 최적의 코돈과 최적이 아닌 코돈이 특정 단백질 구조와 일관되게 연관되어 있다는 사실을 발견했으며, 이는 그들이 단백질 접힘의 신비한 과정에 영향을 미친다는 것을 암시합니다.

당신의 평균적인 음악적 멜로디는 하나의 기계적인 속도로 따라가지 않습니다. 전체 음표, 4분 음표, 16분 음표 등을 혼합하여 특정하고 복잡한 리듬을 배치합니다.

단백질 합성도 같은 방식으로 작동하는 것 같습니다.

사건의 순서는 우아합니다. 리보솜이 mRNA 서열을 특정 tRNA 분자와 일치시킬 때 단백질이 조립됩니다. 그 tRNA는 사슬에서 함께 연결되어 특정 단백질을 형성하는 특정 아미노산을 운반합니다.

그러나 여러 RNA 서열은 동일한 아미노산을 암호화할 수 있습니다. 일부는 빠르게 번역되고 일부는 느리게 번역됩니다. 그것들은 모두 동일한 구성을 가진 단백질을 생성하지만, mRNA 서열의 선택은 단백질이 만들어지는 속도를 극적으로 변화시킬 수 있습니다.

스탠포드 생물학 교수인 Judith Frydman과 연구원 Sebastian Pechmann의 연구는 이제 이 단백질 합성 "리듬"이 리보솜에서 나오는 새로운 단백질 사슬의 접힘을 제어하기 위해 진화적으로 조정될 수 있음을 밝혔습니다.

이 발견은 RNA 서열이 단백질의 최종 접힌 형태를 정의하는 방법을 설명할 수 있습니다. 이는 단백질이 기능하기 위해 접혀야 하기 때문에 분자 생물학의 근본적인 문제입니다.

Frydman Lab의 박사후 연구원인 Pechmann은 "약 50년 동안 시퀀스와 최종 구조 사이에 개념적 차이가 있었습니다. "현재 해독할 수 있는 것보다 시퀀스에 훨씬 더 많은 정보가 있다는 느낌이 들었습니다."

지난달 인쇄에 앞서 온라인 게재 자연 구조 및 분자 생물학, 논문은 10개의 밀접하게 관련된 효모 종을 모델로 분석합니다. 빠른("최적") 및 느린("비최적") 코돈은 모두 진화적으로 보존되어 mRNA 전사체의 특정 부분에 일관되게 나타나며, 여기에서 전략적으로 번역을 늦추거나 가속화하는 것으로 보입니다.

Frydman은 "그들이 하는 일은 단백질 접힘을 위한 조정을 설정하는 것입니다."라고 말했습니다.

tRNA 분자는 리보솜에 의해 작용할 때까지 세포에서 자유롭게 떠다니는 클로버잎 모양의 RNA 꼬임입니다. 클로버의 줄기는 아미노산에 연결되어 있는 반면, 잎의 중간엽은 해당 아미노산에 해당하는 3-뉴클레오티드 mRNA 서열 또는 코돈을 인식합니다.

이 유전자 코드는 부분적으로 중복됩니다. 일부 아미노산은 최대 6개의 서로 다른 코돈에 의해 암호화됩니다. 그러나 이러한 서열은 동일한 아미노산을 지정하지만 모두 동등하게 이용 가능한 것은 아닙니다.

Almost all amino acids can be specified by either a fast, available tRNA molecule or a slow, rare one, giving the cell the option of using RNA sequence to regulate translation speed.

"An idea has been around for years that this could define the rhythm of the translation process," said Frydman. "The step of adding an amino acid is very, very important, and if the ribosome makes mistakes or if the protein doesn't fold correctly, the effort expended in making the protein becomes useless."

Taking into account both the supply of and demand for each tRNA, Frydman and Pechmann ranked the codons according to their availability and examined where they appeared in the mRNA transcripts of 10 related yeast species. This approach allowed them to look for evolutionarily conserved patterns – as Frydman put it, "using evolution to sort out the noise from the biological signal."

The researchers found that non-optimal codons tended to appear in regions where slower protein synthesis could directly facilitate folding even while the protein was still incomplete.

Clusters of non-optimal codons correspond to specific kinds of protein structures known to fold during translation, such as "a-helices" – right-handed spirals – and loops.

In contrast, optimal codons are translated faster, but also more accurately. They tend to code for protein regions where translational errors would put the protein at an especially severe risk of aggregation – a situation in which large numbers of misfolded proteins clump together.

Such aggregates have been implicated in diseases like Alzheimer's and Huntington's. The researchers speculate that the judicious placement of optimal codons in these aggregation-prone stretches would ensure a high degree of accuracy and a lowered chance of potentially disastrous misfolding.

These findings barely scratch the surface of how codon choice may affect folding. The researchers point out that the cell might even be able to fold, or unfold, a protein into different states simply by modulating tRNA availability. This would adjust the relative optimality of the tRNAs' corresponding codons, potentially altering the rhythm of synthesis.

Designers of new proteins may take note as well. Bioengineers often find that their creations misfold, even when their amino acid sequences match natural structures exactly.

"The commonly used strategy to select optimal codons when making synthetic genes often fails," Pechmann said. "A rational understanding of codon sequence optimization will be fundamental for biotechnological applications… We here clearly demonstrate why you need the non-optimal codons to keep this rhythm intact."


Discrimination of Non-Protein-Coding Transcripts from Protein-Coding mRNA

Several recent studies indicate that mammals and other organisms produce large numbers of RNA transcripts that do not correspond to known genes. It has been suggested that these transcripts do not encode proteins, but may instead function as RNAs. However, discrimination of coding and noncoding transcripts is not straightforward, and different laboratories have used different methods, whose ability to perform this discrimination is unclear. In this study, we examine ten bioinformatic methods that assess protein-coding potential and compare their ability and congruency in the discrimination of noncoding from coding sequences, based on four underlying principles: open reading frame size, sequence similarity to known proteins or protein domains, statistical models of protein-coding sequence, and synonymous versus nonsynonymous substitution rates. Despite these different approaches, the methods show broad concordance, suggesting that coding and noncoding transcripts can, in general, be reliably discriminated, and that many of the recently discovered extra-genic transcripts are indeed noncoding. Comparison of the methods indicates reasons for unreliable predictions, and approaches to increase confidence further. Conversely and surprisingly, our analyses also provide evidence that as much as

10% of entries in the manually curated protein database Swiss-Prot are erroneous translations of actually noncoding transcripts.


Genes: Concept, Definition, Size and Types (With Diagram)

Let us make an in-depth study of the genes. 이 기사를 읽고 나면 다음에 대해 배울 것입니다. 1. Modern Concept of Gene 2. Molecular Definition of a Gene 3. Number of Genes on a Single Chromosome 4. Size of a Gene 5. Fine Structure of a Gene 6. Types of Genes and 7. Open Reading Frame.

The genetic blueprint contained in the nucleotide sequence can determine the phenotype of an individual. The hereditary units, which are transmitted from one generation to the next generation are called genes. A gene is a fundamental biological unit like atom which is the fundamental physical unit.

Mendel was the first scientist who proposed genes as particulate units and called them hereditary elements or factors. But the concept of gene has undergone a considerable change since Mendel’s time.

Modern Concept of Gene:

A gene can be described as a polynucleotide chain, which is a segment of DNA. It is a functional unit controlling a particular trait such as eye colour.

Beadle and Tatum concluded by various experiments that gene is a segment of DNA that codes for one enzyme. They proposed one gene-one enzyme hypothesis. But as some genes code for proteins that are not enzymes, the definition of gene was changed to one gene-one protein hypothesis.

Protein Hypothesis:

The concept of gene has undergone further changes as the new facts came to light. Since proteins are polypeptide chains of amino acids translated by mRNA, gene was defined as one gene-one polypeptide relationship.

Some proteins have two or more different kinds of polypeptide chains, each with a different amino acid sequence. They are products of different genes. For example, haemoglobin has two kinds of chains a andβ chains, which differ in amino acid sequence and length. They are encoded by different genes. Thus, gene is defined as one gene-one polypeptide relationship.

Structural and Regulatory Genes:

Even the one gene-one polypeptide definition is not complete as it does not include gene which codes for rRNA and tRNA. Only mRNA is translated into proteins. Therefore genes which code for polypeptides and RNAs are called structural genes.

In addition to structural genes, DNA also contains some sequences that have only regulatory function. These regulatory genes constitute signals, which “turn on” and “turn off” the transcription of structural genes and perform various other regulatory functions. In this way the definition of gene includes structural genes as well as regulatory genes.

Benzer coined terms for the gene, they are Cistron which is the unit of function, Recon which is the unit of recombination and Muton which is the unit of mutation.

Molecular Definition of a Gene:

According to Lodish and others, gene is defined as the entire nucleic acid sequence that is necessary for the synthesis of a functional gene product, which may be polypeptide or any type of RNA. In addition to structural genes (coding genes) it also includes all the control sequences and non-coding introns.

Most prokaryotic genes transcribe polycistronic mRNA and most eukaryotic genes transcribe monocistronic mRNA.

Number of Genes on a Single Chromosome:

Total number of genes on a single chromosome is different in different organisms. Bacteriophage virus R17 consists of only three genes, SV40 consists of 5-10 genes. E. coli bacteria have more than 3000 genes on single 1 mm long chromosome.

Size of a Gene:

In E. coli there are more than four million pairs of nucleotides (4638858 base pairs). It has been estimated that there are about 3000 genes in E. coli.

The minimum size of a gene that encodes a protein can be directly estimated, Each amino acid of a polypeptide chain is encoded by a sequence of three consecutive nucleotides in a single strand of DNA. Therefore by measuring the size of the polypeptide chain, the size of a gene can be directly measured.

The average polypeptide chain has about 450 amino acids, which are encoded by 1350 nucleotides. Therefore, in E. coli the number of genes will be around 3000 (4000000/1350 = 3000). Human genome contains about 30000 genes, (Source : International Human genome sequencing consortium led in the United States by National Human Genome Research Institute (NHGRI) have estimated the number of human protein coding genes to be less than 30000. Simple round worm C. elegans has about 20000 genes).

A single copy of chromsome is composed of more than 3 billion base pairs. Coding regions of these genes take up only 3% of the genome.

Fine Structure of a Gene:

A gene is present only in one strand of DNA, which is a double stranded helix. A gene consists of several different regions. The main region is the coding sequence which carries information regarding amino acid sequence of polypeptides. The region on the left side of coding sequence (upstream or minus region) and on the right side (downstream or plus region) consists of fairly fixed regulatory sequences.

Regulatory sequences consist of promoters which are different in prokaryotes and eukaryotes.

Types of Genes:

1. Simple Genes:

Simple genes have a coding sequence of bases in one DNA strand. Upstream the coding region, the promoter is present. Downstream, the termination region is present.

2. Split Genes:

In most of eukaryotes, many non-coding sequences are present between coding sequences. The coding sequences of DNA of the genes are called exons. In between exons are present non-coding sequences called introns. Exons alternate with introns. Normally introns do not possess any genetic information and are not translated. Such genes are called split genes or interrupted genes.

The mRNA transcribed from this DNA is called precursor mRNA (pre-mRNA) and contains exons as well as introns. The introns are removed by excision and discarded. This process is known as splicing. The remaining segments or exons are joined together to form the mature mRNA which takes part in translation. The mature mRNA is much smaller than the pre-mRNA for example α -globn has two introns, ovalbumin has seven introns and α-collagen has 52 introns.

3. Overlapping Genes:

Most genes consist of DNA sequences that code for one protein. But there are some sequences that code for more than one protein. Fredrick Sanger discovered this phenomenon in bacteriophage φ x 174. Overlapping genes are common in many viruses. Here the small length of viral DNA is exploited for synthesizing different proteins.

This is achieved in different ways. In some cases, one gene generates two proteins by having different starting points. Similarly, the same gene generates two proteins by terminating the expression at different points.

In other cases, a sequence of DNA makes no distinction between exons and introns. This sequence of DNA, which uses only exons for expression, also uses adjoining introns at other times for expression. The differential splicing of a single stretch of mRNA leads to overlapping and therefore different proteins. In this way, multiple proteins can be generated from a single stretch of DNA.

4. Jumping Genes or Transposons:

Earlier it was thought that genes are static and have definite and fixed locus. However, recently it has been discovered that segments of DNA can jump to new locations in the same or different chromosome. First of all it was discovered by Barbara Mc Clintock in Indian maize corn. It has cobs with kernels of different colours. The light coloured kernels were caused by segments of DNA that move into genes coding for pigmented kernels, thereby inactivating pigmented kernels.

These mobile genes are called transposable elements or transposons. They can jump within the genome, thus affecting the gene expression. Transposable elements are components of moderately repetitive class of DNA.

A transposon has well defined ends. It consists of a long central portion. On either end each transposon has specific sequence of bases which are inverted repeats or palindromes on opposite strands. These terminal repeats help in identifying transposons. The site where a transposon is inserted is called target site or recipient site.

Transposable elements can lead to change in the expression of genes. They can also cause mutations. In bacteria, they are present on plasmids.

5. Variable Genes:

Certain polypeptides are coded not by one gene but they are coded by more than one gene present on the same or different chromosomes.

Open Reading Frame:

A gene is a segment of genome which is transcribed into RNA. If the RNA is a transcript of a protein coding gene then it is called messenger RNA or mRNA. This is translated into protein. If the RNA is non-coding as ribosomal RNA (rRNA) or transfer RNA (tRNA) it is not translated.

The part of the protein coding gene which is translated into protein is called open reading frame. It has triplet nucleotide codons. Open reading frame starts with an initiation codon and ends with a termination codon. The region of DNA before a gene is called up-ream region denoted with a minus (-) sign while region after the gene is called downstream denoted with a plus (+) sign. Many genes are split between exons and introns. The introns are removed by splicing to produce a functional RNA before translation.


비디오 보기: ესტერები და ცხიმები: მიღება, ჰიდროლიზი, ცხიმების კლასიფიკაცია, შესაპნების რეაქცია (팔월 2022).