정보

7.1: 별개의 특성으로서의 무능력 - 생물학

7.1: 별개의 특성으로서의 무능력 - 생물학


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

분석을 재현하기 위한 R 마크다운

모든 살아있는 종의 도마뱀을 포함하는 분기군인 Squamates는 다양성으로 잘 알려져 있습니다. 인도네시아의 거대한 코모도 드래곤(그림 7.1A, 바라누스 코모도엔시스) 마다가스카르의 작은 잎 카멜레온(그림 7.1B, 브룩시아), squamates는 형태와 생태학적 틈새 사용의 인상적인 범위에 걸쳐 있습니다(Vitt et al. 2003; Pianka et al. 2017). 심지어 뱀(그림 7.1C 및 D)은 그 자체로 매우 다양하며(~3,500종) 실제로는 반토동물 내에 둥지를 틀고 있는 분기군입니다(Streicher and Wiens 2017). 뱀의 조상인 비정상형 혈통은 약 1억 7천만 년 전에 사지가 없었고(Hedges et al. 2006 참조) 머리 모양, 소화관 및 사지가 없는 생활 방식과 관련된 기타 특성에도 일련의 변화를 겪었습니다. 다시 말해, 뱀은 도마뱀입니다. 고도로 변형된 도마뱀이지만 그럼에도 불구하고 도마뱀입니다. 그리고 뱀은 사지가 없는 비늘의 유일한 혈통이 아닙니다. 사실, 정형동물의 혈통은 그들의 역사를 통해 계속해서 팔다리를 잃었으며(예: 그림 7.1E 및 F), 일부 추산에 따르면 비정형동물은 지난 2억 4천만 년 동안 최소한 26번 팔다리를 잃었습니다(Brandley et al. 2008).

그림 7.1. 다리가 있는 사람과 다리가 없는 사람. A. 코모도 드래곤, B. Brookesia 카멜레온, C. 거짓 산호(옥시로푸스 구이베이) 및 D. 뱀의 뱀, E. 피고포디드(pygopodid) - 사지가 없는 도마뱀붙이 및 F. 안귀드, 또 다른 다리가 없는 도마뱀. 사진 제공: A: 사용자: Raul654 / Wikimedia Commons / CC-BY-SA-3.0, B. Brian Gratwicke / CC-BY-2.0, C. 사용자: Gionorossi / Wikimedia Commons / CC-BY-SA-4.0, D. 사용자:Bladerunner8u / Wikimedia Commons / CC-BY-SA-3.0, E. 사용자: Smacdonald / Wikimedia Commons / CC-BY-SA-2.5, F. 사용자:Marek_bydg / Wikimedia Commons / CC-BY-SA-3.0.

팔다리가 없는 것은 별개의 특성의 한 예입니다. 즉, 일련의 고유한 특성 상태 중 하나를 차지할 수 있는 특성입니다. 이산 형질의 진화를 분석하려면 연속 형질에 사용했던 것과는 다른 모델링 접근 방식이 필요합니다. 이 장에서 나는 나무에서 이산 형질의 진화를 모델링하는 일반적인 접근 방식인 Mk 모델(Lewis 2001)에 대해 논의할 것입니다. 이 모델을 비교 데이터에 맞추면 종을 여러 개별 특성 상태 중 하나로 배치할 수 있는 팔다리가 없는 것과 같은 특성의 진화를 이해하는 데 도움이 됩니다.


비교 생물학을 위한 계통 발생 도구

최근 Twitterverse에서 나는 포스터가 다음을 사용하여 설명하는 스레드를 발견했습니다. 레브베이즈 M에 맞게케이 전이 행렬의 동일한 값을 가정하여 동시에 여러 이산 특성으로 모델링합니다(NS) 모든 특성에 대해.

이것은 M을 피팅하기 때문에 일부 특성에 대해 논리적입니다.케이 단일 개별 특성에 대한 모델은 특히 특성이 변경되는 경우 데이터 제한이 있는 경우가 많습니다. 드물게 (따라서 특정 특성에 대한 전환 프로세스에 대한 정보가 거의 남지 않습니다).

예를 들어, 특성에서 특성에 따라 변화 속도가 크게 다를 것으로 예상하는 상황에서는 이것이 의미가 없습니다. 다른 한편으로, 변화가 드물거나 특성의 변화율이 다른 특성에 대해 유사하다고 가정하는 생물학적 이유가 있는 경우, 특히 우리가 추정한 가치 NS 조상 상태 재구성 또는 확률적 매핑과 같은 다른 분석에서. (이에 대한 자세한 내용은 별도의 에피소드에서!)

물론 이것은 수 또한 R에서 완료!

첫째, 그것은 내 사용하여 수행 할 수 있습니다 파이툴즈 이 함수는 (기본적으로) 두 가지 모델에 적합하기 때문에 ratebytree 기능 모두 같은.

그러나 사용자 정의 가능도 함수를 만든 다음 최적화하는 것만으로 적합할 수도 있습니다. 이 옵션이 실행될 것이므로 여기에서 시연하겠습니다. 더 빠르게 multi-rates 모델에도 적합하지 않기 때문에 ratebytree &ndash를 사용하는 것보다

먼저 로드하겠습니다. 파이툴즈 그런 다음 전이 행렬의 상수 값을 사용하여 계통 발생에서 트리 및 20개의 이진 문자를 시뮬레이션합니다. NS 다음과 같이.

독자들은 내가 0과 1의 두 가지 수준으로 이진 특성에 대한 데이터를 시뮬레이션했음을 알 수 있습니다. 여기서 0 &rarr 1의 전환 속도는 2.0이고 1 &rarr 0의 전환 속도는 1.0입니다.

좋습니다. 이제 우도 함수를 만들어 보겠습니다.

이 작업을 수행하는 방법은 파이툴즈 함수 fitMk 하지만 나는 고치다 의 가치 NS 내가 우리의 우도 함수 내에서 미리 지정할 값으로.

우리가 이것을 할 수 있었던 다른 방법이 있습니다. 예를 들어, fitMk 및 fitDiscrete 모두 가이거 패키지는 또한 모델 객체의 일부로 우도 함수를 내보냅니다.

여기에서 우리의 우도 함수가 어떻게 생겼는지 알 수 있습니다. mapply를 사용하려면 추가하다 모든 특성에 대한 로그 가능성, 먼저 특성 데이터 배열( X )을 재구성하고 NS 행렬( Q )을 목록으로 변환합니다. 이론상 이 코드는 하지 않습니다 각 특성에 대해 동일한 문자 코딩이 있어야 함 NS, 행/열 순서가 각 특성의 수준 순서와 일치하는 경우. (또한 각 특성에는 하나 이상의 상태가 있다고 가정합니다. 이 가정을 완화하는 간단한 수정 사항이 될 것입니다.)

이제 우도 함수가 있으므로 R'에 내장된 수치 최적화 루틴 중 하나를 사용하여 이를 최적화할 수 있습니다. 나는 optim &ndash를 사용할 것이지만 시도할 수 있는 다른 것들이 있습니다(예: nlminb ).

Optimize에서는 'box-constrained' 루틴인 "L-BFGS-B" 방법을 사용합니다. 값 NS아이, 제이 (을위한 NS &네 제이) 논리적으로 &ge 0으로 제한되지만 문제를 피하기 위해 하한을 10 -8로 설정합니다. 내 상한을 100으로 설정하지만 이것은 나무의 총 깊이에 따라 조정할 수 있습니다.

데이터를 시뮬레이션하기 위해 NS1,2 2.0이고 NS2,1 1.0이 됩니다. 우리의 추정은 실제로 매우 닫다.

이제 다음과 같이 ratebytree와 비교해보자.

정돈 된. 이것은 또한 우리에게 어떻게 변화 있는 추정된 적합 모델 매개변수 이었을 것입니다 만약 우리가 우리의 M에 맞으면케이 이 20개의 특성 벡터 중 하나를 개별적으로 모델링하십시오!


배경

척추동물의 단백질 진화를 분석한 King과 Wilson의 주요 연구[1]는 형태학적 다양성에 대한 "조절 과정"의 진화적 변화의 중요성을 추측했습니다[2, 3]. 이러한 아이디어는 곧 François Jacob[4]에 의해 확장되었으며, 그는 기존 시스템의 분자 "땜질"이 예를 들어 기능적 이득을 위해 조절 과정이 변형되거나 결합될 수 있는 진화의 특징이라고 제안했습니다. . 이러한 이론은 형태학적 진화와 관련된 조절 과정의 발산에 대한 많은 연구의 기초가 되며, 유전자의 발현 패턴을 결정하는 유전자 조절 네트워크(GRN)의 변화에 ​​광범위하게 초점을 맞춥니다[5, 6]. 이러한 변화는 에 위치한 전사 인자 결합 부위(TFBS) 내의 돌연변이일 수 있습니다. 시스유전자의 조절 요소(프로모터 및 인핸서) 또는 트랜스 규제 기관의 수준 변화로 인한 규제 변화[6]. GRN의 변경은 표현형 발산으로 이어질 수 있으며 [7], 직간접적인 기능 결과에 관계없이 종 간의 이러한 GRN 변화는 GRN "재배선" 이벤트로 정의됩니다. 이것은 하나 이상의 종에 존재하지만 다른 종에는 존재하지 않는 조절 상호작용을 특징으로 하며, 잠재적으로 이종 TF와 표적 유전자 사이의 새로운 상호작용으로 대체됩니다. 단세포 원핵생물에서 적응 및 진화의 기본 메커니즘인 GRN에 대한 여러 비교 연구가 수행되었습니다. 대장균 [8] 및 효모[9, 10], 식물[11], 초파리[12], 극피동물[12, 13]을 포함한 여러 비 척추동물 진핵생물. 인간과 마우스를 포함한 척추동물에 대한 여러 게놈 데이터 세트를 대조하고 통합하려는 노력이 있지만[14], 이러한 데이터만으로 규제 네트워크의 비교 분석은 여전히 ​​주요 계산 과제로 남아 있으며 게놈 전체 규제의 표현형 효과에 대해서는 알려진 바가 거의 없습니다. 모델이 아닌 척추동물의 네트워크 재배선 이벤트 [15].

척추동물에서 지느러미가 있는 물고기는 모든 그룹의 가장 큰 방사선이며 동아프리카 시클리드는 틀림없이 적응 방사선의 가장 구체적인 현대 사례를 나타냅니다. 동아프리카(Tanganyika, Victoria, Malawi)의 큰 호수와 지난 몇 백만 년 동안[16, 17], 시클리드 어류의 하나 또는 몇 개의 조상 계보가 독립적으로 방출되어 집합적으로 1500종이 넘는 종을 생성했습니다. 이 종은 다양한 생태학적 틈새를 차지하며 골격 형태, 치열, 색상 패턴 및 다양한 행동 특성을 포함한 표현형 특성이 극적으로 다릅니다. 우리는 이전에 조절 요소의 급속한 진화와 유전자 발현 발산[18]과 같은 많은 분자 메커니즘이 동아프리카 시클리드 게놈을 형성했으며 이러한 시스템의 "진화적 땜질"[19]이 필요한 기질을 제공했음을 입증했습니다. 다양화[18]. 이것은 시클리드 종의 최근 기원 및 진행 중인 유전자 흐름[20]과 결합되어 진화적 조절 변화가 유전자 발현 및 궁극적으로 표현형 변이를 제어하는 ​​데 중요한 기능적 역할을 한다는 것을 시사합니다. 그러나 시클리드 표현형 다양성의 여러 특성의 기초가 될 수 있는 조절 네트워크의 게놈 전체 진화에 대해서는 알려진 바가 거의 없습니다. 여기에서 우리는 규제 네트워크의 진화를 특성화하고 규제 시스템의 "땜질"이 밀접하게 관련된 시클리드의 표현형 다양성에 기여할 수 있는지 여부에 대한 타당성을 분석하기 위해 새로운 계산 프레임워크를 개발했습니다.


통계적 행동

MuSSCRat 모델에는 관측값의 수에 비해 많은 매개변수가 있습니다. |$mathcal$| 및 |$mathcal$|⁠ . 따라서 이 복잡한 모델이 속도 변동을 얼마나 잘 감지할 수 있는지 또는 속도 변동의 상태 종속 및 배경 소스를 구별할 수 있는지는 불분명합니다. 따라서 우리는 상태 종속 모델의 통계적 행동을 특성화하기 위해 시뮬레이션 연구를 수행했습니다. 특히, 우리는 다음을 이해하기 위해 실험을 수행했습니다. 1) 배경 속도 변동이 없을 때 상태 종속 속도 변동을 감지하는 능력 2) 배경 속도 변동이 있을 때 상태 종속 속도 변동을 감지하는 능력 3) 비용 배경 비율이 실제로 일정할 때 모델에 배경 비율 변동을 포함하는 것, 4) 배경 비율이 실제로 가변적일 때 일정하다고 가정한 결과.

다음 분석을 위해 시뮬레이션된 각 데이터 세트에 대해 두 번의 복제 MCMC 시뮬레이션을 실행하여 조인트 사후 확률 밀도를 근사했습니다. 관절 후방 밀도가 적절하게 근사되었는지 확인하기 위해 MCMC 진단을 수행했습니다. Dryad에서 사용할 수 있는 보충 자료에서 MCMC 시뮬레이션 및 MCMC 진단에 대한 세부 정보를 제공합니다.

성능 측정

빈번한 속성

베이지안 신뢰 구간(CI)에 대한 빈번한 해석은 매개변수의 실제 값이 |$<100(1 - alpha)\%>$| |$<100(1 - alpha)\%>$| 내에 있을 확률 해당 변연 사후 분포의 CI(모델이 참이라고 가정, Huelsenbeck 및 Rannala 2004 참조). 이 해석을 염두에 두고 우리는 |$95\%$| 시뮬레이션된 데이터 세트에 대해 추론된 CI(기존 유의 수준, |$alpha = 0.05$|⁠). 우리는 정의 커버리지 확률 매개변수의 실제 값이 |$95\%$|에 포함되는 빈도로 씨아이, 위양성 비율 |$95\%$|에서 실제 값이 제외되는 빈도로 CI(1에서 적용 확률을 뺀 값) 및 국가 독립 모델이 |$95\%$|에서 제외되는 빈도로 상태 종속 모델이 true인 경우 CI입니다.

정확도 및 편향

시뮬레이션 실험

실험 1: 일정한 배경 비율

다양한 크기의 데이터 세트를 시뮬레이션했습니다(|$>$| 연속 문자), 다양한 트리 크기(|$ 포함)>$| 종) 및 상태 종속 비율 비율, |$>$| (여기서 |$$|는 비율이 이산 형질의 상태에 의존하지 않는 경우에 해당합니다). |$c$|⁠ , |$N$|⁠ , |$$|⁠ 의 각 조합에 대해 다음을 사용하여 일정한 비율의 출생-사망 프로세스에서 100그루의 나무를 시뮬레이션했습니다. R( R Core Team 2017) 패키지 TESS( Höhna et al. 2015)를 사용하여 종분화율이 1이고 멸종률이 0.5인 경우 루트 높이가 1이 되도록 각 나무의 크기를 조정했습니다. 예상되는 전환 수가 5가 되도록 지정된 비율로 대칭 연속 시간 Markov 체인 |$$|⁠ 인 대칭 디리클레 분포. 마지막으로 |$c$| 배경 비율이 1이라고 가정하는 다변량 브라운 모션 모델에서 연속 문자. Dryad에서 사용할 수 있는 보충 자료에서 시뮬레이션 절차에 대한 자세한 내용을 제공합니다.

우리는 실제 계통 발생이 알려져 있다고 가정하고 MuSSCRat 모델에서 RevBayes의 각 시뮬레이션 데이터 세트를 분석했습니다. 배경 비율이 각 계보(즉, 고정 비율 모델)에 대해 동일하도록 모델을 제한하고 표준 편차 매개변수 |$ u$|⁠ 를 모델에서 제외했습니다. 위의 베이지안 추론 섹션에 설명된 사전을 사용하여 시뮬레이션된 데이터에서 나머지 모델 매개변수를 추정했습니다. 생성 모델과 추론 모델 모두 배경 비율 변동을 제외하므로 이 시뮬레이션 시나리오는 모델이 올바르게 지정되었을 때 방법의 성능을 반영합니다.

이 시뮬레이션 실험의 위양성 비율은 |$5.3\%$| (즉, |$zeta^2_1 / zeta^2_0=1$|⁠ 그림 3, 상위 3개 패널의 맨 위 행), 예상된 |$5\%$| (양측 이항 검정 |$ <

eq 0.05>$|⁠ , |$P- < ext 약 0.6>$|⁠ ). 다음으로 연속 문자 진화 속도가 이산 상태( ⁠|$$|⁠ ) 간에 다를 때의 전력을 계산했습니다. 전력 범위는 |$<약 21\%>$| ~으로 |$100\%$| 최악의 시나리오부터 최고의 시나리오까지. 예상대로 전체적으로 연속 캐릭터 및 종족 수가 증가함에 따라 위력이 향상되었으며 평균 위력은 |$80.4\%$| (그림 3, 맨 위 행을 제외한 맨 위 3개의 패널). |$zeta^2_1$|의 사후 평균 추정치 적은 수의 연속 문자에 대해 약간 편향되었습니다( ⁠|$$|⁠ ) 그러나 문자 및 종의 수가 증가함에 따라 신속하게 실제 값으로 수렴되었습니다(그림 4, 패널의 맨 위 행).

|$$| |$95\%$|에서 제외되었습니다. 배경 비율이 일정하거나(패널의 맨 위 행) 가변적인 경우(패널의 맨 아래 행) CI. 각 패널은 주어진 수의 종의 시뮬레이션에 해당합니다. |$$|⁠ . 각 패널 내에서 행은 다른 정도의 상태 종속 비율 변동(|$$|⁠)에 해당하고 열은 서로 다른 연속 문자 수 |$에 해당합니다.$|⁠ . 각 셀은 |$95\%$| |$zeta^2_1 / zeta^2_0 = 1$|⁠ 를 제외하는 CI , 눈금에 따라 색상이 지정됩니다(오른쪽).

|$$| |$95\%$|에서 제외되었습니다. 배경 비율이 일정하거나(패널의 맨 위 행) 가변적인 경우(패널의 맨 아래 행) CI. 각 패널은 주어진 수의 종의 시뮬레이션에 해당합니다. |$$|⁠ . 각 패널 내에서 행은 다른 정도의 상태 종속 비율 변동(|$$|⁠)에 해당하고 열은 서로 다른 연속 문자 수 |$에 해당합니다.$|⁠ . 각 셀은 |$95\%$| |$zeta^2_1 / zeta^2_0 = 1$|⁠ 를 제외하는 CI , 눈금에 따라 색상이 지정됩니다(오른쪽).

|$$| 사후 평균 추정치의 백분율 오차 배경 비율이 일정하거나(패널의 맨 위 행) 가변적일 때(패널의 맨 아래 행). 패널의 각 열은 주어진 수의 종의 시뮬레이션에 해당합니다. |$$|⁠ . 각 패널 내에서 상자 그림은 각 |$c$| 연속 문자(x축을 따라), 실제 상태 종속 비율로 색상 지정, |$zeta^2_1 / zeta^2_0$| (삽입 범례 참조). 상자 그림은 중간을 나타냅니다 |$50\%$| (상자) 및 중간 |$95\%$| (수염) 시뮬레이션.

|$$| 사후 평균 추정치의 백분율 오류 배경 비율이 일정하거나(패널의 맨 위 행) 가변적일 때(패널의 맨 아래 행). 패널의 각 열은 주어진 수의 종의 시뮬레이션에 해당합니다. |$$|⁠ . 각 패널 내에서 상자 그림은 각 |$c$| 연속 문자(x축을 따라), 실제 상태 종속 비율로 색상 지정, |$zeta^2_1 / zeta^2_0$| (삽입 범례 참조). 상자 그림은 중간을 나타냅니다 |$50\%$| (상자) 및 중간 |$95\%$| (수염) 시뮬레이션.

실험 2: 다양한 배경 비율

이 시뮬레이션 시나리오에서는 시뮬레이션된 모든 트리, 이산 문자 기록, 상관 행렬 및 첫 번째 시뮬레이션 실험(일정한 배경 속도 사용)에서 연속 문자 간의 변동 정도를 설명하는 상대 속도 매개변수를 모두 재사용했습니다. 그러나 이 시뮬레이션에서는 평균이 |$인 로그 정규 분포에서 각 계보에 대한 배경 비율 |$eta^2_l$|⁠를 그려서 연속 문자 진화의 계통별 비율을 시뮬레이션했습니다. $| 및 표준 편차 |$< u = H>$|⁠ .

이 시나리오의 경우 |$eta^2_l$| 베이지안 추론 섹션( MuSSCRat + UCLN)에 설명된 대로 분기마다 다릅니다. 다시 말하지만, 이 시뮬레이션 시나리오는 데이터 생성 모델과 추론 모델 모두 계보에 따라 배경 비율이 달라지도록 허용하기 때문에 모델이 올바르게 지정되었을 때 방법의 성능을 반영합니다.

이 실험의 위양성 비율은 |$4.9\%$| (그림 3, 하단 3개 패널의 상단 행), 예상된 |$5\%$| (양측 이항 검정 |$P eq 0.05$|⁠ , |$P- < ext 약 1>$|⁠ ). 검정력은 실험 1의 검정력보다 약간 낮았습니다. 검정력은 |$14.7\%$| 최악의 경우 |$100\%$| 가장 좋은 경우. 평균적으로 전력은 |$73.7\%$| (그림 3, 맨 위 행을 제외한 맨 아래 3개의 패널). 다시 말하지만, |$zeta^2_1$|의 사후 평균 추정치는 적은 수의 연속 문자를 기반으로 한 분석에 대해 약간만 편향되었습니다(그림 4, 패널의 맨 아래 행).

실험 3: 배경 비율 변동 비용

연속 문자 진화의 배경 비율이 일정할 때 추론 모델에 불필요한 매개변수(즉, 배경 비율 변동을 수용하기 위해)를 포함하면 상태 종속 비율 변동을 감지하는 능력이 감소해야 합니다. 이 시뮬레이션 실험의 목표는 배경 속도 변동이 없을 때 수용하는 비용을 이해하는 것입니다. 이를 달성하기 위해 실험 1의 데이터 세트(일정한 배경 비율에서 시뮬레이션)를 |$로 재사용했습니다.$|⁠ , |$$|⁠ 및 |$>$|⁠ , 그러나 MuSSCRat + UCLN 모델에서 이러한 데이터 세트를 분석했습니다.

배경 비율이 일정하다고 올바르게 가정한 실험 1의 경우 적용 확률은 |$95.3\%$| (양측 이항 검정 |$ <

eq 0.95>$|⁠ , |$P- < ext 약 0.4>$|⁠ ). 대조적으로, 배경 비율이 가변적이라고 잘못 가정한 이 실험에서 적용 확률은 |$97.4\%$| (양측 이항 검정 |$ <

eq 0.95>$|⁠ , |$P- < ext = 0.02>$|⁠ ). 전반적으로 부재 시 배경 속도 변동을 수용하는 비용은 매우 적습니다( ⁠|$<97.4\% - 95.3>\% = 2.1\%$|⁠ ). 또한 background-rate-variation 매개변수의 사후 분포 |$ u$|⁠ 는 실제 값 |$< u = 0>$| 쪽으로 크게 축소되었습니다. (고정 배경 비율 모델): |$ u$|의 평균 사후 평균 추정치 이 시뮬레이션에서 |$$| (|$$|⁠의 이전 평균과 비교하여 Dryad에서 사용할 수 있는 보충 자료 참조).

실험 4: 배경 비율 변동 무시의 결과

연속 문자 진화의 배경 비율이 혈통마다 다를 때 우리는 다음과 같이 예상합니다. ...을 제외한 추론 모델의 배경 비율 변동은 긍정적으로 오도할 수 있습니다. 이 시뮬레이션 실험의 목표는 연속 문자 진화의 상태 종속 속도에 대한 추론에 대한 배경 속도 변동을 수용하지 못하는 결과를 이해하는 것입니다. 이를 달성하기 위해 실험 2(가변 배경 비율에서 시뮬레이션)의 데이터 세트를 재사용했습니다.$|⁠ , |$$|⁠ 및 |$>$|⁠ , 그러나 "제약된" MuSSCRat 모델(즉, |$eta^2_l$|가 모든 계보에 대해 동일하도록 강제하여 일정한 배경 진화 속도를 가정합니다.

배경 비율이 가변적이라고 올바르게 가정한 실험 2의 경우 적용 확률은 |$94.5\%$| (양측 이항 검정 |$ <

eq 0.95>$|⁠ , |$P- < ext 약 0.19>$|⁠ ). 대조적으로 이 실험에서는 배경 비율이 일정하다고 잘못 가정했을 때 적용 확률이 |$85.4\%$|로 감소했습니다. (양측 이항 검정 |$ <

eq 0.95>$|⁠ , |$P- < ext < 1e-10>$|⁠ ). 이 감소된 적용 확률은 |$10\%$|에 대한 오답에 대해 매우 확신하고 있음을 의미합니다. 우리보다 더 자주. 예를 들어, 상태 종속 요율이 실제로 같을 때( ⁠|$$|⁠ ), 주 종속 요율이 다르다는 것을 부정확하지만 자신 있게 추론할 것입니다 |$17.7 %$| 시간의.


비교 생물학을 위한 계통 발생 도구

나는 (그렇지 않음) 최근에 phytools 함수 densityMap 에 대해 다음 질문을 합니다.

귀하의 논문(2013): &ldquo계통 발생에 대한 형질 진화 매핑을 위한 두 가지 새로운 그래픽 방법&rdquo에서 이진 형질이 아닌 이산 형질에 대한 방법 1 '확률적 매핑의 집계 결과 시각화와 동일하게 만들 수 있습니까?

현재 트리에서 이진 문자의 확률적 매핑에서 사후 확률 밀도의 시각화를 생성하는 densityMap 은 2개 이상의 문자에 대해서는 작동하지 않습니다. 이것은 주로 색상을 1차원 이상으로 시각화하는 것이 어렵기 때문입니다! (3-상태 캐릭터에 대한 가능성은 3D RGB 스케일에 확률을 넣는 것입니다. 그러나 이것은 어쨌든 분석에 하나의 차원만 추가합니다.)

현재 유일한 해결책은 "simmap" 트리에서 mergeMappedStates를 사용한 다음 "A" 대 "not A" , "B" 대 "not B" , "C" 대 "not C" 등을 플롯하는 것입니다.

다음은 모델링 중인 특정 캐릭터 상태에 따라 달라져야 하는 방법에 대한 간단한 데모입니다.


별개의 치아 특성을 기반으로 한 유전적 관계: Basketmaker II 및 Mimbres

미국 남서부의 선사 시대 인구 간의 문화와 생물학 간의 관계에 대한 조사는 사회적 상호 작용의 재구성을 향상시킬 수 있습니다. 현재 연구는 Arizona State University 치과 인류학 시스템을 사용하여 여러 사이트에서 Basketmaker II 및 Mimbres 개인의 영구 치열을 분석하고 지역 샘플과 비교합니다. 이산 치아 특성 분석은 대규모 비교 샘플을 사용할 수 있는 경우 모집단 간의 유전적 관련 정도를 평가하는 데 유용한 수단을 제공합니다. 둘 다 현장에서 문화적 변화와 인구 대체는 Basketmaker와 초기 Puebloan 그룹에 작용하는 지배적인 메커니즘으로 가정되었습니다. 우리는 Uto-Aztecan 농부 이주 가설에 비추어 Uto-Aztecan 화자일 가능성이 있는 이들 인구의 관계를 조사합니다. 전통적으로 별개의 문화 단위로 인식되었던 Basketmaker II 복합 단지는 상당한 인구 이질성을 나타냅니다. 웨스턴 바스켓메이커는 우토-아즈텍어 사용자와 생물학적 유대를 공유하는 것으로 보이지만 동부 바스켓메이커는 모델에서 예측한 대로 그렇지 않습니다. Mimbres와 Uto-Aztecan 화자 사이의 관계는 덜 명확합니다. Mimbres는 북부 멕시코 인구에 대해 약한 친화력만을 보여주기 때문입니다. Copyright © 2007 John Wiley & Sons, Ltd.


생물학 14장

Mendel은 짝짓기에 관여하는 부모와 꽃 색깔이나 씨앗 모양과 같이 쉽게 알아볼 수 있는 특성이 다른 개체를 사용할 수 있도록 제어하여 실험을 쉽게 설계할 수 있었습니다.

Mendel은 꽃가루가 형성되기 전에 남성의 생식 기관을 제거하여 자가 수정을 방지했습니다.

멘델은 진정한 교배 계통 또는 순수 계통(자가 수정되거나 동일한 순수 계통 개체군의 다른 구성원과 교배될 때 자신과 동일한 자손을 생산하는 개체로 구성됨)에서 개체를 얻는 것으로 작업을 시작했습니다.

예측 가능한 순수 선으로 시작함으로써 그는 십자가 이후의 모든 새로운 표현형이 십자가로 인한 것임을 확신할 수 있었습니다.

초기 교배에 사용된 개체는 부모 세대이고 그 자손은 F1 세대입니다.

F1 세대 짝짓기

단일 특성에 대한 부모 하이브리드

F2세대에 주름씨앗이 또 등장

주름 = 원형 종자 형질에 대한 열성 형질
둥근 모양 = 주름진 모양에 비해 우세한 특성

우성은 열성 표현형을 가진 개인보다 반드시 더 적합하지는 않습니다.

Mendel은 각 개인이 모든 유전자의 두 가지 버전을 가질 수 있다고 제안했습니다.

결과적으로 각 배우자는 각 유전자의 하나의 대립 유전자를 포함합니다.

이것을 분리의 원리라고 한다

각 부모로부터 배우자에 존재하는 분리된 대립유전자는 수정 시 함께 모여 자손의 첫 번째 세포인 접합체를 생성합니다.

동일한 유전자에 대해 서로 다른 두 개의 대립유전자를 가진 개체

유전자의 대립유전자(종자 모양 유전자와 종자 색상 유전자)가 이잡종 교배의 자손에게 어떻게 전달되는지에 대한 두 가지 가능성이 존재했습니다.

(1) 원래 각 부모에 존재하는 종자 모양의 대립 유전자와 종자 색깔의 대립 유전자는 서로 분리되어 독립적으로 전달됩니다 - Independent Assortment

(2) 종자 모양에 대한 대립 유전자와 원래 각 부모에 존재하는 종자 색깔에 대한 대립 유전자가 배우자에게 함께 전달됨 - 의존적 구색

Mendel은 모든 F1 자손이 원형의 노란색 종자를 가지고 있음을 발견했습니다. F2 자손의 표현형을 조사한 결과, 4개의 표현형, 9:3:3:1 비율의 독립 구색 가설의 전제에 부합한다는 것을 발견했습니다.

Mendel은 많은 수의 자손을 분석했습니다. 인구 규모가 작을수록 예측 비율에 가까워질 가능성이 낮습니다.

상동 쌍이 정렬될 가능성이 똑같이 두 가지 방법이 있으며 이것이 멘델의 독립 구색 원리의 물리적 기반입니다.

야생형: 파리가 멘델의 완두콩처럼 "순수계통"일 수 없기 때문에 사용되는 일반적인 표현형

돌연변이로 인해 비정상적인 표현형을 가진 개체는 돌연변이입니다

성염색체에 전달되는 유전자에서 관찰되는 유전 패턴

암컷과 수컷은 유전자의 대립유전자 수가 다르다

Linked는 불가분의 관계를 의미합니까?

유전자가 같은 염색체에 있을 때 나타남

소수의 수컷은 새로운 대립 유전자 조합이 있는 X 염색체를 가지고 있습니다: Xwy 또는 XWY - Morgan은 X 염색체의 대립 유전자가 어머니에 있는 조합과 다르기 때문에 이러한 개체를 Recombinant라고 불렀습니다.

Morgan은 동일한 염색체에 있는 대립유전자가 종종 함께 유지되지만 항상 그런 것은 아니라고 결론지었고, 여성의 감수분열 1단계에서 교차가 발생할 때 새로운 대립유전자 조합을 가진 배우자가 생성된다고 제안했습니다.

독립적인 분류는 4가지 표현형 조합 모두의 1:1:1:1 비율을 예측하는 반면 완전한 연결은 비재조합 또는 부모 염색체와 관련된 2개의 표현형만 제공합니다.

동일한 염색체에서 더 많은 유전자가 떨어져 있을수록 이들 유전자 사이의 어딘가에서 교차가 발생할 가능성이 더 높아집니다 - 유전자 지도

연결된 유전자는 교차가 일어나지 않는 한 함께 유전되며, 교차가 발생하면 유전자 재조합이 일어납니다.


결과

10개의 비색 변수에 대한 감독되지 않은 K-평균 클러스터 분석(표 1)은 여성과 남성 모두에 대한 최적의 색상 클러스터 수가 3개(표 2)인 것으로 나타났습니다. 여성과 남성 모두에 대해, K-평균의 전체 최적 수는 3이었고, K-평균 = 3에서 최대 갭 통계량이 있었습니다(표 2).

2017년 여성
N = 47
2017년 남성
N = 85
선형 판별식 선형 판별식 1 선형 판별식 2 선형 판별식 1 선형 판별식 2
평균 밝기 0.092 0.138 −0.213 0.088
강함 0.105 0.156 0.101 0.051
UV 크로마 −1318.082 11529.59 −867.469 5969.393
옐로우 크로마 133.069 −63.721 −12.332 −105.373
블루 크로마 −1299.786 11522.04 −846.666 5934.362
그린 크로마 −1355.169 11550.36 −888.693 6035.815
레드 크로마 −1395.448 11597.21 −887.764 6007.215
차이 −0.155 −0.246 0.049 −0.105
스펙트럼 포화 −6.105 −2.555 −9.871 0.476
색조 0.129 0.041 −0.019 0.027
관찰
주황색
관찰
노란색
관찰
하얀
합집합
2017
예측
주황색
7 0 0 7
예측됨
노란색
1 20 1 22
예측
하얀
0 0 18 18
합집합 8 20 19 47
2017
남성
예측
주황색
27 0 0 27
예측
노란색
4 29 1 34
예측
하얀
0 0 24 24
합집합 31 29 25 85

3가지 색상 모프 클래스(그림 2A 및 2B) 간에 구별되는 동일한 10개의 비색 변수(표 1)의 선형 판별 함수 분석 P. 에르하디 두 성별에 대한 주황색 및 노란색 모프의 95% 신뢰 타원에서 일부 겹침이 있습니다(그림 2C 및 2D). 암컷과 수컷의 LDFA 결과는 세 가지 색상 모프를 식별할 수 있으며(그림 2C 및 2D), 색상 모프는 10가지 비색 변수(Wilks' Lambda)에 따라 크게 다릅니다. NS < 0.001). 암컷과 수컷 모두에 대한 LDFA의 모프 예측은 관찰된 모프 할당과 밀접하게 일치했습니다(표 3). 여성의 경우 10개의 비색 변수에 따른 색상 모프의 다변량 식별이 유의했습니다(Wilks' Lambda = 0.042, F(2,44) = 13.533, NS < 0.001). 남성의 경우 동일한 10개의 비색 변수를 기반으로 한 색상 모프의 다변량 식별도 유의했습니다(Wilks' Lamdba = 0.029, F(2,82) = 35.729, NS < 0.001).

그림 2: 색상 모프 포다르시스 에르하르디.

2017년 여성
N = 47
2017년 남성
N = 85
K-평균 갭 통계 표준 오류 갭 통계 표준 오류
1 0.272 0.035 0.309 0.025
2 0.363 0.033 0.440 0.024
3 0.385 0.031 0.502 0.022
4 0.358 0.031 0.492 0.022
5 0.366 0.032 0.496 0.021
6 0.382 0.032 0.495 0.021

최대 교합력은 모든 머리 형태(머리 길이, 머리 너비, 머리 높이)와 강한 양의 상관관계가 있었고 머리 형태도 남녀 모두 신체 크기와 강한 양의 상관관계가 있었습니다(표 4). 따라서 여기에서는 교합력 사이의 관계에 중점을 둡니다. 몸 크기가 머리 크기를 결정하기 때문에 , 색상 모프 및 몸 크기. 수컷 도마뱀의 최대 교합력은 도마뱀 몸의 크기와 강한 양의 상관관계가 있었다(선형 회귀 최대 교합력 ~SVL, adj. NS 2 = 0.644, NS = 0.002, N = 81, DF = 79, 그림 3A), 남성 색상 모프는 유의하게 다른 SVL을 가졌습니다(ANOVA SVL ~모프 F(2,78) = 11.6, NS < 0.05, 표 4, 도 3A). A post hoc Tukey HSD test showed that orange males had significantly longer SVLs than white and yellow males, which did not differ from each other in SVL (Table 4). We then analyzed differences in bite force among male morphs that accounted for lizard size in a GLM that included morph and SVL as fixed effects, and found no significant effect of morph on maximum bite force capacity (GLM maximum bite force ∼morph + SVL, F(3,77) = 13.41, morph p > 0.05, SVL p < 0.001).

Morphometric
ANOVA
Post hoc
comparisons
남성
Difference
남성
P (adj)
여자
Difference
여자
P (adj)
Male SVL
F(2,78) = 11.6
Female SVL
F(2,43) = 0.527
white-orange −3.748 0.001* −0.805 0.932
yellow-orange −4.601 <0.001* −2.268 0.568
yellow-white −0.853 0.709 −1.463 0.675
Male head length
F(2,78) = 14.64
Female head length
F(2,43) = 0.221
white-orange −1.161 <0.001* −0.158 0.892
yellow-orange −1.33 <0.001* −0.523 0.285
yellow-white −0.169 0.821 −0.365 0.360
Male head width
F(2,78) = 12.41
Female head width
F(2,43) = 0.469
white-orange −0.865 <0.001* −0.062 0.957
yellow-orange −0.879 <0.001* −0.184 0.669
yellow-white −0.014 0.997 −0.123 0.744
Male head height
F(2,78) = 11.1
Female head height
F(2,43) = 0.822
white-orange −0.417 0.043* −0.287 0.431
yellow-orange −0.422 0.032 * −0.245 0.531
yellow-white −0.005 0.999 −0.043 0.968

Female maximum bite force was also positively correlated with body size (Linear regression maximum bite force ∼SVL, adj. NS 2 = 0.704, p < 0.001, N = 46, df = 44, Fig. 3B). In contrast to males, female color morphs did not differ in body size (ANOVA SVL ∼morph F(2,43) = 0.651, p = 0.527, Fig. 3B,da Table 4), or head morphometrics (Table 4). In a GLM that included morph and SVL as fixed effects, we did not detect a significant effect of morph on maximum bite force for female color morphs of P. erhardii from the same population (GLM maximum bite force ∼morph + SVL, F(3,42) = 14.72, morph p > 0.05, SVL p < 0.001).

Figure 3: Relationship between maximum bite force and lizard body size (SVL) among color morphs.

From the femoral gland secretions of male P. erhardii (N = 39) originating from the study population in Moni (Naxos, Greece), we could identify 81 different lipophilic compounds (Supplemental Information 3). Considering all individuals together, secretions were mainly a mixture of steroids (average ± SE % of TIC: 68.4 ±1.21%), waxy esters (17.7 ± 0.82%) and tocopherol (5.6 ±0.88%). Fatty acids (3.3 ± 0.40%), alcohols (1.8 ± 0.10%), and aldehydes (1.4 ± 0.11%) were present in intermediate concentrations. Amides (0.6 ± 0.13%), ketones (0.5 ± 0.06%), a terpenoid (0.3 ± 0.06%), and furanones (0.3 ± 0.03%) were the four chemical classes with the lowest average proportion. On average, the five most abundant chemicals were cholesterol (39.8 ± 1.37%), campesterol (7.9 ± 0.41%), α-tocopherol (5.6 ± 0.88%), the 1,2-ethanediyl ester of hexadecanoic acid (5.5 ± 0.47%), and β-sitosterol (4.2 ± 0.45%).

The PERMANOVA, based on the resemblance matrix comparing the three morphs, showed borderline significant differences in the chemical profile of the three color morphs (pseudo F(2,38) = 1.587, p = 0.067). Pairwise PERMANOVA tests indicated statistically significant differences in the chemical composition of the glandular secretions, specifically, between orange and white morphs (NS = 1.590, p = 0.021). There were no significant differences between yellow and white morphs (NS = 1.125, p = 0.243) and orange and yellow morphs (NS = 0.991, p = 0.435). The CAP analysis classified 51.28% of the chemical profiles into the correct population using leave-one-out cross-validation (δ = 0.97, p = 0.389, m = 34 axes Fig. 4A).

Figure 4: Chemical analyses of pore exudate.

The first four principal components jointly explained 64.0% of the variation, with the first axis (29.0%) being strongly affected by α-tocopherol (loading = 0.70), eicosyl 9-octadecenoate (0.27), the 1,2-ethanediyl ester of hexadecanoic acid (−0.25), octadecanoic acid (0.25), and tetradecyl 9-octadecenoate (−0.24). We used the scores of the first four principal components (PCs) to test for among-morph differences using four separate univariate analyses of variance (ANOVAs). These tests indicated that PC1 varied significantly among color morphs (F(2,36) = 4.273, p = 0.0216 Fig. 4B). A post hoc LSD multi-comparison (with Bonferroni correction) showed a significant difference between white and orange color morphs (Table 5), with orange males having higher proportions of α-tocopherol, eicosyl 9-octadecenoate, and octadecanoic acid, but lower proportions of 1,2-ethanediyl ester of hexadecanoic acid and tetradecyl 9-octadecenoate. There were no significant among-morph differences in PC2, PC3, and PC4 (all F ≤ 0.669 p ≥ 0.518). Lastly, variation in the chemical composition of the glandular secretion of P. erhardii could not be explained by variation in body size as none of the PCs showed a significant link with SVL (all F ≤ 1.382, p ≥ 0.175).


추상적 인

The human capacity to acquire complex language seems to be without parallel in the natural world. The origins of this remarkable trait have long resisted adequate explanation, but advances in fields that range from molecular genetics to cognitive neuroscience offer new promise. Here we synthesize recent developments in linguistics, psychology and neuroimaging with progress in comparative genomics, gene-expression profiling and studies of developmental disorders. We argue that language should be viewed not as a wholesale innovation, but as a complex reconfiguration of ancestral systems that have been adapted in evolutionarily novel ways.


METHODS

Simulations

I generated a set of 100 pure birth trees using the Phytools package ( Revell 2012) package in R ( R Core Team 2016), each containing ten taxa. All trees were ultrametric and generated with a total length of 1.0 units for consistency in parameter scaling for trait simulations ( Fig. 1). These trees were used to simulate continuous characters evolving along an unbounded BM process, again using Phytools. This is a Markovian process in continuous time where the variance of the process can increase infinitely through time. This differs from the BM |$sigma^2$| parameter, which gives the variance in the amount of character displacement at each draw, effectively describing the magnitude of the random BM walk or a rate of character displacement. To assess performance across several biological scenarios, traits were simulated at |$sigma^2$| parameterizations of 0.05, 0.5, 1.0, 1.5, and 3. Since the process under which traits were simulated is unbounded, phylogenetic signal is expected to remain consistent across rates ( Revell et al. 2008), but different rates were chosen to illustrate this consistency and to provide even comparison to discrete trait simulations. Discrete characters were simulated in the Phytools package ( Revell 2012) under an Mk model with homogeneous transition probabilities. Traits were generated at transition rates 0.05, 0.5, 1.0, 1.5, and 3. All character matrices were generated without rate heterogeneity, and include invariable sites (i.e., no acquisition bias).

a) Exemplar true simulated tree. b) Tree inferred from 20 discrete characters simulated under Mk from true tree. c) Tree inferred from 20 continuous characters simulated under Brownian motion. Dots denote incorrect bipartitions.


비디오 보기: სქესთან შეჭიდული ნიშან-თვისებები (칠월 2022).


코멘트:

  1. Raedan

    비판 대신 변형을 쓰십시오.

  2. Bebeodan

    당신은 우연히 전문가가 아니십니까?

  3. Brayton

    Bravo, this thought you are just by the way

  4. Jutilar

    좋은 선택)

  5. Beldan

    이것에는 무언가가 있고 나는이 아이디어를 좋아합니다. 나는 당신과 완전히 동의합니다.



메시지 쓰기