Información

7.4: Los cruces permiten la recombinación de loci enlazados - Biología

7.4: Los cruces permiten la recombinación de loci enlazados - Biología


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Hasta ahora, solo hemos considerado situaciones sin enlace (50% de recombinación) o sin enlace completo (0% de recombinación). También es posible obtener frecuencias de recombinación entre 0% y 50%, situación que llamamos incompleto (o parcial) enlace. Se dice que los genes que están en el mismo cromosoma son sinténico independientemente de si están vinculados de forma completa o incompleta. Todos los genes vinculados son sinténicos, pero no todos los genes sinténicos están vinculados, como veremos más adelante.

Los cruces ocurren durante la profase I de la meiosis, cuando pares de cromosomas homólogos se han alineado entre sí en un proceso llamado sinapsis. El cruce comienza con la rotura del ADN de un par de cromátidas no hermanas. Las rupturas ocurren en las posiciones correspondientes en dos cromátidas no hermanas, y luego los extremos de las cromátidas no hermanas se conectan entre sí dando como resultado un intercambio recíproco de ADN de doble hebra (Figura ( PageIndex {4} )). Generalmente, cada par de cromosomas tiene al menos uno (y a menudo más) cruces durante las meiosis (Figura ( PageIndex {5} )).

Figura ( PageIndex {5} ): Un cruce entre dos loci enlazados puede generar genotipos recombinantes (AB, ab), a partir de las cromátidas involucradas en el cruce. Recuerde que en cada organismo ocurren múltiples meiosis independientes, por lo que este patrón particular de recombinación no se observará entre todas las meiosis de este individuo. (Original-Deyholos-CC: AN)

Debido a que la ubicación de los cruces es esencialmente aleatoria a lo largo del cromosoma, cuanto mayor sea la distancia entre dos loci, es más probable que ocurra un cruce entre ellos. Además, los loci que están en el mismo cromosoma, pero están lo suficientemente separados entre sí, tendrán en promedio múltiples cruces entre ellos y se comportarán como si estuvieran completamente desvinculados. Por lo tanto, una frecuencia de recombinación del 50% es la frecuencia de recombinación máxima que se puede observar, y es indicativa de loci que están en cromosomas separados o están ubicados muy separados en el mismo cromosoma.


Supresión y diferenciación progresiva de la recombinación en cromosomas neosexuales recientemente evolucionados

La supresión de la recombinación conduce a la diferenciación estructural y funcional de los cromosomas sexuales y, por tanto, es un paso crucial en el proceso de evolución de los cromosomas sexuales. A pesar del extenso trabajo teórico, los procesos y mecanismos exactos de supresión y diferenciación de la recombinación no se comprenden bien. En tres espinosos espinosos (Gasterosteus aculeatus), un sistema de cromosomas sexuales diferente ha evolucionado recientemente por una fusión entre el cromosoma Y y un autosoma en el linaje del Mar de Japón, que divergió del antepasado de otros linajes aproximadamente 2 Ma. Investigamos la dinámica evolutiva y los procesos de diferenciación de los cromosomas sexuales basados ​​en análisis comparativos de estos linajes divergentes utilizando 63 loci de microsatélites. Tanto los patrones de diferenciación de todo el cromosoma como las inferencias filogenéticas con alelos X e Y indicaron que los cromosomas sexuales ancestrales estaban ampliamente diferenciados antes de la divergencia de estos linajes. Por el contrario, la diferenciación genética parecía haber procedido solo en una pequeña región de los cromosomas neosexuales. Los mapas de recombinación construidos para el linaje del Mar de Japón indicaron que la recombinación se ha suprimido o reducido en una gran región que abarca los cromosomas ancestrales y neo-sexuales. Las regiones cromosómicas que exhiben diferenciación genética y recombinación suprimida o reducida se detectaron de forma continua y secuencial en los cromosomas neo-sexuales, lo que sugiere que la diferenciación se ha extendido gradualmente desde el punto de fusión después de la extensión de la supresión de la recombinación. Nuestro estudio ilustra un proceso continuo de diferenciación de los cromosomas sexuales, proporcionando apoyo empírico para el modelo teórico que postula que la supresión y diferenciación de la recombinación proceden de manera gradual en la etapa muy temprana de la evolución de los cromosomas sexuales.


Introducción

La tecnología de secuenciación de alto rendimiento ha acelerado en gran medida la construcción de mapas de ligamiento densos en especies que no son modelo (por ejemplo, Amores et al. 2011 Miller et al. 2012 Everett y Seeb 2014). Los mapas emergentes permiten conocimientos sin precedentes sobre la arquitectura genómica de la divergencia adaptativa en la naturaleza (por ejemplo, Chutimanitsakun et al. 2011 Gagnaire et al. 2013 Richards et al. 2013). Estos estudios catalizan nuestra comprensión del número, la ubicación genómica y la colocación de los loci afectados por la selección natural. Desafortunadamente, los centrómeros rara vez se incluyen en los mapas de vinculación porque los esfuerzos de mapeo adicionales, como el mapeo de medias tétradas, añaden importantes obstáculos logísticos (cf., Thorgaard et al. 1983 Brieuc et al. 2014 ).

Los centrómeros representan un componente fundamental de la estructura y función cromosómicas (Henikoff et al. 2001), y la información sobre la ubicación del centrómero es vital para comprender correctamente los genomas. Los estudios que describen la divergencia genética han mostrado patrones llamativos en regiones centroméricas o teloméricas (Carneiro et al. 2009 Ellegren et al. 2012). Por lo tanto, el conocimiento sobre el tipo de cromosoma (es decir, acrocéntrico frente a metacéntrico) es de suma importancia para comprender la arquitectura subyacente de los rasgos adaptativos. Sin embargo, las interpretaciones a menudo adolecen de la falta de centrómeros conocidos en mapas de referencia y genomas, lo que ha empobrecido las interpretaciones de los resultados trazados a lo largo de mapas de alta densidad (por ejemplo, Wang et al. 2012 Gagnaire et al. 2013 Carlson et al. 2015) o ensamblajes del genoma (por ejemplo, Ellegren et al. 2012 Tine et al. 2014 Xu et al. 2014 ).

Aquí, demostramos un método sencillo para identificar regiones centroméricas en mapas de vinculación mediante la fase de los mismos datos de recombinación utilizados para construir el mapa. Validamos el método comparando la colocación de centrómeros en fases con la colocación de centrómeros más directa utilizando análisis de media tétrada en salmón rojo, Oncorhynchus nerka. Finalmente, proporcionamos ejemplos de prueba que resaltan las ventajas y limitaciones del método para mapear centrómeros en diferentes sexos y taxones.


Abstracto

Durante la meiosis, una inducción programada de roturas de doble cadena de ADN (DSB) conduce al intercambio de material genético entre cromosomas homólogos. Estos intercambios aumentan la diversidad del genoma y son esenciales para la segregación cromosómica adecuada en la primera división meiótica. Hallazgos recientes han puesto de relieve un control molecular inesperado de la distribución de DSB meióticos en mamíferos por un gen de rápida evolución, que contiene el dominio PR 9 (PRDM9), y los análisis de todo el genoma han facilitado la caracterización de sitios DSB meióticos con una resolución sin precedentes. Además, la identificación de nuevos actores en los procesos de reparación de DSB ha permitido delinear las vías de recombinación que tienen dos resultados principales, cruces y no cruces, que tienen distintos roles mecanicistas y consecuencias para la evolución del genoma.


Materiales y métodos

Muestreo y secuenciación de ADN

Se tomaron muestras de cromosomas X de 14 poblaciones geográficas que abarcan el D. neotestacea rango de especies (Tabla S1, Ver tabla 1 de Dyer, 2012). Estos machos son los mismos que se utilizaron en Dyer (2012), en el que los machos capturados en la naturaleza fueron identificados como portadores de cromosomas X ST o SR por la proporción de descendencia femenina que produjeron. De cada población en la que está presente SR, se secuenciaron al menos tres machos ST y tres SR en cada uno de los 11 loci ligados al X elegidos al azar, que incluían seis genes codificadores de proteínas (marf, mof, pgd, rpl, spk y sxl) y las regiones flanqueantes de seis loci de microsatélites (neo5261, neo6002, neo7029, neo7040, neo8377 y neo8385) (Tabla S2) (Dyer, 2007). En total, cada macho se secuenció en 4510 pares de bases en el cromosoma X. En poblaciones sin SR presente, solo se muestrearon machos ST. Se incluyeron al menos 53 machos ST y 41 SR para cada marcador, aunque el número total de muestras es variable para cada locus individual. De cada población, se eligieron al menos tres machos al azar con respecto a su tipo de cromosoma X utilizando un generador de números aleatorios (www.random.org). Estos machos se secuenciaron en siete loci de codificación de proteínas autosómicos arbitrarios ubicados en todos los demás elementos de Muller excepto F, que incluía esc, gl, mago, ntid, sia, tpi y pequeñito para un total de 2657 pb por individuo (Tabla S2). Todos estos loci también fueron secuenciados en uno o dos individuos de D. orientacea y D. putrida, que son dos de los otros miembros del grupo de especies de testacea. Del último miembro del grupo de especies de testacea, D. testacea, una hembra de cada una de las 24 líneas isofemale recolectadas en Munich, Alemania, fueron elegidas para la secuenciación.

Las extracciones de ADN se realizaron con Qiagen Puregene Core Kit A. Los fragmentos se amplificaron utilizando protocolos de PCR estándar (Tabla S3) y se secuenciaron en un analizador de ADN 3730xl de Applied Biosystems (Foster City, CA, EE. UU.) En las instalaciones de Georgia Genomics. Las llamadas de base se confirmaron utilizando Geneious (Kearse et al., 2012), y los SNP heterocigotos en loci diploides fueron escalonados usando PHASE (Scheet & Stephens, 2006). Las secuencias se alinearon a mano en Geneious, y las repeticiones de microsatélites se eliminaron manualmente, dejando solo las regiones flanqueantes para su uso en los análisis (Kearse et al., 2012). Los marcos de lectura abiertos se asignaron utilizando anotaciones D. melanogaster ortólogos como guía (www.flybase.org).

Mapeo de recombinación

Usamos mapeo de recombinación para determinar el orden de los loci en el cromosoma ST. Realizamos cruces de un solo par con moscas de líneas isofemale recolectadas originalmente en Seattle, WA (Sea), y Coeur d'Alene, ID (ID-1). Las hembras marinas se cruzaron con machos ID-1, y las hembras F1 se recolectaron y cruzaron con machos de un stock de laboratorio endogámico. Los machos F2 (portadores de un cromosoma X derivado de la madre) fueron recolectados y congelados para genotipificación. Todas las moscas se criaron en Instant Drosophila Medium (Carolina Biological Supply, Burlington, NC, EE. UU.) Suplementado con hongos comerciales (Agaricus bisporus) a 20 ° C con 60% de humedad relativa en un ciclo de luz / oscuridad de 12 h. El ADN de los padres y 92 machos F2 se extrajo como se describió anteriormente. Los padres fueron genotipados usando el número de repeticiones en marcadores microsatélites ligados al cromosoma X (como se describe en Pinzone & Dyer, 2013) y secuenciados en loci codificantes de proteínas ligados al cromosoma X para identificar los SNP en los sitios de corte de las enzimas de restricción. BsaWI (New England Biolabs, Ipswich, MA, EE. UU.) Se utilizó para el análisis de fragmentos de restricción de spk. Los machos F2 fueron genotipados en los loci de microsatélites y spk y fueron secuenciados en marf y pgd para identificar qué alelo parental portaban. Los dos loci restantes (rpl y mof) no contenían polimorfismos en el cruce parental y, por lo tanto, no pudieron ser mapeados. El orden y las distancias del mapa más probables se calcularon utilizando la función de mapeo de Kosambi en MapDisto con 1000 réplicas de bootstrap (Kosambi, 1943 Lorieux, 2012).

Como las hembras SR / SR son fértiles, intentamos utilizar dos líneas SR recolectadas y mantenidas de forma independiente para el mapeo de recombinación del cromosoma SR. Estas líneas se recolectaron en Eugene, Oregón, en 2001 (SR-Par) y en Rochester, Nueva York, en 1990 (SR-Lab). Sin embargo, según la secuenciación de cada locus de cada línea, no hubo suficiente variación entre ellos para determinar nada excepto que neo6002 y neo7029 están separados por lo menos 50 cM en SR, lo mismo que en ST.

El stock de laboratorio ST también se recogió originalmente en Nueva York en 1990, y el stock de SR-Lab se mantiene en el mismo trasfondo genético. Cada generación, los machos ST / Y se cruzan con las hembras SR / SR para generar machos SR / Y, y los machos SR / Y también se cruzan con las hembras SR / SR para producir más hembras SR / SR. Probamos la recombinación entre ST y SR cruzando hembras heterocigotas ST / SR con machos ST / Y y luego genotipando 95 descendientes masculinos en los seis microsatélites ligados al X descritos anteriormente. Los genotipos parentales ST y SR se identificaron utilizando cuatro hembras SR / SR y dos machos ST / Y de estas poblaciones SR y ST altamente endogámicas.

Análisis filogenético

Se construyeron árboles de especies filogenéticas multilocus usando * BEAST con el modelo de sustitución de nucleótidos HKY y una longitud de cadena de 100 millones, con un 20% de quemado eliminado (Heled & Drummond, 2010 Bouckaert et al., 2014). Ortólogos de D. testacea, D. orientacea y D. putrida fueron incluidos en el análisis, y basados ​​en trabajos filogenéticos previos, D. putrida se utilizó como un grupo externo para enraizar los árboles (Perlman y Jaenike, 2003 Dyer et al., 2011). Los árboles para el cromosoma X y los loci autosómicos se construyeron por separado. Para el árbol de especies ligadas al cromosoma X, D. neotestacea las muestras se dividieron en ST y SR. El árbol ligado al cromosoma X también incluía el marcador sxl, que se eliminó de análisis posteriores debido a un polimorfismo extremadamente bajo. El árbol autosómico utilizó los siete marcadores autosómicos. Los árboles genéticos individuales generados como parte de estos análisis * BEAST se utilizaron para inferir la relación entre D. neotestacea ST y SR y D. testacea a nivel de locus individual.

Las relaciones entre muestras individuales se infirieron utilizando un árbol filogenético multilocus construido con todos los marcadores ligados al X excepto neo5261, que carecía de una secuencia de D. putrida utilizado para enraizar el árbol. Este árbol también se construyó en * BEAST utilizando el modelo de sustitución HKY y una longitud de cadena de 2 mil millones con un 20% de quemado eliminado.

Patrones de diferenciación genética y recombinación

Para estimar los patrones de diferenciación genética, calculamos KS T y Snn (Hudson et al., 1992 Hudson, 2000) en DnaSP (Librado & Rozas, 2009) utilizando tanto la ubicación geográfica de muestreo como ST y SR como agrupaciones (Librado & Rozas, 2009). Importancia del individuo KS T y Snn Los valores se determinaron utilizando 1000 permutaciones aleatorias según el método de Hudson. et al. (1992), Librado y Rozas (2009). Los análisis estadísticos se realizaron en RStudio (2014).

Para estimar los patrones de LD dentro y a través de los loci, todos los marcadores ligados al X se concatenaron en el orden del mapa genético ST y el coeficiente de correlación por pares (R 2) entre cada par de sitios informativos de parsimonia se calculó según el método de Hill & Robertson (1968). La significancia de cada asociación se calculó en DnaSP usando una prueba exacta de Fisher con una corrección de Bonferroni para pruebas múltiples usando α = 0.05 (Librado y Rozas, 2009). LD se infirió utilizando todas las muestras (SR y ST) y por separado para los cromosomas SR y ST. El ZnS para cada locus se calculó según el método de Kelly (1997). La tasa de recombinación de la población (ρ) se estimó para cada locus utilizando el método de probabilidad compuesta de Hudson (2001) en el programa LDHat (McVean et al., 2004). Para los autosomas, ρ = (1/2)*4nortemir = 2nortemir (ya que los machos no se recombinan en D. neotesteacea), dónde nortemi es el tamaño efectivo de la población y r es la tasa de recombinación por generación. Para el cromosoma X, ρ = (2/3)*3nortemir = 2nortemir. ρ se calculó para ST y SR por separado para cada marcador y luego escalado por el número de sitios. Se detectó intercambio genético entre SR y ST en la alineación concatenada de todos los marcadores ligados al X utilizando el método de Betran et al. (1997) implementado en DnaSP (Librado & Rozas, 2009).

Patrones de polimorfismo de nucleótidos

Para cada marcador, el polimorfismo de nucleótidos se analizó por separado para los grupos de muestra ST y SR. En los marcadores que contenían marcos de lectura abiertos, los sitios de segregación se dividieron en polimorfismos de sitios silenciosos (cambios sinónimos y cambios fuera del marco de lectura abierto) y polimorfismos no sinónimos. Se asumió que las regiones flanqueantes de microsatélites eran sitios silenciosos. Para evaluar los patrones de polimorfismo de nucleótidos, las diferencias promedio de nucleótidos por pares (π) (Nei, 1987), Watterson θ (Watterson, 1975) y Tajima's D (Tajima, 1989) se calcularon en DnaSP utilizando solo sitios silenciosos (Librado & Rozas, 2009). π también se calculó utilizando sólo la variación no sinónima de los genes codificadores de proteínas. Sustituciones netas de nucleótidos por sitio (Da) entre ST y SR se calcularon para un conjunto combinado de todos los marcadores ligados al X (Nei, 1987 Librado & Rozas, 2009). Se identificaron sitios informativos de parsimonia para ST y SR individualmente en DnaSP y se utilizaron para identificar alelos privados. Tajima esperado D Los valores se generaron utilizando 10000 simulaciones coalescentes en el programa HKA (https://bio.cst.temple.edu/

hey / software / software.htm # HKA). Ka/Ks y πa/πs se calcularon para todos los loci codificadores de proteínas en DnaSP (Librado & Rozas, 2009), con ortólogos de D. putrida utilizado para identificar las sustituciones.

Calabazas de cromosomas politenos

Las inversiones en SR se confirmaron utilizando aplastamientos de cromosomas politeno de las glándulas salivales de D. neotestacea larvas de tercer estadio. Las glándulas salivales se disecaron en solución salina tamponada con fosfato, se fijaron en ácido acético al 45%, se tiñeron con orceína y luego se aplastaron físicamente en un portaobjetos de microscopio para separar los cromosomas (Sullivan et al., 2000). Las extensiones de cromosomas se examinaron con un aumento de 400x utilizando microscopía de contraste de fase. El cromosoma X se identificó en machos ST del stock de laboratorio endogámico porque no mostraba sinapsis ni inversiones cromosómicas, y luego, se generaron hembras heterocigotas ST / SR y se utilizaron para identificar las inversiones entre ST y SR.


Abstracto

El Morgan2McClintock Translator permite la predicción de las posiciones del mapa cromosómico de paquiteno meiótico a partir de datos de ligamiento basados ​​en recombinación utilizando distribuciones de frecuencia de nódulos de recombinación. Sus resultados permiten la estimación del contenido de ADN entre los loci mapeados y ayudan a crear una visión general integrada de la estructura del genoma nuclear del maíz.

Se pueden producir DOS tipos de mapas genéticos fundamentalmente diferentes pero colineales, mapas de vínculos y mapas físicos. Los mapas de ligamiento clásico (genéticos) se basan en frecuencias de recombinación de alelos, mientras que los mapas físicos se basan en las moléculas de ADN lineal que componen los cromosomas.

En el maíz, se encuentran disponibles un modelo genético y de las principales especies agrícolas, & # x0003e1200 mapas de ligamiento de alta resolución compuestos por miles de marcadores, mientras que los mapas físicos detallados de la secuencia de ADN y la estructura cromosómica están todavía en desarrollo. Los tres tipos principales de mapas físicos de maíz difieren en el nivel de resolución molecular. Son (1) mapas de ensamblaje de secuencias del genoma con resolución de pares de bases de ADN (ver, p.ej., D ong et al. 2005 Fu et al. 2005) (2) mapas de huellas dactilares-contig, resueltos al nivel de fragmentos de restricción superpuestos de segmentos clonados de ADN genómico (ver, p.ej., P ampanwar et al. 2005) y (3) mapas citológicos construidos por observación microscópica de la estructura del cromosoma paquiteno (p.ej., el mapa Cytogenetic FISH 9 creado por K oumbaris y B ass 2003 y A marillo y B ass 2004).

Los mapas físicos y de enlace tienen diferentes sistemas de coordenadas para posicionar los lugares geométricos. La unidad de mapa genético se llama & # x0201ccentiMorgan & # x0201d (cM) en honor a Thomas Hunt Morgan. Un centimorgan es igual al 1% de cruzamiento entre dos loci enlazados. Los mapas de huella dactilar-contig y de ensamblaje genómico se miden en pares de bases, mientras que los mapas físicos basados ​​en la estructura del cromosoma paquiteno (también llamados mapas citológicos o citogenéticos) colocan cada locus como la distancia fraccional a lo largo del brazo desde el centrómero hasta el telómero. Recientemente, los investigadores de maíz han comenzado a llamar a la unidad de este tipo de denominación de mapa & # x0201ccentiMcClintock & # x0201d (cMC) en honor a la pionera de la genética del maíz Barbara McClintock. Aquí definimos formalmente 1 cMC como el 1% de la longitud del brazo del cromosoma en el que reside un locus dado. Por ejemplo, si el brazo corto del cromosoma 9 tiene una longitud de 8.70 & # x003bcm y el bronce1 (bz1) el locus se encuentra a 5.66 & # x003bcm del centrómero en ese brazo cromosómico, bz1 se encuentra (5.66 / 8.70 & # x000d7 100 & # x0003d) 65% de la distancia desde el centrómero a la punta del cromosoma o 65 cMC desde el centrómero. Un locus en la posición 66 estaría exactamente a 1 cMC del bz1 lugar. Debido a que las longitudes de los brazos de los cromosomas del maíz varían y el centiMcClintock es una unidad relativa, 1 cMC en, p.ej., el brazo corto del cromosoma 9 no consta necesariamente de la misma cantidad de micrómetros que 1 cMC en cualquiera de los otros 19 brazos cromosómicos. Las convenciones citológicas se describen y definen con más detalle en http://www.maizegdb.org/coordinateDef.php.

Las tasas de recombinación varían enormemente a lo largo de los cromosomas individuales, de modo que la distancia del mapa entre dos loci en un mapa de ligamiento puede no predecir con precisión la distancia física entre ellos (Anderson et al. 2004). Esta variación ha dificultado la integración de los dos tipos de mapas y también tiene importantes implicaciones para los esfuerzos de ensamblaje del genoma y las estrategias de clonación posicional (S adder y W eber 2002).

Recientemente se ha desarrollado un método para vincular mapas genéticos con la estructura cromosómica. Anderson et al. (2003) determinaron las distribuciones de frecuencia de los nódulos de recombinación (RN) a lo largo de los 10 cromosomas paquitenos del maíz. Debido a que cada RN representa un cruce en la estructura física del cromosoma, estos mapas de RN son únicos ya que contienen información tanto de ligamiento como citológica que permite la predicción de la posición citológica de cualquier marcador mapeado genéticamente (Anderson et al. 2004). Hemos desarrollado una herramienta, Morgan2McClintock Translator (accesible en http://www.lawrencelab.org/Morgan2McClintock), que automatiza el proceso de predicción de la posición citológica para cualquier información de enlace de entrada.

La conversión de las coordenadas del mapa de enlace de maíz en coordenadas citológicas requiere tanto datos de enlace como frecuencias RN como entrada. El Morgan2McClintock Translator incluye como archivos de datos el mapa RN de maíz (A nderson et al. 2003), así como dos mapas genéticos, el mapa de 1998 de la Universidad de Missouri en Columbia (UMC) (D avis et al. 1999) y el mapa genético de 1997 (N euffer et al. 1995). Más de mil otros mapas genéticos, que también se pueden utilizar como archivos de entrada, están disponibles en MaizeGDB (L awrence et al. 2005 y http://www.maizegdb.org/map.php). El traductor en sí fue codificado con PHP, y las ecuaciones que utiliza para convertir mapas de ligamiento en mapas citológicos son las descritas por Anderson. et al. (2004). La aplicación se puede ejecutar en línea o se puede descargar para uso local en cualquier máquina equipada para servir PHP. Los aspectos de las pantallas de entrada y salida para el traductor del mapa genético UMC 98 se muestran en la Figura 1 (D avis et al. 1999).

El traductor Morgan2McClintock. Las imágenes de captura de pantalla tomadas de http://www.lawrencelab.org/Morgan2McClintock muestran ejemplos de entrada de datos (arriba) y salida (abajo). (A) El usuario primero elige el grupo de enlace de maíz como número de cromosoma (flecha en el paso 1) y luego el correspondiente conjunto de datos de mapa de enlace de centimorgan (flecha en el paso 2). Los datos del mapa de vinculación se pueden elegir entre los conjuntos de datos almacenados disponibles para mapas comunes o se pueden pegar directamente en un cuadro de texto para los datos del mapa que no están almacenados actualmente. Al hacer clic en el botón & # x0201cCalculate & # x0201d, se envían los datos de entrada y se calculan los valores de centiMcClintock a partir de la distribución de frecuencia RN. La página web de salida contiene una tabla que resume un locus por fila e incluye columnas que describen los datos de entrada en centimorgans (B) y los datos de salida en ubicaciones previstas a lo largo del cromosoma paquiteno, expresadas en micrones y centiMcClintocks (C).

La distribución de las RN proporciona una conexión importante entre los mapas genéticos y la estructura cromosómica, lo que ha permitido el examen de la distribución de genes a nivel cromosómico en el maíz (Anderson et al. 2006). Esta integración también permite la estimación del ADN y las distancias cromosómicas entre los loci genéticos, una característica que ayudará en el ensamblaje de la secuencia del genoma del maíz. En teoría, este enfoque es aplicable a otros organismos con datos citológicos de distribución cruzada comparables, como el tomate (S herman y S tack 1995) y el ratón (F roenicke et al. 2002), y planeamos desarrollar un conjunto de herramientas similares para estos organismos que deberían ser útiles para comparar aspectos genéticos y cromosómicos de genomas en diferentes especies.


Materiales y métodos

Material vegetal

En el proyecto CornFed de Plant-KBBE se establecieron dos paneles de medios hermanos de 11 y 13 familias de medios hermanos, uno para el maíz European Dent y otro para el maíz European Flint. Las líneas utilizadas en este estudio, sus orígenes y la asignación a las piscinas Dent o Flint se enumeran en el archivo adicional 1. Cada uno de los dos paneles consta de una línea central (o padre común) que se cruzó a líneas fundadoras que representan importantes y diversas líneas de mejoramiento del germoplasma de maíz europeo. La línea central (F353) del panel Dent se cruzó con 10 líneas fundadoras de Dent. Para el panel Dent, el prefijo de poblaciones es CFD. En el panel de Flint, la línea central UH007 se cruzó con 11 líneas fundadoras de Flint y el prefijo para las poblaciones de este panel es CFF. Además, cada una de las líneas fundadoras se cruzó con B73 y también se generaron las poblaciones recíprocas F353 × UH007 y UH007 × F353. Estas poblaciones adicionales se hicieron para conectar los dos paneles entre sí y con la población NAM de EE. UU. [32] a través de la línea parental B73. El esquema de cruce de los dos paneles de medios hermanos y su conexión se muestra en el archivo adicional 15. Todas las progenies eran líneas DH homocigotas obtenidas de F1 plantas. Las 24 poblaciones de DH resultantes consistieron en 35 a 129 líneas (Tabla 1). En total, se utilizaron 2267 líneas DH para el análisis en este estudio.

Los cruces entre las líneas central y fundadora se hicieron mediante polinización manual utilizando F353 o UH007 como líneas femeninas y las líneas fundadoras como machos. F1 las plantas fueron polinizadas con una línea inductora para en vivo producción de haploides seguida de duplicación de cromosomas y autofecundación de D0 plantas, y posterior multiplicación para obtener D1 plantas [36]. Las líneas atípicas dentro de un cruce o las plantas atípicas dentro de las filas de las líneas DH se eliminaron según las observaciones fenotípicas.

Genotipado de SNP

Muestras a granel de hojas secas o granos de hasta ocho D1 plantas derivadas de la misma D0, se utilizaron para la extracción de ADN mediante el procedimiento de bromuro de cetiltrimetilamonio (CTAB). Las muestras de ADN se ajustaron a 50 a 70 ng / μl y se utilizaron 200 ng por muestra para la genotipificación. La pureza e integridad de la línea DH se verificó primero utilizando un ensayo 96plex VeraCode personalizado (Illumina®, San Diego, CA, EE. UU.) Con marcadores SNP de todo el genoma para garantizar que las líneas llevaran solo uno de los alelos parentales en cada SNP, que sí no portan alelos de la línea inductora y que se derivaron de la verdadera F1 plantas. Para un subconjunto de líneas DH, se utilizaron 13 marcadores SNP patentados analizados con la tecnología KASP ™ (LGC Genomics, Berlín, Alemania) para probar la pureza e integridad de la línea. A continuación, se utilizaron líneas DH verdaderas para la genotipificación con Illumina® MaizeSNP50 BeadChip [33] en una plataforma Illumina® iScan. La hibridación de matrices y el procesamiento de datos sin procesar se realizaron de acuerdo con las instrucciones del fabricante (Illumina®). Los datos brutos se analizaron en la versión v2011 del software Genome Studio de Illumina® (Illumina®) utilizando una versión mejorada del archivo de agrupamiento público (MaizeSNP50_B.egt, [62]). Los datos de SNP se filtraron según el GTscore utilizando un umbral de 0,7. Los SNP heterocigotos se establecieron en valores perdidos (NA) y solo se usaron para el mapeo los marcadores con una frecuencia de alelos menor & gt0.1 por población. Para cada población, el alelo de la línea central se codificó como el alelo 'A' y el alelo de la línea fundadora se codificó como alelo 'B' (archivo adicional 4). Los datos de genotipado sin procesar de los padres y las líneas DH están disponibles en NCBI Gene Expression Omnibus como conjunto de datos GSE50558 [63].

Análisis de la diversidad genética parental

La diversidad genética entre las líneas parentales se evaluó con marcadores SNP de todo el genoma mediante análisis de coordenadas principales, análisis de conglomerados y mediante una exploración del genoma por pares para detectar polimorfismo entre los padres de cada población. Para obtener más información, consulte el archivo adicional 8.

Construcción de mapas genéticos

Se construyeron mapas genéticos para cada población individual como se describió anteriormente [33] utilizando CarthaGene [64] llamado a partir de scripts R personalizados. En el primer paso, se construyeron mapas de andamios estadísticamente robustos con distancias de marcador de al menos 10 cM. En un segundo paso, se aumentó la densidad de marcadores para producir mapas de marco que contengan tantos marcadores como sea posible, mientras se mantiene una puntuación LOD & gt3.0 para la robustez de los pedidos de marcadores. Por último, los mapas completos se obtuvieron mediante la colocación de marcadores adicionales utilizando bin-mapping [65]. Las distancias CentiMorgan (cM) se calcularon utilizando la función de mapeo de Haldane [66]. Los mapas genéticos individuales y los datos genotípicos utilizados para la construcción de los mapas (archivo adicional 4) se depositaron en MaizeGDB bajo el acrónimo del proyecto CORNFED [67].

Coordenadas del mapa físico de los SNP

Las asignaciones de cromosomas y posiciones de los SNP del BeadChip MaizeSNP50 suministrado por el fabricante (Illumina®, San Diego, CA, EE. UU.) Se basan en el ensamblaje B73 AGPv1 con muchos marcadores que carecen de información sobre un cromosoma y / o posición. Por lo tanto, realizamos un nuevo mapeo de los SNP en el ensamblaje B73 AGPv2 [68] utilizando BWA [69]. Las nuevas asignaciones se utilizaron para todos los análisis relacionados con la información de mapeo físico. Las asignaciones están disponibles en el archivo adicional 4.

Construcción de mapas de Marey desnudos y enmascarados

Dado un cromosoma y el mapa genético asociado de una población individual, determinamos las posiciones de los marcadores en el ensamblaje B73. A partir de estas posiciones físicas y genéticas, construimos un primer mapa de Marey [70] que contiene todos los marcadores sinténicos. Este mapa de Marey se suavizó utilizando interpolaciones spline cúbicas [71], produciendo un mapa de Marey "desnudo" que se vio obligado a ser monótono. Luego, las regiones donde faltaba información cartográfica (por ejemplo, segmentos de EII en los padres) se enmascararon, produciendo mapas de Marey "enmascarados" (archivo adicional 9). El procedimiento detallado se explica en el archivo adicional 8.

Paisajes de recombinación

Una vez que se construyó un mapa de Marey desnudo, definimos la función de paisaje de recombinación como su derivada. Dado que el mapa desnudo era monótono por construcción, las tasas de recombinación fueron positivas como deberían ser. En efecto, esta función de paisaje proporcionó la tasa de recombinación local (en cM por Mbp) para cualquier posición física del ensamblaje B73. Tenga en cuenta que este procedimiento no distingue las regiones donde estas tasas de recombinación se estimaron de manera confiable de aquellas en las que no lo estaban (regiones sin máscara versus regiones enmascaradas). Para las pruebas de comparación, fue necesario recurrir a la imputación, es decir, inferir los datos faltantes de otros mapas de forma conservadora.

Mapas de Marey imputados para pruebas de comparación

Para comparar las longitudes genéticas y los paisajes de recombinación entre dos poblaciones o grupos de poblaciones diferentes, utilizamos mapas de Marey `` imputados '' en los que la información que faltaba en el mapa de Marey enmascarado de cualquiera de las poblaciones fue reemplazada por la información disponible en la otra población. Si una región tenía datos enmascarados en ambas poblaciones, su contenido se imputaba utilizando los datos promediados de todas las demás poblaciones. En todos los casos, el procedimiento de imputación se diseñó de modo que los datos faltantes o poco fiables en cualquiera de las poblaciones a comparar nunca indujeran diferencias artificiales. El procedimiento detallado utilizado para la imputación se explica en el archivo adicional 8.

Comparación de longitudes de mapas genéticos

Para cualquier población dada, los datos de mapeo llevaron a una estimación de la longitud genética de un cromosoma dado. Examinamos las diferencias por pares en la longitud genética entre poblaciones, así como las diferencias entre grupos de poblaciones y las probamos para determinar su nivel de significación estadística. Dichas comparaciones se realizaron a partir de los mapas de Marey imputados con un umbral de significación del 5%, utilizando la función welch.test () en el software R y la corrección conservadora de Bonferroni para pruebas múltiples. El origen de la información (datos originales o imputados a lo largo de los cromosomas) se tuvo en cuenta al comparar poblaciones o grupos de poblaciones. Para obtener más información, consulte el archivo adicional 8.

Efecto de la estructura de la población sobre la tasa de recombinación

Las longitudes de los mapas genéticos tendían a ser más largas en las poblaciones que involucraban a los padres Flint, lo que sugiere que algunos alelos de los factores que controlan la tasa de recombinación pueden fijarse diferencialmente en los dos grupos. Para utilizar una medida sólida y objetiva del grado de "pedernal", estimamos la probabilidad de que las 22 líneas parentales pertenezcan a uno de los dos grupos principales (Dent o Flint). Para ello, estimamos la mezcla en un análisis combinado de los paneles de diversidad Dent y Flint descritos anteriormente [37], que incluyó también las líneas de nuestro estudio. Este análisis se realizó con el software Admixture (versión 1.22) [72], utilizando 25.237 SNP de PANZEA y 559 líneas de maíz. Elegimos k = 2 para el número de grupos asumiendo los dos grupos Dent y Flint, y usamos la probabilidad de que cada una de las 22 líneas parentales pertenezcan al grupo Flint para un análisis de correlación con las tasas de recombinación. Más precisamente, analizamos la correlación entre los GWRR de las 23 poblaciones y el promedio del 'flintness' de los dos padres de cada población utilizando la función lm () del software R. El R 2 asociado especifica qué fracción de la varianza en el GWRR se explica por la estructura de grupo de las líneas parentales. La función lm () también proporciona la PAG valor para probar la ausencia de correlación.

Efectos aditivos individuales para la tasa de recombinación

Las 23 longitudes de mapas genéticos que estimamos mostraron una clara correlación positiva con el "flintness" promedio de los padres en los cruces. Sin embargo, las dos líneas centrales podrían estar impulsando esta correlación. Para eliminar los efectos provenientes de las dos líneas centrales, se consideró un modelo aditivo en el que la GWRR de una población producida por un cruce está dada por el promedio de dos efectos, uno de cada padre en el cruce. Para cada línea fundadora, excepto B73, hay un solo cruce en el que está involucrado. We took the GWRR of that cross and subtracted the GWRR of the cross involving the same central line and B73. This difference gives the individual additive effect of the founder line minus that of B73 up to a constant. This constant does not affect a putative correlation between individual-specific 'flintness' and GWRR. We performed the statistical test for significance of this correlation using the same procedures as in the previous section, central lines and B73 omitted.

Comparing recombination landscapes

Just as the genetic length of chromosome maps may differ, two recombination landscapes can have different features (different shapes of the Marey maps). To test whether these differences were statistically significant, we normalized the genetic lengths of the two maps or pools of maps to be compared, by rescaling both of them to their mean value. Then, to compare the shape of both normalized Marey maps, our approach was based on binning the landscapes, representing each as a histogram and then applying a chi-squared test with a conservative Bonferroni-corrected significance threshold of 5% (Additional file 11). The detailed procedure is explained in Additional file 8.

Interference analyses

CO interference was modeled in the framework of the Gamma model [73], including a second pathway using the sprinkling procedure [11] whereby non-interfering pathway P2 COs are simply added to those of P1. So the features of CO distributions along chromosomes were modeled using two parameters: the intensity nu of interference in the interfering pathway P1, and the proportion pag of COs formed through the non-interfering pathway P2. The detailed implementation of the maximum-likelihood method used to estimate the values of the two parameters nu y pag of the model was described earlier [17].


Agradecimientos

We thank J. Wu for technical support, J. Chen (MD Anderson Cancer Center) for 53BP1 −/− mouse embryonic fibroblasts, M. Jasin (Memorial Sloan-Kettering Cancer Center) for U2OS DR-GFP reporter cells, G. Stewart (University of Birmingham) for RIDDLE cells and S. Janicki (Wistar Institute) and D. Spector (Cold Spring Harbor Laboratories) for the U2OS 2-6-3 reporter cell line. We thank K.M. Miller (University of Texas) and A. Sfeir (New York University) for their critical reading of the manuscript and helpful comments. R.A.G. is supported by grant 1R01CA138835-01 from the National Cancer Institute (NCI), a Research Scholar Grant from the American Cancer Society, a Department of Defense Breast Cancer Idea Award, a UPENN–Fox Chase Cancer Center (FCCC) Specialized Program of Research Excellence (SPORE) Pilot Grant and funds from the Abramson Family Cancer Research Institute and Basser Research Center for BRCA. G.M. acknowledges support from NCI grant 1R01CA132878 and funds from the Mayo Clinic Breast Cancer SPORE NCI grant P50CA116201.


7.4: Crossovers Allow Recombination of Linked Loci - Biology

Understanding the molecular underpinnings of evolutionary adaptations is a central focus of modern evolutionary biology. Recent studies have uncovered a panoply of complex phenotypes, including locally adapted ecotypes and cryptic morphs, divergent social behaviours in birds and insects, as well as alternative metabolic pathways in plants and fungi, that are regulated by clusters of tightly linked loci. These ‘supergenes’ segregate as stable polymorphisms within or between natural populations and influence ecologically relevant traits. Some supergenes may span entire chromosomes, because selection for reduced recombination between a supergene and a nearby locus providing additional benefits can lead to locus expansions with dynamics similar to those known for sex chromosomes. In addition to allowing for the co-segregation of adaptive variation within species, supergenes may facilitate the spread of complex phenotypes across species boundaries. Application of new genomic methods is likely to lead to the discovery of many additional supergenes in a broad range of organisms and reveal similar genetic architectures for convergently evolved phenotypes.


Métodos

Simulaciones

I conducted 200 replicate forward-time simulations of a metapopulation adapting to a heterogeneous spatial environment (Figure 1) with SLiM v. 3.2 (Haller and Messer 2017) to create SNP data for each individual. The simulations resulted in a population that had isolation-by-distance structure along an environmental gradient (p.ej., isolation by environment, Wang and Bradburd 2014). For simplicity in interpreting the results, only one type of genomic heterogeneity was simulated on each LG, such that each LG evolved approximately independently. Each of the 9 LGs were 50,000 bases and 50 cM in length. The base recombination rate nortemir = 0.01 (unless manipulated as described below) gave a resolution of 0.001 cM between proximate bases. The recombination rate was scaled to mimic the case where SNPs were collected across a larger genetic map than what was simulated (similar to a SNP chip), but still low enough to allow signatures of selection to arise in neutral loci linked to selected loci (in the simulations 50,000 bases / (r = 1e-05) * 100 = 50 cM in humans 50,000 bp would correspond to 0.05 cM). Thus, SNPs at the opposite ends of linkage groups were likely to have a recombination rate between them of 0.5 (unlinked), but there would otherwise be some degree of linkage among SNPs within linkage groups. For all LGs, the population-scaled mutation rate nortemiμ equaled 0.001. For computational efficiency, 1000 individuals were simulated with scaling of mutation rate and recombination rate as described above (Fisher 1930 Wright 1931, 1938 Crow and Kimura 1970 Bürger 2000). In the first generation, individuals were placed randomly on a spatial map between the coordinates 0 and 1. Individuals dispersed a distance given by a bivariate normal distribution with zero mean and variance (Table 2).

Example landscape simulation. Each box is an individual, colored by their phenotypic value. The background is the selective environment. This output was generated after 1900 generations of selection by the environment, resulting in a correlation of 0.52 between the phenotype and the environment.


Ver el vídeo: Cruces genéticos cómo predecir la expresión de una característica? (Diciembre 2022).