Información

Secuenciación de bisulfitos específicos de alelos

Secuenciación de bisulfitos específicos de alelos


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Al evaluar el estado de metilación en varios sitios CpG después de la secuenciación, cuánta consideración se debe prestar a las inserciones y deleciones de un solo par de bases al azar. Supongamos que hay un dinucleótido CA; ¿Podemos suponer que la CA es nativa de la secuencia o es el resultado de una deleción de G, especialmente cuando esta última es sospechosa una vez que se compara con otras secuencias? ¿Existe realmente una secuencia estándar establecida para compararlo?


Estoy de acuerdo con Vance, necesitamos un poco más de detalles para responder mejor a su pregunta. Por lo que puedo decir, se está preguntando si un polimorfismo de un solo nucleótido (SNP) que da como resultado la adición de una base de citosina a su secuencia es motivo de preocupación al examinar la firma de metilación de esa secuencia.

Primero determinaría si el polimorfismo es común en la población que usa NCBI. Cuanto más común sea el polimorfismo, es menos probable que tenga un efecto grave. Sin embargo, eso no quiere decir que no tenga ningún efecto.

Luego examinaría cuánto varía la metilación de ese sitio en comparación con las muestras sin la base de citosina adicional.

Finalmente determinaría la importancia de la ubicación del SNP. ¿Está ubicado en una isla CpG? ¿O está ubicado en las orillas, estanterías o 'mar abierto'? (ver trabajo de Sandoval et al.)

Sin conocer todo lo anterior, es difícil hacer una llamada sobre cuán importante / poco importante es el SNP en su análisis de metilación.


El análisis de metilomas y transcriptomas específicos de alelos revela una herencia estable y Cis-Regulación de la metilación del ADN en Nasonia

Afiliaciones Departamento de Biología Molecular y Genética, Cornell University, Ithaca, Nueva York, Estados Unidos de América, Cornell Center for Comparative and Population Genomics, Cornell University, Ithaca, Nueva York, Estados Unidos de América

Departamento de afiliación de biología, Universidad de Rochester, Rochester, Nueva York, Estados Unidos de América

Afiliaciones Departamento de Biología Molecular y Genética, Cornell University, Ithaca, Nueva York, Estados Unidos de América, Cornell Center for Comparative and Population Genomics, Cornell University, Ithaca, Nueva York, Estados Unidos de América


Generando Epireads

El formato original de epiread (propuesto por el equipo de methpipe), solo incluye información relacionada con los CpG. BISCUIT amplía este formato para incluir también información SNP. Las columnas del formato epiread de BISCUIT indican:

  1. Nombre del cromosoma
  2. Leer nombre
  3. Leer posición en secuenciación de extremo emparejado
  4. Hebra de bisulfito (bisulfito Watson (+) o bisulfito Crick (-))
  5. Posición de la citosina en el primer CpG (basado en 0)
  6. Patrón de retención ("C" para retención o "T" para conversión) para todos los CpG cubiertos
  7. Posición del primer SNP, si se proporciona un archivo de ubicación de SNP
  8. Llamada base de todos los SNP cubiertos

Un ejemplo del formato epiread es:

Para producir un archivo con formato epiread, debe ejecutar el subcomando epiread con un archivo BAM, un archivo FASTA del genoma de referencia y, opcionalmente, un archivo BED para SNP.

El archivo SNP BED se puede obtener ejecutando biscuit vcf2bed -t snp my_pilefup.vcf.gz. Si no se proporciona ningún archivo SNP, la salida no incluye las columnas adicionales relacionadas con los SNP. Para recuperar el formato epiread original, ejecute cut -f 1,5,6 en el archivo epiread de salida.

Para probar todos los pares SNP-CpG, incluya el indicador -P en su símbolo del sistema. Tenga en cuenta que si busca metilación específica de alelos, deberá ejecutar con el indicador -P e incluir un archivo SNP BED. Para obtener más ayuda sobre las banderas disponibles, ejecute biscuit epiread en la terminal.


Datos de metilación específicos de alelos semisimulados

Realizamos simulaciones para evaluar cómo el rendimiento de nuestro modelo se relaciona con varios parámetros críticos del conjunto de datos subyacente. Para reflejar las características de rendimiento en conjuntos de datos reales, utilizamos una estrategia llamada datos "semisimulados". Las ubicaciones de las lecturas mapeadas se tomaron de datos reales, al igual que las ubicaciones de los CpG dentro de las lecturas y el genoma de referencia subyacente. Los estados de metilación dentro de esas lecturas se determinaron de acuerdo con perfiles de metilación de alelos únicos o específicos de alelos generados aleatoriamente. Brevemente, dentro de una región designada como AMR, generamos aleatoriamente dos perfiles de metilación al muestrear niveles de metilación de CpG individuales como variantes βeta sesgadas hacia 0 o 1. Luego, asignamos cada lectura con la misma probabilidad a uno de los dos alelos, y los estados de metilación de los CpG dentro de la lectura se muestrearon de acuerdo con las probabilidades dadas por el perfil de metilación correspondiente a ese alelo. Se proporciona una descripción completa de este procedimiento en el Texto SI.

Con los metilomas actuales de BS-seq, esperábamos que la variación en la cobertura a lo largo de los cromosomas fuera un factor crítico para el rendimiento de nuestro modelo. Además, la variación en la distancia entre CpG puede evitar que nuestro método capture ASM en regiones de baja densidad de CpG para una longitud de lectura fija. Examinamos qué tan bien nuestro método podía identificar la MAPE en un intervalo genómico dado manipulando tres variables independientes:

Las coberturas medias fueron <5 ×, 10 ×, 15 ×>, correspondientes a los metilomas actuales de BS-seq.

Las longitudes de lectura fueron <50, 100, 150> bases que se corresponden aproximadamente con las tecnologías actuales de secuenciación de lectura corta.

Las distribuciones de densidad de CpG tomaron tres configuraciones diferentes: islas CpG (CGI) definidas como en la ref. 23, promotores no CGI definidos como 1 kb aguas arriba del sitio de inicio de la transcripción (TSS) en las secuencias de referencia del Centro Nacional de Información Biotecnológica, pero no CGI, y antecedentes genómicos muestreados aleatoriamente con densidad CpG (observada / esperada) entre 0,2 y 0,4.

Los detalles sobre el número de conjuntos de datos simulados para cada combinación de parámetros se pueden encontrar en el Texto SI.

La especificidad fue generalmente muy alta (aproximadamente 99%) para todas las combinaciones de parámetros de simulación, lo que refleja nuestro criterio de selección de modelo conservador (Ecs. 4 y 5). Por el contrario, la sensibilidad mostró una mayor dependencia de las propiedades de los conjuntos de datos. La sensibilidad fue mayor para las regiones de mayor densidad de CpG, como se esperaba porque nuestro modelo depende de las relaciones entre los estados de CpG dentro de una lectura. Como se muestra en la Fig. 1, la sensibilidad del CGI interior alcanzó más del 95% para todas las longitudes de lectura cuando la cobertura media estaba por encima de 10 ×. La sensibilidad alcanzó aproximadamente el 70% para las regiones intergénicas, pero requirió una cobertura de 10 × y una longitud de lectura de 100, lo que compensa la disminución de la densidad de CpG. Como era de esperar, una mayor cobertura y longitud de lectura mejoraron la precisión, y el efecto de la longitud de lectura es equivalente al de la densidad CpG. Estos resultados indican que los metilomas con longitudes de lectura de alrededor de 100 pb y una cobertura media superior a 10 × parecen suficientes para que nuestro modelo identifique con precisión la ASM. La mayoría de los metilomas existentes de los experimentos BS-seq cumplen estos criterios.

Sensibilidad de la identificación de AMR basada en datos semisimulados. Se utilizaron coberturas de 5, 10 y 15 × y longitudes de lectura de 50, 100 y 150 pb. Las densidades de CpG se controlaron simulando dentro de (A) CGI, (B) regiones promotoras no CGI, y (C) regiones intergénicas no CGI.


La metilación específica de alelos ocurre en variantes genéticas asociadas con enfermedades complejas

Planteamos la hipótesis de que el fenómeno de la metilación específica de alelos (ASM) puede ser la base de los efectos fenotípicos de múltiples variantes identificadas por los estudios de Genome-Wide Association (GWAS). Evaluamos la ASM en una población humana y documentamos sus patrones de todo el genoma en una pantalla inicial en hasta 380 678 sitios dentro del genoma, o hasta el 5% de las CpG genómicas totales. Mostramos que, si bien existe una variación sustancial entre individuos, el 5% de los sitios evaluados muestran evidencia de MAPE en al menos seis muestras, la mayoría de estos eventos (81%) están bajo influencia genética. Muchas de estas variantes de ASM reguladas en cis también son eQTL en células mononucleares y monocitos de sangre periférica y / o en alto desequilibrio de ligamiento con variantes vinculadas a enfermedades complejas. Finalmente, enfocándonos en los fenotipos autoinmunes, ampliamos esta pantalla inicial para confirmar la asociación de ASM regulada en cis con múltiples variantes complejas asociadas a enfermedades en una población independiente usando secuenciación de bisulfito de próxima generación. Estas cuatro variantes están implicadas en fenotipos complejos como la colitis ulcerosa y la enfermedad de progresión del SIDA (rs10491434), la enfermedad celíaca (rs2762051), la enfermedad de Crohn, la nefropatía por IgA y la enfermedad inflamatoria intestinal de inicio temprano (rs713875) y la altura (rs6569648). Nuestros resultados sugieren que la ASM regulada en cis puede proporcionar un vínculo mecanicista entre los cambios genéticos no codificantes y la variación fenotípica observada en estas enfermedades y sugiere además una ruta para integrar el estado de metilación del ADN con los resultados de GWAS.

Declaracion de conflicto de interes

Intereses en competencia: Tenemos los siguientes intereses. Este estudio fue financiado en parte por Massachusetts Lions Eye Research Fund, Inc. Research to Prevent Blindness, Inc. y New England Eye Center. No hay patentes, productos en desarrollo o productos comercializados que declarar. Esto no altera nuestra adhesión a todas las políticas de PLOS ONE sobre el intercambio de datos y materiales, como se detalla en línea en la guía para autores.

Cifras

Figura 1. Detección basada en microarrays de alelos específicos ...

Figura 1. Detección basada en microarrays de metilación específica de alelos.

Figura 2. Tipos de candidatos a metilación específicos de alelo.

Figura 2. Tipos de candidatos a metilación específicos de alelo.

Gráficos que muestran el número de diferentes categorías de MAPE ...

Figura 3. Confirmación de metilación específica de alelos regulada por cis en…

Figura 3. Confirmación de metilación específica de alelos regulada por cis en una población independiente.

Los mapas de calor muestran el porcentaje de estado de metilación ...

Figura 4. Contexto genómico de alelos específicos regulados en cis ...

Figura 4. Contexto genómico de eventos de metilación específicos de alelos regulados en cis.


NanoNOMe combina Nanopore y NOMe-seq para extraer el epigenoma específico de alelos

Los gnomos son pequeñas criaturas mágicas que extraen tesoros, por lo que quizás te preguntes si un nanoNOMe es un ser aún más diminuto. Bueno, en realidad es una nueva técnica molecular, pero sus aplicaciones son mágicas. Se han desarrollado varios métodos para analizar la metilación del ADN, los factores de transcripción y el estado de la cromatina simultáneamente. Muchos se basan en el principio de NOMe-seq, que utiliza una metiltransferasa GpC para marcar la cromatina abierta, lo que permite la secuenciación del bisulfito para identificar estos sitios y la metilación del ADN en los sitios CpG. Las principales ventajas de estos enfoques son la salida de datos de una sola molécula, lo que significa que los datos de metilación del ADN y ocupación de nucleosomas provienen de la misma cadena de ADN. Un desafío de estos métodos ha sido que la mayoría de las tecnologías de secuenciación tienen lecturas cortas, lo que significa que esta valiosa información de una sola hebra tiene una escala muy limitada.

El laboratorio de Winston Timp en la Universidad Johns Hopkins quería ampliar la longitud de lectura de estos métodos combinatorios. Para hacer esto, utilizaron secuenciación de nanoporos. Nanopore es único entre las tecnologías de secuenciación por sus lecturas muy largas (& gt10kb) de ADN sin amplificar. En un trabajo anterior, el laboratorio del Dr. Timp ha demostrado que la secuenciación de nanoporos puede llamar con precisión la metilación del ADN utilizando su software Nanopolish. Este es un desafío distinto en comparación con la secuenciación bisfulfite, ya que en este caso el ADN no está amplificado y, por lo tanto, el secuenciador de nanoporos detecta directamente el nucleótido 5mC en sí. En este nuevo estudio, combinaron la secuenciación de nanoporos con la metilación de GpC en un método que llaman secuenciación de nanoporos de ocupación de nucleosomas y metiloma (nanoNOMe). Aplicaron este enfoque en cuatro líneas de células humanas. Esto es lo que encontraron en su expedición minera:

  • Las lecturas largas permiten interrogar elementos repetitivos, lo que es difícil con otros métodos.
    • De todos los elementos repetitivos, solo los elementos Alu muestran un aumento de metilación y la accesibilidad a la cromatina se reduce en todos los elementos repetitivos, especialmente en las regiones LINE y LTR
    • Este enfoque también podría utilizarse para explorar los efectos epigenéticos en los alelos mutados frente a los de tipo salvaje.

    En esencia, nanoNOMe agrega una capa exógena de información al ADN mismo, que se puede usar para almacenar información sobre la ocupación de nucleosomas en la célula y generar un epigenoma humano en fase completa. Esto luego se lee a lo largo de moléculas individuales largas usando secuenciación de nanoporos. Podríamos imaginar muchos usos para este enfoque en modelos de enfermedades y ciencia básica. Por lo tanto, si está extrayendo el epigeNome en busca de sus propios tesoros, considere la posibilidad de realizar una expedición de nanoNOme.


    Resultados

    Patrones de IA a través de marcas epigenómicas

    Para explorar los efectos de la variación genética en el epigenoma, el Proyecto de Epigenómica Hoja de Ruta de los Institutos Nacionales de Salud (NIH) (17) ha completado la secuenciación del genoma completo (WGS) en los genomas de 13 donantes y ha publicado epigenomas de referencia de la hoja de ruta de los NIH de 71 muestras combinadas que representan colectivamente 27 tipos de tejidos distintos y nueve tipos de células (fig. S1). Para una identificación precisa de los loci genómicos heterocigotos, secuenciamos los genomas del donante (18). Se incluyeron ocho ensayos en la mayoría de las muestras y se usaron para la detección de IA: WGBS, secuenciación de ARN (RNA-seq) y secuenciación de inmunoprecipitación de cromatina (ChIP-seq) para seis marcas de histonas diferentes (H3K4me3, H3K4me1, H3K36me3, H3K27me3, H3K9me3, y H3K27ac) (fig. S1). Realizamos un análisis de metilación específico de alelo (ASM) en loci heterocigotos de polimorfismo de un solo nucleótido (SNP) dentro de los 49 metilomas WGBS utilizando un umbral de diferencia de metilación absoluta de & gt30% entre alelos y estimando la significancia mediante la prueba exacta de Fisher sobre los recuentos de citosinas metiladas y no metiladas observadas en la misma secuenciación leída con cada uno de los dos alelos SNP (fig. S2A) (18). Realizamos la identificación de IA para las marcas de histonas y la transcripción utilizando la canalización AlleleSeq (fig. S2B) (18, 19).

    Teniendo en cuenta los IA en todas las marcas, los desequilibrios en la metilación del ADN fueron, con mucho, los más abundantes (tabla S1 y fig. S3), en gran parte debido a la distribución genómica de la metilación del ADN, en contraste con la distribución genómica desigual de otras marcas. . Entre las marcas de histonas, H3K27ac tenía más llamadas de desequilibrio que otras (tabla S1), en parte debido a una cobertura más profunda de ChIP-seq para H3K27ac (tabla S1 y figura S3). En los promotores, las marcas H3K27ac y H3K4me3 fueron más abundantes en el alelo con menos metilación del ADN (Fig. 1A). Por el contrario, la señal de H3K9me3 fue más abundante en el alelo con más metilación en los promotores (Fig. 1A). En los potenciadores, H3K27ac tendió a ocurrir con más frecuencia en el alelo con menos metilación del ADN (Fig. 1A). También detectamos, con alta especificidad, enriquecimiento de IA en metilación y cambios coordinados en la transcripción y las marcas de histonas dentro de la mayoría de los loci impresos que incluían un SNP heterocigoto (figs. S4 y S5) (18).

    (A) Número de IA en marcas de histonas y transcripción, loci ASM superpuesto, sobre clases de elementos genómicos. (B para mi) Proporciones de loci SD-ASM sobre loci heterocigotos totales en contenedores de 200 pb cerca de promotores, islas CpG y potenciadores.

    A continuación, evaluamos el alcance del SD-ASM informado. De acuerdo con los efectos genéticos en cis (6, 2022), la co-ocurrencia de ASM en el mismo locus heterocigoto en diferentes muestras fue mayor de lo esperado por casualidad bajo un modelo nulo basado en permutación (fig. S6A). El grado de co-ocurrencia de ASM tendió a ser mayor para pares de muestras en tejidos del mismo individuo que entre pares del mismo tejido en diferentes individuos, que fue mayor que para muestras sin tejido o individuo coincidente (fig. S6B). La baja concordancia en las llamadas de ASM entre individuos puede deberse al contexto del haplotipo local, la deriva epigenética u otros factores no genéticos (3, 4, 6, 20, 22, 23). Modelado de mezcla gaussiana (18) mostró que las diferencias alélicas en la metilación (por encima del umbral del 30%) en los SNP heterocigotos tenían una tendencia a ocurrir en la misma dirección (el mismo alelo muestra una metilación más alta que el otro) entre pares de muestras (fig. S6, C a E) .

    Con el fin de aumentar la potencia para detectar SD-ASM a alta sensibilidad, agrupamos las lecturas de los 49 metilomas y aplicamos el mismo método de detección que para las muestras individuales (fig. S7A) (18). La cobertura profunda del conjunto combinado (cobertura total de 1691 veces en lecturas de secuenciación de bisulfito en el conjunto combinado de 49 metilomas) aumentó nuestro poder para detectar las IA asociadas a la secuencia que eran detectables en diferentes tejidos y donantes (fig. S7, B a D), mientras que nuestro poder para detectar SD-ASM dependiente de tejido y dependiente del donante se redujo (fig. S8, A y B). El número de loci heterocigotos accesibles (los que tienen al menos seis recuentos por alelo), para la determinación de SD-ASM, después de la combinación aumentó a 4,913,361, aumentando nuestra resolución de mapeo SD-ASM, medida como una distancia promedio entre "índices hets", a 600 pares de bases (pb). En el umbral predeterminado de diferencia de metilación del 30%, los IA se detectaron al 5% de los índices hets, lo que redujo el umbral al 20%, un total de

    La sensibilidad del metiloma a la variación genética varía según las clases de elementos genómicos

    A continuación, exploramos si SD-ASM tenía la tendencia a ocurrir dentro de algún tipo particular de elemento genómico. Usando las lecturas agrupadas en los 49 metilomas, observamos el agotamiento de SD-ASM dentro de los promotores que contienen islas CpG (Fig. 1B), así como dentro de las islas CpG en general (Fig. 1C), lo cual es consistente con las observaciones de que ASM está agotado en islas CpG (4, 21) y que los mQTL se agotan dentro de los promotores de genes dentro de las islas CpG (24, 25) y que la expresión de metilación de rasgos cuantitativos se enriquece dentro de las costas de las islas CpG y no en las islas CpG mismas (26). Por el contrario, y reflejando patrones anteriores de mQTL (25), los promotores de genes que no se encuentran en islas CpG mostraron niveles elevados de SD-ASM (Fig. 1D). También observamos el enriquecimiento de SD-ASM aguas abajo del promotor y en el cuerpo del gen (Fig.1, B y D) y asociación positiva entre la expresión específica de alelo (ASE) y ASM sobre exones (Fig.1A), que es consistente con mayor metilación de regiones transcritas activamente, incluidas las del cromosoma X (27) y con el enriquecimiento de mQTL en las regiones que flanquean el sitio de inicio de la transcripción (TSS) (23, 28). Un factor que contribuye a la ASM, particularmente cerca de los sitios de inicio de la transcripción (Fig. 1D), puede ser la presencia de señales reguladoras de la transcripción (29).

    SD-ASM también se enriqueció mucho en potenciadores (Fig. 1E), lo que es consistente con informes anteriores (24, 28). La abundancia de sitios de unión de TF dentro de los potenciadores sugiere que SD-ASM puede resultar de la interrupción de la unión de TF (23). Bajo esa suposición, nuestros datos sugieren que la unión de TF en las islas CpG y los promotores ricos en CpG está amortiguada contra las perturbaciones genéticas, mientras que la unión de TF a los promotores y potenciadores no CpG es más sensible. También observamos un agotamiento leve algo desconcertante de SD-ASM en las regiones flanqueantes de los potenciadores (Fig. 1E), lo que también sugiere un almacenamiento en búfer en esas regiones.

    SD-ASM es atribuible a diferencias entre los espectros de frecuencia epialélicos específicos de alelo

    A continuación, preguntamos si la falta de amortiguación en los loci SD-ASM puede resultar en un exceso de estocasticidad y metaestabilidad, que se define por la presencia de más de un estado estable, cada estado estable corresponde a un epiallelo (patrón de metilación de un solo cromosoma). Para responder a esta pregunta, hicimos uso de la cobertura de lectura WGBS combinada profunda en 49 metilomas (tabla S2) y que cada lectura relaciona una única variante con un solo epiallelo. Evaluamos los epiallelos puntuando el estado de metilación de cuatro sitios CpG homocigotos (4 2 = 16 epiallelos posibles) que eran los más cercanos a cada índice het en lecturas WGBS individuales (13, 14) (Figura 2A). [Nuestro uso del término "epiallele" sigue al uso más reciente (12, 13) y no cumple con la definición original (30), lo que implica herencia intergeneracional. Nuestro uso del término "metaestabilidad" es consistente con su uso en la teoría de sistemas dinámicos y no implica la herencia de un epialélico durante la división celular.]

    (A) Ejemplo de un espectro de frecuencia epialélico (abajo) derivado de los epialélicos observados en lecturas WGBS (arriba). (B) Histogramas de entropía de Shannon, en bits, para los espectros de frecuencia epialélicos para los hets que muestran SD-ASM (rojo) y los hets más cercanos (control) sin SD-ASM (negro). (C) La mayoría de los loci heterocigotos con dos epiallelos frecuentes muestran SD-ASM y tienen una entropía mayor de 1,7 bits (parte roja de la barra), siendo los dos epiallelos bifásicos (totalmente metilados o totalmente sin metilar) el 71,7% del tiempo. La llamada de la derecha proporciona un ejemplo de un het en el que la diferencia entre los espectros de frecuencia epialélicos del alelo 1 (A, naranja) y el alelo 2 (G, azul) explica SD-ASM. (D) Histograma de coeficientes de restricción para loci SD-ASM con dos epiallelos frecuentes. Los rótulos ilustran un ejemplo het (T / C, rótulo superior derecho) con un bajo coeficiente de restricción, y otro (G / C, rótulo inferior derecho) con un alto coeficiente de restricción. (mi) Ilustración del almacenamiento en búfer en contraste con la metaestabilidad ergódica / periódica y en mosaico.

    Para cuantificar la cantidad de estocasticidad en el índice het loci, usamos la entropía de Shannon (18). Los valores de entropía variaron de 0 a 4: una distribución uniforme de frecuencias a través de los 16 patrones epialélicos posibles produce una puntuación máxima de entropía de 4 bits, mientras que una ausencia completa de estocasticidad debido al "búfer" máximo implica solo un epiallelo con una frecuencia distinta de cero y una puntuación de entropía de 0 bits. Para evaluar cuantitativamente cualquier diferencia en el almacenamiento en búfer (falta de sensibilidad a la variación genética) entre SD-ASM y loci de control, identificamos loci SD-ASM que tenían suficiente cobertura y un índice cercano het sin ASM y comparamos entropías. Un total de 6619 (2,7%) de 241,360 loci con SD-ASM cumplieron los dos criterios (18). Observamos una notable diferencia en la entropía, proporcionando una evaluación cuantitativa de la mayor estocasticidad en el SD-ASM frente a los loci de control (Fig. 2B).

    A continuación, examinamos el enriquecimiento de polimorfismos epigenéticos en loci SD-ASM. Estimamos el número de epiallelos frecuentes para cada locus clasificando los epiallelos del más al menos frecuente e identificamos la “lista superior” de tamaño mínimo de epiallelos que representaron al menos el 60% de todas las lecturas con epialleles comprobados. En contraste con los loci de control, que por lo general tenían solo un epiallelo de alta frecuencia en la "lista superior" y, por lo tanto, no eran polimórficos epigenéticamente, los loci SD-ASM mostraron múltiples epiallelos frecuentes; en la mayoría de los casos, solo dos (Fig. 2C) . Al examinar los pares superiores de epialélicos, encontramos que el 71,7% de los pares consistía en uno que estaba completamente metilado y otro completamente sin metilar (Fig. 2C). Esto concuerda con informes anteriores de distribuciones bifásicas (completamente metiladas y completamente no metiladas) de metilación en amplicones con alta varianza de metilación interindividual y en clones de reacción en cadena de la polimerasa con patrones de metilación bimodal (3, 31). Los IA en los loci SD-ASM podrían atribuirse a cambios en los espectros de frecuencia epialélicos entre alelos, típicamente cambios en las frecuencias relativas de los epiallelos completamente metilados y completamente no metilados (Fig. 2C). Validamos el exceso de estocasticidad observado y el enriquecimiento del patrón bifásico en los loci SD-ASM utilizando un conjunto de datos WGBS independiente de la Encyclopedia of DNA Elements (ENCODE) (fig. S9, A a C) (18).

    A continuación, cuantificamos la relación entre la variación genética y las epiallelas estocásticas. En cada locus, estimamos las probabilidades de epiallelos para cada alelo (las probabilidades más altas se indican mediante flechas más gruesas en la Fig. 2, C y D). Luego cuantificamos el grado en que los alelos genéticos determinan las frecuencias epialélicas usando un coeficiente de restricción (18), una medida teórica de la información que es una generalización de la R 2 coeficiente de determinación que se usa comúnmente en genética y es más apropiado para cuantificar la determinación genética de fenotipos estocásticos. Un valor mayor para el valor del coeficiente de restricción significa que la variación epigenética está más restringida y determinada por la variación genética en cis. Intuitivamente, un mayor coeficiente de restricción indica una mayor diferencia en los espectros de frecuencia epialélicos correspondientes a los dos alelos, lo que implica un mayor grado de determinación de los espectros de frecuencia epialélicos por los alelos genéticos (Fig. 2D).

    Hay dos modelos mecanicistas generales que podrían explicar el efecto de la variación de secuencia en cis sobre los espectros de frecuencia epialélicos. El modelo ergódico / periódico estipula un cambio continuo entre estados metaestables, siendo las transiciones estocásticas con un posible componente de periodicidad, como las oscilaciones circadianas. Si se produce un número suficiente de transiciones estocásticas de un epialélico a otro, ese espectro de frecuencia epialélico depende en gran medida de la forma dependiente de la secuencia del panorama energético actual (probabilidades de transición de estado) y no de la memoria epigenética de eventos pasados ​​(Fig. 2E). . Por el contrario, el modelo de mosaico estipula que los epialélicos se transmiten de forma estable a lo largo del tiempo e incluso durante la división celular, y se "congelan" después de un período de metaestabilidad inicial en uno de los estados estables. Ambos modelos conllevan un período de metaestabilidad, ya sea pasado (mosaicismo) o actual (modelo ergódico / periódico).

    Los loci de unión de CTCF muestran conmutación y bucle estocásticos dependientes de la secuencia

    Debido a su asociación con la metilación del ADN en un gran número de sitios de unión, a continuación examinamos el papel del factor de unión a CCCTC (CTCF) en la creación de estados metaestables que corresponden a epiallelos. Se sabe que la metaestabilidad se crea mediante bucles de retroalimentación positiva (incluidos los dobles negativos) (32) que en nuestro caso también incluyen interacciones en cis, como la protección contra la metilación del ADN por la unión de CTCF y la preferencia recíproca de CTCF por el ADN no metilado (33). La primera indicación del papel de la unión de CTCF en la metaestabilidad provino de la observación de que el heterocigoto con el mayor coeficiente de restricción (G / C het) también mostró mayores diferencias en la afinidad de unión de CTCF predicha entre los dos alelos que el otro (T / C het) (Fig. 2D). Considerando que el coeficiente de restricción es proporcional a las diferencias en los espectros de frecuencia epialélicos para los dos alelos (espectros de frecuencia epialélicos idénticos que dan como resultado un valor de coeficiente de restricción de 0), esta observación sugirió una correlación positiva entre el coeficiente de restricción y las diferencias en CTCF afinidad de unión por los dos alelos genéticos, que de hecho se observó (Fig. 3A). En términos de la distorsión del paisaje epigenético debido a la variación genética, vemos que las variantes de secuencia que muestran mayores diferencias en la afinidad de unión de CTCF también muestran mayores diferencias en sus paisajes epigenéticos (energía), como se refleja en los cambios más prominentes entre alelos en su ocupación de estados metaestables (medidos por valores más altos de coeficiente de restricción) (Fig. 3A, arriba). Debido a que la unión de CTCF y la desmetilación de su sitio de unión se refuerzan mutuamente (formando un bucle de retroalimentación positiva y un estado metaestable), el modelo también predice que las variantes asociadas con afinidades de unión de CTCF más altas mostrarán una metilación más baja, que de hecho es el caso (Fig. . 3A, abajo) como se observó anteriormente (23, 24). Tomados en conjunto, estos resultados sugieren un cambio epigenético estocástico dependiente de la secuencia entre estados metaestables que está mediado por la unión de CTCF.

    (A) (Arriba) Correlación entre las diferencias absolutas de afinidad de unión a CTCF, según las puntuaciones de la matriz de peso de posición (PWM), y el coeficiente de restricción para los sitios de unión de CTCF pronosticados con SD-ASM, dos epialélicos frecuentes y un patrón de metilación bifásico. (Abajo) Correlación entre la afinidad de unión de CTCF y la metilación del ADN en los sitios de unión de CTCF predichos. (B) SD-ASM predice más el bucle alélico (28 verdaderos positivos de 44 predicciones) que las puntuaciones de interrupción de motivos (1 verdadero positivo de 44 predicciones). Para controlar la especificidad, se seleccionaron umbrales de modo que ambos métodos predijeran el mismo número de hets (44) para mostrar bucles alélicos. (C) SD-ASM en los sitios de unión de 377 TF definidos con el método SELEX. El gráfico circular (izquierda) y la tabla (derecha) indican tanto los enriquecimientos como las tendencias de direccionalidad utilizando un código de color compartido. (D) (Arriba) Correlación entre las diferencias absolutas de afinidad de unión de ELK3 y el coeficiente de restricción para los sitios de unión pronosticados con SD-ASM, dos epiallelos frecuentes y un patrón de metilación bifásico. (Abajo) Correlación entre la afinidad de unión de ELK3 y la metilación del ADN en los sitios de unión de ELK3 predichos. (mi) Un modelo mecanicista de un paisaje de energía dependiente de la secuencia con dos estados metaestables: el alelo 1 (fila superior), correspondiente a un paisaje donde el estado metaestable ocupado con mayor frecuencia corresponde a un epiallo completamente sin metilar, y el alelo 2 (fila inferior), correspondiente a un paisaje donde el estado metaestable más frecuentemente ocupado corresponde a un epialélico completamente metilado. Los bucles de retroalimentación positiva putativos que implican interacciones entre la unión de TF y la metilación del sitio de unión están indicados para CTCF. Un modelo alternativo que implica la unión competitiva de dos TF se indica a la derecha. La significancia de las correlaciones se probó mediante el uso de Student's t prueba.

    Debido a que el CTCF TF establece bucles de cromatina (34), preguntamos si el estado alélico de metilación también coincidía con el bucle alélico. Con este objetivo, utilizamos un estudio (35) que informa loci de SNP heterocigotos que se asocian tanto con la unión alélica de CTCF como con el bucle de cromatina alélico, según se determina mediante análisis de interacción de cromatina mediante secuenciación de etiquetas de extremos emparejados (ChIA-PET). De hecho, un total de 44 de esos loci SNP también estaban presentes en nuestro conjunto de datos. La comparación de nuestras señales para el estado de metilación de los sitios de unión de CTCF con las puntuaciones de interrupción del motivo de CTCF predichas sugirió que SD-ASM es un indicador más preciso de la unión y bucle de CTCF alélico que la puntuación de interrupción de motivo (Fig. 3B) (18).

    Los sitios de unión de TF muestran cambios dependientes de la secuencia en los espectros de frecuencias epialélicas y los IA

    Los análisis de ASM en elementos reguladores y eQTL revelaron asociaciones entre ASM y marcas de histonas específicas de alelo con la transcripción específica de alelos descendente (fig. S10, A a F) (18). Estos resultados complementaron estudios previos (22, 23) y sugirió la participación de cofactores y unión de TF específicos de alelo en ASM. Para examinar el papel de la unión de TF específicos al alelo, nos centramos en el conjunto de 377 TF evaluados para determinar la afinidad de unión utilizando la evolución sistemática de ligandos de alto rendimiento mediante el método de enriquecimiento exponencial (SELEX) (36). En cuanto a CTCF, identificamos el subconjunto de loci de motivos de unión en un estado heterocigoto con dos epiallelos frecuentes y examinamos la correlación entre el coeficiente de restricción y la diferencia en las afinidades de unión alélicas predichas a través de estos loci para cada TF (tabla S3). Debido al número relativamente pequeño de tales loci por TF, solo 13 mostraron PAG valores (del estudiante t prueba, PAG & lt 0.05), con solo CTCF superviviente a la corrección de Bonferroni (para probar 377 TF) (tabla S3). However, a majority (11 of 13) of the TFs that showed individually significant correlation also showed positive correlation (PAG = 0.01, binomial test), which is consistent with the pattern observed for CTCF where larger differences in TF binding affinities correspond to larger distortions in the configuration of metastable states within the landscape (table S3).

    Likewise, we next examined for all 377 TFs whether disruptions of their predicted binding sites associated with methylation imbalances. A majority (241) showed SD-ASM enrichment within their binding motifs compared with flanking loci (500 bp on each side) (Fig. 3C and table S4), suggesting that TF binding associates with allelic DNA methylation. The SD-ASM outside of the examined motifs may be attributable to sequence variation within undiscovered binding loci, within motifs of noncoding RNAs, or within loci in physical proximity or contact with regions of perturbed TF activity.

    We then examined the relation between allelic differences in motif strengths and methylation levels at SD-ASM loci (18). We observed that for more than half of the TFs tested (207), there was an association between motif strength and level of methylation (Fig. 3C). Most TFs (159) showed gain in methylation on the allele with the disrupted motif, which is consistent with the TF binding either protecting a region from passive methylation (37) or causing active demethylation (Fig. 3C) (38). By contrast, a smaller number of TFs (48), including members of TF families that recruit methyltransferases such as the ETS-domain TF family members (39, 40), showed loss of methylation on the allele with the disrupted motif (Fig. 3, C and D). About a quarter of TFs that show enrichment for SD-ASM show no bias in directionality (table S4), the lack of bias being explainable by contextual behavior at different binding loci, such as for nuclear factor of activated T cells 1 (41) or because of competing TFs at overlapping motifs. Our results support that TF motif sequences are predictive of proximal CpG methylation levels (23, 42, 43).

    We sought to validate the downstream functional consequences of SD-ASM variants, with predicted allelic differences in TF binding, using a luciferase assay. We prioritized cis-overlapping motifs (CisOMs), including those of c-MYC proto-oncogene (cMYC) and tumor suppressor p53 (TP53) that show competitive binding at many loci (44), because CisOMs provide one of the mechanisms of metastability (Fig. 3E), and also those that may have consequences for human disease (table S5). All four SNP validations showed allelic effects on luciferase expression, including two SNPs within CisOMs for cMYC and TP53 and some falling within disease-associated loci (fig. S11) (18), which suggests that SD-ASM helps identify those disease-associated variants that also have functional consequences.

    SD-ASM is enriched near disease-associated loci

    We observed that heterozygous variants with SD-ASM were enriched in the neighborhood of variants previously reported as significant in genome-wide association studies (GWASs) of common disease (Fig. 4A) (22, 23, 45). The enrichment was stronger around GWAS variants that have been replicated in multiple studies versus those that have not. To explore more specifically the role of enhancers, we performed a similar enrichment analysis focusing only on GWAS and SD-ASM variants overlapping enhancer elements. Enhancers that contain replicated GWAS variants were significantly (PAG < 0.0001, χ 2 test) more likely to also contain a variant with SD-ASM than enhancers that did not contain replicated GWAS variants (Fig. 4B). Taken together, these results indicate that AIs provide information about the role of specific loci in common diseases, pointing to the loci that are sensitive to the effects of genetic variation and have functional effects. The enrichment of both GWAS loci and AIs at enhancers, and sensitivity of TF binding to genetic variation discussed in previous sections, provide a mechanistic link between AIs and GWAS associations.

    (A y B) Enrichment of ASM in the proximity of GWAS loci. ASM hets within 1 kb of GWAS loci are compared with colocalized hets without ASM. (C para F) Evidence of purifying selection acting on rare variants with ASM. [(C) and (D)] Proportion of variants associated with ASM compared with those without ASM among the rare (DAF < 1%) variants across individual methylomes. [(E) and (F)] Proportion of loci with ASM over total heterozygous loci over windows of increasing DAF in the combined set of methylomes. (F) This bar chart summary of the data in (E) shows the excess of SD-ASM variants among those with DAF < 1%. χ 2 tests were used for significance of enrichments.

    Variants showing SD-ASM are under purifying selection

    Because the variants with large effects are under purifying selection, they tend to be rare, with frequencies below the detection threshold of association studies such as GWAS, mQTL, and eQTL. By contrast, AIs may provide evidence for functional effects even for rare variants that may be detected in only one individual. On the basis of previous studies that have used signatures of purifying selection such as shifts toward smaller derived allele frequency (DAF) to identify functional variants (46, 47), we would expect that ASM variants would also tend to have a lower DAF than those without ASM. Therefore, we obtained DAF estimates from the 1000 Genomes Project (48), ignoring variants that overlapped regions with low accessibility to variant calling. We observed that in nearly every sample in our dataset, heterozygous variants with ASM were significantly (PAG < 0.05, χ 2 test) more likely to have DAF smaller than 1% than were those without ASM (methylation difference between alleles < 5%) (Fig. 4C). Overall, this analysis found

    130 (median) more rare (DAF < 1%) variants than expected among those with ASM per individual methylome, providing a lower bound on the number of those under purifying selection per individual. When we repeated the analysis for enhancer regions, strong signal was again observed (Fig. 4D), suggesting a median excess of at least 26 enhancer variants under purifying selection per individual.

    The lower bounds from individual samples may underestimate the extent of purifying selection because of underdetection of SD-ASM. We therefore investigated whether an enrichment for rare variants could also be seen for those variants associated with SD-ASM from the combined dataset, using neighboring variants as controls (18). We observed that the chance of a locus having SD-ASM decreased as the derived allele frequency increased (Fig. 4E there were very few variants with DAF > 50%, causing high variance and large confidence intervals). We further tested whether there was a significant enrichment for variants with DAF < 1% among those with SD-ASM and found that such enrichment was indeed significant (odds ratio 1.18 PAG < 0.0001, χ 2 ) (Fig. 4F). That enrichment represents an excess of 2184 rare variants among those with SD-ASM compared with controls. Considering that this observed excess represents a set of 11 genomes (nine individuals and two cell lines), we estimate at least

    200 variants with SD-ASM under purifying selection per individual donor.


    Allele specific cloning efficiency after bisulfite treatment - (Sep/20/2005 )


    I hope my question is appropriate for this bioforum. I performed a bisulfite treatment on genomic DNA (EZ methylation kit, Zymo) and performed nested-PCR on that genomic DNA to amplify specific imprinted genes.

    I sent the PCR product to sequence and I could see on the Chroma file that some T/C peaks were juxtaposing each other. involving that I amplified both alleles in the PCR reaction (as was previously discussed here).

    I cloned the PCR product in P-Drive and sent 10 clones to sequence. and the results seems weird to me. far from the 50/50 I was expecting. I have to mention that I had a lot of trouble getting 10 clones to sequence. bacteria would not grow easily and the yield of my minipreps were very low (for some samples I had to do 20 minipeps to get 10 to sequence. but miniprep issuesare not the point here. )

    The point is: Is it possible that cloning efficiency depends on the allele inserted in the cloning vector? Can some "cloning bias" be introduced such that one bisulfite-treated allele is more easily cloned than the other?

    Anyone has an idea about that? Or got stuff that looks like mine??

    I am curious what differences are there between the two alleles, different methylation, polymorphism?

    When we deal with imprinted genes, we may expect different methylation patterns between the two alleles depending on the maternal/paternal origin of the allele. one allele may be hypermethylated and the other hypomethylated.

    Chroma files showed that I'm amplifying both alleles in my PCR. (if you refer to my first posted message)

    So is it possible that cloning efficiency is not the same for both alleles after bisulfite treatment?

    I don't know if there is a clone bias for methylated allele. It may be possible. But, the under-representation of unmethylated allele in your sequencing clones may due to sampling error because you hardly got 10 colonies in total. I usually don't have any problem obtaining more than hundreds of colonies for sampling. You may want to try Topo cloning kit. I found that result from clone sequencing is consistent to that from direct sequencing.

    Yeah I thought it might be some cloning issues. but I also thought it would not harm to investigate about other possibilities. I'll look for that Topo cloning. thanks pcrman!


    Published online:

    Figure 1 (A) Dlk1-Gtl2 imprinting cluster, including transcriptional start sites (arrows) and transcription units (hatched boxes). (B) Portion of IG-DMR analyzed in this study. The 458 bp region analyzed by bisulfite mutagenesis and DNA sequencing corresponds to positions 110,766,298-110,766,755, NC_000078.5 (black box). Polymorphisms (*) between C57BL/6J and Mus musculus castaneus are as follows: (B6/CAST): 110,766,439 (A/G), 110,776,579 (G/A), 110,766,774 (G/A), 110,766,902-110,766,904 (TTT/TT), 110,767,052 (A/G). (C) Schematic of the Gtl2-DMR, including the Gtl2 transcriptional start site (arrow) and exon 1 (hatched box) +1 corresponds to position 110,779,206. Regions analyzed correspond to positions 110,778,378-110,778,966 and 110,779,331-110,780,052. Polymorphisms are as follows: 110,779,741 (G/A), 110,779,881 (A/G), 110,780,030-110,780,031 (AA/GC).

    Figure 1 (A) Dlk1-Gtl2 imprinting cluster, including transcriptional start sites (arrows) and transcription units (hatched boxes). (B) Portion of IG-DMR analyzed in this study. The 458 bp region analyzed by bisulfite mutagenesis and DNA sequencing corresponds to positions 110,766,298-110,766,755, NC_000078.5 (black box). Polymorphisms (*) between C57BL/6J and Mus musculus castaneus are as follows: (B6/CAST): 110,766,439 (A/G), 110,776,579 (G/A), 110,766,774 (G/A), 110,766,902-110,766,904 (TTT/TT), 110,767,052 (A/G). (C) Schematic of the Gtl2-DMR, including the Gtl2 transcriptional start site (arrow) and exon 1 (hatched box) +1 corresponds to position 110,779,206. Regions analyzed correspond to positions 110,778,378-110,778,966 and 110,779,331-110,780,052. Polymorphisms are as follows: 110,779,741 (G/A), 110,779,881 (A/G), 110,780,030-110,780,031 (AA/GC).

    Published online:

    Figure 2 Paternal allele-specific methylation of the IG-DMR is inherited from sperm. Bisulfite mutagenesis and sequencing of DNA from B6 × CAST and CAST × B6 F1 hybrid liver and B6 × CAST F1 hybrid spermatozoa. Each circle represents one of 32 potentially methylated CpG dinucleotides, the first one located at position 110,766,345 (NC_000078.5). Each row of circles represents an individual strand sequenced. Filled circles represent methylated cytosines, open circles represent unmethylated cytosines, absent circles represent positions at which methylation data was not obtained.

    Figure 2 Paternal allele-specific methylation of the IG-DMR is inherited from sperm. Bisulfite mutagenesis and sequencing of DNA from B6 × CAST and CAST × B6 F1 hybrid liver and B6 × CAST F1 hybrid spermatozoa. Each circle represents one of 32 potentially methylated CpG dinucleotides, the first one located at position 110,766,345 (NC_000078.5). Each row of circles represents an individual strand sequenced. Filled circles represent methylated cytosines, open circles represent unmethylated cytosines, absent circles represent positions at which methylation data was not obtained.

    Published online:

    Figure 3 Methylation of the paternal IG-DMR is maintained during pre- and post-implantation development. Bisulfite mutagenesis and sequencing of DNA from B6 × CAST F1 hybrid embryos. Details as described in Figura 2.

    Figure 3 Methylation of the paternal IG-DMR is maintained during pre- and post-implantation development. Bisulfite mutagenesis and sequencing of DNA from B6 × CAST F1 hybrid embryos. Details as described in Figura 2.

    Published online:

    Figure 4 Paternal allele-specific methylation of the Gtl2-DMR is not inherited from sperm. Each circle represents one of 29 potentially methylated CpG dinucleotides, the first one located at position 110,779,349 (NC_000078.5). Details as described in Figura 2.

    Figure 4 Paternal allele-specific methylation of the Gtl2-DMR is not inherited from sperm. Each circle represents one of 29 potentially methylated CpG dinucleotides, the first one located at position 110,779,349 (NC_000078.5). Details as described in Figura 2.


    These authors contributed equally: Qiyang Li, Zhongju Wang, Lu Zong, Linyan Ye

    Afiliaciones

    Department of Medical Genetics, School of Basic Medical Sciences, and Guangdong Technology and Engineering Research Center for Molecular Diagnostics of Human Genetic Diseases, Southern Medical University, Guangzhou, Guangdong, China

    Qiyang Li, Zhongju Wang, Lu Zong, Linyan Ye, Junping Ye, Haiyan Ou, Bo Guo, Wenquan Liang, Jian Zhang, Yong Long, Yu Hou, Lin Zhou, Shufen Li & Cunyou Zhao

    Key Laboratory of Mental Health of the Ministry of Education, Guangdong-Hong Kong-Macao Greater Bay Area Center for Brain Science and Brain-Inspired Intelligence, and Guangdong Province Key Laboratory of Psychiatric Disorders, Southern Medical University, Guangzhou, Guangdong, China

    Qiyang Li, Zhongju Wang, Linyan Ye, Junping Ye, Bo Guo, Wenquan Liang, Shufen Li & Cunyou Zhao

    Reproductive and Genetic Hospital, The First Affiliated Hospital of USTC, Division of Life Sciences and Medicine, University of Science and Technology of China, Hefei, China

    The Third People’s Hospital of Zhongshan, Zhongshan, Guangdong, China

    Department of Psychiatry, the Affiliated Brain Hospital of Guangzhou Medical University (Guangzhou Huiai Hospital), Guangzhou, Guangdong, China

    Qiong Yang, Fengchun Wu & Xingbing Huang

    Guangdong General Hospital, Guangdong Academy of Medical Science and Guangdong Mental Health Center, Guangzhou, China


    Ver el vídeo: PCR: Reacción en Cadena de la Polimerasa divulgación científica IQOG-CSIC (Mayo 2022).


Comentarios:

  1. Shashakar

    Linda idea

  2. Kirr

    Inequívocamente, una respuesta rápida :)

  3. Nami

    Creo que estas equivocado. Propongo discutirlo. Envíeme un correo electrónico a PM, hablaremos.

  4. Doukasa

    No eres como el experto :)



Escribe un mensaje