Información

Tasas de mutación viral y replicación

Tasas de mutación viral y replicación



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

TL; DR

¿Cuál es la relación entre lo siguiente?

  • Tasas de mutación (expresado como "mutaciones por año" para un virus como, por ejemplo, COVID-19 (SARS-CoV-2). Por ejemplo, este artículo menciona "La tasa parece ser de 24 mutaciones por año"
  • Real virión replicación tasas de error en un célula huésped única, medido como p. ej. tasas de error por virión liberado de la célula infectada, es decir, (número de viriones liberados mutados) por célula infectada.

Supuestos

Asumiría que las mutaciones ocurren en un solo nivel de célula de virión porque hay diferencias en, por ejemplo, nucleótidos en el ARN entre:

  • el virión que infecta una célula (por ejemplo, ACE2 para SARS-CoV-2)
  • los viriones liberados de esa misma célula única

Si es así, ¿no se argumentaría que:

  • errores de replicación (en el nucleótido y, por lo tanto, en el nivel del virión liberado) puede suceder fácilmente, potencialmente miles de millones de veces durante la infección de un solo huésped organismo
  • no existe una mutación "única con éxito" o variante de ARN dentro de un anfitrión, sino que tenemos una distribución de ARN, muchos de los cuales podrían transmitirse simultáneamente a otro organismo huésped?

Más contexto

Cito p. Ej. este papel:

A nivel por sitio, los virus de ADN típicamente tienen tasas de mutación del orden de 10E-8 a 10E-6 sustituciones por sitio de nucleótidos por infección celular (s / n / c). Virus de ARN, sin embargo, tienen tasas de mutación más altas que oscilan entre 10E − 6 y 10E − 4 s / n / c

Una vez más, ¿no significaría eso que un anfitrión único podría 1) generar fácilmente muchas mutaciones del mismo virus y 2) pasar la mayoría de esas mutaciones generadas de forma única a otro huésped? Si es así, ¿por qué podemos simplemente decir "24 mutaciones (en el tiempo) por año"?


Como nadie más lo ha hecho, solo ampliaré lo que ocurrió aquí en los comentarios (principalmente de @Alex Reynolds):

tl; dr: existe la selección natural.

Versión más larga:

  1. Mutaciones / errores de replicación / cualquier cosa que suceda en la creación de nuevas partículas de virus dentro de una célula huésped. Existe cierta distribución del número de eventos mutacionales que ocurrirán en función del número de nuevas moléculas de ARN creadas por célula y la tasa de error de replicación. Algún subconjunto de estas moléculas de ARN se empaquetará en nuevas partículas, produciendo una nueva generación de virus que tendrán la oportunidad de infectar. Sí, esto es potencialmente una gran cantidad de nuevas mutaciones por evento de infección.
  2. Una gran proporción de estas nuevas partículas contendrá ARN no funcionales, debido a mutaciones inactivadoras de un tipo u otro. La mayoría de las nuevas mutaciones serán peores al ser un virus que el virus que las infectó originalmente (su padre inmediato). Por lo tanto, serán superados por las formas no mutadas.
  3. Entre todos aquellos virus que continúan infectando con éxito a lo largo de un año, en promedio observamos 24 mutaciones de sustitución en el genoma a lo largo de ese año. Todas las cadenas de transmisión incluidas en el grupo de virus al final del año deben haber permanecido viables para la infección de los huéspedes. En otras palabras, ha sobrevivido a la selección natural.

En genética de poblaciones, este fenómeno se conoce como "equilibrio de selección de mutación", p. Ej. surgen nuevas mutaciones en la población a un ritmo limitado por la acción de la selección natural (en equilibrio).

Mapas de genotipo-fenotipo

Por supuesto, lo que dejo sin decir es exactamente por qué "... las nuevas mutaciones serán peores al ser un virus que el virus que las infectó originalmente ..."

Esto es muy difícil de predecir en muchos casos. En algunos casos, es muy obvio por qué un mutante es malo para ser un virus, si p. Ej. un gen esencial se elimina del genoma del ARN. Pero para muchas mutaciones únicas, no entendemos realmente cuál será su efecto en la función del virus, solo observamos que abandonan la población debido a la selección negativa.

Si está interesado en esta pregunta, le recomiendo buscar mapas de genotipo-fenotipo. Sé que Jesse Bloom ha trabajado un poco sobre la influenza en este campo, aquí hay un ejemplo de dicho artículo. En general, es extremadamente laborioso realizar este tipo de trabajo, por lo que se sabe relativamente poco sobre el efecto funcional de cualquier mutación específica en un genoma específico.

Espero que sea útil tener todo eso escrito.


Una compensación de velocidad-fidelidad determina la tasa de mutación y la virulencia de un virus de ARN

Las tasas de mutación pueden evolucionar a través de la deriva genética, la selección indirecta debido al autostop genético o la selección directa sobre el costo fisicoquímico de la alta fidelidad. Sin embargo, para muchos sistemas, ha sido difícil desenredar empíricamente el impacto relativo de estas fuerzas. En los virus de ARN, una correlación observada entre la tasa de mutación y la virulencia ha llevado a muchos a argumentar que sus tasas de mutación extremadamente altas son ventajosas porque pueden permitir una mayor adaptabilidad. Este argumento tiene profundas implicaciones porque sugiere que la patogénesis en muchas infecciones virales depende de mutaciones raras o de novo. Aquí, presentamos datos para un modelo alternativo mediante el cual los virus de ARN evolucionan con altas tasas de mutación como un subproducto de la selección para aumentar la velocidad de replicación. Encontramos que un antimutador de poliovirus, 3DG64S, tiene un defecto de replicación significativo y que las poblaciones de tipo salvaje (WT) y 3DG64S tienen una adaptabilidad similar en 2 entornos celulares distintos. La evolución experimental de 3DG64S bajo selección para la velocidad de replicación condujo a la reversión y compensación del fenotipo de fidelidad. Los ratones infectados con 3DG64S exhibieron una morbilidad retardada a dosis muy por encima del nivel letal, consistente con la atenuación por un crecimiento más lento en contraposición a un suministro mutacional reducido. Además, la compensación del defecto de crecimiento 3DG64S restauró la virulencia, mientras que la compensación del fenotipo de fidelidad no lo hizo. Nuestros datos son consistentes con el modelo cinético de corrección de pruebas para reacciones biosintéticas y sugieren que la velocidad es más importante que la precisión. En contraste con lo que se ha sugerido para muchos virus de ARN, encontramos que la diseminación dentro del hospedador está asociada con la velocidad de replicación viral y no con la diversidad genética permanente.


Abstracto

Las tasas de mutación pueden evolucionar a través de la deriva genética, la selección indirecta debido al autostop genético o la selección directa sobre el costo fisicoquímico de la alta fidelidad. Sin embargo, para muchos sistemas, ha sido difícil desenredar empíricamente el impacto relativo de estas fuerzas. En los virus de ARN, una correlación observada entre la tasa de mutación y la virulencia ha llevado a muchos a argumentar que sus tasas de mutación extremadamente altas son ventajosas porque pueden permitir una mayor adaptabilidad. Este argumento tiene profundas implicaciones porque sugiere que la patogénesis en muchas infecciones virales depende de mutaciones raras o de novo. Aquí, presentamos datos para un modelo alternativo mediante el cual los virus de ARN evolucionan con altas tasas de mutación como un subproducto de la selección para aumentar la velocidad de replicación. Encontramos que un antimutador de poliovirus, 3D G64S, tiene un defecto de replicación significativo y que las poblaciones de tipo salvaje (WT) y 3D G64S tienen una adaptabilidad similar en 2 entornos celulares distintos. La evolución experimental de 3D G64S bajo selección para la velocidad de replicación condujo a la reversión y compensación del fenotipo de fidelidad. Los ratones infectados con 3D G64S exhibieron una morbilidad retardada a dosis muy por encima del nivel letal, consistente con la atenuación por un crecimiento más lento en contraposición a un suministro mutacional reducido. Además, la compensación del defecto de crecimiento 3D G64S restauró la virulencia, mientras que la compensación del fenotipo de fidelidad no lo hizo. Nuestros datos son consistentes con el modelo cinético de corrección de pruebas para reacciones biosintéticas y sugieren que la velocidad es más importante que la precisión. En contraste con lo que se ha sugerido para muchos virus de ARN, encontramos que la diseminación dentro del hospedador está asociada con la velocidad de replicación viral y no con la diversidad genética permanente.


INFLUENCIA DE LOS MECANISMOS DE REPLICACIÓN VIRAL EN LA DINÁMICA EVOLUTIVA DENTRO DEL HOSPEDAJE

Los virus replican sus genomas utilizando una variedad de mecanismos, lo que lleva a diferentes distribuciones de mutaciones entre su progenie. Sin embargo, los modelos de evolución viral a menudo solo consideran la tasa media de mutación. Para investigar cuándo y cómo los mecanismos de replicación impactan en la evolución viral, analizamos la dinámica temprana de la infección intrahospitalaria para dos casos idealizados: cuando todos los viriones descendientes de una célula infectada tienen el mismo genotipo, mutado o no, y cuando las mutaciones ocurren de forma independiente entre los viriones descendientes. . Otras historias de vida de replicación caen entre estos extremos. Utilizando modelos de proceso de ramificación, estudiamos la probabilidad de que la infección viral se establezca cuando las mutaciones son letales y, en el caso más general, de dos cepas de diferente aptitud. Para una tasa de mutación media dada, mostramos que un linaje de virus con mutaciones correlacionadas tiene menos probabilidades de sobrevivir que con mutaciones independientes, pero cuando sobrevive, la población viral crece más rápido. Si bien esto es cierto para todos los regímenes de parámetros, el ciclo de vida de la replicación tiene una influencia cuantitativamente significativa en la dinámica viral cuando los efectos estocásticos son importantes y cuando las mutaciones son cruciales para la supervivencia, condiciones típicas de las situaciones de escape evolutivo.

Apéndice S1: Mutantes letales (modelo de ráfaga)

Apéndice S2: Mutantes letales (modelo en ciernes)

Apéndice S3: Evolución adaptativa

Nombre del archivo Descripción
EVO_1687_sm_suppmat.pdf527.1 KB Elemento de información de apoyo

Tenga en cuenta: El editor no es responsable del contenido o la funcionalidad de la información de apoyo proporcionada por los autores. Cualquier consulta (que no sea contenido faltante) debe dirigirse al autor correspondiente del artículo.


Tasas de mutación viral: modelado de los roles de la dinámica viral dentro del hospedador y el compromiso entre la fidelidad y la velocidad de la replicación

Muchos virus, particularmente los virus de ARN, mutan a una tasa muy alta por genoma por replicación. Una posible explicación es que se seleccionan altas tasas de mutación para hacer frente al desafío de los entornos fluctuantes, incluida la respuesta inmune del huésped. Alternativamente, estudios recientes sostienen que los virus evolucionan bajo un compromiso entre la velocidad de replicación y la fidelidad, de manera que se selecciona la replicación rápida y, junto con ella, altas tasas de mutación. Aquí, además de estos factores, consideramos el papel de las propiedades del ciclo de vida viral: a saber, la dinámica de los virus dentro del hospedador resultante de su interacción con el hospedador. Desarrollamos modelos matemáticos que incorporan factores que ocurren dentro y entre huéspedes, incluidas mutaciones perjudiciales y ventajosas, muerte del huésped debido a la virulencia y eliminación de virus por el huésped. Las mutaciones beneficiosas confieren una ventaja tanto dentro del hospedador como en la transmisión. Primero, encontramos que las mutaciones ventajosas tienen solo un efecto débil sobre la tasa óptima de mutación genómica. En segundo lugar, las propiedades del ciclo de vida viral tienen un gran efecto sobre la tasa de mutación. En tercer lugar, cuando se incluye la compensación entre velocidad y fidelidad, puede haber dos tasas de mutación óptimas a nivel local. Nuestro análisis proporciona una forma de considerar cómo las propiedades del ciclo de vida se combinan con las compensaciones bioquímicas para dar forma a las tasas de mutación.

1. Introducción

La mutación permite la adaptación a entornos cambiantes, pero produce cambios perjudiciales al mismo tiempo. Los primeros modelos matemáticos caracterizaron las tasas de mutación óptimas bajo el equilibrio de estos fenómenos opuestos [1, 2]. Generalmente, la evitación de la mutación perjudicial lleva las tasas de mutación a niveles bajos, como se ve en la presencia de mecanismos para corregir errores de replicación. De hecho, cuando los entornos son estables, la tasa de mutación óptima es cero, pero la evolución de tasas de mutación bajas está limitada por el costo de replicar el ADN (o ARN) con precisión, es decir, el costo de la fidelidad [3, 4]. Por lo tanto, la tasa de mutación genómica de equilibrio puede reflejar un equilibrio entre la selección contra la mutación y un límite establecido por el costo de la fidelidad. Este punto de vista está respaldado por la tasa de mutación por genoma notablemente constante en una amplia gama de taxones [3, 4]. Alternativamente, el límite inferior podría establecerse por deriva (la incapacidad de la selección para mejorar más la fidelidad) en lugar del costo de la fidelidad [5,6].

En contradicción con el principio de que las tasas de mutación evolucionan para ser bajas, se han aislado bacterias hipermutables de poblaciones naturales. Por ejemplo, una gran proporción de Pseudomonas aeruginosa Se ha observado que los aislados de los pulmones de pacientes con fibrosis quística tienen tasas de mutación muy elevadas [7]. Se ha hecho una observación similar para Helicobacter pylori aislamientos [8]. En estos ejemplos, las bacterias se enfrentan a entornos fluctuantes que pueden surgir al iniciar o detener el tratamiento con antibióticos o al cambiar la clase de fármaco durante el tratamiento con antibióticos. La presencia de estas cepas mutantes en tales entornos es consistente con modelos teóricos que predicen el aumento transitorio de cepas con altas tasas de mutación debido al autostop, con las mutaciones beneficiosas que crean [9-12].

¿Hasta qué punto se aplican estos principios a los virus? Muchos virus, particularmente los virus de ARN, tienen altas tasas de mutación [4, 13]. ¿Podría esto constituir una adaptación a entornos en constante cambio que requieren que los virus superen constantemente los sistemas de defensa de su anfitrión? Por ejemplo, los virus de los vertebrados pueden necesitar escapar perpetuamente del sistema inmunológico para sobrevivir cambiando los sitios que son reconocidos por la inmunidad del huésped. En otras palabras, ¿la carrera armamentista de la Reina Roja mantiene altas tasas de mutación? Algunos estudios teóricos han argumentado que este principio se aplica a los virus [14, 15] de hecho, se ha demostrado que las cepas de virus de alta fidelidad tienen menor aptitud [16, 17]. Estas explicaciones se basan en la suposición de que las tasas de mutación elevadas deben generar mutaciones de escape ventajosas de una manera que supere el costo de las mutaciones deletéreas. Sin embargo, esta idea ha sido cuestionada porque la transmisión puede ocurrir antes de que el sistema inmunológico discrimine entre linajes virales. Es decir, los virus no necesitan altas tasas de mutación ni un escape adaptativo de la inmunidad si pueden sobrevivir simplemente infectando a otros huéspedes [18,19]. Además, los virus de ADN comparten el mismo estilo de vida parasitario que los virus de ARN, pero tienen tasas de mutación más bajas [18].

Una dificultad adicional con una explicación basada en los efectos beneficiosos de las mutaciones es que las altas tasas de mutación también conducen a efectos deletéreos. El papel de la mutación deletérea en los virus se ha estudiado utilizando la teoría de las cuasiespecies, una nube de individuos estrechamente relacionados que ocupan un paisaje de aptitud cuyas propiedades son críticas para su evolución [20-23]. Una predicción de este trabajo es que el límite superior de la tasa de mutación genómica es uno por replicación, lo cual es ampliamente consistente con los hallazgos empíricos [20, 24, 25]. Es evidente que la tasa de mutación deletérea es alta en los virus [26, 27], con un 20 a un 40 por ciento de las mutaciones que tienen efectos letales [26]. Por tanto, los modelos de evolución de las tasas de mutación viral también deberían tener en cuenta los efectos deletéreos.

Una explicación alternativa para las altas tasas de mutación viral aboga por una compensación entre la tasa de replicación y la precisión, de modo que la alta replicación debe venir con una baja precisión (es decir, altas tasas de mutación) [19,28]. Bajo esta hipótesis, la evolución viral está fuertemente impulsada por la selección para una replicación rápida, y las tasas de mutación son altas debido a esta restricción bioquímica. La reducción de la aptitud observada en las cepas virales de alta fidelidad puede explicarse como resultado de esta compensación más que por su incapacidad para producir mutaciones adaptativas [29,30]. En consonancia con esta idea, se encuentra la relación positiva entre la tasa de replicación y la tasa de mutación observada en el VIH [30]. Además, en el virus de la estomatitis vesicular existe una relación negativa entre la tasa de mutación y la tasa de adaptación medida in vitro [29]. Sniegowski et al. [4] argumentan que la mutación deletérea impulsa las tasas lo más bajas posible bajo la restricción impuesta por el costo de la fidelidad. En comparación, la selección para una replicación rápida en virus puede impulsar la tasa de replicación lo más alta posible bajo la misma restricción.

Por lo tanto, el pensamiento actual en esta área contrasta dos compensaciones que pueden influir en las tasas de mutación: la primera entre mutaciones perjudiciales y ventajosas, y la segunda entre velocidad de replicación y precisión. Otra compensación a considerar proviene de la evolución de la literatura sobre virulencia [31]. Los esfuerzos para comprender la evolución de la virulencia de los patógenos han identificado un equilibrio entre, por un lado, crecer rápidamente y matar al huésped (virulencia) y, por otro lado, crecer demasiado lento y ser eliminado por la respuesta inmune [32] o superado por una respuesta más rápida. -cepas en crecimiento [33-35].

Las propiedades del ciclo de vida del virus, definidas aquí como la dinámica de la población viral resultante de la interacción entre el virus y el huésped, podrían tener un impacto importante en las tasas de mutación. Por ejemplo, como se mencionó anteriormente, el escape del sistema inmunológico puede desempeñar un papel para los virus de los vertebrados [15]. Un estudio de simulación reciente combina la dinámica intrahospitalaria y entre hospedadores de un patógeno para explorar la evolución de las tasas de mutación del patógeno [36]. Este estudio sugiere que son posibles dos tasas de mutación localmente óptimas: primero, cuando los patógenos tienen una tasa de mutación muy baja, evolucionan demasiado lentamente para aumentar su tasa de replicación dentro del hospedador y, por lo tanto, no matan a su hospedador y son capaces de transmitir a más En segundo lugar, cuando los patógenos tienen una alta tasa de mutación, producen demasiadas mutaciones perjudiciales para mejorar su tasa de replicación dentro del hospedador y, nuevamente, no matan a su hospedador y pueden transmitir a más hospedadores. Nuestra comprensión de las tasas de mutación viral mejoraría aún más integrando los tres tipos de compensaciones y explicando cómo interactúan.

Aquí, construimos y analizamos un modelo simple de evolución de la tasa de mutación viral al incluir dinámicas dentro y entre hospedadores, similar a la de Antia. et al. [32]. Las mutaciones pueden tener efectos nocivos, pero el proceso de mutación también produce cambios estocásticos raros que permiten que los virus infecten a más huéspedes. Estudiamos cómo las múltiples compensaciones descritas anteriormente funcionan juntas para influir en las tasas de mutación. Como en el trabajo de O'Fallon [36], encontramos la posible ocurrencia de dos tasas de mutación óptimas localmente, que emergen en nuestro modelo por diferentes razones.

2. Modelo

Desarrollamos un modelo dinámico simple de virus que crecen dentro de los hosts y se transmiten entre hosts. Posteriormente ampliamos este modelo básico para considerar los procesos dentro del host con más detalle. En el modelo básico, los virus crecen exponencialmente dentro del anfitrión, a partir de un solo virus. Los virus pueden experimentar mutaciones tanto perjudiciales como ventajosas. La tasa de mutación es U por genoma viral por generación y la tasa de crecimiento dentro del huésped es r por virus por generación. Puede haber una relación entre estos dos parámetros debido a limitaciones bioquímicas en ese caso, escribiremos r(U) para la tasa de crecimiento. La transmisión es proporcional al número total de virus producidos durante el curso de la infección, con proporcionalidad constante C. No hay sobreinfección ni coinfección.

Las mutaciones deletéreas dan como resultado viriones no viables, son letales. La proporción de mutaciones que son letales y reducen efectivamente la tasa de replicación viral es δ. Las mutaciones ventajosas confieren una ventaja de crecimiento. σ dentro de los hosts y una ventaja de transmisión s entre hosts. Una mutación es ventajosa con probabilidad α. Nos referiremos a los virus con mutaciones ventajosas como mutantes. Suponemos que, como máximo, se produce una única mutación ventajosa dentro de una única infección. La mutación ventajosa confiere una ventaja selectiva de σ dentro del anfitrión. La infección termina en el momento T. La Tabla 1 resume los parámetros del modelo.

Tabla 1. Parámetros del modelo básico y otros símbolos.

(a) Dinámica y aptitud media del virus

Cada mutación letal de generación viral elimina una proporción 1 − e -δU de viriones. El virus crece exponencialmente dentro del anfitrión de acuerdo con e bt , dónde

Tenga en cuenta que el tiempo t toma valores a pesar de que la infección termina en el momento T. Entonces, siempre que el tiempo de esta distribución sea mayor que T (es decir. t & gt T), esto significa que la infección ha terminado antes de que el mutante haya tenido la oportunidad de aparecer.

El mutante tiene ventaja s con respecto a la transmisión a nuevos hosts. Esto corresponde aproximadamente a una situación de Reina Roja en la que siempre hay una mutación de tamaño de efecto potencialmente grande disponible porque la población huésped sigue evolucionando (o adquiriendo memoria inmunitaria contra cepas antiguas). La aptitud reproductiva general es un promedio sobre las contribuciones de las dos cepas. Esto se calcula integrando la carga viral durante el tiempo de infección. t y promediando los tiempos τ que el mutante podría haber surgido (si es que lo hizo) antes de tiempo T.

El número de virus mutantes de tipo salvaje y ventajoso viene dado, respectivamente, por e bt ye B(1+σ)t . El número total de virus de tipo salvaje por t = T es

Por tanto, la aptitud reproductiva media es

(b) Factores intrahospitalarios: virulencia e inmunidad

Se considerarán tres tipos de modelos intrahospitalarios. Primero, la duración de la infección. T es constante independientemente de la tasa de crecimiento viral B. En segundo lugar, la infección termina cuando el virus mata al huésped al alcanzar un tamaño de población D. La duración de la infección viene dada por el momento en que este umbral de virulencia D se alcanza, a saber T = registro (D)/B. Finalmente, la duración depende tanto de la virulencia como de la respuesta inmune, como sigue. La infección termina porque el virus mata al huésped cuando alcanza un tamaño de población de D o porque la respuesta inmune elimina el virus porque crece lo suficientemente lento como para ser dominado. Para modelar estos dos fenómenos, suponga que la duración de la infección T es dado por

Aquí, la respuesta inmune es más efectiva cuando las tasas de crecimiento viral son bajas. Especialmente, para bajas tasas de crecimiento efectivas. B hay una relación lineal entre B y la duración de la infección T. El parámetro B* es un punto de inflexión que separa la virulencia (muerte del huésped) de la recuperación (eliminación por el huésped). La Figura 1 ilustra la trayectoria del virus dentro del hospedador bajo este modelo. Este modelo es una versión simplificada del propuesto por Antia et al. [32].

Figura 1. Relación entre virulencia, aclaramiento del sistema inmunológico y duración de la infección. Se muestran cinco ejemplos de trayectorias virales con líneas continuas, con flechas discontinuas que indican el final de la infección en cada caso. El caso del medio etiquetado B* indica la tasa de crecimiento (pendiente de la trayectoria logarítmica) de un virus que crece a la tasa mínima para matar al huésped, o la tasa máxima que aún debe eliminar el sistema inmunológico. La curva delgada representa el límite en (B/B*) 2 log (D). Este modelo es conceptualmente similar al de Antia et al. [32], sin variables que describan explícitamente el sistema inmunológico.

(c) Compensación entre velocidad de replicación y precisión

Bajo un compromiso entre la velocidad y la precisión de la replicación, habría una relación positiva entre r y U. A medida que aumenta la fidelidad de la replicación (como U disminuye), debería haber un costo creciente para la velocidad de replicación a través de una disminución en r(U). Este es el costo de la fidelidad. Dejar

Estudiamos el efecto de esta relación considerando cómo la evolución en el panorama del fitness a lo largo de (r, U) está limitado por la ecuación (2.3). La superficie de aptitud especificada por la ecuación (2.1) exhibe compensaciones a nivel de población en el sistema, mientras que la curva de restricción representa compensaciones bioquímicas. Explorar la ubicación de esta curva sobre la superficie de aptitud muestra cómo operan múltiples compensaciones en la evolución de las tasas de mutación viral.

(d) Un modelo extendido con limitación de recursos y mutación no letal

Para relajar algunas de las suposiciones del modelo básico, presentamos un modelo extendido en el que hay una mutación deletérea no letal y en el que los recursos para el virus están limitados por el agotamiento de las células diana. Definimos un modelo estocástico de tiempo continuo de la siguiente manera. Dejar V sea ​​el número de virus de tipo salvaje (o células infectadas por virus), W el número de virus con mutaciones nocivas no letales, X el número de virus mutantes con mutación ventajosa pero no mutaciones perjudiciales, y Y el número de virus mutantes con la mutación ventajosa y la mutación perjudicial. Dejar θ Sea el número de células diana utilizadas por el virus, este es un recurso que el virus puede agotar. Las células diana se infectan con el parámetro de tasa β. Las células infectadas mueren a un ritmo ω por celda por unidad de tiempo.

Los virus con la mutación beneficiosa tienen una ventaja de crecimiento de σ dentro de los anfitriones, mientras que tener la mutación deletérea no letal tiene un costo ζ. Dejar δ sea ​​la proporción de mutaciones que son deletéreas pero no letales, y λ sea ​​la proporción de mutaciones que son letales. Como antes, α es la proporción de mutaciones que son ventajosas. Defina cuáles son las probabilidades respectivas de mutación no letal perjudicial y ventajosa por generación por célula infectada.

Se puede describir una versión determinista del modelo con el siguiente sistema de ecuaciones diferenciales:

Las condiciones iniciales son: V = V0, W = 0, X = 0, Y = 0 y θ = θ0 a t = 0, donde V0 y θ0 son, respectivamente, el número inicial de células diana infectadas por virus y no infectadas. Estudiamos el modelo estocástico correspondiente computacionalmente utilizando el método tau leap de Gillespie. Calculamos la aptitud del virus para una realización determinada del proceso con

3. Resultados

(a) Modelo básico

Estudiamos el modelo considerando primero la aptitud reproductiva del virus, dada por la ecuación (2.1) en función de la tasa de crecimiento. r y tasa de mutación U. Recuerde que hay tres variantes del modelo. El primero asume una duración constante de la infección. En la segunda variante, la duración depende de la tasa de crecimiento efectiva del virus: se supone que el huésped muere cuando la población de virus que crece exponencialmente supera el tamaño del umbral letal. D. En la tercera variante, el huésped muere si el virus crece a un ritmo rápido o, alternativamente, se recupera si el virus crece lentamente y se supone que se elimina por inmunidad (ver figura 1). Figura 2a muestra cómo cambia el valor reproductivo en función de la tasa de crecimiento r y tasa de mutación U bajo el primer modelo, en el que la duración de la infección T es constante y no hay virulencia. A medida que aumenta la tasa de crecimiento y disminuye la tasa de mutación, los contornos aumentan en altura. El virus maximiza su aptitud al crecer tan rápido como puede mientras mantiene su tasa de mutación lo más baja posible. Aquí, no hay ninguna desventaja en el crecimiento rápido, y se favorecen las bajas tasas de mutación porque los efectos deletéreos de la mutación se sienten más inmediatamente que los efectos ventajosos. En otras palabras, el componente de aptitud física de tipo salvaje R tiene un efecto dominante sobre el valor reproductivo.

Figura 2. Aptitud reproductiva (ecuación 2.1) en función de la tasa de crecimiento r y tasa de mutación U. (a) Duración de la infección T es constante y se establece en T = 7. (B) La duración de la infección es T = registro (D)/B y depende de la virulencia. (C,D) La duración de la infección depende tanto de la virulencia como de la inmunidad, como se indica en la ecuación (2.2). (D) La duración de la infección depende nuevamente tanto de la virulencia como de la inmunidad, pero la influencia de los efectos adaptativos se exagera al establecer s = 15. Los parámetros son α = 0.1, δ = 0.5, σ = 0.1, s = 0.1, C = 2 ×10 −3 , T = 7, B* = 1.2.

Figura 2B muestra el efecto sobre el valor reproductivo para el modelo asumiendo solo virulencia. Aquí, en contraste con el modelo con una duración constante de la infección, las bajas tasas de crecimiento junto con las altas tasas de mutación conducen a los valores reproductivos más altos. Esto se debe a que las bajas tasas de crecimiento conducen a una gran población dentro del hospedador y, por lo tanto, a una mayor transmisión. Esto se logra reduciendo la tasa de crecimiento. r y / o aumentando el impacto de la mutación deletérea a través de U sobre la tasa de crecimiento efectiva B.

Figura 2C muestra el efecto tanto de la virulencia como de la inmunidad dependiente de la tasa de crecimiento. En este caso, hay un valor de B, a saber B*, en el que la duración de la infección T es el más alto (ver ecuación 2.2). A esta tasa de crecimiento efectiva, la carga viral total y el valor reproductivo también son máximos para los parámetros utilizados en el análisis. Por lo tanto, hay una cresta de fitness a lo largo B = B* para los parámetros utilizados aquí. Figura 2D muestra la superficie de aptitud nuevamente para el modelo con virulencia e inmunidad, pero con una selección positiva extremadamente fuerte (s establecido en 15). En este caso, el B = B* La relación es ahora una cresta "inclinada" con valores de aptitud más altos en combinaciones más altas de r y U. Además, para tasas de crecimiento bajas r, tasa de mutación U picos en valores intermedios. Observamos que para lograr esta distorsión de la superficie s debe ser empujado a valores extremadamente altos (el efecto aparece alrededor de s = 10). Las mutaciones en los virus que permiten el uso de diferentes receptores de células hospedadoras tienen el potencial de aumentar el grupo disponible de hospedadores susceptibles (por ejemplo, norovirus [37]). Sin embargo, s & gt 10 es quizás todavía poco realista, ya que constantemente requeriría más de 10 veces más nuevos huéspedes susceptibles para estar disponibles mediante la conmutación de receptores.

En la figura 3, mostramos tanto la duración de la infección como T como una función de U para una tasa de crecimiento fija r, bajo el modelo de virulencia + inmunidad. Aquí, vemos que las dos funciones alcanzan su punto máximo en el mismo punto, es decir, donde se unen las dos piezas del modelo. Esto muestra que la aptitud viral se ve fuertemente afectada por la duración de la infección, que a su vez está determinada por los detalles de las propiedades del ciclo de vida del virus. Tenga en cuenta que el pico de aptitud física aquí se encuentra en las proximidades de U = 1, el límite superior de la tasa de mutación genómica predicha por la teoría de las cuasiespecies [20]. Esto resulta de los efectos de la mutación deletérea debido al término B = re -δU en el modelo a través del cual la tasa de crecimiento intrahospitalario cae bruscamente alrededor U = 1.

Figura 3. Estado físico (eje izquierdo) y duración de la infección T (eje derecho), en función de la tasa de mutación logarítmica U para el modelo, incluida la virulencia y la inmunidad para el mismo conjunto de parámetros, con r tomando tres valores: r = 1, 1,75, 2,5. Los otros parámetros son: α = 0.1, δ = 0.5, σ = 0.1, s = 0.1, C = 2 ×10 −3 , T = 7, B* = 1,2. Observe los picos en T y coinciden y ocurren en la discontinuidad, en la cual B = B*. , líneas continuas duración de la infección, líneas discontinuas.

(b) Aplicación de la compensación bioquímica entre velocidad y precisión

Si la velocidad y la precisión de la replicación están limitadas por una compensación, entonces no todos los fenotipos son posibles en particular, los virus no pueden ser a la vez muy rápidos y muy precisos. Tal restricción se puede modelar con una relación positiva entre la tasa de crecimiento r y tasa de mutación U, como se hizo con la ecuación (2.3). Son posibles otras relaciones, sin embargo, los resultados cualitativos no dependen de la forma exacta de esta relación. Esta curva puede verse como una restricción para la evolución adaptativa que actúa como una barrera al movimiento en el panorama de la aptitud física [38]. En el contexto actual, esto se puede interpretar de dos maneras: (i) los únicos estados genéticos posibles son aquellos que confieren pares de r y U a lo largo de la curva y (ii) los únicos estados genéticos posibles son aquellos con r y U en o debajo de la curva.

Esta curva de restricción puede intersecar la cresta de aptitud dada por los contornos más altos de en la figura 2C,D. Si se cruza con esa cresta en dos valores, como se ilustra en la figura 4 (línea discontinua), entonces hay dos pares óptimos localmente de r, U. Por lo tanto, surgen dos "estrategias" de crecimiento viral: primero, el virus puede crecer de forma lenta y precisa, segundo, puede crecer de forma rápida e inexacta. Por otro lado, es posible que la curva de restricción no se cruce con la cresta de aptitud (figura 4, línea de puntos). Esta curva inferior corresponde a un escenario en el que la restricción produce una menor fidelidad para una tasa de crecimiento determinada. Aquí, la evolución conduciría al sistema al punto de la curva de restricción con la mayor aptitud, correspondiente a una estrategia de tasa de replicación intermedia y fidelidad.

Figura 4. Limitación a la evolución de la tasa de mutación impuesta por una compensación bioquímica entre la velocidad de replicación y la precisión. Curva punteada: cuando la curva de restricción (ver ecuación 2.3) no se cruza con la cresta de aptitud, r y U evolucionan hacia un solo pico a lo largo de la curva, que se muestra con un círculo blanco en este ejemplo. Dashed curve: when the constraint curve intersects the fitness ridge at two points (black circles) these points can be interpreted as two ‘strategies’ for combining replication and mutation rates. Note that although the constraint curve of equation 2.3 has negative concavity with respect to U, the concavity with respect to the log(U) transformation, as shown in the plot, is positive. Parameters: δ = 0.5, B* = 1.2, ε = 0.1 ρ = 1 (dotted curve) and ρ = 2 (dashed curve).

(c) Extended model with resource limitation and non-lethal mutation

To study the extended model, we again vary the genomic mutation rate U widely and observe the effect on fitness (figure 5). We do so for the case in which 10 per cent of mutations lead to beneficial effects (α = 0.1), and an alternative (α = 0) in which there are no beneficial mutations.

Figure 5. A more detailed simulation model with resource limitation through target cell depletion this model also includes non-lethal deleterious mutation and within-host positive selection. Parameters: λ = 0.4, δ = 0.3, ζ = 0.25, σ = 0.1, s = 0.1, C = 4 × 10 −8 , θ0 = 4 ×10 8 , ω = 2, D = θ0/2, V0 = 10. The parameter β is set such that βθ0/ω = 10. We sampled 50 points, taking the average of 100 simulations per point. α = 0, dashed line α = 0.1, solid line.

As we saw in the earlier simple model, there is an optimal mutation rate that balances the negative effects of virulence on the one hand and deleterious mutation on the other. Virulence takes effect here for low genomic mutation rates U, which are associated with high growth rates. The balance of these two forces operates with or without beneficial mutations. When beneficial mutations are introduced, the peak is higher and shifted to higher values of U. There is therefore an advantage to lowering fidelity and producing advantageous mutations, but this advantage is not large compared with the influences of within-host growth characteristics.

4. Discusión

Although the evolution of mutation rates has been a subject of general interest for a long time, it is only relatively recently that this has been explicitly studied in the context of viruses [29,30]. The basic principles applying to prokaryotes and eukaryotes do not directly apply to viruses because selection acts differently in viruses. There is little or no benefit in prokaryotes and eukaryotes for DNA polymerases to replicate genomes quickly because reproduction at the organismal level requires many other factors. Even in the case of prokaryotes, which generally have smaller genomes than eukaryotes, cell division requires many steps in addition to genome replication. While it may be faster to replicate small prokaryotic genomes, there is no relationship between genome size and cell division rate [39,40]. In contrast, for viruses, fast genome replication has an immediate fitness advantage both at the virion level and the within-host level. There should therefore be strong selection on replication speed [19,28]. A trade-off between the speed of replication and the accuracy of replication has been advocated as the major determinant of the observed genomic mutation rate [19,28]. Here, we have developed a model to examine this biochemical trade-off as well as two further trade-offs: that between advantageous and deleterious mutations, and the life-history trade-off between virulence and immunity.

Incorporating different assumptions about life-history details of viruses leads to very different outcomes. When the duration of infection is constant, replicating as fast and accurately as possible is of ultimate importance. There is an immediate advantage to growing quickly, which is not helped much by advantageous mutations. When the duration of infection depends on how quickly the virus kills the host, replicating as slowly and inaccurately as possible is favoured. This is because low growth rates lead to long-lived infections, and thus high average viral loads. High mutation rates lead to the same outcome by reducing the number of viable viruses through deleterious mutations. We note, however, that if host or environmental factors impose a low underlying growth rate r, then the optimal mutation rate U must be low. When the duration of infection depends on both virulence and host immunity, there is a balance between the two phenomena and the optimal effective growth rate is intermediate. This optimal rate maximizes the total viral load without killing the host, in the same manner as in the model of Antia et al. [32]. Because this optimal growth rate is affected by both the replication rate and the mutation rate, there is a ridge in fitness values over the space of r y U values through the relationship B* = r e −δU . The trade-off that emerges here is between within-host growth and deleterious mutation in optimizing the effective growth rate. Evolution of mutation rates depends on this ridge as well as any constraint imposed by biochemical trade-offs.

In contrast to deleterious mutation, our model suggests that advantageous mutations have an indirect and therefore weak effect on reproductive fitness. High mutation rates in viruses are not likely to be an adaptation to produce advantageous mutations that is, they are probably not maintained in a Red Queen scenario. An exception to this principle may occur in viruses causing persistent infections, such as HIV, in which immune escape mutants occur frequently over long periods [41]. Nevertheless, the model presented here generally supports the hit-and-run view of viruses, according to which they transmit to other hosts without having to escape immunity through mutation [18,19]. This is true even when the effect of advantageous mutation is strongly favoured by elevating their rate and effect size. Although this difficulty of explaining mutation rates using escape dynamics has been framed as an inability of life-history properties to explain viral mutation rates [18,19,28], we argue that, in fact, life-history properties in the sense of within-host dynamics [32] play a crucial role. The study of O'Fallon [36] presents an alternative model supporting this contention.

Our analysis offers a way of considering the replication speed–accuracy trade-off simultaneously with the other trade-offs to yield a more complete perspective on the evolution of mutation rates. The speed–accuracy trade-off is a biochemical trade-off, which can be viewed as a constraint on how evolution can proceed on the fitness landscape defined here by . It is a ‘design barrier’ on the landscape as discussed by Stearns [38]. Under this view of the interaction between the trade-offs, evolution will push mutation rates as high as possible on the fitness landscape along the constraint curve connecting replication rate and mutation rate. In this case, imposing this biochemical trade-off implies the possibility of two distinct local optima, which occur only when the constraint curve crosses the curve corresponding to the optimal effective growth rate on the fitness landscape. In contrast to the model of O'Fallon [36], the dual optima here arise from the interaction of two trade-offs rather than the occurrence of two alternative strategies for optimizing within host growth rates. Similarly to O'Fallon [36], the optima occur when the duration of infection is longest, as that is when viral load is highest. Although rather speculative, this may be a step towards understanding why viruses vary in their genomic mutation rate [4,13]. In particular, DNA viruses have lower mutation rates than RNA viruses, and it is possible that life-history and biochemical trade-offs lead to an alternative lower optimum for DNA viruses.

Our model also provides a way of understanding the effect of antiviral drugs (such as ribavirin) that act by increasing the mutation rate to lethal levels [42–44]. This increase in mutation rate might be viewed as a movement on the fitness landscape (figure 2C) to a point with higher genomic mutation rate (towards the right on the contour plot). Such a move decreases reproductive fitness, potentially driving the viral population to extinction. If resistance to the mutagen evolves, this movement could be reversed, shifting the mutation rate towards the original lower rate. The fitness ridge we identify here suggests that there could be a class of resistance mutations that restores fitness, but not necessarily by reducing the mutation rate. Specifically, there may be resistance mutations that confer a small reduction in the genomic mutation rate combined with a large increase in the replication rate (an upward move on the contour plot), as pointed out by Bull et al. [44]. Such mutations restore fitness without needing to overcome the high mutation rate.

The model could be extended in several directions. We did not consider issues such as robustness and evolvability [22,28,45]. High mutation rates may lead to occupation of more robust regions of the fitness landscape. To model this phenomenon, the proportions of advantageous and deleterious mutations (α y δ in our model) could become functions of the growth rate r. Our basic model only considered mutations of lethal effect and advantageous mutations with a single effect size s. Our extended model generalized deleterious effects with an additional class, but it may be possible to generalize further to include more realistic distributions of fitness effect. Another direction would be to make the immune system more detailed and realistic. Finally, we did not consider genetics explicitly, but rather assumed that all phenotypic states are possible, and only along a constraint curve under one version of the model. Another model could specify genetic states as bitstrings and specify how genotype determines phenotype (in this case growth rate and genomic mutation rate). This would allow exploration of epistasis, landscape ruggedness and robustness, for instance.


Cálculos

General Method.

By using either the accumulation method or the null-class method described above, a published mutation frequency F for a particular trait can be converted into a mutation rate μ. A mutation rate μB per base can be obtained by dividing μ by the mutational target size T (the number of bases at which the event can occur) and multiplying by a correction factor for mutations other than base substitutions. For mutations studied in riboviruses, T is usually very small for instance, if the mutations consist exclusively of a single base substitution (such as G → A) at a single site, then T = 1/3. (Strictly speaking, T is a third of the total number of different base substitutions that can be monitored.) In these riboviral systems, only base-pair substitutions are scored. Thus, it is necessary to correct for all other kinds of mutations. Because riboviral mutational spectra are unavailable, we must instead fall back on the correction factor [(all mutations)/(base pair substitutions)] of 1.462 determined in several DNA-based microbial systems (5, 7). Multiplying by the genome size GRAMO then yields the mutation rate per genome per replication μg. When these calculations are strung together, the mutation accumulation μg = 1.462fG/2cT, and the null-class μg = −1.462[lnPAG(0)]GRAMO/NT.

Previous Values Accepted or Updated.

Several mutation frequencies and references to supplementary information were considered previously (5) and either are used unchanged or are recalculated with the new equation for mutation rate. (I) In two experiments measuring C → T mutations at poliovirus base 5,310 (8), F = 3.05 × 10 −5 and 2.28 × 10 −5 GRAMO = 7,433 C ≈ 2.8 and 2.8 T = 1/3 and μg = 0.177 and 0.132, respectively. (ii) Three measurements were made of mutation to guanidine resistance in poliovirus (9). The first was transformed by an arcane method that does not require updating and for which μg = 0.758 (5). In the second and third, F = 1.11 × 10 −4 and 5.73 × 10 −4 C ≈ 2.5 and 2.5 T = 4/3 and μg = 0.182 and 0.876, respectively. (iii) In two measurements with vesicular stomatitis virus (VSV ref. 10), F = 1.75 × 10 −4 and 2.35 × 10 −4 GRAMO = 11,162 C ≈ 2 and 2.5 T = 2/3 and μg = 1.07 and 1.15, respectively.

New Values.

(I) Frequencies of revertants of drug-dependent mutants of human rhinovirus 16 to drug independence were measured somewhat incidentally (11). This virus has a genome of 7,124 bases (12). The mean revertant frequency (reciprocal of the mean relative plaquing efficiency) of the V1210A mutant was 1/6,457 = 1.55 × 10 −4 . Assuming that reversion was exclusively to the wild type, T = 1/3 C ≈ 3.6, including the growth of plaques into stocks. Thus, μg = (1.462 × 1.55 × 10 −4 × 7,124)/(2 × 3.6 × 1/3) = 0.672. (ii) Mutation rates to resistance to monoclonal antibodies were screened in measles virus by using the null-class method (13). When the authors’ calculations are extended to take into account the effects of the inoculum size on the number of total replications and the content of preexisting mutants in the inocula, the mean mutation rate to drug independence is μ = 1.08 × 10 −4 . The number of sites at which mutation could occur was estimated from the observation that five sequenced mutations fell into four sites assuming a Poisson distribution of mutations among sites, the most probable number of sites is 7.5. The size of the measles genome is 15,894 bases (14). Thus, μg = (1.462 × 1.08 × 10 −4 × 15,894 × 3)/7.5 = 1.00.

Data Not Used.

In several instances, either recently appearing or previously analyzed data (5) are not well suited to the approach employed here. The latter include pioneering bacteriophage studies (15, 16), studies of VSV and poliovirus genomic RNA based on limit ribonuclease digestions rather than on genetic approaches (17, 18), and studies based on sequencing clonal copies of poliovirus and influenza virus genomes or involving sampling procedures that may have perturbed mutant frequencies (19, 20).

Mutation Rates Tabulated.

The independently measured μg values are arranged by increasing magnitude in Table 1. For a set of nine values varying by about 9-fold, the median is likely to be a better estimator than the mean. The 96% confidence interval around the median is 0.18–1.07 (21).

Genomic mutation rates in riboviruses


Tracking evolution of SARS-CoV-2 virus mutations

Since COVID-19 began its menacing march across Wuhan, China, in December 2019, and then across the world, the SARS-CoV-2 virus has taken a "whatever works" strategy to ensure its replication and spread. But in a new study published in Evolutionary Bioinformatics, University of Illinois researchers and students show the virus is honing the tactics that may make it more successful and more stable.

A group of graduate students in a spring-semester Bioinformatics and Systems Biology class at Illinois tracked the mutation rate in the virus's proteome -- the collection of proteins encoded by genetic material -- through time, starting with the first SARS-CoV-2 genome published in January and ending more than 15,300 genomes later in May.

The team found some regions still actively spinning off new mutations, indicating continuing adaptation to the host environment. But the mutation rate in other regions showed signs of slowing, coalescing around single versions of key proteins.

"That is bad news. The virus is changing and changing, but it is keeping the things that are most useful or interesting for itself," says Gustavo Caetano-Anolles, professor of bioinformatics in the Department of Crop Sciences at Illinois and senior author on the study.

Importantly, however, the stabilization of certain proteins could be good news for the treatment of COVID-19.

According to first author Tre Tomaszewski, a doctoral student in the School of Information Sciences at Illinois, "In vaccine development, for example, you need to know what the antibodies are attaching to. New mutations could change everything, including the way proteins are constructed, their shape. An antibody target could go from the surface of a protein to being folded inside of it, and you can't get to it anymore. Knowing which proteins and structures are sticking around will provide important insights for vaccines and other therapies."

The research team documented a general slowdown in the virus's mutation rate starting in April, after an initial period of rapid change. This included stabilization within the spike protein, those pokey appendages that give coronaviruses their crowned appearance.

Within the spike, the researchers found that an amino acid at site 614 was replaced with another (aspartic acid to glycine), a mutation that took over the entire virus population during March and April.

"The spike was a completely different protein at the very beginning than it is now. You can barely find that initial version now," Tomaszewski says.

The spike protein, which is organized into two main domains, is responsible for attaching to human cells and helping inject the virus's genetic material, RNA, inside to be replicated. The 614 mutation breaks an important bond between distinct domains and protein subunits in the spike.

"For some reason, this must help the virus increase its spread and infectivity in entering the host. Or else the mutation wouldn't be kept," Caetano-Anolles says.

The 614 mutation was associated with increased viral loads and higher infectivity in a previous study, with no effect on disease severity. Yet, in another study, the mutation was linked with higher case fatality rates. Tomaszewski says although its role in virulence needs confirmation, the mutation clearly mediates entry into host cells and therefore is critical for understanding virus transmission and spread.

Remarkably, sites within two other notable proteins also became more stable starting in April, including the NSP12 polymerase protein, which duplicates RNA, and the NSP13 helicase protein, which proofreads the duplicated RNA strands.

"All three mutations seem to be coordinated with each other," Caetano-Anolles says. "They are in different molecules, but they are following the same evolutionary process."

The researchers also noted regions of the virus proteome becoming more variable through time, which they say may give us an indication of what to expect next with COVID-19. Specifically, they found increasing mutations in the nucleocapsid protein, which packages the virus's RNA after entering a host cell, and the 3a viroporin protein, which creates pores in host cells to facilitate viral release, replication, and virulence.

The research team says these are regions to watch, because increasing non-random variability in these proteins suggests the virus is actively seeking ways to improve its spread. Caetano-Anolles explains these two proteins interfere with how our bodies combat the virus. They are the main blockers of the beta-interferon pathway that make up our antiviral defenses. Their mutation could explain the uncontrolled immune responses responsible for so many COVID-19 deaths.

"Considering this virus will be in our midst for some time, we hope the exploration of mutational pathways can anticipate moving targets for speedy therapeutics and vaccine development as we prepare for the next wave," Tomaszewski says. "We, along with thousands of other researchers sequencing, uploading, and curating genome samples through the GISAID Initiative, will continue to keep track of this virus."


Consequences of viral evolution:

-Viral quasispecies: The fast and flexible evolution of RNA virus genomes creates population of viruses with a large numbers of variant genomes. A single sequence cannot accurately describe the viral population in a single host or even in cell culture . This provides an evolutionary advantage, because mutations are already present and waiting to be selected, when selection pressure is applied to such a population. -Defective interfering virus: Defective genomes can arise through deletion, ?rearrangement, or recombination of a competent viral genome . In negative stranded RNA viruses, these are called defective interfering viruses (DI) which compete with the viral genome for replication and/or encapsidation: this tends to attenuate the virus and triggers host antiviral defenses. These defective genomes accumulate in cell culture, where innate antiviral defense is often lacking. For example, Sendai virus grown in cell culture is full of DIs, which are very potent inducers of innate immunity. Indeed DIs are not encoding for viral genes that downregulate host interferon system. Therefore, the more DI there is with the virus, the less the virus will be able to tone down interferon induction. That is why cultured Sendai virus is commonly used to experimentally induce interferon, whereas the competent Sendai virus would efficiently shut off the IFN production.


Mutation accumulation is determined by replication mode

In contrast to cells, viruses can adopt a variety of replication modes. Replication is said to follow a “stamping machine” model if a single template is used to produce all progeny strands within a given cell (Fig. 3a). Under this theoretical model, there is only one round of copying per cell. In practice, this means that each infecting genome is used to synthesize a single reverse-complementary intermediate which in turn is used as template for synthesizing all progeny genomes. This contrasts with semi-conservative replication, in which each strand is copied once to produce progeny molecules that are, in turn, used as templates in the next round of copying. Since under semi-conservative replication the number of strands doubles in each cycle, the virus necessarily has to undergo multiple replication cycles within each cell to produce enough progeny. Under stamping machine replication the mutation frequency observed after one cell infection equals the mutation rate, but under semi-conservative replication this frequency is also determined by the number of replication cycles, as mutants become amplified. This means that a given viral polymerase will produce more mutations per cell if replication is semi-conservative than if replication is stamping machine-like. These two models are indeed two extremes of a continuum of possible replication modes. For instance, a virus can produce multiple progeny molecules per round of copying which then undergo a second replication cycle in the same cell to end up producing hundreds or thousands of progeny molecules.

Viral replication modes and mutation accumulation. a Stamping machine versus semi-conservative replication. As opposed to cells, which use only semi-conservative replication, viruses can adopt a variety of replication modes. In the stamping machine model, a single template strand is used to synthesize all progeny genomes within a given cell. However, this is not possible in practice because replication requires synthesis of complementary strands or “anti-genomes” (azul). Under this model, the mutation frequency after one cell infection cycle will equal the mutation rate except if mutations occur during the first round of copying (from genome to anti-genome), in which case they will be present in all of the viral progeny. Under semi-conservative replication, multiple rounds of copying are required to produce enough progeny, thus allowing for the intra-cellular accumulation of mutations. B Relationship between lysis time and mutation accumulation. Longer cell infection cycles (late burst) can allow for the production of more progeny viruses. Under semi-conservative replication, this will require more rounds of copying but, if replication follows the stamping machine model, the number of rounds of copying will not change (more progeny genomes will be produced from the same template). Hence under this model, a late-burst virus variant will undergo fewer total rounds of copying at the population scale than early-burst variants and will tend to accumulate fewer mutations

It has been suggested that the stamping machine model has been selectively favored in RNA viruses because it compensates for the extremely high error rate of their polymerases [79–81]. Some RNA viruses such as bacteriophage ϕ6 [82], bacteriophage Qβ [83] and turnip mosaic virus [84] tend to replicate via the stamping machine model. However, empirically-informed modeling of the poliovirus replication cycle indicated multiple rounds of copying per cell [85]. Similarly, single-cell analysis of the genetic diversity produced by vesicular stomatitis virus revealed that some mutations are amplified within cells, implying that multiple rounds of copying take place per cell [86]. However, it remains unknown whether a given virus can modify its replication mode in response to specific selective pressures in order to promote or down-regulate mutational output. To a large extent, the replication mode of most viruses should be dictated by the molecular mechanisms of replication and, hence, should be subjected to strong functional constraints. For instance, bacteriophage ϕX174 replicates via the stamping machine mode because it uses rolling circle replication [87, 88]. In contrast, semi-conservative replication is probably the only mechanistically feasible replication model for viruses with large DNA genomes.


Discusión

Very often, a statistical method for analyzing a population sample is developed under a specific model, such as the constant effective population size assumed by Rodrigo et al. (1999) . When the population in question evolves in a manner that is significantly different from the model, the statistical analysis and the resulting conclusions can be misleading. Therefore, it is important to understand how an estimator behaves under various situations. The estimator of mutation rate proposed in this paper has the distinct feature of being unbiased in a variety of situations, which deserves further discussion.

In the case of population growth or, in general, varying effective population size, it is easy to see that is an unbiased estimator of v because equations (5) and (7) hold regardless of the value of effective population size. This property of our estimator is particularly important for its application to fast-changing viral populations such as HIV-1, because a within-host population can change dramatically in size over a short period of time.

The estimator is also unbiased in the presence of population structure, because regardless of population structure, every sequence in the second sample experiences the same amount of time since the time at which the first sample was taken. As long as a consistent sampling strategy is used from different samples, equations (5) and (7) hold regardless of population structure.

It is also obvious that recombination does not introduce bias in our estimate of either, because equations (5) and (7) hold in the presence of recombinations. Of course, this is not to say that nonconstant effective population size, population structure, and recombination have no effect on our estimate, because they do affect the variance of the estimator.

Natural selection is an important factor to consider when analyzing samples from viral populations such as HIV-1. When the DNA region under study is not directly involved in natural selection, our estimator should remain nearly unbiased. This includes the situation in which the region under study is tightly linked to a locus that is under strong natural selection. For example, if natural selection has led to the fixation of a favorable mutation before sampling starts, then its effect is very similar to that of a growing population and thus will not lead to bias in our estimator. When many mutations in the samples are not selectively neutral, the accumulation of nucleotide changes in a sequence in a given period may deviate from Poisson distribution, and the substitution rate can be elevated or reduced depending on the type of natural selection. In the case of deleterious mutations, the mutation rate per year estimated from equation (13) is likely to be smaller than that extrapolated by mutation rate per site per generation and generation time. This will result in an overestimate of the generation time. On the other hand, if positive selection is involved, the substitution rate per site per year will be elevated, which will result in an underestimate of the generation time. One way to minimize the effect of natural selection is to conduct analyses on synonymous substitutions only. With more and more data available, such analyses should be very informative. Since our analysis in this paper is mainly for the purpose of illustration, and also because of the relative small samples, we do not pursue the more detailed analysis.

Since the number of mutations that substantially enhance viral survival should be small compared with the total number of mutations, the bias in our estimate of v due to positive selection is unlikely to be substantial. Nevertheless, since positive selection is likely operating on the env gene of HIV-1 (e.g., Bonhoeffer, Holmes, and Nowak 1995 Yamaguchi and Gojobori 1997 Zhang et al. 1997 ), our estimate of the generation time may be slightly affected. Another potential source of error in the estimate of generation time is the mutation rate per site per generation. For example, if the mutation rate is underestimated, then it will result in an underestimate of the generation time. With these caveats, it is encouraging that our estimate of generation time agrees well with the recent estimate of 1.8 days from viral load data (see Rodrigo et al. 1999 ). It will be interesting to see if the agreement continues to hold with increasing data.

What causes Rodrigo et al.'s (1999) estimates of GRAMO to be consistently larger than ours? Although the variances in both estimators may lead to fluctuation, the discrepancy is likely due to some fundamental differences between the two estimators. One similarity between the two estimators of generation time is that both rely on estimates of the numbers of generations per day. However, our method is more direct and is unbiased for estimating the number of generations per day, while Rodrigo and Felsenstein's (1999) method is indirect, relying on estimates of both the effective population size and the number of coalescent events among the sequences in sample 2 in the period that separates the two samples. Counting the coalescent events directly from an estimated phylogeny will likely overestimate this number even if the phylogeny is perfectly reconstructed. The simple analysis below will reveal why this is so.