Adaptación genómica del picoeucariota Pelagomonas calceolata al hierro.

Blog

HogarHogar / Blog / Adaptación genómica del picoeucariota Pelagomonas calceolata al hierro.

Jun 03, 2023

Adaptación genómica del picoeucariota Pelagomonas calceolata al hierro.

Communications Biology volumen 5, Número de artículo: 983 (2022) Cita este artículo 2102 Accesos 4 Citas 20 Detalles de Altmetric Metrics Las especies de fitoplancton más pequeñas son actores clave en los océanos

Biología de las comunicaciones volumen 5, número de artículo: 983 (2022) Citar este artículo

2102 Accesos

4 citas

20 altmétrico

Detalles de métricas

Las especies de fitoplancton más pequeñas son actores clave en el ciclo biogeoquímico de los océanos y su abundancia y distribución se ven afectadas por los cambios ambientales globales. Entre ellas, las algas de la clase Pelagophyceae abarcan especies costeras que causan floraciones de algas nocivas, mientras que otras son cosmopolitas y abundantes. La falta de referencia genómica en este linaje es una de las principales limitaciones para estudiar su importancia ecológica. Aquí, analizamos la abundancia relativa, el nicho ecológico y el potencial de adaptación de Pelagomonas calceolata en todos los océanos utilizando una secuencia genómica ensamblada completa a escala cromosómica. Nuestros resultados muestran que P. calceolata es una de las especies eucariotas más abundantes en los océanos, con una abundancia relativa favorecida por las altas temperaturas, la poca luz y las condiciones pobres en hierro. Las proyecciones de cambio climático basadas en su abundancia relativa sugieren una extensión del hábitat de P. calceolata hacia los polos a finales de este siglo. Finalmente, observamos un repertorio genético específico y variaciones en el nivel de expresión que potencialmente explican su éxito ecológico en ambientes bajos en hierro y nitratos. En conjunto, estos hallazgos revelan la importancia ecológica de P. calceolata y sientan las bases para un análisis a escala global de las estrategias de adaptación y aclimatación de este pequeño fitoplancton en un entorno cambiante.

El fitoplancton marino representa más del 45% de la producción primaria fotosintética en la Tierra y desempeña un papel esencial en el suministro de materia orgánica a las redes alimentarias marinas1. Son actores globales clave en la absorción de CO2 y proporcionan oxígeno gaseoso a la atmósfera. Durante el último siglo se ha informado de una disminución global de la biomasa de fitoplancton (1% de la concentración de clorofila-a por año), lo que ha llevado a una disminución de la producción primaria neta en muchas regiones oceánicas2. Esta disminución es probablemente una consecuencia del calentamiento global de los océanos, que impulsa la estratificación de la columna de agua, reduciendo el suministro de nutrientes a las aguas superficiales. Es probable que las reducciones de la productividad del fitoplancton impulsadas por la temperatura en las regiones tropicales y templadas tengan efectos en cascada en los niveles tróficos más altos y el funcionamiento de los ecosistemas3.

Los picoeucariotas fotosintéticos (PPE), definidos por un diámetro celular <3 µm, pertenecen a diferentes filos, incluidos Chlorophyta, Cryptophyta, Haptophyta y Stramenopiles4. Presentes en todos los océanos, los EPI son los productores primarios dominantes en las regiones cálidas y oligotróficas5. El calentamiento de los océanos y la expansión de las regiones oligotróficas en las próximas décadas pueden ampliar el nicho ecológico de los EPI, y se espera un cambio global de grandes organismos fotosintéticos hacia productores primarios más pequeños3,6. Por ejemplo, el derretimiento del hielo marino en la cuenca del Ártico canadiense se ha asociado con un aumento en la abundancia de EPP como Micromonas a expensas de algas más grandes7. En el laboratorio, esta alga tiene la capacidad de cambiar su temperatura óptima para el crecimiento en sólo unos pocos cientos de generaciones, lo que sugiere que se verá menos afectada por el calentamiento global que muchos organismos más grandes8. Además, la mayor relación superficie-volumen celular de los PPE en comparación con las células de fitoplancton más grandes es ventajosa para la adquisición de recursos y el crecimiento en entornos con nutrientes limitados9,10.

El hierro es un compuesto clave necesario para la actividad de la cadena respiratoria, la fotosíntesis y la fijación de nitrógeno10. Debido a que el hierro biodisponible es extremadamente bajo en más de un tercio de la superficie del océano, el pequeño fitoplancton ha desarrollado varias estrategias para optimizar la absorción de hierro y reducir las necesidades de hierro11. En las diatomeas, los mecanismos de absorción de hierro reductores y no reductores involucran muchas proteínas, incluidas fitotransferrinas, reductasas férricas transmembrana, permeados de hierro y proteínas de unión a sideróforos12. Las necesidades de hierro pueden modularse mediante la variación de los niveles de expresión genética entre las proteínas que requieren hierro y sus equivalentes sin hierro. Estos interruptores de proteínas incluyen la transferencia de electrones (flavodoxina/ferredoxina), la gluconeogénesis (fructosa-bifosfato aldolasa tipo I o tipo II) y superóxido dismutasas (Mn/Fe-SOD, Cu/Zn-SOD o Ni-SOD)13,14,15.

El crecimiento del EPP también está limitado por la disponibilidad de nitrógeno (N) en grandes porciones del océano global16. El amonio (NH4+), el nitrato (NO3−) y el nitrito (NO2−) son la principal fuente de N inorgánico para los EPI; sin embargo, varios estudios han demostrado que el N orgánico disuelto, como la urea, puede metabolizarse en ambientes limitados en N17. Por ejemplo, varios transportadores de urea localizados en la membrana en la diatomea Phaeodactylum tricornutum se expresan al máximo en condiciones de limitación de nitrógeno18 y la proliferación de algas nocivas de las pelagoficeas Aureococcus anophagefferens puede ser alimentada por la urea19.

A pesar de su gran distribución taxonómica, la mayoría de los estudios moleculares sobre el papel ecológico de los EPI y su adaptación al medio ambiente se limitan a unas pocas especies. Se sospecha que los PPE poseen capacidades de aclimatación/adaptación altamente desarrolladas, pero los mecanismos moleculares subyacentes siguen estando mal caracterizados debido a la falta de datos genómicos de referencia.

Entre los EPI, Pelagomonas calceolata fue el primer miembro descrito de la clase Pelagophyceae20. Desde entonces, se ha identificado en muchas regiones oceánicas utilizando su secuencia de ARNr 18 S y su genoma del cloroplasto21,22,23. Varios estudios han demostrado la capacidad de P. calceolata para adaptarse a diferentes condiciones ambientales. En el laboratorio, se ha demostrado que P. calceolata exhibe un alto grado de aclimatación a las fluctuaciones de la luz con una rápida activación del ciclo fotoprotector de las xantofilas y una extinción no fotoquímica24. En el archipiélago de las Marquesas, P. calceolata es una de las especies que mejor responden a la fertilización con hierro con una regulación positiva de genes implicados en la fotosíntesis, la síntesis de aminoácidos y la asimilación de nitrógeno13. Un análisis a escala global de los genes de los pelagofitos reveló que están adaptados a condiciones bajas en hierro14. En el Pacífico subtropical, P. calceolata expresa genes de estrés en muestras de superficie y genes implicados en la asimilación de nitrógeno están sobreexpresados ​​en el máximo profundo de clorofila25. Un estudio de laboratorio sugiere que P. calceolata también tiene la capacidad de aumentar los niveles de transcripción de las enzimas de escisión de compuestos orgánicos nitrogenados (catepsina, ureasa, arginasa) en bajas concentraciones de nitrógeno26. Por tanto, la expresión genética parece estar controlada según la fuente y la cantidad de nitrógeno. En conjunto, esta aparente plasticidad adaptativa puede explicar la presencia de P. calceolata en muchos ambientes oceánicos diferentes, sin embargo, falta un análisis exhaustivo de la capacidad genética de esta especie y la caracterización in situ de su nicho ecológico.

Aquí secuenciamos, ensamblamos y anotamos el genoma de Pelagomonas calceolata, con una combinación de lecturas largas y cortas. Examinamos su estructura genómica y contenido genético en relación con otros fitoplancton unicelulares. Utilizamos este genoma para detectar P. calceolata en conjuntos de datos ambientales de expediciones de Tara en todos los océanos para caracterizar su nicho ecológico e identificar las condiciones ambientales que controlan su abundancia relativa. Finalmente, se estudiaron los niveles de expresión ambiental de genes implicados en la absorción y metabolismo de los compuestos nitrogenados y del hierro.

Para medir la abundancia de P. calceolata en los océanos y estudiar su capacidad genética para crecer en diferentes condiciones ambientales, secuenciamos y ensamblamos el genoma de P. calceolata RCC100 utilizando lecturas largas de Oxford Nanopore Technologies (ONT) y lecturas cortas de Illumina. Utilizando la distribución k-mer de lecturas cortas, se estimó que el genoma era homocigótico con un tamaño de 31 Mb (Figura complementaria S1a). Las lecturas largas de ONT se ensamblaron con Flye en seis contigs nucleares para un total de 32,4 Mb, 1 contig circular de plástido (90 Kb) y 1 contig circular mitocondrial (39 Kb) (Fig. 1, Fig. Suplementaria S1b, c, y Suplementaria Datos 1). Se detectaron dos regiones duplicadas grandes y muy similares (>99% de identidad) en el extremo de los contig 1 y 5 (393 Kb) y en los extremos de los contig 3 y 6 (192 Kb; Nota complementaria 1 y Figura complementaria S1d) . Se detectaron repeticiones teloméricas (TTAGGG) n en ambos extremos de los cóntigos 2, 3, 4 y 6, lo que indica que estos cuatro cóntigos representan cromosomas completos (Figura complementaria S1d). Para el contig 1 y el contig 5, se identificaron secuencias teloméricas en un solo extremo y el otro extremo termina en la región duplicada. Utilizamos la tecnología de largo alcance Hi-C para validar el ensamblaje de la secuencia del genoma de P. calceolata. El mapa de interacción reveló una gran cantidad de contactos dentro de contigs y muy pocos entre contigs (Figura complementaria S2 y Nota complementaria 2). No se detectaron quimeras ni fragmentaciones. Este resultado confirma que los seis cóntigos corresponden a seis cromosomas de P. calceolata.

Representación de los 6 cóntigos nucleares de P. calceolata. La capa superior indica el número de genes por 100 Kb (barras negras), la capa intermedia representa el contenido de GC en porcentaje en una ventana de 200 Kb y la capa inferior es la posición de las repeticiones de ADN de más de 500 bases repetidas al menos cinco veces en todo el genoma. Las barras rojas, naranjas y amarillas indican tres repeticiones diferentes en regiones de bajo GC presentes en al menos tres contigs diferentes. Los rectángulos discontinuos rojos y azules son regiones cromosómicas duplicadas.

Se predijo un total de 16,667 genes en el genoma de P. calceolata (ver "Métodos"), que es un número elevado para un PPE (Tabla 1 y Datos complementarios 2). Hubo un promedio de 0,45 intrones por gen, y la distribución de sus longitudes revela un pico alrededor de 210 pb, que es la longitud característica de los elementos intrones descritos en A. anophagefferens27 (Figura complementaria S3, Datos complementarios 3 y Nota complementaria 3). En total, 9812 proteínas predichas de P. calceolata (58%) son homólogas con al menos un gen en un genoma de estramenopilo, incluidas 2631 (16%) que solo se comparten con el pelagofito A. anophagefferens (Figura complementaria S4). Se encontró un dominio funcional conservado (Pfam, KO o InterProScan) en 11.240 proteínas (67%). Incluso si las estimaciones de integridad genética son imprecisas para especies distantes de los organismos modelo, obtuvimos un 94,0% de integridad con BUSCO28 (88% de genes de copia única y 6% duplicados), lo que demuestra que nuestro genoma está casi completo (Datos complementarios 4).

Una característica notable en el genoma de P. calceolata es la distribución del contenido de GC a lo largo de los cromosomas de P. calceolata (Fig. 1). Mientras que el contenido promedio de GC del genoma nuclear es del 63%, una región grande en cada contig (259 Kb en promedio) tiene 52% de GC. Estos grandes valles únicos en el contenido de GC en cada cromosoma sugieren que estas regiones abarcan centrómeros. El resultado de Hi-C confirma las posiciones de los centrómeros con la presencia de contactos entre regiones de bajo GC en los cromosomas, lo que sugiere la proximidad física de estas regiones en el núcleo (Figura complementaria S2). Curiosamente, no observamos una acumulación de elementos repetidos o transposones en estas regiones de bajo GC y solo una ligera disminución de la densidad genética. Las especificidades genómicas y el contenido genético de las regiones con bajo contenido de GC se detallan en los Datos complementarios 5, S6 y la Nota complementaria 4. Los patrones de bajo GC en los centrómeros podrían explicarse por la inhibición de la recombinación29,30, lo que sugiere que P. calceolata es capaz de meiosis y recombinación. Entre los 23 genes específicos de la meiosis caracterizados en otras especies31,32,33, 18 homólogos están presentes en el genoma de P. calceolata (Datos complementarios 7). Estos genes incluyen el iniciador de rotura de ADN de doble hebra (DSB), SPO11; RAD50, RAD52 y MRE11 para unirse a DSB; HOP2, MND1, DMC1 y RAD51 para asegurar el emparejamiento e invadir la cadena homóloga; Los genes MSH2, MSH3, PMS1 y MSH6 participan en la vía de hibridación de hebras dependiente de la síntesis y MUS81 son necesarios para el cruce sin interferencias (clase II). Los cinco genes faltantes están ausentes en muchos organismos capaces de realizar meiosis, lo que sugiere que no son necesarios para realizar la recombinación genética (Nota complementaria 5). En conjunto, la estructura genómica y el contenido genético de P.calceolata sugieren fuertemente que esta especie realiza meiosis.

Para estimar la abundancia relativa de P. calceolata en todos los océanos, primero utilizamos la abundancia de la región V9 del ARNr 18 S secuenciado de todas las muestras de la expedición Tara Oceans34. La Unidad Taxonómica Operacional (OTU) de P. calceolata más abundante en la fracción de tamaño de 0,8 a 5 µm es en promedio del 0,80% para las 104 muestras de superficie y del 1,23% para las 61 muestras de máximo de clorofila profunda (DCM) (Datos complementarios 8). Según este método de estimación de abundancia, P. calceolata es la tercera OTU eucariota más abundante de la fracción de tamaño de 0,8 a 5 µm después de dos OTU de Dinophyceae afiliadas a Ankistrodinium y una Gymnodiniaceae desconocida.

Para estimar la abundancia de P. calceolata independientemente de las PCR y el sesgo del número de copias del ARNr 18 S, utilizamos el mapeo de lecturas metagenómicas en el genoma de P. calceolata. Para la fracción de tamaño de 0,8 a 5 µm, el porcentaje de lecturas secuenciadas alineadas en el genoma es del 1,39% (n = 93, sd = 1,5) en muestras de superficie y del 2,67% (n = 55, sd = 1,6) en muestras de DCM. En la fracción de tamaño de 0,8 a 2000 µm, P. calceolata representa el 1,01% (n = 80, sd = 1,2) de todas las lecturas en muestras de superficie y el 1,56% (n = 39, sd = 1,3) en muestras de DCM. Se observó una abundancia relativa máxima del 6,7% en la fracción de tamaño de 0,8 a 5 µm en el Océano Índico Norte (estación TARA_38) en el DCM (Fig. 2a). En el Océano Índico, el Mar Rojo y el Mar Mediterráneo, P. calceolata es significativamente más abundante en el DCM que en la superficie (Fig. 2b). En aguas frías (por debajo de 10 °C), P. calceolata no se detecta por encima de nuestro umbral del 25% de cobertura genómica horizontal. Se observan variaciones importantes entre y dentro de cada cuenca oceánica, lo que sugiere que muchos factores bióticos o abióticos influyen en la abundancia de P. calceolata.

a Mapa mundial de la abundancia relativa de lecturas metagenómicas de P. calceolata. El código de color indica el porcentaje de lecturas secuenciadas alineadas en el genoma. Se muestran las muestras de DCM de fracciones de tamaño de 0,8 a 5 µm (círculos) o de 0,8 a 2000 µm (triángulos). Se considera que P. calceolata está ausente cuando la cobertura horizontal es inferior al 25% del genoma (puntos grises). b Diagrama de caja de la abundancia relativa en cada región oceánica en muestras de superficie y DCM. Las estrellas rojas indican una diferencia significativa entre las muestras SUR y DCM (prueba de Wilcoxon, valor de P <0,01).

Finalmente, comparamos los dos métodos de estimación de la abundancia (Figura complementaria S5). La abundancia relativa basada en metagenómica está fuertemente correlacionada con la abundancia relativa basada en códigos de barras (correlaciones de Pearson de 0,91 y 0,70 para las fracciones de tamaño de 0,8 a 2000 y 0,8 a 5 µm, respectivamente). Sin embargo, la abundancia basada en metacódigos de barras es en promedio 2,3 menor en la fracción de tamaño de 0,8 a 5 µm y 3,1 menor en la fracción de tamaño de 0,8 a 2000 en comparación con la abundancia basada en metagenómica (Figura complementaria S5).

Para identificar los factores que controlan la abundancia de P. calceolata en los océanos, utilizamos parámetros físico-químicos disponibles para cada estación oceánica (ver “Métodos”). El análisis de componentes principales reveló una relación positiva entre la abundancia de P. calceolata basada en metagenómica, la temperatura y la distancia a la costa y una relación negativa con la concentración de hierro (Fig. 3a, b). Este resultado fue consistente en las 2 fracciones de tamaño que contienen células de P. calceolata (fracciones de tamaño de 0,8 a 5 µm y de 0,8 a 2000 µm; figura complementaria S6). A pesar de los numerosos factores que potencialmente influyen en la abundancia de P. calceolata, observamos una correlación positiva de Pearson débil pero significativa con la temperatura, una correlación negativa con la radiación fotosintéticamente activa (PAR, media de 30 días) y una correlación negativa con las concentraciones de hierro (Tabla 2). . En la fracción de tamaño de 0,8 a 5 µm, la abundancia relativa de P. calceolata es mayor en condiciones bajas en hierro (<0,2 nmol/l, 54 muestras) con un promedio de 2,3 % de lecturas metagenómicas que en ambientes altos en hierro (>0,2 nmol/l, 88 muestras) con un promedio de 1,7 % de lecturas metagenómicas (prueba de Wilcoxon, valor de P = 0,02). En la fracción de tamaño de 0,8 a 2000 µm, observamos la misma tendencia con una abundancia relativa del 1,9% de lecturas metagenómicas en promedio en aguas bajas en hierro (49 muestras) y una abundancia relativa menor del 0,78% de lecturas metagenómicas en promedio en aguas con alto contenido de hierro. -ambientes de hierro (59 muestras) (prueba de Wilcoxon, valor de P = 9,6e-7). Además, la abundancia relativa de P. calceolata está débilmente correlacionada con la concentración de 9'butanoiloxifucoxantina, un pigmento característico de los pelagofitos (Pearson 0,22, valor de P = 0,02 y Pearson 0,41, valor de P = 4,82e−05 en los rangos de 0,8 a 5 µm y 0,8 –fracción de tamaño de 2000 µm, respectivamente). Utilizamos un modelo aditivo general para estimar la contribución de la temperatura, la PAR y la concentración de hierro a la abundancia relativa de P. calceolata (Tabla 2). Los tres factores explican el 32,3% de las variaciones en la abundancia de P. calceolata en la fracción de tamaño de 0,8 a 5 µm y el 56,8% en la fracción de tamaño de 0,8 a 2000 µm.

a Análisis de componentes principales de la abundancia relativa basada en metagenómica de P. calceolata en la fracción de tamaño de 0,8 a 5 µm. Los porcentajes de varianza explicados por cada eje se indican en los títulos de los ejes. Panel superior: cada punto representa una muestra con un tamaño proporcional a la abundancia relativa de P. calceolata y los colores indican las cuencas oceánicas. Panel inferior: nueve parámetros ambientales se representan como vectores junto con la abundancia relativa de P. calceolata (vector azul). b Gráfico de burbujas de la abundancia relativa de P. calceolata para la fracción de tamaño de 0,8 a 5 µm según los nueve parámetros ambientales. c Delta de la abundancia relativa modelada de P. calceolata entre 2010 y 2099. Las áreas verdes corresponden a una disminución, mientras que las áreas moradas corresponden a un aumento de la abundancia relativa de P. calceolata. Las estrellas pequeñas indican ubicaciones donde al menos uno de los controladores predictores está fuera de rango en comparación con los valores del conjunto de datos de entrenamiento.

Finalmente, proyectamos la abundancia relativa de P. calceolata a finales de siglo siguiendo a Frémont et al. metodología35. Modelamos el nicho ecológico de P. calceolata utilizando los conjuntos de datos del World Ocean Atlas (WOA18) en el momento y lugar del muestreo o utilizando la climatología proyectada en 2099 utilizando el escenario RPC8.5 (ver “Métodos”). Utilizamos cuatro técnicas de aprendizaje automático: modelos aditivos generalizados (GAM), redes neuronales (nn), bosque aleatorio (rf) y árboles potenciados por gradiente (bt) y evaluamos su rendimiento con dos parámetros. El coeficiente de correlación de Pearson indica la correlación entre el modelo y las mediciones in situ de la abundancia de P. calceolata. Las cuatro herramientas de aprendizaje automático tienen rendimientos similares según las correlaciones de Pearson (nn = 0,676; gam = 0,621; bt = 0,683; rf = 0,694). El segundo parámetro es la raíz del error cuadrático medio (rmse) y refleja la magnitud de los errores en los modelos (el número de desviaciones estándar de la media). Utilizando esta métrica, el enfoque GAM es menos bueno (rmse = 1,04) que las otras tres herramientas (nn = 0,964; bt = 0,952; rf = 0,941). Estos resultados indican que tenemos suficientes datos in situ para capturar las tendencias globales sobre la abundancia relativa de P. calceolata, pero estos modelos podrían ser imprecisos sobre la amplitud de las variaciones de abundancia. Además, las predicciones en aguas tropicales son inciertas porque este entorno en 2099 está fuera del rango del conjunto de datos de entrenamiento. Debido a que el rendimiento de los cuatro modelos es similar, los combinamos para obtener la proyección más precisa (Fig. 3c y Fig. complementaria S7). A pesar de estas limitaciones, proyectamos un aumento de hasta el 1,12% de la abundancia relativa de P. calceolata desde la latitud 40° hasta la latitud 50° en los hemisferios norte y sur y una disminución en aguas templadas y tropicales (-0,8% máximo).

El hierro es un metal fundamental para todos los organismos fotosintéticos, necesario para la fotosíntesis, el ciclo del nitrógeno y la protección contra especies reactivas de oxígeno. Dado que P. calceolata parece prosperar en aguas pobres en hierro, identificamos genes de P. calceolata que codifican la absorción y almacenamiento de hierro, luego comparamos sus niveles de expresión en niveles bajos (<0,2 nmol/l) versus altos (>0,2 nmol/l) de hierro. condiciones utilizando metatranscriptomas de Tara Oceans. P. calceolata tiene cinco genes que codifican la fitotransferrina ISIP2A implicada en la captación de Fe3+ a través de vesículas endosómicas y dos supuestas proteínas de almacenamiento de hierro ISIP3. En entornos pobres en hierro, se sobreexpresan tres ISIP2A y un ISIP3 (Fig. 4a y Datos complementarios 9). Este resultado indica que, de manera similar a las diatomeas, los ISIP están regulados positivamente después de la falta de hierro en P. calceolata, lo que potencialmente mejora el crecimiento celular en ambientes bajos en hierro. Tres genes codifican el transportador de hierro ferroportina, pero no se expresan diferencialmente según el entorno (Figura complementaria S8a). Estas proteínas son exportadoras de hierro en organismos multicelulares, pero su función en las microalgas aún está por estudiar36. Finalmente, identificamos ocho permeasas de zinc/hierro potencialmente involucradas en la absorción de hierro del medio ambiente en el genoma de P. calceolata. Entre ellos, dos se sobreexpresan en ambientes con alto contenido de hierro y uno en ambientes con bajo contenido de hierro. Curiosamente, observamos la ausencia de la permeasa de hierro FTR1, la ferritina de almacenamiento de hierro y la proteína ISIP1 inducida por el hambre (implicada en la endocitosis de sideróforos en diatomeas). En comparación con P. calceolata, las Pelagophyceae costeras A. anophagefferens no tienen el gen ISIP3 y un menor número de permeasas de zinc-hierro.

a Niveles relativos de expresión génica normalizados en transcripción por millón (TPM) de cinco fitotransferrinas (ISIP2A) y dos supuestos almacenamientos de hierro (ISIP3) en estaciones oceánicas con bajo contenido de hierro (<0,2 nM) y alto contenido de hierro (>0,2 nM). Para cada gen se indican los valores P de las pruebas estadísticas de Wilcoxon entre condiciones bajas y altas de hierro. Los valores de P significativos (<0,01) están en negrita. b Niveles de expresión relativos (TPM) de genes que codifican ferredoxina (naranja) y su equivalente no ferroso flavodoxina (púrpura) en cada muestra de Tara Oceans. Las muestras se clasifican desde condiciones bajas en hierro (izquierda) hasta altas en hierro (derecha). Las concentraciones de hierro se indican en nM en la barra horizontal de color. c Misma representación para los genes que codifican la fructosa-bifosfato aldolasa II (naranja) y su equivalente no ferroso, la fructosa-bifosfato aldolasa I (púrpura).

Varias proteínas ferrosas importantes pueden sustituirse por equivalentes no ferrosas en entornos pobres en hierro14. En el genoma de P. calceolata identificamos 11 genes de flavodoxina involucrados en la transferencia de electrones durante la fotosíntesis, reemplazando potencialmente a las ferredoxinas (17 genes; Datos complementarios 9). Esta cantidad de genes es importante en comparación con otras algas, incluida A. anophagefferens (5 flavodoxinas y 9 ferredoxinas). Los niveles de expresión de estos genes en los océanos revelaron una sobreexpresión de genes de flavodoxina en ambientes bajos en hierro, reemplazados por ferredoxinas en condiciones altas en hierro (Fig. 4b). La fructosa-bisfosfato aldolasa (FBA), necesaria para la gluconeogénesis y el ciclo de Calvin, está codificada por seis genes en P. calceolata. Dos genes dependen de un catión divalente (FBA tipo II) y los otros cuatro son independientes del zinc/hierro (FBA tipo I). FBA tipo I está sobreexpresado en condiciones con alto contenido de hierro y casi ausente en condiciones con bajo contenido de hierro (Fig. 4c). Finalmente, todos los tipos de superóxido dismutasas (SOD) se encuentran en el genoma de P. calceolata. Las SOD no ferrosas (Cu / Zn y Ni) codificadas por tres genes y Mn / Fe-SOD codificadas por dos genes no se expresan diferencialmente según las concentraciones de hierro (Figura complementaria S8b). El contenido genético y la flexibilidad transcriptómica sugieren capacidades importantes para el crecimiento de P. calceolata en ambientes bajos en hierro.

Debido a que P. calceolata podría ser un actor importante en el ciclo del nitrógeno (N) en los ecosistemas oceánicos25, exploramos su contenido genético y analizamos los niveles de expresión de genes involucrados en el metabolismo del nitrógeno en el medio ambiente utilizando los metatranscriptomas de Tara Oceans (Fig. 5 y datos complementarios). 9). La absorción de compuestos inorgánicos que contienen nitrógeno está respaldada por 11 genes en P. calceolata. Tres genes codifican transportadores de nitrato/nitrito, tres genes codifican transportadores de formiato/nitrito y cinco genes codifican transportadores de amonio. Un gen transportador de formiato/nitrito y dos genes transportadores de nitrato/nitrito se sobreexpresan significativamente en condiciones bajas en nitrato (Figura complementaria S9). Un transportador de amonio se sobreexpresa en entornos con bajo contenido de amonio (Figura complementaria S9). Identificamos una nitrato reductasa y dos nitrito reductasa en el genoma de P. calceolata (Datos complementarios 9). El nivel de expresión es significativamente mayor en ambientes con alto contenido de nitrato para la nitrato reductasa y una nitrito reductasa (Figura complementaria S10). Pero la segunda nitrito reductasa se expresa sorprendentemente menos en condiciones de alto contenido de nitrato. El número de enzimas que incorporan amonio en compuestos orgánicos (vía GS/GOGAT) es mayor en P. calceolata que en otras especies: cinco genes de glutamina sintetasa (GS) y cuatro de glutamato sintasa (GOGAT) están presentes en el genoma de P. calceolata. Dos genes GS se expresan más en muestras con alto contenido de nitrato y 1 gen GOGAT se expresa más en muestras con bajo contenido de nitrato (Figura complementaria S10).

a Representación esquemática del transporte y asimilación de N en P. calceolata según el contenido del gen. El código de color indica si el número de copias de genes para una función específica está sobrerrepresentado (verde), igualmente representado (azul), subrepresentado (naranja) o ausente (rojo) en el genoma de P. calceolata en comparación con la media de ocho pico-nano fotosintéticos. eucariotas. El número de copias del gen para cada función se indica en los Datos complementarios 9. b Organización del dominio de las proteínas detectoras de NIT en P. calceolata. Los cuadros naranjas son dominios de detección de NIT (IPR13587), los cuadros azules son el dominio de serina-treonina/tirosina-quinasa (IPR20635) y los rectángulos amarillos son dominios transmembrana. c Niveles de expresión relativos (TPM) de tres genes sensores de NIT en entornos con bajo contenido de nitrato (<2 µM) y alto contenido de nitrato (>2 µM). Para cada gen se indican los valores de P de las pruebas de Mann-Withney-Wilcoxon entre muestras con niveles bajos y altos de nitratos. Los valores de P significativos (<0,01) están en negrita.

Identificamos tres genes que transportan el dominio de detección de nitratos y nitritos (NIT) (IPR013587) en el genoma de P. calceolata. Utilizando proteínas no redundantes del NCBI y bases de datos genómicas marinas (ver "Métodos"), se identificaron 60 proteínas homólogas de los dominios de detección de NIT de P. calceolata. Estos homólogos están restringidos a la clase Pelagophyceae (16 transcriptomas), la clase Dictyochophyceae (6 transcriptomas) y un supuesto transcriptoma criptofito. El árbol filogenético de esta familia de proteínas muestra tres subfamilias que divergen antes de la separación Dictyochophyceae/Pelagophyceae (Figura complementaria S11). Una proteína de P. calceolata lleva un dominio de detección de NIT rodeado por dos dominios transmembrana, lo que sugiere una capacidad de detección externa de nitrato/nitrito, mientras que los otros dos genes NIT llevan un dominio de proteína quinasa (IPR000719), lo que sugiere una transducción de señales basada en la fosforilación dependiente del nitrato intracelular. o concentración de nitrito (Fig. 5b). Para investigar esta posibilidad, estudiamos los niveles de expresión de los genes sensores de NIT. De hecho, el posible gen externo de detección de NIT se sobreexpresa significativamente en ambientes bajos en nitratos. Por el contrario, solo uno de los genes sensores de NIT intracelulares está regulado positivamente en ambientes ricos en nitratos (Fig. 5c). Este resultado sugiere un papel importante de los genes sensores de NIT en la aclimatación a las concentraciones ambientales de nitrato.

Finalmente, identificamos genes implicados en el reciclaje de nitrógeno de compuestos orgánicos que son importantes en varias especies en caso de privación de nitrógeno inorgánico. Se detectaron una arginasa y una cianato liasa en el genoma de P. calceolata, pero ningún gen que codifique la formamidasa. Además, el número de copias de genes de las enzimas involucradas en el ciclo de la urea (carbamoil-fosfato sintetasa, ornitina carbamoiltransferasa, argininosuccinato sintasa y argininosuccinato liasa) es igual o ligeramente menor que en otras algas (Fig. 5a y Datos complementarios 9). Entre estos genes, solo la cianato liasa se sobreexpresa en condiciones bajas en nitratos, lo que sugiere que el cianato es una fuente alternativa importante de nitrógeno orgánico para P. calceolata (Figura complementaria S10).

Las funciones esenciales del fitoplancton en los ecosistemas oceánicos se han ilustrado muchas veces; sin embargo, numerosos linajes aún están poco explorados y los organismos modelo están restringidos a unos pocos taxones (principalmente diatomeas, prasinófitos y haptofitos), lo que limita la comprensión global de la actividad del fitoplancton. El genoma de P. calceolata ensamblado y anotado en este estudio revela una alta abundancia previamente subestimada de P. calceolata en los océanos y aporta nuevos conocimientos sobre características genómicas específicas de esta clase de algas relacionadas con su adaptación a entornos específicos.

En este estudio hemos demostrado que P. calceolata es cosmopolita en muestras oceánicas por encima de 10 ° C con una abundancia relativa generalmente> 1% de todas las lecturas secuenciadas. A diferencia de las Pelagophyceae costeras A. anophagefferens que pueden presentar altos picos de abundancia37, no se reportaron floraciones de P. calceolata, pero P. calceolata está bien adaptada a una amplia gama de condiciones ambientales como lo sugieren estudios previos21,23. Aunque la abundancia de un organismo calculada a partir de metacódigos de barras o datos metagenómicos proporciona solo una cuantificación indirecta y relativa de la abundancia de organismos, ambos métodos sugieren que P. calceolata es uno de los pico-nano eucariotas más abundantes en los datos marinos. La alta abundancia relativa de P. calceolata medida con un enfoque de metabarcodes ha sido confirmada recientemente con un método qPCR (promedio de 5 882 ± 2 855 copias del gen rRNA mL-1 en la superficie del Pacífico Norte oriental)21. Además, hemos demostrado que el enfoque de codificación de metabarras probablemente subestima la abundancia relativa de P. calceolata en comparación con el análisis metagenómico debido al bajo número de copias de ARNr en este organismo. Sin embargo, no podemos excluir que el gran tamaño del genoma de P. calceolata en comparación con los genomas bacterianos presentes en la fracción de tamaño de 0,8 a 5 µm sobreestime su abundancia relativa en los conjuntos de datos metagenómicos. Otros estudios pueden combinar enfoques microscópicos y de clasificación de flujo con datos genómicos para evaluar la cantidad de células y la biomasa de este organismo en los océanos. El análisis de nuestro modelo ha revelado un probable aumento de la abundancia relativa de P. calceolata a finales de siglo en latitudes altas donde la temperatura del agua de mar es actualmente demasiado baja para esta especie. Este resultado es coherente con estudios previos que sugieren un aumento global de fitoplancton en regiones subpolares38,39.

El hierro es esencial para el crecimiento, la fotosíntesis, la producción primaria, la fijación de nitrógeno y la reducción de los EPP40. Nuestros resultados muestran que P. calceolata prospera en aguas pobres en hierro y, por lo tanto, ocupa un gran nicho ecológico para un EPI. Existen dos estrategias principales contra la privación de hierro: la optimización de la absorción de hierro y la modulación de las necesidades de hierro. Los genes que codifican los quelantes de hierro y la ferritina están ausentes en el genoma de P. calceolata, y los genes que codifican los transportadores pasivos de hierro están insuficientemente representados o igualmente representados en comparación con otros PPE. Por el contrario, las fitotransferrinas (ISIP2A), las supuestas proteínas de almacenamiento de hierro (ISIP3) y las ferroportinas están sobrerrepresentadas en el genoma de P. calceolata. Los niveles de expresión de los genes ISIP están anticorrelacionados con la concentración de hierro en P. calceolata y muestran una aclimatación a condiciones bajas en hierro. Debido a que las fitotransferrinas dependen de los iones carbonato, la acidificación de los océanos puede reducir la eficiencia de la absorción de hierro en muchas especies, incluida P. calceolata41,42. En comparación con P. calceolata, la baja abundancia de A. anophagefferens en océanos abiertos donde el hierro es limitado es consistente con la ausencia de genes involucrados en la absorción y almacenamiento de hierro, incluidas las permeasas de hierro y los genes ISIP3. La presencia de tres genes de ferroportina en P. calceolata es interesante ya que estas proteínas transmembrana exportadoras de hierro desempeñan un papel importante en la homeostasis del hierro en organismos multicelulares36. Se desconoce la función de la ferroportina en las microalgas, pero podría actuar exportando hierro desde los endosomas al citoplasma43. En el alga verde Chlamydomonas reinhardtii, un gen de ferroportina se sobreexpresa en condiciones bajas de Fe44. Aunque no encontramos cambios significativos en la expresión de los 3 genes de ferroportina de P. calceolata según la concentración de hierro, se podría investigar la función de estos genes para comprender su papel en concentraciones variables de hierro.

La modulación de las necesidades de hierro parece ser una importante estrategia de aclimatación para P. calceolata en ambientes bajos en hierro. Todos los interruptores moleculares conocidos entre proteínas ferrosas y no ferrosas están presentes en el genoma de P. calceolata y la regulación transcriptómica de estos genes sugiere un papel central de estas proteínas para su crecimiento en ambientes bajos en hierro.

Los pelagofitos, que expresan más del 90% de todas las transcripciones de transportadores de nitrato, pueden dominar la absorción y asimilación de nitrato en el Océano Pacífico Norte25. De hecho, P. calceolata contiene una gran colección de genes para transportadores de nitrógeno inorgánico. La principal diferencia con la A. anophagefferens costera es el número reducido de transportadores de amonio en P. calceolata.

Los compuestos de nitrógeno orgánico también podrían ser una fuente importante de nitrógeno para P. calceolata. Hemos demostrado que los genes de cianato liasa y ureasa se expresan en muchos entornos, pero sólo la cianato liasa se sobreexpresa en condiciones de bajo contenido de nitratos. Estos dos genes, presentes en gran medida entre los linajes de fitoplancton, podrían ser componentes importantes de la aclimatación a ambientes bajos en nitratos45. Además, A. anophagefferens crece más rápido en sustratos de nitrógeno orgánico (urea y ácido glutámico) que en nitrato o amonio, lo que sugiere que la dominancia de Pelagophyceae en ambientes bajos en nitrato podría deberse a un uso optimizado de estas moléculas orgánicas46.

Una característica notable del genoma de P. calceolata es la presencia de tres genes que portan dominios NIT (PF08376). Este dominio NIT se describió por primera vez en proteínas sensoras de nitrito y nitrato bacteriano47. Este sensor es una proteína alfa-helicoidal que desempeña un papel de transducción de señales en la regulación de la expresión genética, la motilidad celular y la actividad enzimática en Klebsiella oxytoca48. En las algas pico-nano, los dominios de detección de NIT pueden asociarse con un dominio de serina-treonina/tirosina-quinasa, lo que sugiere transducción de señales de acuerdo con la concentración intracelular de nitrato/nitrito, o estar rodeados por dos dominios transmembrana que sugieren detección extracelular. Aunque los dominios de detección de NIT se pueden encontrar en varios filos, los homólogos de las proteínas NIT de P. calceolata están restringidos a pelagofitos y dictiocófitos. Los genes NIT en P. calceolata se expresan altamente en aguas subtropicales del Pacífico empobrecidas en N, lo que sugiere que estas proteínas tienen un papel en la regulación de la transcripción según la disponibilidad de nitrato25. Nuestros resultados sugieren que las proteínas detectoras de NIT responden de manera diferente al agotamiento ambiental de nitratos. Podemos plantear la hipótesis de que la proteína sensora de NIT sobreexpresada en entornos ricos en nitratos desempeña un papel en la regulación intracelular del nitrógeno almacenado, activando vías cuando las reservas de nitrato o nitrito son suficientes. Por el contrario, la supuesta detección extracelular de NIT podría ser un sensor ambiental de nitrato o nitrito activado para regular la expresión de genes implicados en la aclimatación a condiciones bajas en nitrato.

En resumen, debido a su amplia distribución y su gran abundancia en océanos abiertos, Pelagomonas calceolata puede servir como un modelo ecológicamente relevante para estudiar los protistas fotosintéticos marinos. Utilizamos la secuencia del genoma a escala de cromosomas, principalmente de telómero a telómero, generada en este estudio para estimar su abundancia en conjuntos de datos ambientales. Hemos demostrado que el genoma de P. calceolata tiene características genómicas específicas que podrían explicar su éxito ecológico en océanos abiertos. En comparación con las Pelagophyceae costeras A. anophagefferens, el genoma de P. calceolata contiene genes específicos implicados en la aclimatación a condiciones bajas en hierro. El gran repertorio de genes implicados en la adquisición de nutrientes del medio ambiente es coherente con su patrón generalizado de distribución de abundancia relativa en diferentes entornos. El nicho ecológico de P. calceolata sugiere que esta alga se beneficiará del cambio climático global con la extensión de regiones oligotróficas y el calentamiento global de los océanos. Estudios futuros podrían utilizar el genoma de P. calceolata para explorar los procesos de adaptación y aclimatación que controlan la distribución y abundancia de esta alga.

El cultivo de Pelagomonas calceolata RCC100 se cultivó en un fotoperiodo de luz:oscuridad de 12:12 h en medio K con base de agua de mar natural a 20 °C. En la Colección de Cultivos de Roscoff, las células se mantuvieron a una intensidad de luz de ~80 μmol de fotón m-2 s-1 y el volumen de cultivo se aumentó hasta 1 litro en la fase de crecimiento exponencial medio antes de la recolección. El cultivo RCC100 no fue axénico y se desarrolló en presencia de microbiota bacteriana indefinida.

Se sedimentaron células de 500 ml de cultivo mediante dos centrifugaciones sucesivas a 10.000 × g durante 15 minutos a 4 ° C. El ADN genómico se extrajo utilizando el kit NucleoSpin Plant II Mini según las instrucciones del fabricante (Macherey-Nagel, Hoerdt, Francia) con la siguiente excepción para el paso de lisis: 400 µL de tampón de lisis PL1 y 25 µL de proteinasa K 25 mg/mL. Se agregaron a los sedimentos de cepa y los lisados ​​​​se incubaron a 55 ° C durante 1 h a 900 rpm. La cantidad y la integridad del ADN se evaluaron respectivamente en un espectrofluorómetro Qubit 2.0 (Invitrogen, Carlsbad, CA, EE. UU.) y un espectrofotómetro Nanodrop1000 (Thermo Fisher Scientific, MA, EE. UU.).

Para la secuenciación de Illumina, se sonicó el ADN (1,5 μg) utilizando un sonicador Covaris E220 (Covaris, Woburn, MA, EE. UU.). Los fragmentos se repararon en los extremos, se adenilaron en 3′ y se agregaron adaptadores Illumina (Bioo Scientific, Austin, TX, EE. UU.) utilizando el kit Kapa Hyper Prep (KapaBiosystems, Wilmington, MA, EE. UU.). Los productos de ligación se purificaron con perlas AMPure XP (Beckmann Coulter Genomics, Danvers, MA, EE. UU.). Luego, la biblioteca se cuantificó mediante qPCR utilizando el kit de cuantificación de bibliotecas KAPA para bibliotecas Illumina (KapaBiosystems), y el perfil de la biblioteca se evaluó utilizando un kit de ADN de alta sensibilidad en un bioanalizador Agilent (Agilent Technologies, Santa Clara, CA, EE. UU.). La biblioteca se secuenció en un instrumento Illumina NovaSeq (Illumina, San Diego, CA, EE. UU.) utilizando química de lectura de 150 bases de longitud en modo de extremo emparejado.

Para la secuenciación ONT, la biblioteca se preparó utilizando el ADN genómico con código de barras nativo 1D (con EXP-NBD104 y SQK-LSK109). Los fragmentos de ADN genómico (1 µg) se repararon y se adenilaron en 3' con la mezcla de reparación de ADN FFPE NEBNext y el módulo de reparación de extremos/dA-Tailing NEBNext® Ultra™ II (New England Biolabs, Ipswich, MA, EE. UU.). Luego se ligaron los adaptadores con códigos de barras proporcionados por ONT utilizando NEB Blunt/TA Ligase Master Mix (NEB). Después de la purificación con perlas AMPure XP (Beckmann Coulter, Brea, CA, EE. UU.), se agregaron los adaptadores de secuenciación (ONT) utilizando la ADN ligasa NEBNext Quick T4 (NEB). La biblioteca se purificó con perlas AMPure XP (Beckmann Coulter), luego se mezcló con el tampón de secuenciación (ONT) y la perla de carga (ONT) y se cargó en una celda de flujo MinION R9.4.1. Las lecturas se realizaron con Guppy 3.1.5.

Para la secuenciación Hi-C, la biblioteca se preparó utilizando el kit Dovetail Omni-C (Dovetail Genomics, Scotts Valley, CA, EE. UU.). Primero se centrifugó un cultivo de P. calceolata RCC100 (60 ml correspondientes a aproximadamente 6 x 107 células) a 5000 x g durante 10 minutos. El sedimento se procesó como células de mamífero, siguiendo el Protocolo de células de mamífero para la preparación de muestras (versión 1.4) sin utilizar reactivo de reticulación DSG. Brevemente, la cromatina se fijó con formaldehído, se digirió aleatoriamente con ADNasa I y luego se extrajo. Los extremos de la cromatina se repararon y ligaron a un adaptador de puente biotinilado, seguido de una ligadura de proximidad de los extremos que contenían el adaptador. Después de la ligadura por proximidad, se revirtieron los enlaces cruzados y se purificó el ADN. Se trató el ADN purificado para eliminar la biotina que no era interna a los fragmentos ligados y se generó una biblioteca de secuenciación utilizando enzimas NEBNext Ultra y adaptadores compatibles con Illumina. Los fragmentos que contienen biotina se aislaron utilizando perlas de estreptavidina antes del enriquecimiento de la biblioteca por PCR. La calidad de la biblioteca Dovetail Hi-C se verificó como se describe anteriormente y se secuenció en un instrumento Illumina MiSeq (Illumina, San Diego, CA, EE. UU.) en modo emparejado (2 * 150 pb), produciendo 2,832,092 lecturas. Las lecturas sin procesar de Hi-C se alinearon con el ensamblaje (opción -s sin ninguna) usando Juicer (Juicer versión 1.5.6 - Juicer Tools versión 1.9.9)49. La representación del mapa de contactos se generó con R versión 4.1.1 utilizando el archivo nodups combinado.

Cuando la concentración celular alcanzó los 10 millones de células/ml en la fase de crecimiento exponencial medio, se recogieron 160 ml de cultivo mediante tres filtraciones sucesivas en filtros de policarbonato de 1,2 µm y 47 mm para evitar la contaminación procariótica. Para preservar la integridad de las células y el ARN, mantuvimos el tiempo de filtración y la presión por debajo de 10 minutos y 20 mmHg, respectivamente. Luego, los filtros se almacenaron en tubos Falcon de 15 ml con 3 ml de Trizol (Invitrogen, Carlsbad, CA, EE. UU.), se mezclaron y se congelaron instantáneamente en nitrógeno líquido para su posterior procesamiento. El ARN se extrajo mediante incubación a 65 °C durante 15 minutos, seguido de extracción con cloroformo. La fase acuosa se purificó utilizando un kit Purelink RNA Isolation (Ambion Invitrogen, Carlsbad, CA, EE. UU.) según las instrucciones del fabricante. La contaminación del ADN se eliminó mediante digestión utilizando el kit TURBO DNA-free™ (Ambion Invitrogen) de acuerdo con el protocolo de tratamiento con ADNasa del fabricante. Después de dos rondas de incubación de 30 minutos a 37 °C, se evaluó mediante PCR la eficacia del tratamiento con ADNasa. La cantidad y la calidad del ARN extraído se analizaron con cuantificación fluorimétrica específica de ARN en un fluorómetro Qubit 2.0 utilizando el ensayo Qubit RNA HS (Invitrogen). Las cualidades del ARN total se comprobaron mediante electroforesis capilar en un bioanalizador Agilent, utilizando el kit RNA 6000 Nano LabChip (Agilent Technologies, Santa Clara, CA).

La preparación de la biblioteca RNA-Seq se llevó a cabo a partir de 1 µg de ARN total utilizando el kit TruSeq Stranded mRNA (Illumina, San Diego, CA, EE. UU.), lo que permitió la orientación de las cadenas de mRNA. Brevemente, se seleccionaron ARN poli(A) + con perlas de oligo(dT), se fragmentaron químicamente y se convirtieron en ADNc monocatenario mediante cebado con hexámero aleatorio. Después de la síntesis de la segunda cadena, el ADNc bicatenario se adeniló en 3' y se ligó a adaptadores Illumina. Los productos de ligación se amplificaron por PCR siguiendo las recomendaciones del fabricante. Finalmente, la biblioteca Illumina lista para secuenciar se cuantificó mediante qPCR utilizando el kit de cuantificación de bibliotecas KAPA para bibliotecas Illumina (KapaBiosystems, Wilmington, MA, EE. UU.) y se evaluó con un bioanalizador Agilent 2100 (Agilent Technologies, Santa Clara, CA, EE. UU. ). La biblioteca se secuenció utilizando química de lectura de extremos pares de 101 pb en un secuenciador HiSeq2000 Illumina. Se descartaron los nucleótidos de baja calidad (Q <20) de ambos extremos de las lecturas. Se eliminaron los adaptadores de secuenciación de Illumina y las secuencias de cebadores y se descartaron las lecturas de menos de 30 nucleótidos después del recorte. Estos pasos de recorte y limpieza se lograron utilizando un software diseñado internamente basado en el paquete FastX (https://www.genoscope.cns.fr/externe/fastxtend/). El último paso identifica y descarta los pares de lectura asignados al genoma del fago phiX, utilizando el alineador SOAP50 y la secuencia de referencia del fago PhiX174 de Enterobacteria (GenBank: NC_001422.1). Este procesamiento, descrito en la ref. 51, dieron como resultado datos de alta calidad. Además, las lecturas similares a ARN ribosomal se excluyeron utilizando las bases de datos SortMeRNA52 2.1 y SILVA.

Se utilizaron lecturas de nanoporos sin procesar para el ensamblaje del genoma. La asignación taxonómica se realizó utilizando Centrifuge53 versión 1.0.3 para detectar posible contaminación. El tamaño del genoma y la tasa de heterocigosidad se estimaron utilizando lecturas cortas de Genomescope54 e Illumina. Para el ensamblaje del genoma, generamos tres conjuntos de lecturas de ONT: todas las lecturas, una cobertura del genoma de 30× con las lecturas más largas y una cobertura del genoma de 30× con las lecturas de mayor calidad estimadas por la herramienta Filtlong (https://github.com/rrwick /Filtlong). Aplicamos el filtrado Filtlong con parámetros predeterminados utilizando lecturas cortas de Pelagomonas Illumina como referencia (las lecturas de ONT cubiertas por las lecturas de Illumina tienen puntuaciones más altas). Luego aplicamos cuatro ensambladores diferentes con configuraciones predeterminadas, Smartdenovo, Redbean, Flye y Ra en estos tres conjuntos de lecturas (Datos complementarios 1)55,56,57,58. Después de la fase de ensamblaje, seleccionamos el mejor ensamblaje (Flye con todas las lecturas) según el tamaño acumulativo y la fragmentación. De hecho, el ensamblador Wtdbg2 y Smartdenovo generó ensamblajes fragmentados con N90 más bajo. Raven y Flye estaban muy cerca, pero solo el conjunto de Flye con todas las lecturas de ONT contenía los cóntiges circulares mitocondriales y cloroplásticos. Para mostrar conexiones que no están presentes en el archivo contigs, utilizamos la herramienta Bandage59. El conjunto Flye seleccionado se pulió tres veces usando Racon60 con lecturas ONT y dos veces con lecturas Hapo-G61 e Illumina. La integridad genética del ensamblaje se estimó utilizando el análisis de genes ortólogos de copia única de BUSCO v5 con el conjunto de datos de stramenopile versión 10 que contiene 100 genes28.

Las regiones repetitivas del genoma se enmascararon utilizando la herramienta Tandem Repeat Finder62, la herramienta Dust para detectar regiones de baja complejidad63 y RepeatMasker64 para identificar repeticiones intercaladas según la búsqueda de homología dentro del clado Stramenopile y otras secuencias de baja complejidad. Las posiciones de las repeticiones detectadas se fusionaron y enmascararon en el genoma, representando el 8% de su longitud. La identificación ab initio de secuencias familiares repetidas se realizó utilizando RepeatScout65. El algoritmo primero calcula la frecuencia de todos los k-mers en el genoma y luego elimina las regiones de baja complejidad y las repeticiones en tándem. En >80% de los casos, las familias repetidas identificadas mediante enfoques ab initio no se superponen con regiones repetitivas identificadas mediante búsqueda de homología. El contenido de GC a lo largo del genoma se calculó con Bedtools nuc versión 2.29.266 y la cobertura en una ventana no superpuesta de 2 Kb con Mos Depth versión 0.2.867.

Las lecturas de secuenciación de ARN de P. calceolata RCC100 se ensamblaron utilizando Velvet 1.2.07 y Oases 0.2.08 con un tamaño de k-mer de 63 pb68,69. Las lecturas se asignaron nuevamente a los contigs con BWA-mem70 y solo se mantuvieron lecturas consistentes de extremos emparejados. Se detectaron regiones descubiertas y se utilizaron para identificar cóntigos quiméricos. Además, se realizaron búsquedas en marcos de lectura abiertos (ORF) y dominios utilizando respectivamente TransDecoder (http://transdecoder.sourceforge.net) y CDDsearch71. Se eliminaron las extremidades contig sin ORF predichos o dominios funcionales. Por último, utilizamos la información de la cadena leída para orientar los contigs de ARN. Completamos el conjunto de datos de RNA contigs con los dos conjuntos de transcriptomas de la cepa RCC100 de P. calceolata de la base de datos Marine Eukaryotes Transcriptomes (METdb) (//metdb.sb-roscoff.fr/metdb/)72.

La predicción de genes nucleares se realizó utilizando 23.696 proteínas de Pelagomonadales (principalmente A. anophagefferens) descargadas del sitio web del NCBI. Las proteínas se alinearon en el genoma mediante una estrategia de dos pasos. Primero, se utilizó BLAT73 (versión 36 con parámetros predeterminados) para localizar rápidamente las supuestas regiones correspondientes de estas proteínas en el genoma. Se retuvieron el mejor partido y los partidos con una puntuación mayor o igual al 90% de la mejor puntuación del partido. Luego, se enmascararon las regiones con alineamientos BLAT y alineamos el mismo conjunto de proteínas usando BLAST74, que puede identificar coincidencias más divergentes. En segundo lugar, las alineaciones se refinaron utilizando Genewise75 (parámetros predeterminados de la versión 2.2.0, excepto la opción del modelo -splice para detectar sitios de empalme no canónicos), que es más preciso para detectar límites intrón/exón. Las alineaciones se mantuvieron si más del 50% de la longitud de la proteína está alineada en el genoma. Además, los conjuntos de transcriptomas de P. calceolata RCC969, RCC2362, RCC706 y RCC981 incluidos en METdb se tradujeron en proteínas y se alinearon con el genoma utilizando BLAT, un filtro de puntuación BLAT> 50 % y alineaciones refinadas con Genewise como se describió anteriormente.

Seleccionamos alineamientos del ensamblaje del transcriptoma recién generado y los dos ensamblajes disponibles en METdb que pertenecen a la cepa P. calceolata RCC100 para construir un conjunto de entrenamiento para el predictor del gen AUGUSTUS ab initio76. Sólo se conservaron para el entrenamiento modelos genéticos con secuencias codificantes completas de ADN y se reservaron 1.000 genes para probar la precisión de AUGUSTUS. La formación inicial produjo parámetros de exones e intrones para las especies de P. calceolata. Los parámetros se optimizaron mediante pasos sucesivos de entrenamiento y prueba. Calculamos la precisión de la predicción de genes ejecutando AUGUSTUS en el conjunto de prueba. A nivel de exón, AUGUSTUS tuvo un buen desempeño en términos de sensibilidad (0,619) y especificidad (0,669). Por lo tanto, ejecutamos AUGUSTUS en el genoma enmascarado en función de parámetros entrenados.

La predicción ab initio y todas las alineaciones transcriptómicas y proteicas se combinaron utilizando Gmove, un predictor fácil de usar sin necesidad de un paso de calibración previa77. Brevemente, se utilizaron supuestos exones e intrones, extraídos de predicciones y alineaciones, para construir un gráfico, donde los nodos y bordes representan exones e intrones respectivamente. De este gráfico, Gmove extrae todas las rutas y busca marcos de lectura abiertos (ORF) consistentes con la evidencia de proteínas. Recortamos regiones transcritas no traducidas que se superponían a la parte codificante de un gen vecino y cambiamos el nombre de los genes siguiendo la nomenclatura estándar. Se excluyeron los modelos de genes monoexónicos que codifican proteínas de menos de 200 aminoácidos sin una coincidencia proteica significativa (1006 genes). Los genes de cloroplasto y mitocondrias (cóntigos 7 y 8) se predijeron utilizando anotaciones publicadas previamente para P.calceolata23,78. Siguiendo este proceso, predijimos 16.667 genes con 0,45 intrones por gen en promedio.

Se anotaron los modelos genéticos previstos del genoma nuclear de P. calceolata (contig 1 a contig 6) para la función de la proteína utilizando InterProScan v5.41-78.079. Se realizó una alineación de proteínas con la base de datos NR (versión 12-01-2021) con Diamond v0.9.2480. Se retuvo la mejor coincidencia de proteínas con una anotación funcional y un valor e <10-5. Los ortólogos de KEGG (KO) se identificaron con la herramienta de búsqueda de HMM KofamKoala v1.3.0 y se conservaron las anotaciones de KO con un valor e <10-5 y una puntuación por encima del umbral de HMM81. Finalmente, los términos de Gene Ontology (GO) y los números de Enzyme Commission (EC) se recuperaron del análisis de Interproscan y KO, respectivamente. Los nombres y funciones de los genes mitocondriales y cloroplastos publicados previamente se informaron en los genes correspondientes23,78. Todas las anotaciones de genes funcionales de P. calceolata están disponibles en Datos complementarios 2.

Para comparar la anotación funcional de P. calceolata con otros pequeños eucariotas fotosintéticos de vida libre, aplicamos el mismo análisis a las proteínas predichas disponibles para las siguientes especies: Aureococcus anophagefferens, Thalassiosira pseudonana, Phaeodactylum tricornutum, Nannochloropsis oceanica, Bathycoccus prasinos, Micromonas pusilla, Ostreococcus lucimarinus y Emiliania huxleyi (las referencias se indican en la Tabla 1).

Definimos una lista de 23 genes específicos de la meiosis utilizando tres estudios previos31,32,33. Se utilizaron anotaciones KO y dominios Interproscan para recuperar estos genes en el genoma de P. calceolata. Las lecturas transcriptómicas de P. calceolata se asignaron a los genes predichos con BWA-MEM v 2.2.1. Se conservaron lecturas alineadas en más del 80% de su longitud para estimar los niveles de expresión relativos de los genes de la meiosis.

Los genes que contienen el dominio de detección de NIT se identificaron basándose en anotaciones de Interproscan. Se recuperaron homólogos eucariotas de los tres genes sensores NIT de P. calceolata con un BLASTP (valor e < 10-5, cobertura > 100 aa) contra 27,7 millones de proteínas de NR, la base de datos de transcriptomas METdb72 y proteomas de algas eucariotas de la base de datos JGI. , Genomas amplificados unicelulares de Tara Oceans y genomas ensamblados con metagenomas (SMAG)82. Las 60 proteínas recuperadas y las 3 proteínas que contienen el dominio NIT de P. calceolata se alinearon con Mafft v7.0 (https://mafft.cbrc.jp/alignment/server/) y un árbol filogenético de máxima probabilidad (Jones-Taylor). –Modelo de sustitución de Thornton y 100 bootstraps) se realizó con el software MEGAX. Las regiones transmembrana en proteínas que contienen dominios de detección de NIT se identificaron con TMHMM v 2.055.

Utilizamos conjuntos de datos metagenómicos de las expediciones Tara Oceans y Tara Polar Circle para detectar y estimar la abundancia relativa de P. calceolata en los océanos. Se analizaron conjuntos de datos de muestras de agua recolectadas en la zona fótica: superficie (SUR) y máximo de clorofila profunda (DCM). Se seleccionaron muestras de agua fraccionadas por tamaño que contenían algas pico-nano (organismos <5 µm de diámetro celular): 0,2–3 µm (100 muestras), 0,8–2000 µm (119 muestras) y 0,8–5 µm (148 muestras)51. Las lecturas metagenómicas se alinearon en el genoma de P. calceolata ensamblado en este estudio con BWA-mem versión 0.7.15 con parámetros predeterminados83. Las alineaciones con al menos el 90 % de identidad sobre el 80 % de la longitud de lectura se conservaron para análisis posteriores. En el caso de varias posibles mejores coincidencias, se eligió una al azar. Para eliminar supuestos duplicados de PCR, se eliminaron múltiples pares de lectura alineados en la misma posición en el genoma de P. calceolata con samtools rmdup versión 1.10.270. Para la abundancia metagenómica, dividimos el número total de lecturas alineadas en el genoma de P. calceolata ensamblado en este estudio por el número total de lecturas secuenciadas para cada muestra. Para la abundancia de metacódigos de barras, utilizamos la tabla 18SV9 rRNA OTU publicada en 2019 y disponible aquí https://zenodo.org/record/3768510#.YEX2S9zjJaQ34. Para este análisis se eliminaron las OTU bacterianas y de arqueas.

Se realizaron dos modelos de abundancia relativa de P. calceolata basados ​​en las condiciones ambientales in situ medidas en el momento del muestreo o utilizando los conjuntos de datos WOA18. Los parámetros ambientales medidos durante la expedición están disponibles en la base de datos Pangea (https://www.pangaea.de/) y se describen en la ref. 84. Las concentraciones de hierro son medias anuales derivadas del modelo PISCES285 y descritas en la ref. 13. Las concentraciones de amonio en la fecha y lugar del muestreo se derivan del modelo Darwin del MITgcm y están disponibles en la base de datos Pangea86. Los parámetros ambientales para cada muestra están disponibles en los Datos complementarios 10. Consideramos que las muestras oceánicas son "bajas en hierro" si contienen menos de 0,2 nM de hierro, "bajas en nitrato" si contienen menos de 2 µM de nitrato y "bajas en nitrato" si contienen menos de 2 µM de nitrato. amonio” si contienen menos de 25 nM de amonio. Estos umbrales se definieron con la distribución de concentraciones de nutrientes en el conjunto de datos y estudios previos13,14. Las correlaciones de Pearson entre la abundancia relativa de P. calceolata y todos los parámetros ambientales se calcularon con la función cor del paquete R FactoMineR versión 2.4 y el paquete GGally versión 2.1.0. Se realizó análisis de componentes principales (PCA) con 9 parámetros que presentaron correlaciones de Pearson significativas. Utilizamos un Modelo Aditivo Generalizado (GAM) por su capacidad para ajustar funciones no lineales y no monótonas y por su baja sensibilidad a valores extremos para modelar la abundancia relativa de P. calceolata en función de la concentración de hierro, la temperatura y la luz PAR87 . Esta función está implementada en la versión 1.8–33 del paquete mgcv R.

Se utilizó la media de varias climatologías de los Modelos del Sistema Terrestre bajo el escenario RCP8.5 (ESM8.5) para definir las condiciones ambientales a finales de siglo siguiendo el método de la ref. 35. Los modelos de abundancia relativa de P. calceolata basados ​​en WOA18 en ubicaciones, profundidades y meses de muestras de los océanos Tara o ESM8.5 se obtuvieron utilizando cuatro técnicas de aprendizaje automático como se describe en la ref. 35. con algunas diferencias. Las cuatro herramientas fueron entrenadas en modo de regresión, utilizamos el paquete neuralnet R88 con los siguientes parámetros: oculto = 1, decay = 0.1, mxit = 1e6 y tamaño = 5, se seleccionaron 6 splines para el GAM. Realizamos una validación cruzada aleatoria 100 veces para cada modelo y evaluamos su desempeño utilizando el coeficiente de correlación de Pearson y rmse. Utilizamos los enfoques del modelo de conjunto35 para los modelos finales a escala global de la abundancia relativa de P. calceolata (es decir, las proyecciones medias de las técnicas validadas de aprendizaje automático). Las Figuras 2a, 3c y la Figura complementaria S7 se generaron utilizando el mapa mundial de los paquetes R “maps”, “mapdata” y “ggmap”. Los datos de los mapas mundiales se importan del proyecto de dominio público Natural Earth.

Las lecturas metatranscriptómicas de los conjuntos de datos de Tara Oceans se alinearon en secuencias codificantes predichas del genoma de P. calceolata con BWA-mem 2.2.1 utilizando parámetros predeterminados. Seleccionamos lecturas alineadas con más del 95% de identidad en más del 80% de la longitud de la lectura. Mantuvimos los genes nucleares cubiertos por al menos diez lecturas en un mínimo de diez muestras y eliminamos los detectados en más del 90% de las muestras que probablemente agregan lecturas metagenómicas de otros organismos (mapeo cruzado). Para obtener valores de expresión relativa sólidos, eliminamos muestras en las que se detectaron menos del 25% de los genes de P. calceolata. Finalmente obtuvimos la expresión de 15.679 genes de P. calceolata en 167 muestras. En todos los análisis de expresión génica, normalizamos los niveles de expresión génica en transcripciones por millón de kilobases (TPM). Los niveles de expresión genética de P. calceolata en todas las muestras de Tara Oceans están disponibles aquí: https://doi.org/10.5281/zenodo.6983365.

Los tamaños de las muestras se indican en los métodos, en los títulos de las figuras o en el texto principal. Se aplicaron pruebas no paramétricas de rangos con signo de Wilcoxon con la hipótesis alternativa bilateral y no pareadas. Se aplicaron pruebas estadísticas de Fisher de dos lados para el análisis de enriquecimiento genético. Todas las pruebas estadísticas del manuscrito se generaron con R versión 4.0.3 y los valores de P <0,01 se consideran significativos.

Más información sobre el diseño de la investigación está disponible en el Resumen de informes de investigación de la naturaleza vinculado a este artículo.

Las lecturas genómicas y transcriptómicas, el ensamblaje del genoma y la predicción de genes de Pelagomonas calceolata están disponibles en el sitio web de ENA (EMBL-EBI) con el número de acceso PRJEB47931. Los transcriptomas de P. calceolata están disponibles con el número de acceso PRJEB34158, ejecuta ERR3497221 y ERR3497222. Las secuencias metagenómicas de Tara Oceans y Tara Polar Circle están archivadas en la ENA con los siguientes números de acceso: PRJEB9740, PRJEB9691, PRJEB4352 y PRJEB1787. Todos los demás datos están disponibles del autor correspondiente previa solicitud razonable.

Field, CB, Behrenfeld, MJ, Randerson, JT & Falkowski, P. Producción primaria de la biosfera: integración de componentes terrestres y oceánicos. Ciencia 281, 237–240 (1998).

Artículo CAS PubMed Google Scholar

Boyce, DG, Lewis, MR y Worm, B. Disminución global del fitoplancton durante el siglo pasado. Naturaleza 466, 591–596 (2010).

Artículo CAS PubMed Google Scholar

Henson, SA, Cael, BB, Allen, SR y Dutkiewicz, S. Diversidad futura del fitoplancton en un clima cambiante. Nat. Comunitario. 12, 5372 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Vaulot, D., Eikrem, W., Viprey, M. & Moreau, H. La diversidad de fitoplancton eucariota pequeño (≤3 μm) en ecosistemas marinos. Microbiol FEMS. Rev. 32, 795–820 (2008).

Artículo CAS PubMed Google Scholar

Agawin, NSR, Duarte, CM & Agustí, S. Control de nutrientes y temperatura del aporte del picoplancton a la biomasa y producción de fitoplancton. Limnol. Oceanogr. 45, 591–600 (2000).

Artículo CAS Google Scholar

Moran, XAG, Lopez-Urrutia, Á., Calvo-Diaz, A. & Li, WKW Creciente importancia del pequeño fitoplancton en un océano más cálido. Globo. Cambiar Biol. 16, 1137-1144 (2010).

Artículo de Google Scholar

Li, WKW, McLaughlin, FA, Lovejoy, C. & Carmack, EC Las algas más pequeñas prosperan a medida que el océano Ártico se refresca. Ciencia 326 https://doi.org/10.1126/science.1179798 (2009).

Benner, I., Irwin, AJ y Finkel, ZV Capacidad del picoeucariota común del Ártico Micromonas para adaptarse a un océano que se calienta. Limnol. Letra de Oceanografía. 5, 221–227 (2020).

Sunda, WG & Huntsman, SA Absorción de hierro y limitación del crecimiento en el fitoplancton oceánico y costero. Mar. Química. 50, 189–206 (1995).

Artículo CAS Google Scholar

Raven, JA La duodécima conferencia de Tansley. Lo pequeño es hermoso: el picofitoplancton. Función. Ecológico. 12, 503–513 (1998).

Artículo de Google Scholar

Morel, FMM & Price, NM Los ciclos biogeoquímicos de los metales traza en los océanos. Ciencia 300, 944–947 (2003).

Artículo CAS PubMed Google Scholar

Gao, X., Bowler, C. y Kazamia, E. Estrategias del metabolismo del hierro en diatomeas. J. Exp. Bot. 72, 2165–2180 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Caputi, L. y col. Respuestas a nivel comunitario a la disponibilidad de hierro en ecosistemas de plancton en mar abierto. Globo. Ciclos biogeoquímicos 33, 391–419 (2019).

Artículo CAS Google Scholar

Carradec, Q. et al. Un atlas oceánico global de genes eucariotas. Nat. Comunitario. 9, 373 (2018).

Artículo PubMed PubMed Central CAS Google Scholar

Morrissey, J. y col. Una nueva proteína, omnipresente en el fitoplancton marino, concentra el hierro en la superficie celular y facilita la absorción. actual. Biol. 25, 364–371 (2015).

Artículo CAS PubMed Google Scholar

Moore, CM y cols. Procesos y patrones de limitación de nutrientes oceánicos. Nat. Geociencias. 6, 701–710 (2013).

Artículo CAS Google Scholar

Kumar, A. & Bera, S. Revisando la utilización del nitrógeno en las algas: una revisión del proceso de regulación y asimilación. Biorrecurso. Tecnología. Rep. 12, 100584 (2020).

Artículo de Google Scholar

Smith, SR y cols. Evolución y regulación del flujo de nitrógeno a través de redes metabólicas compartimentadas en una diatomea marina. Nat. Comunitario. 10, 4552 (2019).

Artículo PubMed PubMed Central CAS Google Scholar

Berg, GM, Glibert, PM, Lomas, MW y Burford, MA Absorción y crecimiento de nitrógeno orgánico por parte del crisófito Aureococcus anophagefferens durante un evento de marea marrón. Mar. Biol. 129, 377–387 (1997).

Artículo CAS Google Scholar

Andersen, RA, Saunders, GW, Paskind, MP y Sexton, JP Ultraestructura y secuencia del gen 18s rRNA para el gen Pelagomonas calceolata. y sp. nov. y la descripción de una nueva clase de algas, las pelagophyceae classis nov. J. Phycol. Rev. 29, 701–715 (1993).

Artículo CAS Google Scholar

Choi, CJ y cols. Transiciones estacionales y geográficas en la estructura de la comunidad de fitoplancton eucariota en los océanos Atlántico y Pacífico. Frente. Microbiol. 11, 542372 (2020).

Artículo PubMed PubMed Central Google Scholar

Duerschlag, J. y col. División de nichos por plancton fotosintético como impulsor de la fijación de CO2 en el océano subtropical oligotrófico del Pacífico Sur. ISME J 1–12 https://doi.org/10.1038/s41396-021-01072-z (2021).

Worden, AZ y cols. Distribución global de un alga salvaje revelada por metagenómica dirigida. actual. Biol. 22, R675–R677 (2012).

Artículo CAS PubMed Google Scholar

Dimier, C. é, Brunet, C., Geider, R. & Raven, J. Dinámica de crecimiento y fotorregulación del picoeucariota Pelagomonas calceolata en luz fluctuante. Limnol. Oceanogr. 54, 823–836 (2009).

Artículo CAS Google Scholar

Dupont, CL y cols. Genomas y expresión genética a través de gradientes de luz y productividad en comunidades microbianas del Pacífico subtropical oriental. ISME J. 9, 1076–1092 (2015).

Artículo CAS PubMed Google Scholar

Kang, Y. y col. Respuestas transcriptómicas de cuatro pelagofitos al estrés por nutrientes (N, P) y luz. Frente. Marzo ciencia. 8, 636699 (2021).

Huff, JT, Zilberman, D. & Roy, SW Mecanismo para que los transposones de ADN generen intrones a escalas genómicas. Naturaleza 538, 533–536 (2016).

Artículo PubMed PubMed Central CAS Google Scholar

Waterhouse, RM y cols. Aplicaciones de BUSCO, desde evaluaciones de calidad hasta predicción de genes y filogenómica. Mol. Biol. Evolución. 35, 543–548 (2018).

Artículo CAS PubMed Google Scholar

Nambiar, M. & Smith, GR Represión de la recombinación meiótica dañina en regiones centroméricas. Desarrollo de células Semin. Biol. 54, 188-197 (2016).

Artículo CAS PubMed PubMed Central Google Scholar

Pessia, E. et al. Evidencia de una conversión genética generalizada sesgada por GC en eucariotas. Genoma Biol. Evolución. 4, 675–682 (2012).

Artículo CAS PubMed PubMed Central Google Scholar

Chi, J., Mahé, F., Loidl, J., Logsdon, J. & Dunthorn, M. El inventario de genes de meiosis de cuatro ciliados revela la prevalencia de una vía cruzada independiente del complejo sinaptonémico. Mol. Biol. Evolución. 31, 660–672 (2014).

Artículo CAS PubMed Google Scholar

Ramesh, MA, Malik, S.-B. & Logsdon, JM Un inventario filogenómico de genes meióticos; evidencia de sexo en Giardia y un origen eucariota temprano de la meiosis. actual. Biol. 15, 185-191 (2005).

CAS PubMed Google Académico

Schurko, AM & Logsdon, JM Uso de un conjunto de herramientas de detección de meiosis para investigar antiguos "escándalos" asexuales y la evolución del sexo. Bioensayos 30, 579–589 (2008).

Artículo CAS PubMed Google Scholar

Ibarbalz, FM et al. Tendencias globales en la diversidad del plancton marino en todos los reinos de la vida. Celda 179, 1084–1097.e21 (2019).

Artículo CAS PubMed PubMed Central Google Scholar

Frémont, P. et al. Reestructuración de la biogeografía genómica del plancton en la superficie del océano bajo el cambio climático. Nat. Subir. Chang. 12, 393–401 (2022).

Artículo de Google Scholar

Ward, DM y Kaplan, J. Transporte de hierro mediado por ferroportina: expresión y regulación. Biochim Biophys. Actas 1823, 1426-1433 (2012).

Artículo CAS PubMed PubMed Central Google Scholar

Gobler, CJ, Lonsdale, DJ & Boyer, GL Una revisión de las causas, efectos y manejo potencial de las floraciones dañinas de marea marrón causadas por Aureococcus anophagefferens (Hargraves et sieburth). Estuarios 28, 726–749 (2005).

Artículo de Google Scholar

Agusti, S., Lubian, LM, Moreno-Ostos, E., Estrada, M. & Duarte, CM Cambios proyectados en el picoplancton fotosintético en un océano subtropical más cálido. Frente. Mar. Ciencia. Rev. 5, 506 (2019).

Artículo de Google Scholar

Anderson, SI, Barton, AD, Clayton, S., Dutkiewicz, S. & Rynearson, TA Los tipos funcionales del fitoplancton marino exhiben diversas respuestas al cambio térmico. Nat. Comunitario. 12, 6413 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Martín, JH y cols. Probando la hipótesis del hierro en ecosistemas del Océano Pacífico ecuatorial. Naturaleza 371, 123-129 (1994).

Artículo CAS Google Scholar

Shi, D., Xu, Y., Hopkinson, BM & Morel, FMM Efecto de la acidificación de los océanos sobre la disponibilidad de hierro para el fitoplancton marino. Ciencia 327, 676–679 (2010).

Artículo CAS PubMed Google Scholar

McQuaid, JB y cols. La fitotransferrina sensible a los carbonatos controla la absorción de hierro de alta afinidad en las diatomeas. Naturaleza 555, 534–537 (2018).

Artículo CAS PubMed Google Scholar

Turnšek, J. et al. La proteómica de proximidad en una diatomea marina revela una supuesta vía de tráfico de hierro desde la superficie celular al cloroplasto. eLife 10, e52770 (2021).

Artículo PubMed PubMed Central Google Scholar

Urzica, EI et al. El análisis a nivel de sistemas y transsistema identifica respuestas conservadas de deficiencia de hierro en el linaje de plantas [W][OA]. Célula vegetal 24, 3921–3948 (2012).

Artículo CAS PubMed PubMed Central Google Scholar

Mao, X. et al. Diversidad, prevalencia y expresión de genes de cianasa (cynS) en microorganismos marinos planctónicos. ISME J. 16, 602–605 (2022).

Artículo CAS PubMed Google Scholar

Ou, L., Cai, Y., Jin, W., Wang, Z. & Lu, S. Comprensión de la captación y asimilación de nitrógeno de la cepa china de Aureococcus anophagefferens (Pelagophyceae). Res. de algas. 34, 182-190 (2018).

Artículo de Google Scholar

Shu, CJ, Ulrich, LE y Zhulin, IB El dominio NIT: un módulo predicho de respuesta a nitratos en receptores sensoriales bacterianos. Tendencias Bioquímica Ciencia. 28, 121-124 (2003).

Artículo CAS PubMed Google Scholar

Wu, SQ, Chai, W., Lin, JT y Stewart, V. Regulación general del nitrógeno de la expresión nasR del gen regulador de la asimilación de nitrato en Klebsiella oxytoca M5al. J. Bacteriol. 181, 7274–7284 (1999).

Artículo CAS PubMed PubMed Central Google Scholar

Durand, NC y cols. Juicer proporciona un sistema de un solo clic para analizar experimentos Hi-C con resolución de bucle. Sistema celular. 3, 95–98 (2016).

Artículo CAS PubMed PubMed Central Google Scholar

Li, R., Li, Y., Kristiansen, K. y Wang, J. SOAP: programa corto de alineación de oligonucleótidos. Bioinformática 24, 713–714 (2008).

Artículo CAS PubMed Google Scholar

Alberti, A. et al. Secuencias de nucleótidos de plancton marino de virales a metazoos de la expedición Tara Oceans. Ciencia. Datos 4, 170093 (2017).

Artículo CAS PubMed PubMed Central Google Scholar

Kopylova, E., Noé, L. y Touzet, H. SortMeRNA: filtrado rápido y preciso de ARN ribosómicos en datos metatranscriptómicos. Bioinformática 28, 3211–3217 (2012).

Artículo CAS PubMed Google Scholar

Kim, D., Song, L., Breitwieser, FP & Salzberg, SL Centrífuga: clasificación rápida y sensible de secuencias metagenómicas. Genoma Res. https://doi.org/10.1101/gr.210641.116 (2016).

Vurture, GW et al. GenomeScope: creación rápida de perfiles del genoma sin referencias a partir de lecturas breves. Bioinformática 33, 2202–2204 (2017).

Artículo CAS PubMed PubMed Central Google Scholar

Vaser, R. y Šikić, M. Otro ensamblador de genoma de novo. BioRxiv. https://doi.org/10.1101/656306 (2019).

Liu, H. y col. SMARTdenovo: un ensamblador de novo que utiliza lecturas largas y ruidosas. Gigabyte 2021, 1–9 (2021).

Artículo de Google Scholar

Kolmogorov, M., Yuan, J., Lin, Y. y Pevzner, PA Montaje de lecturas largas y propensas a errores utilizando gráficos repetidos. Nat. Biotecnología. 37, 540–546 (2019).

Artículo CAS PubMed Google Scholar

Ruan, J. & Li, H. Ensamblaje de lectura larga rápido y preciso con wtdbg2. Nat. Métodos 17, 155-158 (2020).

Artículo CAS PubMed Google Scholar

Wick, RR, Schultz, MB, Zobel, J. & Holt, KE Bandage: visualización interactiva de ensamblajes del genoma de novo. Bioinformática 31, 3350–3352 (2015).

Artículo CAS PubMed PubMed Central Google Scholar

Vaser, R., Sović, I., Nagarajan, N. y Šikić, M. Ensamblaje del genoma de novo rápido y preciso a partir de lecturas largas sin corregir. Genoma Res 27, 737–746 (2017).

Artículo CAS PubMed PubMed Central Google Scholar

Aury, J.-M. & Istace, B. Hapo-G, pulido de conjuntos de genomas con reconocimiento de haplotipos con lecturas precisas. Bioinformación de genómica de NAR. 3, lqab034 (2021).

Benson, G. Tandem repite buscador: un programa para analizar secuencias de ADN. Ácidos nucleicos res. 27, 573–580 (1999).

Artículo CAS PubMed PubMed Central Google Scholar

Morgulis, A., Gertz, EM, Schäffer, AA y Agarwala, R. Una implementación DUST rápida y simétrica para enmascarar secuencias de ADN de baja complejidad. J. Computación Biol. 13, 1028-1040 (2006).

Artículo CAS PubMed Google Scholar

Smit, AFA, Hubley, R. y Green, P. RepeatMasker. http://repeatmasker.org/ (2013).

Price, AL, Jones, NC y Pevzner, PA Identificación de novo de familias repetidas en genomas grandes. Bioinformática 21, i351 – i358 (2005).

Artículo CAS PubMed Google Scholar

Quinlan, AR & Hall, IM BEDTools: un conjunto flexible de utilidades para comparar características genómicas. Bioinformática 26, 841–842 (2010).

Artículo CAS PubMed PubMed Central Google Scholar

Pedersen, BS y Quinlan, AR Mos Depth: cálculo rápido de cobertura para genomas y exomas. Bioinformática 34, 867–868 (2018).

Artículo CAS PubMed Google Scholar

Schulz, MH, Zerbino, DR, Vingron, M. y Birney, E. Oasis: ensamblaje robusto de novo RNA-seq en todo el rango dinámico de niveles de expresión. Bioinformática 28, 1086–1092 (2012).

Artículo CAS PubMed PubMed Central Google Scholar

Zerbino, DR y Birney, E. Velvet: algoritmos para ensamblaje de lectura corta de novo utilizando gráficos de Bruijn. Genoma Res. 18, 821–829 (2008).

Artículo CAS PubMed PubMed Central Google Scholar

Li, H. y col. La secuencia Alineación/Formato de mapa y SAMtools. Bioinformática 25, 2078–2079 (2009).

Artículo PubMed PubMed Central CAS Google Scholar

Marchler-Bauer, A. et al. CDD: base de datos de dominio conservado del NCBI. Ácidos nucleicos res. 43, D222-D226 (2015).

Artículo CAS PubMed Google Scholar

Niang, G. y col. METdb: una base de datos de referencia genómica para especies marinas. F1000Research, https://doi.org/10.7490/f1000research.1118000.1 (2020).

Kent, WJ BLAT: la herramienta de alineación tipo BLAST. Genoma Res. 12, 656–664 (2002).

CAS PubMed PubMed Central Google Académico

Altschul, SF, Gish, W., Miller, W., Myers, EW y Lipman, DJ Herramienta básica de búsqueda de alineación local. J. Mol. Biol. 215, 403–410 (1990).

Artículo CAS PubMed Google Scholar

Birney, E., Clamp, M. y Durbin, R. GeneWise y genomewise. Genoma Res. 14, 988–995 (2004).

Artículo CAS PubMed PubMed Central Google Scholar

Stanke, M. y col. AGOSTO: predicción ab initio de transcripciones alternativas. Ácidos nucleicos res. 34, W435–W439 (2006).

Artículo CAS PubMed PubMed Central Google Scholar

Dubarry, M. y col. Gmove una herramienta para la predicción de genes eucariotas utilizando diversas evidencias. F1000Research, https://doi.org/10.7490/f1000research.1111735.1 (2016).

Sibbald, SJ, Lawton, M. y Archibald, JM Evolución del genoma mitocondrial en algas pelagofitas. Genoma Biol. Evolución. 13, evab018 (2021).

Quevillon, E. et al. InterProScan: identificador de dominios proteicos. Ácidos nucleicos res. 33, W116–W120 (2005).

Artículo CAS PubMed PubMed Central Google Scholar

Buchfink, B., Reuter, K. y Drost, H.-G. Alineaciones de proteínas sensibles a escala del árbol de la vida usando DIAMOND. Nat. Métodos 18, 366–368 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Aramaki, T. y col. KofamKOALA: asignación de KEGG Ortholog basada en el perfil HMM y el umbral de puntuación adaptativa. Bioinformática 36, ​​2251–2252 (2020).

Artículo CAS PubMed Google Scholar

Delmont, TO et al. Convergencia del repertorio funcional de linajes de plancton eucariotas distantes y abundantes en el océano iluminado por el sol. Genómica celular 2, 100123 (2022).

Artículo CAS Google Scholar

Li, H. y Durbin, R. Alineación de lectura corta rápida y precisa con la transformada de Burrows-Wheeler. Bioinformática 25, 1754-1760 (2009).

Artículo CAS PubMed PubMed Central Google Scholar

Pesant, S. et al. Recursos científicos abiertos para el descubrimiento y análisis de datos de Tara Oceans. Ciencia. Datos 2, 150023 (2015).

Artículo CAS PubMed PubMed Central Google Scholar

Aumont, O., Ethé, C., Tagliabue, A., Bopp, L. & Gehlen, M. PISCES-v2: un modelo biogeoquímico oceánico para estudios de carbono y ecosistemas. Desarrollo de modelos geocientíficos. 8, 2465–2513 (2015).

Artículo CAS Google Scholar

Clayton, S. y col. Consecuencias biogeoquímicas versus ecológicas de la física oceánica modelada. Biogeociencias 14, 2877–2889 (2017).

Artículo CAS Google Scholar

Ravindra, K., Rattan, P., Mor, S. y Aggarwal, AN Modelos aditivos generalizados: creación de evidencia sobre la contaminación del aire, el cambio climático y la salud humana. Reinar. En t. 132, 104987 (2019).

Artículo CAS PubMed Google Scholar

Günther, F. & Fritsch, S. neuralnet: entrenamiento de redes neuronales. RJ 2, 30–38 (2010).

Artículo de Google Scholar

Gobler, CJ y cols. Nicho del alga dañina Aureococcus anophagefferens revelado mediante ecogenómica. Proc. Acad. Nacional. Ciencia. Estados Unidos 108, 4352–4357 (2011).

Artículo CAS PubMed PubMed Central Google Scholar

Guo, L. y col. El ensamblaje del genoma de Nannochloropsis oceanica proporciona evidencia del derrocamiento del núcleo del huésped por parte del núcleo simbionte durante la especiación. Comunitario. Biol. 2, 1-12 (2019).

Artículo CAS Google Scholar

Bowler, C. y col. El genoma de Phaeodactylum revela la historia evolutiva de los genomas de diatomeas. Naturaleza 456, 239–244 (2008).

Artículo CAS PubMed Google Scholar

Armbrust, EV y cols. El genoma de la diatomea thalassiosira pseudonana: ecología, evolución y metabolismo. Ciencia 306, 79–86 (2004).

Artículo CAS PubMed Google Scholar

Worden, AZ y cols. Evolución verde y adaptaciones dinámicas reveladas por genomas de micromonas picoeucariotas marinas. Ciencia 324, 268–272 (2009).

Artículo CAS PubMed Google Scholar

Palenik, B. et al. El diminuto eucariota Ostreococcus proporciona información genómica sobre la paradoja de la especiación del plancton. PNAS 104, 7705–7710 (2007).

Artículo CAS PubMed PubMed Central Google Scholar

Moreau, H. y col. Las funcionalidades genéticas y la estructura del genoma de Bathycoccus prasinos reflejan especializaciones celulares en la base del linaje verde. Genoma Biol. 13, R74 (2012).

Artículo PubMed PubMed Central Google Scholar

Leer, BA et al. El pangenoma del fitoplancton Emiliania sustenta su distribución global. Naturaleza 499, 209–213 (2013).

Artículo CAS PubMed Google Scholar

Descargar referencias

Agradecemos el compromiso de las siguientes personas que hicieron posible este trabajo: Genoscope/CEA, CNRS (en particular la Federation de Recherche R2022/Tara Oceans GO-SEE), Marie-José Garet-Delmas de la Roscoff Culture Collection por su creciente la cepa RCC100, Claude Scarpelli por su apoyo en informática de alto rendimiento y Linda Sperling por la edición de idiomas. Los cálculos se realizaron utilizando la máquina cobalt HPC. Agradecemos el apoyo financiero de FRANCE GENOMIQUE (ANR-10-INBS-09–08) y Oceanomics (ANR-11-BTBR-0008). También agradecemos a la Tara Expedition Foundation y sus socios por la organización de expediciones científicas marinas (http://oceans.taraexpeditions.org). Este artículo es la contribución número 139 de Tara Oceans.

Genómica metabólica, genoscopio, Instituto François Jacob, CEA, CNRS, Univ Evry, Université Paris-Saclay, 91057, Evry, Francia

Nina Guérin, Marta Ciccarella, Elisa Flamant, Paul Frémont, Sophie Mangenot, Benjamin Istace, Benjamin Noel, Caroline Belser, Laurie Bertrand, Eric Pelletier, Adriana Alberti, Olivier Jaillon, Patrick Wincker, Jean-Marc Aury y Quentin Carradec

Federación de Investigación para el Estudio de la Ecología y la Evolución de los Sistemas Oceánicos Globales, R2022/Tara Oceans GO-SEE, 3 rue Michel-Ange, 75016, París, Francia

Nina Guérin, Elisa Flamant, Paul Frémont, Sophie Mangenot, Laurie Bertrand, Karine Labadie, Corinne Cruaud, Eric Pelletier, Adriana Alberti, Olivier Jaillon, Patrick Wincker y Quentin Carradec

Genoscopio, Instituto François Jacob, CEA, Universidad Paris-Saclay, 2 Rue Gaston Crémieux, 91057, Évry, Francia

Karine Labadie y Corinne Cruaud

Universidad de la Sorbona, CNRS, Estación Biológica de Roscoff, AD2M, UMR7144, Place Georges Teissier, 29680, Roscoff, Francia

Sarah Romac y Charles Bachy

Universidad de la Sorbona, CNRS, FR2424, Station Biologique de Roscoff, 29680, Roscoff, Francia

Charles Bachy y Martín Gachenot

Universidad Paris-Saclay, CEA, CNRS, Instituto de Biología Integrativa de la Célula (I2BC), 91198, Gif-sur-Yvette, Francia

Adriana Alberti

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

SR, CB y MG realizaron cultivos de P. calceolata y extracciones de ADN/ARN. Secuenciación coordinada de ADN/ARN AA, EP y CC. BI, BN y JMA realizaron el ensamblaje y la anotación del genoma. MC, SM, QC y JMA realizaron análisis genómicos. NG, EF y QC analizaron conjuntos de datos ambientales. PF y OJ trabajaron en modelos de P. calceolata. QC y NG escribieron el artículo con el fuerte apoyo de JMA y PWCB, LB y KL realizaron la preparación, secuenciación y análisis de la biblioteca Hi-C, respectivamente. Todos los autores contribuyeron a la preparación del manuscrito y aprobaron la versión final del artículo.

Correspondencia a Quentin Carradec.

Los autores declaran no tener conflictos de intereses.

Communications Biology agradece a Senjie Lin, Ana Cabello y los demás revisores anónimos por su contribución a la revisión por pares de este trabajo. Editores principales: Linn Hoffmann y Luke R. Grinham. Los informes de los revisores pares están disponibles.

Nota del editor Springer Nature se mantiene neutral con respecto a reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Acceso Abierto Este artículo está bajo una Licencia Internacional Creative Commons Attribution 4.0, que permite el uso, compartir, adaptación, distribución y reproducción en cualquier medio o formato, siempre y cuando se dé el crédito apropiado a los autores originales y a la fuente. proporcione un enlace a la licencia Creative Commons e indique si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la normativa legal o excede el uso permitido, deberá obtener permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.

Reimpresiones y permisos

Guérin, N., Ciccarella, M., Flamant, E. et al. Adaptación genómica del picoeucariota Pelagomonas calceolata a océanos pobres en hierro revelada por una secuencia del genoma a escala cromosómica. Común Biol 5, 983 (2022). https://doi.org/10.1038/s42003-022-03939-z

Descargar cita

Recibido: 13 de diciembre de 2021

Aceptado: 02 de septiembre de 2022

Publicado: 16 de septiembre de 2022

DOI: https://doi.org/10.1038/s42003-022-03939-z

Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:

Lo sentimos, actualmente no hay un enlace para compartir disponible para este artículo.

Proporcionado por la iniciativa de intercambio de contenidos Springer Nature SharedIt

Informes Científicos (2023)

Al enviar un comentario, acepta cumplir con nuestros Términos y pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.