Por Eric MEUNIER, 29 de mayo de 2025
Desde hace muchos años, las multinacionales recopilan una cantidad cada vez mayor de información sobre secuencias genéticas y proteicas o información epigenética. Reducen los seres vivos a unos pocos datos recopilados en bases de datos digitales. Gracias a los algoritmos de la «inteligencia artificial», pretenden disponer de herramientas que determinan qué modificaciones genéticas permitirían obtener una nueva característica determinada. En una sociedad en la que las técnicas de modificación genética y las patentes están íntimamente relacionadas, estos algoritmos acelerarán sobre todo las pretensiones de apropiación de los seres vivos.

En el ámbito de las tecnologías genéticas, la digitalización de los seres vivos y el tratamiento informático de los datos obtenidos están en pleno auge. Utilizando secuencias de genomas presentes en la biodiversidad, los poseedores de algoritmos de «inteligencia artificial» afirman ahora poder predecir las modificaciones genéticas necesarias para obtener nuevas características.
Una lectura aún parcial de un gran número de genomas
En 2023, un artículo informaba de cómo investigadores del Wellcome Sanger Institute (Reino Unido) habían «alimentado» fábricas de algoritmos para que predijeran las «mejores reparaciones ante un defecto genético»i. Los investigadores establecieron 3064 secuencias de ADN de longitud variable para insertarlas en un genoma. Tras aplicar un método de inserción de cada una de estas secuencias, secuenciaron el genoma modificado obtenido para comprobar si la modificación genética se había realizado correctamente. Con sus resultados, «alimentaron» un algoritmo utilizado en «aprendizaje automático» (machine learning en inglés) para que este «detectara los perfiles que permiten determinar el éxito de las inserciones, como la longitud o el tipo de reparación del ADN implicado».
Otros van más allá en las ambiciones que atribuyen a estos algoritmos. En 2024, Science publicó un artículoii en el que se daba cuenta del trabajo de investigadores estadounidenses para desarrollar un modelo algorítmico de «inteligencia artificial» (IA). Según esta publicación, este algoritmo puede «interpretar y generar secuencias genómicas a gran escala». Denominado Evo, sería capaz de analizar «millones de genomas microbianos» y, a continuación, «generar eficazmente largas secuencias (de ADN)». Sin modestia alguna, los autores explican que el algoritmo Evo «ha desarrollado una comprensión global del complejo código genético de la vida, desde los nucleótidos básicos del ADN hasta genomas completos». Según los investigadores, Evo sería capaz de predecir cómo «pequeños cambios en el ADN» pueden modificar las características de los organismos, así como de «generar secuencias largas del tamaño de un genoma y desarrollar nuevos sistemas biológicos», siempre y cuando un sistema biológico se defina únicamente por sus secuencias genéticas.
Según un informe de la asociación alemana Save Our Seeds, publicado en enero de 2025iii, esta dinámica de alimentar algoritmos con información de secuencias genéticas es compartida por varias empresas. Entre los ejemplos citados se encuentra el modelo algorítmico desarrollado por la empresa Inari, denominado FloraBERT. Según el informe, el algoritmo se alimentó con las secuencias reguladoras de 93 especies vegetales y 25 variedades diferentes de maíz. El uso previsto de este algoritmo es que pueda predecir cómo las modificaciones genéticas en las secuencias reguladoras del genoma del maíz pueden alterar las características de esta planta. Una colaboración entre Google e Instadeep también ha dado lugar a un algoritmo finalizado a finales de 2023, AgroNT (por Agronomic Nucleotide Transformer). Alimentado con secuencias genéticas de 48 especies vegetales, el algoritmo se habría utilizado para simular más de 10 millones de mutaciones en la yuca, asociándolas a una predicción de modificación de características.
Combinación de modificaciones genéticas y algoritmos
El uso de algoritmos por parte de los investigadores tiene como objetivo determinar qué modificaciones genéticas en qué secuencias serían más eficaces para obtener una característica determinada. Una combinación que es el resultado del trabajo descrito anteriormente, es decir, el análisis por parte de estos algoritmos de un número cada vez mayor de genomas. Sin embargo, como señala el informe de Save Our Seedsiv, estos trabajos son aún recientes, ya que aparecieron después de 2022.
Las modificaciones genéticas previstas con el uso de algoritmos se refieren, hasta la fecha, principalmente a las secuencias denominadas «reguladoras». Estas secuencias regulan la expresión de otras secuencias genéticas en función de las señales internas o externas que reciben. La modificación genética de estas secuencias reguladoras puede tener por objeto apagar la expresión de una secuencia en lugar de eliminarla. Otros trabajos que utilizan algoritmos no pretenden apagar la expresión de una secuencia genética, sino modular su nivel de expresión. El algoritmo iCREPCP de la Universidad de Huazhong (China) se utiliza precisamente para identificar secuencias promotoras y sugerir las modificaciones genéticas más «prometedoras»v. También se han seleccionado otras secuencias: las de los pequeños ARN que se utilizan en los complejos Crispr.
Los algoritmos de «inteligencia artificial» también se utilizan para predecir las modificaciones genéticas que podrían alterar las estructuras de las proteínas. Se han recopilado trabajos que se centran en las modificaciones genéticas que deben introducirse para aumentar la resistencia de los tomates al hongo Phytophthora infestans. Esta investigación se ha llevado a cabo con el algoritmo AlphaFold, que ha permitido identificar dos bloques de una proteína que deben modificarse para aumentar dicha resistencia. Otros investigadores han utilizado el mismo algoritmo para aumentar la viscosidad de las patatas. En el caso del maíz, se trata de modificar la arquitectura de las plantas para que puedan cultivarse más densamente en los campos. En el caso del trigo, se han identificado proteínas para que el trigo sea más fácil de «trabajar» en la industria agroalimentaria…
Algoritmos para sustituir a los asistentes de laboratorio
En lugar de limitarse a ser herramientas de trabajo, algunos están trabajando para que los algoritmos de IA se conviertan en asistentes de laboratorio. A finales de 2024, un artículo de prensavi informaba de cómo Google DeepMind y BioNTech están trabajando para desarrollar autómatas que intervengan en la elección de los experimentos científicos que se van a realizar, desde sus protocolos hasta la recopilación y el análisis de los resultados. Para Karim Beguir, director general de BioNTech, estos asistentes serían «aceleradores de la productividad» para los investigadores.
Así pues, están surgiendo proyectos de asistentes para analizar secuencias genéticas o predecir la estructura de las proteínas, como ya hemos visto. Otros podrían utilizarse también para «elaborar, planificar y ejecutar experimentos químicos complejos». La herramienta Claude 3.5 de Anthropic podría incluso utilizarse en una fase aún más temprana, esta vez para generar ideas para experimentos. Un uso que, como señala el autor del artículo de 2024vii, aún debe enfrentarse a la utilidad real de tales propuestas de experimentos.
Las multinacionales en primera línea
Bayer, BASF, Syngenta, Corteva… estas multinacionales semilleras ya utilizan sus algoritmos para modificar genéticamente plantas. Save our Seedsviii recuerda acertadamente que estas empresas llevan varios años recopilando grandes cantidades de datos genéticos, proteicos… precisamente para alimentar sus algoritmos.
Corteva, por ejemplo, ha desarrollado su propio algoritmo utilizando una herramienta de Google, el software BigBird. Para obtener predicciones de modificaciones genéticas, en este caso mutaciones, que se llevarán a cabo en secuencias reguladoras, Corteva ha proporcionado a su algoritmo información sobre secuencias de 14 especies vegetales, entre las que se encuentran la cebada, el arroz, el trigo, el maíz, la colza (una planta de la familia de la col) y la soja. Corteva también colabora con la empresa Tropic Bioscience con la esperanza de poder llevar a cabo modificaciones genéticas para aumentar la resistencia a las enfermedades.
Por su parte, al igual que BASF, Bayer trabaja con Evogene y su algoritmo para definir las modificaciones genéticas que deben realizarse para obtener resistencia a las enfermedades en diversas plantas. Save our Seeds añade que también ha invertido en dos empresas que utilizan algoritmos y la herramienta de modificación genética Crispr/Cas, las empresas Ukko y Amfora.
Por último, Syngenta ha desarrollado su propio algoritmo, que ya hemos mencionado, AgroNT, en colaboración con InstaDeep y Google. Con esta herramienta, la empresa busca ahora establecer modificaciones genéticas que se llevarán a cabo en el maíz y la soja.
Los algoritmos utilizados predicen modificaciones genéticas basándose únicamente en el conocimiento de secuencias genéticas, sin tener en cuenta el contexto celular dentro del organismo ni la diversidad de los entornos en los que se diseminaría dicho organismo. Se trata de un enfoque reduccionista, en el que la fiabilidad de los resultados depende de los datos que se le proporcionan, que en ningún caso constituyen la totalidad de los datos relativos a los seres vivos. Datos cuya producción se va a acelerar y que, además, están sustituyendo a los datos obtenidos de la observación directa de los seres vivos, que se desarrolla en un tiempo necesariamente más lento, pero más colaborativo…
Referencias:
i « Prime Editing and Machine Learning Aid Researchers in Determining the Best Fix for Genetic Flaws », Genetic Engineering & Biotechnology News, 17 de febrero de 2023.
ii Eric Nguyen et al., « Sequence modeling and design from molecular to genome scale with Evo », Science, Vol. 386, Número 6723, 15 de noviembre de 2024.
iii B. Vogel, « When chatbots breed new plant varieties », Save Our Seeds, enero de 2025.
iv Ibid.
v Deng, K. et al., «iCREPCP: A deep learning-based web server for identifying base-resolution cis-regulatory elements within plant core promoters», Plant Communications, volumen 4, número 1, 9 de enero de 2023.
vi Edd Gent, «DeepMind and BioNTech Bet AI Lab Assistants Will Accelerate Science», SingularityHub, 7 de octubre de 2024.
vii Ibid.
viii B. Vogel, « When chatbots breed new plant varieties », Save Our Seeds, enero de 2025.
—————