Un modèle d’apprentissage automatique analysant la méthylation de l’ADN basée sur CpG a prédit avec précision l’origine de nombreux types de cancer différents chez les patients atteints de cancers primaires inconnus (CUP), selon une recherche présentée lors de la réunion annuelle 2026 de l’American Association for Cancer Research (AACR), qui s’est tenue du 17 au 22 avril.
Les CUP sont des tumeurs malignes métastatiques dans lesquelles le site primaire du cancer n’a pas pu être identifié. Ces cancers sont souvent associés à de moins bons résultats, en partie parce que les décisions de traitement doivent être prises sans connaître l’origine du cancer, et que les patients sont généralement traités avec des schémas de chimiothérapie larges et non spécifiques plutôt que des thérapies ciblées sur un type de cancer spécifique, selon le présentateur Marco A. De Velasco, PhD, membre du corps professoral du Département de biologie du génome de l’Université Kindai au Japon.
« Seulement entre 15 et 20 % des patients atteints de CUP présentent des caractéristiques qui permettent aux médecins de les traiter avec des thérapies spécifiques au site, associées à de meilleurs résultats », a expliqué De Velasco.
Cependant, la plupart des patients, entre 80 % et 85 %, reçoivent une chimiothérapie plus générale, souvent moins efficace. Les patients recevant une thérapie dirigée sur site peuvent survivre jusqu’à 24 mois, contre six à neuf mois pour ceux recevant un traitement standard. »
Marco A. De Velasco, Département de biologie du génome, Université Kindai
Les chercheurs ont exploré si l’identification de l’origine du cancer à l’aide du profilage moléculaire pourrait améliorer les décisions de traitement. Ces approches analysent les modèles de biologie tumorale, tels que l’activité des gènes ou les modifications chimiques de l’ADN, qui diffèrent selon les types de cancer et peuvent persister même après la propagation du cancer. Bien que certaines méthodes se soient révélées prometteuses, elles n’ont pas démontré de bénéfices évidents en termes de survie dans les essais cliniques, selon De Velasco.
Dans cette étude, De Velasco et ses collègues, dont le chercheur principal Kazuko Sakai, PhD, et le chercheur principal Kazuto Nishio, MD, PhD, ont développé une nouvelle approche axée sur la méthylation de l’ADN CpG, un type de modification chimique qui se produit au niveau des bases de l’ADN cytosine et guanine. De Velasco a noté que la méthylation CpG agit comme une « empreinte digitale » moléculaire pour différents tissus du corps. En analysant ces modèles dans des échantillons de tumeurs, les chercheurs ont développé un modèle informatique capable de distinguer 21 types de cancer différents.
« Au lieu de nous appuyer sur des ensembles de données volumineux et complexes, nous avons cherché à identifier un ensemble de marqueurs plus petit et plus pratique, tout en conservant un fort pouvoir prédictif », a déclaré De Velasco. « L’objectif à long terme est de créer un outil qui pourrait aider les médecins à identifier le tissu d’origine probable et à éclairer des décisions de traitement plus efficaces. »
Le modèle a été développé à l’aide des données de méthylation de près de 7 500 patients atteints de 21 types de cancer différents obtenues du programme Cancer Genome Atlas et d’autres ensembles de données publics. Les données ont été réparties entre les cohortes de formation et de test.
Les chercheurs ont appliqué l’apprentissage automatique pour identifier les sites de méthylation du CpG dans l’ADN tumoral de la cohorte d’entraînement et créer des profils de méthylation associés à différents types de tumeurs.
Les résultats de l’étude ont montré que le modèle a correctement identifié le type de cancer dans environ 95 % des cas dans la cohorte testée et a maintenu de solides performances – une précision d’environ 87 % – lorsqu’il est appliqué à une cohorte de validation indépendante de l’institution du chercheur de 31 cas représentant 17 types de cancer différents.
« L’une des découvertes les plus importantes de notre étude est que nous avons pu prédire avec précision l’origine de nombreux types de cancer différents en utilisant un très petit sous-ensemble de marqueurs ADN, soit environ 1 000 régions CpG sélectionnées parmi des centaines de milliers à travers le génome », a déclaré De Velasco. « C’est important car cela montre que nous pouvons simplifier les données moléculaires complexes tout en conservant de solides performances prédictives. »
Pour les patients atteints de CUP, ce modèle pourrait aider les médecins à abandonner les approches de traitement par essais et erreurs et à sélectionner à la place des thérapies adaptées au site d’origine probable d’un cancer, a-t-il ajouté.
« Nos résultats suggèrent que les approches basées sur l’ADN peuvent aider à identifier l’endroit où un cancer a pu commencer, même lorsque la tumeur d’origine n’est pas visible. En utilisant un ensemble de marqueurs beaucoup plus restreint et plus ciblé, cette approche pourrait rendre ces types de tests plus pratiques et accessibles à l’avenir », a déclaré De Velasco.
« Dans l’ensemble, nous considérons cette recherche comme faisant partie d’un effort plus large visant à mieux comprendre le cancer à l’aide d’informations moléculaires, dans le but de soutenir des soins plus informés et personnalisés à l’avenir. Cependant, ce travail en est encore au stade de la recherche.
L’une des principales limites de cette étude est que le modèle a été développé en utilisant des cancers d’origine connue, plutôt qu’une véritable CUP, ce qui signifie que le modèle doit être testé sur des patients réels atteints de CUP pour comprendre ses performances en milieu clinique. Une autre limite est que toutes les tumeurs ne sont pas faciles d’accès pour les tests génétiques, en particulier à un stade avancé. Selon De Velasco, une prochaine étape importante de cette recherche consiste à adapter et à évaluer ce modèle en utilisant une biopsie sanguine pour analyser l’ADN tumoral circulant au lieu de s’appuyer sur l’ADN provenant d’échantillons de tissus.