Jurnal Internasional Penjaga MBD4 terhadap kerusakan metilasi dan defisiensi germ line predisposes terhadap hematopoiesis klonal dan onset dini AML

Download Jurnal Disini

Key Points

  • DNA glycosylase MBD4 bertindak sebagai perlindungan terhadap kerusakan dari deaminasi 5mC.

  • Defisiensi garis MBD4 menstimulasi hematopoiesis klonal dan memandu pengembangan leukemia melalui mutasi berulang pada DNMT3A.

Abstrak

Kecenderungan 5-methylcytosine (5mC) untuk menjalani deaminasi spontan memiliki peran besar dalam membentuk genom manusia, dan kerusakan metilasi ini tetap menjadi sumber utama mutasi somatik yang menumpuk seiring bertambahnya usia. Bagaimana deaminasi 5mC berkontribusi terhadap risiko kanker pada jaringan yang berbeda masih belum jelas. Genomic profiling dari 3 onset akut myeloid leukemia awal (AML) mengidentifikasi hilangnya garis kuman MBD4 sebagai inisiator dari hypermutation 5mC-dependent. MBD4-kekurangan AML menampilkan beban mutasi 33 kali lipat lebih tinggi daripada AML umumnya, dengan> 95% menjadi C> T dalam konteks suatu dinukleotida CG. Tanda khas ini juga diamati pada kanker sporadis yang memperoleh mutasi-mutasi bialikik pada tikus-tikus knockout MBD4 dan pada Mbd4. Pengambilan sampel berurutan dari kasus-kasus germ line menunjukkan ekspansi berulang progenitor sel darah dengan mutasi patogen pada DNMT3Agen penggerak utama untuk hematopoiesis klonal dan AML. Temuan kami mengungkapkan faktor genetik dan epigenetik yang membentuk pengaruh mutagenik 5mC. Dalam sel-sel darah, ini menghubungkan kerusakan metilasi ke lanskap pengemudi hematopoiesis klonal dan mengungkapkan jalur lambung yang diawetkan. Kuman line MBD4 defisiensi meningkatkan kerentanan kanker dan predisposisi untuk AML.

Pendahuluan

Sel terkena berbagai tekanan yang merusak DNA. Sebagian besar kerusakan muncul dari sumber endogen, termasuk paparan terhadap molekul reaktif dan kesalahan replikasi. 1 Meskipun sebagian besar peristiwa ini diperbaiki, beberapa diperbanyak dan memperkenalkan mutasi. Pembusukan integritas genom ini memiliki implikasi besar bagi kesehatan kita, terutama untuk memodulasi kejadian kanker seiring dengan bertambahnya usia. Anemia Fanconi memberikan gambaran ini dalam sistem hematopoietik. Cacat perbaikan DNA spesifik yang mendukung keluarga penyakit ini mengatur stadium untuk risiko tinggi perkembangan myelodysplasia dan leukemia myeloid akut (AML) pada usia dini. 2

DNA metilasi pada residu sitosin memberikan mutagenik utama. stimulus, seperti 5-methylcytosine (5mC) memiliki kecenderungan untuk menjalani deaminasi spontan untuk timin. 3 Oleh karena itu, tidak mengherankan bahwa CG> TG mutasi adalah fitur yang menonjol dari kerusakan DNA terkait usia, seperti yang terdeteksi. pada kanker manusia, 4 sel induk normal, 5 dan mutasi de novo melewati garis kuman. 6 Bentuk kerusakan ini ada di mana-mana yang telah terjadi diusulkan sebagai jam molekuler untuk melacak penuaan. 4 CG> TG mutasi membuat kontribusi penting pada lanskap mutasi somatik kanker, 7 dan penting untuk menggambarkan bagaimana jalur perbaikan yang batasi kerusakan metilasi memodifikasi risiko kanker. [19659029] Kerusakan metilasi diperbaiki dengan jalur perbaikan eksisi dasar (BER). Setelah deaminasi 5mC, penghapusan thymine mispaired dilakukan oleh 1 dari 2 glikosilase DNA, metil-binding domain 4 (MBD4) 8 atau thymine DNA glycosylase (TDG). 9 Inaktivasi Mbd4 pada tikus dikonfirmasi peran fungsional dalam perbaikan kerusakan metilasi, 1011 tetapi apakah melindungi terhadap kanker masih belum jelas. Dalam laporan ini, kami mengkarakterisasi kasus-kasus keluarga dengan menginaktivasi garis kuman MBD4 dan menunjukkan peran penting dalam menjaga terhadap kerusakan metilasi dan kerentanan terhadap perkembangan AML dan beberapa kanker padat.

Metode

Karakteristik pasien dan koleksi sampel [19659038PasiendiberikaninformedconsentsesuaidenganDeklarasiHelsinkiuntukpartisipasidalampenelitiandanuntukpengumpulansampelselamaperawatanmerekaProyekpenelitianinidisetujuiolehkomiteetikapenelitianmanusia(HRECs)kami(ErasmusMedicalCenter[EMC] Proyek Komite Etika Ulasan Medis MEC 2015-155, Walter and Eliza Hall Institute of Medical Research [WEHI] proyek HREC 13/01, Melbourne Proyek Kesehatan HREC 2012.274). EMC-AML-1, WEHI-AML-1, dan WEHI-AML-2 didiagnosis dengan AML dan diterapi dengan kombinasi kemoterapi sesuai protokol di institusi masing-masing.

EMC-AML-1 berusia 33 tahun ketika didiagnosis dengan leukemia monositik akut (AML, World Health Organization [WHO] Klasifikasi Internasional Penyakit [ICD] 9891/3). AML memiliki trisomi 11 pada karyotyping dan negatif untuk NPM1FLT3dan CEBPA mutasi. Riwayat medisnya termasuk polip kolon yang membutuhkan hemicolectomy 2 tahun sebelum diagnosis AML-nya. AML-nya refrakter terhadap kemoterapi induksi (standar dosis sitarabin dan daunorubisin). Induksi berulang dengan cytarabine dosis menengah menghasilkan remisi morfologis dan sitogenetik lengkap. Dia kemudian menjalani transplantasi sel induk hematopoietik autolog (HSCT) dengan pengkondisi BU-CY (busulfan dan siklofosfamid). Dia kambuh 2 tahun dan 3 bulan postautologous HSCT. AML saat kambuh memiliki kariotipe normal dan negatif untuk NPM1FLT3dan CEBPA mutasi. Kemoterapi induksi saliva (cytarabine dosis tinggi, mitoxantrone, dan etoposide) menghasilkan remisi morfologis lengkap. Hal ini diikuti oleh HSCT allogeneic dari donor yang tidak terkait dengan kondisi tubuh dan iradiasi tubuh. Ia mencapai remisi morfologis lengkap dengan chimerisme donor penuh. Ia mengembangkan penyakit graft-versus-host yang luas dengan kegagalan cangkok sekunder responsif terhadap steroid dan reaktivasi virus Epstein-Barr yang membutuhkan rituximab. Dia meninggal 2 tahun HSCT postalogogenik dengan AML kambuh.

WEHI-AML-1 adalah 31 tahun ketika didiagnosis dengan AML dengan perubahan terkait myelodysplasia (sindrom myelodysplastic-terkait kelainan sitogenetik, monosomi 7, WHO ICD 9895/3). AML negatif untuk NPM1FLT3dan CEBPA mutasi. Dia memiliki kemoterapi induksi (cytarabine dosis tinggi, idarubicin, dan etoposide) dan mencapai remisi morfologis dan sitogenetik lengkap. Ini diikuti oleh 2 siklus kemoterapi konsolidasi (cytarabine dosis standar, idarubicin, dan etoposide). Relaps morfologis dini terdeteksi pada pemeriksaan sumsum tulang sebelum HSCT allogeneic dari saudara perempuannya (WEHI-AML-2) dengan pengkondisian BU-CY. Pemeriksaan sumsum tulang 5 minggu postallogeneic HSCT menunjukkan remisi morfologi dan sitogenetik lengkap, serta chimerism donor penuh. Relapsed AML (dari WEHI-AML-1 asal) terjadi 11 minggu HSCT postalogenis. Terapi penyelamatan dengan rejimen kemoterapi FLAG (fludarabine, cytarabine, dan filgrastim) terbukti tidak berhasil. WEHI-AML-1 meninggal karena relaps AML <12 bulan setelah diagnosis.

WEHI-AML-2 berusia 30 tahun ketika dia menyumbangkan sel induk darah tepi ke WEHI-AML-1. Riwayat medisnya termasuk anemia defisiensi besi sekunder akibat menoragia dan perdarahan dari kolon desendens dan polip rektal. Hitung darah lengkapnya normal pada saat pemberian sel induk. Hitung darah lengkap rutinnya 4 tahun kemudian, pada 34 tahun, menunjukkan pansitopenia. Diagnosis AML dengan perubahan terkait myelodysplasia (sindrom myelodysplastic – kelainan cytogenetic terkait, monosomi 7, WHO ICD 9895/3) dibuat pada pemeriksaan sumsum tulang. AML negatif untuk NPM1FLT3dan CEBPA mutasi. Dia memiliki kemoterapi induksi (cytarabine dosis tinggi dan idarubicin) dan mencapai remisi morfologis dan sitogenetik lengkap. Ini diikuti oleh 1 siklus kemoterapi konsolidasi (cytarabine dosis standar, idarubicin, dan etoposide). Dia kemudian memiliki HSCT allogeneic menggunakan 2 unit darah tali pusar sebagian HLA-cocok sesuai pendingin FLU-CY-TBI (fludarabine; siklofosfamid, dan iradiasi tubuh total). Dia mengembangkan penyakit graft-versus-host kelas 1 dari usus. Dia tetap dalam remisi morfologis dan sitogenetik lengkap.

Sampel dari sumsum tulang dan darah perifer dikumpulkan selama pengobatan mereka (suplemen Tabel 1; tersedia di Darah situs Web). WEHI-AML-2 adalah donor untuk HSCT allogeneic untuk WEHI-AML-1 dan memiliki darah perifer diambil untuk analisis chimerism pada saat sumbangan yang tersedia untuk analisis.

Sekuens exome keseluruhan dan sekuensing genom keseluruhan

Seluruh sekuensing eksis pada EMC-AML-1 dilakukan seperti yang dijelaskan sebelumnya. 12 Untuk WEHI-AML-1 dan WEHI-AML-2, 50 hingga 100 ng DNA dan TruSeq Nano Sample Preparat Kit (Illumina) ) digunakan untuk menghasilkan perpustakaan DNA terindeks. Sekuensing genom keseluruhan dilakukan pada HiSeq X Ten (Illumina). Exome capture dilakukan dengan Human All Exon v5_UTR Capture Library dan SureSelect XT2 Target Enrichment System (Agilent Technologies) sebelum sequencing pada HiSeq2500 (Illumina). Penyelarasan dan pemanggilan varian dirinci dalam Metode tambahan.

Penilaian MBD4 status dan proporsi mutasi CG> TG di TCGA

Untuk menilai frekuensi mutasi CG> TG dalam Kanker Genom Atlas Sampel (TCGA), somatik panggilan varian nukleotida tunggal (SNV) tersedia melalui National Cancer Institute Genomic Data Commons disaring untuk membatasi analisis untuk varian dengan variasi frekuensi alel> 20%, dengan cakupan minimal 20 bacaan dan yang diakui oleh pada Setidaknya 3 dari 4 penelepon: SomaticSniper, VarScan2, MuTect2, dan MuSE. Pendekatan ini berkorelasi baik dengan hasil dari pipa analisis kita sendiri. Kandidat varian garis-garis-induk yang berdampak MBD4 bersumber dari Genomic Data Commons (September 2016) dan analisis terbatas pada varian dengan variasi frekuensi alel> 10%, ditemukan dengan frekuensi populasi <1% di ExAC (non-TCGA cohort). 13 Variasi frekuensi alel dan nomor salinan lokal sekitar MBD4 dinilai dalam sampel kanker yang cocok untuk menunjuk kasus sebagai inaktivasi monoelektik atau bialel. [19659053] Mengurangi representasi sequencing bisulfit (RRBS)

Untuk WEHI-AML-1 dan WEHI-AML-2, perpustakaan RRBS dibuat dari 75 hingga 100 ng DNA menggunakan Ovation RRBS Methyl-Seq System (NuGEN) dengan konversi bisulfit menggunakan kit Epitect (Qiagen). Perpustakaan diurutkan pada HiSeq2500. Data RRBS yang ditingkatkan dari EMC-AML-1 tersedia melalui Database Genotypes dan Phenotypes (dbGaP) (phs001027), dan data RRBS dari glioblastoma, GBM1063T, tersedia dari Gene Expression Omnibus (GSE70175). 14 [19659014] Pembacaan sekuens RRBS dipangkas untuk menghapus adaptor dan rangkaian kualitas rendah dengan Trim_Galore. Adaptor keanekaragaman dihapus dengan skrip python NuGEN (trimRRBSdiversityAdaptCustomers.py). Alignment to hg19 dilakukan dengan Bismark 0.13.0, dan status metilasi dinilai menggunakan bismark_methylation_extractor, mengabaikan 5 basa pada 5 ′ akhir setiap membaca. 15

Sekuensing genom utuh Mbd4 liar -tipe dan tikus knockout

Mbd4 tikus knockout (JAX stock # 004989) diperoleh dari Jackson Laboratory. 11 Tikus-tikus disilang kembali generasi tambahan untuk C57BL / 6, sebelum kawin silang. Semua penelitian pada hewan disetujui oleh Komite Etika Hewan WEHI (Project 2014.010). Sel sumsum tulang tikus dikumpulkan dalam medium Elang Dulbecco yang dimodifikasi (Thermo Fisher Scientific) yang mengandung 10% HyClone bovine calf serum, zat besi yang disuplementasi (Thermo Fisher Scientific). Sepuluh ribu sel dikultur dalam 1 mL Dulbecco modifikasi Elang sedang dengan 20% serum lembu sapi, 0,3% agar (BD), 100 ng / mL sel induk murine, 10 ng / mL murine interleukin-3 (IL-3), dan 2 IU erythropoietin. 16 Kultur diinkubasi selama 11 hari pada 37 ° C dalam suasana yang sepenuhnya dilembabkan dengan 10% CO 2. Koloni individu diisolasi, dan DNA diekstraksi menggunakan QIAamp DNA Micro Kit (Qiagen). DNA dari koloni individu diamplifikasi menggunakan TruePrime WGA Kit (SYGNIS), dan DNA yang diperkuat dimurnikan menggunakan QIAamp DNA Mini Kit (Qiagen). DNA sumsum tulang tikus diekstraksi menggunakan DNeasy Blood & Tissue Kit (Qiagen). DNA diukur menggunakan Agilent 2200 Tapestation Genomic DNA ScreenTape Assay (Agilent Technologies). Sekuensing genom keseluruhan dilakukan pada NovaSeq (Illumina). Data sekuensing DNA disejajarkan dengan genom tikus (mm10) menggunakan bwa-mem. Alignment, panggilan varian, dan perhitungan tingkat mutasi relatif dilakukan dengan menggunakan pendekatan yang sama yang diuraikan untuk data sekuensing manusia. Welch t tes digunakan untuk membandingkan antara kelompok sampel (n = 3 per kelompok).

profil Genomik koloni yang diturunkan dari sel tunggal (SCDCs) dari EMC-AML-1

Transplantasi sel induk autologus EMC-AML-1 dan mendiagnosis sampel darah perifer digunakan untuk mendapatkan koloni sel progenitor tunggal hematopoietik. Secara singkat, sel-sel dicairkan dan diencerkan secara berurutan dalam medium Iscove termodifikasi Dulbecco (Thermo Fisher) yang dilengkapi dengan 5% serum albumin manusia (Thermo Fisher) dan 20 U / mL heparin (yaitu, awalnya 1: 1; setelah 10 menit, 1:10; dan setelah 20 menit, 1:20). Suspensi sel disentrifugasi pada 4 ° C, dan sel-sel diresuspensi dalam salin fosfat-buffered dingin. Sel-sel berlapis pada kerapatan yang berbeda (0,04-2 × 10 5 sel per mL) di MethoCult GF H84434 Metilselulosa menengah dengan sitokin (Stemcell Technologies) selama 14 hari pada 37 ° C dan 5% CO 2. DNA diisolasi dari koloni individu menggunakan QiaAmp DNA Micro Kit (Qiagen) dan dikuantifikasi menggunakan Qubit DNA HS assay kit (Life Technologies). Illumina TruSight Myeloid Sequencing Panel (Illumina) diaplikasikan untuk mendeteksi mutasi pada gen yang sering bermutasi pada keganasan myeloid.

MBD4 glycosylase activity assays

Uji aktivitas glikosilase MBD4 dilakukan seperti yang dijelaskan sebelumnya dengan modifikasi berikut. 17 Aktivitas glikosilase protein MBD4 (0,5 μM) pada double-stranded FAM-label 32bp-oligonukleotida (0,1μM) dinilai dan dipantau oleh denaturasi elektroforesis gel. DNA untai tunggal berlabel FAM yang dihasilkan divisualisasikan menggunakan filter laser 473-nm (Blue LD Laser) dan 530DF20 pada Typhoon FLA9500 (GE Healthcare).

Oligonukleotida 32-bp berikut ini diperoleh dari Integrated DNA Technologies. : (FAM) -5′-TCGGATGTTGGGGSPAG X GCATGATAGTGTA-3 ′ (di mana X = C atau T); 5′-TACACTATCATGCGCTGACCCACAACATCCGA-3 ′. Double-stranded FAM-label oligonukleotida cocok dicocokkan dan tidak cocok disiapkan oleh hibridisasi dimana 100 μM oligodinukleotida dicampur dalam 50 µL annealing buffer mengandung 10 mM tris (hidroksimetil) aminometana HCl, 1 mM EDTA, dan 50 mM NaCl (pH 8,0), kemudian diinkubasi pada 95 ° C selama 2 menit, diikuti dengan penurunan suhu yang stabil selama 45 menit hingga 25 ° C. Dupleks beruntai ganda didinginkan dan disimpan pada suhu 4 ° C.

Hasil

Batas garis germ dari MBD4 predisposisi AML dengan tanda mutasi baru

Kami mengidentifikasi 3 pasien dengan AML, termasuk 2 saudara, yang khas karena beban mutasinya yang tinggi (∼33 kali lipat di atas apa yang khas untuk AML) dan tanda tangan mutasi yang unik, di mana> 95% mutasi adalah CG> TG (Gambar 1A-B; tambahan Gambar 1A) . Tanda tangan ini berbeda dari distribusi mutasi C> T yang umumnya diamati pada AML dan lebih halus daripada tanda mutasional yang dianggap berasal dari penuaan, 4 yang menunjukkan ketergantungan penuh dekat pada 5 mC deaminasi. Meskipun mutasi CG> TG merupakan fitur integral dari kerusakan DNA yang berkaitan dengan usia dan AML paling sering merupakan penyakit usia tua (rata-rata usia onset adalah> 70 tahun), semua 3 pasien lebih muda dari 35 tahun saat diagnosis.

Gambar 1.

Kanker defisien MBD4 menunjukkan tanda mutasi yang khas. (A) Beban mutasi di AML, disajikan sebagai jumlah substitusi dasar per exome Data bersumber dari dbGaP, kasus diperintahkan pada pengenal pasien (EMC: phs001027 12 dan TCGA: phs000178 24). (B) Konteks trimer dari mutasi C> T dalam 3 MBD4 – Kasus AML yang tidak sempurna Pusat asal tercermin dalam label sampel Sebagai perbandingan, kami menunjukkan tanda tangan 1, tanda tangan yang sudah ada yang terkait dengan deaminasi 5mC, dan semua mutasi C> T hadir dalam TCGA-AML. (C) representasi skematis dari MBD4, menyoroti varian garis kehilangan fungsi yang dideteksi dalam kasus-kasus dan kasus-kasus AML dalam TCGA (di atas). Uji glikosilase dilakukan untuk menilai aktivitas rekombinan MBD4 (AA430-580 atau panjang penuh), wild-type (WT), delH567, atau D560A mutan katalitik tidak aktif. Substrat (S) dan produk (P). Hasil yang konsisten diperoleh dalam 5 percobaan untuk MBD4 AA430-580 dan 3 percobaan untuk panjang penuh. (D) Proporsi CG> TG mutasi yang diamati ditetapkan terhadap jumlah total substitusi dasar yang terdeteksi untuk semua sampel TCGA. Sampel dengan germ line MBD4 kehilangan-fungsi-varian yang ditunjuk baik sebagai heterozigot (monoelektik) atau benar-benar tidak aktif (bialel) berdasarkan genotipe kanker (termasuk mutasi somatik). Garis abu-abu menandai 1% teratas dan 0,1% kasus dengan proporsi tertinggi mutasi CG> TG. Satu set tipe tumor terpilih disorot.

Urutan DNA garis kuman dari 3 kasus mengidentifikasi hilangnya fungsi varian pada gen yang mengkodekan DNA glikosilase MBD4, yang memainkan peran kunci dalam memulai perbaikan. setelah 5mC deaminasi 8 (Gambar 1C; tambahan Tabel 2). Kasus EMC-AML-1 membawa penghapusan homozigot Histidine 567 (H567) dalam domain glikosilase MBD4. Sebuah uji glikosilase in vitro menegaskan bahwa hilangnya H567 menghasilkan protein MBD4 yang secara katalaktif tidak aktif (Gambar 1C). Saudara kandung (WEHI-AML-1, WEHI-AML-2) adalah senyawa heterozigot dengan frameshift di ekson 3 dan varian yang mengganggu akseptor sambatan ekson 7 dari MBD4 (Gambar 1C; tambahan Gambar 2A). Analisis MBD4 messenger RNA memungkinkan untuk pentahapan varian ke alel yang berbeda dan menegaskan penyambungan menyimpang yang tidak termasuk ekson 7 dan mengganggu domain glikosilase (Gambar 2B tambahan). MBD4 sebelumnya tidak dikaitkan dengan keganasan hematologi, tetapi mutasi somatik, terutama frameshifts, telah terdeteksi pada kanker kolon sporadis dengan defisiensi perbaikan mismatch. 1819 Dua pasien (EMC-AML) -1, WEHI-AML-2) juga memiliki polip kolorektal, manifestasi umum dari cacat perbaikan DNA, termasuk yang terkait dengan hilangnya komponen BER MUTYH 20 dan NTHL1. 21

Inaktivasi MBD4 dikaitkan dengan tanda tangan kerusakan metilasi di berbagai jenis kanker

Kami menambang database kanker besar untuk mengeksplorasi hubungan antara defisiensi MBD4 dan tanda CG> TG yang khas. Analisis TCGA, yang terdiri dari 10 683 jenis kanker (termasuk 200 AML), mengidentifikasi 9 kasus yang membawa varian garis-kehilangan-fungsi germ dalam MBD4 (Gambar 1C; Gambar tambahan 1A-B dan tambahan Tabel 2). Dalam 2 dari kasus-kasus ini, melanoma uveal (TCGA-UVM-1) dan glioblastoma multiforme (TCGA-GBM-1), mutasi situs sambatan disertai dengan hilangnya alel wild type MBD4 (suplemen Gambar 3A). Analisis sekuensing RNA dari kedua tumor dikonfirmasi menyimpang menyimpang MBD4diprediksi akan menghasilkan pemotongan protein dan hilangnya fungsi (tambahan Gambar 3B). Kedua kasus menunjukkan tingkat mutasi yang tinggi dan pengayaan yang kuat untuk mutasi CG> TG, serupa dengan MBD4-defisien AML (Gambar 1D; Gambar 1A tambahan). Tanda ini juga diamati pada garis sel glioma, SW1783, yang membawa varian terpotong homozigot di MBD4 di Leucine 563 (tambahan Gambar 1A). Kanker yang mempertahankan alel tipe-liar tidak menunjukkan tanda CG> TG yang menonjol (Gambar 1D; Gambar 1A tambahan). Hasil ini menunjukkan kedua alel MBD4 harus diinaktivasi untuk menghambat aktivitas perbaikannya, yang konsisten dengan sindrom kanker terkait-BER lainnya. 2021

Fitur genetik dan epigenetik yang berdampak kerusakan metilasi

Pengurutan seluruh genom dan metilasi genom dilakukan untuk memperbaiki tanda mutasi yang terkait dengan defisiensi MBD4 pada AML. Secara keseluruhan,> 15.000 mutasi substitusi diidentifikasi dalam setiap genom AML, di mana> 90% adalah CG> TG (Gambar 1B tambahan). Insersi dan penghapusan tidak umum, menunjukkan jalur perbaikan ketidakcocokan tetap utuh. Tingkat mutasi terkait dengan kelimpahan 5mC. Daerah yang jarang termetilasi, seperti promotor dan kepulauan CG, jarang bermutasi (Gambar 2A). Mengoreksi kelimpahan 5mC diukur dalam sel CD34 + normal mengungkapkan tingkat mutasi yang konsisten di seluruh fitur genom yang berbeda (Gambar 2A). Penilaian langsung status metilasi pada kanker MBD4-kekurangan, atau jaringan kontrol yang cocok, menegaskan bahwa mutasi terjadi di situs CG termetilasi (suplemen Gambar 4).

Gambar 2.

Kerusakan diperkenalkan oleh 5mC deaminasi dipengaruhi oleh fitur genetik dan epigenetik. (A) Mengamati tingkat mutasi relatif (RMR) pada fitur genom yang berbeda dalam sekuensing genom keseluruhan dari WEHI-AML-1 dan WEHI-AML-2, dihitung per Mb dari dinukleotida CG (CG dikoreksi), atau dikoreksi untuk status metilasi di CD34 normal + sel (5mC dikoreksi). (B) Status kelimpahan dan metilasi untuk pemisah NCG dari sekuens bisulfit genom utuh yang berasal dari CD34 normal + sel. 37 Nilai RMR dihitung untuk WEHI-AML-1 dan WEHI-AML-2 untuk setiap NCG trimer, akuntansi untuk perbedaan dalam kelimpahan dan status 5mC dalam keadaan normal CD34 + sel dan diskalakan untuk memperhitungkan total beban mutasi (lihat Metode tambahan). Nilai-nilai individu diplot (n = 2), dan bar menunjukkan mean. (C) nilai RMR dihitung dari data exome untuk kanker dengan defisiensi 5 MBD4. Ada pengayaan signifikan mutasi dalam konteks ACG dibandingkan dengan TCG (P =, 0079, Mann-Whitney U tes). (D) nilai RMR dihitung dari seluruh data sekuensing genom yang dihasilkan dari Mbd4 KO (Mbd4-KO) progenitor sel darah murine pada usia 4 bulan. Nilai dari koloni individu diplot (n = 3), dan bar menunjukkan mean. Ada pengayaan signifikan mutasi dalam konteks ACG dibandingkan dengan TCG (P = .019, t tes Welch). (E) nilai RMR dihitung untuk tetramer NCGN di WEHI-AML-1 dan WEHI-AML-2, kemudian dipisahkan oleh waktu replikasi (n = 2).

Selanjutnya kami menilai pengaruh genetik and epigenetic features on the mutation rate.22 When we examined the local sequence context, we observed that the proportion of mutations was higher in the context of the ACG triplet and lower in the context of TCG, with CCG and GCG being intermediate. The preference for ACG remained after correction for trimer abundance and methylation status (Figure 2B) and was found to be significant in the exome data from 5 MBD4-deficient cancers (P = .007937, Mann-Whitney U test) (Figure 2C). The same mutational signature, including the preference for the ACG trimer, was recapitulated in blood cell progenitors isolated from Mbd4 knockout mice, both at 4 months of age (Figure 2D) and in animals aged for over a year, which had a higher mutation burden (supplemental Figure 5). The ACA trimer was the most commonly mutated site outside of a CG context in the cancers, and this matches the most common site of non-CG methylation.23 Extending the analysis of sequence context to include 1 base on either side of the CG identified higher mutation rates in the context of a 3′ cytosine (NCGC). The relative mutation rate was not influenced by the transcriptional strand (supplemental Figure 6A) but was higher in late replicating regions (Figure 2E) and at lowly expressed genes (supplemental Figure 6B). The differences between tetramers and enrichment in late replicating regions were also evident in rare germ line CG>TG single nucleotide polymorphisms from the gnomAD database13 (supplemental Figure 6C). Collectively, these results suggest that although 5mC is the dominant factor contributing to the mutation rate, the local sequence context, replication timing, and expression status also contribute.

MBD4 deficiency drives a common path of clonal evolution to AML

The 3 cases of AML with germ line MBD4 deficiency exhibited common molecular features, including biallelic DNMT3A mutations and IDH1 or IDH2 hot spot mutations, all of which were CG>TG (Figure 3A-C). This is a relatively rare path to AML, affecting <3% of patients in TCGA-AML24; therefore, it is highly unlikely that these 3 individuals share this pattern of driver mutations by chance. Analysis of sequential bone marrow biopsies taken during treatment and single-cell genotyping allowed us to refine the order of somatic mutation acquisition in 2 cases (EMC-AML-1, WEHI-AML-1), with DNMT3A mutations preceding IDH mutations (Figure 3A-B; supplemental Figure 7). DNMT3A mutations present in the AML at diagnosis were also detected in nonleukemic bone marrow populations in both cases, indicating that these mutations are among the first acquired. Mutations in DNMT3A are known to alter the self-renewal capacity of hematopoietic stem cells (HSCs)25 and are associated with age-related clonal hematopoiesis (ARCH), also known as clonal hematopoiesis of indeterminate potential.2629 For both cases, a marked expansion of clones carrying DNMT3A mutations occurred in the remission phase following treatment (Figure 3A-B). EMC-AML-1 experienced multiple clonal outgrowths, with 9 distinct DNMT3A mutations, and repeated selection of clones with biallelic DNMT3A mutations, which appears to be a key step in the development of leukemia in these patients. Broader testing of other AMLs with biallelic DNMT3A mutations demonstrated that 24 out of 30 (80%) have coincident mutations in IDH1 or IDH2suggesting cooperation between these mutations that may explain this conserved path to leukemia.

Figure 3.

Germ line MBD4-deficient patients share a common path to AML. Clonal evolution and phylogenetic tree diagram highlighting the acquisition of key driver mutations and clonal dynamics in WEHI-AML-1 (A) and in EMC-AML-1 (B). (C) The phylogenetic tree diagram for key driver mutations in WEHI-AML-2. Variant allele frequencies were derived from whole exome sequencing data or deep sequencing for all cases. For EMC-AML-1 single-cell genotyping was used to resolve the clonal relationships. Clones are represented by different colors, and the vertical lines in the top panels indicate sampling points. The premalignant clone (P, in dark blue) and the AML clones evident at diagnosis (D, in red) and relapse (R, in yellow) are designated. Both WEHI-AML-1 and EMC-AML-1 experienced clonal hematopoiesis during remission. The transplant for WEHI-AML-1 was provided by WEHI-AML-2, which occurred 4 years prior to her own diagnosis of AML.

MBD4 deficiency stimulates clonal hematopoiesis through inactivation of DNMT3A

To determine the influence of this mutational process on the composition of MBD4-deficient bone marrow, we genotyped additional single cells, or SCDCs, isolated from EMC-AML-1 at multiple points during treatment. As expected, the leukemic clones were dominant at the time of diagnosis and relapse, but genotyping individual cells revealed that they continue to acquire CG>TG mutations (supplemental Figure 8). When HSCs collected at remission were examined, we found that 20 of 30 (67%) SCDCs carried mono- or biallelic CG>TG mutations in DNMT3A that were mostly distinct (Figure 4A). A further 2 (7%) SCDCs carried CG>TG mutations in TP53 (Figure 4B). Deep variant calling across all EMC-AML-1 samples uncovered additional CG>TG mutations in ARCH-associated genes: 28 in DNMT3A10 in TP535 in ASXL1and 7 in TET2 (Figure 4A-D). When these findings are extrapolated to the entire bone marrow compartment, it suggests a rich diversity of clones carrying mutations in ARCH-associated genes, predominantly in DNMT3A. Three observations support the notion that the mutations in DNMT3A are functionally important: first, their repeated expansion in the blood indicates a fitness advantage; second, there is clear enrichment of nonsynonymous mutations (assessed with dNdScv,30 q = 4.63e-05, Benjamini-Hochberg corrected); and third, the majority of mutations (65%) have been observed in ARCH26,28,31 (Figure 4A). Taken together, these results emphasize the importance of 5mC damage as a source of mutations that drive clonal expansion in the blood, representing a key contributor to ARCH.

Figure 4.

Recurrent C>T mutations in genes implicated in age-related clonal hematopoiesis (ARCH). (A) DNMT3A mutations were detected in MBD4-deficient patients at time of disease (leukemic phase) or remission (remission phase). EMC-AML-1 had additional DNMT3A mutations that were detected through sequencing of bulk DNA, SCDCs obtained from diagnostic bone marrow, and SCDCs from autologous stem cells collected during complete remission. The majority of the DNMT3A mutations had been detected in healthy individuals with ARCH. Additional point mutations were identified in remission material from EMC-AML-1, in TP53 (B), ASXL1 (C), and TET2 (D). A more detailed phylogenetic tree is provided in supplemental Figure 8.

Discussion

Here we describe a new genetic predisposition to cancer, in which germ line MBD4 deficiency is associated with the development of early-onset AML, through the acquisition of pathogenic mutations in driver genes, most particularly DNMT3A. Although additional investigation is required to determine the frequency with which MBD4 deficiency contributes to familial cancer predisposition and to refine the disease spectrum and penetrance, our results highlight a crucial role for MBD4 in safeguarding against the damage wrought by 5mC deamination. Concomitantly, 2 other groups have also identified the link between MBD4 inactivation and methylation damage, through identification of sporadic solid cancers with a combination of germ line and somatic mutations (Rodrigues et al32 and Jan Korbel, manuscript submitted November 2017). Our study, in addition, reveals the impact of constitutive inactivation of MBD4 on the development of early-onset AML and reveals that blood cell progenitors are particularly sensitive to methylation damage.

As noted earlier, methylation damage accumulates as part of normal aging.4,5 Our current understanding of how methylation damage manifests largely depends on mutational profiles garnered from large collections of human cancers,4 but distilling a clear signature has been complicated by the diverse DNA damage processes and repair defects present in those cancers. MBD4-deficient cancers, particularly cases with constitutive loss, provide a unique opportunity to refine the mutational signature for methylation damage, and we have identified genetic and epigenetic factors that shape its influence. This distinctive damage signature was recapitulated in blood cells from Mbd4 knockout mice, indicating that the DNA repair pathway guarding against methylation damage is broadly conserved. The ubiquitous nature of methylation damage means even small fluctuations in mutation rate are relevant if we wish to understand its influence on genomic integrity. Our results demonstrate a profound link between methylation damage and the development of hematological malignancy, which is reshaping our understanding of how 5mC contributes to cancer risk over a lifetime.

One manifestation of methylation damage is clonal hematopoiesis, a phenomenon typically observed in people >70 years of age.2629 The influence of methylation damage is reflected in the prevalence of C>T mutations in clonal hematopoiesis, which has been noted previously.28,33 Individuals with biallelic loss of MBD4 in the germ line confirm this link; they sustain high levels of damage from 5mC deamination throughout their lifetime and experience clonal expansions decades earlier, which eventually progress to AML. Repeated sampling and single-cell genotyping of blood cell progenitors revealed a rich diversity of mutations that overlap the driver landscape of clonal hematopoiesis, including mutations in DNMT3A particularly, but also in TP53ASXL1and TET2. The coexistence of this diverse array of mutant clones, and our ability to monitor their prevalence dynamically, offers new insight into the fitness landscape of clonal hematopoiesis. Future studies will need to explore the latency and degree of penetrance of mutations associated with clonal hematopoiesis and AML in Mbd4 knockout mice as they age, in order to fully investigate the human disease pathogenesis we have identified.

There are >40 million 5mC residues in the genome, yet the 3 individuals that lack MBD4 constitutively all developed the same type of cancer, AML, with a common set of driver mutations. A small set of genes have been defined that predispose to AML (reviewed by Godley and Shimamura34), including DNA repair genes, such as those in the Fanconi anemia pathway, but to our knowledge none exhibit such a conserved path to malignancy. Our results indicate this convergence results from the combination of a highly restricted mutational signature, which accesses a select set of driver genes, and the role of DNMT3A, which regulates HSC self-renewal capacity and protects against transformation.25,35,36 This interaction between mutational process, driver landscape, and stem cell biology may explain the tissue-restricted pattern of disease in this and other cancer predisposition syndromes and has broader implications for understanding how the aging process shapes cancer risk.

Acknowledgments

The authors thank S. He, A. Rijneveld, K. van Lom, and K. Gussinklo for providing clinical information; M. Wall for assistance with cytogenetics; N. Sprigg for assistance with sample collection; L. Di Rago for assistance with mouse agar colonies; E. Rombouts for assistance with single-cell sorting; I. Martincorena and F. Abascal for advice on the dNdScv model; S. van Rossum and J. Lebbink for assistance with recombinant protein isolation; the Australasian Leukaemia and Lymphoma Group for access to clinical samples; and S. Wilcox for technical assistance with sequencing. Additional sequencing was performed at the Australian Genome Research Facility (Melbourne, VIC, Australia) and the Kinghorn Centre for Clinical Genomics (Sydney, NSW, Australia). Sean Grimmond, Jason Wong, Oliver Sieber, Alicia Oshlack, and Stephen Nutt provided valuable feedback on the manuscript.

This work was supported by the Australian National Health and Medical Research Council (NHMRC) (program grant 1113577 [W.S.A. and A.W.R.] and project grant 1145912 [I.J.M.]), an Independent Research Institutes Infrastructure Support Scheme Grant (9000220), a Victorian State Government Operational Infrastructure Support Grant, The Netherlands Organisation for Scientific Research (NWO), and the Center for Translational Molecular Medicine (CTMM). M.A.S. is supported by a grant from CTMM (GR03O-102) and a Rubicon fellowship from NWO (019.153LW.038). E.C. is supported by a PhD scholarship from the Leukaemia Foundation of Australia. A.S.a.H. is supported by a PhD scholarship from the Ministry of Health, Sultanate of Oman. M.E.B. is supported by the Bellberry-Viertel fellowship. W.S.A. and A.W.R. are supported by fellowships from NHMRC (1058344 and 1079560, respectively). I.J.M. is supported by the Victorian Cancer Agency. The authors wish to acknowledge the generous philanthropic support of the Felton Bequest, Malcolm Broomhead, and BHP Billiton.

The results are based, in part, on data generated by the TCGA Research Network (http://cancergenome.nih.gov/) and the Epigenetic studies in Acute Myeloid Leukemia (phs001027), which was supported by National Institutes of Health, National Cancer Institute (K08CA169055) (F. E. Garrett-Bakelman), Starr Cancer Consortium I4-A442 (A. M. Melnick, R. Levine, and C. E. Mason), and LLS SCOR 7006-13 (A. M. Melnick). Sequencing data from WEHI-AML-1 and WEHI-AML-2 have been deposited at the European Genome Phenome Archive (EGA) (EGAS00001002581). The data are available for ethically approved research into hematological malignancy upon completion of a data transfer agreement. Sequencing data from EMC-AML-1 were sourced from the dbGaP under accession phs001027. Sequencing data from the Mbd4 knockout mice is available through the National Center for Biotechnology Information (NCBI) Short Read Archive (SRP126117). The code for reproducing figures is made available through GitHub (https://github.com/MathijsSanders/AML-RoaMeR).

Authorship

Contribution: M.A.S., E.C., A.W.R., P.J.M.V., and I.J.M. conceived and designed research; M.A.S., E.C., C.F., A.Z., S.E.M., A.S.a.H., A.B., B. Luiken, M.R., T.M., R.M.H., F.G.K., A.W.R., P.J.M.V., and I.J.M. developed methodology and performed research; M.A.S., E.C., C.F., A.Z., S.E.M., R.M.H., F.G.K., S.F., M.E.B., E.M.B., W.S.A., A.W.R., P.J.M.V., and I.J.M. analyzed data; and M.A.S., E.C., C.F., W.S.A., B. Löwenberg, A.W.R., P.J.M.V., and I.J.M. wrote the manuscript or contributed to revision of the manuscript.

Conflict-of-interest disclosure: The authors declare no competing financial interests.

Correspondence: Ian J. Majewski, Cancer and Haematology Division, The Walter and Eliza Hall Institute, 1G Royal Parade, Parkville 3052, VIC, Australia; e-mail: majewski{at}wehi.edu.au.