Jurnal Internasional Pandangan topologis lintasan keadaan sel CD34 + manusia dari output sel tunggal dan data proteomik terintegrasi

Download Jurnal Disini

Pendahuluan

Keluaran klon jangka panjang yang stabil dari berbagai jenis sel darah matang dari transplantasi sel CD34 manusia + telah dilaporkan pada penerima transplantasi yang dimanipulasi secara genetik. 1 3 Namun, mekanisme yang mengatur waktu, daya tahan, dan keragaman proses diferensiasi yang mendasarinya masih kurang dipahami. Secara historis, ini telah dimodelkan sebagai melibatkan peristiwa bifurkasi berurutan, mirip dengan proses yang diyakini terjadi selama pengembangan awal. 45 Model ini sebagian besar didasarkan pada identifikasi kondisi in vitro yang mendukung produksi bersamaan beberapa garis keturunan sel dan identifikasi fenotipe yang memungkinkan pengayaan diferensial dari nenek moyang yang terdeteksi. 6

12 Namun, penelitian telah menyarankan bahwa jalur jalur keturunan yang berbeda, dan bahkan alternatif, mungkin ada. 61314 Data transkripom sel tunggal konten tinggi yang terkait juga sekarang menunjukkan proses yang lebih berkelanjutan dari pembatasan garis keturunan hematopoietik pada kedua tikus [19659019] 1516 dan manusia. 141718 Data epigenomik yang diperoleh juga mendukung konsep kontinum di mana sel-sel dengan fitur garis keturunan “prima” secara progresif didistribusikan di seluruh sebelumnya. didefinisikan fenotip nenek moyang. 1517 [194520

Temuan ini telah membangkitkan minat pada karakterisasi agnostik molekuler sel hematopoietik primitif dan penggunaan pengurutan indeks untuk memasangkan sifat proteomik dan biologis dari fenotip yang sangat cocok. 2123 Sitometri massa 24 adalah sangat cocok untuk studi seperti itu karena memungkinkan kuantifikasi simultan lusinan epitop permukaan serta protein intraseluler pada resolusi tinggi dalam ratusan ribu sel individu. Dengan demikian mengatasi ketidakmampuan untuk menyimpulkan tingkat protein dari beberapa pengukuran transkrip, 212527 terutama protein yang mengalami modifikasi posttranslational yang diinduksi secara eksternal. dalam perubahan nasib sel. 2829 Penggunaan gabungan pengukuran permukaan dan sel tunggal intraseluler juga memungkinkan berbagai tingkat regulator internal untuk dikorelasikan dengan profil penanda permukaan yang tepat yang digunakan untuk menginterogasi. sifat biologis dari sel yang hidup. 213031

Kami sekarang melaporkan penerapan strategi umum ini ke seluruh garis keturunan-negatif (lin ) CD34 + subset dari sel darah tali pusat (CB) normal dalam hubungannya dengan penilaian output klon mereka dalam kultur jangka pendek yang mendukung produksi eritroid (E) yang simultan dan efisien, neutrofil / mon sel ocyte (NM), dan limfoid (L). Integrasi data dari kedua jenis pengukuran menghasilkan tampilan probabilistik dari transisi molekul variabel yang dilakukan oleh CD34 + sel CB yang dialami selama pembatasan in vivo ke status prekursor sel darah matang tunggal.

Bahan dan metode

] Persiapan sel CB manusia

Sampel heparinized yang disetujui secara anonim dari sel CB normal diperoleh dengan persetujuan berdasarkan protokol yang disetujui oleh Dewan Etika Penelitian Dewan Riset Universitas British Columbia. Sel CD34 + (> 50%) diisolasi dengan menggunakan kit EasySep dari fraksi kepadatan ringan dari CD11b yang habis RosetteSep + CD3 + CD19 ] + sel (STEMCELL Technologies, Vancouver, BC, Kanada) dan kemudian digunakan baik secara langsung atau setelah kriopreservasi dalam dimetil sulfoksida dan serum janin sapi (STEMCELL Technologies).

Aliran sitometri dan pemilahan indeks

Sel ditangguhkan dalam Hanks 'Balanced Salt Solution ditambah dengan serum manusia 5% dan antibodi CD32 anti-manusia 1,5 μg / mL (Klon IV.3; Teknologi STEMCELL). Mereka kemudian diwarnai dengan antibodi yang ditunjuk (Tabel 1 tambahan, tersedia di situs web Darah) selama 1 sampai 2 jam di atas es sebelum pengurutan indeks pada penyortir FACSAria Fusion (BD Biosciences, Franklin Lakes, NJ).

Uji in vitro

Pembentukan koloni dalam metilselulosa dinilai dengan sel tunggal, yang dipilih secara acak, diurutkan dengan indeks yang diendapkan secara langsung dan secara individu ke dalam 60 sumur bagian dalam dari pelat polistiren Nunc 96-sumur bawah datar (Thermo Fisher Scientific, Waltham , MA) dimuat dengan 50 μL media metilselulosa; medium itu dilengkapi dengan 50 ng / mL faktor sel induk (SCF), 20 ng / mL faktor penstimulasi koloni granulosit-makrofag, interleukin-3 (IL-3), interleukin-6, faktor stimulasi granulosit-koloni (G-CSF ), dan 3 U / mL erythropoietin (EPO) (STEMCELL Technologies). Pelat diinkubasi selama 2 hingga 3 minggu pada suhu 37 ° C dalam atmosfer lembab 5% karbon dioksida di udara; masing-masing sumur kemudian dicitrakan untuk memungkinkan penugasan tipe koloni.

Untuk pengujian dalam kultur yang mengandung stroma jangka pendek, sel-sel yang diurutkan secara indeks diendapkan diendapkan ke dalam 60 sumur dalam dari pelat 96 sumur. Piring dimuat dengan 9000 MS-5 sel dan 333 masing-masing fibroblast tikus M210B4 yang mengekspresikan IL-3 dan G-CSF manusia, dan sl / sl fibroblast tikus yang mengekspresikan SCF dan IL-3 manusia, dan FLT3L manusia , dengan modifikasi Minimum Essential Medium-alpha dengan 2 mM glutamin, serum janin sapi 7,5%, dan 10 −4 M β-mercaptoethanol (MilliporeSigma, Burlington, MA); 50 ng / mL SCF (Novartis, East Hanover, NJ), 10 ng / mL FLT3L (Immunex Corporation, Seattle, WA), 10 ng / mL interleukin-7 (Sistem R&D, Minneapolis, MN), dan 3 U / mL EPO (STEMCELL Technologies) ditambahkan untuk 2 minggu pertama, dan 3 U / mL EPO dan 10 ng / mL interleukin-7 hanya untuk minggu terakhir. Kultur ini juga diinkubasi pada suhu 37 ° C dalam karbon dioksida 5% di udara, dan perubahan setengah-setengah mingguan dilakukan. Setelah 3 minggu, semua sel dipanen, diwarnai dengan antibodi (tambahan Tabel 2), dan dinilai dengan penyortiran sel yang diaktifkan fluoresensi untuk mendeteksi klon> 10 sel yang termasuk satu atau lebih dari populasi sel berikut: NM (CD45 + 11b + 33 + 14 +/−), B (CD45 + 11b – 33 10 + 19 + 56 ), pembunuh alami (NK) (CD45 + 56 + 11b +/− 33 14 7 ), E (CD45 IPK +), atau prekursor-T (CD45 + 11b 33 56 10 10 19 CD7 +). Klon yang mengandung> 10 CD45 + 34 + peristiwa dengan tidak adanya sel dewasa didefinisikan sebagai klon “ledakan”.

Analisis data

Analisis data dan data sitometri adalah dianalisis dengan perangkat lunak statistik R (menggunakan kombinasi paket “flowCore” dan skrip khusus; R Foundation for Statistical Computing, Wina, Austria). Rincian tambahan diberikan dalam Metode tambahan.

Hasil

CD34 yang diterima secara konvensional + fenotip progenitor gagal untuk mengisolasi himpunan bagian yang dibatasi garis keturunan

Rencana percobaan umum yang digunakan untuk memastikan hubungan yang sebelumnya tidak terdokumentasi antara proteomik fitur dan potensi keluaran garis keturunan dari lin CD34 + sel CB ditunjukkan secara skematis dalam Gambar 1A. Eksperimen awal dilakukan untuk menentukan frekuensi relatif sel dengan output klonal yang berbeda dari sel eritroid (E) yang matang, granulosit (G), makrofag (M), eosinofil (Eos), dan / atau ledakan pada 660 kultur mikro-metilselulosa ( MC), dimulai dengan sel-sel indeks tunggal yang diambil secara acak dari seluruh lin CD34 + kompartemen CB (dalam pengujian 3 sampel CB besar yang dikumpulkan dengan pewarnaan 13 antibodi permukaan sel) (Gambar 1A tambahan; Tabel 1 tambahan). Komposisi garis keturunan dari masing-masing 491 klon yang terdeteksi 2 hingga 3 minggu kemudian (> 20 sel / klon, efisiensi kloning 74%) dinilai buta, dan asal masing-masing kemudian ditugaskan secara retrospektif ke 1 dari 8 CD34 yang diterima secara konvensional + himpunan bagian berdasarkan profil penanda permukaan yang diindeks (Gambar 1B). Tiga belas persen dari klon mengandung sel E (hemoglobinisasi) eksklusif, 39% baik banyak (> 1000) atau lebih sedikit (20-1000) sel GM (bola bening) eksklusif, 0,8% sel Eos eksklusif (sangat refraktil), 21% jelas. campuran sel E + GM (koloni GEMM), dan 1% mengandung <100 sel terdispersi yang tidak siap untuk garis keturunan apa pun (ditetapkan sebagai ledakan). Megakaryocytes diketahui diproduksi dalam kondisi ini 32 tidak diidentifikasi secara spesifik.

Gambar 1.

Distribusi output sel yang dibedakan dari fenotipe lin CD34 + sel CB. (A) eksperimental umum desain. (BC) Jumlah sel input dalam masing-masing 8 fenotipe input CD34 + dianalisis dengan kegiatan output yang ditampilkan. Sel induk hematopoietik (HSC): CD34 + CD38 CD45RA CD90 + CD49f +. MPPs: CD34 + CD38 CD45RA ] – CD90 CD49f . LMPPs: CD34 + CD38 CD10 CD45RA +. MLP: CD34 + CD38 CD10 + CD45RA +. CMP: CD34 + CD38 + CD10 CD135 + CD45RA . Parlemen Eropa: CD34 + CD38 + CD10 CD135 CD45RA . GMP: CD34 + CD38 + CD10 CD135 + CD45RA +. Pra – B / NK: CD34 + CD38 + CD10 + CD45RA +. Jumlah sel input (n) dalam setiap fenotipe juga ditunjukkan. Legenda menunjukkan kombinasi garis silsilah yang diamati secara visual dalam uji (B) MC atau (C) menurut aliran sitometri di STC. (B) Jumlah 6 jenis sel klonogenik yang diidentifikasi dalam uji MC sel tunggal dari 660 yang dipilih secara acak, indeks-diurutkan lin CD34 + sel CB (3 percobaan). (C) Jumlah sel dengan output seluler terindikasi dinilai dalam tes STC sel tunggal 3 minggu dari 480 yang dipilih secara acak, indeks-diurutkan lin CD34 + sel CB (2 percobaan)

Keluaran silsilah dari 8 fenotip yang dijelaskan secara konvensional mengonfirmasi asosiasi yang diharapkan 633 tetapi dengan beberapa penyimpangan penting (Gambar 1B ; tambahan Tabel 3). Hasil ini termasuk temuan bahwa setengah dari 68% sel input diklasifikasikan sebagai megakaryocyte / erythroid progenitors (MEPs) yang menghasilkan beberapa sel E juga memiliki aktivitas GM, dan 12% MEP lainnya tampak dibatasi GM. Sel-sel input yang diklasifikasikan sebagai progenitor granulosit-makrofag (GMP) memiliki prediksi yang lebih dekat terhadap konten progenitor yang dibatasi oleh GM (58%), tetapi ini hanya menyumbang 18% dari semua CD34 + progenitor yang dibatasi GM terdeteksi, 60% di antaranya diidentifikasi sebagai progenitor myeloid umum (CMP). Untuk sel input diklasifikasikan secara fenotip sebagai progenitor pra-B / NK (pra-B / NK), 11% menunjukkan aktivitas clonogenik GEMM. Sebagian besar koloni ledakan kecil, dan semua koloni Eos, dihasilkan dari CMP. Hasil ini menunjukkan bahwa semua fenotipe CD34 + sel CB diterima secara konvensional sebagai sel yang mengandung garis keturunan yang dapat menghasilkan beberapa keturunan dari garis keturunan lain dan juga tidak menangkap semua nenek moyang yang memang menampilkan garis keturunan- potensi keluaran terbatas.

Kami kemudian mengulangi analisis ini dengan menggunakan versi 3-minggu dari sistem kultur klon yang mengandung stroma 6-minggu yang dijelaskan sebelumnya, dengan menambahkan EPO untuk mendeteksi produksi keturunan E serta NM dan berbagai jenis. prekursor limfoid (L) 21 dari CD34 + CD38 + sel CB. Sebanyak 480 sel CB diurutkan indeks tunggal, sekali lagi diambil secara acak dari total lin CD34 + kompartemen, kemudian dievaluasi untuk potensi diferensiasi mereka dalam kultur jangka pendek (STC) ini. ) sistem (2 percobaan independen). Setelah 3 minggu, 55% dari kultur ini (263 dari 480) mengandung ≥50 sel tembus bulat (Gambar 1C) dan 54% (256 dari 480) berisi sel yang cukup untuk analisis masing-masing sesuai dengan flow cytometry ( > 10 sel manusia yang layak terdeteksi / dikultur) (Gambar tambahan 2; Tabel tambahan 4). Karena tidak semua granulosit memiliki progenitor hulu bersama, 13 kami menggunakan istilah yang lebih spesifik, NM, untuk menggambarkan output neutrofil / makrofag dalam pengujian STC.

Analisis output garis keturunan yang ditentukan secara klon dari hasil yang sama. 8 yang ditugaskan secara retrospektif CD34 + fenotip CB dalam sistem STC (Gambar 1C; tambahan Tabel 4) menunjukkan bahwa ini menunjukkan heterogenitas yang lebih luas daripada yang ditunjukkan dalam uji MC. Dengan demikian, 8% MEP menunjukkan potensi garis turunan NM atau B, dan proporsi GMP yang lebih besar menampilkan kombinasi garis-B, prekursor T, dan / atau NK serta aktivitas progeni NM dan aktivitas yang dibatasi NM (36%) , memperluas hasil dari laporan terkait terbaru. 61318 Demikian pula, sebagian besar sel pra-B / NK klonogenik (73%) menghasilkan keturunan NM , dan dalam 3, hanya NM. Tidak ada klon prekursor eksklusif NK atau T yang terdeteksi, dan sebagian besar klon yang mengandung prekursor T juga mengandung sel-sel garis turunan NM dan B (83%), hampir dua pertiganya (63%) di antaranya mengandung sel-sel NK. Sebagian besar klon yang berasal dari CMP (80%) mengandung beberapa sel progeni NM dan B-lineage, dan terdeteksi pada 30% keseluruhan. Menariknya, semua klon yang diturunkan CMP yang mengandung progeni NM dan E (8% dari semua klon yang diturunkan CMP) juga mengandung sel NK, dan 1 juga mengandung sel garis turunan B. 4% klon yang diturunkan CMP lainnya mengandung sel CD45 + 34 + sel tanpa adanya sel yang mengekspresikan penanda garis keturunan dewasa, mirip dengan asal-usul dari dugaan “ledakan” koloni yang diidentifikasi. dalam budaya MC. Hanya 1 dari 11 progenitor multilimfoid (MLP) yang diuji menghasilkan klon, dan mengandung sel-sel NM, B, dan NK; namun, 7 dari 10 progenitor multipoten prima limfoid (LMPPs) menghasilkan klon yang dapat dideteksi, 6 di antaranya berisi NM + B dengan NK dan / atau prekursor T. Semua kecuali 1 dari 16 progenitor multipoten klonogenik (MPP) menghasilkan progeni L dan NM, dan 2 juga menghasilkan sel E. Progeni yang dapat dianalisis tidak terbukti dalam jumlah STC yang sangat kecil yang diprakarsai dengan sel dengan fenotip sel induk hematopoietik.

Fenotipe dengan kemurnian yang ditingkatkan dari nenek moyang yang dibatasi garis keturunan

Kami selanjutnya menganalisis data pengurutan indeks untuk mengidentifikasi fenotipe dari sel yang telah diklasifikasikan sebagai E, NM, atau L-dibatasi dalam uji STC. Analisis ini menghasilkan strategi 6-marker gating baru untuk sel-sel ini (Gambar 2A; Tambahan Tabel 5). Dari data ini, dalam kombinasi dengan hasil uji STC klonal dari fenotipe yang terakhir ini diisolasi dari 2 donor CB tunggal tambahan, kami menemukan 36% dari CD45 + 34 + + 38 hai 71 + (P-Es) akan dibatasi E, 37% dari CD45 + 34 + 38 hi 71 (P-NMs) dibatasi NM, 34% dari CD45 + 34 + 38 mid 71 45RA + 10 hi (P-Ls) dibatasi B / T / NK, dan CD45 hi 34 hi 38 pertengahan 71 10 (P-Mix) menjadi multipoten (47% mampu menghasilkan keturunan NM + L ± E). Kemurnian garis turunan dari fenotip P-NM dan PL keduanya lebih tinggi daripada GMP (P = .004) dan pra-B / NK (P = .01) fenotipe , masing-masing (Tabel 6 tambahan). Fraksi CD34 yang lebih primitif + 38 juga dapat dibagi lagi berdasarkan ekspresi CD10 dan CD45RA untuk memisahkan sel dengan potensi limfoid terbatas (CD45RA + 10 hi) dari orang-orang dengan potensi campuran garis keturunan NM + L ± E (CD10 ) (Gambar 2B).

Gambar 2.

Fenotip sel klonogenik dengan relatif homogen eous output activities. (A) Representasi plot penyortiran sel yang diaktifkan fluoresensi dari strategi gerbang untuk mengisolasi lin yang lebih homogen secara fungsional CD34 + progenitor CB. (B) Rata-rata keluaran kombinatorial sel NM, E, dan L (B, NK, atau T-prekursor) dari setiap populasi yang terjaga dalam tes STC klonal (4 percobaan independen). Berarti ± SD untuk frekuensi setiap populasi dalam lin CD34 + kompartemen ditunjukkan di bawah label yang relevan. Lihat juga Tabel tambahan 4 dan 5.

CD34 + sel dengan output garis turunan yang sangat terbatas tetap heterogen secara molekuler

Selanjutnya kita mengeksplorasi bagaimana tingkat variabel dari 40 protein yang sebelumnya diukur dengan menggunakan sitometri massa dalam 280 298 yang sama-sama diisolasi, lin tunggal yang layak CD34 + sel-sel CB didistribusikan di seluruh himpunan bagian yang secara fenotipik dan fungsional dianalisis. Ke-40 protein yang diperiksa terdiri dari 6 faktor transkripsi (TF), 18 perantara pensinyalan sel teraktivasi, 2 indikator status siklus sel, dan 14 penanda permukaan sel (diberikan dalam database FlowRepository dengan identifikasi repositori # FR-FCM-ZYFV). Perbandingan data sitometri massa dengan data transkriptom yang dapat diakses publik untuk tipe sel yang didefinisikan secara fenotipik yang sama (GSE42414 34) (Gambar 1B tambahan; Tabel 7) mengungkapkan korelasi positif yang signifikan dengan probe dalam data Illumina untuk 21 dari 40 protein yang diperiksa (median r = 0,51; rentang interkuartil, 0,35-0,60 untuk probe / penanda berkorelasi positif). Semua penanda yang tersisa tidak memiliki korelasi atau korelasi negatif (Gambar 3 tambahan), menyoroti informasi baru yang diperoleh dari menganalisis kadar protein daripada tingkat transkrip. 21303135

Profil molekuler 2 dimensi yang diperoleh untuk masing-masing dari 8 fenotip yang didefinisikan secara konvensional dapat dipisahkan dalam penyisipan stochastic tetangga yang disebarkan t-SNE (t-SNE) [19659090] 3637 space (Gambar 3A) (P nilai <0,001 di kedua dimensi t-SNE, Kruskal-Wallis rank sum test) dan menunjukkan banyak asosiasi yang diantisipasi (misalnya, GATA1 dengan MEP, 3839 C / EBPα dengan GMP, 4041 PAX5 dengan pra-B / NK dan MLP 42) (Gambar 3B; Gambar tambahan 4). Ketika distribusi protein keseluruhan dianalisis, keterkaitan populasi fenotipik juga umumnya seperti yang diharapkan, termasuk tingkat tumpang tindih yang tinggi antara GMP dan fenotipe pra-B / NK (median, 64%; kisaran interkuartil, 61% -66%) , konsisten dengan bukti fungsional dari keterkaitan mereka 13 (Gambar 3C). Namun demikian, penyimpangan yang signifikan dari unimodality hadir di semua himpunan bagian (tes Hartigan, Holm-koreksi P <0,01 dalam dimensi ≥1) dan sangat menonjol dalam fenotipe CMP di mana 5 mode dapat dengan mudah dibedakan. (Gambar 5A tambahan). Beberapa mode ini mengidentifikasi sel yang mengekspresikan GATA1 tingkat tinggi dan tingkat PU.1 dan C / EBPα yang lebih rendah, dan yang lainnya memiliki profil yang berlawanan (Gambar 5B tambahan). Ekspresi yang lebih tinggi dari CD71 juga dicatat dalam CMP-GATA1-tinggi, dengan ekspresi yang lebih tinggi dari CD114 (reseptor G-CSF), CD33, dan CD133 dalam CMP-tinggi CM.1 (tambahan Gambar 5C). Hasil yang terakhir ini mendukung konsep bahwa CB CMP terdiri dari campuran himpunan bagian molekul yang berbeda, termasuk beberapa dengan potensi erythropoietic atau granulopoietic. 14 Menariknya, sejumlah perantara pensinyalan juga menunjukkan distribusi diferensial di seluruh lanskap t-SNE dengan perbedaan yang signifikan antara fenotipe.

Gambar 3.

Fenotipe nenek moyang menunjukkan profil molekul yang berbeda tetapi tumpang tindih. (A) distribusi t-SNE ditentukan dari tingkat permukaan yang berbeda dan penanda intraseluler untuk masing-masing lin CD34 + dianalisis fenotip CB.Peningkatan kepadatan sel diindikasikan dengan meningkatnya intensitas warna. Kontur hitam menggambarkan kuantil ke-75 dari distribusi kepadatan keseluruhan. Plot untuk CD34 + CD38 subpopulasi ditunjukkan di sebelah kiri, dan untuk subpopulasi CD34 + CD38 +di sebelah kanan. (B) Level relatif berbeda TFs (kiri) dan protein pemberi sinyal (kanan) melintasi distribusi t-SNE dari semua sel CD34 + dianalisis. (C) t-SNE d distribusi untuk fenotipe alternatif ditunjukkan dalam (A). Panel paling kanan menunjukkan pengelompokan hierarkis dari semua populasi yang ditentukan secara fenotip (8 fenotipe konvensional ditambah 3 fenotipe baru) berdasarkan perbedaan berpasangan dalam distribusi kepadatannya. HSC, sel-sel induk hematopoietik.

Kami juga menganalisis kembali data sitometri massa berdasarkan fenotipe yang lebih terbatas pada garis keturunannya (Gambar 3C). However, even these remained significantly multimodal (Hartigan’s Dip test, Holm-corrected P < .001 in ≥1 t-SNE dimension). However, despite the overall heterogeneity in the protein profiles of all phenotypes analyzed, their interrelatedness (derived from pairwise calculations of the overlap of their molecular properties in the t-SNE distributions) was similar to the expected hierarchical structure. Importantly, these results were consistent even when the data for each CB sample were analyzed individually (congruence among distance matrices test, a permutation-based test for concordance among distance matrices,43 Holm-corrected P < .001 for all samples).

To test whether the observed molecular relatedness/heterogeneity might be an artifact of the analytical methods used, we also subjected the same data to pairwise correlation analyses, hierarchical clustering, principal component analysis, and iso- and diffusion mapping. For these tests, a spiked-in CD34CD33CD45RA+ cell population of mature lymphoid cells (designated as B/T) was included to serve as an out-group. In all tests, the mature B/T cells were separated from the entirety of the CD34+ cells, with the latter still remaining poorly resolved (supplemental Figure 6). The poor resolution of the linCD34+ cells into subsets was also not improved by increasing the number of dimensions.

To investigate the major proteomic contributors to the heterogeneity seen in the t-SNE data for the 8 conventionally defined linCD34+ CB cell phenotypes, we also examined the various classes of markers assessed separately or together in groups. As anticipated, a good separation between the designated phenotypes was observed when the analysis was confined to the surface marker data (Figure 4). However, addition of the TF data to the surface marker data decreased rather than improved the resolution of subsets (Holm-corrected P < .001), and exclusive analysis of TF levels, or of the signaling intermediates, yielded similar relationships between populations to the overall data set (congruence among distance matrices test, Holm-corrected P < .01), albeit with reduced coherence.

Figure 4.

Lineage information is contained in multiple protein parameters, including signaling states. (A) t-SNE distributions obtained using all 40 analyzed parameters; TFs only (GATA3, PAX5, PU.1, TAL1, CEBPα, and GATA1); surface markers only (CD45RA, CD71, CD45, CD114, CD123, CD34, CD33, CD49f, CD10, CD135, CD38, CD90, HLADR, and CD133); intracellular markers only (pSHP2, GATA3, pCRKL, pSrc, pACC, Cyclin B1, PAX5, PU.1, pSTAT5, pAKT, pSTAT1, pSMAD2/3, pP38, pSTAT3, pMAPKAPK2, IκBα, pCREB, active β-catenin, pERK1/2, Ki67, pSykZap70, TAL1, CEBPα, pS6, GATA1, and peEF2); active signaling intermediates (pSHP2, pCRKL, pSrc, pACC, pSTAT5, pAKT, pSTAT1, pSMAD2/3, pP38, pSTAT3, pMAPKAPK2, IκBα, pCREB, active β-catenin, pERK1/2, pSyk/Zap70, pS6, and peEF2), or surface markers together with TFs. (B) Hierarchical clustering of phenotypically defined populations based on pairwise differences in each of their t-SNE distributions from (A).

Integration of molecular and cell output data identifies broad groupings of cells with different lineage potentials

We then questioned how linCD34+ CB cells with distinct differentiation properties in the MC/STC assays would be distributed in the molecular space described by the mass cytometric data obtained on the entire linCD34+ cell compartment. For this analysis, we defined groups of cells according to their lineage outputs and used a k-nearest (10) neighbor algorithm approach to identify probability distributions in the t-SNE space of the molecular properties of each group of cells.21 This approach revealed a general separation of the cells that produced different types of colonies in the MC assays, with the exception of those with GM-restricted activity but variable proliferative ability, and those that generated pure Eos and blast colonies (false discovery rates ≤0.01 in ≥1 t-SNE dimension) (Figure 5A). In addition, all of these distributions were unimodal in both bioassays (P > .05 in both t-SNE directions, Hartigan’s dip test) (Figure 5A-B), with the exception of cells that were not clonogenic or that produced exclusively CD34+ progeny. Cells with multilineage outputs in STC were centrally located and highly overlapping in the t-SNE space (Figure 5B; supplemental Figure 7A). Resampling-based robustness analyses revealed the distributions for all types of progenitors to be highly reproducible (80% to 95% for most), although less so for rarer types, as expected for small data sets (supplemental Methods; supplemental Figure 7B-C).

” data-icon-position=”” data-hide-link-title=”0″>Figure 5.

Figure 5.

Functionally defined progenitors with NM, L, and/or E potential display partially overlapping molecular profiles. (A-B) Distribution of each progenitor type in t-SNE space. Index sort information was used to map each progenitor to its nearest 10 neighbors in the mass cytometry data based on the scaled intensity of expression of CD45RA, CD71, CD45, CD123, CD34, CD33, CD49f, CD10, CD135, CD38, CD90, HLA-DR, and CD133. The nearest neighbors for all members of a given progenitor type were pooled and used to generate a probability density, indicated by the intensity of the color shown. The lowest level contains 95% of the total probability density, with each higher 10% density levels indicated thereafter. The black contour shows the 75th quantile of the overall density. (A) Mappings for all progenitor types assessed visually in methylcellulose assays as shown in Figure 1B. (B) Mappings for a representative selection of lineage competencies assessed in the STC assays as shown in Figure 1C. (C) A hierarchical clustering of the progenitor types analyzed based on a pairwise assessment of differences in the density distributions between all mappings of functionally and phenotypically defined cell types. Closely related groups are highlighted and given a descriptive name. (D) Multidimensional scaling indicating the relative distances (based on the distribution differences) between all phenotypically and functionally defined progenitor subsets.

We then compared the distribution of the 8 surface marker–defined conventional phenotypes and our newly described progenitors (P-E, P-NM, and P-L) with the mass cytometrically identified groups of cells with different functionally identified lineage output abilities. This comparison revealed a number of distinct groupings and some newly defined associations. One of the latter was an “early” cluster that included MPPs, Eos-restricted progenitors, and a subset of STC-initiating cells that generated only CD34+ progeny and was localized between the erythroid/Mk and mixed lineage clusters (Figure 5C-D). In addition, cells with E potential in the MC or STC were found to cluster with MEPs but were also related as a group closer to the erythroid/MK cluster, and more distantly to the other clusters. Cells with mixed-lineage or L-only potential clustered together, as did those with predominantly NM-restricted outputs in the bioassays. Interestingly, the GMPs, LMPPs, MLPs, and pre–B/NK phenotypes all clustered away from all of the functionally defined cells, suggesting that many of the cells with these latter phenotypes may lack clonogenic activity in the assays performed.

Differences in CD34+ CB cell lineage output capabilities are associated with coordinate changes in signaling, cell cycle status, and TF expression

Mapping of the functionally defined groups of cells from the MC/STC assays onto our 40-parameter molecular map to identify parameters associated with cells capable of different lineage output types confirmed elevated expression of CD135, CD45RA,6 CD133,13 PU.1, and C/EBPα to be associated with NM (± B/T) potential; elevated CD10 with B-restricted activity,8,18 and CD71 and GATA1 with E potential44,45 (supplemental Figure 8-10). Differences in levels of CD34, CD38, and CD33 expression between progenitor types were also evident, with notably higher CD38 expression on cells with restricted E or NM potential. Lineage outputs were also significantly associated with certain active signaling intermediates and indicators of cell cycle status. This finding included increased levels of phosphorylated eEF2 and active (dephosphorylated) β-catenin as selective features of E progenitors.

We then used pseudo-temporal ordering to infer paths of differentiation in the overall t-SNE plot starting from cells that produce only CD34+ cells (and no differentiated cells) within 3 weeks in STC to a final E-restricted, NM-restricted, or B-lymphoid–restricted state (Figure 6A). Bootstrap resampling revealed that the fits obtained were highly reproducible in repeatedly resampled data for each trajectory. The results showed numerous parameter levels changed markedly and differentially across the 3 trajectories (Figure 6B-D). The transition to an E-restricted state was the most complex with different parameter-specific dynamics, some of which increased, others that decreased, and a large group that decreased initially and then increased. In contrast, restriction to NM activity showed a unilateral increase in most parameters, and restriction to B-lymphopoiesis was associated with a progressive decrease in most parameters, with subtle increases in a few. Notably, all 3 trajectories were accompanied by an increase in Ki67, suggesting that progressive emergence from deep quiescence is a shared aspect of multiple lineage restriction processes.

Figure 6.

Molecular transitions reveal that changes in signaling and cell cycle parameters accompany TF alterations. (A) Pseudo-time axes for transitions between cells that produced CD34+ cells but no mature cells in STC, to STC-E (left), STC-NM (middle), and STC-B (right). Areas enclosing the most probable regions (minimum area containing 15% of the total probability density) of cells with these lineage capabilities are indicated. Start and end points were set as the most probable point in the first category and the progenitors of single lineages, respectively. (B-D) Normalized levels of each intracellular marker are shown across 100 bin s of pseudo-time in the left plots. Bin values represent the median level of a given marker for all cells within that pseudo-time bin. Single cells, colored based on their most probable lineage outputs, are shown for the 4 markers that differ the most over pseudo-time in the left plots (highest residuals). Solid violet lines indicate best fits for either linear, sigmoidal, or Gaussian regressions (fit selected by using the Bayesian Information Criterion). Fits from 1000 bootstrap replicates of 1% of the total cells are shown as faint violet lines to indicate a probable range. Transitions from cells that produced only CD34+ progeny in STC to STC-E are shown in (B), to STC-NM in (C), and to STC-B in (D).

Changes in TF levels in these trajectories included previously reported reciprocal changes in GATA1 and PU.1 levels during the early differentiation of E progenitors4649 (Figure 6B; supplemental Figure 11) and a late activation of TAL1 after the acquisition of peak GATA1 levels, consistent with the reported role of TAL1 in terminal erythropoiesis.50 Unexpectedly, changes immediately preceding GATA1 activation included fluctuations in phospho-eEF2 and active β-catenin (Figure 5B), PKA and MAPK intermediates phospho-STAT5, and phospho-STAT3. This analysis also showed associated early increases in PU.1 and then CEBP/α leading to an NM-restricted state49,51 (Figure 6C; supplemental Figure 12), with an inverse pattern accompanying B-lymphoid restriction (Figure 6D; supplemental Figure 13). Interestingly, this latter sequence was not accompanied by an increase in PAX5, which was, however, evident in the trajectory to NM-restricted cells and was associated with cells having NM+T-precursor or NM+B potential (supplemental Figure 10). NM restriction was also associated with an increase in phospho-CRKL along with all 3 phospho-STATs. Several MAPK intermediates and β-catenin also showed increasing activation with initiation of differentiation, but this finding did not extend to PKA intermediates. In contrast, during B-lymphoid restriction, the levels of most signaling intermediates decreased, except for minimal changes in the phospho-STATs and an early transient increase in phospho-SMAD2/3, followed by a decrease in IκBα (suggestive of activated NF-κB signaling).

Discussion

The present study integrated measurements of the differentiation activity and the levels of 40 proteins determined in large numbers of single cells drawn randomly from the entire CD3CD19CD11bCD34+ population present in normal human CBs. Key to this analysis was the use of a 3-week, growth factor–supplemented, stromal cell–containing culture system that supports the identification of single-input CD34+ cells able to produce any combination of most of the major blood cell lineages. Computational mapping of index-sorted cells to their mass cytometry profiles then allowed a deep interrogation of the relationships between differentiation potentials and molecular states at the single-cell level. The results provide new evidence of extensive promiscuity in the lineage outputs of phenotypes still widely used to isolate cells assumed to have a relatively homogeneous set of lineage potentialities. They also made possible the identification and validation of new phenotypes that reproducibly allow CB progenitors with more consistent differentiation potentials to be isolated. Use of these in a pseudo-temporal ordering approach to identify molecularly defined differentiation trajectories strongly suggests coherent changes in signaling intermediates as consistent aspects of the hematopoietic lineage restriction processes assessed.

The proteomic and functional heterogeneity of conventionally used phenotypes highlight the need for caution in interpreting data derived from their bulk-level analysis. This problem was exemplified in extreme form by the CMP phenotype, which comprises most of the CD34+ compartment and where at least 5 distinct subsets with features expected of either E or NM progenitors, but not both, could be readily discriminated. Interestingly, we detected very few linCD34+ CB cells that produced E+NM progeny that did not also generate detectable L cells. These results thus confirm and extend recent similar findings for cells defined as mouse,15,16,52 as well as human, CMPs.14 They also now provide a molecular explanation for the recent report that most cells capable of differentiating into all lineages have an MPP rather than a CMP phenotype. From our survey of the differentiation potential exhibited by >1000 single index-sorted cells, we observed a number of combinations of lineage potencies outside currently described hierarchical models. Conversely, we confirmed that a high expression of CD38 enables progenitors lacking lymphopoietic activity to be separated from others (Figure 2A; supplemental Figure 10), and a high expression of CD71 selects for progenitors with E potential (supplemental Figure 7C).14,18,32,44,53 Together with various recent single-cell studies, these results suggest that although surface marker phenotypes may enrich for different lineage potencies, the sequences of events underlying lineage restriction may not be adequately described at a molecular level by global bifurcations.4,5

Assuming CD34+ CB cells can be modeled as a nonsynchronized population at equilibrium, the frequency of those in a given molecular state might be considered to be proportional to the stability of that state. Based on this assumption, we generated a model of neonatal hematopoietic differentiation states from the density of progenitors present in the multidimensional space defined by the 40 different molecular features analyzed (Figure 7). Importantly, this model does not reveal highly discriminated states or trajectories within the linCD34+ population. Rather, it suggests shallower barriers delimiting distinct differentiation behaviors than previously anticipated, related in part to the history of environmental cues encountered at each stage. Consistent with this model is the finding that the probability densities between all functionally defined subsets are highly overlapping, including those displaying single lineage-restricted outputs. These observations underscore the possibility that relatively small molecular variations may result in lineage restriction. Indeed, one of the more novel findings here is the close association noted between changes in signaling profiles and lineage potential. These results extend previous limited evidence that environmental factors may play an influential role during the process of lineage restriction.54,55 More detailed investigation of the extent and nature of such influences will be an important challenge for the future.

Figure 7.

A schematic representation of the molecular landscape of human CD34+CB cell differentiation. Contours shown are derived from the molecular data using the inverse of the cell density in t-SNE space to estimate the stability of different molecular states. Annotation was added based on functional mapping data. Arrows indicate the multidirectional paths that could be taken from primitive to more restricted differentiation states based on the experimental data.