PLoS One: Αποκρυπτογράφηση Γονιδιωματική Τροποποιήσεις στον Καρκίνο του παχέος εντέρου μέσω Μεταγραφική Δευτερεύων-Based Analysis


Δίκτυο

Αφηρημένο

Τόσο η μεταγραφική υποτύπου και σηματοδότηση αναλύσεις του δικτύου έχουν αποδειχθεί χρήσιμη στην έρευνα για τον καρκίνο γονιδιωματικής. Ωστόσο, οι δύο αυτές προσεγγίσεις εφαρμόζονται συνήθως σε απομόνωση σε υπάρχουσες μελέτες. Έχουμε λόγο ότι αποκρυπτογράφηση γονιδιωματικής αλλαγές με βάση τον καρκίνο μεταγραφική υποτύπους μπορεί να βοηθήσει να αποκαλύψει δίκτυα οδηγό υποτύπου-ειδική και παρέχει γνώσεις για την ανάπτυξη εξατομικευμένων θεραπευτικών στρατηγικών. Σε αυτή τη μελέτη, ορίσαμε μεταγραφική υποτύπους για τον ορθοκολικό καρκίνο (CRC) και ταυτοποιείται οδηγός δίκτυα /οδοί για κάθε υπότυπο. Εφαρμόζοντας συναίνεση ομαδοποίηση σε μια ομάδα ασθενών με 1173 δείγματα εντοπίστηκαν τρεις μεταγραφικές υποτύπους, οι οποίες επικυρώθηκαν σε μια ανεξάρτητη ομάδα με 485 δείγματα. Οι τρεις υπότυποι χαρακτηρίστηκαν από διαφορετικές μεταγραφικές προγραμμάτων που σχετίζονται με φυσιολογικό ενήλικα παχέος εντέρου, του παχέος εντέρου νωρίς την εμβρυϊκή ανάπτυξη, και επιθηλιακά μεσεγχυματικά μετάβαση, αντίστοιχα. Έδειξαν επίσης στατιστικά διαφορετικές κλινικές εκβάσεις. Για κάθε υπότυπο, θα χαρτογραφηθεί σωματικών δεδομένων μετάλλαξης και μεταβολή του αριθμού αντιγράφων σε ένα ολοκληρωμένο δίκτυο σηματοδότησης και προσδιορίζονται υποτύπου ειδικά δίκτυα οδηγό χρησιμοποιώντας ένα τυχαίο στρατηγική πόδια που βασίζεται. Βρήκαμε ότι γονιδιωματική αλλοιώσεις στο μονοπάτι σηματοδότησης Wnt ήταν κοινά μεταξύ όλων των τριών υποτύπων? Ωστόσο, μοναδικούς συνδυασμούς αλλαγών συμπεριλαμβανομένων μονοπατιού Wnt, VEGF και Notch οδήγησε διακριτές μοριακές και κλινικών φαινοτύπων σε διαφορετικούς υποτύπους CRC. Τα αποτελέσματά μας παρέχουν ένα συνεκτικό και ολοκληρωμένο εικόνα της ανθρώπινης CRC που συνδέει γονιδιωματικής αλλαγές στις μοριακές και κλινικές συνέπειες, και το οποίο παρέχει πληροφορίες για την ανάπτυξη εξατομικευμένων θεραπευτικών στρατηγικών για διαφορετικούς υποτύπους CRC

Παράθεση:. Zhu J, Wang J , Shi Ζ, Franklin JL, Deane NG, Coffey RJ, et al. (2013) Αποκρυπτογράφηση Γονιδιωματική Τροποποιήσεις στον Καρκίνο του παχέος εντέρου μέσω της Ανάλυσης Δικτύων Μεταγραφική Δευτερεύων-βάση. PLoS ONE 8 (11): e79282. doi: 10.1371 /journal.pone.0079282

Συντάκτης: Amanda Ewart Toland, Πολιτειακό Πανεπιστήμιο του Οχάιο Medical Center, Ηνωμένες Πολιτείες της Αμερικής

Ελήφθη: 19, Αύγ του 2013? Αποδεκτές: 20 Σεπτέμβρη του 2013? Δημοσιεύθηκε: 15 Νοέμβρη, 2013

Copyright: © 2013 Zhu et al. Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της άδειας χρήσης Creative Commons Attribution, το οποίο επιτρέπει απεριόριστη χρήση, τη διανομή και την αναπαραγωγή σε οποιοδήποτε μέσο, ​​με την προϋπόθεση το αρχικό συγγραφέα και την πηγή πιστώνονται

Χρηματοδότηση:. Χρηματοδότηση από Ηνωμένες Πολιτείες Υπηρεσία Δημόσιας Υγείας χορηγεί GM088822, CA126479, CA159988, CA095103, CA069457, DK052334 και CA068485. Οι χρηματοδότες δεν είχε κανένα ρόλο στο σχεδιασμό της μελέτης, τη συλλογή και ανάλυση των δεδομένων, η απόφαση για τη δημοσίευση, ή την προετοιμασία του χειρογράφου

Αντικρουόμενα συμφέροντα:.. Οι συγγραφείς έχουν δηλώσει ότι δεν υπάρχουν ανταγωνιστικά συμφέροντα

Εισαγωγή

Καρκίνος του παχέος εντέρου (CRC) είναι μια σημαντική αιτία της παγκόσμιας νοσηρότητας καρκίνου [1]. Κατά τη διάρκεια των τελευταίων τριών δεκαετιών, μοριακές γενετικές μελέτες έχουν αποκαλύψει κάποιες κρίσιμες μεταλλάξεις που διέπουν την παθογένεια της CRC [2]. Πρόσφατα, με την ανάπτυξη τεχνολογιών προσδιορισμού αλληλουχίας υψηλής απόδοσης, χιλιάδες γενετικές αλλαγές έχουν εντοπιστεί στη CRC. Εκτός από έναν περιορισμένο αριθμό γνωστών συχνά-μεταλλαγμένα ογκογονίδια ή γονίδια καταστολής όγκων όπως APC, KRAS, PIK3CA και ΤΡ53, ένα πολύ μεγαλύτερο αριθμό γονιδίων είναι μεταλλαγμένα σε μία χαμηλή συχνότητα [3]. Έχει προταθεί ότι οι σωματικές μεταλλάξεις που βρέθηκαν σε καρκίνους είναι είτε «οδηγοί» ή «επιβάτες» [3]. Πώς να διακρίνει τους οδηγούς από τους επιβάτες ανάμεσα σε χιλιάδες μεταλλάξεις χαμηλής συχνότητας έχει γίνει μια σημαντική πρόκληση στην έρευνα για τον καρκίνο.

Επειδή οδών και των δικτύων σηματοδότησης και όχι μεμονωμένα γονίδια ρυθμίζουν την πορεία της ογκογένεσης και της προόδου [4], αρκετές μελέτες έχουν χρησιμοποιηθεί ειδικός-επιμέλεια μονοπάτια για να βοηθήσει στην ερμηνεία υψηλής απόδοσης γονιδιωματικής αλλαγές [3], [5], [6]. Αν και χρήσιμες, οι μέθοδοι αυτές περιορίζονται από την κάλυψη και την πληρότητα των επιμελήθηκε οδών [7]. Κατά συνέπεια, οι προσεγγίσεις που βασίζονται σε δίκτυο όπως HotNet [8] και NetWalker [9] έχουν αναπτυχθεί, με την επιτυχή εφαρμογή στην ταυτοποίηση των υποδικτύων που είναι εμπλουτισμένα με γονιδιωματικές παραλλαγές [6], [10].

Δίκτυο -με βάση τις μεθόδους έχουν αρχίσει να παρέχουν ένα επίπεδο συστημάτων κατανόηση των πολύπλοκων γονιδιωματικής παραλλαγές. Ωστόσο, επειδή οι υπάρχουσες μελέτες θεωρούν συνήθως όλα τα δείγματα όγκων από κοινού, σε αντίθεση με την κανονική τους ελέγχους, έχουν την τάση να εντοπιστούν τα δίκτυα κοινής σηματοδότησης σε όλα τα δείγματα όγκων και μπορεί να αποτύχει να αντιμετωπίσει την ετερογένεια μεταξύ των γονιδιωμάτων καρκίνο.

Η μεταγραφική ανάλυση υποτύπου έχει παράσχει μεγάλη γνώσεις σχετικά με τη βιολογία της νόσου, την πρόγνωση και εξατομικευμένες θεραπευτικές ουσίες για διαφορετικούς τύπους καρκίνου [11], [12]. Είναι ενδιαφέρον ότι, αν και οι δύο μεταγραφικές υποτύπου και δίκτυο σηματοδότησης αναλύσεις έχουν αποδειχθεί χρήσιμα στην έρευνα του καρκίνου γονιδιωματικής, οι δύο αυτές προσεγγίσεις εφαρμόζονται συνήθως σε απομόνωση σε υπάρχουσες μελέτες. Έχουμε λόγο ότι αποκρυπτογράφηση γονιδιωματικής αλλαγές με βάση τον καρκίνο μεταγραφική υποτύπους μπορεί να βοηθήσει να αποκαλύψει δίκτυα οδηγό υποτύπου-ειδική και παρέχει γνώσεις για την ανάπτυξη εξατομικευμένων θεραπευτικών στρατηγικών.

Για την CRC, η TCGA (ο καρκίνος Γονιδιώματος Atlas) του δικτύου που αναφέρθηκαν πρόσφατα μια ταξινόμηση των τριών μεταγραφικών υποτύπους, που ονομάζεται ως «MSI /CIMP», «Επεμβατική», και «CIN», αντίστοιχα [13]. Ωστόσο, η ανάλυση περιορίζεται από διάφορους παράγοντες. Πρώτον, οι υπότυποι ταυτοποιήθηκαν από μια σχετικά μικρή ομάδα ασθενών με μόνο 220 δείγματα και δεν ανεξάρτητη επικύρωση πραγματοποιήθηκε, αφήνοντας τη γενικότητα της ταξινόμησης υποτύπου αναπόδεικτη. Στη συνέχεια, λόγω της έλλειψης δεδομένων επιβίωσης με αρκετό χρόνο παρακολούθησης για την ομάδα TCGA, κλινική σημασία των υποτύπων μένει να αποδειχθεί. Δεν είναι σαφές από ποια κριτήρια η «επεμβατική» υποτύπου ονομάστηκε και αν υποστηρίζεται από βιολογικά και κλινικά δεδομένα. Επιπλέον, αν και είναι πολύ ενδιαφέρον να συνδεθούν παγκόσμια γονιδιωματική χαρακτηριστικά, όπως η αστάθεια μικροδορυφόρου (MSI), CpG νησί μεθυλίωση φαινότυπο (CIMP), και χρωμοσωμική αστάθεια (CIN) με μεταγραφική υποτύπους, παραμένει μια μεγάλη πρόκληση για να μεταφράσει αυτές τις ενώσεις σε στοχευμένη θεραπευτική για διαφορετικούς υποτύπους CRC.

σε αυτή τη μελέτη, υποθέτουμε ότι οι εξαιρετικά ετερογενής γονιδιωματική αλλοιώσεις παρατηρήθηκαν σε CRC μπορεί να συγκλίνει σε ένα περιορισμένο αριθμό διακριτών μηχανισμών που οδηγούν μοναδικά πρότυπα έκφρασης γονιδίου σε διαφορετικούς υποτύπους μεταγραφική. Κατ ‘αρχάς, επεκτείναμε τα ευρήματα TCGA εκτελώντας υποτύπου ανακάλυψη βασίζεται σε δεδομένα γονιδιακής έκφρασης από 1173 δείγματα CRC όγκου συσσωρευτεί κατά τη διάρκεια της τελευταίας δεκαετίας, επικυρωμένη προσδιορίζονται υποτύπους σε μια ανεξάρτητη ομάδα με 485 δείγματα, και συνδέεται κάθε υπότυπο με τη μοναδική βιολογία και την κλινική έκβαση. Στη συνέχεια, θα χαρτογραφηθεί σωματική μετάλλαξη και την παραλλαγή αριθμό αντιγράφων (CNV) δεδομένων σε ένα ολοκληρωμένο δίκτυο σηματοδότησης και εντόπισε ένα δίκτυο οδηγό για κάθε υπότυπο. Οι συναχθεί δίκτυα και συναφείς οδών συσχετίζονται απόλυτα με κατάντη προγράμματα μεταγραφική χαρακτηριστικό για κάθε υπότυπο, παρέχοντας ισχυρές έμμεσες αποδείξεις για την αποτελεσματικότητα της προσέγγισής μας και το κύρος του συμπεράσματος μας. Με βάση τα μοναδικούς συνδυασμούς αλλαγές πορείας και τα κλινικά αποτελέσματα, έχουμε προτείνει συγκεκριμένες θεραπευτικές στρατηγικές για διαφορετικούς υποτύπους CRC.

Υλικά και Μέθοδοι

Δεδομένων και Επεξεργασία

Όπως φαίνεται στον πίνακα S1 στο αρχείο S1, δεδομένα γονιδιακής έκφρασης για 1173 δείγματα ανθρώπινου CRC είχαν κατεβάσει από τη βάση δεδομένων γονιδιακής έκφρασης Omnibus (GEO) για να χτίσει μια ομάδα ανακάλυψη. δεδομένα γονιδιακής έκφρασης για ένα επιπλέον ανθρώπινα δείγματα CRC 485 είχαν κατεβάσει από τη βάση δεδομένων GEO, η ArrayExpress Αρχείο και ο καρκίνος Γονιδιώματος Atlas (TCGA) για να δημιουργήσετε μια ομάδα επικύρωσης. Για κάθε σύνολο δεδομένων γονιδιακής έκφρασης Affymetrix, η Στιβαρό MultiChip Ανάλυση (RMA) αλγόριθμο [14] χρησιμοποιήθηκε για την επεξεργασία των δεδομένων, συμπεριλαμβανομένων των ποσοστημόριο εξομάλυνση και log2-μετασχηματισμού. Για να γίνει το επίπεδο έκφρασης συγκρίσιμα μεταξύ των συνόλων δεδομένων, μπορούμε κανονικοποιούνται περαιτέρω το επίπεδο έκφρασης του κάθε ανιχνευτή που σε κάθε δείγμα σε σχέση με το μέσο όρο της έκφρασής του σε όλα τα δείγματα με τον ίδιο σύνολο δεδομένων, αφαιρώντας το μέσο όρο του στο εν λόγω σύνολο δεδομένων από κάθε μία από τις μετρήσεις έκφρασης της [ ,,,0],15]. Όπως φαίνεται στο Σχήμα S1 σε S2 αρχείου, το επίπεδο έκφρασης απέναντι σύνολα δεδομένων είναι συγκρίσιμη μετά από αυτή την κανονικοποίηση. Στη συνέχεια, σύνολο αναγνωριστικών καθετήρα χαρτογραφήθηκαν σε σύμβολα γονίδιο με βάση το αρχείο χαρτογράφησης που παρέχονται από τις αντίστοιχες βάσεις δεδομένων. σετ καθετήρα αντιστοιχίζονται με πολλαπλά γονίδια είχαν εξαλειφθεί. Όταν πολλαπλά σετ ανιχνευτή χαρτογραφήθηκαν στο ίδιο γονίδιο, ο διάμεσος χρησιμοποιήθηκε για να αντιπροσωπεύει το επίπεδο έκφρασης γονιδίου. Για τα δεδομένα γονιδιακής έκφρασης TCGA βασίζεται σε Agilent 244 K Gene Expression μικροσυστοιχιών, Επίπεδο 3 δεδομένων γονιδιακής έκφρασης (log2 Lowess ομαλοποιηθεί (cy5 /Cy3) κατέρρευσε από το σύμβολο γονιδίων) έχουν κατεβάσει και οι τιμές έκφρασης για κάθε γονίδιο επίσης σημαίνει επίκεντρο. Επιλέχθηκαν 10481 σύμβολα γονίδιο κοινά σε όλα τα σύνολα δεδομένων για τις επόμενες αναλύσεις.

Για να διερευνηθεί μεταβολές της γονιδιακής έκφρασης σε δείγματα CRC σχέση με το φυσιολογικό βλεννογόνο δείγματα, δεδομένα γονιδιακής έκφρασης για αυτά τα 182 δείγματα κανονικοποιήθηκαν μαζί με τον αλγόριθμο RMA [14 ]. Στη συνέχεια, ομαλοποιήθηκε το επίπεδο έκφρασης του γονιδίου g σε κάθε δείγμα σε σχέση με το μέσο όρο της έκφρασής του στα πέντε φυσιολογικά δείγματα βλεννογόνου, αφαιρώντας το μέσο όρο της στα φυσιολογικά δείγματα από κάθε μία από τις μετρήσεις της έκφρασής του.

Για να χαρακτηριστεί η εμβρυϊκών ανάπτυξη του παχέος εντέρου, πραγματοποιήσαμε μια μελέτη φυσικά μικροσυστοιχιών χρόνου χρησιμοποιώντας τη καθαρών C57BL /6 (Jackson Laboratories, Bar Harbor, μΕ) ποντίκια (Gene Expression Omnibus, GSE38831). Η μελέτη αυτή πραγματοποιήθηκε σε αυστηρή συμφωνία με τη φροντίδα των ζώων και τις οδηγίες χρήσης και έγκριση της επιτροπής του Vanderbilt ζώων Φροντίδα και Χρήση (IACUC). Τα ποντίκια παρακολουθήθηκαν σε όλο το πείραμα για σημάδια δυσφορίας κατά την κανονική διάρκεια του κύκλου ζωής τους, αν και δεν υπάρχουν πειραματικές χειρισμούς αυτούς τους ποντικούς διεξήχθησαν εκτός αναπαραγωγής. Εάν ενδείξεις δυσφορίας παρατηρήθηκαν κατά την διάρκεια εβδομαδιαία παρακολούθηση, τα ποντίκια υποβλήθηκαν σε ευθανασία με ασφυξία με CO2 ακολουθούμενη από αυχενική εξάρθρωση για τη μείωση του πόνου των ζώων. Επτά δοκίμια που αντιστοιχούν στη παχέος ανάπτυξη ποντίκι από Ε13.5 να E18.5 και ενήλικες (οκτώ εβδομάδων μετά τον τοκετό) συλλέχθηκαν. Τα εμβρυϊκά συλλογή του παχέος εντέρου και η παρασκευή RNA πραγματοποιήθηκαν όπως περιγράφηκε προηγουμένως [16]. RNA δείγματα υποβλήθηκαν στο Vanderbilt Λειτουργική Γονιδιωματική κοινόχρηστο πόρο (FSGR, https://array.mc.vanderbilt.edu), όπου το RNA καθαρίζεται με τη χρήση του κιτ RNeasy (QIAGEN, & Βαλένσια, CA) και υβριδοποιήθηκε στο Affymetrix Mouse Genome 430 Πίνακες Expression 2.0 GeneChip (Santa Clara, CA) σύμφωνα με τις οδηγίες του κατασκευαστή. Ο αλγόριθμος RMA χρησιμοποιήθηκε για ομαλοποίηση των δεδομένων. σύμβολα γονιδίου ποντικού χαρτογραφήθηκαν σε σύμβολα ανθρώπινο γονίδιο από τον κατάλογο του Ανθρώπου και του ποντικιού Orthology διαθέσιμη από το ποντίκι Γονιδιώματος Πληροφορικής (https://www.informatics.jax.org/).

δεδομένα CNV και σωματικών δεδομένων μετάλλαξης για δείγματα TCGA με δεδομένα έκφραση ταιριάζει γονιδίου είχαν κατεβάσει από την ιστοσελίδα TCGA.

σηματοδότηση μονοπατιών επιμέλεια του NCI-Φύση, Cancer Cell χάρτη και REACTOME είχαν κατεβάσει από τη βάση δεδομένων Pathway Commons (τελευταία έκδοση στην Jun, 2011). μονοπάτια σηματοδότησης BioCarta είχαν κατεβάσει από το NCI Διαδρομή Αλληλεπίδραση Database (Ιούνιος, 2011). Ενσωμάτωση μονοπάτια από όλες τις παραπάνω πηγές οδήγησε σε ένα δίκτυο σηματοδότησης που περιέχει 3152 γονίδια και 47.833 άκρες. μεγαλύτερη συνιστώσα του περιείχε 3078 γονίδια και 47.772 άκρες, το οποίο χρησιμοποιήθηκε για τη συναγωγή των ανάντη υποδίκτυα οδηγού.

δικτύου

Συν-έκφραση και την Μονάδα Ανάλυσης

Με βάση την μήτρα της γονιδιακής έκφρασης με 10.481 γονίδια και 1173 δείγματα για την ομάδα ανακάλυψη, που υπολογίζονται οι συντελεστές συσχέτισης του Pearson για όλα τα ζεύγη γονιδίων 54920440. Η κατασκευή ενός δικτύου συν-έκφραση απαιτεί μια κατάλληλη επιλογή ενός κατώτατου ορίου για τους συντελεστές συσχετισμού κατά ζεύγη. Για να εξασφαλιστεί η βιολογική σημασία της κατασκευασμένης δικτύου, χρησιμοποιήσαμε μια μέθοδο γνώση καθοδηγείται για την επιλογή όριο [17]. Συγκεκριμένα, αξιολογήσαμε λειτουργική ομοιότητα μεταξύ κάθε ζεύγους των γονιδίων με βάση την οντολογία γονιδίων (GO) σχολιασμό βιολογική διεργασία, χρησιμοποιώντας τη σημασιολογική ομοιότητα του Resnik του [18]. Οι μέσες λειτουργικές ομοιότητες των ζευγών γονιδίου σε διάφορες περιοχές συσχέτιση υπολογίστηκαν και σχεδιάστηκαν (Σχήμα S2 σε S2 File). Βασισμένο στο οικόπεδο, είχε επιλεγεί ο συντελεστής συσχέτισης του Pearson απόλυτο των 0,45 για κατωφλίου επειδή μια απότομη αύξηση στην λειτουργική ομοιότητα εμφανίζεται πάνω από το όριο αυτό για τόσο θετικές όσο και αρνητικές συσχετίσεις. Με βάση τα παραπάνω κατώφλι, ένα δίκτυο γονίδιο συν-έκφραση με 8.546 γονίδια και 508.071 ακμές κατασκευάστηκε. Χρησιμοποιήσαμε προηγουμένως δημοσιευθεί Επαναληπτική Clique Καταμέτρηση (ICE) αλγόριθμο μας [17] για την αναγνώριση σχετικά ανεξάρτητες μονάδες συν-έκφραση από το δίκτυο γονίδιο συν-έκφραση (Εικόνα 1Α και Πίνακας S2 σε S1 αρχείου). Να επικεντρωθεί σε μεγάλα μεταγραφικά προγράμματα, που απαιτείται κάθε μονάδα να έχει τουλάχιστον 20 μοναδικά γονίδια.

(Α) Σχεδιασμός της μελέτης. Μια λεπτομερής περιγραφή των μεθόδων και των δεδομένων που χρησιμοποιήθηκαν στη μελέτη μπορεί να βρεθεί στον Πίνακα S2 σε File S1? (Β) Επισκόπηση της μεθόδου που χρησιμοποιήθηκε για τη συναγωγή ανάντη υποδίκτυα πρόγραμμα οδήγησης για μεμονωμένες υποτύπους.

Η

Η μεταγραφική Δευτερεύων Στοιχεία

Για τον υπότυπο ανακάλυψη, πραγματοποιήσαμε τη συναίνεση μέσο σύνδεσης ιεραρχική συσταδοποίηση [19] , με βάση γονίδια στα παραπάνω προσδιορίζονται ενότητες και όλα τα δείγματα ανακάλυψη (Σχήμα 1Α και Πίνακας S2 σε S1 File). Η ομαδοποίηση έγινε με GenePattern [20], χρησιμοποιώντας τις ίδιες παραμέτρους όπως [12]. Για τις προσδιοριζόμενες υποομάδες του CRC, SigClust διεξήχθη για να αξιολογηθεί η σημασία όλων των συνδυασμών ζεύγη [21] (Σχήμα 1Α και Πίνακας S2 σε File S1). Για τον προσδιορισμό των δειγμάτων που δεν μπορεί να εκπροσωπεί υποομάδα της καλά, αξιολογήσαμε πόσο καλά κάθε δείγμα βρίσκεται μέσα υποομάδας της. Συγκεκριμένα, για το δείγμα

i

, υπολογίσαμε

α (i)

ως η μέση απόσταση μεταξύ των

i

και όλα τα άλλα δείγματα από την υποομάδα όπου

i

ανήκει. Στη συνέχεια, η μέση απόσταση μεταξύ

i

και όλα τα δείγματα από κάθε μία από τις άλλες υποομάδες υπολογίσθηκε αντίστοιχα, και η μικρότερη μέση απόσταση,

b (i),

ταυτοποιήθηκε. Στη συνέχεια, υπολογίζεται το πλάτος σιλουέτα

s (i)

όπως ορίζεται από:

s

(

i

) = (

β

(

i

) –

μια

(

i

)) /max (

μια

(

i

),

β

(

i

)) [22]. Δείγματα με θετική αξία σιλουέτα κρατήθηκαν ως «πυρήνα» δείγματα για την αντίστοιχη υποτύπου (Εικόνα 1Α και Πίνακας S2 σε S1 αρχείου). Αυτή η ανάλυση πραγματοποιήθηκε με τη χρήση του πακέτου σιλουέτα στο R.

Κατασκευή Δευτερεύων ταξινομητή και Εκχώρηση Γονίδια Υπογραφή για κάθε υπότυπο

Χρησιμοποιήσαμε ένα πλησιέστερο συρρικνωμένο κέντρο βάρους μέθοδο ταξινόμησης, Πρόβλεψη Ανάλυση των μικροσυστοιχιών (ΡΑΜ) [23] για την κατασκευή ταξινομητές για τις παραπάνω ορίζονται υποτύπους. Τρέξαμε 10 φορές διασταυρωμένης επικύρωσης 100 φορές για να αξιολογήσει την απόδοση των ταξινομητών με διαφορετικό αριθμό γονιδίων. Για τον επιλεγμένο ταξινομητή, χρησιμοποιήσαμε τον ακόλουθο κανόνα για να εκχωρήσετε κάθε γονίδιο στο ταξινομητή σε έναν υπότυπο. Πρώτον, τα γονίδια σημαντικά τη ρυθμιζόμενη (one-ουρά του Student t-Test,

ρ

& lt? 0,05) σε ένα υπότυπο σε σύγκριση με όλες τις άλλες υποτύπους ορίστηκαν ως up-ρυθμιζόμενα γονίδια για αυτόν τον υπότυπο. Στη συνέχεια, υπόλοιπα γονίδια που ήταν σημαντικά κάτω ρυθμίζονται σε έναν υπότυπο σε σύγκριση με όλες τις άλλες υποτύπους ορίστηκαν ως γονίδια ρυθμισμένα προς τα κάτω για αυτόν τον υπότυπο. Για κάθε υπότυπο, τόσο οι up-ρυθμιζόμενα γονίδια και τα γονίδια κάτω-ρυθμίζονται θεωρήθηκαν ως γονίδια υπογραφή.

Οδηγός υποδικτύου Αναγνώριση

Εμείς χρησιμοποιηθεί ο αλγόριθμος Netwalker [9] για την αναγνώριση υποδίκτυο του οδηγού ( Σχήμα 1Α και Πίνακας S2 σε S1 αρχείου). Δεδομένου του ολοκληρωμένου δικτύου σηματοδοσίας και να αρχίσει τις πιθανότητες για κάθε κόμβο ανατίθενται με βάση την κατάσταση γονιδιωματική παραλλαγή, ο αλγόριθμος που χρησιμοποιείται το τυχαίο περίπατο με την τεχνική επανεκκίνηση [24] για τον υπολογισμό της τελικής βαθμολογίας προτεραιότητα για κάθε κόμβο με βάση τις πιθανότητες σταθερής κατάστασης. Έχουμε δημιουργήσει τις πιθανότητες έναρξης για όλα τα 3078 γονίδια που βασίζεται στη σωματική μετάλλαξη και πληροφορίες CNV για κάθε υπότυπο ξεχωριστά. Όπως φαίνεται στο Σχήμα 1 Β, υπολογίσαμε δύο δυαδικών μήτρες με βάση τα δεδομένα σωματική μετάλλαξη (1 για μη σιωπηλή μετάλλαξη, 0 για τους άλλους) και τα δεδομένα CNV (1 για γονίδια εντός κέρδη ή ζημίες περιοχές με αναλογία ≥1.2 ή ≤0.8, 0 για τους άλλους) για κάθε υπότυπο ξεχωριστά.

για να εκχωρήσετε μεγαλύτερο βάρος στην γονιδιωματική μεταβολές που παρατηρούνται σε δείγματα με λιγότερα συνολικό αριθμό των τροποποιήσεων και αλλαγών που παρατηρούνται σε πολλαπλά δείγματα, πραγματοποιήσαμε στήλη-σοφός εξομάλυνση ακολουθείται από σειρά-σοφός περιλήψεων για κάθε δυαδική μήτρα, και έτσι μετασχηματίζονται κάθε μήτρα σε ένα φορέα. Για έναν υπότυπο, ας υποδηλώσει

n

ως ο συνολικός αριθμός των γονιδίων και

m

ως ο συνολικός αριθμός των δειγμάτων. Η σωματική κατάσταση μετάλλαξης του γονιδίου

i

ορίζεται ως:

, όπου είναι η τιμή για το γονίδιο

i

στο δείγμα

ι

στη σωματική μετάλλαξη μήτρα. Ομοίως, η κατάσταση CNV του γονιδίου

i

ορίζεται ως εξής: όπου είναι η τιμή για το γονίδιο

i

στο δείγμα

ι

στη μήτρα CNV. Στη συνέχεια, και για κάθε γονίδιο συνενώθηκαν μαζί με ίσο βάρος. Ξεκινήστε την πιθανότητα για γονιδιακή

i

() Έτσι ορίζεται ως:

Για τον αλγόριθμο NetWalker, η πιθανότητα επανεκκίνηση ορίστηκε σε 0,5 και η σύγκλιση καθορίστηκε με, όπου είναι η πιθανότητα για γονιδιακή

i

στο

t

ου επανάληψη.

για την εκτίμηση της στατιστικής σημαντικότητας των βαθμολογιών για κάθε γονίδιο, κατασκευάσαμε 1000 σύνολα τυχαία Μετατεθειμένο πιθανότητες έναρξης και δημιουργούνται 1000 σύνολα των τυχαίων βαθμολογίες. Για κάθε γονίδιο στο δίκτυο, ένα τοπικό

σ

αξία υπολογίστηκε συγκρίνοντας την πραγματική βαθμολογία σε τυχαία αποτελέσματα από το ίδιο γονίδιο, και μια παγκόσμια

σ

αξία υπολογίστηκε συγκρίνοντας την πραγματική βαθμολογία σε τυχαία βαθμολογίες από όλα τα γονίδια [9]. Μια σημαντική παγκόσμια

σ

τιμή υποδεικνύει τη συνολική σημασία του κόμβου σε σχέση με την είσοδο ξεκινήσει πιθανότητες, ενώ μια σημαντική τοπική

σ

αξία εξασφαλίζει ότι η σημασία δεν είναι απλά οφείλεται στην τοπολογία του δικτύου. Για κάθε υπότυπο, η μεγαλύτερη συνεκτική συνιστώσα που σχηματίζεται από τα σημαντικά γονίδια (τοπική

σ

& lt? 0.05 και η παγκόσμια

σ

& lt? 0,05). Αναφέρθηκε ως το υποδίκτυο οδηγός

Ανάλυση επιβίωσης

καμπύλες επιβίωσης Πρότυπο Kaplan-Meier δημιουργήθηκαν για CRC υποομάδες, και η διαφορά επιβίωσης μεταξύ των ομάδων ήταν στατιστικά αξιολογήθηκε χρησιμοποιώντας τη δοκιμασία log-rank. Οι μονοπαραγοντική και πολυπαραγοντική Cox ανάλυση παλινδρόμησης αναλογικού κινδύνου χρησιμοποιήθηκαν για να αξιολογηθούν οι πιθανές ανεξάρτητους προγνωστικούς παράγοντες που σχετίζονται με την επιβίωση. Όλες αυτές οι αναλύσεις πραγματοποιήθηκαν με τη χρήση του πακέτου επιβίωσης σε R.

GO και Ανάλυση KEGG Μονοπάτια Εμπλουτισμός

GO και αναλύσεις εμπλουτισμό της οδού KEGG διεξήχθησαν χρησιμοποιώντας WebGestalt, στην οποία η υπεργεωμετρική δοκιμή χρησιμοποιήθηκε για εμπλουτισμό ανάλυση και η διαδικασία Benjamini-Hochberg χρησιμοποιήθηκε για τον έλεγχο του False Discovery Rate (FDR) [25].

Οπτικοποίηση Δίκτυο

Δίκτυα απεικονίστηκαν χρησιμοποιώντας Cytoscape [26].

Αποτελέσματα

αναγνώριση των τριών μεταγραφική υπότυποι στο CRC

Χρησιμοποιήσαμε μια καθιερωμένη μέθοδο, Συναίνεση Ομαδοποίηση [19], για την αξιόπιστη ταυτοποίηση των μεταγραφικών υποτύπων [12], [27]. Συνήθως, τα γονίδια με υψηλή διακύμανση έκφρασης σε μια ομάδα δείγμα που επιλέχθηκε για να συγκεντρωθούν τα δείγματα [28]. Αυτή η μέθοδος επιλογής γονίδιο δεν είναι σε θέση να διακρίνει τη βιολογική διακύμανση από την τεχνική της διακύμανσης. Επειδή η απορύθμιση ενός κλειδιού σηματοδοτικό μονοπάτι οδηγεί συνήθως σε συντονισμένες αλλαγές έκφρασης των κατάντη γονιδίων, ομάδες γονιδίων συν-εκφράζεται σε μια ομάδα δείγμα (modules δηλαδή συν-έκφραση) μπορεί να αντανακλά καλύτερα υποκείμενη βιολογική διακύμανση. Ως εκ τούτου, κατασκευάσαμε πρώτα ένα δίκτυο γονίδιο συν-έκφραση και ταυτοποιείται 33 μονάδες συν-έκφραση με συνολικά 1472 μοναδικών γονιδίων από μία κοόρτη ανακάλυψη με 1.173 δείγματα CRC (Πίνακας S1 σε File S1). Στη συνέχεια, θα πραγματοποιηθεί συναίνεση ομαδοποίηση χρησιμοποιώντας γονίδια από αυτές τις ενότητες, αξιολογείται η σημασία του συμπλέγματος και εντοπίστηκαν δείγματα πυρήνα για κάθε ομάδα όπως περιγράφηκε προηγουμένως [12].

Σύμφωνα με τις συναίνεση μήτρες και τα εμπειρικά αθροιστική συνάρτηση κατανομής (CDF) οικόπεδα στα σχήματα S3A και S3b στο S2 αρχείου, η σταθερότητα ομαδοποίηση αυξήθηκε σημαντικά από 2 συστάδες έως 3 συστάδες ενώ κανένας προφανής αύξηση βρέθηκε για περισσότερο από 3 συστάδες, γεγονός που υποδηλώνει ότι τα δείγματα 1173 CRC θα μπορούσε να χωριστεί σθεναρά σε τρεις ομάδες. Έχουμε αξιολογηθεί περαιτέρω η σημασία του συμπλέγματος χρησιμοποιώντας SigClust [21] και επιβεβαίωσε την στατιστική σημαντικότητα για τις τρεις συστάδες (Σχήμα S3C στο S2 αρχείου). Μετά Verhaak et al. [12], ορίσαμε τα «δείγματα πυρήνα» για κάθε υπότυπο, όπως τα άτομα με υψηλότερη ομοιότητα με τη δική τους τάξη από ό, τι σε οποιαδήποτε άλλη τάξεις και εντοπίστηκαν 985 δείγματα πυρήνα βασίζεται σε θετικά πλάτος σιλουέτα τους [22] (Σχήμα S3D στην S2 αρχείου).

Στη συνέχεια, χρησιμοποιήσαμε PAM για την κατασκευή ενός ταξινομητή για τις παραπάνω ορίζονται υποτύπους. Η συρρίκνωση της PAM εκτελεί αυτόματη επιλογή των γονιδίων και μπορεί δυνητικά να κάνει ο ταξινομητής πιο ακριβή από τη μείωση του φαινομένου της θορυβώδη γονιδίων. Το μικρότερο μέσο σφάλμα διασταυρούμενης επικύρωσης του 0,5% επιτεύχθηκε με τη χρήση όλων των 1472 γονιδίων με βάση 100 φορές από 10 φορές την επικύρωση σταυρό, γεγονός που υποδηλώνει ότι τα γονίδια θορυβώδη ίσως έχουν ήδη αφαιρεθεί σε συν-έκφραση του γονιδίου διαδικασία επιλογής της μονάδας με βάση μας. Με χαλαρή απαίτηση ποσοστό σφάλματος, ΡΑΜ ήταν σε θέση να μειώσει περαιτέρω τον αριθμό των γονιδίων στο ταξινομητή. Για παράδειγμα, όταν το ποσοστό σφάλματος αυξήθηκε σε 9%, ένα ταξινομητή με 853 γονίδια αναφέρθηκε. Οι ταξινομητές με μειωμένο αριθμό γονιδίων που συνήθως προτιμάται σε καθήκοντα κατάταξης? Ωστόσο, επειδή ένας σημαντικός στόχος της παρούσας μελέτης ήταν να κατανοήσουμε τη βιολογία υποκείμενων διαφορετικών υποτύπων, επιλέξαμε το 1472 γονίδιο ταξινομητή για να διευκολυνθεί η ανάλυση κατάντη εμπλουτισμό GO.

Χρησιμοποιώντας τη μέθοδο που περιγράφεται στο Υλικά και Μέθοδοι, βρήκαμε 449 γονίδια υπογραφή για τον υπότυπο 1 (κόκκινη γραμμή στο Σχήμα 2, με 402 γονίδια ρυθμισμένα προς τα πάνω και 47 γονίδια ρυθμισμένα προς τα κάτω), 505 γονίδια υπογραφή για υπότυπος 2 (πράσινη γραμμή στο Σχήμα 2, με 500 γονίδια ρυθμισμένα προς τα πάνω και 5 γονιδίων κατάντη ρυθμιζόμενη) και 512 υπογραφή γονίδια για τον υπότυπο 3 (μπλε γραμμή στο Σχήμα 2, με 480 γονίδια ρυθμισμένα προς τα πάνω και 32 γονίδια κάτω-ρυθμίζονται, Πίνακας S3 στο S3 αρχείου). Επιπλέον, έξι γονίδια που δεν θα μπορούσε να οριστεί ως γονίδια υπογραφής που βασίζεται σε κριτήρια μας σημάνθηκαν με μαύρη γραμμή στο Σχήμα 2 (στο πάνω μέρος του χάρτη θερμότητας).

(α) χρησιμοποιώντας τα 1.472 επιλεγμένων γονιδίων, 985 δείγματα πυρήνα στην ομάδα ανακάλυψη ήταν συγκεντρωμένα σε τρεις υποτύπους. Για κάθε υπότυπο, τα δείγματα και τα γονίδια υπογραφή σημάνθηκαν με το ίδιο χρώμα (κόκκινη γραμμή για τον υπότυπο 1, πράσινη γραμμή για τον υπότυπο 2 και μπλε γραμμή για τον υπότυπο 3). Οι βιολογικές διαδικασίες εμπλουτισμένο με γονίδια υπογραφή για κάθε υπότυπο εμφανίζονται δίπλα στα μπαρ χρώμα? (Β) Χρησιμοποιώντας την ίδια διάταξη των γονιδίων υπογραφή και υποτύπους CRC ως (Α), το πρότυπο γονιδιακής έκφρασης για τα δείγματα 485 CRC από την ομάδα επικύρωση παρουσιάστηκε.

Η

Για να ελέγξετε περαιτέρω τη βιολογική σημασία των τα γονίδια υπογραφή, υπολογίσαμε την ζεύγη λειτουργική ομοιότητα για όλα τα γονίδια σε μια υπογραφή που βασίζεται στο σχολιασμό βιολογική διαδικασία GO χρήση σημασιολογικής ομοιότητας του Resnik του [18]. Για κάθε υπογραφή, η μέση κατά ζεύγη λειτουργική ομοιότητα όλων των γονιδίων υπογραφή ήταν σημαντικά υψηλότερη από εκείνη του ίδιου αριθμού γονιδίων που επιλέγονται τυχαία από τις 1.472 γονιδίων (ρ & lt? 0,001 για τον υπότυπο 1, ρ = 0,018 για τον υπότυπο 2, και ρ = 0.001 για τον υπότυπο 3, μετάθεση test).

το μικρό σφάλμα διασταυρούμενης επικύρωσης στην ανάλυση PAM, διακριτικό πρότυπα έκφρασης για κάθε υπότυπο, όπως φαίνεται στο Σχήμα 2, και σημαντική λειτουργική συνοχή των γονιδίων υπογραφή για κάθε υπότυπο υποδεικνύει ότι CRC υπότυπος κατάταξη μας είναι τόσο ακριβή και καλά υποστηρίζεται από διακριτά πρότυπα έκφρασης των λειτουργικά σχετικών γονιδίων υπογραφή.

για να συγκρίνετε προσέγγιση ενότητα που βασίζεται σε συν-έκφραση μας για την επιλογή γονιδίων με τη μέθοδο του μονού γονιδίου που βασίζεται, επαναλάβαμε η ανωτέρω ανάλυση ομαδοποίηση με βάση τον ίδιο αριθμό γονιδίων (1472) με το μεγαλύτερο διάμεσο απόλυτη απόκλιση μεταξύ των 1173 δειγμάτων. Σε σύγκριση με τη μέθοδο μας, η μέθοδος ενός μόνο γονιδίου που βασίζεται δημιουργείται μεγαλύτερο μέσο σφάλμα διασταυρούμενης επικύρωσης στην ανάλυση PAM (2% έναντι 0,5%). Επιπλέον, οι περισσότεροι από τους υποτύπου ειδικών υπογραφές που παράγονται με τη μέθοδο του μονού γονιδίου που βασίζονται δεν έδειξε σημαντική λειτουργική συνοχή σε σύγκριση με τυχαίες λίστες γονιδίων του ίδιου μεγέθους.

Επικύρωση των τριών υποτύπων CRC σε ένα ανεξάρτητο κοόρτης

Για την επικύρωση των υποτύπων CRC ανακαλύφθηκαν παραπάνω, έχουμε συντάξει ένα ανεξάρτητο σύνολο δεδομένων γονιδιακής έκφρασης με 485 δείγματα CRC από έξι πρόσθετων πόρων (Πίνακας S1 στο αρχείο S1). Ο υπότυπος ετικέτες των δειγμάτων επικύρωσης προβλέφθηκαν χρησιμοποιώντας το παραπάνω κατασκευάζονται ταξινομητή PAM με τις πιθανότητες για μεμονωμένα δείγματα που παρέχεται στον Πίνακα S4 σε S3 αρχείου. Χρησιμοποιώντας την ίδια διάταξη των γονιδίων και των υποτύπων CRC όπως αυτά που χρησιμοποιούνται στο Σχήμα 2Α, η γονιδιακή έκφραση για τα 485 δείγματα από το σύνολο επικύρωσης οπτικοποιήθηκε στην Εικόνα 2Β. Μια οπτική σύγκριση μεταξύ Εικόνες 2Α και 2Β δείχνει ότι οι τρεις υπότυποι του CRC που προσδιορίζονται στο σύνολο ανακάλυψη μπορεί να ανακαλύψει πάλι γερά στο σύνολο δεδομένων επικύρωσης.

Κατεύθυνση γονιδιακής έκφρασης Αλλάζει

Για την ταυτοποίηση του υποτύπου, εστιάσαμε στις σχετικές μεταβολές της γονιδιακής έκφρασης σε όλα τα δείγματα όγκων. Για να διευκρινιστεί περαιτέρω η απόλυτη κατεύθυνση των αλλαγών γονιδιακής έκφρασης, συγκρίναμε την έκφραση των γονιδίων υπογραφή σε κάθε υπότυπο CRC με την έκφραση τους σε φυσιολογικά δείγματα βλεννογόνου του παχέος εντέρου. Όπως φαίνεται στο Σχήμα 3Α και στον Πίνακα S5 στο File S1, σε γενικές γραμμές, τα γονίδια υπογραφή για τον υπότυπο 1 ήταν πάνω ρυθμισμένα σε υπότυπο 1 αλλά κάτω-ρυθμίζονται σε υποτύπου 2 και 3 σε σύγκριση με το φυσιολογικό. γονίδια Υπογραφή για υπότυπο 2 ήταν σαφώς κάτω-ρυθμίζονται σε υποτύπους 1 και 3 σε σύγκριση με το κανονικό, αλλά η ρύθμιση προς τα κάτω ήταν ασθενέστερη σε υπότυπο 2. γονίδια Υπογραφή για υπότυπο 3 ήταν πάνω ρυθμισμένα σε όλα τα δείγματα CRC σύγκριση με τα φυσιολογικά, με το ισχυρότερη πάνω ρύθμιση που παρατηρήθηκε για τον υπότυπο 3 και μόνο μέτρια ανοδική ρύθμιση που παρατηρήθηκε για τον υπότυπο 2. Παρόμοια τάση παρατηρήθηκε κατά τη σύγκριση των δειγμάτων TCGA από την ομάδα επικύρωση με 22 φυσιολογικά δείγματα από TCGA.

(Α) Έκφραση της υπογραφής γονιδίων σε τρεις υποτύπους CRC σε σύγκριση με την έκφραση σε φυσιολογικά δείγματα. Ο χάρτης θερμότητα βασίστηκε σε 1.472 επιλεγμένα γονίδια, και η έκφραση του γονιδίου του συνόλου δεδομένων GSE17536 με 177 ανθρώπινα δείγματα CRC και πέντε κανονικές δείγματα βλεννογόνου. (Β) Η συσχέτιση μεταξύ του προτύπου έκφρασης του γονιδίου τριών υποτύπων CRC και το πρότυπο έκφρασης των διαφορετικών σταδίων ανάπτυξης του παχέος εντέρου ποντικού βασίζεται σε γονίδια που σχετίζονται ώρα. Η χρονοσειρών αναφέρονται στον οριζόντιο άξονα, ενώ οι συντελεστές συσχέτισης Pearson έδειξε στον κάθετο άξονα (Points αντιπροσωπεύουν συντελεστές συσχέτισης Pearson, μπάρες αντιπροσωπεύουν διαστήματα εμπιστοσύνης 95%). (Γ) Η έκφραση των γονιδίων υπογραφή EMT σε τρεις υποτύπους CRC.

Η

Μοναδικές Βιολογίας του Καρκίνου για διαφορετικούς CRC υπότυποι

Έχει προταθεί ότι CRC ογκογένεση και την εξέλιξη ανακεφαλαιώνει την εμβρυϊκή ανάπτυξη και επιθηλιακών μεσεγχυματικά μετάβασης (EMT) προγράμματα [29], [30]. Να αποκτήσουν γνώσεις σχετικά με την βιολογική έννοια των τριών υποτύπων CRC, ερευνήσαμε έκφραση γονιδίων των τριών υποτύπων εντός των πλαισίων της φυσιολογικής ανάπτυξης του παχέος εντέρου και EMT.

Κατ ‘αρχάς, έχουμε δημιουργήσει ένα σύνολο δεδομένων γονιδιακής έκφρασης (βλέπε Υλικά και Μέθοδοι ) της φυσιολογικής ανάπτυξης του παχέος εντέρου ποντικού (Ε13.5-E18.5 και ενηλίκων) και ορίζονται τα γονίδια συνδέονται με την ανάπτυξη, όπως τα γονίδια top1000 με τη μεγαλύτερη μέση απόλυτη απόκλιση μεταξύ των διαφόρων χρονικών σημείων μεταξύ εκείνων με υψηλή συσχέτιση με αναπτυξιακά χρονικά σημεία (απόλυτη Spearman συντελεστής συσχέτισης & gt? 0,9). Με βάση τα γονίδια συνδέονται με την ανάπτυξη, αξιολογήσαμε τη συσχέτιση μεταξύ των προτύπων έκφρασης διαφορετικών υποτύπων CRC και διαφορετικά αναπτυξιακά χρονικά σημεία. Συγκεκριμένα, για κάθε ζεύγος CRC υποτύπου και αναπτυξιακών χρονικό σημείο, υπολογίσαμε συντελεστή συσχέτισης του Pearson μεταξύ του υποτύπου κεντροειδή των γονιδίων συνδέονται με την ανάπτυξη και τα επίπεδα έκφρασης των ίδιων γονιδίων στο χρονικό σημείο. Όπως φαίνεται στο Σχήμα 3Β, τα πρότυπα γονιδιακής έκφρασης του υποτύπου 3 (μπλε γραμμή) ήταν περισσότερο παρόμοια με εκείνη του πρώιμου σταδίου ανάπτυξης του παχέος εντέρου ποντικού ενώ πρότυπο έκφρασης γονιδίου του υποτύπου 2 (πράσινη γραμμή) ήταν πιο παρόμοια με εκείνη του ενήλικου παχέος εντέρου. Σταθερά, GO ανάλυση εμπλουτισμό έδειξε ότι ο υπότυπος 3 υπογραφή ήταν σημαντικά εμπλουτισμένη με γονίδια στις διαδικασίες πολλαπλασιασμού που σχετίζονται, όπως του κυτταρικού κύκλου (FDR = 9.95 × 10

-24), η διαδικασία του μεταβολισμού DNA (FDR = 9,18 × 10

-12) και μεταβολική διαδικασία mRNA (FDR = 2,63 × 10

-7) (Σχήμα 2). Είναι καλά γνωστό ότι η πρώιμη εμβρυϊκή ανάπτυξη χαρακτηρίζεται από τον πολλαπλασιασμό των κυττάρων ταχεία. Από την άλλη πλευρά, ο υπότυπος 2 υπογραφή ήταν σημαντικά εμπλουτισμένη με γονίδια που εμπλέκονται σε διαφοροποιημένα λειτουργίες που απαιτούνται για ένα πιο ώριμο στάδιο ανάπτυξης, όπως συστολή λείου μυός (FDR = 7.00 × 10

-4) και νευρολογικές διαδικασία συστήματος (FDR = 1.56 × 10

-14). Αυτά τα γονίδια καταστέλλονται σε αδιαφοροποίητα εμβρυϊκά κύτταρα [31], το οποίο ήταν σε συμφωνία με σημαντικά μειωμένη έκφραση τους σε 3 αλλά δεν υπότυπος 2 (Σχήμα 3Α). Λαμβανόμενα μαζί, αυτά τα αποτελέσματα υποδηλώνουν ότι υπότυπος 3 όγκοι επανενεργοποιηθεί τα αναπτυξιακά προγράμματα γονιδιακής έκφρασης νωρίς κόλον, ενώ τον υπότυπο 2 όγκοι διατηρήθηκαν καλύτερα προγράμματα γονιδιακή έκφραση σε φυσιολογικούς ενήλικες κόλον.

Στη συνέχεια, εξετάσαμε την μορφή έκφρασης ενός προηγουμένως που δημοσιεύθηκε υπογραφή ΕΜΤ [30] σε αυτές τις τρεις υποτύπους. Η υπογραφή προήλθε από ένα σύνολο δεδομένων μικροσυστοιχιών [30] συγκρίνοντας κυτταρικές σειρές που παρουσιάζει ένα πρότυπο έκφρασης γονιδίου μεσεγχυματικά-σαν (υψηλά επίπεδα VIM και χαμηλά επίπεδα Cdh1) έναντι κυτταρικών σειρών με ένα πρότυπο έκφρασης γονιδίου επιθηλιακά-σαν (χαμηλά επίπεδα VIM και υψηλά επίπεδα Cdh1). 149 γονίδια ρυθμισμένα προς τα πάνω σε μεσεγχυματικά-όπως κυτταρικές γραμμές με μια

ρ-τιμή

& lt? 0,01 σε

t-test

χρησιμοποιήθηκαν στην ανάλυσή μας. Αυτά τα γονίδια είχαν ένα πολύ υψηλότερο επίπεδο έκφρασης σε υπότυπο 1 όγκους σε σύγκριση με τις άλλες δύο υποτύπους (Εικόνα 3C). GO ανάλυση εμπλουτισμό έδειξε ότι η υπογραφή υπότυπος 1 εμπλουτίστηκε με γονίδια στη μετανάστευση των κυττάρων (FDR = 2,0 × 10

-4) και μορφογένεση των αιμοφόρων αγγείων (FDR = 7.49 × 10

-5), βιολογικές διεργασίες συνδέονται στενά με EMT [32], [33]. Έτσι, το πρόγραμμα EMT είναι χαρακτηριστικό του υποτύπου 1. Ένας πλήρης κατάλογος των όρων GO εμπλουτίζεται για τις υπογραφές υπότυπος μπορεί να βρεθεί στον Πίνακα S6 στο S3 αρχείου.

Διακριτές κλινική έκβαση για διαφορετικές CRC υπότυποι

You must be logged into post a comment.