You must be logged into post a comment.
Αφηρημένο
Εισαγωγή
Η πρόοδος στις τεχνολογίες υψηλής απόδοσης έχουν προκαλέσει ποικίλες ενημερωτικές μοριακών δεικτών για την πρόβλεψη του αποτελέσματος του καρκίνου. Long μη-κωδικοποίησης RNA (lncRNA) και μεθυλίωσης του DNA καθώς οι νέες κατηγορίες των πολλά υποσχόμενων δείκτες εμφανίζονται ως βασικά μόρια σε καρκίνους του ανθρώπου? Ωστόσο, η προγνωστική χρησιμότητα αυτών των διαφορετικών μοριακών δεδομένων μένει να διερευνηθεί.
Υλικά και Μέθοδοι
Προτείναμε μια υπολογιστική αγωγού (IDFO) να προβλέψουν την επιβίωση των ασθενών με τον προσδιορισμό των βιολογικών δεικτών πρόγνωσης που σχετίζονται με τη χρήση πολλαπλών -τύπου μοριακά δεδομένα (mRNA, microRNA, μεθυλίωση του DNA, και lncRNA) από 3198 δείγματα από πέντε τύπους καρκίνου. Εκτιμήσαμε την προγνωστική απόδοση και των δύο και μόνο μοριακών δεδομένων και ολοκληρωμένη μοριακά δεδομένα πολλαπλού τύπου στη διαστρωμάτωση της επιβίωσης των ασθενών, και σε σύγκριση με τη σχετική σημασία τους σε κάθε τύπο καρκίνου, αντίστοιχα. ανάλυση επιβίωσης χρησιμοποιώντας πολυμεταβλητή παλινδρόμηση Cox έγινε για να διερευνηθεί η επίδραση των IDFO-προσδιορίζονται δείκτες και παραδοσιακές μεταβλητές σχετικά με την κλινική έκβαση.
Αποτελέσματα
Χρησιμοποιώντας την προσέγγιση IDFO, λάβαμε καλή προβλεπτική απόδοση του μοριακή σύνολα δεδομένων (bootstrap ακρίβεια: 0,71 – 0,97) σε πέντε τύπους καρκίνου. Εντυπωσιακά, lncRNA ταυτοποιήθηκε ως ο καλύτερος προγνωστικός παράγοντας πρόβλεψης σε επικυρωμένων ομάδες των τεσσάρων τύπων καρκίνου, ακολουθούμενη από μεθυλίωση του DNA, mRNA, και στη συνέχεια microRNA. Βρήκαμε η οποία ενσωματώθηκαν μοριακών δεδομένων πολλαπλών τύπος έδειξε παρόμοια προβλεπτική ικανότητα σε μοριακά δεδομένα μονού τύπου, αλλά με την εξαίρεση των συνδυασμών μεθυλίωσης lncRNA + DNA σε δύο καρκίνους. Επιβίωση ανάλυση των μοντέλων αναλογικών κινδύνων επιβεβαιώθηκε υψηλή ανθεκτικότητα για lncRNA και μεθυλίωσης του DNA ως παράγοντες πρόγνωση εξαρτάται από την παραδοσιακή κλινικές μεταβλητές.
Συμπέρασμα
Η μελέτη μας προσφέρει μια εικόνα για τη συστηματική κατανόηση της προγνωστικής απόδοση των διαφορετικών μοριακών δεδομένων τόσο ενιαία και συνολική πρότυπα, τα οποία μπορεί να έχουν ειδική αναφορά στην μετέπειτα σχετικές μελέτες
Παράθεση:. Xu L, Φενγκτζι L, Changning L, Liangcai Ζ, Yinghui L, Yu L, et al. (2015) Σύγκριση της Πρόγνωσης Χρησιμότητα των διαφόρων μοριακών δεδομένων μεταξύ lncRNA, μεθυλίωση του DNA, microRNA, και mRNA σε πέντε ανθρώπινων καρκίνων. PLoS ONE 10 (11): e0142433. doi: 10.1371 /journal.pone.0142433
Επιμέλεια: Rossella Rota, Ospedale Pediatrico Bambino Gesu », Ιταλία
Ελήφθη: 9 Ιουλίου 2015? Αποδεκτές: 21η Οκτωβρίου του 2015? Δημοσιεύθηκε: 25 Νοεμβρίου, 2015
Copyright: © 2015 Xu et al. Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της άδειας χρήσης Creative Commons Attribution, το οποίο επιτρέπει απεριόριστη χρήση, τη διανομή και την αναπαραγωγή σε οποιοδήποτε μέσο, με την προϋπόθεση το αρχικό συγγραφέα και την πηγή πιστώνονται
Δεδομένα Διαθεσιμότητα: Τα δεδομένα είναι δεδομένων των ασθενών. Λόγω των ηθικών περιορισμών, τα στοιχεία είναι διαθέσιμα από το Cancer Genome Atlas (TCGA) Πύλη Στοιχεία για τους ερευνητές που πληρούν τα κριτήρια για την πρόσβαση σε εμπιστευτικά δεδομένα:. Https://tcga-data.nci.nih.gov/tcga/
χρηματοδότηση:. Οι συγγραφείς δεν έχουν καμία υποστήριξη ή χρηματοδότηση για να αναφέρετε
Αντικρουόμενα συμφέροντα:. Οι συγγραφείς έχουν δηλώσει ότι δεν υπάρχουν ανταγωνιστικά συμφέροντα
Εισαγωγή
πρόβλεψη πρόγνωση του καρκίνου είναι ζωτικής σημασίας για τον έλεγχο του πόνου, της προόδου, και το θάνατο των ασθενών. Ακριβής πρόβλεψη αποτελέσματος μπορεί να χρησιμοποιηθεί κλινικά για να επιλέξετε το καλύτερο από αρκετές διαθέσιμες θεραπείες για τους ασθενείς με καρκίνο και να βελτιώσει τις πιθανότητες επιβίωσής τους [1, 2]. Παραδοσιακά, πρόγνωση βασίζεται σε κλινικές παθολογικές παραμέτρους, όπως το στάδιο του όγκου, μετάσταση, και παθολογική διαγνωστικές ηλικία [3]. Πρόσφατα, ένας αριθμός των διακριτικών μοριακών βιοδεικτών έχουν ρωτήθηκαν και εφαρμόζεται για πρόσβαση στο κλινική έκβαση των ασθενών, όπως (μέλη φωσφορυλίωση, υποδοχείς της κυτταρικής επιφάνειας) που βασίζονται σε πρωτεΐνη, με βάση το DNA (SNP, CNV), και το RNA που βασίζεται σε ( mRNA, microRNA, ncRNA) [4-7]. Επιπλέον, υπάρχουν όλο και περισσότερες ενδείξεις υποδηλώνουν ότι οι μεγάλες μη-κωδικοποίησης RNA (lncRNA) και μεθυλίωσης του DNA μπορούν να μεσολαβήσουν ογκογόνο ή όγκου αποτελέσματα κατασταλτική, που αντιπροσωπεύουν νέες κατηγορίες υπόσχεται βιοδεικτών [5]. Ωστόσο, οι περισσότερες μελέτες επικεντρώνονται στις δύο ένα ενιαίο καταγωγή του καρκίνου ή για επιμέρους δεδομένα πλατφόρμα, ενώ μια ολοκληρωμένη σύγκριση για τον προσδιορισμό της σχετικής προγνωστική ισχύ για κάθε κατηγορία μορίων για ένα συγκεκριμένο καρκίνο θα παρείχε ιδανικά μια πιο αποτελεσματική διαγνωστική πλατφόρμα. Αυτό θα επιτρέψει επίσης την εξέταση του κατά πόσον στόχευση των κοινών βιοδείκτες θα προσφέρει καλύτερο έλεγχο των καρκίνων του [2]. Παρά την αυξανόμενη διαθεσιμότητα των δεδομένων που περιγράφουν αυτά τα διάφορα μόρια, προηγούμενες μελέτες ή τα διαθέσιμα πλαίσια /αγωγοί δεν έχουν διερευνηθεί σε αυτές τις ερωτήσεις.
Στρατηγικές όπως η RT-PCR και ανοσοϊστοχημεία έχουν διερευνηθεί ένα σημαντικό αριθμό των βιοδεικτών για την πρόγνωση [8- 10]. Ωστόσο, οι περισσότεροι από τους βιοδείκτες βρέθηκαν από «εκπαιδευμένες εικασίες» αντί
μέσω
συστηματική, γονιδίωμα-ευρεία προσέγγιση. Επιπλέον, μόνο λίγα έχουν χρησιμοποιηθεί σε ένα κλινικό περιβάλλον και η χρησιμότητα της πλειοψηφίας αυτών των δεικτών υγρής-lab-based μένει να καθοριστεί [4]. Πιο πρόσφατα, με τη χρήση προφίλ υψηλής απόδοσης, υπολογιστικές προσεγγίσεις όπως προσεγγίσεις μηχανικής μάθησης [11-16] και διαφορετικά μοντέλα επιβίωσης [17-19] εφαρμόζονται για τον εντοπισμό υποψήφιων βιοδεικτών με προγνωστικές τιμές για τη νόσο. Αν και αυτές οι μεθοδολογίες έχουν συσσωρεύσει μεγάλη ποσότητα μοριακού υπογραφών με αποδεκτή ακρίβεια, λίγη συστηματική έρευνα έχει διεξαχθεί για να προσδιοριστεί η προγνωστική δύναμη των ποικίλων μοριακών υπογραφών και η σχετική σημασία τους. Αυτό συμβαίνει επειδή οι περισσότερες μελέτες πάσχουν από ένα ή περισσότερα από τα ακόλουθα τέσσερα προβλήματα: (i) ανεπάρκεια των μοριακών προφίλ, (ii) που περιορίζεται σε ενιαίο γενεαλογία του καρκίνου, (iii) υπανάπτυκτες στρατηγικές για να διερευνήσει τη βέλτιστη παράγοντες πρόβλεψης από την άποψη των δεδομένων υψηλής διάστασης και του όγκου ανομοιογένεια. Παρ ‘όλα αυτά, το έργο Cancer Genome Atlas (TCGA) συγκεντρωτικά μεγάλη ποσότητα γονιδιωματικής δεδομένων βρέθηκε να αυξάνει την κατανόηση των κλινικών παθολογίες διαφόρων μοριακών πλατφόρμες σε ανθρώπινους καρκίνους [20-23], η οποία θα βοηθήσει τη μετάφραση των βιολογικών δεδομένων σε προγνωστική χρησιμότητα.
σε αυτή τη μελέτη, έχουμε εφαρμόσει ένα αγωγό να εντοπίσει βιοδείκτες πρόγνωση που σχετίζονται με multi-μική προφίλ, συμπεριλαμβανομένων RNA-επόμενα, η μεθυλίωση του DNA Στεφάνη ChIP, και microRNA-επόμενα και σε σύγκριση σχετική προγνωστική ισχύ τους σε πέντε καρκίνους TCGA . Κατά τη διάρκεια της διαδικασίας μοντελοποίησης, βιοδείκτες ζωτικής σημασίας για την κλινική έκβαση κατατάχθηκαν και επιλέγεται με τη βέλτιστη προσέγγιση Επαναληπτική διαγραφή Χαρακτηριστικό μας (IDFO). Επιπλέον, αξιολόγησε τα προγνωστικά επιχειρήσεις κοινής ωφέλειας και των δύο ατομικών και ολοκληρωμένη πολυ-μική προγνωστικούς παράγοντες για τη διερεύνηση της συμβολής τους στην μοντελοποίηση των επιδόσεων, και η προβλεπτική ικανότητα των διαφορετικών μοριακών προγνωστικών στις αντίστοιχες καρκίνους περαιτέρω αξιολογήθηκαν σε ανεξάρτητα σύνολα δοκιμών. Η ανάλυση επιβίωσης χρησιμοποιήθηκε για να προσδιοριστεί η προγνωστική χρησιμότητα του IDFO πιστοποιηθέν προγνωστικοί παράγοντες μόνο του ή σε συνδυασμό με κλινικές μεταβλητές. Επιπλέον, για να διευκολυνθεί η χρήση της προσέγγισής μας, υλοποιήσαμε επίσης διαθέσιμη στο κοινό τον πηγαίο κώδικα R (CAPM.R), η οποία επιτρέπει στους ερευνητές να χτίσει μοντέλα πρόγνωση για άλλα σύνολα δεδομένων. Η μελέτη μας παρέχει ένα δυναμικό σύστημα αξιολόγησης των κινδύνων για την πρόβλεψη πρόγνωση του καρκίνου, η οποία αποκαλύπτει όχι μόνο την προγνωστική χρησιμότητα της πολυ-μική δεδομένων σε όλους τους τύπους καρκίνου, αλλά επίσης διευκολύνει την κατανόηση των lncRNA και μεθυλίωσης του DNA ως πιθανοί προγνωστικοί δείκτες για την εξέλιξη του όγκου.
Υλικά και Μέθοδοι
Σύνολα
συναρμολογούνται 3198 διατίθενται στο κοινό δείγματα όγκων σε δεδομένα σειρά που βασίζεται στους πέντε τύπους καρκίνου από το έργο του καρκίνου Γονιδιώματος Atlas (TCGA), τα οποία έχουν δημοσιευθεί στο [20, 24-27] (Πίνακας Α στο S1 αρχείο περιγράφει τις αναλυτικές κατανομές δείγματος). επιλέγεται Όλα τα δείγματα όγκου με βάση τα ακόλουθα κριτήρια: (α) υπογραφές (μεταγραφές mRNA /lncRNA /microRNA, ανιχνευτές μεθυλίωσης DNA) απουσιάζουν από το 50% των δειγμάτων του όγκου απομακρύνθηκαν ως άσχετο, (β) τα δείγματα με συμφωνημένα κλινικές πληροφορίες ( π.χ., ο χρόνος επιβίωσης, την ηλικία, το στάδιο του όγκου), (ασθενείς γ) του όγκου με μόνο μέχρι ένα μήνα μετά την επέμβαση επιβίωση εξαιρέθηκαν για να αποφευχθεί οποιαδήποτε πιθανή σύγχυση επιρροή των μετεγχειρητικών επιπλοκών. Τα περισσότερα από τα δείγματα όγκου αποτελούνταν από τρία διαφορετικά σύνολα δεδομένων μοριακό προφίλ, τα οποία ήταν ΚΝΑ-seq, microRNA-seq, και μεθυλίωση DNA Στεφάνη chip. Τέσσερις τύποι μοριακών υπογραφών εξήχθησαν ως πρόγνωση προγνωστικοί από τα τρία προφίλ μοριακά δεδομένα, συμπεριλαμβανομένων lncRNA και mRNA υπογραφές από RNA-επόμενα προφίλ, υπογραφές μεθυλίωσης του DNA ήταν από τη μεθυλίωση του DNA Χάντρα ChIP 450k /27k, και microRNA υπογραφές ήταν από την microRNA- προφίλ επόμενα. Για κάθε προφίλ μοριακά δεδομένα, επιλέξαμε τυχαία δύο-τρίτα των δειγμάτων όγκων για την κατασκευή (δηλαδή «τρένο») μοντέλα πρόβλεψης για τον εντοπισμό καλύτερους δείκτες απόδοσης, και το υπόλοιπο ένα τρίτο των δειγμάτων χρησιμοποιήθηκαν για μια ανεξάρτητη δοκιμή αυτών των προγνωστικών. Σύνολα δεδομένων που αντιστοιχούν σε διαφορετικές μορφές καρκίνου αναλύθηκαν ξεχωριστά. Επιπλέον, για την πρόβλεψη της έκβασης των ασθενών, δείγματα όγκων είχαν ανατεθεί είτε σε μια «καλή» ή «κακή» ομάδες αποτέλεσμα ως ετικέτες πρόγνωση. Το κατώτατο όριο των δύο ομάδων έκβαση ορίστηκε βάσει της κλινικής χαρακτηρισμό των αντίστοιχων καρκίνων (οι οποίες έχουν το πλεονέκτημα του να παραγάγει δύο ομάδων έκβασης με ίσου μεγέθους σε κάθε καρκίνο).
διχοτόμηση της επιβίωσης
δεδομένων
Εμείς διχοτομήθηκε τα λογοκρίνονται δεδομένα επιβίωσης για κάθε τύπο καρκίνου με τον ορισμό ενός ορίου του χρόνου αποκοπής, όπως: 2 έτη για ασθενείς με αδενοκαρκίνωμα του παχέος εντέρου (COAD), 3 χρόνια για πνεύμονα καρκίνωμα πλακωδών κυττάρων (LUSC), καρκίνωμα ορώδες κυσταδενο (OV), της μήτρας καρκίνωμα corpus ενδομητριοειδές (UCEC), και 5 έτη για μαστού διηθητικό καρκίνωμα (BRCA). Οι ασθενείς που ζούσαν πέρα από το χρόνο αποκοπής ήταν χαρακτηρισμένα ως «καλή πρόγνωση» ο θανών ήταν χαρακτηρισμένα ως «κακή πρόγνωση». Ασθενείς με λογοκρίνονται χρόνους επιβίωσης που ήταν πριν είχαν εξαιρεθεί από το όριο αποκοπής (π.χ., λιγότερο από 1 μήνα)
Προ-επεξεργασία των γονιδιωματικής και επιγονιδιώματος προφίλ
RNA-επόμενα:. TCGA RNA-seq επίπεδο 2 στοιχεία ομαλοποιούνται και υποβάλλονται σε επεξεργασία από τον υπολογισμό του διαβάζει ανά βάση κιλό ανά εκατομμύριο χαρτογραφηθεί διαβάζει αξίας (RPKM) για την έκφραση των μεταγραφών lncRNA /mRNA. Για να ταιριάζει με τα συναρμολογημένα μεταγραφές σε λεπτομερείς lncRNAs /mRNA, όλες οι μεταγραφές ήταν ευθυγραμμισμένες με το Ανθρώπινο Γονιδίωμα από τον κατάλογο αναφοράς από το UCSC (GRCh37 /hg19), ενώ οι μεταγραφές με & gt? το ήμισυ του μήκους του με το ένα lncRNA /mRNA προσδιορίστηκαν ως έναν αγώνα [28]
microRNA-επόμενα:. microRNA επίπεδα έκφρασης προσδιορίστηκαν
μέσω
δεδομένων επίπεδο αλληλουχίας TCGA microRNA 3 (Illumina Γονιδιώματος αναλυτής & amp? Hiseq 2000). Οι υπολογισθείσες εκφράσεις για μεταγραφές ευθυγράμμιση σε ένα συγκεκριμένο miRNA ανακτήθηκαν τόσο από τις ισομορφή και ποσοτικοποίηση αρχεία miRNA (διαθέσιμο στην πύλη δεδομένων TCGA μαζί με μετα-σχολιασμό κάθε σύνολο δεδομένων) [29]
Η μεθυλίωση του DNA Στεφάνη Chip:. Η τα σύνολα δεδομένων μεθυλίωσης του DNA στις περισσότερες ομάδες όγκου αποτελείται από την Illumina 450K ή /και 27K πλατφόρμες σειρά. Ως εκ τούτου, επιλέξαμε τις επικαλύψεις CpGs (που μετράται με τη δοκιμασία ΙΙ Infinium τύπου) που ήταν παρόντες και στις δύο από τις δύο πλατφόρμες (Infinium 450K και 27K) και δεν είχε τις τιμές που λείπουν περισσότερο από το 10% σε όλα τα δείγματα σε κάθε τύπο καρκίνου, αντίστοιχα .
Υπογραφή μεθοδολογία αξιολόγησης: IDFO
Η προσέγγιση IDFO αποτελείται από τρεις βασικές διαδικασίες (Σχήμα 1):
Η πρόγνωση ιεράρχηση κινδύνου (PRP) κατάταξη. Υπήρχαν ένας μεγάλος αριθμός υποψήφιων μεταβλητών εντός των διαφορετικών μοριακών προφίλ, το οποίο θα κοστίσει τεράστια υπολογισμού κατά τη διάρκεια της κατάρτισης μοντέλου. Για να ξεπεραστεί αυτό το «διάσταση κατάρα», έχουμε αναπτύξει αυτό το προ-βιοδεικτών στρατηγική κατάταξη: Η πρόγνωση του κινδύνου ιεράρχηση (PRP) στην οθόνη από τα πιο αντιπροσωπευτικά προγνωστικές μεταβλητές, όπως είχε αρχικά μοντέλο χαρακτηριστικά της κατάρτισης για κάθε μοριακό προφίλ, αντίστοιχα. Σε αυτή τη διαδικασία, θα διερευνηθούν δύο βήματα:
υπολογισμό του για την εκχύλιση διαφορικά εκφρασμένων /μετουσιωμένο υπογραφές
x
i
μεταξύ των δύο ομάδων έκβασης. Όπως τύπο, (1) Εδώ ήταν η μέση τιμή έκφρασης /μεθυλίωση της υπογραφής
x
i
στην ομάδα 1
ου, και ήταν η μέση έκφραση τιμής /μεθυλίωσης του
x
i
στην
ΕΔ 2,
σ
ήταν η τυπική απόκλιση των δύο αντίστοιχης ομάδας, 1 = μία ομάδα, 2 = ομάδα δύο.
P
unicox
, ο υπολογισμός της μονοπαραγοντική Cox
σ
αξία της μοριακής υπογραφής
x
i
, η οποία χρησιμοποίησε τις τιμές έκφρασης /μεθυλίωση του
x
i
ως μεταβλητή για μια μονοπαραγοντική ανάλυση επιβίωσης παλινδρόμησης Cox.
Τέλος, η
PRP
αξία κίνδυνος
υπογραφής
x
i
υπολογίστηκε ως τη χρήση αυτού του τύπου, (2) Σε περίπτωση που προέρχονται από την εξίσωση 1.
Η
Μοντέλο κτιρίου. Για διεξοδικά την αξιολόγηση της προγνωστικής ικανότητας των μορίων πολυ-πλατφόρμα για αντίστοιχους τύπους καρκίνου, χρησιμοποιήσαμε 5 μοντέλα μηχανικής μάθησης σε συνδυασμό με 4 στρατηγικές για την εξαγωγή χαρακτηριστικών για τη δημιουργία ενός αγωγού απόδοση. Δύο άλλα βήματα χρησιμοποιήθηκαν: κτίριο μοντέλο και επιλογής χαρακτηριστικών. Πέντε αλγόριθμοι μηχανικής μάθησης προτάθηκαν στο κτίριο μοντέλο, το οποίο είναι η υποστήριξη φορέα μηχάνημα (SVM), k-πλησιέστερων γειτόνων (KNN), λογιστική παλινδρόμηση (LR), τυχαία δάσος (βλέπε συμπληρωματικές μεθόδους στην S1 αρχείου) (RF) και NaiveBayes ( NB). Η απόδοση κάθε ταξινομητή αξιολογήθηκε χρησιμοποιώντας τη μέθοδο 632-Bootstrap, χρησιμοποιώντας αυτόν τον τύπο, (3) Σε περίπτωση που
ν
ήταν ο συνολικός αριθμός των επαναλήψεων, και ήταν το
i
ου
ακρίβεια τρένο πείραμα και η ακρίβεια δοκιμής. Εδώ έχουμε χωρίσει τα δύο τρίτα δείγματα για την εκπαίδευση και ένα τρίτα δείγματα για δοκιμές, οι οποίες είχαν εξαχθεί από τα αρχικά σύνολα εκπαίδευσης.
Επιλογή Χαρακτηριστικών. Σε αυτή τη διαδικασία, προτείναμε τέσσερις στρατηγικές εξαγωγή χαρακτηριστικών, δηλαδή ως SVM-RFE, RF-IS το Lasso και PFS (Συμπληρωματικές Μέθοδοι στην S1 File) για να προσδιοριστεί η βέλτιστη σύνολο των χαρακτηριστικών συνολικά. Η διαδικασία επιλογής χαρακτηριστικών που ξεκίνησε με τον αλγόριθμο PRP κατετάγη n-top-σταθμισμένη χαρακτηριστικά (για λεπτομερείς αριθμούς δείτε συμπληρωματικές μέθοδοι και εικόνα Α S1 Αρχείο) και, στη συνέχεια, επαναληπτικά εξαλειφθεί έναν αριθμό ή ένα κλάσμα των λιγότερο σημαντικών /κρίσιμα χαρακτηριστικά καθορίζονται βάσει των αντίστοιχων λήφθηκε τις στρατηγικές εξόρυξης μέχρι την υψηλότερη ακρίβεια εκκίνησης. Κατά τη διαδικασία βελτιστοποίησης χαρακτηριστικό, ένας μέσος ακρίβεια 10.000 φορές τυχαία εκ νέου δειγματοληψία με αντικατάσταση υπολογίστηκε ως η ακρίβεια εκτίμηση για κάθε επαναληπτική επιλεγμένο χαρακτηριστικό σετ. Για να αξιολογηθεί η σταθερότητα των PRP τάξεις χαρακτηριστικό, μια προσομοίωση Monte Carlo χρησιμοποιώντας πακέτο R GMCT [30] έγινε και με τυχαία επιλογή ίσο αριθμό διαθέτει για τις αντίστοιχες μοριακών μοντέλων σε κάθε όγκο. Τέλος, το υψηλότερο πρότυπο εκκίνησης αναγνωρίστηκε ως το καλύτερο μοντέλο πρόγνωσης και προβλήθηκε από τα χαρακτηριστικά της, στη συνέχεια εξετάστηκαν στο σύνολο τεστ για ανεξάρτητη επικύρωση. Το μοντέλο κατασκευής, στατιστική ανάλυση και τα γραφήματα πραγματοποιήθηκαν με τη χρήση Bioconductor (www.bioconductor.org)
Η
Αυτό το διάγραμμα ροής περιέχει τρία βασικά βήματα: α. (I) PRP κατάταξη των μοριακών χαρακτηριστικών, (ii) το μοντέλο κατασκευής και (iii) η λειτουργία βελτιστοποίηση και επικύρωση.
Η
Στατιστικά
Φοιτητών
t
δοκιμές χρησιμοποιήθηκαν για να συγκρίνουν διαφορά εκφράζεται υπογραφές (mRNA, lncRNAs, μεθυλίωση του DNA, και microRNAs) μεταξύ των δύο ομάδων κινδύνου. Η Wilcoxon signed rank test εκδόθηκε για την αξιολόγηση της στατιστικής σημαντικότητας της κατανομής επιβίωσης των δύο ομάδων πρόγνωση ταξινομηθεί από τα μοντέλα MCPHR, ανά τύπο αυτό, (4) Σε περίπτωση που
S
1 και
S
2 ήταν το ποσοστό των επιζώντων σε δύο ομάδες κινδύνου,
V
1 και
V
2 ήταν η διακύμανση του
S
1 και
S
2.
Η δοκιμή αναλογία πιθανοτήτων χρησιμοποιήθηκε για να συγκρίνουμε την εφαρμογή δύο μοντέλων (π.χ. μοντέλα προγνωστικό IDFO με και χωρίς πρόσθετες μεταβλητές), η οποία ήταν με βάση τον υπολογισμό των δεικτών κινδύνου. Η λειτουργία πιθανότητα υπολογίστηκε χρησιμοποιώντας αυτόν τον τύπο, (5) όπου
S
(
t
i
) ήταν η λειτουργία επιβίωσης που έδειξε το ποσοστό του
i
ου
ασθενή στη ζωή κατά το χρόνο
t
? Η συνάρτηση πυκνότητας
f
(
t
i
) ήταν η πιθανότητα θανάτου στο μικρό χρονικό διάστημα
t
?
w
i
ήταν ο σταθμισμένος μέσος ρυθμός επιβίωσης υπολογίστηκε από όπου
V
i
ήταν η διακύμανση των ποσοστών επιβίωσης ?
n
ήταν ο συνολικός αριθμός των ασθενών στις αντίστοιχες ομάδες. Η ανάλυση Kaplan-Meier και log-rank μοντέλα πιθανότητα είχαν χρησιμοποιηθεί για να εξετάσει τις διαφορές στην επιβίωση και τις καμπύλες Kaplan-Meier συντάχθηκαν με βάση τη μέση βαθμολογία κινδύνου. Οι
σ
τιμές σε όλες τις στατιστικές δοκιμασίες μικρότερη από 0,05 θεωρήθηκαν σημαντικές. Οι παραπάνω στατιστικές αναλύσεις πραγματοποιήθηκαν με τη χρήση των πακέτων R:. «Επιβίωση» και «survcomp»
Η πολυπαραγοντική Cox αναλογικών κινδύνων Παλινδρόμηση
Η πολυμεταβλητή μοντέλο Cox παλινδρόμησης αναλογικών κινδύνων, όπως το πιο δημοφιλές μαθηματική μοντελοποίηση προσέγγιση εφαρμόστηκε για την εκτίμηση των δεικτών κινδύνου, σε σχέση με τους κινδύνους, που αντιστοιχούν διαστήματα εμπιστοσύνης 95% (CI) και τις καμπύλες επιβίωσης με τη χρήση αρκετών /πολλαπλών επεξηγηματικές μεταβλητές (μοριακή και /ή κλινικές μεταβλητές). Ως παράδειγμα, ένα παραμετρικό μοντέλο βασίζεται στην εκθετική κατανομή με τη χρήση αυτού του τύπου, (6) Σε περίπτωση που,
h
(
t
) ήταν η συνάρτηση κινδύνου, η
x
1,
x
2
… x
k
ήταν οι συμπαράγοντες, και
β
1,
β
2
…
,
β
k
ήταν οι συντελεστές των αντίστοιχων συμπαράγοντες, όπου,
β & gt? 0
εκπροσώπησε την συμμεταβλητή παράγοντα κινδύνου που σχετίζονται με την «φτωχή πρόγνωση», αντίθετα,
β & lt? 0
αναγράφεται η προστατευόμενη συμμεταβλητή παράγοντας που σχετίζεται με την «καλή πρόγνωση». Η συνεχής
α
σε αυτό το μοντέλο αντιπροσώπευε ημερολόγιο βάσης κίνδυνο, δεδομένου καταγραφής
h
(
t
) =
α
ή
h
(
t
) =
exp
(
α
), όταν όλα τα
x
τιμές ήταν μηδενικές.
σκορ κινδύνου
.
R
(
t
) υπολογίστηκε για προγνωστική κινδύνου κάθε ασθενή, και ορίζεται ως ένας γραμμικός συνδυασμός των μεταβλητών πρόβλεψης σταθμίζονται με αντίστοιχους συντελεστές τους παλινδρόμησης Cox, και υπολογίζεται με τη χρήση αυτού του τύπου, ( 7) Σε περίπτωση που
R
(
t
) ήταν το σκορ κίνδυνο ασθενή
t
,
h
(
t
) ήταν η αξία κινδύνου υπολογίζεται με τον πολυπαραγοντικό μοντέλο παλινδρόμησης Cox (που προέρχεται από την εξίσωση 6)
κωδικούς R:. CAPM
για να επιτρέψετε στους χρήστες να εφαρμόσει κατασκευαστεί αγωγός μας και σε άλλα σύνολα δεδομένων, έχουμε εφαρμόσει ένα κοινό διαθέσιμο τον πηγαίο κώδικα R (CAPM.r) να εκτελέσει πρόβλεψη πρόγνωση του καρκίνου, η οποία είναι ελεύθερα διαθέσιμο σε https://www.escience.cn/people/lixu/index.html.
Αποτελέσματα
Αξιολόγηση της προγνωστικής απόδοση διαφορετικών μοριακών δεδομένων
το διάγραμμα ροής της μελέτης μας φαίνεται στην Εικ 2. Έχουμε συναρμολογούνται 3198 διατίθενται στο κοινό σε δείγματα όγκων δεδομένων συστοιχία που βασίζονται μεταξύ πέντε τύπους καρκίνου TCGA: μαστού διηθητικού καρκινώματος ( BRCA) [26], αδενοκαρκίνωμα του κόλου (COAD) [27], του πνεύμονα καρκίνωμα πλακωδών κυττάρων (LUSC) [25], της μήτρας καρκίνωμα corpus ενδομητριοειδές (UCEC) [31] και ορώδες καρκίνωμα κυσταδενο (OV) [24]. Οι πέντε τύποι καρκίνου επιλέχθηκαν λόγω ομάδες τους TCGA περιλαμβάνονται επαρκή δείγματα με πολλαπλούς τύπους των μοριακών δεδομένων και κλινικές πληροφορίες (Πίνακας Α στο S1 αρχείου). Κάθε τύπος καρκίνου που αποτελείται από τέσσερα προφίλ μοριακών δεδομένων, συμπεριλαμβανομένων (i) lncRNA: Illumina HiSeq 2000 RNA αλληλουχίας V2? (Ii) mRNA: Illumina HiSeq 2000 RNA αλληλουχίας V2? (Iii) Η μεθυλίωση του DNA: Illumina Infinium Ανθρωπίνων μεθυλίωσης του DNA 27K, 450K? (Iv): microRNA: Illumina Γονιδιώματος Αναλυτής /HiSeq 2000 πλατφόρμα αλληλουχίας microRNA. Προκειμένου να αξιολογηθεί συνολικά η προβλεπτική ικανότητα των τεσσάρων τύπων μοριακών υπογραφών με την αντίστοιχη καρκίνους τους, κατασκευάσαμε μια ομάδα 5 ταξινομητές (SVM [32], KNN [33], NaiveBayes [34], RandomForest [35], Πολυωνυμική λογιστική παλινδρόμησης [14]), σε συνδυασμό με 4 χαρακτηριστικό στρατηγικές εξόρυξης: το λιγότερο Απόλυτη Συρρίκνωση και χειριστή επιλογής (LASSO) [36], με βάση Support Vector Machine Αναδρομικές χαρακτηριστικό εξάλειψη (SVM-RFE) [37], Τυχαία Δάσος φάσμα σημασίας με βάση επιλογής χαρακτηριστικών (RF-IS) [38], και την ιεράρχηση-εξαλειφθεί επιλογή χαρακτηριστικών (PFS) (Συμπληρωματικές Μέθοδοι στην S1 File) για να οικοδομήσουμε μια πρόγνωση υπολογιστική αγωγού που ονομάστηκε ως η μέθοδος λειτουργία βελτιστοποίησης Επαναληπτική διαγραφή (IDFO, βλέπε Μέθοδοι και σχήμα 1).
Ο αγωγός αυτός περιέχει τέσσερις κυρίως διαδικασίες: Ι) την επεξεργασία δεδομένων. Έχουμε συγκεντρώσει μια συλλογή από 3198 δείγματα όγκων σε πέντε τύπους ανθρώπινων καρκίνων, η οποία αποτελείται από τέσσερις τύπους των μοριακών δεδομένων, συμπεριλαμβανομένων: lncRNA, microRNA, mRNA, και μεθυλίωση του DNA. Κάθε τύπος των μοριακών δεδομένων στις αντίστοιχες καρκίνους έχει μεταποιηθεί σε διάταξη μήτρας με βάση τη χρήση μεθόδων προεπεξεργασίας CAPM. II) κατάταξη χαρακτηριστικό. Μοριακή χαρακτηριστικά που σχετίζονται με την πρόγνωση αναλύθηκαν και ταξινομούνται σύμφωνα με τον αλγόριθμο PRP. Για κάθε είδος μοριακά δεδομένα, επιλέξαμε top-σταθμισμένη 100 υπογραφές για τα αρχικά σύνολα χαρακτηριστικό σε κάθε μία από τις πέντε καρκίνων, αντίστοιχα. III) κτίριο Μοντέλο και επιλογής χαρακτηριστικών. Σε αυτή τη διαδικασία, υιοθετήσαμε πέντε ταξινομητές σε συνδυασμό με τέσσερις αλγόριθμοι επιλογής χαρακτηριστικών για τον καθορισμό της βάσης πρόβλεψη πρόγνωση. Κατά τη διαδικασία επιλογής χαρακτηριστικών, κάθε ομάδα χαρακτηριστικών εκπαιδεύτηκε με 10.000 φορές την τυχαιοποίηση και με τις καλύτερες επιδόσεις πίνακα χαρακτηριστικό με μεγαλύτερη ακρίβεια εκκίνησης επιλέχθηκε για κάθε μοριακών δεδομένων ανά τον καρκίνο. IV) Επικύρωση. Για να αξιολογηθεί η προβλεπτική ικανότητα του κάθε μοριακά δεδομένα, τα καλύτερα χαρακτηριστικά επιδόσεις εφαρμόστηκαν περαιτέρω ανεξάρτητων δοκιμών σε κάθε ομάδες του καρκίνου, αντίστοιχα.
Η
Κατά τη διάρκεια της διαδικασίας λειτουργία βελτιστοποίησης, οι ταξινομητές για κάθε μοριακά δεδομένα ήταν αρχικά εκπαιδευτεί από την πρόγνωση του κινδύνου ιεράρχηση αλγόριθμο (PRP? βλέπε Μέθοδοι) κατατάσσονται χαρακτηριστικά και στη συνέχεια επαναληπτικά εξαλειφθεί έναν αριθμό ή ένα κλάσμα λιγότερο σημαντικό /κρίσιμο χαρακτηριστικά που προσδιορίστηκαν από τις στρατηγικές εξόρυξης τέσσερις-χαρακτηριστικό γνώρισμα μέχρι να παρατηρηθεί η βέλτιστη πίνακα χαρακτηριστικών. Για να αξιολογηθεί η σταθερότητα του PRP μέθοδο, ένα Monte Carlo Simulation (MCS) διεξήχθη επίσης να επιλέξετε ίσου μεγέθους των χαρακτηριστικών ως τυχαία επικύρωσης για τα αντίστοιχα προφίλ σε κάθε όγκο. Ένα ταξινομητής με την υψηλότερη εκκίνησης ακρίβεια [39] ταυτοποιήθηκε ως το βέλτιστο μοντέλο και οι καλύτερες επιδόσεις προγνωστικοί κατόπιν ελέγχθηκαν σε ανεξάρτητες ομάδες δοκιμών. Τα υποδείγματα παραστάσεις κάθε μοριακών δεδομένων ( «τρένο») σε συνδυασμό με στρατηγικές επιλογής αντίστοιχο χαρακτηριστικό τονίζεται στο σχήμα 3α-3ε. Παρατηρήσαμε ότι, 1) οι ακρίβειες εκκίνησης όλων των ταξινομητών κυμάνθηκε 0,71 έως 0,97 (Πίνακας Β S1 αρχείου), η οποία έδειξε καλή απόδοση της προσέγγισης IDFO για πολλούς τύπους καρκίνου? 2) οι PRP κατετάγη σύνολα χαρακτηριστικό οδήγησε σε σημαντικά βελτιωμένη ακρίβεια σε σύγκριση με τυχαία επιλεγμένα σύνολα χαρακτηριστικό MCS (μέση ακρίβεια: PRP = 0,81, MCS = 0,59? Μονόπλευρη Wilcoxon signed rank test:
P
& lt? 1.12e -5)? 3), και δεν υπήρχε καμία εμφανής διαφορά μεταξύ των αλγορίθμων ταξινόμησης σε σχέση με τους όγκους, και η απόδοση των διαφορετικών μοριακών υπογραφών δεν διαφέρουν σημαντικά μεταξύ τους καρκίνους, που επιβεβαιώνει μια ιδιαίτερα ισχυρή της γονιδιωματικής και επιγενετικών δεδομένα πρόβλεψης πρόγνωση? 4) του συνόλου των 20 βέλτιστη προγνωστικούς μοντέλα (5 καρκίνοι * 4 σετ μοριακά δεδομένα), 12 από τα 20 (60%) ελήφθησαν από τον αλγόριθμο PFS, που ακολουθείται από LASSO (30%) και SVM-RFE (10%), η οποία ανέφερε ότι η νέα προσέγγιση επιλογής χαρακτηριστικών μας πρότεινε είχε καλή απόδοση παρόμοια με παραδοσιακές μεθόδους (Πίνακας Β S1 αρχείου). Στη συνέχεια, να συγκρίνει την προβλεπτική επιδόσεις των τεσσάρων τύπων μοριακών υπογραφών με μια αμερόληπτη επικύρωση, εφαρμόσαμε τους καλύτερους δείκτες πρόγνωση από κάθε μοντέλο κατάρτισης σε ανεξάρτητη σειρά δοκιμών. Αξίζει να σημειωθεί ότι, όπως φαίνεται στο σχήμα 3στ, οι υπογραφές lncRNA απεικονίζονται τις καλύτερες επιδόσεις σε τέσσερις καρκίνους: BRCA (test set ακρίβεια: 0.78,
που Ν
δοκιμαστική
= 159), COAD (test set ακρίβεια: 0.85,
Ν
δοκιμών που
= 48), LUSC (test set ακρίβεια: 0.77,
Ν
σύνολο ελέγχου
= 56), και OV (σετ ακρίβεια δοκιμής: 0.79,
Ν
δοκιμών που
= 75). Μεθυλίωσης του DNA ήταν η δεύτερη καλύτερη ικανότητα πρόβλεψης των BRCA (test set ακρίβεια: 0.76,
Ν
δοκιμών που
= 73), COAD (test set ακρίβεια: 0.79,
Ν
σύνολο ελέγχου
= 67), LUSC (test set ακρίβεια: 0.77,
Ν
δοκιμών που
= 42), τον καρκίνο των ωοθηκών (σύνολο ελέγχου ακριβείας: 0,7,
Ν
σύνολο ελέγχου
= 146), και το τρίτο καλύτερους δείκτες στην UCEC (test set ακρίβεια: 0,8,
Ν
σύνολο ελέγχου
= 81). mRNA και microRNA ως παραδοσιακή κλινική βασική δείκτες, κατατάχθηκαν χαμηλότερα από τις αρχικές μας προσδοκίες. mRNA ήταν η τρίτη καλύτερους δείκτες στην BRCA (σύνολο ελέγχου της ακρίβειας: 0.64,
Ν
δοκιμών που
= 159), COAD (test set ακρίβεια: 0.64,
N
σύνολο ελέγχου
= 48), LUSC (test set ακρίβεια: 0.76,
Ν
δοκιμών που
= 56) και OV (δοκιμή που ακρίβεια: 0,6,
Ν
σύνολο ελέγχου
= 75). δεδομένων microRNA οδήγησε σε χειρότερη προβλεπτική ικανότητα σε σχέση με όλους τους άλλους τύπους δεδομένων. Επιπλέον, λόγω της αξιοσημείωτη απόδοση του lncRNAs στη διαστρωμάτωση της επιβίωσης των ασθενών, πραγματοποιήσαμε περαιτέρω βιβλιογραφία ανάκτησης να εξετάσει το ενδεχόμενο για τυχόν ενδείξεις συσχέτισης μεταξύ IDFO-έλεγχο lncRNAs και την εξέλιξη πρόγνωση. Από όλα τα 157 βέλτιστου προγνωστικούς lncRNA σε πέντε καρκίνους (21 στην BRCA, 36 σε COAD, 33 στην LUSC, 41 σε OV, 37 σε UCEC), 22 lncRNAs είχε προηγουμένως αναφερθεί στην βιβλιογραφία (Πίνακας F και Σχήμα Β S1 File). Αυτά τα αποτελέσματα υποδηλώνουν ότι η προσέγγισή μας θα μπορούσαν δυνητικά να εντοπίσει αξιόπιστος συνδέονται πρόγνωση lncRNAs, και θέσαμε πρόσφατα εντοπίστηκαν lncRNAs, είτε μεμονωμένα είτε ως σύνθετο δείκτες, μπορεί να είναι ζωτικής σημασίας για την κλινική πρακτική.
(ΑΕ) Best μοντέλα πρόβλεψης της κάθε μοριακά δεδομένα των πέντε ανθρώπινων καρκίνων σε διαφορετικές στρατηγικές επιλογής χαρακτηριστικών (στήλες αναγράφεται χαρακτηριστικό στρατηγικές επιλογής: Λάσο PFS, SVM-RFE, RF-IS, και MCS? σειρές αναφέρεται μοριακή υπογραφές), (στ) ορίζει Test ακρίβειες των τεσσάρων τύπων μοριακών υπογραφές σε πέντε καρκίνους TCGA (σειρές υποδεικνύεται τύποι μοριακών δεδομένων, στήλες υποδεικνύεται τύπους καρκίνου). Προκειμένου να γίνει διάκριση μεταξύ των αποτελεσμάτων της κατάρτισης και τις δοκιμές, χρησιμοποιήσαμε μπλε χρώματος στοιχεία για τα αποτελέσματα της κατάρτισης (Σχήμα 3Α-3Ε) και κόκκινου χρώματος στοιχεία για τα αποτελέσματα των δοκιμών. * BRCA = μαστού διηθητικό καρκίνωμα? COAD = αδενοκαρκίνωμα του παχέος εντέρου? LUSC = πνεύμονα καρκίνωμα πλακωδών κυττάρων? UCEC = μήτρας Corpus ενδομητριοειδές καρκίνωμα? OV = υδαρής κυσταδενοκαρκινώματος.
Η
Ένταξη των πολλαπλών μική βιοδεικτών για την πρόγνωση πρόβλεψη
Πρόσφατες μελέτες δείχνουν ότι τα ολοκληρωμένο πολυ-μική υπογραφές θα μπορούσε αποτελεσματικά να βελτιώσει την επίδοση του μοντέλου [28, 40]. Να διερευνήσει αν η υπόθεση ήταν κατάλληλη για την διχοτομήθηκε συνολική πρόβλεψη επιβίωσης, επεκτείναμε την προσέγγισή μας IDFO για τη διερεύνηση της απόδοσης των ενοποιητική μοντελοποίηση των μοριακών δεδομένων πολλαπλού τύπου σε πέντε καρκίνους. Όπως ενοποιητική μοντέλα απαιτούν δείγματα όχι μόνο αποτελείται από multi-μική προφίλ, αλλά και εκείνες που πληρούν τα προγνωστικά κριτήρια, παρατηρήσαμε μια τελική των 20 ολοκληρωμένων ομάδων multi-μική δεδομένων στις πέντε τύπους καρκίνου, συμπεριλαμβανομένων των 15 ομάδων διπλό συνδυασμό και 5 τρίκλινα -σύνολα συζευγμένων ομάδες (βλέπε πίνακα Γ στο S1 αρχείου). Όπως ήταν ανεπαρκής ο αριθμός των microRNA-επόμενα δείγματα επικάλυψη με τις τρεις άλλες μοριακές προφίλ, οι υπογραφές microRNA αποκλείστηκαν στην ολοκληρωμένη ανάλυση μοντέλων. Πίνακας C σε S1 αρχείου που παρατίθενται τα προγνωστικά ακρίβειες ( «δοκιμή») των 20 ολοκληρωμένων μοντέλων. Εν ολίγοις, το 80% των ολοκληρωμένων συνδυασμών πολλαπλών μική δεδομένα δεν έδειξαν σημαντικά βελτιωμένη προγνωστική ισχύ σε σύγκριση με μεμονωμένες μοριακά δεδομένα τους (Σχήμα 4A-4C), εκτός για τα μοντέλα μεθυλίωσης lncRNA + DNA σε δύο τύπους καρκίνου του OV και UCEC (Εικ 4D και 4Ε) (OV: μονόπλευρη Wilcoxon signed rank test, DNA μεθυλο + lncRNA
vs
DNA μεθυλο:.
P
& lt? 1.2e-4, DNA μεθυλο + lncRNA
vs
lncRNA:
P
& lt? 4.7e-3? UCEC:. DNA μεθυλο + lncRNA
vs
DNA μεθυλο:.
P
& lt? 1.7e-4, DNA μεθυλο + lncRNA
vs
lncRNA:
P
& lt? 8.2e-5).. Εκτός αυτού, με την αύξηση του μοριακού τύπου, η απόδοση του τριπλού συνδυασμού ομάδων ήταν σύμφωνη με το μέσο επίπεδο των μοριακών μοντέλων μονού τύπου με περιορισμένη διαταραχές σε όλους τους πέντε τύπους καρκίνου. Κατά συνέπεια, τα περισσότερα από τα ολοκληρωμένα μοντέλα multi-μική δεδομένων έδειξε παρόμοια προβλεπτική ισχύ με τις αντίστοιχες επιμέρους μοντέλα μοριακά δεδομένα τους, γεγονός που υποδηλώνει το περιεχόμενο των πληροφοριών των ολοκληρωμένων στοιχείων πολυ-πλατφόρμα θα μπορούσε να είναι σε μεγάλο βαθμό περιττή όσον αφορά την διαστρωμάτωση της επιβίωσης των ασθενών. Παρόμοια αποτελέσματα παρατηρήθηκαν και σε μια πρόσφατη μελέτη για τον καρκίνο του μαστού θεραπεία μοντελοποίηση [1].
(Α) BRCA (Ν
επικαλύπτει
= 178), (Β) COAD (Ν
επικαλύπτει
= 161), (C) LUSC (Ν
επικαλύπτει
= 97), (Δ) OV (Ν
επικαλύπτει
= 145), (Ε) UCEC (Ν
επικαλύπτει
= 84). Για τα αντίστοιχα μοντέλα σε κάθε τύπο καρκίνου, που πραγματοποιήθηκαν 10.000 φορές τυχαίων διάσπαση με 2/3 κατάρτιση και 1/3 δοκιμές χρησιμοποιώντας IDFO αγωγού. Η διακεκομμένη κόκκινο κουτί αναγράφεται η σημαντικά βελτιωμένη απόδοση των δύο ολοκληρωμένων μοντέλων σε (D) OV και (Ε) UCEC σε σύγκριση με τις επιμέρους μοντέλα τύπου δεδομένων (δύο όψεων Wilcoxon signed rank test,
P
& lt? 0,01)? η διακεκομμένη μπλε κουτί αναγράφεται τα τρία επιμέρους μοντέλα τύπου δεδομένων των κ, lnr και meth. Η ολοκληρωμένη ομάδα που αποτελείται από μοντέλα μοριακή υπογραφή τόσο διπλό συνδυασμό και τριπλά-συνδυασμού. Μεμονωμένη ομάδα περιείχε τα τρία επιμέρους μοντέλα μοριακού τύπου δεδομένων. Η γκρίζα γραμμή σε επτά κουτιά δείχνει τα προγνωστικά μοντέλα των ολοκληρωμένων ομάδων και μεμονωμένων ομάδων. Ν
επικαλύπτει
είναι ο αριθμός των δειγμάτων επικάλυψης συνέβη σε όλα τα τρία προφίλ μοριακών δεδομένων (mRNA, lncRNA και μεθυλίωσης του DNA), lnr = lncRNA, mr = mRNA, μεθ = μεθυλίωση του DNA, κ + lnr = mRNA + lncRNA, κ + μεθ = mRNA + μεθυλίωσης του DNA, lnr + μεθ = lncRNA + μεθυλίωσης του DNA, κ + lnr + μεθ = mRNA + lncRNA + μεθυλίωσης του DNA
Η
Η ανάλυση επιβίωσης:. επικύρωση των IDFO προγνωστικών για λογοκρισία στοιχεία επιβίωσης
Εκτός από να εξετάσει τη σχέση μεταξύ προγνωστικοί IDFO και της κλινικής έκβασης σε BRCA, COAD, LUSC, UCEC και OV, υποβάλλαμε τους καλύτερους δείκτες των αντίστοιχων προφίλ δεδομένων στην πολυμεταβλητή Cox παλινδρόμησης αναλογικού κινδύνου ( MCPHR) ανάλυση [41] για την αξιολόγηση της συσχέτισης της IDFO-προγνωστικούς παράγοντες με κίνδυνο την πρόγνωση και τη διερεύνηση των κλινικών υπηρεσιών κοινής ωφελείας τους.
You must be logged into post a comment.