PLoS One: Αναγνώριση του καρκίνου υπότυποι από miRNA-TF-mRNA ρυθμιστικών δικτύων και Έκφραση Δεδομένων


Αφηρημένο

Ιστορικό

Ο εντοπισμός των υποτύπων καρκίνου είναι ένα σημαντικό συστατικό της εξατομικευμένης πλαίσιο φάρμακο. Ένας αυξανόμενος αριθμός υπολογιστικών μεθόδων έχουν αναπτυχθεί για τον προσδιορισμό των υποτύπων του καρκίνου. Ωστόσο, οι υπάρχουσες μέθοδοι σπάνια χρησιμοποιούν πληροφορίες από ρυθμιστικά δίκτυα γονίδιο για να διευκολύνει τον εντοπισμό υπότυπο. Είναι ευρέως αποδεκτό ότι η γονιδιακή ρυθμιστική δίκτυα παίζουν κρίσιμους ρόλους στην κατανόηση των μηχανισμών ασθενειών. Διαφορετικοί υπότυποι του καρκίνου πιθανότατα προκαλείται από διαφορετικούς ρυθμιστικούς μηχανισμούς. Ως εκ τούτου, υπάρχουν μεγάλες ευκαιρίες για την ανάπτυξη μεθόδων που μπορεί να χρησιμοποιήσει τις πληροφορίες του δικτύου για τον εντοπισμό των υποτύπων καρκίνου.

Αποτελέσματα

Στην εργασία αυτή, προτείνουμε μια μέθοδο, σταθμισμένη σύντηξης δίκτυο ομοιότητας (WSNF), για να χρησιμοποιήσει τις πληροφορίες στο συγκρότημα ρυθμιστικού δικτύου miRNA-TF-mRNA για τον εντοπισμό υποτύπους καρκίνου. Έχουμε κατ ‘αρχάς την κατασκευή του κανονιστικού δικτύου, όπου οι κόμβοι αντιπροσωπεύουν τα χαρακτηριστικά, δηλαδή η microRNAs (miRNAs), παράγοντες μεταγραφής (ΤΡ) και αγγελιαφόρο RNA (mRNA που) και οι άκρες δείχνουν τις αλληλεπιδράσεις μεταξύ των χαρακτηριστικών. Οι αλληλεπιδράσεις ανακτώνται από διάφορες διατομικών βάσεις δεδομένων. Στη συνέχεια, χρησιμοποιήστε τις πληροφορίες του δικτύου και τα δεδομένα έκφρασης του miRNAs, TFs και mRNAs για τον υπολογισμό του βάρους από τα χαρακτηριστικά, που αντιπροσωπεύουν το επίπεδο της σημασίας των χαρακτηριστικών. Το βάρος χαρακτηριστικό στη συνέχεια ενσωματώνεται σε μια προσέγγιση σύντηξης δίκτυο να ομαδοποιούνται τα δείγματα (ασθενείς) και έτσι να προσδιορίσει υποτύπους καρκίνου. Εφαρμόσαμε τη μέθοδο μας στην TCGA μαστού διηθητικό καρκίνωμα (BRCA) και πολύμορφο γλοιοβλάστωμα (GBM) σύνολα δεδομένων. Τα πειραματικά αποτελέσματα δείχνουν ότι WSNF συμπεριφέρεται καλύτερα από τις άλλες που χρησιμοποιούνται συνήθως υπολογιστικές μεθόδους, και οι πληροφορίες από ρυθμιστικό δίκτυο miRNA-TF-mRNA συμβάλλει στη βελτίωση των επιδόσεων. Η μέθοδος WSNF εντοπιστεί επιτυχώς πέντε υποτύπους του καρκίνου του μαστού και τρεις υποτύπους GBM που δείχνουν σημαντικά διαφορετικά πρότυπα επιβίωσης. Παρατηρήσαμε ότι τα πρότυπα έκφρασης των χαρακτηριστικών σε ορισμένα miRNA-TF-mRNA υπο-δίκτυα διαφέρουν ανά εντοπιστεί υποτύπους. Επιπλέον, αναλύσεις εμπλουτισμού μονοπάτι δείχνουν ότι η κορυφή πορείες συμμετέχουν οι πλέον διαφορικά εκφρασμένα γονίδια σε κάθε μία από τις προσδιοριζόμενες υποτύπων είναι διαφορετικά. Τα αποτελέσματα θα παρέχουν πολύτιμες πληροφορίες για την κατανόηση των μηχανισμών που χαρακτηρίζουν διαφορετικούς υποτύπους του καρκίνου και να βοηθήσει το σχεδιασμό από θεραπείες περιποίησης. Όλα τα σύνολα δεδομένων και τα σενάρια R για να αναπαράγουν τα αποτελέσματα είναι διαθέσιμα στο διαδίκτυο στην ιστοσελίδα:. https://nugget.unisa.edu.au/Thuc/cancersubtypes/

Παράθεση: Xu Τ, Le TD, Liu L , Wang Ε, Sun B, Li J (2016) Προσδιορισμός του καρκίνου υπότυποι από miRNA-TF-mRNA ρυθμιστικών δικτύων και δεδομένων έκφρασης. PLoS ONE 11 (4): e0152792. doi: 10.1371 /journal.pone.0152792

Επιμέλεια: Bibekanand Mallick, Εθνικό Ινστιτούτο Τεχνολογίας, Rourkela, Ινδία

Ελήφθη: 13, Δεκεμβρίου του 2015? Αποδεκτές: 18 Μαρ, 2016? Δημοσιεύθηκε: 1 Απριλίου 2016

Copyright: © 2016 Xu et al. Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της άδειας χρήσης Creative Commons Attribution, το οποίο επιτρέπει απεριόριστη χρήση, τη διανομή και την αναπαραγωγή σε οποιοδήποτε μέσο, ​​με την προϋπόθεση το αρχικό συγγραφέα και την πηγή πιστώνονται

Δεδομένα Διαθεσιμότητα:. Όλη η δεδομένα είναι εντός του Υποστηρίζοντας αρχεία πληροφοριών του χαρτιού και

Χρηματοδότηση:. η εργασία αυτή έχει υποστηριχθεί εν μέρει από το Συμβούλιο Έρευνας της Αυστραλίας (https://www.arc.gov.au/) Discovery έργου DP130104090 (JL και LL ), και το Εθνικό Ίδρυμα Φυσικών Επιστημών της Κίνας 31371340 (BS), https://www.nsfc.gov.cn/publish/portal1/. Οι χρηματοδότες δεν είχε κανένα ρόλο στο σχεδιασμό της μελέτης, τη συλλογή και ανάλυση των δεδομένων, η απόφαση για τη δημοσίευση, ή την προετοιμασία του χειρογράφου

Αντικρουόμενα συμφέροντα:.. Οι συγγραφείς έχουν δηλώσει ότι δεν υπάρχουν ανταγωνιστικά συμφέροντα

Εισαγωγή

Αντί να είναι μια ενιαία ασθένεια, καρκίνο εμπλέκει διαφορετικούς υποτύπους που χαρακτηρίζονται από διαφορετικά σύνολα μορίων [1, 2]. Ο εντοπισμός των υποτύπων καρκίνου είναι ένα κρίσιμο έργο για την επιλογή της σωστής θεραπείας για τους ασθενείς, όπως διάφορους υποτύπους του καρκίνου μπορεί να ανταποκριθεί καλά σε διαφορετικές θεραπείες περιποίησης. Για παράδειγμα, υποδοχέα οιστρογόνων (ER) του μαστού με θετικούς υπότυπο του καρκίνου θα ανταποκριθεί σε ορμονική θεραπεία, και ο ανθρώπινος παράγοντας υποδοχέα του επιδερμικού αυξητικού 2 (HER2) θετική υποτύπου είναι πιθανό να επωφεληθούν από τη χημειοθεραπεία. Ωστόσο, η τρέχουσα κατανόηση των μηχανισμών που ελέγχουν ο ένας τον υπότυπο καρκίνου είναι ακόμη πολύ από την ολοκλήρωσή της.

Πολλές υπολογιστικές μέθοδοι έχουν αναπτυχθεί για τον προσδιορισμό υποτύπων του καρκίνου. Αυτές οι μέθοδοι εμπίπτουν σε τρεις διαφορετικές ροές της έρευνας. Στο πρώτο ρεύμα, τα εξόρυξη δεδομένων ή μηχανικής μάθησης μοντέλα που κατασκευάστηκαν για να αξιοποιήσει σύνολα δεδομένων γονιδιακής έκφρασης για τα δείγματα ομαδοποίησης (ασθενείς) σε διαφορετικές ομάδες, εκάστη των οποίων αντιστοιχεί σε έναν υπότυπο του καρκίνου [3-7]. Ωστόσο, χρησιμοποιώντας ένα γονιδιωματικό τύπος δεδομένων μπορεί να μην είναι επαρκής για τον εντοπισμό του καρκίνου υποτύπους ακρίβεια. Με την πρόοδο της τεχνολογίας προσδιορισμού της αλληλουχίας, τα πολλαπλών τύπων δεδομένων των ασθενών με καρκίνο, όπως γονιδιωματική, miRNA και συναφή κλινικά δεδομένα που διατίθενται στις μέρες μας. Αυτά πλούτο των συνόλων δεδομένων οδηγούν στο δεύτερο ρεύμα της έρευνας στον οποίο οι ερευνητές αναλύουν διαφορετικούς τύπους δεδομένων χωριστά για τον προσδιορισμό των υποτύπων και τα αποτελέσματα που λαμβάνονται χωριστά στη συνέχεια ενσωματώνονται για να σχηματίσουν το τελικό αποτέλεσμα. Τα κυριότερα σημεία αυτής της προσέγγισης είναι [1, 8-10]. Ωστόσο, ανάλυση των διαφορετικών τύπων δεδομένων χωριστά μπορεί να χάσουν την συμπληρωματική πληροφορία στα δεδομένα των ίδιων ασθενών, και μπορεί να υπάρχει σύγκρουση στα αποτελέσματα που λαμβάνονται με τη χρήση διαφορετικών τύπων δεδομένων. Η τελευταία ρεύμα έρευνα επικεντρώνεται στην ανάλυση των δεδομένων πολλαπλών omics ταυτόχρονα και έχει εντοπίσει κάποια υποτύπους σημαντικό καρκίνο πρόσφατα [11-14].

Ωστόσο, οι πληροφορίες από ρυθμιστικά δίκτυα γονίδιο χρησιμοποιείται σπάνια από το υφιστάμενο υπολογιστικές μεθόδους. Γονίδιο ρυθμιστικά δίκτυα διαδραματίζουν σημαντικό ρόλο σε κάθε διαδικασία της ζωής, και την κατανόηση της δυναμικής των δικτύων αυτών βοηθήσει να αποκαλύψει τους μηχανισμούς των ασθενειών [15]. Αν και η σημασία της πληροφόρησης με βάση το δίκτυο έχει αντιμετωπιστεί με πρόσφατα έργα [16, 17], εξακολουθεί να υπάρχει έλλειψη μεθόδους που χρησιμοποιούν βιολογικές πληροφορίες που προέρχονται από τα δίκτυα για τον εντοπισμό των υποτύπων καρκίνου. Επιπλέον, παραμένει μια μεγάλη πρόκληση να συνδέσει τα δεδομένα πολλαπλών omics και πληροφορίες του δικτύου με τους υποτύπους του καρκίνου και τα αποτελέσματα, ιδίως πρόγνωση. Πρόσφατα, Liu et al. [18] πρότεινε την NCIS μέθοδο (δίκτυο-υποβοηθούμενη συν-ομαδοποίηση για τον προσδιορισμό των υποτύπων καρκίνου) να χρησιμοποιούν τα προφίλ έκφρασης των mRNAs και τις πληροφορίες δικτύου των αλληλεπιδράσεων mRNA-mRNA με μια μέθοδο δι-ομαδοποίηση για να ανακαλύψει υποτύπους καρκίνου. Ωστόσο, το γονίδιο ρυθμιστικά δίκτυα είναι πολύπλοκα και περιλαμβάνουν πολλά είδη των ρυθμιστικών αρχών συμπεριλαμβανομένων των miRNAs και ΤΡ. Είναι ενδιαφέρον να χρησιμοποιήσουν τις πληροφορίες στα δίκτυα που περιλαμβάνουν miRNAs, ΤΡ, και mRNAs για τον εντοπισμό των υποτύπων καρκίνου. Οι πληροφορίες που μπορεί όχι μόνο να βελτιώσει την ακρίβεια των υπολογιστικών μοντέλων, αλλά και να παρέχει γνώσεις σχετικά με τους μηχανισμούς (οι ρυθμιστικές δίκτυα) που ρυθμίζει κάθε υπότυπο του καρκίνου.

Στην εργασία αυτή, προτείνουμε μια μέθοδο, που ονομάζεται σταθμισμένη ομοιότητα σύντηξης δικτύου (WSNF), για τον προσδιορισμό των υποτύπων καρκίνου κάνοντας χρήση τόσο των πληροφοριών δεδομένων έκφρασης και του δικτύου των miRNAs, TFs και mRNA. Λαμβάνοντας υπόψη ένα σύνολο δεδομένων που περιέχει τα προφίλ έκφρασης ενός συνόλου miRNAs, TFs και mRNAs (γνωστά ως χαρακτηριστικά στο υπόλοιπο του χαρτιού), WSNF ανακτά κατ ‘αρχάς τις αλληλεπιδράσεις μεταξύ αυτών των χαρακτηριστικών από διαφορετικές interatomic βάσεις για την κατασκευή του κανονιστικού δικτύου miRNA-TF-mRNA . Στο δίκτυο, τα χαρακτηριστικά αντιπροσωπεύονται από τους κόμβους και τις αλληλεπιδράσεις μεταξύ των χαρακτηριστικών που υποδεικνύεται από τις άκρες. Στη συνέχεια, τον υπολογισμό του βάρους (δηλ σημασία) ενός χαρακτηριστικού με τη χρήση των πληροφοριών δικτύου miRNA-TF-mRNA και η διακύμανση της έκφρασης των χαρακτηριστικών. Τέλος, μπορούμε να τροποποιήσει την προσέγγιση [11] σύντηξης δίκτυο ομοιότητας (ΙΣΝ) να αναλάβει το βάρος χαρακτηριστικό υπόψη κατά την ομαδοποίηση των ασθενών για τον εντοπισμό των υποτύπων καρκίνου.

Έχουμε εφαρμόσει τη μέθοδο WSNF στον καρκίνο του μαστού TCGA και σύνολα δεδομένων GBM. Τα πειραματικά αποτελέσματα δείχνουν ότι η μέθοδος μας έχει εντοπίσει επιτυχώς πέντε υποτύπους καρκίνου του μαστού και τρεις υποτύπους GBM που έχουν σημαντικά διαφορετικά μοτίβα επιβίωση. Οι πληροφορίες από την κανονιστική δίκτυο miRNA-TF-mRNA βελτιώνει την απόδοση της προσέγγισης σύντηξης δικτύου, όπως η μέθοδος WSNF αποδίδει καλύτερα από τα δύο ΙΣΝ [11], η μέθοδος της σύντηξης του δικτύου χωρίς τη χρήση βάρους χαρακτηριστικό και NCIS [18] που χρησιμοποιεί μόνο mRNA δεδομένα έκφρασης και τις αλληλεπιδράσεις του mRNA-mRNA. Μπορούμε επίσης να συγκρίνουμε τη μέθοδό μας με Συναίνεση ομαδοποίησης (CC) [7], μια μέθοδος που χρησιμοποιείται ευρέως στην έρευνα TCGA. Τα πειραματικά αποτελέσματα δείχνουν ότι η μέθοδος WSNF έχει επίσης καλύτερη απόδοση τόσο με το καρκίνο του μαστού και των συνόλων δεδομένων GBM. Για το σύνολο δεδομένων του καρκίνου του μαστού, αναλύουμε τις εντοπίστηκαν υποτύπους λεπτομερώς και να αναφέρουν τα αποτελέσματα σε σχέση με τα πρότυπα έκφρασης, τις διαφορές των ρυθμιστικών δικτύων miRNA-TF-mRNA μεταξύ των διαφόρων υποτύπων, και τα λειτουργικά μονοπάτια που χαρακτηρίζουν κάθε υπότυπο. Οι πληροφορίες μπορεί να είναι πολύτιμη για την ενίσχυση του σχεδιασμού θεραπεία συγκεκριμένων υποτύπων καρκίνου του μαστού.

Υλικά και Μέθοδοι

Επισκόπηση Μέθοδος

Σας προτείνουμε να χρησιμοποιήσετε το miRNA-TF-mRNA ρυθμιστικών δίκτυο για να βοηθήσει την ταυτοποίηση των υποτύπων καρκίνου. Υπάρχουν τρία βασικά βήματα στη μέθοδο WSNF (Σχήμα 1), συμπεριλαμβανομένων των: 1) την κατασκευή κανονιστικού δικτύου miRNA-TF-mRNA, 2) τον υπολογισμό του βάρους για κάθε χαρακτηριστικό (miRNA, TF, mRNA), και 3) την τροποποίηση και την εφαρμογή του προσέγγιση ομοιότητα δίκτυο σύντηξης [11] για τον προσδιορισμό υποτύπων του καρκίνου, λαμβάνοντας παράλληλα το βάρος χαρακτηριστικό υπόψη. Έχουμε περιγράψει τις λεπτομέρειες κάθε βήμα παρακάτω.

Στο βήμα 1, οι αλληλεπιδράσεις μεταξύ miRNAs, TFs και mRNAs που προέρχονται από τις βάσεις δεδομένων που χρησιμοποιούνται για την κατασκευή του κανονιστικού δικτύου miRNA-TF-mRNA. Στο βήμα 2, η κατάταξη του κάθε χαρακτηριστικό (R) υπολογίζεται με βάση τα στοιχεία του δικτύου, καθώς και τα στοιχεία των γονιδίων και της έκφρασης των miRNAs που χρησιμοποιείται για να πάρει τη διακύμανση έκφρασης χαρακτηριστικό (MAD) σε όλα τα δείγματα. Στη συνέχεια, για κάθε χαρακτηριστικό, την κατάταξή του και την παραλλαγή της έκφρασης συνδυάζονται για να αποκτήσουν το βάρος του (W). Στο βήμα 3, οι σταθμισμένες δίκτυα ομοιότητα δείγμα που λαμβάνεται από γονίδια (mRNA, ΤΡ) και miRNAs ξεχωριστά χρησιμοποιώντας τα βάρη και τα δεδομένα έκφραση των χαρακτηριστικών, και, τέλος, το δίκτυο σύντηξης και ομαδοποίηση εκτελούνται για να βρείτε τις ομάδες ασθενών που συνεπάγεται υποτύπων καρκίνου.

Κατασκευάζοντας το miRNA-TF-mRNA κανονιστικού δικτύου

σε αυτό το βήμα, χρησιμοποιούμε μια ποικιλία πηγών για την κατασκευή των δικτύων αλληλεπίδρασης miRNA-TF-mRNA. Το δίκτυο περιέχει διαφορετικούς τύπους αλληλεπιδράσεων, συμπεριλαμβανομένων εκείνων μεταξύ miRNA-mRNA, miRNA-TF, TF-miRNA, TF-mRNA, TF-TF, και mRNA-mRNA. Σχήμα 2 δείχνει τις λεπτομέρειες των πηγών δεδομένων για την ανάκτηση των διαφόρων αλληλεπιδράσεων τύπου. Στο σχήμα, κάθε τύπος των αλληλεπιδράσεων αναπαρίσταται ως ένα σύνδεσμο, όπου η πηγή είναι ο ρυθμιστής και το τέλος βέλος είναι ο στόχος. Οι πηγές δεδομένων που παρατίθενται δίπλα σε κάθε είδος των αλληλεπιδράσεων.

Η

Εμείς κατ ‘αρχάς να πάρετε τον κατάλογο των TFs συνδυάζοντας την TFs στην Εγκυκλοπαίδεια του DNA Elements (ΚΩΔΙΚΟΠΟΙΗΣΗ) δεδομένα τσιπ επόμενα, TransmiR [19 ] και συντελεστές FANTOM5 Ανθρωπίνων μεταγραφής που είναι διαθέσιμα σε https://fantom.gsc.riken.jp/5/sstar/Browse_Transcription_Factors_hg19. Τέλος, μια λίστα των 1679 TFs λαμβάνεται (δείτε το αρχείο S1 για τη λίστα).

Όπως φαίνεται στο Σχήμα 2, παίρνουμε τις αλληλεπιδράσεις miRNA-mRNA και miRNA-TF από πειραματικά επιβεβαιώνεται βάσεις δεδομένων, συμπεριλαμβανομένων Tarbase [20 ], mirTarbase [21], mirRecords [22], και η βάση δεδομένων πρόβλεψης starbase v2.0 [23]. Tarbase, mirTarbase και mirRecords περιλαμβάνουν τις επιμέλεια επιβεβαίωσε αλληλεπιδράσεις από τη βιβλιογραφία. starbase v2.0 περιέχει την ένωση των συνόλων των αλληλεπιδράσεων miRNA-mRNA που προβλέπονται από τα προγράμματα λογισμικού πρόβλεψης στόχου πέντε miRNA (TargetScan, PicTar, ΠΙΤΑ, Miranda και RNA22). Ελέγχει, επίσης, κάθε ένα από τα ζεύγη αλληλεπίδρασης miRNA-mRNA με βάση TCGA Pan-καρκίνου [24] σύνολα δεδομένων έκφρασης. Το κριτήριο της δοκιμής επικύρωσης είναι η αντι-συσχέτιση με αρνητικό συντελεστή συσχέτισης Pearson (

σ

-τιμή & lt? 0,05) μεταξύ ενός miRNA και το στόχο της. Στο δίκτυό μας, χρησιμοποιούμε τις αλληλεπιδράσεις miRNA-mRNA σε starbase v2.0 που υποστηρίζονται από τουλάχιστον ένα TCGA Pan-καρκίνου του συνόλου δεδομένων έκφρασης. Επιπλέον, οι αλληλεπιδράσεις miRNA-mRNA που προέρχεται από τα δεδομένα ΚΩΔΙΚΟΠΟΙΗΣΗ [25] χρησιμοποιούνται επίσης στην εργασία μας. Οι αλληλεπιδράσεις είναι διαθέσιμα στη διεύθυνση:. https://encodenets.gersteinlab.org/

Οι αλληλεπιδράσεις mRNA-mRNA που ανακτώνται από Reactome [26] και STRING v10.0 [27]. Από που περιέχονται στο Reactome και STRING είναι τα ζεύγη αλληλεπίδρασης πρωτεΐνης-πρωτεΐνης, χρησιμοποιούμε το

org.Hs.eg.db

πακέτο R [28] για να χαρτογραφήσει την πρωτεΐνη-γονίδιο σχολιασμό για να πάρει το αντίστοιχο mRNA-mRNA ζεύγη αλληλεπίδρασης. Επιλέγουμε το σκορ cut-off ως 0,9 στην STRING v10.0 για να επιλέξετε τα ζεύγη mRNA-mRNA της υψηλής αξιοπιστίας για το δίκτυό μας.

Για ρύθμιση TF, παίρνουμε τις αλληλεπιδράσεις μεταξύ των TF-mRNA από το τσιπ ΚΩΔΙΚΟΠΟΙΗΣΗ -SEQ δεδομένων [29] και μεταγραφικό ρυθμιστικό στοιχείο βάσης δεδομένων (TRED) [30]. Οι ΚΩΔΙΚΟΠΟΙΗΣΗ τσιπ επόμενα δεδομένα σε UCSC γονιδίωμα Browser επεξεργασία χρησιμοποιώντας το υπολογιστικό αγωγό για τη δημιουργία ενιαίων κορυφές των δεσμευτικών TF. TRED είναι ένα ολοκληρωμένο αποθετήριο για τις δύο cis και trans-ρυθμιστικά στοιχεία. Περιέχει την επιμέλεια της μεταγραφής πληροφορίες ρύθμιση, συμπεριλαμβανομένου του μεταγραφικού παράγοντα μοτίβα και πειραματικές αποδείξεις δέσμευσης. Έχουμε ανακτήσει τις αλληλεπιδράσεις TF-TF από Reactome και STRING, με τη χαρτογράφηση σχολιασμό πρωτεΐνη-γονιδίου, όπως ότι για να πάρει τις αλληλεπιδράσεις TF-TF. Για το δίκτυό μας, οι TF-miRNA αλληλεπιδράσεων που προέρχονται από δύο πηγές: TransmiR [19], καθώς και τα συμπληρωματικά στοιχεία [25], που είναι επίσης διαθέσιμο σε https://encodenets.gersteinlab.org/

Υπολογισμός χαρακτηριστικό. βάρη

με την προτεινόμενη μέθοδο WSNF, υπολογίζουμε το βάρος ενός χαρακτηριστικού σε δύο στάδια. Πρώτον, χρησιμοποιούμε τις πληροφορίες του δικτύου miRNA-TF-mRNA κατασκευάστηκε στο προηγούμενο βήμα για να ταξινομήσει τις λειτουργίες. Στη συνέχεια, τα δεδομένα έκφρασης χρησιμοποιείται για την εύρεση της μεταβολής έκφραση κάθε χαρακτηριστικό σε όλες τα δείγματα στα σύνολα δεδομένων. Επιτέλους, το βάρος ενός χαρακτηριστικού επιτυγχάνεται με το συνδυασμό παραλλαγή κατάταξη και η έκφρασή της

Στάδιο 1:.. Computing κατάταξη των χαρακτηριστικών χρησιμοποιώντας το Google PageRank

Η Google PageRank [31, 32] είναι μια αλγόριθμος που χρησιμοποιήθηκε αρχικά για να κατατάξουν το τεράστιο αριθμό των ιστοσελίδων από το Google Search. Βασίζεται σε ένα κατευθυνόμενο γράφημα

G

(

V

,

E

), όπου οι κόμβοι

V

αντιπροσωπεύουν τις ιστοσελίδες και τις άκρες

E

δείχνουν τις υπερ-συνδέσεις μεταξύ των ιστοσελίδων. Η βασική παραδοχή είναι ότι ένα σημαντικό ιστοσελίδας είναι πιθανότερο να έχουν περισσότερες εισερχόμενες συνδέσεις από άλλες ιστοσελίδες. Ας υποθέσουμε ότι υπάρχουν

Ν

ιστοσελίδες {

σ

1,

σ

2, …,

σ

Ν

}. Η κατάταξη μιας ιστοσελίδας

σ

i

ορίζεται ως εξής: (1) όπου

PR

(

σ

i

) και

PR

(

σ

ι

) είναι οι βαθμολογίες των ιστοσελίδων

σ

i

και

σ

ι

αντίστοιχα, με το

σ

i συζητήσεων ←

p

ι

?

δ

είναι ο συντελεστής απόσβεσης που είναι σαν μια πιθανότητα click-through χρησιμοποιούνται για να διασπαστεί η κατάταξη των ιστοσελίδων χωρίς εξερχόμενες συνδέσεις, και 0 & lt?

δ

& lt? 1?

Μ

(

σ

i

) είναι το σύνολο των ιστοσελίδων που συνδέονται με

σ

i

? και

L

(

σ

ι

) είναι ο αριθμός των εξερχόμενων συνδέσεων από

σ

ι

. Έτσι, μια ιστοσελίδα

σ

i

θα έχουν υψηλή κατάταξη εάν συνδέεται με πολλά άλλα υψηλόβαθμα ιστοσελίδες

σ

ι

. Για ενδιαφερόμενους αναγνώστες, η σύγκλιση και υπολογισμού του PageRank χρησιμοποιώντας την παραπάνω επαναληπτική τύπο (δηλαδή την εξίσωση 1) απεικονίζεται στο [33, 34].

Για την περίπτωση μας αξιοποιώντας κανονιστικού δικτύου miRNA-TF-mRNA σε κατάταξη ένα χαρακτηριστικό, ένα μοριακό ρυθμιστική πολλοί στόχοι είναι σημαντική. Σε miRNA-TF-mRNA του δικτύου μας, που συμβολίζεται ως

G

(

V

,

E

), οι κόμβοι

V

είναι τα χαρακτηριστικά (miRNAs , TFs και mRNAs) και οι άκρες

E

είναι οι αλληλεπιδράσεις μεταξύ των ρυθμιστικών αρχών και των στόχων τους. Η κατεύθυνση του άκρου είναι από ένα ρυθμιστή για το στόχο του. Ένα σημαντικό ρυθμιστή είναι ανάλογη με μια σημαντική ιστοσελίδα σε PageRank που πολλές άλλες ιστοσελίδες συνδέουν, εκτός από το ότι ο ρυθμιστής έχει πολλές συνδέσεις βγαίνει από αυτό με τους στόχους της. Ας υποθέσουμε ότι υπάρχουν

Ν

χαρακτηριστικά {

στ

1,

στ

2, …,

στ

Ν

}. Η κατάταξη (κανονιστική σημασία) ενός χαρακτηριστικού

στ

i

μπορεί να οριστεί ως εξής χρησιμοποιώντας έναν τροποποιημένο αλγόριθμο PageRank: (2) όπου

R

(

στ

i

) και

R

(

στ

ι

) είναι οι βαθμολογίες των χαρακτηριστικών

στ

i

και

στ

ι

αντίστοιχα, με το

στ

i

στ

ι

?

δ

είναι η η απόσβεση παράγοντα, και 0 & lt?

δ

& lt? 1?

T

(

στ

i

) είναι το σύνολο των στόχων που

στ

i

ρυθμίζει ? και

L

(

στ

ι

) είναι ο αριθμός των ρυθμιστικών αρχών που ρυθμίζουν

στ

ι

Τα σενάρια R και Matlab της πληροφορικής τη δυνατότητα κατάταξη από το ρυθμιστικό δίκτυο miRNA-TF-mRNA παρέχεται στο S2 αρχείου

Στάδιο 2:… Ενσωμάτωση χαρακτηριστικό κατάταξης και παραλλαγή χαρακτηριστικό

Η μεταβολή της έκφρασης σε ολόκληρη δείγματα είναι ένας σημαντικός δείκτης για την έρευνα του καρκίνου γονιδιωματικής δεδομένων. Τα χαρακτηριστικά (π.χ. γονίδια) με υψηλότερες διακυμάνσεις έκφραση αντιμετωπίζονται πάντα ως πιο σημαντικό βιολογικό δείκτη σε μηχανισμούς του καρκίνου. Χρησιμοποιούμε τη μέση απόλυτη απόκλιση (MAD) να εκπροσωπεί την παραλλαγή έκφραση ενός χαρακτηριστικού. Το MAD ενός χαρακτηριστικού

στ

i

υπολογίζεται ως εξής: (3) όπου

X

(

στ

i

) είναι ένα αριθμητικό διάνυσμα που αντιπροσωπεύει τις αξίες έκφραση λειτουργία

στ

i

σε όλα τα δείγματα (ασθενείς).

Για να ενσωματώσει το παραλλαγή χαρακτηριστικό με δυνατότητα κατάταξης, NCIS [18] ακολουθεί την ιδέα της GeneRank [35] για να αντικαταστήσει απλά το μέρος [] αλγόριθμο PageRank της Google με το MAD για να ληφθεί το τελικό βάρος ενός χαρακτηριστικού. Ωστόσο, διαπιστώνουμε ότι το τελικό βάρος που λαμβάνεται με αυτόν τον τρόπο τόσο από GeneRank και NCIS συσχετίζεται έντονα με το βάρος χαρακτηριστικό που υπολογίζονται άμεσα με την εξίσωση 2, δηλαδή χωρίς τη χρήση MAD. Η ισχυρή συσχέτιση συνεπάγεται ότι η προσέγγιση που ακολουθείται από τις δύο μεθόδους ενσωμάτωσης των MAD δεν είναι αποτελεσματική καθώς οι πληροφορίες διακύμανση έκφραση δεν αντικατοπτρίζεται από το τελικό βάρος που λαμβάνεται χρησιμοποιώντας την προσέγγισή τους. Τα λεπτομερή αποτελέσματα σε αυτό το εύρημα φαίνεται στο S3 αρχείου.

Για να ξεπεραστεί αυτό το πρόβλημα, υιοθετούμε ένα γραμμικό μοντέλο να ενσωματώσει αποτελεσματικά τη δυνατότητα κατάταξης και τη διακύμανση χαρακτηριστικό σε αυτό το χαρτί. Εμείς πρώτον εξομαλύνει τη λειτουργία κατάταξη που λαμβάνεται από την κανονιστική δίκτυο miRNA-TF-mRNA και παραλλαγή χαρακτηριστικό από τα δεδομένα της έκφρασης ως εξής: (4) (5)

Ένα γραμμικό μοντέλο εφαρμόζεται στη συνέχεια να ενσωματώσουν αυτά τα δύο μέτρα για να πάρετε το τελικό βάρος για κάθε χαρακτηριστικό. (6) όπου

β

είναι μια παράμετρος ρύθμισης για τη σημασία των πληροφοριών κανονιστικού δικτύου miRNA-TF-mRNA. Όσο μεγαλύτερη είναι η τιμή του

β

είναι το πιο σημαντικό ρόλο τα στοιχεία του κανονιστικού δικτύου miRNA-TF-mRNA θα παίξει για τον υπολογισμό του τελικού βάρους των χαρακτηριστικών. Στα πειράματά μας, θέτουμε

β

σε 0,8 να επικεντρωθεί περισσότερο στις πληροφορίες του δικτύου για τον καρκίνο υπότυπο ανακάλυψη.

Σταθμισμένη σύντηξης δίκτυο ομοιότητας

Χρησιμοποιούμε τις πληροφορίες χαρακτηριστικό βάρους για να βοηθήσει την ταυτοποίηση των υποτύπων του καρκίνου από τα δεδομένα γονιδιακής έκφρασης και δεδομένα έκφρασης miRNA. Για το σκοπό αυτό, τροποποιούμε την σύντηξη δίκτυο ομοιότητα (SNF) μέθοδος [11] για να συμπεριλάβει το βάρος χαρακτηριστικό που ελήφθη στο προηγούμενο στάδιο στη διαδικασία της ταξινόμησης του καρκίνου υπότυπο.

SNF είναι ένα πολυ-omics μέθοδος επεξεργασίας δεδομένων ότι κατασκευάζει ένα σύντηξης δίκτυο ομοιότητα ασθενή με την ενσωμάτωση της ομοιότητας ασθενής που λαμβάνεται από κάθε μία από τις γονιδιωματικές τύπων δεδομένων. SNF υπολογίζει την ομοιότητα μεταξύ των ασθενών που χρησιμοποιούν ο ένας τον ενιαίο τύπο δεδομένων χωριστά. Οι ομοιότητες μεταξύ των ασθενών από τους διάφορους τύπους δεδομένων στη συνέχεια ενσωματώνονται με μια διαδικασία διάχυσης εγκάρσια δίκτυο για την κατασκευή της σύντηξης μήτρα ομοιότητας των ασθενών. Τέλος, μια μέθοδος ομαδοποίησης εφαρμόζεται στη μήτρα σύντηξης ομοιότητας των ασθενών να συγκεντρωθούν οι ασθενείς σε διαφορετικές ομάδες, οι οποίες συνεπάγονται διαφορετικούς υποτύπους του καρκίνου.

Το βασικό στάδιο της SNF είναι να καθορίσει την ομοιότητα μεταξύ των ασθενών, καθώς θα πρέπει να διαστρωμάτωση παρόμοιους ασθενείς στην ίδια ομάδα (υπότυπος). Ευκλείδεια απόσταση χρησιμοποιείται σε ΙΣΝ για τη μέτρηση της ομοιότητας μεταξύ των ασθενών σε ενιαίο γονιδιωματική τύπο δεδομένων, όπου, όμως, όλες οι λειτουργίες αντιμετωπίζονται ως εξίσου σημαντική. Ας υποθέσουμε ότι υπάρχει ένα σύνολο δεδομένων προφίλ έκφρασης (

ν

ασθενείς ×

σ

χαρακτηριστικά), τότε η Ευκλείδεια απόσταση μεταξύ των ασθενών

S

i

και τον ασθενή

S

ι

είναι: (7), όπου και βρίσκονται οι τιμές έκφραση

στ

m

στην ασθενείς ηλικίας

S

i

και

S

ι

, αντίστοιχα.

Έχουμε τροποποιήσει την απόσταση των ασθενών τύπο ως εξής αναλάβει το βάρος του κάθε χαρακτηριστικό γνώρισμα υπόψη: (8)

Με τη χρήση της παραπάνω τροποποιημένο δείγματα τύπο απόστασης, η προτεινόμενη μέθοδος WSNF θεωρεί ομοιότητα των δύο ασθενών με βάση όχι μόνο τη συνολική διαφορά μεταξύ των επιπέδων έκφρασης από όλα τα χαρακτηριστικά τους, αλλά και τη σημασία (βάρος) του κάθε ένα από τα χαρακτηριστικά γνωρίσματα. Όπως έχουμε κάνει χρήση των πληροφοριών που miRNA-TF-mRNA του δικτύου κατά τον υπολογισμό του βάρους χαρακτηριστικό και η μέθοδός μας αντιμετωπίζει διαφορετικά χαρακτηριστικά διαφορετικά, θα δούμε στο Αποτελέσματα και συζήτηση τμήματος που WSNF ξεπερνά σημαντικά το ΙΣΝ και τις άλλες μεθόδους που χρησιμοποιούνται συνήθως για τον εντοπισμό υποτύπων καρκίνου.

Αποτελέσματα και Συζήτηση

Σύνολα

Στην εργασία αυτή, χρησιμοποιούμε τα BRCA και GBM σύνολα δεδομένων από τον καρκίνο Genome Atlas (TCGA) για τα πειράματά μας, συμπεριλαμβανομένης της γονιδίου (mRNA και TF) στοιχεία έκφρασης, στοιχεία έκφρασης των miRNAs και κλινικά δεδομένα (συνολικός χρόνος επιβίωσης, κατάσταση επιβίωσης και κάποιες κλινικές συμπαράγοντες). Τα δείγματα Επίπεδο 3 TCGA όγκου κατεβάσει από το Broad GDAC Firehose (timestamp: 04/02/2015). Για να πάρετε το μεγαλύτερο αριθμό αντίστοιχα δείγματα για τους δύο καρκίνους, χρησιμοποιούμε RNASeq και miRNAHiseq δεδομένων για τα δεδομένα BRCA και μικροσυστοιχιών για την GBM.

Τα γονίδια και τα miRNAs με πολύ χαμηλά επίπεδα έκφρασης και χαμηλή διαφορές μεταξύ των δειγμάτων αφαιρεθεί. Τα διαφορετικά σημεία αποκοπής επιλέγονται με βάση τα χαρακτηριστικά της διανομής των συνόλων δεδομένων BRCA και GBM (δείτε το S3 αρχείου). Για τα σύνολα δεδομένων BRCA RNASeq και miRNAHiseq, έχουμε κατ ‘αρχάς να χρησιμοποιήσετε το

συνδεθείτε

2 μετατροπή σε προ-επεξεργασία τους, η οποία συνήθως χρησιμοποιείται για τα δεδομένα του RNA-αλληλουχίας όπως εισήχθη στο

DESeq2

[36] πακέτο R . Υπολογίζουμε τη μέση τιμή για κάθε χαρακτηριστικό των δειγμάτων και αφαιρέστε τα γονίδια% 25 και 60% miRNAs με χαμηλό μέσο όρο έκφρασης. Στη συνέχεια, η τυπική απόκλιση του κάθε γονιδίου και miRNA υπολογίζεται, και τα γονίδια και miRNAs με τυπική απόκλιση μικρότερη από 0,5 αφαιρούνται επίσης. Για τα δεδομένα μικροσυστοιχιών GBM, υπάρχουν κάποιες λείπουν παρατηρήσεις. Έχουμε κατ ‘αρχάς εφαρμόσει τον καταλογισμό χρησιμοποιώντας το

καταλόγισε

pacakage R [37]. Στη συνέχεια, υπολογίζουμε την τυπική απόκλιση του κάθε γονιδίου και miRNA. Τα γονίδια με τυπική απόκλιση μικρότερη από 0,6 και των miRNAs με τυπική απόκλιση μικρότερη από 0,2 αφαιρεθεί. Η λεπτομερής διαδικασία επεξεργασίας των συνόλων δεδομένων που καταγράφονται στο S3 αρχείου. Στο τέλος, υπάρχουν 587 αντίστοιχα δείγματα σε BRCA με 12.233 mRNA, 1338 TFs και 361 miRNAs. Εν τω μεταξύ, για GBM υπάρχουν 276 αντίστοιχα δείγματα με 10.278 mRNA, 1.083 TFs και 287 miRNAs (δείτε το S3 αρχείου).

Δίκτυο κατασκευή

Όπως αναφέρεται στα Υλικά και Μέθοδοι τμήμα, χρησιμοποιούμε διάφορες δημόσιες βάσεις δεδομένων για να κατασκευάσει το ρυθμιστικό δίκτυο miRNA-TF-mRNA. Ο Πίνακας 1 δείχνει τον αριθμό των αλληλεπιδράσεων από τις πηγές δεδομένων για την κατασκευή των ρυθμιστικών δικτύων όσον αφορά τη δέσμη BRCA. Ανάλογες πληροφορίες για το σύνολο δεδομένων GBM είναι στο S3 αρχείου.

Η

Τα προσδιορίζονται υπότυποι έχουν σημαντικά διαφορετικά μοτίβα επιβίωση

Με τα κατασκευαστεί δίκτυα και το BRCA και σύνολα δεδομένων έκφρασης GBM, WSNF προσδιορίζει πέντε υποτύπους καρκίνου του μαστού και τρεις υποτύπους GBM. Τα προσδιοριζόμενα υποτύπων του καρκίνου και των σχετικών κλινικών πληροφοριών για τον καρκίνο του μαστού και GBM δίνονται στο S4 και S5 αρχεία. Να εκτιμήσει πόσο καλά η μέθοδός μας έχει αποδώσει στον εντοπισμό των υποτύπων καρκίνου, διεξάγουμε ανάλυση επιβίωσης των προσδιορισμένων υποτύπων καρκίνου. Τα σχήματα 3 και 4 δείχνουν τις καμπύλες επιβίωσης των ασθενών στις πέντε υποτύπους του BRCA και των τριών υποτύπων του GBM, αντίστοιχα. Η

p-τιμές

από τις δοκιμές Log-rank [38] είναι 0,00483 για BRCA και 0,00279 για GBM. Οι p-τιμές δείχνουν ότι οι προσδιορίζονται υποτύπους σε δύο σύνολα δεδομένων έχουν σημαντικά διαφορετικά μοτίβα επιβίωση, υποδεικνύοντας διαφορετικών υποτύπων καρκίνου αντίστοιχα.

ι

,

ν

ι

,

s

i

στο οικόπεδο Silhouette είναι ετικέτα υπότυπο, ο αριθμός των ασθενών με τον υπότυπο και το πλάτος Silhouette για τον ασθενή

i

, αντίστοιχα.

Η

ι

,

ν

ι

,

s

i

στο οικόπεδο Silhouette είναι ετικέτα υπότυπο, ο αριθμός των ασθενών με τον υπότυπο και το πλάτος Silhouette για τον ασθενή

i

, αντίστοιχα.

η

Επίσης, χρησιμοποιούμε το πλάτος Silhouette [39] και το μαύρο-άσπρο heatmap για να αποδειχθεί η συνοχή των δειγμάτων (ασθενείς) σε κάθε υπότυπο και η διαφορά μεταξύ των διαφόρων υποτύπων, αντίστοιχα. Όπως φαίνεται στα Σχήματα 3 και 4, οι συνολικές τιμές πλάτους μέσος Silhouette είναι θετικά τόσο για BRCA και GBM. Σημειώστε ότι η τιμή του πλάτους Silhouette είναι θετική εάν τα δείγματα σε κάθε υπότυπο είναι συνεπείς, και αρνητικές διαφορετικά. Εν τω μεταξύ, οι μαύρο-άσπρο θερμικούς χάρτες που δημιουργείται από τη μήτρα του δείγματος ομοιότητας με την τακτοποίηση των δειγμάτων σύμφωνα τις ετικέτες συμπλέγματος. Τα όρια κατηγορία για όλους τους υποτύπους είναι πολύ σαφείς. Ειδικότερα, το τρίτο υπότυπος του BRCA έχει μία τιμή πλάτους υψηλή σιλουέτα και ένα σαφή αντίθεση στο μαύρο-άσπρο heatmap, γεγονός που υποδηλώνει μοναδικά χαρακτηριστικά των ασθενών σε αυτή υπότυπο.

Οι πληροφορίες δίκτυο βελτιώνει την ταυτοποίηση του καρκίνου υπότυποι

Για να διερευνήσουν κατά πόσον οι πληροφορίες από την κανονιστική δίκτυο miRNA-TF-mRNA στην πραγματικότητα βοηθά στη βελτίωση της αναγνώρισης των υποτύπων καρκίνου, συγκρίνουμε την μέθοδο WSNF με τις προηγουμένως προτεινόμενες μεθόδους συμπεριλαμβανομένων NCIS [18], Συναίνεση ομαδοποίησης (CC ) [7], και SNF [11]. NCIS χρησιμοποιεί δεδομένα γονιδιακής έκφρασης και της πληροφόρησης από τις αλληλεπιδράσεις mRNA-mRNA. CC είναι η συχνά χρησιμοποιούμενη μέθοδος ομαδοποίησης σε ερευνητικές εργασίες TCGA [1, 8, 40-42], με βάση την ενιαία γονιδιωματικής τύπο δεδομένων. SNF είναι η μέθοδος πολλαπλών συγχώνευσης δεδομένων γονιδιώματος και ομαδοποίηση, αλλά δεν χρησιμοποιεί τις πληροφορίες από τις ρυθμιστικές δίκτυα γονιδίων. Για να κάνετε μια δίκαιη σύγκριση, από τα επεξεργασμένα σύνολα δεδομένων μας (BRCA & amp? GBM) και κατασκευάστηκε ρυθμιστικών δικτύων miRNA-TF-mRNA, χρησιμοποιούμε τα δεδομένα γονιδιακής έκφρασης και να εξαγάγετε τις αλληλεπιδράσεις mRNA-mRNA ως είσοδος για NICS. Εμείς ενώσετε τα κανονικοποιημένα δεδομένα γονιδιακής έκφρασης και τα δεδομένα έκφρασης των miRNAs κανονικοποιούνται για κάθε ασθενή, καθώς τα δεδομένα εισόδου για το CC. Οι είσοδοι του ΙΣΝ είναι τα δεδομένα γονιδιακής έκφρασης και τα δεδομένα της έκφρασης των miRNAs. Οι είσοδοι της μεθόδου WSNF μας είναι τα δεδομένα γονιδιακής έκφρασης, τα δεδομένα έκφρασης των miRNAs και τα ρυθμιστικά δίκτυα miRNA-TF-mRNA. Διεξάγουμε τις αναλύσεις επιβίωσης για τις προσδιοριζόμενες υποτύπους από κάθε μία από τις μεθόδους και συγκρίνετε τις

σ

τιμαί των δοκιμών Log-rank [38] για την αξιολόγηση της σημασίας των διαφορετικών κατανομών επιβίωσης σε όλη υποτύπους.

από τον πίνακα 2, βλέπουμε ότι WSNF έχει σημαντικά χαμηλότερο

σ

-τιμές σε σχέση με άλλες κοινές μεθόδους τόσο στο BRCA και σύνολα δεδομένων GBM. Όταν

β

έχει οριστεί σε 1, το βάρος για τα χαρακτηριστικά είναι εντελώς καθορίζεται από την κανονιστική δίκτυο miRNA-TF-mRNA. Τα αποτελέσματα δείχνουν ότι η μέθοδος WSNF είναι καλύτερη από τις άλλες υπάρχουσες μεθόδους, γεγονός που υποδηλώνει ότι οι πληροφορίες από την κανονιστική δίκτυο miRNA-TF-mRNA συμβάλλει στη βελτίωση της ταυτοποίησης των υποτύπων. Παρατηρούμε επίσης ότι η μέθοδος αποδίδει πολύ καλά και στα δύο σύνολα δεδομένων όταν

β

είναι 0.8 (η οποία είναι η προεπιλεγμένη τιμή που χρησιμοποιείται για

β

).

Η

υποτύπους του καρκίνου του μαστού παρουσιάζουν διαφορετικά πρότυπα έκφρασης

στην προηγούμενη ενότητα, έχουμε αποδείξει την απόδοση της WSNF χρησιμοποιώντας τα BRCA και GBM σύνολα δεδομένων. Τα αποτελέσματα υποδεικνύουν ότι WSNF είναι ικανή να ανακαλύπτουν καρκίνο υποτύπων με διακριτά μοτίβα επιβίωση και η μέθοδός μας υπερτερεί των υφιστάμενων μεθόδων ταυτοποίησης του καρκίνου υπότυπο. Ερευνούμε τα πρότυπα έκφρασης mRNA, TF και miRNA σε όλη τους πέντε διαφορετικούς υποτύπους του καρκίνου του μαστού. Παρόμοια με [8], εξάγουμε τα «δείγματα πυρήνα», οι οποίες προσδιορίζονται με βάση το πλάτος Silhouette τους με την άρση των δειγμάτων με αρνητικές τιμές πλάτους Silhouette σε κάθε υπότυπο. Υπάρχουν 502 δείγματα με τιμές πλάτους θετική Silhouette σε πέντε υποτύπους. Έχουμε λάβει επίσης 69 φυσιολογικά δείγματα από TCGA για σύγκριση. Οι θερμικούς χάρτες για mRNA, TF, και η έκφραση των miRNAs φαίνεται στο σχήμα 5. Λαμβάνοντας κανονική ομάδα ως σημείο αναφοράς, μπορούμε να δούμε από το σχήμα ότι τα προφίλ έκφρασης μεταξύ των υποτύπων είναι σημαντικά διαφορετική.

Η

Για να έχουν μια πιο προσεκτική ματιά στα πρότυπα έκφρασης των γονιδίων που χαρακτηρίζουν κάθε υπότυπο, χρησιμοποιούμε το

Voom

[43] μέθοδο και

Limma

[44] R Πακέτο για να βρείτε τα διαφορικά εκφρασμένων γονιδίων (προσαρμοσμένο

σ

-τιμή & lt? 0,01) μεταξύ κάθε υπότυπο και φυσιολογικά δείγματα. Επιλέγουμε τα κορυφαία 1500 διαφορικά εκφραζόμενων γονιδίων σε κάθε υπότυπο για την ανάλυση. Το σχήμα 6 δείχνει την επικάλυψη των διαφορικά εκφραζόμενων γονιδίων σε όλη την υποτύπους. Υπάρχουν 473 κοινά διαφορικά εκφραζόμενα γονίδια για όλους τους υποτύπους. Εν τω μεταξύ, κάθε υπότυπος έχει συγκεκριμένα γονίδια τους (Δευτερεύων 1: 271, υπότυπος 2: 82, υπότυπος 3: 393, Δευτερεύων 4: 291, υπότυπος 5: 157). Τα κοινά γονίδια μεταξύ των πέντε υποτύπους και ο υποτύπος-ειδικά γονίδια που απαριθμούνται στο S6 αρχείου. Αν και υπάρχουν ορισμένα κοινά διαφορικά εκφραζόμενα γονίδια για όλους τους υπότυπους, πρότυπα έκφρασης τους είναι εντελώς διαφορετικές, όπως φαίνεται στο Σχ 7. Στην τελευταία ενότητα, διεξάγει την ανάλυση μονοπάτι για τον υποτύπο-ειδικά γονίδια να διερευνήσει τα χαρακτηριστικά της λειτουργίας τους σε κάθε υπότυπο.

η

αλλαγές στο κανονιστικό δίκτυα σε όλη υποτύπων καρκίνου του μαστού

Εμείς εξαγάγετε το γονίδιο TF

BCL11A

να δείξει τις αλλαγές στο κανονιστικό δίκτυο miRNA-TF-mRNA σε όλες τις εντοπίστηκαν υποτύπων καρκίνου του μαστού.

BCL11A

είναι ένα πρωτο-ογκογονίδιο που έχει σημαντική επίδραση στον καρκίνο του μαστού [45]. Όπως φαίνεται στο σχήμα 8,

BCL11A

εκφράζεται έντονα σε Δευτερεύων 3, αλλά ταπεινός εκφράζονται σε άλλους υπότυπους. Έχουμε χαρτογραφήσει τους ασθενείς στην Υποκατηγορία 3 έως κλινικά δεδομένα και να διαπιστώσει ότι το 73,5% των ασθενών που βρίσκονται σε τριπλά αρνητικό κλάσης, συμπεριλαμβανομένων ΕΚ-, PR-και HER2-.

You must be logged into post a comment.