PLoS One: Ψηφοφορία-Based Καρκίνος Μονάδα Αναγνώρισης συνδυάζοντας τοπολογικές και Data-Driven Properties


Αφηρημένο

Πρόσφατα, υπολογιστικές προσεγγίσεις ενσωμάτωση αριθμού αντιγράφων εκτροπές (προσαρμογείς CNA) και γονιδιακή έκφραση (GE) έχουν μελετηθεί εκτενώς για τον εντοπισμό γονίδια και τα μονοπάτια σχετίζονται με τον καρκίνο. Σε αυτό το έργο, έχουμε ενσωματώσει αυτά τα δύο σύνολα δεδομένων με αλληλεπίδρασης πρωτεΐνης-πρωτεΐνης (PPI) πληροφορίες για να βρει τον καρκίνο που σχετίζονται με λειτουργικές ενότητες. Για την ενσωμάτωση CNA και η GE δεδομένων, φτιάξαμε το πρώτο δίκτυο σχέση γονίδιο-γονίδιο από ένα σύνολο γονιδίων σπόρων με την απαρίθμηση όλων των τύπων ζεύγη συσχετισμούς, π.χ. GE-GE, CNA-GE, και CNA-ΚΥΠΕ, σε πολλές ασθενείς. Στη συνέχεια, προτείνουμε ένα αλγόριθμο αναγνώρισης μονάδας καρκίνο ψήφου που βασίζεται συνδυάζοντας τοπολογικές και τα δεδομένα με γνώμονα τις ιδιότητες (αλγόριθμος VToD) με τη χρήση του δικτύου σχέση γονίδιο γονίδιο ως πηγή των πληροφοριών που βασίζονται σε δεδομένα και τα δεδομένα ΠΠΑ ως τοπολογικές πληροφορίες. Εφαρμόσαμε τον αλγόριθμο VToD σε 266 πολύμορφο γλοιοβλάστωμα (GBM) και 96 καρκινώματος των ωοθηκών (ΕΗΦ) δείγματα που έχουν τόσο την έκφραση και την αντιγραφή μετρήσεις τον αριθμό, και εντοπίζονται 22 μονάδες GBM και 23 ΕΗΦ ενότητες. Μεταξύ 22 ενότητες GBM, 15, 12, και 20 μονάδες ήταν σημαντικά εμπλουτισμένη με καρκίνο που σχετίζονται με οδούς KEGG, BioCarta, και GO όρους, αντίστοιχα. Μεταξύ 23 ΕΗΦ ενότητες, 19, 18, και 23 μονάδες ήταν σημαντικά εμπλουτισμένη με καρκίνο που σχετίζονται με οδούς KEGG, BioCarta, και GO όρων, αντίστοιχα. Ομοίως, παρατηρήσαμε επίσης ότι 9 και 2 μονάδες GBM και 15 και 18 ΕΗΦ ενότητες εμπλουτίζονται με το γονίδιο του καρκίνου απογραφή (ΚΕΔ) και συγκεκριμένα γονίδια του οδηγού του καρκίνου, αντίστοιχα. προτεινόμενος αλγόριθμος μονάδα ανίχνευσης μας ξεπέρασαν σημαντικά άλλες υπάρχουσες μεθόδους όσον αφορά τόσο λειτουργικά και γονίδιο του καρκίνου του συνόλου εμπλουτισμούς. Τα περισσότερα από τα σχετικά με τον καρκίνο οδούς και από τις δύο ομάδες δεδομένων καρκίνος βρίσκεται σε αλγόριθμο μας περιείχε περισσότερα από δύο τύπους γονιδίου-γονιδίου σχέσεις, που δείχνει ισχυρή θετική συσχέτιση μεταξύ του αριθμού των διαφορετικών τύπων σχέσεων και-τιμές εμπλουτισμού CGC (0,64 για GBM και 0,49 για OVC). Αυτή η μελέτη δείχνει ότι έχουν εντοπιστεί ενότητες που περιέχουν τόσο τις αλλαγές έκφρασης και CNAs μπορεί να εξηγήσει τις δραστηριότητες σχετίζονται με τον καρκίνο με μεγαλύτερη ιδέες

Παράθεση:. Azad ΑΚΜ, Lee H (2013) Ψηφοφορία-Based Ενότητα Καρκίνο Στοιχεία συνδυάζοντας τοπολογικές και Data- Driven Properties. PLoS ONE 8 (8): e70498. doi: 10.1371 /journal.pone.0070498

Επιμέλεια: Dongxiao Zhu, Πολιτειακό Πανεπιστήμιο Wayne, Ηνωμένες Πολιτείες της Αμερικής

Ελήφθη: 9 Νοεμ 2012? Αποδεκτές: 19 Ιουνίου του 2013? Δημοσιεύθηκε: 5 Αυγούστου 2013

Copyright: © 2013 Azad, ο Lee. Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της άδειας χρήσης Creative Commons Attribution, το οποίο επιτρέπει απεριόριστη χρήση, τη διανομή και την αναπαραγωγή σε οποιοδήποτε μέσο, ​​με την προϋπόθεση το αρχικό συγγραφέα και την πηγή πιστώνονται

Χρηματοδότηση:. Αυτό το έργο (αρ 2011-0029447) υποστηρίχθηκε από το Πρόγραμμα Ερευνητής Mid-σταδιοδρομίας μέσω της επιχορήγησης του Εθνικού Ιδρύματος Ερευνών χρηματοδοτείται από το Υπουργείο Παιδείας, Επιστήμης και Τεχνολογίας. Οι χρηματοδότες δεν είχε κανένα ρόλο στο σχεδιασμό της μελέτης, τη συλλογή και ανάλυση των δεδομένων, η απόφαση για τη δημοσίευση, ή την προετοιμασία του χειρογράφου

Αντικρουόμενα συμφέροντα:.. Οι συγγραφείς έχουν δηλώσει ότι δεν υπάρχουν ανταγωνιστικά συμφέροντα

Εισαγωγή

Ο καρκίνος είναι μια κοινή γενετική ασθένεια και μια παγκόσμια κύρια αιτία θανάτου. γονιδιωματική Καρκίνος προσδιορίζει τις αλλαγές των γονιδίων που παίζουν σημαντικό ρόλο στη έναρξη και την εξέλιξη του καρκίνου. Δεκαετίες έρευνας έχουν αποκαλύψει ότι ο καρκίνος είναι στενά συνδεδεμένη με ανώμαλες αλλαγές στο ρυθμιστικό και μονοπατιών σηματοδότησης κατά την διάρκεια της ανάπτυξης και της κακοήθειας του [1], [2]? όπως dysregulations σε βασικούς οδούς συμβεί λόγω συνδυασμούς γενετικές μεταβολές και οι αλλαγές έκφραση των ογκογονιδίων ή γονιδίων καταστολής του όγκου [3] – [5]. Ως εκ τούτου, πολλοί αλγόριθμοι έχουν αναπτυχθεί για τον προσδιορισμό μονοπατιών που σχετίζονται με τον καρκίνο [6] -. [9] χρησιμοποιώντας DNA προσαρμογείς CNA, η GE αλλαγές, PPIs, και ούτω καθεξής

Εκτεταμένη χρήσεις της GE για τη μελέτη των μοριακών οδών που έχουν βοηθήσει στην ταξινόμηση των υποτύπων του καρκίνου, προβλέποντας την πρόγνωση και την ανάπτυξη φαρμάκων για τον καρκίνο. Ωστόσο, χρησιμοποιώντας μόνο δεδομένα GE για την ταυτοποίηση γονιδίων που σχετίζονται με τον καρκίνο δεν είναι αρκετά, επειδή ορισμένα σημαντικά γονίδια στον καρκίνο σχετίζονται οδοί δεν θα μπορούσε να εκφράζονται διαφορικά και μερικά διαφορικά εκφραζόμενων γονιδίων μπορεί να μην είναι σχετική με τον καρκίνο. CNAs είναι δομικά παραλλαγές των αλληλουχιών DNA που αντιστοιχούν σε μη φυσιολογική αντίγραφα τμημάτων DNA σε μια μορφή της διαγραφής ή της ενίσχυσης στο κύτταρο [10]. CNAs είναι γνωστό ότι είναι ένα χαρακτηριστικό γνώρισμα του καρκίνου, και μεθόδους που περιλαμβάνουν GISTIC [11], η ΡΑΕ [12], και WIFA [13] έχουν χρησιμοποιηθεί για την ανίχνευση καρκινικών γονιδίων-οδηγού σε παρεκκλίνουσα γονιδιωματικές περιοχές. Μια πρόσφατη ανάλυση μεγάλης κλίμακας δειγμάτων GBM από τον καρκίνο Γονιδιώματος Atlas (TCGA) [8] έδειξε γενετικές αλλοιώσεις συμπεριλαμβανομένων μεταλλάξεις, διαγραφές, και επιμηκύνσεις του DNA σε 78%, 87%, και 88% των 206 δειγμάτων GBM στα συστατικά του πυρήνα του RB, TP53, και μονοπάτια RTK /PI3K, αντίστοιχα.

Αρκετές μελέτες έχουν αναφερθεί πρόσφατα τη σημασία της ενσωμάτωσης CNA και η GE σύνολα δεδομένων για τον εντοπισμό του καρκίνου που σχετίζονται με οδούς. TCGA έρευνα για τον καρκίνο των ωοθηκών έδειξε ότι οι γενετικές αλλοιώσεις και την έκφραση του γονιδίου αλλαγές ταυτόχρονα συμβαίνουν στο μονοπάτι σηματοδότησης ρετινοβλάστωμα [14]. Jörnsten

et al.

[15] ανέπτυξε ένα μοντέλο που εξηγεί τις επιπτώσεις της CNAs στην GE σε ένα δίκτυο μεγάλης κλίμακας. Με βάση το μοντέλο, προγνωστικό βαθμολογίες υπολογίστηκαν και ταυτοποιήθηκαν τα γονίδια σχετίζονται με τον καρκίνο. Akavia

et al.

[16] χρησιμοποιείται μια ολοκληρωμένη Μπεϋζιανή προσέγγιση για τον εντοπισμό βιολογικά και θεραπευτικά σημαντικών γονιδίων του οδηγού σε γενετικά τροποποιημένα περιοχές συσχετίζοντας τα γονίδια υποψήφιος οδηγός με διαφορικά εκφρασμένων γονιδίων. Θα εφαρμοστεί η προτεινόμενη μέθοδος σε ένα σύνολο δεδομένων μελάνωμα και προσδιόρισε γνωστά γονίδια του οδηγού στο μελάνωμα, μαζί με νέα γονίδια οδηγό καρκίνο TBC1D16 και Rab27a. Μια σημαντική πρόοδο στον συνδυασμό CNA και η GE αναλύει τα γονίδια ως μονάδα και όχι ως μεμονωμένα γονίδια. Witten

et al.

[17] εφαρμόζονται κανονική ανάλυση συσχέτισης για την ενσωμάτωση CNA και η GE. Αυτή η μέθοδος συνδέει ενότητες ΚΥΠΕ με μονάδες της GE και βελτιστοποιεί τις αλληλεπιδράσεις CNA-GE.

Στην κατασκευή μονάδων ή υποδίκτυα, έχουν PPIs έχουν χρησιμοποιηθεί ως προηγούμενη ενημέρωση να ενσωματώσει τη σύνδεση μεταξύ των γονιδίων. Cerami

et al.

[9] πρότεινε μια μέθοδο για την κατασκευή υποδίκτυα που περιέχει ένα σημαντικό αριθμό από μεταλλαγμένων γονιδίων χρησιμοποιώντας ανθρώπινα PPIs και να προσδιορίσουν μονοπάτια που σχετίζονται με GBM. Chuang

et al.

[6] πρότεινε μια προσέγγιση της ενσωμάτωσης PPIs και της GE σύνολα δεδομένων για τον προσδιορισμό των δεικτών υποδίκτυο που κατατάσσουν μεταστατικών και μη-μεταστατικών όγκων.

Προτείνουμε ένα υπολογιστικό πλαίσιο για να ενσωματώσει ΚΥΠΕ -CNA, CNA-GE, και GE-GE σχέσεις με το δίκτυο της αλληλεπίδρασης πρωτεΐνης για τον εντοπισμό ενότητες σχετίζονται με τον καρκίνο στην οποία οι γενετικές αλλαγές των γονιδίων που εξηγείται από αυτές τις σχέσεις. Παρά το γεγονός ότι η σχέση της GE-GE έχει μελετηθεί για δεκαετίες [18] – [20], CNA-CNA [21] – [23] και CNA-GE [7], [24] – [27] σχέσεις έχουν μόνο πρόσφατα μελετηθεί . Έχει παρατηρηθεί ότι επιμηκύνσεις και διαγραφές τμημάτων DNA μπορούν να επηρεάσουν τα επίπεδα έκφρασης των γονιδίων στην ίδια θέση, καθώς και μακρινή τοποθεσία γονίδια [25]. Αυτή η trans-βρίσκεται συσχέτιση μεταξύ CNA και η GE μπορεί να είναι ένας από τους μηχανισμούς που εξηγούν περίπλοκες σχέσεις μεταξύ των γονιδίων στην σηματοδότηση και ρυθμιστικά μονοπάτια. Να ενσωματώσει αυτές τις πολύπλοκες σχέσεις, κατασκευάζουμε ένα δίκτυο σχέσεων γονίδιο-γονίδιο χρησιμοποιώντας διαφορικά εκφράζονται και σημαντικά τον αριθμό αντιτύπου τροποποιημένα γονίδια σε ζεύγη σύνολα δεδομένων που περιέχουν και δεδομένα DNA και RNA στο ίδιο σύνολο των ασθενών. Στη συνέχεια, έχουμε συμπεριλάβει επίσης πληροφορίες PPI για την εκμετάλλευση πριν από λειτουργικές εξαρτήσεις μεταξύ των γονιδίων. Χρησιμοποιήσαμε μια προσέγγιση ψήφου να βρείτε αντιπροσωπευτικά γονίδια που συνδέονται στενά με άλλα γονίδια μέσω των ενώσεων μεταξύ τους προσαρμογείς CNA, η GE, και PPIs. Αυτά τα αντιπροσωπευτικά γονίδια που χρησιμοποιούνται για την κατασκευή προ-ενότητες, συμπεριλαμβάνοντας σχετίζεται ισχυρά γονίδια. Στη συνέχεια, οι προ-ενότητες συγχωνεύθηκε με άλλες προ-ενότητες που έχουν στατιστικά σημαντικές συσχετίσεις με προσαρμογείς CNA, η GE, και τις σχέσεις PPI, και οι τελικές μονάδες παράγονται.

Η προτεινόμενη προσέγγιση εφαρμόστηκε σε GE και CNAs δεδομένων της GBM και τα δείγματα ΕΗΦ από TCGA να εντοπίσει ενότητες σχετίζονται με τον καρκίνο. Οι εντοπίστηκαν μονάδες αξιολογήθηκαν σε δύο πτυχές: η λειτουργική συνάφεια και η σχέση τους με τον καρκίνο. Για να ελέγξετε ότι οι μονάδες αποτελούνται από λειτουργικά συνεκτική γονιδίων, εφαρμόσαμε δοκιμές λειτουργικό εμπλουτισμό χρησιμοποιώντας KEGG [28], μονοπάτια BioCarta [29], και GO βιολογική διαδικασία [30]. Για να ελεγχθεί ότι τα δημιουργούνται ενότητες που σχετίζονται με τον καρκίνο, επιλέξαμε πρώτα σχετίζονται με τον καρκίνο οδοί από αυτές τις τρεις κατηγορίες οδών. Δεδομένου ότι δεν υπάρχει ακόμη συναίνεση σχετικά με το ποιες οδοί ή λειτουργικά όρους που σχετίζονται με τον καρκίνο, θεωρούμε ότι ένα μονοπάτι συνδέεται με τον καρκίνο, αν είναι σημαντικά εμπλουτισμένη με καρκίνο που σχετίζονται με γονίδια από μια απογραφή γονίδιο του καρκίνου (ΚΕΔ) [31]. Στη συνέχεια, εφαρμόσαμε τον εμπλουτισμό δοκιμές με τη χρήση αυτών των οδών σχετίζονται με τον καρκίνο. Τα αποτελέσματά μας έδειξαν ότι οδών σχετίζονται με τον καρκίνο εμπλουτίστηκαν με εντοπίστηκαν μονάδες μας και στα δύο σύνολα δεδομένων GBM και ΕΗΦ, και ότι ένας σημαντικός αριθμός των γονιδίων στις ενότητες συνδέθηκαν με άλλους μέσω CNA-ΚΥΠΕ, CNA-GE, και GE-GE σχέσεις .

Αποτελέσματα

πλαίσιο Συνδυάζοντας τοπολογικές και δεδομένων με γνώμονα Ιδιότητες

Έχουμε αναπτύξει την προσέγγιση VToD να κατασκευάσει μονάδες που αποτελούνται από ένα σύνολο λειτουργικά συνεκτική και καρκινογόνες σχετικά γονίδια. VToD αναπτύχθηκε βασίζεται σε τέσσερις βασικές ιδέες? γονίδια (i) με παρόμοια προφίλ γονιδιακής έκφρασης και οι αλλαγές του αριθμού αντιγράφων είναι πιο πιθανό να είναι στην ίδια μονάδα, (ii) τα γονίδια μπορούν να εκχωρηθούν σε πολλαπλές μονάδες για να αντικατοπτρίζει τη βιολογική γνώση ότι κάποια γονίδια που εμπλέκονται σε πολλαπλές οδούς, (iii) γονιδίων σε μικρή απόσταση στο δίκτυο ΠΠΑ είναι πιο πιθανό να ανήκουν στην ίδια μονάδα, και (iv) τα γονίδια κόμβο στο δίκτυο ΠΠΑ είναι πιο πιθανό να συμπεριληφθούν στις ενότητες αφού πολλά γονίδια πλήμνη έχει ένα μεγάλο αριθμό αλληλεπιδρώντων εταίροι μπορούν να συμβάλει στην ανάπτυξη του καρκίνου. Οι πρώτες δύο ιδέες θεωρούν ιδιότητες βασίζονται σε δεδομένα και οι δύο τελευταίοι αντανακλούν τοπολογικές ιδιότητες των γονιδίων εντός του δικτύου ΠΠΑ.

Το σχηματικό διάγραμμα της προτεινόμενης μεθόδου μας VToD φαίνεται στο Σχήμα 1. VToD κατασκευάζει μια σχέση γονίδιο γονίδιο δίκτυο, με την ενσωμάτωση της GE και CNA σύνολα δεδομένων, όπου είναι ένα σύνολο γονιδίων σπόρων και είναι ένα σύνολο γονιδίων-γονιδίου σχέσεις. Τα γονίδια Seed επιλέγονται με συνδυασμό διαφορικά εκφραζόμενων γονιδίων (DE) και γονίδια CNA, όπου τα γονίδια CNA λαμβάνονται από TCGA [8], [14] και παρατίθενται στον Πίνακα S1. Για GBM, 4.821 γονίδια σπόρων επιλέχθηκαν συνδυάζοντας 2.976 γονίδια DE και 2,073 γονίδια CNA. Για ΕΗΦ, 6.649 γονίδια σπόρων κατασκευάστηκαν από 710 γονίδια DE και 6.510 γονίδια CNA. Σημειώστε ότι ορισμένα γονίδια σπόρου είναι τόσο διαφορικά εκφράζονται και να αντιγράψετε τον αριθμό μεταβληθεί. Οι σχέσεις γονίδιο-γονιδίου κατασκευάστηκαν, όπου δύο γονίδια έχουν ισχυρή συσχέτιση με τουλάχιστον έναν από τους τρεις τύπους σχέσεων: GE-GE, CNA-GE, και CNA-CNA. Στη συνέχεια, VToD ενσωματώνει στοιχεία ΠΠΑ που με το δίκτυο γονίδιο γονίδιο σχέση

GGR από

ακόλουθα τέσσερα σημαντικά βήματα.

(Α) γονιδιακή έκφραση και ζεύγη δεδομένων ΚΥΠΕ τους συλλέγονται. (Β) Ένα δίκτυο σχέση γονίδιο-γονιδίου,

GGR

, κατασκευάζεται χρησιμοποιώντας άμεσες και έμμεσες σχέσεις της GE-GE, CNA-GE, και CNA-CNA. (Γ) Ένα νέο αλγόριθμο, VToD, βρίσκει επικάλυψη ενότητες που συνδυάζει την

GGR

δικτύων και πληροφοριών PPI. (δ) Λειτουργική και το γονίδιο του καρκίνου του συνόλου εμπλουτισμοί δοκιμαστεί για τις προσδιοριζόμενες ενότητες

Η

Υπολογίστε τη σχέση μεταξύ γονιδίων:.

Για κάθε δύο γονίδια και, μια τιμή σύνδεσης από γονίδιο σε γονίδιο υπολογίζεται συνδυάζοντας τη σχέση του γονιδίου-γονιδίου και το σύνολο δεδομένων PPI. Η αξία ένωση ονομάζεται – σε αυτή τη μελέτη, αφού υποθέτουμε ότι οι ψήφοι γονίδιο για γονιδιακή να αντιπροσωπεύουν τη δύναμη της σύνδεσης μεταξύ δύο γονιδίων

Επιλέξτε εκπρόσωπο γονίδια του κάθε γονιδίου:

Για. γονιδίου, οι ψήφο τιμές από όλα τα άλλα γονίδια ταξινομούνται κατά φθίνουσα σειρά, και τα γονίδια που βρίσκονται στο top% των ψήφων τιμές που επιλέγονται ως αντιπροσωπευτικές γονίδια του γονιδίου.

Φόρμα προ-ενότητες :

Εάν ένα γονίδιο επιλέγεται ως αντιπροσωπευτικό γονίδιο από πολλαπλά γονίδια, άλλα γονίδια επιλέγοντας το γονίδιο ως εκπρόσωπος γονίδιο μαζί με το γονίδιο το ίδιο το σχηματισμό ενός προ-module

Συγχώνευση προ-ενότητες. :.

δύο προ-ενότητες συγχωνευθούν αν ζεύγη των μελών των δύο προ-ενότητες είναι εξαιρετικά σχετίζονται με το δίκτυο γονίδιο γονίδιο σχέση και είναι στενά συνδεδεμένο στο δίκτυο ΠΠΑ

Η

Ο αλγόριθμος VToD εμπνέεται από έναν αλγόριθμο [32], στην οποία, για κάθε γονίδιο, τα πιο συνδέονται γονίδια που επιλέγονται για να σχηματίσουν προ-ενότητες με βάση μόνο την τοπολογία ΠΠΑ δυναμικό σύστημα μεταγωγής σήματος (STM). Ωστόσο, η σαφής διάκριση έγκειται μεταξύ STM και VToD στη διαδικασία (i) τον υπολογισμό της συσχέτισης μεταξύ δύο γονιδίων και (ii) τη συγχώνευση προ-ενότητες, δεδομένου ότι η προσέγγισή μας ενσωματώνει GE, προσαρμογείς CNA και σύνολα δεδομένων PPI.

Οι κατασκευασμένες μονάδες αξιολογήθηκαν σε δύο πλευρές? (I) μετρήσαμε λειτουργική συνάφεια των προσδιορισμένων μονάδων δοκιμάζοντας αν τα γονίδια σε μια λειτουργική μονάδα εμπλουτίστηκαν για KEGG, μονοπάτια BioCarta, και βιολογικές διεργασίες σε όρους GO (ονομάζεται λειτουργική δοκιμή εμπλουτισμού), και (ii) εκτιμήσαμε την καταλληλότητα του ενότητες για τον καρκίνο με την εφαρμογή ενός τεστ εμπλουτισμό των σχετιζόμενων με τον καρκίνο οδών ή του καρκίνου που σχετίζονται με βιολογικές λειτουργίες, οι οποίες είναι υποσύνολα των παραπάνω τρεις κατηγορίες οδών /GO όρους εμπλουτισμένο με γονίδια που σχετίζονται με τον καρκίνο από το ΚΕΔ [31] (που ονομάζεται καρκινογόνες σχετικές οδός δοκιμή εμπλουτισμού). Περαιτέρω, ελέγξαμε εάν γονίδια στα εντοπίστηκαν ενότητες εμπλουτίζονται με τα γονίδια του καρκίνου από τα γονίδια του οδηγού ΚΕΔ, GBM [33], και ΕΗΦ που σχετίζονται με τα γονίδια [34]. Σε αυτές τις εκτιμήσεις, οι υπεργεωμετρική στατιστικά στοιχεία που χρησιμοποιούνται για τη δοκιμή του εμπλουτισμού.

Ενότητες από το VToD Αλγόριθμος

Οι κατανομές όλων απαριθμούνται ζεύγη σχέσεις γονίδιο-γονίδιο (GE-GE, CNA-GE, και CNA-CNA) μεταξύ των γονιδίων των σπόρων φαίνονται στο Σχήμα S1, και οι κατανομές όλων των ψήφων τιμές για GBM και τα σύνολα OVC δεδομένα που δείχνονται στο Σχήμα S2. Δεδομένου ότι ο αριθμός των προ-ενότητες εξαρτάται από τις τιμές% στο Βήμα 2 του αλγορίθμου VToD, προσπαθήσαμε τρεις τιμές για να εξετάσει πόσο τιμές επίδραση επί των κατασκευασμένων προ-ενότητες. Ψηφοφορία τιμές του κορυφαίου 1%, 0,25% και 0,1% απέδωσε τελικά 100, 68, και 43 προ-ενότητες για GBM, και 138, 53, και 34 προ-ενότητες για OVC. Στη συνέχεια, εφαρμόσαμε τις λειτουργικές δοκιμές εμπλουτισμού και δοκιμές εμπλουτισμού οδό καρκίνου που σχετίζονται με προ-ενότητες που δημιουργείται χρησιμοποιώντας τις παραπάνω τρεις τιμές κατωφλίου. Το Σχήμα 2 δείχνει το κλάσμα εμπλουτισμένο προ-ενότητες? αν και πολλές προ-ενότητες έχουν σημαντικές επικαλύψεις με γνωστές πορείες σε όλες τις τρεις όρια, προ-ενότητες από = 0,25% και 0,1% έχουν περισσότερες επικαλύψεις με τα μονοπάτια σε σχέση με = 1%, που δείχνουν ότι τα υψηλότερα ψήφων τιμές δημιουργούν υψηλότερο κλάσμα λειτουργικά σχετικές και σχετίζονται με τον καρκίνο ενότητες.

(Α) είναι για GBM και (Β) είναι για OVC. Μπάρες αντιπροσωπεύουν κλάσματα ενότητες εμπλουτίζονται με KEGG, BioCarta, GO βιολογική διαδικασία, σχετίζονται με τον καρκίνο KEGG, σχετίζονται με τον καρκίνο BioCarta, ο καρκίνος-σχετικές GO βιολογική διαδικασία, και την απογραφή γονίδιο του καρκίνου (ΚΕΔ) για τρία διαφορετικά κατώτατα όρια ψηφοφορία. Επιπλέον, σε κάθε περίπτωση, η ψήφος τιμές υπολογίστηκαν χρησιμοποιώντας μόνο τοπολογικές ιδιότητες, χρησιμοποιώντας μόνο τα δεδομένα με γνώμονα τις ιδιότητες, και με το συνδυασμό τους να συγκρίνουν επιμέρους επιπτώσεις τους στις επιδόσεις. Οι αριθμοί των γονιδίων (NGS) σε κάθε σετ προ-ενότητα παρουσιάζεται αντίστοιχα.

Η

Δοκιμάσαμε επίσης τη σημασία της, λαμβάνοντας υπόψη τόσο τοπογραφικών και τα δεδομένα με γνώμονα τις ιδιότητες για τον υπολογισμό ζεύγη ψηφοφορία. Εμείς παράγεται προ-ενότητες χρησιμοποιώντας μόνο τοπολογικές και μόνο τις ιδιότητες που βασίζονται σε δεδομένα. Όταν χρησιμοποιήθηκε η ενιαία ιδιοκτησία, επιλέχθηκε ο ίδιος αριθμός ζευγών γονιδίου με εκείνη των ζευγών γονίδιο που επιλέγεται συνδυάζοντας τις δύο ιδιότητες για κάθε τιμή του. Σε όλες τις τρεις τιμές για το κατώτατο όριο, το κλάσμα των λειτουργικά εμπλουτισμένο ενοτήτων ήταν υψηλότερη όταν τοπολογικές και που βασίζονται σε δεδομένα ιδιότητες συνενώθηκαν ό, τι όταν μόνο ένα ακίνητο χρησιμοποιήθηκε τόσο για GBM και OVC, όπως φαίνεται στο Σχήμα 2.

Εμείς επιλέξαμε = 0,1% ως κατώτατο όριο για περαιτέρω ανάλυση. Χρησιμοποιώντας αυτό το όριο, για GBM, ελήφθησαν 43 προ-ενότητες. Με τη συγχώνευση αυτών των προ-ενότητες, 22 μονάδες παρήχθησαν, και ο μέσος αριθμός των γονιδίων στις ενότητες ήταν 24. Για ΕΗΦ, χρησιμοποιώντας το ίδιο όριο, 34 προ-ενότητες παρήχθησαν, και 23 μονάδες ελήφθησαν μετά τη συγχώνευση προ-ενότητες, όπου ο μέσος όρος των αριθμό των γονιδίων είναι 57. Όλα τα γονίδια στις ενότητες που παρατίθενται στον πίνακα S2 και S3 πίνακα. Η στατιστική σημαντικότητα των ταυτοποιημένων ενότητες παρουσιάζεται στο σχήμα S3.

Επειδή ο αλγόριθμος VToD επιτρέπει πολλαπλές εμφανίσεις των γονιδίων σε διάφορες ενότητες, υπολογίσαμε το μέσο ποσοστό των κοινών γονιδίων μεταξύ των ενοτήτων. Για GBM, η αναλογία των κοινών γονιδίων ήταν 16,07%, η οποία ήταν παρόμοια με εκείνα των οδών KEGG και BioCarta. Επίσης, η κατανομή των αναλογιών των κοινών γονιδίων υπολογίστηκε. Περίπου οι μισές από τις ενότητες που είχαν το 10% των κοινών γονιδίων, γεγονός που δείχνει ότι οι τελικές μονάδες θα εμπλουτιστεί με διακριτά λειτουργικά μονοπάτια ή όρους (Εικόνες S4A και S4B). Ερευνήσαμε επίσης τρεις διαφορετικούς τύπους των άμεσων σχέσεων (GE-GE, CNA-GE, και CNA-ΚΥΠΕ) μεταξύ των ζευγών γονιδίων μέσα σε κάθε μία από αυτές τις 22 μονάδες GBM (Σχήμα S5A). Περίπου το 64% των μονάδων που περιέχονται τουλάχιστον δύο τύπους των σχέσεων, που δείχνει (i) ότι τα γονίδια με παρόμοια γονιδιακή έκφραση και τον αριθμό αντιγράφων του DNA αλλαγές είναι πιο πιθανό να είναι στο ίδιο δομοστοιχείο, και (ii) ότι η δραστηριότητα των γονιδίων σε αυτές προσδιορίζονται ενότητες μπορούν να εξηγηθούν από διαφορετικούς μοριακούς μηχανισμούς (Πίνακας S4).

Για 23 ΕΗΦ ενότητες, η μέση αναλογία των κοινών γονιδίων ήταν 11,68%, το οποίο ήταν επίσης χαμηλότερες από εκείνες από KEGG και BioCarta, και περισσότερο από ό, τι τα μισά από τα 23 ΕΗΦ ενότητες είχε το 10% των κοινών γονιδίων (Εικόνες S4C και S4D). Περίπου το 83% του συνόλου των 23 OVC ενότητες (Σχήμα S5B) περιείχε τουλάχιστον δύο τύπους άμεσων σχέσεων.

ενότητες σχετίζονται με τον καρκίνο που προσδιορίζονται από τον αλγόριθμο VToD για GBM.

Εμείς εφαρμοστεί λειτουργική και τον καρκίνο γονίδιο που δοκιμές εμπλουτισμού σε 22 ενότητες GBM. Βρήκαμε ότι το 19 (86,36%), 14 (63,63%), και 20 (90,9%) μονάδες ήταν σημαντικά εμπλουτισμένη (FDR-τιμή 0,05) με τουλάχιστον ένα KEGG, BioCarta, ή GO όρων, αντίστοιχα, δείχνοντας ότι έχουν εντοπιστεί ενότητες είναι λειτουργικά συνεκτική. Επίσης, 15 (68,18%), 12 (54,55%), και 20 (90,9%) μονάδες GBM ήταν σημαντικά εμπλουτισμένη με καρκίνο που σχετίζονται με οδούς KEGG, BioCarta, και GO όρους, αντίστοιχα. Στην περίπτωση της δοκιμής σύνολο εμπλουτισμό γονίδιο του καρκίνου, 9 και 2 μονάδες GBM είχε σημαντική επικάλυψη (FDR-τιμή 0,05) με ΚΕΔ [31] και GBM που σχετίζονται με τα γονίδια [33], αντίστοιχα. Αυτά τα αποτελέσματα δείχνουν ότι οι μονάδες μας που σχετίζονται με την ανάπτυξη του καρκίνου. Ο Πίνακας 1 παρουσιάζει την περίληψη των κορυφαίων πέντε επιλεγμένες ενότητες με εντολή GBM που σχετίζονται με τιμαί εμπλουτισμό γονίδιο? Οι ενότητες αυτές περιέχουν πολλές GBM που σχετίζονται με τα γονίδια. Όλα τα αποτελέσματα εμπλουτισμού για το σύνολο δεδομένων GBM παρουσιάζονται στους Πίνακες S4, S5, S6 και S7.

Η

Έχουμε επιλέξει Ενότητα GBM 2 να εξηγήσει λεπτομερώς πώς τα γονίδια αλληλεπιδρούν με άλλα γονίδια και εμπλέκονται σε βιολογικών οδών σε ενότητες. Έχουμε επιλέξει αυτό το module για περαιτέρω εξηγήσεις δεδομένου ότι έχει μια χαμηλή τιμή-εμπλουτισμό με το γονίδιο του καρκίνου σύνολα, και περιέχει ζεύγη γονιδίων με ισχυρές συσχετίσεις σε τρεις τύπους των άμεσων σχέσεων. Αυτή η ενότητα περιέχει 1.080 ζεύγη γονιδίων από 48 γονίδια, και ανάμεσά τους υπήρχαν 300 GE-GE, 9 CNA-GE, και 8 άμεσες σχέσεις ΚΥΠΕ-CNA. Το σχήμα 3Α δείχνει την άποψη του δικτύου της ενότητας GBM 2 μόνο με άμεσες σχέσεις. Υπήρχαν τρεις τύποι ακμών στο δίκτυο αυτό: i) κόκκινες άκρες για CNA-ΚΥΠΕ, ii) μπλε άκρες για CNA-GE, και iii) το πράσινο άκρες για GE-GE σχέσεις μεταξύ των δύο γονιδίων. Γονίδια που ανήκουν σε εμπλουτίζεται σημαντικά μονοπάτια /όροι ομαδοποιούνται. Πληροφορίες για το DNA προσαρμογείς CNA και /ή αλλαγές της έκφρασης για τα γονίδια σημάνθηκαν επίσης μαζί τους μέσα σε κάθε ομάδα. Συχνότητες του αριθμού αλλαγές αντίγραφο παρουσιάστηκαν ως ποσοστό των 206 δειγμάτων GBM είτε με εστιακή ενίσχυση ή ομόζυγη διαγραφή στο [8]. Για να μετρήσετε το κλάσμα των δειγμάτων όγκου με τις αλλαγές της γονιδιακής έκφρασης για, θεωρήσαμε ότι ένα δείγμα όγκου είναι υπερ- ή υπο-εκφράζεται εάν η αξία του στην Εξίσωση (1) ανήκει στο top 10% των τιμών όλων των δειγμάτων όγκου, όπου είναι η αξία έκφραση ενός δείγματος όγκου και είναι η μέση έκφραση όλων των δειγμάτων ελέγχου για το. Με βάση τις κατανομές του για την GBM και σύνολα δεδομένων ΕΗΦ, 0.4 επιλέχθηκε για GBM και 0,365 για OVC. (1)

(Α) Μια άποψη του δικτύου της ενότητας GBM 2 χρησιμοποιώντας μόνο τις άμεσες σχέσεις, που από Cytoscape [ ,,,0],70]. Γονίδια ομαδοποιούνται με βάση την επικάλυψη με μονοπάτια BioCarta, και τα ποσοστά των δειγμάτων με CNA και GE αλλαγές εμφανίζονται. Τα γονίδια ΚΕΔ χρωματισμένο με ελιές και τα γονίδια GBM είναι σε μωβ. Cytoband και Amp /Del (ή Τροποποίηση-Έκφραση Αλλαγές) πληροφορίες για CNA-CNA (ή CNA-GE) Τα ζεύγη παρουσιάζονται στον πίνακα ένθετο. Οι δοκιμές εμπλουτισμού (Β) Μονοπάτι με μονοπάτια KEGG και BioCarta για αυτήν την ενότητα παρουσιάζεται. Μπλε γραμμές δείχνουν τα τιμαί εμπλουτισμό των οδών και κόκκινες γραμμές δείχνουν τις-τιμές επικάλυψη μεταξύ της οδού και των γονιδίων του οδηγού GBM. Μαύρο κάθετες μπάρες δείχνουν-τιμή κατωφλίου, 0,05, και το πλάτος των οριζόντιων ράβδων εξαρτάται από (-τιμή). (C) Κόκκινο μπάρες δείχνουν την επικάλυψη-τιμή με γονίδια οδηγό ΚΕΔ και GBM.

Η

Ένα εγχειρίδιο βιβλιογραφική έρευνα που προβλέπονται ενθαρρυντικά στοιχεία για τις άμεσες σχέσεις στην Ενότητα GBM 2. Γονίδια σε MAPK1-MAPK3, MAPK3- οι MAPK9, και MAPK1-MAPK9 ζεύγη που εμπλέκονται σε διάφορες καρκινογόνες και GBM που σχετίζονται με οδούς, συμπεριλαμβανομένης της σηματοδότησης ΜΑΡΚ, σηματοδότηση ERBB, εστιακή πρόσφυση και σηματοδότηση του υποδοχέα Toll-όπως. Σε BRCA2-ING1, και τα δύο γονίδια παίζουν κρίσιμους ρόλους στον έλεγχο του κυτταρικού κύκλου [35], [36]? ING1 είναι ένα ογκοκατασταλτικό γονίδιο και αλληλεπιδρά με ΤΡ53, και υπο-έκφραση και γενετική αναδιάταξη έχουν παρατηρηθεί σε αρκετές μορφές καρκίνου, συμπεριλαμβανομένων GBM [37]? και BRCA2, ένα ογκοκατασταλτικό γονίδιο, έχει πρόσφατα γίνει στόχος για ευαισθητοποίηση κυττάρων γλοιώματος για θανάτωση από αντι-καρκινικά φάρμακα [38]. Σε BTBD2-TEP1, TEP1 είναι ένα πολύ γνωστό γονίδιο καταστολής GBM, και η διαγραφή /μετάλλαξη αυτού του γονιδίου έχει παρατηρηθεί σε πολλούς καρκίνους, συμπεριλαμβανομένων GBM [39]? πολυμορφισμός του BTBD2 εμπλέκεται στην διπλό σκέλος οδού επιδιόρθωσης σπάσιμο που μπορεί να είναι χρήσιμες για την επιβίωση GBM [40]. Σε ING1-HMGB1, και τα δύο γονίδια βρίσκονται σε χρωμόσωμα 13q, όπου η απώλεια αριθμού αντιγράφων έχει αναφερθεί [41] – [43], υποδηλώνοντας συνυπάρχουσες διαγραφή αυτών των δύο γονιδίων. Σε APEX1-HIF1A και HIF1A-TEP1 με τη σχέση CNA-CNA, APEX1 και HIF1A αλληλεπιδρούν άμεσα με το άλλο

in vitro

[44]? και, GBM, αντιγράψτε απώλεια αριθμό στο 14q11.1-q13.1, 14q23.2-q23.3, και 14q32.33, όπου τα εν λόγω γονίδια που βρίσκεται, έχει αναφερθεί από Donovan

et al.

[45]. Η σχέση μεταξύ 14q11.1-11.2 και 14q23.1-31.3 εμφανίζονται επίσης σε διαπιστώσεις μας CNA-GE σχέσεις (APEX1-BRCA1, BRCA1-HIF1A, και BRCA 1-TEP1) μέσα σε αυτή την ενότητα. Σε BTBD2-BARD1, BARD1 προτάθηκε ως μεσολαβητής της απόπτωσης επειδή η υπερ-έκφραση του επάγει κυτταρικό θάνατο [46]? και υψηλής LOH έχει ανιχνευθεί σε μεταστάσεις ανθρώπινο καρκίνωμα στον εγκέφαλο σε χρωμόσωμα 19p13.3 για BTBD2 [47].

Το Σχήμα 3Β δείχνει δοκιμές εμπλουτισμού χρησιμοποιώντας πορείες KEGG και BioCarta για τις GBM ενότητας 2. Για GBM- σχετικές οδούς, υπολογίσαμε επίσης τις-τιμές για τον εμπλουτισμό του GBM σχετίζονται γονίδια σε αυτά τα μονοπάτια, αντίστοιχα. Στο Σχήμα 3Β, η κορυφή 15 37 εμπλουτισμένη KEGG και η κορυφή 15 από 49 εμπλουτισμένη οδών BioCarta παρουσιάζονται για την Ενότητα GBM 2, μαζί με τις αντίστοιχες επικαλυπτόμενες-τιμές τους, κατατάσσονται σύμφωνα με αυτές τις-τιμές. Ενότητα GBM 2 περιέχει πολλά παλαιότερα γνωστή GBM που σχετίζονται με KEGG διόδων, συμπεριλαμβανομένων γλοίωμα, σηματοδότηση Ρ53, ΜΑΡΚ σηματοδότηση, ERBB σηματοδότησης, σηματοδότησης mTOR, και τη σηματοδότηση του VEGF, και GBM που σχετίζονται με οδούς BioCarta, συμπεριλαμβανομένων των ΑΤΜ, G2, G1, RB, Ρ53, PTEN μονοπάτια, και ΚΟΑ [48]. Ενότητα GBM 2 είναι επίσης εμπλουτισμένο με καρκίνο που σχετίζονται με 40 KEGG, 48 μονοπάτια BioCarta, και 92 όρους GO.

Δοκιμάσαμε επίσης τη σημασία της ενότητας GBM 2 με καρκίνο, χρησιμοποιώντας ΚΕΔ και GBM που σχετίζονται με τα γονίδια, όπως φαίνεται στο Σχήμα 3C. Ενότητα GBM 2 περιείχε 10 CGC γονίδια του ΤΡ53, BRCA1, BRCA2, Daxx, DDX5, MDM2, MDM4, NPM1, TEP1, και WRN, με αποτέλεσμα μια-τιμή του 1,0510, και 2 GBM-σχετιζόμενα γονίδια των ΤΡ53 και TEP1, με αποτέλεσμα την α-τιμή των 1,0210.

ενότητες σχετίζονται με τον καρκίνο που προσδιορίζονται από τον αλγόριθμο VToD για τον καρκίνο των ωοθηκών.

Μεταξύ 23 ΕΗΦ ενότητες, 22 (95,65%), 18 (78.26%), 23 ( 100%), 15 (65,22%), και 18 (78.26%) ενότητες ήταν σημαντικά εμπλουτισμένη (FDR-τιμή 0,05) με τουλάχιστον ένα KEGG, μονοπάτια BioCarta, GO όρων, ΚΕΔ [31], ή ΕΗΦ που σχετίζονται με σύνολα γονιδίων [ ,,,0],34], αντίστοιχα. Επίσης, 19 (82,61%), 18 (78,26%), και 23 (100%) OVC ενότητες ήταν σημαντικά εμπλουτισμένη με καρκίνο που σχετίζονται KEGG, BioCarta, και GO όρους, αντίστοιχα. Ο Πίνακας 2 δείχνει την περίληψη των πέντε επιλεγμένες ενότητες με εντολή ΕΗΦ που σχετίζονται με το γονίδιο που τιμαί εμπλουτισμού. Όλα τα αποτελέσματα εμπλουτισμού για το σύνολο δεδομένων OVC παρουσιάζονται στους Πίνακες S8, S9, S10 και S11

Η

Ερευνήσαμε ΕΗΦ Ενότητα 8 αναλυτικά, όπως φαίνεται στο Σχήμα 4.? περιέχει 629 ζεύγη γονιδίων των 37 γονιδίων, και ανάμεσά τους υπήρχαν 2 GE-GE, 28 CNA-GE, και 49 άμεσες σχέσεις ΚΥΠΕ-CNA. Σε ΕΗΦ Ενότητα 8, STAT5b-STAT3 ζεύγος γονιδίων ενεργοποιείται στον καρκίνο των ωοθηκών [49], αλληλεπιδρά με το άλλο [50], και εμπλέκεται σε πολλές οδούς, συμπεριλαμβανομένης της σηματοδότησης JAK-STAT, σηματοδότηση RAS, χημειοκινών σηματοδότησης, EGF, IL10, PDGF και μονοπάτια ΤΡΟ. Σε STAT5b-PRLR, και τα δύο γονίδια που εμπλέκονται σε σηματοδότηση Jak-STAT, ένα σήμα μεταγωγής μονοπάτι με πλήκτρο ελέγχου επί πολλαπλασιασμό, τη διαφοροποίηση, και επιβίωση των μαστικών κυττάρων [51]. Πρόσφατα, έχει δειχθεί ότι PRLR και κατάντη STAT5b του ακετυλιώνονται με πρωτεΐνη CREB δέσμευσης (CBP) [52]. Σε EGF-STAT1 και EGF-STAT3, τόσο γονίδιο ζεύγη εμπλέκονται σε καρκίνο του παγκρέατος, οδός EGF, και της οδού μεταγωγής σήματος? τόσο STAT1 και STAT3 ενεργοποιούνται από την κινάση Jak σε απόκριση σε EGF [53] – [55], όπου JAK2 σηματοδότηση /STAT3 απαιτείται για τον καρκίνο των ωοθηκών EGF καθοδηγείται [55]. Σε PIK3R1-IGF1R, αυτά τα γονίδια αλληλεπιδρούν μεταξύ τους [56] και εμπλέκονται σε πολλές λειτουργικές πορείες, συμπεριλαμβανομένου του IGF1, IGF1R, HDAC, BAD, IGF1MTOR, και μονοπάτια εστιακής προσκόλλησης. Σε ERBB2-STAT, αυτά τα γονίδια που εμπλέκονται σε καρκίνο του παγκρέατος και μεταγωγής σήματος οδούς? ο συσχετισμός μεταξύ της ενεργοποίησης του ErbB2 και STAT3 έχει παρατηρηθεί σε πολλούς ανθρώπινους όγκους [57], [58]. Σε με ErbB2 STAT5b, και τα δύο γονίδια αλληλεπιδρούν με JAK2 [59], [60] και εμπλέκονται σε μονοπάτια σηματοδότησης και μεταγωγής σήματος ERBB. Σε EGF-erbB2, αυτά τα γονίδια αλληλεπιδρούν άμεσα με το άλλο [61] και εμπλέκονται σε πολλούς καρκίνους, συμπεριλαμβανομένου του παγκρέατος, του ενδομητρίου, του προστάτη, της ουροδόχου κύστης και των ωοθηκών. Θα συμμετέχουν επίσης στην ERBB σηματοδότησης και μονοπάτια εστιακής προσκόλλησης. Σε HRAS-Fyn, αυτά τα γονίδια αλληλεπιδρούν μεταξύ τους

in vitro

[62] και εμπλέκονται σε πολλές οδούς, όπως η εστιακή προσκόλληση, καθοδήγηση άξονα, σηματοδότηση υποδοχέα Τ-κυττάρων, και FC σηματοδότηση έψιλον RI, ECM , μονοπάτια TCR, και ιντεγκρίνης.

(Α) Μια άποψη δίκτυο ΕΗΦ Ενότητα 8 χρησιμοποιώντας μόνο τις άμεσες σχέσεις. Τα γονίδια ΚΕΔ χρωματισμένο με ελιές και ΕΗΦ που σχετίζονται με τα γονίδια είναι σε μωβ. (Β) ο εμπλουτισμός Pathway δοκιμές δοκιμές ήταν παρόμοιες με αυτές στο Σχήμα 3 (Β), αλλά εδώ, κόκκινες γραμμές δείχνουν τις επικαλυπτόμενες-τιμές μεταξύ της οδού και OVC-σχετιζόμενα γονίδια. (C) Κόκκινο μπάρες δείχνουν τις-τιμές που συμπίπτουν με εκείνες των CGC- και ΕΗΦ που σχετίζονται με τα γονίδια.

Η

Το Top 15 των 37 εμπλουτισμένη KEGG και την κορυφή 15 από 59 εμπλουτισμένη μονοπάτια BioCarta εμφανίζονται επίσης για την Ενότητα ΕΗΦ 8 στο σχήμα 4Β. Περιλαμβάνει γνωστό ΕΗΦ που σχετίζονται με οδούς KEGG, όπως η εστιακή πρόσφυση, σηματοδότησης JAK-STAT, σηματοδότηση ERBB, αλληλεπίδραση υποδοχέα κυτοκίνης-κυτοκινών, χημειοκινών σηματοδότησης και σηματοδότηση του VEGF, και ΕΗΦ που σχετίζονται με οδούς BioCarta, όπως σηματοδότησης AKT, IL6, RAS, οδοί EGF, IGF1, PDGF, VEGF, CXCR4 και HER2 [34]. Δοκιμάσαμε επίσης τη σημασία της ενότητας OVC 8 με τον καρκίνο. Ενότητα ΕΗΦ 8 εμπλουτίστηκε με 39 KEGG, 58 μονοπάτια BioCarta, και 49 όρους GO, η οποία ήταν σχετιζόμενη με τον καρκίνο υποσύνολα των αρχικών οδών /όρους. Επίσης, όπως φαίνεται στην Εικόνα 4C, η ηλεκτρονική μονάδα OVC 8 περιείχε 7 γονίδια CGC (PTPN11, ΑΚΤ1, erbB2, FOXO1, HRAS, LIFR και PIK3R1) με-τιμή των 2,0810 και 6 OVC-συναφή γονίδια (EGF, EphA2, erbB2 , PIK3R1, STAT3 και VEGFA) με-τιμή των 5,2310. Αυτά τα αποτελέσματα δείχνουν ότι εντοπίστηκαν μονάδες μας από τα ΕΗΦ δεδομένα που αντιπροσωπεύουν σχετίζονται με τον καρκίνο μονοπάτια.

Συγκρίνοντας VToD με άλλες μεθόδους

Ο Πίνακας 3 δείχνει τις συγκρίσεις απόδοσης μεταξύ των προτεινόμενων μας αλγόριθμο VToD και άλλες μεθόδους ομαδοποίησης με χρήση σύνολα δεδομένων GBM και ΕΗΦ? σε σύγκριση με αυτούς τους αλγορίθμους, ένα υψηλότερο κλάσμα μονάδων VToD ήταν λειτουργικά εμπλουτισμένο από ενότητες από άλλους αλγορίθμους. Παρά το γεγονός ότι η λειτουργική εμπλουτισμό των ενοτήτων DFM-CIN είναι συγκρίσιμα με εκείνα των VToD, VToD εντοπίζονται ένα υψηλότερο κλάσμα των ενοτήτων encriched με πορείες σχετίζονται με τον καρκίνο από DFM-CIN. Σημειώστε ότι, δεδομένου ότι οι αλγόριθμοι σχεδιάστηκαν για διαφορετικούς τύπους δεδομένων, αυτά συγκρίθηκαν χρησιμοποιώντας τύπους δεδομένων στο αρχικό έγγραφο. Για μια ιεραρχική μέθοδο ομαδοποίησης, η GE, προσαρμογείς CNA και PPI σύνολα δεδομένων εντάχθηκαν

Η

Ιεραρχική ομαδοποίηση:. Για να βρείτε μονάδες από το ιεραρχικό αλγόριθμο ομαδοποίησης, θα μετατραπεί δικτύου σχέση γονίδιο γονίδιο μας σε ένα πίνακα αποστάσεων χρησιμοποιώντας την τοπολογικές επικάλυψη μετρικό [63] του εργαλείου WCGNA στο R υπολογιστική σουίτα. Αυτή η μήτρα απόσταση στη συνέχεια χρησιμοποιήθηκε για ιεραρχική συσταδοποίηση με το μέσο όρο της σύνδεσης. Το δενδρόγραμμα του συμπλέγματος είχε κοπεί από μια δυναμική δέντρο-cut [64] αλγόριθμο, τελικά παράγει 216 μονάδες, όταν χρησιμοποιήθηκε το σύνολο δεδομένων GBM. Εφαρμόσαμε λειτουργικό και το γονίδιο του καρκίνου του τεστ σύνολο εμπλουτισμός με αυτά τα 216 μονάδων. Βρήκαμε 14, 0, και 13 ενότητες που έχουν σημαντικές επικαλύψεις με μονοπάτια KEGG, BioCarta, και GO όρων, αντίστοιχα, και 4, 0, και 4 εμπλουτίζεται ενότητες με καρκίνο που σχετίζονται με τις υποκατηγορίες του KEGG, BioCarta, και GO όρων, αντίστοιχα. Επίσης, 5 και 1 ενότητες εμπλουτίζονται με CGC- και GBM που σχετίζονται με γονίδια (Πίνακας S12). Ο Πίνακας 3 δείχνει την συγκριτική απόδοση μεταξύ ιεραρχική ομαδοποίηση και αλγόριθμοι VToD, δείχνοντας ότι VToD εντοπίσει περισσότερες ενότητες μονοπάτι εμπλουτισμένο από την ιεραρχική αλγορίθμου ομαδοποίησης (Πίνακας S13). Επιπλέον, το σχήμα S6a δείχνει το οικόπεδο κουτί-τιμές εμπλουτισμού γονιδίου οδηγού ΚΕΔ και GBM, υποδεικνύοντας υψηλότερο εμπλουτισμό γονίδιο του καρκίνου σε VToD σε σύγκριση με ιεραρχική ομαδοποίηση. Επίσης, τα διαγράμματα πίτας στην Εικόνα S6B δείχνουν διαφορετικούς συνδυασμούς των τριών τύπων των άμεσων σχέσεων (ΚΥΠΕ-ΚΥΠΕ, GE-CNA, GE-GE). Εδώ, VToD παρήγαγε ένα μεγαλύτερο ποσοστό των μονάδων που περιέχουν περισσότερα από ένα είδος άμεσες σχέσεις σε σύγκριση με ιεραρχική ομαδοποίηση.

Cerami et. al .: Cerami

et al.

[9] ανέπτυξε έναν αλγόριθμο για την ενσωμάτωση τους αριθμούς DNA αντιγραφής, σωματική μετάλλαξη και τα σύνολα δεδομένων ΡΡΙ, και την εφάρμοσε έως 84 στοιχεία TCGA GBM [8].

You must be logged into post a comment.