PLoS One: Μπεϋζιανή Διαδρομή Ανάλυση του Καρκίνου μικροσυστοιχιών Δεδομένων


Αφηρημένο

High Throughput Βιολογικά Δεδομένα (HTBD) απαιτεί λεπτομερείς μεθόδους ανάλυσης και από τη σκοπιά της επιστήμης της ζωής, αυτά τα αποτελέσματα ανάλυσης κάνει πιο λογικό, όταν ερμηνεύεται στο πλαίσιο των βιολογικών οδών. Bayesian Networks (BNs) συλλάβει δύο γραμμικές και μη γραμμικές αλληλεπιδράσεις και να χειρίζονται στοχαστική γεγονότα σε ένα πιθανοτικό πλαίσιο αντιπροσωπεύοντας το θόρυβο της βιωσιμότητάς τους υποψήφιους για ανάλυση HTBD. Έχουμε προτείνει πρόσφατα μια προσέγγιση, που ονομάζεται Bayesian Διαδρομή Ανάλυση (BPA), για την ανάλυση HTBD χρησιμοποιώντας BNs στην οποία είναι γνωστά βιολογικά μονοπάτια μοντελοποιηθεί ως BNs και τα μονοπάτια που εξηγούν καλύτερα το δεδομένο HTBD βρίσκονται. BPA χρησιμοποιεί την πτυχή πληροφορίες αλλαγή για να ληφθεί μια μήτρα εισόδου να σκοράρει σε κάθε μονοπάτι μοντελοποιηθεί ως ένα ΒΝ. Βαθμολόγησης επιτυγχάνεται χρησιμοποιώντας τη μέθοδο της ισοδύναμης Bayesian-Dirichlet και η σημασία αξιολογείται από την τυχαιοποίηση μέσω bootstrapping από τις στήλες του πίνακα εισόδου. Σε αυτή τη μελέτη, θα βελτιώσει το σύστημα BPA βελτιστοποιώντας τα βήματα που εμπλέκονται στην «Data Προεπεξεργασία και Διακριτοποίηση», «Αξιολόγηση Σημασία» «Scoring», και «Λογισμικό και Web Application». Δοκιμάσαμε το βελτιωμένο σύστημα για τα συνθετικά σύνολα δεδομένων και πέτυχε πάνω από% ακρίβεια 98 για τον προσδιορισμό των ενεργών μονοπάτια. Η συνολική προσέγγιση εφαρμόστηκε σε σύνολα δεδομένων μικροσυστοιχιών πραγματικό του καρκίνου, προκειμένου να διερευνηθούν οι πορείες που είναι συνήθως δραστηριοποιούνται σε διάφορους τύπους καρκίνου. Συγκρίναμε τα ευρήματά μας σχετικά με το πραγματικό σύνολα δεδομένων με μια σχετική προσέγγιση που ονομάζεται Ανάλυση μονοπάτι σηματοδότησης Επιπτώσεων (SPIA)

Παράθεση:. Korucuoglu M, ISCI S, Ozgur Α, Otu HH (2014) Bayesian Pathway Ανάλυση του Καρκίνου μικροσυστοιχιών δεδομένων. PLoS ONE 9 (7): e102803. doi: 10.1371 /journal.pone.0102803

Επιμέλεια: Raya Khanin, Memorial Sloan Kettering,, Ηνωμένες Πολιτείες της Αμερικής

Ελήφθη: 14 Φλεβάρη 2014? Αποδεκτές: 24 Ιουνίου, 2014? Δημοσιεύθηκε: 18, Ιουλίου 2014

Copyright: © 2014 Korucuoglu et al. Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της άδειας χρήσης Creative Commons Attribution, το οποίο επιτρέπει απεριόριστη χρήση, τη διανομή και την αναπαραγωγή σε οποιοδήποτε μέσο, ​​με την προϋπόθεση το αρχικό συγγραφέα και την πηγή πιστώνονται

Χρηματοδότηση:. Αυτό το έργο υποστηρίχθηκε από το Επιστημονικό και Τεχνολογικό Ερευνητικό Συμβούλιο της Τουρκίας (TUBITAK) αριθμός επιχορήγηση 111E042 (HHO). Οι χρηματοδότες δεν είχε κανένα ρόλο στο σχεδιασμό της μελέτης, τη συλλογή και ανάλυση των δεδομένων, η απόφαση για τη δημοσίευση, ή την προετοιμασία του χειρογράφου

Αντικρουόμενα συμφέροντα:.. Οι συγγραφείς έχουν δηλώσει ότι δεν υπάρχουν ανταγωνιστικά συμφέροντα

Εισαγωγή

Bayesian δίκτυο (BN) μοντέλα έχουν κερδίσει σε δημοτικότητα για την εκμάθηση βιολογικά μονοπάτια από τα δεδομένα γονιδιακής έκφρασης μικροσυστοιχιών [1], [2]. BNs αντιπροσωπεύουν δομή εξάρτησης για ένα σύνολο τυχαίων μεταβλητών χρησιμοποιώντας κατευθυνόμενος άκυκλος γράφος και έχουν χρησιμοποιηθεί με αυξανόμενη δημοτικότητα στα μαθηματικά και υπολογιστικών επιστημών κατά τη διάρκεια των τελευταίων 20 ετών. Ωστόσο, οι τρέχουσες εφαρμογές ΒΝ περιορίζεται να δομήσει μάθηση χρησιμοποιώντας παρατηρούμενα δεδομένα και ως εκ τούτου λειτουργούν μόνο σε μερικές εκατοντάδες μεταβλητές όπως αλγόριθμοι εκμάθησης δομής είναι υπολογιστικά πολύπλοκη. Αυτό, με τη σειρά του, οδηγεί σε αναποτελεσματική χρήση των HTBD, τα οποία περιέχουν ένα πολύ μεγαλύτερο αριθμό των μεταβλητών.

Από τη σκοπιά των επιστημών της ζωής, τα αποτελέσματα ανάλυσης δεδομένων κάνει πιο λογικό, όταν ερμηνεύεται στο πλαίσιο των βιολογικών δικτύων και μονοπατιών. Οι μέθοδοι που βασίζονται προηγουμένως συσταθεί ανάλυση μεμονωμένων γονιδίων επεκτάθηκε στο δίκτυο και την κλίμακα της οδού ως επί το πλείστον κατά μήκος των γραμμών του συνόλου γονιδίων ανάλυση (GSA) [3], [4] ή Γονιδιακή Οντολογία (GO) προσεγγίσεις με βάση [5] – [7], η οποία επικεντρώνεται στον καθορισμό προκαθορισμένα σετ γονιδίων ή των κατηγοριών που ρυθμίζονται σημαντικά. Ωστόσο, αυτές οι προσεγγίσεις εξετάζουν τα γονίδια εισόδου και τα σύνολα του γονιδίου-στόχου και μαθήματα απλώς ως

λίστες

και δεν ενσωματώνουν στα μοντέλα τους την τοπολογία, μέσω του οποίου τα γονίδια σε αυτές τις κατηγορίες αλληλεπιδρούν μεταξύ τους. Άλλες δημοφιλείς εμπορικές προσεγγίσεις, όπως η εφευρετικότητα δρόμος της Γνωσιακής Βάσης (Ingenuity Inc., California) ή PathwayAssist (Αριάδνη Genomics, Καλιφόρνια) και τον εντοπισμό γνωστές οδούς ως ενεργά με βάση HTBD απλά λαμβάνοντας υπόψη τον αριθμό των γονιδίων που μοιράζονται από τη λίστα εισόδου και η μονοπάτι στόχο. Όλα aferomentioned μέθοδοι χρησιμοποιούν κάποια παραλλαγή της κύριας ιδέα ότι μια λειτουργική κατηγορία είναι σχετικό με την παρατηρούμενη HTBD αν η τάξη έχει μια στατιστικά σημαντική ποσότητα της λίστας γονιδίου εισόδου.

Έχουμε προτείνει πρόσφατα μια προσέγγιση, που ονομάζεται Bayesian Διαδρομή ανάλυση (BPA), για την ανάλυση HTBD χρησιμοποιώντας BNs [8]. Στο πλαίσιο BPA είναι γνωστές οδούς διαμορφώνεται ως BNs και η επεξεργασία HTBD χρησιμοποιείται για να σκοράρει σε κάθε δίκτυο για την αξιολόγηση καταλληλότητας του στο παρατηρούμενα δεδομένα? την επίτευξη μιας ροής εργασίας που ενσωματώνει στο μοντέλο του την τοπολογία των οδών. Υπάρχουν αφού υπήρξαν προσεγγίσεις που διαμορφώσει το τοπολογία μονοπάτι σε κάποιο βαθμό στην ανάλυση των HTBD [9] – [14]. Από την άποψη της γενικής εφαρμογής και άμεση σχέση με την έξοδο της BPA, έχουμε χρησιμοποιήσει την ανάλυση μονοπάτι σηματοδότησης Επιπτώσεων (SPIA) [15] στις συγκρίσεις μας. SPIA συνδυάζει το μέτρο GSA με βάση την ενεργοποίηση μονοπατιού με μια νέα βαθμολογία οδού διαταραχή, η οποία αντανακλά το βαθμό στον οποίο η απορύθμιση των γονιδίων στην οδό είναι σε συμφωνία με την ιεραρχία σηματοδότησης.

Στην προσέγγιση BPA, μονοπάτια είναι ανακτώνται από τη βάση δεδομένων KEGG [16]. Κάθε καταχώρηση (κόμβος) στην οδό αντιστοιχίζεται σε ένα εσωτερικό μοναδικό αναγνωριστικό και μια μονάδα μετατροπής πραγματοποιεί την απαραίτητη χαρτογράφηση μεταξύ των ταυτοτήτων γονιδιακής έκφρασης εισόδου και τα αναγνωριστικά κόμβο οδού. Οι επαναλαμβανόμενες καταχωρήσεις στην οδό συγχωνεύονται και εκπροσωπούνται ως ένα ενιαίο κόμβο, ενώ διατήρηση σχέσεων άκρη. θεωρία BN χρησιμοποιεί κατευθυνόμενος άκυκλος γράφος (DAG), αλλά μπορεί να υπάρχει υπάρχουν κύκλοι στις βιολογικές οδούς. Αυτό έχει ξεπεραστεί με τη μέθοδο Spirtes ‘όπου οι αναπαραστάσεις γράφημα μοντέλα διαρθρωτικών εξίσωση [17] μετατρέπεται σε κατέρρευσε άκυκλα γραφήματα τέτοια ώστε d-διαχωρισμούς σε αναδιπλωμένο γράφημα συνεπάγεται τις ίδιες σχέσεις ανεξαρτησίας που ορίζεται από το μοντέλο. Για το σκοπό αυτό, ένα βιολογικό μονοπάτι διαμορφώνεται ως ΒΝ, η οποία τώρα μπορεί να ελεγχθεί από τα δεδομένα εισόδου για την αξιολόγηση φυσικής κατάστασης του.

Η BPA αναλαμβάνει ένα δύο-ομάδα (π.χ. υπόθεση εναντίον του ελέγχου) κανονικοποιημένα δεδομένα γονιδιακής έκφρασης όπως εισαγωγή. Η μήτρα παρατήρηση να στείλει κάθε DAG επιτυγχάνεται με τη δημιουργία των τιμών φορές μεταβολής (FC) για κάθε ζεύγος δειγμάτων στις δύο ομάδες. Σε αυτήν την μήτρα, στήλες αντιπροσωπεύουν γονίδια στο DAG και σειρές αντιπροσωπεύουν συγκρίσεις κατά ζεύγη. Αν υπάρχουν

N

1

και

N

2

δείγματα στις δύο ομάδες, η μήτρα παρατήρηση αποτελείται από

N

1 × N

2

σειρές. Κάθε στήλη αντιπροσωπεύει το FC για το αντίστοιχο γονίδιο σε κάθε μία από τις

N

1 × N

2

ζεύγη συγκρίσεις. Αυτές οι συνεχείς τιμές FC επιλύονται με την χρήση ενός cut-off του 2. Εάν η τιμή FC είναι μεγαλύτερη από 2 ή μικρότερη από 0,5 (δηλαδή το γονίδιο απορυθμισμένη), μετατρέπεται σε 1, και διαφορετικά μετατρέπεται σε 2.

Ο βαθμός στον οποίο ένα μονοπάτι εξηγεί δεδομένη HTBD μετριέται χρησιμοποιώντας το ισοδύναμο Bayesian Dirichlet (BDE) σκοράρει με ισοδύναμη μέθοδο μέγεθος του δείγματος [18]. Σε αυτή τη φάση, ο ΒΝ ενημερώνεται με τη μήτρα παρατήρηση κατά τη διάρκεια του υπολογισμού βαθμολογίας. Η στατιστική σημαντικότητα αυτής της μέτρησης αξιολογείται με τη δοκιμή κατά τα σύνολα δεδομένων που δημιουργούνται από την εφαρμογή τυχαιοποίηση μέσω bootstrapping όπου η παρατηρούμενη βαθμολογία κατατάσσεται κατά βαθμολογιών που προκύπτουν από τυχαία σύνολα δεδομένων. Bootstrapping εφαρμόζεται στις στήλες της μήτρας παρατήρηση παρέχει μια τυχαιοποίηση των σειρών, τα οποία χρησιμοποιούνται στο σκορ. Τα αποτελέσματα αξιολογούνται από την άποψη της ονομαστικής p-τιμές και ψευδείς ρυθμό ανακάλυψης (FDR) τιμές διόρθωση για τη δοκιμή πολλαπλές υποθέσεις.

Σε αυτό το έγγραφο, έχουμε δύο θεμελιώδεις στόχους. Ο πρώτος μας στόχος είναι να βελτιωθεί το σύστημα BPA, χρησιμοποιώντας τις ακόλουθες στρατηγικές. Προκειμένου να βελτιστοποιηθεί η φάση διακριτοποίησης, προσπαθήσαμε ίσου πλάτους, την ίδια συχνότητα, K-means, Στήλη Κ-μέσων, Bi-directional Κ-μέσων, και Αυτόματο Κατώφλι Διακριτοποίηση [19], [20], εκτός από το σκληρό-cut -off επίπεδα που προσφέρονται από BPA. Στη φάση της βαθμολόγησης, εφαρμόσαμε Akaike Κριτήριο Πληροφορίας (AIC) [21], Bayesian Criterion Πληροφοριών (BIC) [22], και Factorized Κανονικοποιημένο Μέγιστη Πιθανότητα (fNML) [23] και συγκρίνονται τα αποτελέσματα με το σύστημα βαθμολόγησης BDE. Η φάση αξιολόγησης σημασία άλλαξε έτσι ώστε τυχαία σύνολα δεδομένων ελήφθησαν σε επίπεδο σήματος γονιδίου. Στην προσέγγιση αυτή, τα δείγματα σε κάθε μία από τις δύο κατηγορίες τυχαία ιονανταλλαγή για την παροχή νέων σειρών δεδομένων [24]. Κάθε νέο σετ δεδομένων (με νέες αναθέσεις κατηγορίας για κάθε δείγμα) εκτελείται μέσα από την πλήρη ροή εργασίας και υπολογίζεται μια τιμή βαθμολογίας. Με αυτό τον τρόπο, θα ξεπεράσουμε τις περιπτώσεις κατά τις οποίες η τρέχουσα προσέγγιση BPA αδυνατεί να παράσχει τυχαιοποιημένη σύνολα δεδομένων. Κατά τη δοκιμή των νέων αυτών προσεγγίσεων, που παράγεται συνθετικά δεδομένα μικροσυστοιχιών που προσομοιώνει την έκφραση του γονιδίου από το

Ν

διαβάσεις, όπου ένα υποσύνολο,

N

ένα

, αυτών των οδών είναι ενεργή. Ένα κριτήριο επιδόσεων αξιολογείται από την ακρίβεια της πρόβλεψης ενεργητικής και παθητικής μονοπάτια. Εκτός από τη βελτίωση της μνήμης και της CPU χρήση του αλγορίθμου, έχουμε προσθέσει επίσης νέες οργανισμούς για τους οποίους μπορεί να χρησιμοποιηθεί το σύστημα BPA και θα παρέχει μια πύλη σε https://bioinfo.unl.edu/bpa/που φιλοξενεί το σταμάτημα μεμονωμένη έκδοση του βελτιστοποιημένο λογισμικό μαζί με φροντιστήριο και το παράδειγμα σύνολα δεδομένων.

δεύτερος στόχος μας σε αυτή τη μελέτη είναι να εφαρμόσει τη βελτιωμένη προσέγγιση ανάλυσης μονοπατιού για σύνολα δεδομένων σε πραγματικό καρκίνο. Για το σκοπό αυτό, έχουμε κατεβάσει σύνολα δεδομένων σε πραγματικό microarray από τη βάση δεδομένων GEO NCBI του σχετικά καρκίνους της ουροδόχου κύστης, του εγκεφάλου, του μαστού, του παχέος εντέρου, του ήπατος, του πνεύμονα, των ωοθηκών και του θυρεοειδούς. Ερευνήσαμε τα μονοπάτια που συνήθως προσδιορίζονται ως ενεργά σε αυτές διάφορα σύνολα δεδομένων για τον καρκίνο των μικροσυστοιχιών.

Μέθοδοι

Κλάση Ετικέτα μεταθέσεων

Στο αρχικό σύστημα BPA, η μήτρα δεδομένων παρατήρησης για ΒΝ βαθμολόγησης αποτελείται από τις 2 επιπέδων διακριτοποιούνται επίπεδα FC για τα γονίδια του δικτύου να σημειωθούν. Ο βαθμός στον οποίο ένα μονοπάτι εξηγεί δεδομένη HTBD μετράται με τη χρήση του «Bayesian Dirichlet ισοδύναμο» (BDE) σκοράρει και τη στατιστική σημαντικότητα αυτής της μέτρησης αξιολογείται από την τυχαιοποίηση μέσω bootstrapping όπου η παρατηρούμενη βαθμολογία κατατάσσεται κατά βαθμολογιών που προκύπτουν από τυχαία σύνολα δεδομένων. Οι τυχαιοποιημένες σύνολα δεδομένων που λαμβάνονται με την αλλαγή της δομής των στηλών του πίνακα παρατήρησης μέσω δειγματοληψίας με αντικατάσταση κάθε στήλη ξεχωριστά.

Στον Πίνακα 1, δείχνουμε δύο δειγμάτων περιπτώσεις τέτοιων πινάκων εισόδου. Εδώ, στήλες υποδηλώνουν τα γονίδια και σειρές υποδηλώνουν την κατά ζεύγη σύγκριση των δειγμάτων στις δύο ομάδες δείγμα (π.χ. καρκίνος vs. κανονικό). Η μέθοδος aferomentioned τυχαιοποίησης (αρχικά απασχολούνται από BPA) λειτουργεί με επιτυχία όταν μια μήτρα παρατήρηση όπως στον Πίνακα 1 (α) είναι η περίπτωση κατά την οποία μια συγκεκριμένη στήλη δεν αποτελείται μόνο από ένα είδος παρατήρησης. Ωστόσο, εάν η μήτρα παρατήρηση αποδεικνύεται ότι είναι όπως στον Πίνακα 1 (β), όπου οι στήλες αντιπροσωπεύουν ένα μόνο είδος της παρατήρησης, την τυχαία κατανομή των στηλών της μήτρας παρατήρησης δεν θα οδηγήσει σε μεταβολή. Ως εκ τούτου, οι βαθμολογίες που λαμβάνονται με τυχαία σύνολα δεδομένων θα είναι το ίδιο, καθιστώντας την εκτίμηση σημασία σχεδόν αδύνατο να επιτευχθεί. Είναι δυνατόν να ληφθούν μήτρες όπως στην τελευταία αυτή περίπτωση, δηλαδή μια μήτρα όπου μια δεδομένη στήλη αποτελείται μόνο από το ίδιο επίπεδο, όταν ένα γονίδιο δείχνει τον ίδιο βαθμό και την κατεύθυνση της αλλαγής μεταξύ των δύο κατηγοριών. Με άλλα λόγια, εάν ένα γονίδιο σε μια δεδομένη πορεία είναι σταθερά 2 ή περισσότερα FC ρυθμίζεται προς τα πάνω σε μία τάξη σε σχέση με την άλλη, θα καταλήξετε με τη στήλη για αυτό το γονίδιο να αποτελείται μόνο από το ίδιο επίπεδο διακριτοποίησης.

Η

για να ξεπεραστεί αυτό το πρόβλημα, θα εφαρμόζεται η μέθοδος μετάθεση περιγράφηκε προηγουμένως για τυχαίο σύνολα δεδομένων γονιδιακής έκφρασης [24]. Αυτό τυχαιοποίηση γίνεται με την αντικατάσταση των δειγμάτων κάθε κατηγορίας τυχαία. Ας υποθέσουμε ότι έχουμε ένα σύνολο δεδομένων που αποτελείται από 10 κανονικά και 10 δείγματα καρκίνου. Σε μία περίπτωση της μετάθεσης, για παράδειγμα, 3

ου, 5

ου, και 6

ου είναι φυσιολογικά δείγματα αντικατασταθεί με 1

ου, 7

ου και 9

ου δείγματα καρκίνου. Η μήτρα παρατήρηση παράγεται από κατά ζεύγη σύγκριση των τιμών σημάτων πάνω από την νέα τάξη των δύο τάξεων που ακολουθείται από διακριτοποίησης. Αυτή η διαδικασία επαναλαμβάνεται

Οι χρόνοι Β

και βαθμολογίες μονοπάτι υπολογίζεται χρησιμοποιώντας τις discretized μήτρες. Ως αποτέλεσμα, η στατιστική σημασία της παρατηρούμενης βαθμολογίας μπορεί να εκτιμηθεί με ακρίβεια μέσω της κατάταξης κατά βαθμολογιών που προκύπτουν από διαφορετικές μήτρες παρατήρηση που παράγονται από αυτά τα

Β

τυχαία σύνολα δεδομένων. Αν η βαθμολογία ενός συγκεκριμένου μονοπατιού είναι Sn, π-αξία του εκτιμάται χρησιμοποιώντας όπου

Ι (α)

είναι 1 εάν

μια

είναι «αλήθεια» και 0 διαφορετικά. Η σημασία της κάθε οδού έχει αναφερθεί ως αυτό το ονομαστική τιμή p και το αντίστοιχο ποσοστό εσφαλμένης ανακάλυψη (FDR) υπολογίζεται χρησιμοποιώντας τη διαδικασία Benjamini-Hochberg [25]

Διακριτοποίηση

Η BPA χρησιμοποιείται μια μέθοδος διακριτοποίησης έτσι ώστε η συνεχής τιμή FC αναπαρίσταται ως 1 εάν αυτό είναι μεγαλύτερο από 2 ή μικρότερη από ½ (δηλαδή ένα γονίδιο απορρυθμισμένης), και ως 2 διαφορετικά. Μια άλλη χρήση της διακριτοποίησης 2-επίπεδο είναι η επιλογή ενός τιμή αποκοπής του 3, δηλαδή η FC αναπαρίσταται ως 1 αν η τιμή του είναι μεγαλύτερη από 3 ή λιγότερο από το 1/3 και ως 2 διαφορετικά. Σε 3 επίπεδα διακριτοποίησης με την τιμή αποκοπής 2, η πολλαπλή μεταβολή αναπαρίσταται ως 1, αν η αξία του είναι μεγαλύτερη από 2 ως 2 αν είναι λιγότερο από ½, και ως 3 διαφορετικά. Σε 3 επίπεδα διακριτοποίησης με την τιμή αποκοπής του 3, η πτυχή της αλλαγής αναπαρίσταται ως 1, αν η αξία του είναι μεγαλύτερη από 3 ως 2 αν είναι λιγότερο από το 1/3, και ως 3 διαφορετικά.

η μελέτη αυτή, προτείνουμε νέες μεθόδους διακριτοποίησης [19], [20] για να χρησιμοποιηθεί στην επεξεργασία των παρατηρηθεί φορές τιμές μεταβολής για χρήση από Bayesian μετρήσεις βαθμολόγησης. Ένα

Ν

-by-

Μ

μήτρα

E

χρησιμοποιείται για να υποδηλώσει την παρατηρούμενη FC μήτρα, όπου

Ν

είναι ο αριθμός των κατά ζεύγη συγκρίσεων και

M

είναι ο αριθμός των γονιδίων.

E (n, m)

δηλώνει την αξία FC σύγκρισης

n

για το γονίδιο

m

.

E (n, 🙂

δηλώνει FC στοιχεία σύγκρισης

n

για όλα τα γονίδια, και

Ε (:, m)

δηλώνει τα στοιχεία FC του γονιδίου

m

για όλες τις συγκρίσεις.

Ίσες Πλάτος Διακριτοποίηση (EWD).

EWD χωρίζει τη σειρά μήτρας παρατήρηση

ν

σε

k

διαστήματα ίσου πλάτους μεταξύ

E (n,:)

min

και

E (n,:)

max

. Έτσι, τα διαστήματα της σύγκρισης

ν

έχουν πλάτος

w

=

(E (n,:)

max

E (n,:)

min)

/

k

, με όριο τα σημεία στο

E (n,:)

min + w, E (n,:)

min + 2w, … , E (n,:)

min + (k – 1) β

όπου

k

είναι ένας θετικός ακέραιος

ίση συχνότητα Διακριτοποίηση (EFD)

..

EFD χωρίζει το ταξινομημένο

E (n, 🙂

σε

k

χρονικά διαστήματα, έτσι ώστε κάθε διάστημα περιέχει τον ίδιο αριθμό τιμών FC.

K-means Διακριτοποίηση .

K-means διαιρεί

E (n, 🙂

σε

k

διαστήματα από k-means clustering, έτσι ώστε παρόμοιες τιμές FC σύγκρισης

n

τοποθετούνται στο ίδιο διάστημα

Στήλη K-means Διακριτοποίηση (Co-k-means)

Co-k-means διαιρεί

Ε.. (:, m)

στο

k

διαστήματα από k-means clustering, έτσι ώστε παρόμοιες τιμές FC για το γονίδιο

m

τοποθετούνται στο ίδιο διάστημα.

Αμφίδρομη K-means Διακριτοποίηση (Bi -Κ-μέσα).

στο bi-k-means μέθοδο τόσο k-means και συν-k-means αντίστοιχα υλοποιείται με την παράμετρο

k + 1

, δίνοντας κάθε αξία FC δύο discretized τιμές. Εάν το προϊόν από τις δύο τιμές είναι ίσες ή μεγαλύτερες από ό, τι

x

2

, και λιγότερο από

(x + 1)

2

, το τελικό discretized αξία αυτού τιμή της έκφρασης είναι

x

, όπου

x

είναι ένας θετικός ακέραιος που κυμαίνεται από

1

να

k

.

Αυτόματο Κατώφλι Διακριτοποίηση .

υπάρχουν δύο επιλογές για την αυτόματη διακριτοποίηση όριο, το οποίο καθορίζει επαναληπτικά τις τιμές cut-off με την ελαχιστοποίηση της διακύμανσης. Το σύνολο των δεδομένων FC

E

χωρίζεται σε δύο χρονικά διαστήματα, σύμφωνα με μια ορισμένη τιμή cut-off στην παγκόσμια επιλογή. Η τοπική επιλογή αυτής της μεθόδου διαιρεί

Ε (:, m)

σε δύο χρονικά διαστήματα σύμφωνα με τις τιμές αποκοπής που ορίζονται για κάθε στήλη (γονίδιο) ξεχωριστά

Scoring

. Εκτός από το σύστημα βαθμολόγησης BDE, προτείνουμε τα παρακάτω μετρήσεις όρος που πρέπει να χρησιμοποιείται στο σύστημα BPA.

Akaike Κριτήριο Πληροφορίας (AIC).

AIC είναι ένα από τα πιο συχνά χρησιμοποιούμενα κριτήρια πληροφοριών , η οποία επιλέγει το μοντέλο που ελαχιστοποιεί την αρνητική πιθανότητα τιμωρούνται από τον αριθμό των παραμέτρων [21]: όπου είναι η μέγιστη πιθανότητα του μοντέλου

Μ

,

D

παρατηρείται δεδομένων, και το ρ είναι ο αριθμός των παραμέτρων στο μοντέλο.

Bayesian Criterion πληροφοριών (BIC).

BIC είναι ένα άλλο ευρέως διαδεδομένο κριτήρια πληροφοριών και σε αντίθεση με AIC, BIC είναι συνεπής και βελτιώνει τις επιδόσεις με μεγάλα μεγέθη δείγματος [ ,,,0],22]. BIC ορίζεται ως εξής:..

BIC διαφέρει από AIC μόνο στη δεύτερη θητεία, η οποία εξαρτάται από το μέγεθος του δείγματος

Ν

Η

Factorized Κανονικοποιημένο Μέγιστη Πιθανότητα (fNML)

Silander et al. [23] ανέπτυξε το σκορ fNML με βάση την κατανομή [26], [27] κανονικοποιημένη μέγιστης πιθανότητας (NML). Λαμβάνοντας υπόψη ένα σύνολο δεδομένων

D

, το κριτήριο επιλογής μοντέλου NML επιλέγει το μοντέλο

M

για το οποίο είναι το μεγαλύτερο. όπου η εξομάλυνση γίνεται μέσω όλα τα σύνολα δεδομένων

D ‘

του ίδιου μεγέθους όπως

D

. Μετά τη λήψη του λογαρίθμου, το σκορ είναι σε μορφή τιμωρούνται λογαριθμική πιθανοφάνεια δίνεται

G

= {

G

1

, …,

G

m

} ως μητρική εταιρία που στο Δ.Σ.Ε. (δηλαδή

G

i

είναι η μητρική σύνολο του κόμβου

X

i

στο DAG): όπου το άθροισμα ομαλοποίηση πηγαίνει πάνω από όλα την πιθανή

D

i

στήλη φορείς. Ακόμη και αν ο όρος ποινή έχει μια εκθετική αριθμό όρων, μπορεί να αξιολογηθεί αποτελεσματικά χρησιμοποιώντας έναν αλγόριθμο γραμμικής χρόνου εισάγεται στο [28]. Με τον υπολογισμό της διάρκειας ποινή για κάθε μεταβλητή στο σύνολο δεδομένων, το NML γίνεται factorized.

Σύνολα δεδομένων

Εμείς που παράγεται συνθετικά μεταγραφικών ρυθμιστικών δικτύων και παράγονται τα δεδομένα γονιδιακής έκφρασης προσομοίωση με το θόρυβο που χρησιμοποιούν SynTReN v1.12 [29]. Δημιουργήσαμε 55 συνθετικά δίκτυα που μιμούνται βιολογικές οδούς με μεγέθη που κυμαίνονται από 7 έως 200. Έχουμε επιλέξει τυχαία 20 από 55 μονοπάτια για να είναι ενεργή και SynTReN δημιουργούνται τα αντίστοιχα σύνολα δεδομένων έκφρασης για τα δείγματα 20 δοκιμής και 20 ελέγχου με 2249 γονίδια προσθέτοντας ένα θόρυβο 4% επίπεδο.

για να ελέγξετε τη βελτιστοποιημένη και βελτιωμένη απόδοση BPA σε σύνολα πραγματικών δεδομένων, χρησιμοποιήσαμε 1 της ουροδόχου κύστης, 2 εγκέφαλο, 2 μαστού, του παχέος εντέρου 1, 2 του ήπατος, των πνευμόνων 1, 1 ωοθηκών, και 2 σύνολα δεδομένων για τον καρκίνο του θυρεοειδούς . Κατά την επιλογή των συνόλων δεδομένων, έχουμε σταθερή την πλατφόρμα για να Affymetrix για την πρόληψη προκατάληψη και να χρησιμοποιηθούν τα σύνολα δεδομένων, όπου όγκων και φυσιολογικά δείγματα είναι σαφώς καθορισμένα και τα δείγματα του καρκίνου είναι τόσο ομοιογενής όσο το δυνατόν. Τα περισσότερα από τα δεδομένα τσιπ ήρθε από την Affymetrix HG-U133 Plus 2.0 GeneChip, η οποία αποτελείται από περισσότερα από 54.000 σετ ανιχνευτών που αντιπροσωπεύουν πάνω από 47.000 μεταγραφές παρέχοντας μια ολοκληρωμένη εικόνα της ανθρώπινης μεταγραφικό. Άλλοι τύποι τσιπ περιλαμβάνουν HG-U133A και HG-U133A_2, οι οποίες αντιπροσωπεύουν περίπου 22.000 probesets. Πριν από την εφαρμογή της προτεινόμενης προσέγγισης, δεδομένων των πρώτων μικροσυστοιχιών έχει ομαλοποιηθεί χρησιμοποιώντας Affymetrix Microarray Analysis Suite (MAS) 5,0 αλγόριθμο [30].

Για κάθε σύνολο δεδομένων, θα εφαρμοστεί η προτεινόμενη μέθοδος ανάλυσης με 1000 παραλλαγές και αξιολογούνται σημαντικών οδών με ονομαστική τιμή p 0,05 και ένα FDR 0.25.

Αποτελέσματα

Στον πίνακα S1, παραθέτουμε τα επίπεδα ακρίβειας (εάν ένα δίκτυο είναι σωστά ονομάζεται ενεργό /ανενεργό) της τα διάφορα συστήματα διακριτοποίησης για 10 προσομοίωση σύνολα δεδομένων (D

1-D

10). Σύμφωνα με τα αποτελέσματα της προσομοίωσης, η καλύτερη μέθοδος διακριτοποίησης είναι η k-μέσα σε 2 επίπεδα διακριτοποίησης που εφαρμόζεται στις σειρές της μήτρας παρατήρησης. Η προσέγγιση αυτή επιτυγχάνει ακρίβεια 0,962 ± 0,031. Ως εκ τούτου, 2 επιπέδων μέθοδος k-means χρησιμοποιείται ως μέθοδος διακριτοποίησης για τα πειράματα για να προσδιοριστεί το καλύτερο κριτήριο βαθμολόγησης.

Τα σύνολα δεδομένων, τα οποία χρησιμοποιούνται για τη μέτρηση της απόδοσης των μεθόδων διακριτοποίησης, χρησιμοποιούνται επίσης για την εκτίμηση των μεθόδων βαθμολόγησης. Τα ληφθέντα ακρίβειες πρόβλεψη αναφέρονται στον Πίνακα 2. Σύμφωνα με τα αποτελέσματα της προσομοίωσης, η καλύτερη μέθοδος βαθμολόγησης είναι η μέθοδος fNML, που εκτιμά κατά πόσον μια οδός είναι ενεργή ή όχι με ακρίβεια 0,984 ± 0.016. Ως εκ τούτου, η 2-επίπεδο k-σημαίνει ότι οι μέθοδοι διακριτοποίησης και fNML βαθμολόγησης που χρησιμοποιείται για την ανάλυση δεδομένων σε πραγματικό μικροσυστοιχιών όπως αυτός ο συνδυασμός πέτυχε την υψηλότερη ακρίβεια.

Η

Στον Πίνακα 3, παραθέτουμε το μικροσυστοιχιών 12 πραγματικό του καρκίνου σύνολα δεδομένων (GEO αριθμοί, τύπους καρκίνου, και οι αριθμοί των δειγμάτων) και ο αριθμός των διόδων που προσδιορίζονται ως ενεργά με ΒΡΑ και SPIA αναλύσεις. Στους πίνακες S2 και S3, παραθέτουμε τον πλήρη κατάλογο των οδών θεωρούνται ενεργά από την BPA και τις μεθόδους SPIA για κάθε πραγματικό σύνολο δεδομένων καρκίνο μικροσυστοιχιών, αντίστοιχα. Συνολικά, η BPA εντοπίστηκαν 171 μονοπάτια που έχουν βρεθεί σημαντικές σε τουλάχιστον ένα από τα σύνολα δεδομένων. 15 από αυτά τα μονοπάτια έχουν βρεθεί να είναι σημαντική σε τουλάχιστον τα μισά από τα σύνολα δεδομένων και ως εκ τούτου ενδεχομένως να αντιπροσωπεύουν κοινούς μηχανισμούς σε διάφορους τύπους καρκίνου (βλέπε πίνακα S2).

Η

Ερευνήσαμε επίσης την από κοινού ανάληψη σημαντικών οδών σε τύπους καρκίνου αντιπροσωπεύεται από δύο σύνολα δεδομένων, εκτός από το καρκίνο του θυρεοειδούς, η οποία έχει οδηγήσει σε πολύ λίγες σημαντικές οδούς. Αυτά τα αποτελέσματα για την ανάλυση ΒΡΑ συνοψίζεται στην Εικόνα 1. Στην περίπτωση των συνόλων δεδομένων εγκεφάλου και καρκίνο του ήπατος, οι κοινές οδοί αποτελούνται από 52% και 59% του συνόλου δεδομένων με τον μικρότερο αριθμό οδών. Στα σύνολα δεδομένων για τον καρκίνο του μαστού, βλέπουμε ένα μικρότερο βαθμό συμφωνίας (-31%). Αυτά τα κοινά σημεία είναι το 60%, 41%, και 52% για τα σύνολα δεδομένων του εγκεφάλου, του μαστού, του ήπατος και, αντίστοιχα, με τη χρήση της ανάλυσης SPIA. Ωστόσο, SPIA χρησιμοποιεί ένα υποσύνολο των οδών διερευνήθηκαν από το σύστημα ΒΡΑ. Όταν εξετάζουμε μόνο τις πορείες στη βάση δεδομένων SPIA, τα κοινά σημεία στην ανάλυση BPA είναι 73%, 45% και 71% για τον εγκέφαλο, του μαστού και του ήπατος σύνολα δεδομένων, αντίστοιχα.

Η

Στο Σχήμα 2, παραθέτουμε τον αριθμό των μονοπατιών που προσδιορίζονται από τις δύο μεθόδους ανάλυσης, όταν η βάση δεδομένων οδός περιορίζεται σε εκείνο που χρησιμοποιείται από SPIA. Κατά μέσο όρο, ο αριθμός των οδών βρέθηκε να είναι σημαντικά δραστική από τις δύο μεθόδους είναι περίπου το 60% των οδών του αλγορίθμου με το μικρότερο αριθμό των ενεργών διαδρομών.

Η

Αν και το βελτιωμένο σύστημα ΒΡΑ ξεπέρασε το παλιό σύστημα BPA για τα συνθετικά σύνολα δεδομένων (τα δεδομένα δεν φαίνονται), συγκρίναμε την απόδοση και των δύο μεθόδων για την δεδομένα μικροσυστοιχιών πραγματικό καρκίνου. Ο κατάλογος των οδών που κρίνονται σημαντικές από το παλιό σύστημα BPA αντιπροσωπεύεται στον Πίνακα S4. Το παλιό ανάλυση BPA αποκάλυψε 127 πορείες που δραστηριοποιούνται σε τουλάχιστον ένα από τα σύνολα δεδομένων για τον καρκίνο και 18 από τις οδούς βρέθηκαν να είναι κοινές σε τουλάχιστον τα μισά από τα σύνολα δεδομένων. Στον Πίνακα S5, παραθέτουμε τον αριθμό των οδούς που εντοπίστηκαν ως ενεργά από τα δύο συστήματα BPA και να αναφέρει τον αριθμό των διαδρομών που συνήθως προσδιορίζονται από τις δύο μεθόδους σε κάθε σύνολο δεδομένων για τον καρκίνο.

Τα αποτελέσματα για τα σύνολα δεδομένων σε πραγματικό καρκίνο ( πίνακες S4 και S5) δείχνουν ότι το παλιό σύστημα BPA δεν παρουσιάζουν συνοχή για μερικά από τα σύνολα δεδομένων (π.χ. 57 έναντι 1 μονοπάτι που προσδιορίζονται από το νέο εναντίον παλιά ΔΔΕ στα δεδομένα «κύστη» που? 16 έναντι 3 οδούς που εντοπίστηκαν από ο νέος εναντίον παλιά ΔΔΕ στο «στήθος» σύνολο δεδομένων? 58 έναντι 0 μονοπάτι που προσδιορίζονται από το νέο εναντίον παλιά ΔΔΕ στα δεδομένα «πνεύμονα» που? και 10 έναντι 0 μονοπάτι που προσδιορίζονται από το νέο εναντίον παλιά ΔΔΕ στην η «θυρεοειδής» σύνολο δεδομένων). Πιστεύουμε ότι αυτό οφείλεται κυρίως με τη μέθοδο δοκιμής μετάθεση εισαχθούν στο νέο σύστημα BPA όπου το παλιό σύστημα αποτυγχάνει να παράγει τυχαία σύνολα δεδομένων στα μονοπάτια που δείχνουν μια σταθερή κατεύθυνση αλλαγής φορές για τα μέλη της (βλέπε Πίνακα 1). Μερικά από τη βελτίωση των επιδόσεων μπορεί να αποδοθεί με τις βελτιστοποιημένες μεθόδους διακριτοποίησης και βαθμολόγησης ενσωματωθεί στο νέο σύστημα BPA. Οι παλιές και νέες sytems BPA παρουσιάζουν, κατά μέσο όρο, μια επικάλυψη 28% μεταξύ των οδούς που εντοπίστηκαν σε κάθε σύνολο δεδομένων. Αυτό το επίπεδο της συμφωνίας είναι σημαντικά χαμηλότερο από εκείνο που παρατηρείται μεταξύ των νέων μεθόδων BPA και SPIA, η οποία έδειξε 60% επικάλυψη κατά μέσο όρο. Επιπλέον, λάβαμε μια επικάλυψη 25% κατά μέσο όρο μεταξύ των παλαιών μεθόδων BPA και SPIA όταν εξετάστηκαν οι οδοί που προσδιορίζονται για κάθε δεδομένα μικροσυστοιχιών πραγματικό του καρκίνου που καθορίζονται από τις δύο μεθόδους.

Εφαρμόσαμε επίσης τη βελτιωμένη μέθοδο BPA για το NCI-60 κυτταρική σειρά καρκίνου σύνολο δεδομένων μικροσυστοιχιών χρησιμοποιούνται στην περιγραφή της μεθόδου Gene set Εμπλουτισμός Ανάλυσης (GSEA) [31]. Αυτό το σύνολο δεδομένων περιέχει αποτελέσματα μικροσυστοιχιών (τρέχει στην πλατφόρμα Affymetrix HGU95Av2) για 50 από τις κυτταρικές σειρές NCI-60 (www.broadinstitute.org/gsea/datasets.jsp). Χρησιμοποιήσαμε αυτό το σύνολο δεδομένων για τον εντοπισμό οδών απορρυθμισμένη ακόλουθα μιας μετάλλαξης στο γονίδιο ρ53 καταστολέα όγκου. Από τα 50 δείγματα, 17 είναι άγριου τύπου και 33 μεταλλάξεις μεταφοράς στο γονίδιο p53. Οι οδοί που προσδιορίζονται ως ενεργά με ΒΡΑ, λόγω των μεταλλάξεων στην ρ53 που αναφέρονται στον Πίνακα 4.

Η

Συζήτηση

συνθετικά προσομοιώσεις δεδομένα μας προσδιορίζονται ομαδοποίηση κ-μέσων ως την καλύτερη μέθοδο που εκτελεί διακριτοποίησης . Βρίσκουμε αυτό το αποτέλεσμα λογικό ως k-means χρησιμοποιεί την κατανομή των δεδομένων για να ελαχιστοποιηθεί το συνολικό μέσο τετραγωνικό σφάλμα σε σχέση με τις discretized αξίες και τα γεγονότα real FC. Επίσης, με βάση τα συνθετικά αποτελέσματα των δεδομένων, η μέθοδος βαθμολόγησης που απέδωσε την υψηλότερη ακρίβεια ήταν η factorized κανονικοποιημένη μέγιστη πιθανότητα (fNML) βαθμολογία [23]. Αυτό το αποτέλεσμα ήταν επίσης αναμενόμενο, δεδομένου ότι έχει αποδειχθεί ότι το σύστημα βαθμολόγησης BDE είναι πολύ ευαίσθητη στην επιλογή της προηγούμενης υπερ-παραμέτρους και AIC και BIC απαιτεί κάποια χειροκίνητη ρύθμιση παραμέτρων και δεν λειτουργούν καλά με τα μικρά σύνολα δεδομένων, η οποία είναι μερικές φορές η περίπτωση με HTBD [32]. fNML από την άλλη πλευρά είναι μια μέθοδος θεωρία της πληροφορίας με βάση βελτιστοποιημένη βαθμολόγησης που δεν έχει ρυθμιζόμενους παραμέτρους.

Κατά την ανάλυση δεδομένων σε πραγματικό μικροσυστοιχιών χρήση BPA, η οδός που βγήκε στα περισσότερα από τα δεδομένα του καρκίνου θέτει ως σημαντική δραστηριότητα ( 8/12) είναι το μονοπάτι μόρια κυτταρικής προσκόλλησης (CAMs). Τα CAMs που βρίσκονται στην επιφάνεια των κυττάρων και να συμμετέχουν στην δραστηριότητα ενός δεσμευτικού με άλλα κύτταρα κυττάρων. Ένα από τα κύρια χαρακτηριστικά των καρκινικών κυττάρων είναι η ανεξέλεγκτη ανάπτυξη όπου τα κύτταρα έχουν ανοσία σε πυκνότητα-εξαρτώμενη αναστολή. Τα καρκινικά κύτταρα συνεχίσει να αναπτύσσεται, σχηματίζοντας πολλαπλά επίπεδα, ακόμη και όταν η κυτταρική πυκνότητα αυξάνεται. Αυτό οφείλεται κυρίως στη δυσλειτουργία σε CAMs, η οποία έχει αποδειχθεί ότι παίζει σημαντικό ρόλο στην εξέλιξη του καρκίνου [33] και την διατάραξη σημαντικά μονοπάτια μεταγωγής σήματος [34]. Συγκεκριμένα, έχουν CAMs έχει αποδειχθεί ότι εμπλέκονται στον εγκέφαλο [35], της ουροδόχου κύστης [36], του μαστού [37], το ήπαρ [38], του πνεύμονα [39] και του θυρεοειδούς [40] καρκίνο? τα σύνολα δεδομένων για τον καρκίνο, όπου το προτεινόμενο σύστημα βρήκε το CAM μονοπάτι ως ενεργοποιηθεί σημαντικά.

Άλλες οδοί που πρέπει να τονιστεί είναι «Citrate (TCA /τρικαρβοξυλικού οξέος) κύκλος», «Συμπλήρωμα και καταρράκτη πήξης» και «λιπώδους ιστού σηματοδότηση «μονοπάτια που βρέθηκε να είναι σημαντικά ενεργό σε 7 σύνολα δεδομένων για τον καρκίνο από 12. κύκλου Citrate, επίσης γνωστή ως κύκλος τρικαρβοξυλικού οξέος (κύκλος TCA) ή τον κύκλο του Krebs, είναι μέρος της κυτταρικής αναπνοής. Πρόκειται για μια σειρά από χημικές αντιδράσεις που χρησιμοποιούνται από όλους τους αερόβιους οργανισμούς για την παραγωγή ενέργειας. κεντρικής σημασίας της σε πολλές βιοχημικές οδούς υποδηλώνει ότι ήταν ένα από τα πρώτα τμήματα του κυτταρικού μεταβολισμού να εξελίσσεται [41]. Μια πρόσφατη μελέτη προσδιόρισε αυτό τον κύκλο ως μια ειδική για τον καρκίνο μεταβολική οδό [42]. Σε ένα ευρύ φάσμα των καρκινικών κυττάρων, συμπεριλαμβανομένων των τύπων που περιλαμβάνονται στο σύνολα δεδομένων μας, έχει βρεθεί ότι μια μετάλλαξη προκαλεί αυτόν τον κύκλο για να τρέξει από την ανάποδη. Συμπλήρωμα και οδό πήξης καταρράκτη μπορεί να εξηγηθεί σε δύο μέρη: το σύστημα συμπληρώματος είναι ένα πρωτεολυτικό καταρράκτη στο πλάσμα του αίματος και ένας μεσολαβητής της έμφυτης ανοσίας, ένας μη ειδικός μηχανισμός άμυνας κατά των παθογόνων, και η πήξη του αίματος είναι μία άλλη σειρά από προενζύμου-προς-σερίνη μετατροπές πρωτεάση . Αυτή η οδός χαρακτηρίζεται ως σημαντική για τους τύπους του μαστού και του καρκίνου του ήπατος σε ένα λειτουργικό χάρτη του καρκίνου, το οποίο έχει καθιερωθεί μετά την ανάλυση των λειτουργικών προφίλ έκφρασης του σημαντικά εμπλουτισμένη οδούς KEGG σε διαφορετικές οντότητες όγκου εκχωρηθεί σε διάφορες κατηγορίες όγκου [43]. Λιπώδους ιστού μονοπάτι σηματοδότησης συσχετίζεται θετικά με την παραγωγή λεπτίνης, η οποία είναι ένας σημαντικός ρυθμιστής της πρόσληψης ενέργειας και μεταβολικό ρυθμό. Η λεπτίνη και η αδιπονεκτίνη είναι τα πιο άφθονα Αδιποκυτοκίνες και τα καλύτερα μελετημένα μόρια σε αυτή την κατηγορία μέχρι τώρα. Πρόσφατα όγκου βιολογική ευρήματα σχετικά με το ρόλο του πιο εξέχοντα Αδιποκυτοκίνες λεπτίνης και αδιπονεκτίνης, οι οποίες εμπλέκονται στην ανάπτυξη του όγκου, εισβολή και μετάσταση, δείχνουν τα αποτελέσματα της Αδιποκυτοκίνες σε καρκίνους του εγκεφάλου και του μαστού [44], τα είδη των συνόλων δεδομένων του καρκίνου, όπου το σύστημα ΒΡΑ βρέθηκε αυτό το μονοπάτι ως ενεργοποιηθεί σημαντικά. Υπήρξαν και άλλες συμπληρωματικές μελέτες που έχουν δείξει τη σχέση της λιπώδους μονοπάτι προς πνεύμονα και του ήπατος καρκίνων [59] σηματοδότησης, [60].

συνθετικών αποτελεσμάτων Τα στοιχεία μας δείχνουν ότι το βελτιωμένο σύστημα BPA προσδιορίζει τη δραστηριότητα ενός μονοπατιού με ακρίβεια πάνω από 98%. Αν και δεν υπάρχει χρυσός Standart στην αξιολόγηση των δραστικών διόδων σχετικά με τα πραγματικά δεδομένα μικροσυστοιχιών ενός ορισμένου φαινοτύπου, αναπαραγωγιμότητα BPA στους ίδιους τύπους καρκίνου ήταν πάνω από 50% κατά μέσο όρο. Όταν η βάση δεδομένων μονοπάτι περιορίζεται σε εκείνο που χρησιμοποιείται από SPIA, αυτό αναπαραγωγιμότητα υπερβαίνει το 70%. Τέλος, όταν εξετάζονται όλα τα σύνολα δεδομένων του καρκίνου, η συμφωνία μεταξύ των δύο μεθόδων είναι περίπου 60%. Δεδομένης της τεχνικής και βιολογική ποικιλία, ένας τέτοιος υψηλός βαθμός επικάλυψης μεταξύ των διαφόρων συστημάτων ανάλυσης οδός είναι πολύ ελπιδοφόρα.

Σε μια προσπάθεια να εντοπίσει patways ειδικά για συγκεκριμένους τύπους καρκίνου, ερευνήσαμε μονοπάτια που βρίσκονται σταθερά να είναι ενεργοί για τους ίδιους τύπους καρκίνου (και μη δραστικές για τους άλλους τύπους καρκίνου) από το τρέχον σύστημα ΒΡΑ. Για τον καρκίνο του εγκεφάλου, «μονοπάτι της νόσου του Parkinson (hsa05012)» βρέθηκε ενεργή στις δύο σύνολα δεδομένων καρκίνο του εγκεφάλου και μόνο σε μία από τις υπόλοιπες ομάδες δεδομένων 10 του καρκίνου. νόσος του Parkinson (PD) είναι μια από τις πιο κοινές neurodegeneretive διαταραχές που σχετίζονται με την απώλεια κυττάρων στη μέλαινα ουσία περιοχή του μεσεγκεφάλου [45]. Πρόσφατα, έχουν υπάρξει μελέτες που συνδέουν τους μοριακούς μηχανισμούς και γενετική διαθέσεις της νόσου στον καρκίνο. Μεταλλάξεις σε PARK2, μια από τις πιο κοινές αιτίες της πρώιμης έναρξης PD, έχει δειχθεί ότι παίζει έναν κεντρικό ρόλο στην γλοιοβλαστώματα [46] που παρουσιάζουν μεταβολές στην σχεδόν ταυτόσημα υπολείμματα τόσο στο PD και των δειγμάτων καρκίνου του εγκεφάλου. Εντοπισμός αυτής της οδού ως ενεργά σχεδόν μοναδικά και με συνέπεια σε σύνολα δεδομένων για τον καρκίνο του εγκεφάλου υπονοεί ότι η BPA είναι σε θέση να προσδιορίσει βιολογικά νόημα οδών με βάση την υποκείμενη HTBD. Στα σύνολα δεδομένων καρκίνο του ήπατος, «μεταβολισμός Βιοτίνη (hsa00641)» και «αποικοδόμηση οξύ 3-χλωροακρυλικό (hsa00780)» οδών βρέθηκαν να είναι ενεργός μόνο κατά τα δύο σύνολα δεδομένων ήπατος.

You must be logged into post a comment.