PLoS One: Ανασυγκρότηση του Gene Ρυθμιστική Modules στον κύκλο Cancer Cell από την Multi-Source Data Integration


Αφηρημένο

Ιστορικό

Ακριβής ρύθμιση του κυτταρικού κύκλου είναι ζωτικής σημασίας για την ανάπτυξη και την ανάπτυξη όλων των οργανισμών. Η κατανόηση του ρυθμιστικού μηχανισμού του κυτταρικού κύκλου είναι ζωτικής σημασίας για την διαλεύκανση πολλών περίπλοκες ασθένειες, κυρίως του καρκίνου. Πολλαπλές πηγές βιολογικών δεδομένων είναι διαθέσιμα για τη μελέτη των δυναμικών αλληλεπιδράσεων μεταξύ πολλών γονιδίων που σχετίζονται με τον καρκίνο του κυτταρικού κύκλου. Η ενσωμάτωση αυτών των ενημερωτικών και συμπληρωματικές πηγές δεδομένων μπορεί να βοηθήσει να συμπεράνουμε μια αμοιβαία συνοχή γονίδιο μεταγραφικό ρυθμιστικό δίκτυο με ισχυρή ομοιότητα με τις υποκείμενες γονίδιο ρυθμιστικές σχέσεις στα καρκινικά κύτταρα.

Αποτελέσματα και ΚΥΡΙΟΤΕΡΑ ΑΠΟΤΕΛΕΣΜΑΤΑ

Προτείνουμε μια ενοποιητική πλαίσιο που συνάγει γονίδιο ρυθμιστικής ενότητες από τον κυτταρικό κύκλο των καρκινικών κυττάρων με την ενσωμάτωση πολλαπλές πηγές βιολογικών δεδομένων, συμπεριλαμβανομένων των προφίλ γονιδιακής έκφρασης, το γονίδιο οντολογία, και μοριακή αλληλεπίδραση. Μεταξύ των 846 ανθρώπινα γονίδια με υποτιθέμενο ρόλο στη ρύθμιση του κυτταρικού κύκλου, εντοπίσαμε 46 μεταγραφικών παραγόντων και 39 ομάδες γονιδίων οντολογίας. Εμείς ανακατασκευαστεί ρυθμιστικές υπομονάδες να συναγάγει τις υποκείμενες ρυθμιστικές σχέσεις. Τέσσερις ρυθμιστικά μοτίβα δίκτυο ταυτοποιήθηκαν από το δίκτυο αλληλεπίδραση. Η σχέση μεταξύ του κάθε παράγοντα μεταγραφής και προέβλεψε ομάδες γονίδιο στόχο εξετάστηκε από την εκπαίδευση ένα επαναλαμβανόμενο νευρωνικό δίκτυο του οποίου η τοπολογία μιμείται το μοτίβο (ες) δίκτυο στο οποίο είχε ανατεθεί ο παράγοντας μεταγραφής. Τεκμαιρόμενη μοτίβα του δικτύου που σχετίζονται με οκτώ γνωστά γονίδια του κυτταρικού κύκλου επιβεβαιώθηκαν με ανάλυση του γονιδίου σύνολο εμπλουτισμό, δεσμευτική ανάλυση εμπλουτισμό χώρο, και η σύγκριση με προηγουμένως δημοσιευμένα πειραματικά αποτελέσματα.

Συμπεράσματα

Έχουμε δημιουργήσει μια ισχυρή μέθοδος που μπορεί να συναχθεί με ακρίβεια υποκείμενες σχέσεις μεταξύ ενός συγκεκριμένου παράγοντα μεταγραφής και κατάντη γονίδια στόχο της, ενσωματώνοντας διαφορετικά στρώματα των βιολογικών δεδομένων. Η μέθοδός μας θα μπορούσε επίσης να είναι επωφελής για τους βιολόγους για την πρόβλεψη των στοιχείων των εποπτικών ενότητες στις οποίες συμμετέχει κάθε υποψήφιο γονίδιο. Τέτοιες προβλέψεις μπορούν στη συνέχεια να χρησιμοποιηθούν για να σχεδιάσουν μια πιο απλοποιημένη πειραματική προσέγγιση για βιολογική επικύρωσης. Η κατανόηση της δυναμικής αυτών των μονάδων θα ρίξει φως σχετικά με τις διεργασίες που συμβαίνουν σε καρκινικά κύτταρα που προκύπτουν από σφάλματα στη ρύθμιση του κυτταρικού κύκλου

Παράθεση:. Zhang Υ, Xuan J, de los Reyes BG, Clarke R, Ressom HW ( 2010) Ανασυγκρότηση του Gene Ρυθμιστική Modules στον κύκλο Cancer Cell από την Multi-Source Data Integration. PLoS ONE 5 (4): e10268. doi: 10.1371 /journal.pone.0010268

Επιμέλεια: Geraldine Butler, University College Dublin, Ιρλανδία

Ελήφθη: 16 του Οκτ, 2009? Αποδεκτές: 25 Μαρτίου 2010? Δημοσιεύθηκε: 21, Απριλίου του 2010

Copyright: © 2010 Zhang et al. Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της άδειας χρήσης Creative Commons Attribution, το οποίο επιτρέπει απεριόριστη χρήση, τη διανομή και την αναπαραγωγή σε οποιοδήποτε μέσο, ​​με την προϋπόθεση το αρχικό συγγραφέα και την πηγή πιστώνονται

Χρηματοδότηση:. Αυτή η μελέτη υποστηρίζεται εν μέρει από τις επιχορηγήσεις από τα Εθνικά Ινστιτούτα Υγείας (CA109872, NS29525, EB00830, και CA096483) και το Υπουργείο άμυνας (BC030280). Οι χρηματοδότες δεν είχε κανένα ρόλο στο σχεδιασμό της μελέτης, τη συλλογή και ανάλυση των δεδομένων, η απόφαση για τη δημοσίευση, ή την προετοιμασία του χειρογράφου

Αντικρουόμενα συμφέροντα:.. Οι συγγραφείς έχουν δηλώσει ότι δεν υπάρχουν ανταγωνιστικά συμφέροντα

Εισαγωγή

η κυτταρική διαίρεση, τη γήρανση, και ο θάνατος είναι περίπλοκα ρυθμιζόμενη διαδικασίες που εξαρτώνται από την ισορροπία μεταξύ των διαφόρων αυξητικών και αναστέλλοντας σήματα. Οι περιπλοκές από αυτές τις διαδικασίες που ορίζονται από συγκρότημα γενετικά προγράμματα που επιτρέπουν ορισμένα γονίδια να εκφράζονται σε ένα στενά ρυθμιζόμενο τρόπο. Λάθη στη ρύθμιση προκαλέσει ανεξέλεγκτο πολλαπλασιασμό των κυττάρων, μια καθολική ιδιότητα των όγκων. Αυτό το χαρακτηριστικό οδηγείται από γονίδια που δεικνύουν ανώμαλα δραστηριότητες σε κύτταρα όγκου, πολλά από τα οποία έχουν σημαντικούς ρόλους στην μεταγωγή σημάτων ρύθμισης της ανάπτυξης στον πυρήνα και διασυνδέεται αυτά τα σήματα για να τροποποιήσουν τη γονιδιακή έκφραση. Ενώ αυτή η σηματοδότηση συμβάλλει αναπόφευκτα στην πολλαπλασιαστική ικανότητα των κυττάρων του όγκου, είναι συχνά σχεδιαστεί να κάνουν με ιεραρχικό τρόπο, ενισχύοντας τη δραστηριότητα των προσαγωγών σηματοδότησης, τελικά συγκλίνουν σε αυτά τα γονίδια που ελέγχουν την πρόοδο του κυτταρικού κύκλου.

οι πρόοδοι στην έρευνα για τον καρκίνο κατά τη διάρκεια των τελευταίων ετών έχουν αρχίσει να αποκαλύψει το περίπλοκο γενετικού προγραμματισμού της προόδου του κυτταρικού κύκλου. Τα επίπεδα έκφρασης χιλιάδων γονιδίων κυμαίνονται σε ολόκληρο τον καρκίνο του κυτταρικού κύκλου [1], [2]. Οι περιοδικές μεταγραφική δραστηριότητα πολλών γονιδίων που εμπλέκονται στην ανάπτυξη των κυττάρων, της σύνθεσης DNA, αναπαραγωγή σώματος πόλου ατράκτου, και τη διαμετακόμιση μέσω του κυτταρικού κύκλου έχουν παρατηρηθεί καθένα [3]. Οι μεταγραφικές ρυθμιστικές δίκτυα (Trns) που συνδέονται με αυτές τις δραστηριότητες έχουν ερευνηθεί εκτενώς [4], [5], [6], [7], [8]. Περαιτέρω χαρακτηρισμός του γονιδιώματος σε επίπεδο μεταγραφικής προγραμματισμός του κυτταρικού κύκλου των θηλαστικών είναι ένα κρίσιμο βήμα προς την κατανόηση των βασικών διαδικασιών του κυτταρικού κύκλου και την ακριβή τους ρόλους τους στον καρκίνο.

δεδομένα γονιδιακής έκφρασης κυτταρικού κύκλου που λαμβάνεται από κύτταρα Hela έχουν αναλυθεί με διάφορες μεθόδους ομαδοποίησης και τα γονίδια οργανώνονται σε λειτουργικές και ρυθμιστικές ομάδες [1], [2]. Με βάση αυτές τις μελέτες, για την ίδρυση ενός ισχυρού συμπέρασμα όσον αφορά τις ρυθμιστικές σχέσεις μεταξύ ενός ορισμένου παράγοντα μεταγραφής και υποτιθέμενο γονίδιο-στόχο (α) θα μπορούσε να επιτευχθεί καλύτερα με το συνδυασμό των δεδομένων γονιδιακής έκφρασης με πληροφορίες για παράγοντα μεταγραφής θέσεις πρόσδεσης και τα πιθανά είδη αλληλεπίδραση με βάση την υπάρχουσες βιολογικές γνώσεις [9]. Η μεταγραφική ενεργοποίηση ή καταστολή εξαρτάται από την αναγνώριση ειδικών αλληλουχιών στοιχείο προαγωγέα από τη ρυθμιστική πρωτεΐνη δέσμευσης DNA. Πώς ένας συγκεκριμένος συνδυασμός αυτών των πρωτεϊνών συγγενείς με τα γονίδια σε ένα γονιδίωμα αναφέρεται ως TRN. Ως εκ τούτου, είναι σημαντικό να διερευνηθεί πώς αυτές οι περιοδικές πρότυπα ρυθμίζονται στο πλαίσιο του TRN του κυτταρικού κύκλου σε καρκινικά κύτταρα.

Η αντίστροφη μηχανική μιας παγκόσμιας TRN παραμένει πρόκληση οφείλεται σε διάφορους περιορισμούς, μεταξύ άλλων (1) την υψηλή διαστάσεων των ζωντανών κυττάρων, όπου δεκάδες χιλιάδες γονίδια δρουν σε διαφορετικές χρονικές και χωρικές συνδυασμούς, (2) κάθε γονίδιο αλληλεπιδρά ουσιαστικά με πολλαπλούς εταίρους είτε άμεσα είτε έμμεσα, έτσι πιθανές σχέσεις είναι δυναμικές και μη γραμμικές, (3) τις τρέχουσες τεχνολογίες υψηλής απόδοσης παράγουν δεδομένα που περιλαμβάνουν ένα σημαντικό ποσό του θορύβου, και (4) το μέγεθος του δείγματος είναι εξαιρετικά χαμηλό σε σύγκριση με τον αριθμό των γονιδίων [10]. Αποσύνθεση ενός TRN σε ένα μικρό σύνολο των επαναλαμβανόμενων ρυθμιστικών ενότητες (

π.χ.

, μοτίβα δικτύου) είναι μια πολλά υποσχόμενη στρατηγική για την αντιμετώπιση αυτής της πρόκλησης.

Έχουμε περιγράψει την ανάπτυξη ενός καινοτόμου υπολογιστικού πλαισίου που συνάγει συγκρότημα Trns με την ενσωμάτωση βιολογικών δεδομένων από πολλαπλές πηγές και τη χρήση της έννοιας του μοτίβου δικτύου modular ανάλυση. Η καινοτομία αυτής της υπολογιστικής πλαισίου έγκειται στην αποσύνθεση ενός πολύπλοκου βιολογικού δικτύου σε δυναμικά απλό αλλά καλά χαρακτηρισμένο μοτίβα δίκτυο, και τη δυνατότητα να ενσωματώνουν ανόμοιων βιολογικά δεδομένα για τον υπολογισμό αυτών των μοτίβων του δικτύου. Οι τεκμαιρόμενη ενότητες παρέχουν μια λογική βάση για τη δημιουργία νέων υποθέσεων για τις επόμενες πειραματική επαλήθευση. Έχουμε αποδείξει την ικανότητα αυτού του υπολογιστικού πλαισίου να συναχθεί ρυθμιστικές υπομονάδες που συνδέονται με την εξέλιξη του κυτταρικού κύκλου σε κύτταρα HeLa με το συνδυασμό πληροφοριών από τα πειράματα χρονικής πορείας γονιδιακή έκφραση [2], οι αλληλεπιδράσεις πρωτεΐνης-πρωτεΐνης (ΡΡΙ) [11], [12], [13], [14], [15], [16], [17], [18], [19], [20], [21], [22], πρωτεΐνη-DNA αλληλεπιδράσεις (PDI) [23] και το γονίδιο οντολογίας (GO) [24].

σε σύγκριση με έχουν αναφερθεί στο παρελθόν τη στρατηγική μας, η οποία εφαρμόστηκε σε TRN συμπέρασμα στο κύτταρο ζύμης κύκλου [25], αυτό το νέο σύστημα περιλαμβάνει μια ολοκληρωμένη χρήση των PPI και PDI δεδομένων (εφεξής τα δεδομένα της μοριακής αλληλεπίδρασης) από δεκατρία δημοσίως διαθέσιμες βάσεις δεδομένων σε συνδυασμό με την ανίχνευση των σημαντικών μοτίβων δικτύου για κάθε παράγοντα μεταγραφής. Εφαρμογή του νέου αυτού συστήματος επέκτεινε σημαντικά το πεδίο των δικτύων που ενσωματώνουν βαθύτερες σύνολα γνωστά και πολύτιμα βιολογικά στοιχεία. Επιπλέον, έχουμε εισαγάγει μια νέα μέθοδο εγκυρότητα συμπλέγματος που χρησιμοποιεί το σχολιασμό GO για να υπολογίσει την ομοιότητα των δύο δεδομένων των γονιδίων σε ένα σύμπλεγμα. Το διαμέρισμα με την υψηλότερη βαθμολογία ομοιότητα έχει επιλεγεί ως η βέλτιστη σύμπλεγμα. Μικρές μονάδες TRN (

δηλ.

, Μοτίβα δικτύου) είναι εύκολα ερμηνεύσιμο και έχουν τη δυνατότητα να παρέχουν γνώσεις σχετικά με νέες υποθέσεις. Εάν μια συστάδα γονιδίων ενέχεται στην μοτίβο δίκτυο ενός παράγοντα μεταγραφής, και τα περισσότερα γονίδια έχουν αποδείξεις ότι ρυθμίζονται από τον συγκεκριμένο παράγοντα μεταγραφής, είναι πολύ πιθανό ότι και άλλα γονίδια σε αυτό το σύμπλεγμα έχουν παρόμοια ρυθμιστική σχέσεις με το συγκεκριμένο παράγοντα μεταγραφής. Η δυνατότητα εξαγωγής συμπερασμάτων από εξευγενισμένα υπολογιστικού πλαισίου μας επιβεβαιώνεται από διάφορες αναλύσεις, συμπεριλαμβανομένης της ανάλυσης σύνολο γονιδίων εμπλουτισμού (GSEA), δεσμευτική ανάλυση εμπλουτισμό ιστοσελίδα (BSEA), και επιπλέον έρευνα βιβλιογραφίας.

Αποτελέσματα

Επισκόπηση το πλαίσιο ενοποίησης δεδομένων

Θεωρήσαμε δύο διαφορετικά στρώματα των δικτύων σε κάθε TRN με βάση την ανάλυση των δεδομένων Hela κυτταρικού κύκλου. Πρώτη είναι η σωματική δίκτυο που περιλαμβάνει PPIs και ΡϋΙ στο επίπεδο δέσμευσης του παράγοντα-γονιδίου. Δεύτερο είναι το λειτουργικό δίκτυο που ενσωματώνει τις συνέπειες αυτών των φυσικών αλληλεπιδράσεων, όπως η ενεργοποίηση ή καταστολή της μεταγραφής. Χρησιμοποιήσαμε τρεις τύπους των δεδομένων για την ανακατασκευή του TRN, δηλαδή PPIs που προέρχεται από μια συλλογή PPI βάσεων δεδομένων, ΡϋΙ από τη βάση δεδομένων TRANSFAC, και τα προφίλ γονιδιακής έκφρασης πορεία του χρόνου, όπως δημοσιεύεται από [2]. Οι δύο πρώτες πηγές δεδομένων που παρέχονται άμεσα πληροφορίες δικτύου για να περιορίσουν το μοντέλο TRN. Τα προφίλ γονιδιακής έκφρασης παρέχεται μια σαφή μέτρηση για τα αιτιώδη αποτελέσματα του μοντέλου TRN. GO σχολιασμού περιγράφει τις ομοιότητες μεταξύ των γονιδίων μέσα σε ένα δίκτυο, το οποίο διευκολύνει περαιτέρω χαρακτηρισμό των σχέσεων μεταξύ των γονιδίων. Ο στόχος ήταν να διακρίνει τις εξαρτήσεις μεταξύ των προτύπων γονιδιακής έκφρασης και τις φυσικές δια-μοριακές αλληλεπιδράσεις αποκαλύπτεται από συμπληρωματικές πηγές δεδομένων.

Το μοντέλο πλαίσιο για TRN συμπέρασμα από την ενοποίηση των δεδομένων πολλαπλών στρώσεων απεικονίζεται στο Σχήμα 1. Εκτός από τα δεδομένα προ-επεξεργασίας, τα τρία διαδοχικά βήματα που εμπλέκονται σε αυτό το πλαίσιο, όπως περιγράφεται στα ακόλουθα:

πρότυπα γονιδιακής έκφρασης για πρώτη φορά συγκεντρωμένα σε βιολογικά σημαντικές ομάδες από FCM? GO κατηγορία πληροφορίες των γονιδίων χρησιμοποιήθηκε για να προσδιοριστεί ο βέλτιστος αριθμός συμπλέγματος. Για την αξιολόγηση των συστάδων γονιδίων, GSEA διεξήχθη στις βέλτιστες συστάδες. Επιπλέον, σημαντική μοτίβα δίκτυο ανιχνεύονται στη συνδυασμένη δίκτυο των PPI και PDI στη συνέχεια αποδίδεται σε κάθε παράγοντα μεταγραφής. Αφού οι συστάδες γονιδίων που σχηματίζονται και παράγοντες μεταγραφής αποδόθηκαν να δικτυωθούν κατηγορίες μοτίβο, οι συνδέσεις μεταξύ παραγόντων μεταγραφής και συστάδες γονιδίων συναχθεί από RNNs εκπαίδευση που μιμούνται η τοπολογία του δικτύου μοτίβα που είναι παράγοντες μεταγραφής ανατεθεί. Τέλος, οι τεκμαιρόμενη μοτίβα δίκτυο επικυρώθηκαν από BSEA και τη λογοτεχνία αποτελέσματα.

Η

Gene ομαδοποίησης.

Τα γονίδια με παρόμοιο προφίλ έκφρασης εκπροσωπείται από ένα σύμπλεγμα για την αντιμετώπιση του προβλήματος επεκτασιμότητα σε TRN συμπερασματολογία [26]. Η υπόθεση είναι ότι ένα υποσύνολο των γονιδίων που σχετίζονται με την άποψη της έκφρασης (συν-ρυθμιζόμενες) μπορούν να ομαδοποιηθούν με βάση ένα ενοποιητικό cis-ρυθμιστικών στοιχείων (ες) που συνδέονται με ένα κοινό παράγοντα μεταγραφής που ρυθμίζει η κάθε μία και κάθε μέλος του συμπλέγματος (συν-εκφράζεται) [27]. πληροφορίες GO χρησιμοποιήθηκε για τον καθορισμό του βέλτιστου αριθμού των συστάδων σε σχέση με ορισμένες ευρείες λειτουργικές κατηγορίες. Δεδομένου ότι κάθε συστάδα αντιπροσωπεύει κυρίως μία ευρεία βιολογική ή διεργασία κατηγορία όπως εκτιμήθηκαν από FuncAssociate [28]), το ρυθμιστικό δίκτυο συνεπάγεται ότι ένας δεδομένος παράγοντας μεταγραφής είναι πιθανό να εμπλέκονται στον έλεγχο μιας ομάδας λειτουργικώς συναφή γονίδια [29].

δίκτυο για μεταγραφικού παράγοντα.

για να μειωθεί η πολυπλοκότητα του προβλήματος συμπέρασμα, μοτίβα του δικτύου χρησιμοποιήθηκαν αντί μιας παγκόσμιας συμπέρασμα TRN. Τα σημαντικά μοτίβα δίκτυο στη συνδυασμένη δίκτυο μοριακή αλληλεπίδραση καθιερώθηκαν πρώτα και εκχωρηθεί σε τουλάχιστον έναν παράγοντα μεταγραφής. Αυτές οι ενώσεις περαιτέρω χρησιμοποιήθηκαν για την ανακατασκευή των ρυθμιστικών πλαισίων.

Κατασκευή μοτίβα δικτύου για τον παράγοντα μεταγραφής.

Για κάθε παράγοντα μεταγραφής ανατεθεί σε ένα μοτίβο δίκτυο, ένα γενετικό αλγόριθμο (GA) δημιουργείται υποψήφιο γονίδιο clusters για την ανάθεση σε έναν παράγοντα μεταγραφής με βάση τις σχέσεις που δημιουργούνται από το μοτίβο του δικτύου. Ένα επαναλαμβανόμενο νευρωνικό δίκτυο (RNN) είχε εκπαιδευτεί για να διαμορφώσει μια TRN που μιμείται το σχετικό μοτίβο του δικτύου. GA δημιουργούνται τα συμπλέγματα γονιδίων υποψήφιο, και βελτιστοποίηση σμήνος σωματιδίων (PSO) χρησιμοποιήθηκε για να ρυθμίσετε τις παραμέτρους του RNN. επιλέχθηκαν οι παράμετροι για να ελαχιστοποιηθεί η ρίζα του μέσου τετραγωνικού σφάλματος (RMSE) μεταξύ της εξόδου της RNN και πρότυπο έκφρασης του συμπλέγματος γονιδίου στόχου. Το RMSE επέστρεψε στην GA για την παραγωγή της επόμενης γενιάς των συνεργατικών σχηματισμών υποψηφίου γονιδίου. Βελτιστοποίηση συνεχίστηκε έως ότου ολοκληρωθεί είτε ένα προκαθορισμένο μέγιστο αριθμό των επαναλήψεων ή επετεύχθη μία προκαθορισμένη ελάχιστη RMSE. Η διαδικασία επαναλήφθηκε για όλους τους παράγοντες μεταγραφής. Βιολογική γνώσης από βάσεις δεδομένων χρησιμοποιήθηκε για την αξιολόγηση των προβλεπόμενων αποτελεσμάτων.

Ίδρυση βέλτιστος αριθμός των βιολογικά σημαντικών συστάδες από σύμπλεγμα μέτρησης ισχύος

Τα γονίδια που ανήκουν σε παρόμοιες ή σχετικές λειτουργικές κατηγορίες και που παρουσιάζουν παρόμοια μοτίβα μεταγραφής είναι πιθανόν να ρυθμίζονται από τον ίδιο μηχανισμό [30]. Εκφράζονται συντονισμένα γονίδια είναι πιθανό να ενοποιηθούν με κοινή cis-ρυθμιστικά στοιχεία και οι συγγενείς παράγοντα μεταγραφής τους (ες) [31], [32], αλλά αυτή η σχέση είναι συχνά εύκολο να διαπιστωθούν μόνο σε περιπτώσεις όπου το σύμπλεγμα αποτελείται από ιδιαίτερα να εκφράζονται μετρίως γονίδια . Επιπλέον, σε υψηλές θέσεις διαστάσεων δεδομένα αυτά τα ενιαία συσχετισμοί είναι θορυβώδης και η υποκείμενη δομή συσχέτισης των δεδομένων μπορεί να είναι σύνθετη [10]. Γονίδια αντίστοιχα στα ίδια ή συναφή λειτουργικές κατηγορίες βασίζονται στη γονιδιακή οντολογία είναι επίσης πιθανό να ρυθμίζεται από έναν παράγοντα μεταγραφής κοινή [33]. Ολοκληρωμένη ανάλυση των δεδομένων προφίλ μεταγραφής και γονίδιο οντολογία σχολιασμός είναι μια πιο ισχυρή προσέγγιση για την πρόβλεψη δικτύου από μια μονοδιάστατη προσέγγιση βασίζεται σε ένα ενιαίο στρώμα των πληροφοριών, όπως μονοπαραγοντική μέτρα συσχέτισης.

Ένα σύνολο 846 γονιδίων που σχετίζονται με ο έλεγχος του κυτταρικού κύκλου έχουν ταυτοποιηθεί προηγουμένως σε κύτταρα HeLa [2]. Εμείς κατανεμήθηκε περαιτέρω αυτά τα γονίδια σε πιο συγκεκριμένες λειτουργικές ομάδες (Σχήμα 2) με fuzzy c-σημαίνει ομαδοποίηση (FCM) [34]. Σε σύγκριση με τα παραδοσιακά μέσα K-ομαδοποίηση, το σύστημα αυτό παρέχει μια περισσότερο εύρωστη στρατηγική που επιτρέπει γονίδια με παρόμοια σχήματα έκφρασης που πρέπει να τοποθετούνται στο ίδιο σύμπλεγμα με πολύ μειωμένο θόρυβο υποβάθρου [26]. FCM ομαδοποίηση περιλαμβάνει δύο εμπειρικές παραμέτρους: την παράμετρο ασάφεια

m

και ο αριθμός των συστάδων

γ

. Η βέλτιστη τιμή του

m

για το σύνολο δεδομένων που χρησιμοποιούνται σε αυτή τη μελέτη ήταν 1,1548, η οποία προσδιορίστηκε με βάση τη μέθοδο που προτείνει Dembele και Kastner [35].

Το σύστημα απεικονίζει τη διαδικασία της ομαδοποίησης γονιδίων σε βιολογικά νόημα συστάδες. Τα δεδομένα γονιδιακής έκφρασης χρησιμοποιήθηκαν πρώτα να βρούμε τη βέλτιστη τιμή m για FCM ομαδοποίηση. Με τη βέλτιστη τιμή m, FCM ομαδοποίηση πραγματοποιήθηκε με δεδομένα γονιδιακής έκφρασης για τους αριθμούς σύμπλεγμα που κυμαίνονται από 2 έως 50. Οι βαθμολογίες ομοιότητας όλων των ζευγών των γονιδίων σε κάθε συστάδα ένα διαμέρισμα κατά μέσο όρο και συμβολίζεται ως συνολική βαθμολογία ομοιότητας για ένα διαμέρισμα σύμπλεγμα. Το διαμέρισμα με την υψηλότερη βαθμολογία ομοιότητας επελέγη ως βέλτιστη. GSEA διεξήχθη χρησιμοποιώντας FuncAssociate να αξιολογήσει τις συστάδες γονιδίων σχηματίζεται χρησιμοποιώντας το βέλτιστο αριθμό σύμπλεγμα.

Η

Ο βέλτιστος αριθμός σύμπλεγμα προσδιορίστηκε με την σημασιολογική ομοιότητα μεταξύ οποιουδήποτε ζεύγους γονιδίου σε ένα ενιαίο σύμπλεγμα. Αυτή είναι μια μέθοδος που βασίζεται στη γνώση που έχει ως στόχο να εκτιμηθεί η βέλτιστη κατάτμηση συμπλέγματος από μια συλλογή των υποψηφίων χωρίσματα και βελτιώνει την προγνωστική αξιοπιστία και η βιολογική σημασία της εξόδου. Σημασιολογική ομοιότητα μεταξύ των ζευγών γονιδίου υπολογίστηκε με το συνδυασμό των βαθμολογιών ομοιότητας μεταξύ των όρων GO εκχωρηθεί σε κάθε γονίδιο. Συνάφεια μέτρα ομοιότητας χρησιμοποιήθηκαν για να υπολογιστεί ομοιότητα σε σχέση με τις αποδιδόμενες ορολογίες GO [36]. Η βαθμολογία ομοιότητα όλα τα ζεύγη των γονιδίων σε κάθε συστάδα ένα διαμέρισμα κατά μέσο όρο και συμβολίζεται με το συνολικό σκορ ομοιότητας για το συγκεκριμένο διαμέρισμα συμπλέγματος.

Η μέθοδος σύμπλεγμα αξιολόγηση κύρους θεωρούνται και οι τρεις κλάδοι της οντολογίας (κυτταρικό συστατικό, το μοριακό λειτουργία, και βιολογική διαδικασία) για τον υπολογισμό των βαθμολογιών ομοιότητας. Το διαμέρισμα με την υψηλότερη βαθμολογία ομοιότητας επιλέχθηκε ως η βέλτιστη χώρισμα (Σχήμα 3). Συγκρίναμε την απόδοση των FCM ομαδοποίησης με την Κ-μέσου ομαδοποίησης σε σχέση με δύο διαφορετικούς

τιμές m

. Το ένα είναι η προεπιλεγμένη τιμή 2 και η άλλη βασίζεται στην βέλτιστη τιμή του 1,1548 (Σχήμα 2). Από την ανάλυση αυτή, παρατηρήσαμε ότι FCM ομαδοποίηση με τη βέλτιστη

m

τιμή δίνει την καλύτερη βαθμολογία ομοιότητας. Η υψηλότερη βαθμολογία ομοιότητα ελήφθη με 39 ομάδες, υποδεικνύοντας μια βέλτιστη κατάσταση για να μειώσει το χώρο αναζήτησης για TRN συμπερασματολογία

χαράχθηκαν τρεις αποτελέσματα ομαδοποίησης:. K-means clustering και FCM ομαδοποίησης με δύο

m

αξίες (

m

είναι η παράμετρος ασάφεια): προκαθορισμένη τιμή (

m

= 2) και η βέλτιστη τιμή (

m

= 1,1548)

η.

για να αξιολογήσει τις βέλτιστες συμπλέγματα επιλέγονται με βάση GO, GSEA εφαρμόστηκε χρησιμοποιώντας τη βέλτιστη τιμή (Πίνακας S1). Κάθε ομάδα εμπλουτίστηκε σε συγκεκριμένες βιολογικές κατηγορίες. Για να αξιολογηθεί περαιτέρω η βιολογική σημασία των καθιερωμένων clusters, GO πληροφορίες χρησιμοποιήθηκαν για να προσδιοριστεί κατά πόσον οι συστάδες έχουν σημαντικές εμπλουτισμό έναν ή περισσότερους όρους, χρησιμοποιώντας το πρόγραμμα FuncAssociate [28]. Η στρατηγική αυτή έκανε χρήση ενός υποσυνόλου των γονιδίων ως είσοδο για την παραγωγή ενός πίνακα κατάταξης (από την P-values) από τα χαρακτηριστικά GO που είναι εμπλουτισμένα μεταξύ του γονιδίου εισόδου υποσύνολο [24]. Η έξοδος έδωσε τους όρους GO που ήταν σημαντικά εμπλουτισμένη σε κάθε ομάδα μεταξύ όλων των γονιδίων (ίσο με το σύνολο των 26.512 ανθρώπινα γονίδια στο πρόγραμμα FuncAssociate).

Μετά από αυτό το καθεστώς, το συνολικό σύνολο των γονιδίων που εμπλέκονται στη ρύθμιση του κυτταρικού κύκλου περαιτέρω υποδιαιρείται σε 39 συμπλέγματα (Πίνακας S1). Από αυτές τις ομάδες, 31 ήταν σαφώς σχετίζονται με τις κατηγορίες GO που συνεπάγεται μια πιο συγκεκριμένη λειτουργία που ενοποιεί τα μέλη του ενός, αλλά όχι άλλες ομάδες, δημιουργώντας έτσι πιο άμεσες σχέσεις μεταξύ ορισμένων μικρότερων υπο-ομάδες των γονιδίων. Για παράδειγμα, συμπλέγματα 29 και 8 μπορεί τόσο να συνδέεται με την προ-μιτωτικούς, μιτωτικά και μετα-μιτωτικούς εκδηλώσεις (Μ-φάση). Ωστόσο, τα μέλη της συστάδας 8 μπορούν να διακριθούν από τα μέλη της συστάδας 29 λόγω της ειδικής τους ρόλους τους στο χρωμόσωμα διπλασιασμό (αντιγραφή του DNA) και κυτταροκίνηση. Αντίθετα, τα μέλη της συστάδας 29 μπορούν να διακριθούν από τα μέλη της συστάδας 8 λόγω της ειδικής τους ρόλους τους στη συναρμολόγηση ινών άξονα και αποσυναρμολόγηση.

Η βιολογική σημασία αυτών των πολύ ειδικών λειτουργικών σχέσεων, που ιδρύθηκε από το σύστημα ομαδοποίησης μας, μπορεί να περαιτέρω να επεκταθεί από την άποψη των σχέσεων εντός του κανονιστικού πλαισίου. Για παράδειγμα, τα μέλη των δύο συστάδων 29 και 8 έχουν ταυτοποιηθεί προηγουμένως ως άμεσες κατάντη στόχοι της E2F παραγόντων (Ren et al., 2002). Παρόμοιες σχέσεις μπορεί να διαπιστωθεί με άλλα συμπλέγματα όπως συστάδα 32, το οποίο αποτελείται από τα γονίδια με βιοχημικές ρόλους ενός DNA λιγάση. Έτσι, τα γονίδια in Cluster 32 εμπλέκονται σε διαδικασίες που σχετίζονται με την επισκευή χάσμα ή επεξεργασία θραύσμα Okazaki κατά την διάρκεια της αντιγραφής του DNA και του χρωμοσώματος διπλασιασμού. Προηγούμενες μελέτες έχουν αποδείξει ότι τα γονίδια που σχετίζονται με αυτή τη λειτουργία είναι υπό το ρυθμιστικό έλεγχο του E2F1 και PCNA (Shibutani et al, 2008? Δείτε περισσότερες λεπτομέρειες στον πίνακα S2).

Με βάση όλες αυτές τις σχέσεις, μία ειδική αντοχή της τρέχουσα μέθοδος μας είναι η ικανότητά του να διακρίνει τα γονίδια που σχετίζονται με τη λειτουργία σε μια ευρεία έννοια και υπο-κατηγοριοποίηση τους σε πολύ συγκεκριμένες (στενό) λειτουργικές κατηγορίες, με αποτέλεσμα την πρόβλεψη των κανονιστικών σχέσεων που συνάδουν με βιολογικά έγκυρη σχέσεις.

Εκχώρηση παράγοντες μεταγραφής να δικτυωθούν μοτίβα

είναι

Trns αποτελείται από επανειλημμένες εμφανίσεις των μοτίβων του δικτύου, τα οποία είναι απλά, επαναλαμβανόμενα μοτίβα των συντηρημένων βιολογικών μονάδων που κυμαίνονται από τη μοριακή τομείς για μικρά δίκτυα αντίδρασης [37]. Κάθε μοτίβο δικτύου εκτελεί μια καθορισμένη λειτουργία επεξεργασίας πληροφοριών εντός του δικτύου. Εστιάσαμε σε τρεις-κόμβο μοτίβα δίκτυο, διότι η πλειοψηφία των μεγαλύτερων μοτίβα δίκτυο Μέγεθος αποτελούνται μέγιστο των τριών κόμβων [38]. Ο στόχος ήταν να εκχωρήσετε κάθε δυνατή μεταγραφικός παράγοντας που σχετίζεται έλεγχο του κυτταρικού κύκλου σε τουλάχιστον ένα μοτίβο δικτύου σύμφωνα με το δίκτυο συνδυασμένων μοριακή αλληλεπίδραση. Ο στόχος επιτεύχθηκε με την οικοδόμηση ενός μοντέλου RNN για όλες τις πιθανές ρυθμιστικά γονίδια που εμπλέκονται στην μεταγραφή βάσει συγκεκριμένων μοτίβο του δικτύου τους. Η έξοδος RNN είναι ένα μοντέλο που συνδέει κάθε

καλόπιστους

ή υποθετικό μεταγραφικό ρυθμιστή με κατάντη γονίδια στόχους τους.

Όλα τα γονίδια είτε με άμεσο ή έμμεσο ρόλο στη ρύθμιση της μεταγραφής εντοπίστηκε για πρώτη φορά από η συνολική δέσμη 846 που συνδέονται κυτταρικού κύκλου γονίδια σύμφωνα με GO κατηγορίες που υποδηλώνουν πιθανούς ρόλους στην μεταγραφή (Ashburner et al., 2000). Υποψήφια γονίδια που παρέμειναν μετά το φιλτράρισμα άλλες κατηγορίες της λειτουργίας των γονιδίων είναι εκείνες που είχαν ανατεθεί στις ακόλουθες υποθετικές λειτουργίες: δραστηριότητα μεταγραφικού παράγοντα (GO: 0003700), ρύθμιση της μεταγραφής (GO: 0061019), και σύνθετες μεταγραφικού παράγοντα (GO: 0005667). Από GO πληροφορίες από μόνη της δεν μπορεί να είναι επαρκής για τον εντοπισμό των γονιδίων με καλόπιστη ρόλους ως παράγοντες μεταγραφής, θα φιλτράρεται περαιτέρω λίστα των παραγόντων υποψήφιος μεταγραφής, προσθέτοντας ένα άλλο στρώμα των επιβεβαιωτικών πληροφοριών με βάση τα αποτελέσματα της PubMed αναζητήσεις. Αυτό το πρόσθετο σχολιασμό μας επέτρεψε να επικυρώσει την κατάταξη GO των υποψηφίων γονιδίων μας. Οι λεπτομερείς περιγραφές των όρων GO και ειδικούς ρόλους στην μεταγραφή του υποψηφίου TFs χρησιμοποιήθηκαν στη μελέτη αυτή στον Πίνακα S3. Μεταξύ των γονιδίων που σχετίζονται με τον κύκλο 846 κυττάρων, 46 σχολιάστηκαν με τις λειτουργίες που σχετίζονται με την μεταγραφική ρύθμιση βασίζεται τόσο GO και τις βάσεις δεδομένων PubMed. Τα γονίδια αυτά θεωρούνται ως πιθανοί παράγοντες μεταγραφής.

Στα δεδομένα μικροσυστοιχιών, γονίδια συχνά εκπροσωπούνται από πολλούς ανιχνευτές ολιγονουκλεοτιδίων. Γονίδια που αντιπροσωπεύεται από τα σύνολα ανιχνευτή με μεγαλύτερη διακύμανση περαιτέρω εξετάζεται στην παρούσα μελέτη (Zhang et al., 2007). Εμείς αποσυντίθεται το TRN σε διάφορα μοτίβα του δικτύου, με κάθε μοτίβο του δικτύου που ενδεχομένως συνδέονται με έναν παράγοντα (ες) δίνεται η μεταγραφή. Ένα σύνολο τεσσάρων μοτίβα δικτύου βρέθηκαν να είναι σημαντικές στη συνδυασμένη δίκτυο μοριακή αλληλεπίδραση (Σχήμα 4), έτσι κάθε παράγοντα μεταγραφής ανατέθηκε σε τουλάχιστον ένα από αυτά τα μοτίβα του δικτύου.

Το αριστερό πλαίσιο παρουσιάζει το δίκτυο τεσσάρων μοτίβο ρυθμιστικές ενότητες που εξετάζονται στην παρούσα μελέτη. Ο δεξιός πίνακας απεικονίζει τεκμαιρόμενη σχέσεις μεταγραφή του γονιδίου του παράγοντα-στόχο για εξαρτώνται από οκτώ κυτταρικού κύκλου παράγοντες μεταγραφής.

Η

αποποίησης μοτίβο του δικτύου ρυθμιστικών μονάδες μεταξύ παραγόντων μεταγραφής και συστάδες γονιδίων

Οι σχέσεις μεταξύ των μεταγραφικών παραγόντων και συμπλέγματα γονιδίων προσδιορίστηκαν με βάση τα μοντέλα RNN. Για κάθε ένα από τα μοτίβα τέσσερα δίκτυο (Σχήμα 4), ένα κατάλληλο RNN κτίστηκε όπως περιγράφηκε προηγουμένως [25]. Τα μοντέλα RNN εκπαιδεύτηκαν χρησιμοποιώντας το υβριδικό γενετικό αλγόριθμο – σωματιδίων βελτιστοποίησης σμήνος (GA-PSO) για να βρείτε τις κατάντη συστάδες γονιδίων για όλες τις 46 πιθανοί παράγοντες μεταγραφής. Ενώσεις μεταξύ κάθε παράγοντα μεταγραφής και 39 συστάδες γονιδίων προσδιορίστηκε με την εκπαίδευση του μοντέλου RNN που μιμείται το συγκεκριμένο μοτίβο δικτύου για ένα δεδομένο παράγοντα μεταγραφής. Λόγω της μείωσης του υπολογιστική πολυπλοκότητα (χαρτογράφηση μεταξύ 46 παράγοντες μεταγραφής και 39 γονίδιο συστάδες αντί του 846 γονιδίων), οι αριθμοί των GA και PSO γενεών που απαιτείται για την επίτευξη του προ-καθορισμένο ελάχιστο RMSE ήταν σημαντικά μειωμένη. Η γενιά PSO για RNN ορίστηκε σε 1000 [39]. Η ελάχιστη τιμή του RMSE μειώνεται καθώς ο αριθμός των γενεών αυξήθηκε (Πίνακας 1). Το ελάχιστο RMSE για GA γενιές 600 και 800 ήταν 0,077 και 0,075, αντίστοιχα. Βασισμένο σε 600 GA γενιές, η μέθοδος εξαγωγής συμπερασμάτων μας έχουν ανατεθεί με επιτυχία όλα τα 46 πιθανοί παράγοντες μεταγραφής στο γονίδιο στόχο συσπειρώσεις τους και να συναχθεί το πιο πιθανό μεταγραφικό ρυθμιστικό μοτίβα δικτύου (TRNMs? Βλέπε Εικόνα 4 για τις αντιπροσωπευτικές TRNMs)

Η

. Η ισχύς και η ακρίβεια του δικτύου που απεικονίζεται από τους TRNMs μπορεί να αξιολογηθεί με σύγκριση με ένα πρότυπο δίκτυο κατασκευάστηκε με βάση τα πραγματικά βιολογικά δεδομένα. Ελλείψει αυτών των πληροφοριών, πραγματοποιήσαμε μια αρχική επικύρωση του δικτύου ψάχνοντας για γνωστούς συνδέσεις γονίδιο στις βάσεις δεδομένων. Με βάση τα αποτελέσματα μοτίβο δίκτυο πρόβλεψη μονάδας, συλλέξαμε λογοτεχνία αποδεικτικά στοιχεία από τον NCBI και TRANSFAC [40] βάσεις δεδομένων. Εξετάσαμε κάθε προβλέψει μοτίβο του δικτύου και εξέτασε τις σχέσεις μεταξύ του μεταγραφικού παράγοντα και σύμπλεγμα γονιδίων στόχων του (s). Μετέπειτα ανάλυση διεξήχθη υπό την βασική παραδοχή ότι η τεκμαρτή μοτίβο του δικτύου είναι πιο πιθανό να είναι βιολογικά νόημα αν οι παράγοντες μεταγραφής είναι αυτό συσχετίζεται με τις εμπλουτισμένες βιολογικές λειτουργίες στα κατάντη συστάδες.

Σημαντικές μοτίβα του δικτύου που προκύπτει από την έρευνα των διαθέσιμων εξαρτάται από τη λογοτεχνία του κυτταρικού κύκλου των γονιδίων, όπως

E2F1, E2F2, SP1, BRCA1, STAT1, PCNA, RBPSUH

, και

ΗΜΟΒ2

παρατίθενται στο Σχήμα 4. με βάση τον συνδυασμό των πληροφοριών, η βιολογικές επιπτώσεις του δικτύου μπορεί να εξηγηθεί. Για παράδειγμα,

E2F

είναι ένας παράγοντας μεταγραφής που παίζει έναν κρίσιμο ρόλο στην εξέλιξη του κυτταρικού κύκλου σε κύτταρα θηλαστικών [41].

E2F1

, το οποίο περιέχει δύο επικαλυπτόμενα

E2F

που δεσμεύουν θέσεις στην περιοχή του προαγωγέα του, ενεργοποιείται κατά τη μετάβαση G1 /S σε E2F-εξαρτώμενο τρόπο.

E2F2

αλληλεπιδρά με ορισμένα στοιχεία της

E2F1

υποκινητή και τα δύο γονίδια που εμπλέκονται στην αντιγραφή του DNA και επισκευή [42], κυτταροκίνηση, και την ανάπτυξη του όγκου [43]. Σύμφωνα με τα αποτελέσματα GSEA, Cluster 8 είναι εμπλουτισμένο με τα γονίδια που εμπλέκονται στην μίτωση και κυτοκίνηση, και Cluster 34 είναι εμπλουτισμένη με γονίδια που εμπλέκονται σε διάφορες λειτουργικές κατηγορίες που συνδέονται με την ανάπτυξη του όγκου. Όπως φαίνεται στο Σχήμα 4, τόσο Cluster 8 και 34 προβλέπεται να ρυθμίζεται από

E2F1

και

E2F2

, και τα αποτελέσματα αυτά είναι σε συμφωνία με προηγούμενες εκθέσεις βασίζονται σε βιολογικά δεδομένα [41], [43].

η ανάλυσή μας προβλέπει ότι

E2F1

και

PCNA

αποτελούν συστατικά του ίδιου δικτύου. Αμφότερα αυτά τα γονίδια που εμπλέκονται στη ρύθμιση των συστάδων 32 και 34. Η καλύτερη κατανοητή μοριακή λειτουργία του

PCNA

πρωτεΐνη είναι ο ρόλος του στη ρύθμιση των ευκαρυωτικών DNA ικανότητα επεξεργασίας δέλτα πολυμεράση, η οποία εξασφαλίζει την πιστότητα της σύνθεσης του DNA και επισκευή [44]. Ωστόσο, πρόσφατες μελέτες έχουν δώσει ενδείξεις ότι οι

PCNA

πρωτεΐνης λειτουργεί επίσης ως άμεση καταστολέας των μεταγραφικό συνενεργοποιητή p300 [45]. Μια άλλη μελέτη δείχνει ότι

PCNA

καταστέλλει τη μεταγραφική δραστηριότητα των υποδοχέων ρετινοϊκού οξέος (

RAR

s) [46]. Έτσι, η συμμετοχή αυτών των γονιδίων στο ίδιο δίκτυο, όπως προβλέπεται από τον αλγόριθμο εξαγωγής συμπερασμάτων του δικτύου μας, υποστηρίζεται σθεναρά από τη γνώση των κανονιστικών σχέσεων που έχουν ήδη καθοριστεί σε πειραματικά δεδομένα. Τα αποτελέσματα της πρόβλεψης μας είναι σε συμφωνία με αυτές τις αναφορές δεδομένου ότι οι δύο Clusters 8 και 32 εμπλουτισμένο με γονίδια που εμπλέκονται στη σύνθεση του DNA και ρυθμιστικές διαδικασίες.

Πήραμε τρεις προσεγγίσεις για την περαιτέρω διερεύνηση κατά πόσο τα γονίδια προβλέπεται να ρυθμίζεται από

οι E2F

γονίδια σε ομάδες 8, 32 και 34 επικυρωθεί στην κλασική ευρεία μεθόδους μη-γονιδιώματος. Πρώτον, διερευνήθηκε πόσα «γνωστές»

E2F1

και

E2F2

στόχοι προβλέπεται από προτεινόμενης μεθόδου μας. Σύμφωνα με Bracken

et al

. [47], 130 γονίδια εξετάστηκαν ως

E2F

στόχους, 44 εκ των οποίων είχαν αρχικά εντοπιστεί από την κλασική, μη-γονιδίωμα-ευρεία προσεγγίσεις. Από τη στιγμή που περιορίζεται η ανάλυσή μας με τα γονίδια που σχετίζονται με τον κυτταρικό κύκλο 846, 45 γονίδια που συμπλήρωσαν το

E2F

γονιδίων στόχων που αναφέρονται στο διαιτητή. [47], 21 εκ των οποίων ήταν γνωστές από μελέτες που χρησιμοποιούν την κλασική μοριακή βιολογία αναλύσεις. Οι στόχοι γονίδιο που προβλέπεται από τη μέθοδο αγώνα μας 15 από 45 γονίδια, τα 15 εκ των οποίων είναι μεταξύ εκείνων που βρίσκονται αρχικά με τη χρήση τυποποιημένων πειράματα μοριακής βιολογίας. Ένας πιθανός λόγος είναι ότι οι προσεγγίσεις γονιδιώματος σε επίπεδο είναι συνήθως εξαιρετικά θορυβώδης και ασυνεπής σε διάφορες μελέτες. Οι λεπτομερείς πληροφορίες σχετικά με αυτά τα γονίδια είναι παρατίθενται στον Πίνακα S4.

Δεύτερον, θελήσαμε να δούμε αν οι προβλεπόμενες συστάδες γονιδίου στόχου μας εμπλουτισμένο σε αντίστοιχες θέσεις δέσμευσης για τους παράγοντες μεταγραφής σε ανοδική περιοχή τους. Τόσο για

E2F1

και

E2F2

, 7 από τα 17 γονίδια στο Cluster 8 περιέχουν θέσεις σύνδεσης σε ανάντι περιοχές τους, όπως επιβεβαιώνεται από τα στοιχεία της βάσης δεδομένων SABiosciences (http: //www.sabiosciences. com /chipqpcrsearch.php; app = TFBS).

Τέλος, διαπιστώσαμε πόσα γονίδια στις συστάδες γονιδίων έχουν

E2F

θέσεις πρόσδεσης. Εφαρμόσαμε το εργαλείο ανακάλυψη μοτίβο, WebMOTIFS [48] για να βρουν από κοινού μοτίβα στις συστάδες γονιδίων προβλέπεται να το

E2F

στόχους χρησιμοποιώντας ανάλυση δέσμευσης εμπλουτισμό ιστοσελίδα (BSEA). Τα αποτελέσματα αποκάλυψαν ότι ένα μοτίβο που ονομάζεται E2F_TDP, GCGSSAAA, αναγνωρίζεται ως η σημαντικότερη μοτίβο μεταξύ συστάδες γονιδίων 2, 8, 29, 31, 32 και 34. Δυστυχώς, για Clusters 30 και 36, ο αριθμός των γονιδίων σε αυτές τις συστάδες είναι πάρα πολύ μικρή για την ανάλυση WebMOTIFS. Όλες αυτές οι συστάδες γονιδίων προβλέπεται στους μεταγενέστερους στόχους του

E2F

. Για παράδειγμα, 43 από τα 52 γονίδια στο Cluster 2 έχουν υποτιθέμενο

E2F

θέσεις πρόσδεσης στην ανάντη περιοχές τους. Οι λεπτομερείς πληροφορίες των αποτελεσμάτων BSEA φαίνεται στο Σχήμα 5. Για τις TRNMs για τις οποίες εμπλέκονται δύο παράγοντες μεταγραφής, μπορούμε επίσης να βρούμε εν λόγω κατάντη γονίδιο είναι συστάδες εμπλουτισμένα σε αμφότερα τα δεσμευτικά μοτίβα αλληλουχία θέσης. Για παράδειγμα, Cluster 32 είναι εμπλουτισμένο στις δύο μοτίβα E2F_TDP και MH1, που αντιστοιχούν στα δύο παράγοντες μεταγραφής στο TRNM: E2F1 και SP1. Αυτά τα αποτελέσματα BSEA υποστηρίξει σθεναρά τα αποτελέσματα συμπέρασμα μας.

λογότυπα Ακολουθία αντιπροσωπεύουν το μοτίβο σημαντικά υπερεκπροσωπούνται στη συστάδα μεμονωμένων γονιδίων που σχετίζονται με την προβλεπόμενη ανάντη παράγοντες μεταγραφής τους, σύμφωνα με τον αλγόριθμο ανακάλυψης WebMOTIFS [48].

You must be logged into post a comment.