You must be logged into post a comment.
Αφηρημένο
Ιστορικό
Ένας μεγάλος αριθμός γονιδιακής έκφρασης προφίλ μελέτες (GEP) για την πρόγνωση του καρκίνου του παχέος εντέρου (CRC) έχει εκτελεστεί, αλλά δεν υπάρχει αξιόπιστη γονίδιο υπογραφή για την πρόβλεψη της CRC πρόγνωση βρέθηκε. Εργαλείων βιοπληροφορικής εμπλουτισμός είναι μια ισχυρή προσέγγιση για τον εντοπισμό βιολογικών διεργασιών στην ανάλυση δεδομένων υψηλής απόδοσης.
Κύρια Ευρήματα
Έχουμε για πρώτη φορά συλλέγονται τα αποτελέσματα από το 23 μέχρι σήμερα δημοσιευθεί ανεξάρτητες μελέτες GEP για CRC πρόγνωση. Σε αυτές τις 23 μελέτες, 1475 μοναδικό, χαρτογραφούνται γονίδια εντοπίστηκαν, από τις οποίες 124 (8,4%) έχουν αναφερθεί σε τουλάχιστον δύο μελέτες, με 54 από αυτούς που δείχνουν αποτελείται κατεύθυνση στην αλλαγή της έκφρασης μεταξύ των μεμονωμένων μελετών. Χρησιμοποιώντας αυτά τα δεδομένα, επιχειρήσαμε να ξεπεραστεί η έλλειψη αναπαραγωγιμότητας παρατηρούνται στα γονίδια που αναφέρθηκαν σε μεμονωμένες μελέτες GEP με διεξαγωγή μιας ανάλυσης εμπλουτισμού βάσει διαδρομής. Χρησιμοποιήσαμε έως δέκα εργαλεία για υπερεκπροσώπηση ανάλυση του Gene Ontology (GO) κατηγορίες ή Κιότο Εγκυκλοπαίδεια γονιδίων και γονιδιωμάτων (KEGG) οδούς σε κάθε ένα από τους τρεις καταλόγους γονίδιο (1475, 124 και 54 γονίδια). Η στρατηγική αυτή, με βάση τις δοκιμές πολλαπλά εργαλεία, μας επέτρεψε να προσδιορίσει την αλυσίδα οξειδωτική φωσφορυλίωση και την εξωκυτταρική κατηγορίες αλληλεπίδραση υποδοχέα μήτρας, καθώς και μια γενική κατηγορία που σχετίζονται με τον κυτταρικό πολλαπλασιασμό και την απόπτωση, ως τα μόνα σημαντικά και σταθερά υπεραντιπροσωπεύονται μονοπάτια στα τρία γονίδιο λίστες, οι οποίες αναφέρθηκαν από διάφορα εργαλεία εμπλουτισμού.
Συμπεράσματα
οδός που βασίζεται ανάλυση εμπλουτισμό μας μελετών προφίλ 23 ανεξάρτητες γονιδιακής έκφρασης στην πρόγνωση της CRC εντοπιστεί σημαντικά και σταθερά υπερεκπροσωπούνται προγνωστική κατηγορίες για CRC. Αυτές υπερεκπροσωπούνται κατηγορίες έχουν λειτουργικά σαφώς σχετίζονται με την εξέλιξη του καρκίνου, και αξίζουν περαιτέρω διερεύνηση
Παράθεση:. Lascorz J, Chen Β, Hemminki Κ, Försti Α (2011) Συναίνεση Pathways Εμπλεκόμενος στην πρόγνωση του καρκίνου του παχέος εντέρου εντοπίζονται μέσω Συστηματική εμπλουτισμός Ανάλυση της γονιδιακής έκφρασης Σπουδών. PLoS ONE 6 (4): e18867. doi: 10.1371 /journal.pone.0018867
Συντάκτης: Τσαντ Creighton, Baylor College of Medicine, Ηνωμένες Πολιτείες της Αμερικής
Ελήφθη: 1 Δεκεμβρίου, 2010? Αποδεκτές: 15, Μαρτίου, 2011? Δημοσιεύθηκε: 25 Απριλίου 2011
Copyright: © 2011 Lascorz et al. Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της άδειας χρήσης Creative Commons Attribution, το οποίο επιτρέπει απεριόριστη χρήση, τη διανομή και την αναπαραγωγή σε οποιοδήποτε μέσο, με την προϋπόθεση το αρχικό συγγραφέα και την πηγή πιστώνονται
Χρηματοδότηση:. Αυτό το έργο υποστηρίχθηκε από το Εθνικό Δίκτυο Γονιδιώματος γερμανική Ερευνών (NGFN-Plus) (01GS08181), η Deutsche Krebshilfe (γερμανικά Καρκίνο AID) (107.318), και την Ευρωπαϊκή Ένωση (ΕΕ) (ΥΓΕΙΑ-F4-2007-200767). Οι χρηματοδότες δεν είχε κανένα ρόλο στο σχεδιασμό της μελέτης, τη συλλογή και ανάλυση των δεδομένων, η απόφαση για τη δημοσίευση, ή την προετοιμασία του χειρογράφου
Αντικρουόμενα συμφέροντα:.. Οι συγγραφείς έχουν δηλώσει ότι δεν υπάρχουν ανταγωνιστικά συμφέροντα
Εισαγωγή
Καρκίνος του παχέος εντέρου (CRC) είναι η τρίτη πιο κοινή μορφή καρκίνου και η τέταρτη κύρια αιτία θανάτου από καρκίνο σε όλο τον κόσμο, με κίνδυνο της ζωής στη Δυτική Ευρώπη και στη Βόρεια Αμερική πληθυσμούς γύρω στο 5% [1].
Πολλές προφίλ γονιδιακής έκφρασης (GEP) μελέτες για CRC έχουν πραγματοποιηθεί την τελευταία δεκαετία, χρησιμοποιώντας τεχνολογία μικροσυστοιχίας. Σύμφωνα με πιθανές κλινικές εφαρμογές τους, μπορούν να ταξινομηθούν σε τρεις ομάδες [2]: μελέτες σχετικά με τη διαδικασία της καρκινογένεσης, μελέτες για την πρόβλεψη της πρόγνωσης, και μελέτες για την πρόβλεψη της ανταπόκρισης στη θεραπεία. Δείχνουν μικρή επικάλυψη στις εντοπίστηκαν γονίδια, και καμία αξιόπιστη υπογραφή χρήσιμα στην κλινική πράξη έχει βρεθεί. Επί του παρόντος, η Διεθνής Ένωση κατά του Καρκίνου (UICC) ΤΝΜ ταξινόμηση των κακοήθων όγκων με βάση κλινικοπαθολογοανατομικές στάσης παραμένει το πρότυπο για CRC πρόγνωση [3].
Εμείς επικεντρώθηκε στις μελέτες για την πρόβλεψη της πρόγνωσης, η οποία περιλαμβάνει μια ετερογενή ομάδα μελέτες GEP. Στόχος τους είναι να εντοπίσει ένα προφίλ γονιδιακής έκφρασης σε διακρίσεις πιο επιθετικά από λιγότερο επιθετική CRC, με βάση τα διαφορετικά χαρακτηριστικά που σχετίζονται με την εξέλιξη της νόσου, όπως η ύπαρξη υποτροπής, η παρουσία της μετάστασης, ή δεδομένα επιβίωσης. Μέχρι σήμερα, μόνο μία μετα-ανάλυση δέκα μελέτες GEP ανέφερε έναν κατάλογο των 13 γονιδίων που εκφράζονται διαφορικά σε CRC με καλή σχέση με κακή πρόγνωση, που αναφέρθηκαν από τουλάχιστον δύο ανεξάρτητες μελέτες [4].
Ήταν
Πολλαπλές λόγους προταθεί για να εξηγήσουν αυτή την έλλειψη αναπαραγωγιμότητας στις μελέτες GEP για CRC, όπως μικρής ισχύος μελέτες, η έλλειψη επικύρωσης των αποτελεσμάτων, οι διαφορές στο πειραματικό πρωτόκολλο και τη στατιστική παγίδες στην ανάλυση των δεδομένων έκφρασης μικροσυστοιχιών για την έκβαση του καρκίνου [3]. Αλλαγές στη βιολογικά χαρακτηριστικά απαιτούν συντονισμένη μεταβολή στην έκφραση του γονιδίου σύνολα τα οποία ρυθμίζουν τη βιολογική δραστικότητα, και αυτή η πληροφορία μπορεί δύσκολα να εξαχθούν από αλλαγές στην έκφραση των μεμονωμένων γονιδίων όταν η επικάλυψη μεταξύ των μελετών είναι τόσο χαμηλή [5]. Εμπλουτισμός εργαλεία ανάλυσης, τα οποία εκτιμούν υπερεκπροσώπηση ορισμένων κατηγοριών γονιδίου ή πορείες σε μια λίστα γονίδιο, είναι μια πολλά υποσχόμενη στρατηγική για τον εντοπισμό βιολογικών κατηγορίες εμπλέκονται στη διαδικασία διερευνώνται [6].
Μια ολοκληρωμένη ανάλυση των διαθέσιμων εργαλείων βιοπληροφορικής ο εμπλουτισμός πρόσφατα δημοσιεύτηκαν [6]. Με βάση τον αλγόριθμο που εφαρμόζεται, τα εργαλεία εμπλουτισμού μπορούν να ταξινομηθούν σε τρεις κατηγορίες: Ανάλυση ενικού εμπλουτισμού (SEA ή κατηγορίας Ι)? ανάλυση του γονιδίου σύνολο εμπλουτισμού (GSEA ή κατηγορίας II)? και την ανάλυση modular εμπλουτισμού (ΜΕΑ ή την κατηγορία ΙΙΙ). Σε όλα τα εργαλεία, ο κατάλογος εισόδου των γονιδίων έχει αντιστοιχιστεί με τους βιολογικούς όρους σε βάσεις δεδομένων, και στη συνέχεια στατιστική ανάλυση εξετάζει τον εμπλουτισμό των μελών γονίδιο για κάθε ένα από τους όρους σχολιασμού και διορθώνει πολλαπλές δοκιμές [6]. Εφαρμόσαμε διάφορα εργαλεία ΣΕΠΕ για τις ίδιες λίστες γονίδιο εισόδου, και μόνο εμπλουτισμένο κατηγορίες που λαμβάνονται με διάφορα εργαλεία θεωρήθηκαν ενδεικτικά της πραγματικής πρόβλεψης. Η στρατηγική αυτή, με βάση τις δοκιμές πολλαπλών εργαλείων, προτείνεται προκειμένου να αποκτήσει τα πιο ικανοποιητικά αποτελέσματα [7].
Γονιδιακή Οντολογία (GO) [8] και του Κιότο Εγκυκλοπαίδεια γονιδίων και γονιδιωμάτων (KEGG) [9] είναι οι δύο κύριες βάσεις δεδομένων σχολιασμό συλλογή βιολογική γνώση των γονιδίων, που τα καθιστούν πολύ κατάλληλο για τη βιοπληροφορική σάρωση για τον εμπλουτισμό ανάλυση [6]. Επί του παρόντος, GO περιέχει πληροφορίες για τα 18261 προϊόντα ανθρώπινο γονίδιο, ενώ KEGG maps 373 διαφορετικά μονοπάτια. Ο στόχος μας ήταν να προσδιορίσει τις λειτουργικές κατηγορίες (GO τους όρους και τις οδούς KEGG) που υπερεκπροσωπούνται σταθερά σε στατιστικά σημαντικό τρόπο στον κατάλογο των διαφορικά εκφρασμένων γονιδίων προκύπτει από τις μελέτες GEP για CRC πρόγνωση. Συλλέξαμε πρώτα δεδομένα από τις 23 ανεξάρτητες μελέτες που δημοσιεύτηκαν GEP στην πρόγνωση του CRC για να εξαχθούν τα γονίδια που αναφέρθηκαν σε τουλάχιστον δύο από αυτά, και στη συνέχεια αυτά τα γονίδια χρησιμοποιήθηκαν για την ανάλυση συστηματική εμπλουτισμού με πολλές ανεξάρτητες εργαλεία SEA. Με αυτό τον τρόπο, ξεπεράσαμε την έλλειψη αναπαραγωγιμότητας παρατηρούνται και στα δύο γονίδια που αναφέρονται σε μεμονωμένες μελέτες GEP και τις υπερεκπροσωπούνται κατηγορίες που αναφέρθηκαν από τον εμπλουτισμό εργαλεία ανάλυσης, και θα μπορούσε να προσδιορίσει με συνέπεια εμπλουτίζεται κατηγορίες.
Αποτελέσματα
Meta -την ανάλυση των μελετών GEP
Ένα σύνολο 1.897 διαφορετικά αναγνωριστικά γονίδιο (IDs) έχουν αναφερθεί ότι εκφράζεται διαφορικά σε 23 ανεξάρτητες μελέτες GEP στην πρόγνωση του CRC (Πίνακας 1). Από αυτά, ο αριθμός των μοναδικών, χαρτογραφούνται γονίδια ήταν 1.475, εκ των οποίων ρυθμίζονται up-603 γονιδίων και 794 ρυθμισμένα προς τα κάτω σε κακή πρόγνωση δείγματα, ενώ το 78 είχε μια αντίθετη κατεύθυνση σε αλλαγή έκφρασης μεταξύ μεμονωμένες μελέτες. Από τα 1475 γονίδια, 124 γονίδια (8,4%) έχουν αναφερθεί σε περισσότερες από μία μελέτη GEP (115 σε δύο, και εννέα σε τρεις μελέτες), 19 από αυτούς (15,3%) ήταν πάνω ρυθμισμένα σε κακή δείγματα πρόγνωση σε δύο μελέτες, 35 κάτω-ρυθμιζόμενη (28,2%), και 70 με αντίθεση κατεύθυνση στην αλλαγή της έκφρασης ανάμεσα σε δύο μελέτες. Έτσι, 54 από τις 124 γονίδια (43,5%) ανέφεραν την ίδια κατεύθυνση σε μεταβολή γονιδιακής έκφρασης σε δύο διαφορετικές μελέτες GEP. Από τα εννέα γονίδια που αναφέρθηκαν σε τρεις μελέτες (ATP5C1, CA2, CYP51A1, FN1, HSP90AB1, IQGAP1, RPS5, SPP1, και TXN), μόνο CYP51A1 και SPP1 έδειξε την ίδια κατεύθυνση με την αλλαγή της έκφρασης σε όλες τις τρεις μελέτες (Πίνακας S1). Όλα αυτά τα εννέα γονίδια που περιλαμβάνονται στον κατάλογο 54 γονίδιο. Δεν υπήρχε η τάση των γονιδίων που αναφέρθηκαν από δύο μελέτες για να καταλήξει συχνότερα από δύο μελέτες GEP ερευνά το ίδιο χαρακτηριστικό που σχετίζονται με την πρόγνωση της νόσου (ύπαρξη υποτροπής, η παρουσία της μετάστασης ή επιβίωση) από ό, τι από οποιεσδήποτε δύο μελέτες. Οι επτά μελέτες που διερευνούν την επανάληψη αναφερθεί 541 μοναδικά γονίδια, 15 από αυτούς (2,8%) σε δύο μελέτες. Οι 13 μελέτες που σχετίζονται με τη μετάσταση αναφέρθηκαν 934 μοναδικά γονίδια, με 50 από αυτές (5.3%) σε δύο μελέτες. Τέλος, οι δύο μελέτες που σχετίζονται με την επιβίωση αναφερθεί 34 μοναδικά γονίδια, κανένας από αυτούς κοινή για τις δύο μελέτες.
Η
Βλέπε Πίνακα S1 και S2 πίνακα για μια πλήρη λίστα των γονιδίων.
Εμπλουτισμός αναλύσεις
Τρεις λίστες γονίδιο χρησιμοποιήθηκαν για τον εμπλουτισμό αναλύσεις: όλα τα 1475 γονίδια που αναφέρθηκαν στις 23 ανεξάρτητες μελέτες GEP, τα 124 γονίδια που αναφέρθηκαν σε τουλάχιστον δύο μελέτες GEP (ανεξάρτητα από συνέπεια σε αλλαγή έκφρασης μεταξύ των μελετών), και τα 54 γονίδια που αναφέρθηκαν σε τουλάχιστον δύο μελέτες GEP με συνεπή κατεύθυνση στην αλλαγή της γονιδιακής έκφρασης μεταξύ των δειγμάτων με την κακή και την καλή πρόγνωση. Δέκα εμπλουτισμού εργαλεία που χρησιμοποιούνται για την απόκτηση σημαντικά υπερεκπροσωπούνται διαδικασία πάει Βιολογικά, GO Μοριακής κατηγορίες Λειτουργία, και KEGG μονοπάτια (πίνακες S3, S4, S5).
Ο αριθμός των αναφερόμενων εμπλουτίζεται κατηγορίες παρουσίασαν σημαντική μεταβλητότητα μεταξύ των διαφόρων εργαλείων που χρησιμοποιούνται (Πίνακας 2), αν και το ίδιο κατώφλι σημαντικότητας (Ρ τιμή & lt? 0,05 μετά από διόρθωση για πολλαπλές δοκιμές) και συνθήκες ανάλυσης (πλήρες γονιδίωμα ως φόντο αναφοράς και τουλάχιστον δύο γονιδίων από τη λίστα εισόδου στον εμπλουτισμένο κατηγορία) εφαρμόστηκαν σε όλες τις αναλύσεις . Οι προέκυψαν τιμές P για τον εμπλουτισμό ενός ενιαίου GO ή KEGG όρος συχνά κυμαίνονταν αρκετές τάξεις μεγέθους μεταξύ των διαφόρων μέσων (πίνακες S3, S4, S5). Σε γενικές γραμμές, οι GeneCodis εργαλεία [10] και WebGestalt [11] ανέφεραν πιο εμπλουτισμένο κατηγορίες από τα άλλα εργαλεία, και πολλά από τα εμπλουτισμένα κατηγορίες αναφέρθηκαν μόνον από GeneCodis (πίνακες S3, S4, S5). GeneCodis ταξινομούνται επίσης σημαντικά μικρότερο αριθμό γονιδίων από τη λίστα εισόδου στα αναφερθεί εμπλουτισμένο κατηγορίες GO. Από την άλλη πλευρά, το εργαλείο ΣΥΓΚΕΝΤΡΩΣΗ [12] ανέφεραν λιγότερο εμπλουτισμένο κατηγορίες από τα άλλα εργαλεία (Πίνακας 2).
Η
Ταυτοποίηση με συνέπεια εμπλουτισμένου κατηγοριών
Παρά την μεταβολή του αριθμού της υπερεκπροσωπούνται κατηγορίες που αναφέρθηκαν από τα διάφορα εργαλεία εμπλουτισμού, αρκετές κατηγορίες έχουν αναφερθεί από πολλά από τα εργαλεία που χρησιμοποιούνται. Για την αποφυγή ψευδώς θετικά, εφαρμόσαμε δύο αυστηρά όρια επιλογής πριν θεωρηθεί μια κατηγορία εμπλουτίζεται ως συνέπεια. Κατ ‘αρχάς, επιλέχθηκαν μόνο οι κατηγορίες που αναφέρθηκαν πρέπει να εμπλουτιστεί με διάφορα εργαλεία σε μια λίστα γονίδιο (Πίνακας S6). Από αυτά, μόνο τα κοινά σε τουλάχιστον δύο από τους τρεις καταλόγους γονίδιο κατηγορίες θεωρούνται να εμπλουτιστεί με συνέπεια. Χρησιμοποιώντας αυτά τα δύο κριτήρια επιλογής, έξι γενικές κατηγορίες Διαδικασία GO Biological (πολλαπλασιασμό των κυττάρων, θετική ρύθμιση της βιολογικής διαδικασίας, θετική ρύθμιση της κυτταρικής διαδικασίας, ρύθμιση της απόπτωσης, τη ρύθμιση του κυτταρικού πολλαπλασιασμού, και απάντηση σε χημικό ερέθισμα), πέντε κατηγορίες GO Μοριακής Λειτουργία ( δραστηριότητα υδρογόνο ιόν διαμεμβράνης μεταφορέα, ανόργανα δραστηριότητα μεταφορέα κατιόν διαμεμβράνης, μονοσθενή ανόργανη δραστικότητα μεταφορέα κατιόν διαμεμβρανική, πρωτεΐνη δέσμευσης, και ξεδιπλωμένη πρωτεΐνη σύνδεσης), και επτά οδών KEGG (αλληλεπίδραση εξωκυτταρικό δέκτη μήτρας, εστιακή προσκόλληση, η νόσος του Huntington, οξειδωτική φωσφορυλίωση, μονοπάτια στον καρκίνο , η νόσος του Πάρκινσον, και μικροκυτταρικό καρκίνο του πνεύμονα) υπερεκπροσωπήθηκαν σταθερά στις μελέτες GEP στην πρόγνωση του CRC (Πίνακας 3). Η αναλογία των πάνω και κάτω ρυθμιζόμενα γονίδια ήταν παρόμοια σε κάθε μία από την σταθερά εμπλουτισμένου GO και τις κατηγορίες KEGG, όπως στον κατάλογο 124 γονίδιο (τα δεδομένα δεν παρουσιάζονται). Η αναλογία εμπλουτισμού ήταν υψηλότερη για τις πιο συγκεκριμένες και σαφώς καθορισμένες οδούς KEGG από ό, τι για τις μεγάλες κατηγορίες GO (Σχήμα 1). Μία υψηλή επικάλυψη των μεμονωμένων γονιδίων μεταξύ αυτών των 18 κατηγοριών παρατηρήθηκε επίσης (Πίνακας 4). Με βάση αυτή την επικάλυψη, τρία βιολογικά νόημα μεμονωμένες ομάδες της κατηγορίας ήταν τελικά λαμβάνονται:
Μια μεγάλη ομάδα, συμπεριλαμβανομένων των έξι γενικές κατηγορίες Διαδικασία GO Biological (πολλαπλασιασμό των κυττάρων, θετική ρύθμιση της βιολογικής διαδικασίας, θετική ρύθμιση της κυτταρικής διαδικασίας, ρύθμιση της την απόπτωση, τη ρύθμιση του κυτταρικού πολλαπλασιασμού, και απάντηση σε χημικό ερέθισμα), μαζί με δεσμευτική η πρωτεΐνη δύο κατηγορίες GO Μοριακής Λειτουργία και δεσμευτική εκτυλίχθηκε πρωτεΐνη. Οι οδοί κατηγορία KEGG στον καρκίνο συμπίπτουν επίσης με αυτά GO κατηγορίες.
Οι τρεις KEGG τις οδούς οξειδωτική φωσφορυλίωση, η νόσος του Huntington και η νόσος του Πάρκινσον, μαζί με τρεις κατηγορίες Λειτουργία GO Molecular (υδρογόνο δραστηριότητα διαμεμβράνης μεταφορέας ιόντων, ανόργανο κατιόν διαμεμβρανική μεταφορέα δραστηριότητα, και μονοσθενείς δραστηριότητα μεταφορέα ανόργανο κατιόν διαμεμβρανική), η οποία περιλαμβάνει έξι παρα τέσσερα κοινά γονίδια.
οι δύο KEGG τις οδούς εξωκυττάρια αλληλεπίδραση υποδοχέα μήτρας και εστιακής προσκόλλησης, με τα έξι γονίδια σε αυτές τις δύο κατηγορίες KEGG περιλαμβάνονται επίσης στην μεγάλη πρωτεΐνη κατηγορία Λειτουργία GO Μοριακής δεσμευτική.
η
Λόγος του εμπλουτισμού = αριθμός των παρατηρούμενων διαιρείται με τον αριθμό των αναμενόμενων γονίδια από κάθε GO ή κατηγορία KEGG στη λίστα γονίδιο (σύμφωνα με WebGestalt ή, εναλλακτικά, DAVID ή εργαλεία GOTM). GO BP, Gene Ontology βιολογική διαδικασία? GO MF, Gene Ontology Μοριακής Λειτουργία? KEGG, Κιότο Εγκυκλοπαίδεια γονιδίων και γονιδιωμάτων.
Η
Η
Εμπλουτισμός ανάλυση χρησιμοποιώντας το λογισμικό Ingenuity επιβεβαίωσε τα αποτελέσματα που λαμβάνονται με τις βάσεις δεδομένων GO και KEGG. Το μόνο υπερεκπροσωπούνται κανονική πορεία στον κατάλογο 124 του γονιδίου ήταν οξειδωτική φωσφορυλίωση (P
διορθωθεί = 2.7 × 10
-2), ενώ η κατηγορία αυτή ήταν η τρίτη πιο σημαντική οδός (P
διορθωθεί = 1,0 × 10
-5) μεταξύ των 159 εμπλουτίζεται κανονικών μονοπατιών στο σύνολο 1475 γονίδιο. Τα αποτελέσματα για τις κατηγορίες Λειτουργία Βιο ήταν πάρα πολύ μη ειδική, λόγω του μεγάλου αριθμού των εμπλουτισμένων κατηγορίες που αναφέρθηκαν για κάθε μία από τις τρεις καταλόγους γονίδιο (61 έως 77 εμπλουτισμένο όρους) (Πίνακας 2). Ωστόσο, η γενικές κατηγορίες κυτταρικό θάνατο, ο καρκίνος και η κυτταρική ανάπτυξη και τον πολλαπλασιασμό ήταν μεταξύ των κορυφαίων τεσσάρων εμπλουτισμένο όρους στις τρεις καταλόγους γονίδιο, με διορθωμένες τιμές Ρ μεταξύ 10
-4 και 10
-20 (δεν παρουσιάζονται τα δεδομένα) .
εμπλουτισμός ανάλυση με όλα τα εργαλεία εμπλουτισμό εκτελέστηκε επίσης χωριστά για τις τέσσερις μεμονωμένες μελέτες GEP αναφέρουν περισσότερα από 100 μοναδικά γονίδια χαρτογραφούνται [13] – [16] (Πίνακας S7). Από τους 18 όρους GO /KEGG, οι γενικές κατηγορίες GO αναφέρθηκαν μόνο από ορισμένες από τις τέσσερις μεμονωμένες μελέτες GEP, ενώ οι ειδικότερες μονοπάτια KEGG φάνηκε να είναι πιο συχνά αναφερόμενες. Στη μελέτη GEP από Bertucci et al. [14] σχεδόν όλοι οι 18 κατηγορίες βγήκε ως υπερεκπροσωπούνται στη λίστα γονίδιο.
Συζήτηση
Ο μεγάλος αριθμός των δημοσιευμένων μελετών μικροσυστοιχιών για την πρόγνωση του CRC, παρουσιάζοντας μια πολύ χαμηλή επικάλυψη στα αποτελέσματα, έχει παρέχεται καμία γενικά αποδεκτή προφίλ γονιδιακής έκφρασης για την πρόβλεψη της CRC πρόγνωση. Επιπλέον, δεν γονιδίωμα-ευρεία μελέτες συσχέτισης της έκβασης στην CRC έχουν δημοσιευθεί, αλλά είναι τώρα σε εξέλιξη [3]. Η ετερογένεια στο σχεδιασμό της μελέτης σχετικά με τους GEP χαρακτηριστικά που σχετίζονται με την εξέλιξη της νόσου κάνει μια συνεπής σύγκριση των αποτελεσμάτων μεταξύ των μονών μελέτες πολύ δύσκολη [17]. Εδώ, θα αναφέρουν τα αποτελέσματα της προσέγγισής μας, με την οποία χρησιμοποιήσαμε τη μεγαλύτερη συλλογή των μελετών GEP για CRC πρόγνωση μέχρι τώρα, και για πρώτη φορά εφαρμόζεται και σε σύγκριση με πολλά εργαλεία εμπλουτισμού στις εξάγεται λίστες γονιδίου. Η στρατηγική αυτή μας επέτρεψε να προσδιορίσει την αλυσίδα οξειδωτική φωσφορυλίωση και την εξωκυτταρική κατηγορίες αλληλεπίδραση υποδοχέα μήτρας, καθώς και μια γενική κατηγορία που σχετίζονται με τον κυτταρικό πολλαπλασιασμό και την απόπτωση, καθώς τα μόνα σημαντικά και σταθερά υπεραντιπροσωπεύονται οδών που εμπλέκονται στην εξέλιξη CRC.
στο πρώτο μέρος της μελέτης, προσπαθήσαμε να ξεπεράσουμε την έλλειψη αναπαραγωγιμότητας στις μελέτες GEP στο CRC πρόγνωση επιλέγοντας τα γονίδια που αναφέρθηκαν σε περισσότερες από μία μελέτη, σε μια προσπάθεια να μειώσει ψευδώς θετικά αποτελέσματα. Από το σύνολο των 1475 μοναδικό, σχολιασμένο γονίδια εντοπίστηκαν σε 23 ανεξάρτητες μελέτες GEP, 124 γονίδια (8,4%) έχουν αναφερθεί σε τουλάχιστον δύο μελέτες, και μόνο 9 από αυτά (0,6%) σε τρεις μελέτες, οι οποίες μας δίνουν μια σαφή ιδέα της η έλλειψη αναπαραγωγιμότητας σε επίπεδο μεμονωμένων γονιδίων. Αυτή η έλλειψη αναπαραγωγιμότητας δεν φαίνεται να προκαλείται από τα διαφορετικά χαρακτηριστικά διερευνήθηκαν που σχετίζονται με την πρόγνωση του καρκίνου, δεδομένου ότι το ποσοστό των γονιδίων που αναφέρθηκαν από δύο μελέτες της ίδιας κατηγορίας (2,8% για την επανάληψη, 5,3% για τις μελέτες μετάσταση, και 0% για την επιβίωση μελέτες) ήταν ακόμη χαμηλότερο από ό, τι για όλες τις μελέτες μαζί (8,4%). Απροσδόκητα, 70 από αυτά τα 124 γονίδια (56,5%) έδειξε αντίθεση κατεύθυνση σε αλλαγή έκφρασης μεταξύ δύο μεμονωμένων μελετών, ενώ για το άλλο 54 (43,5%), η αλλαγή έκφραση ήταν στην ίδια κατεύθυνση, 19 ρυθμίζεται προς τα πάνω (15,3%) και 35 κάτω-ρυθμιζόμενη (28,2%). Το ποσοστό των πάνω και κάτω -regulated γονίδια ήταν περίπου η ίδια, επίσης, στο καθένα από τα σταθερά εμπλουτίζεται GO και τις κατηγορίες KEGG. Οι ασυνέπειες στην κατεύθυνση της διαφορικής έκφρασης μπορεί να αποδοθεί σε διάφορους παράγοντες: πρώτον, ο μεγάλος αριθμός των λανθασμένων θετικών παρατηρήθηκαν σε μελέτες γονιδιακής έκφρασης μικροσυστοιχίας [18]? δεύτερο, υπεργενίκευση των συγκρίσεων σε μετα-αναλύσεις, ιδίως σε σχέση με πειραματικό σχεδιασμό και πλαίσιο αναφοράς για την έκφραση? Τρίτον, η ετερογένεια στα δείγματα ιστού που χρησιμοποιείται σε κάθε μελέτη? και το τέταρτο, ανακριβή αποτελέσματα λόγω κακού σχεδιασμού μελέτης [19]. Ωστόσο, μια σαφής εξήγηση για τις διαφορές αυτές λείπει. Μόνο ένα προηγούμενο μετα-ανάλυση των δέκα μελέτες GEP ανέφερε μια λίστα 13 γονιδίων διαφορικά εκφραζόμενων σε CRC με καλή έναντι κακή πρόγνωση, αναφέρθηκαν από τουλάχιστον δύο ανεξάρτητες μελέτες [4]. Μια σύγκριση με τα αποτελέσματά μας έδειξαν ότι οκτώ από τα γονίδια είναι επίσης παρούσα σε 124 λίστα γονιδίων μας, με την ίδια κατεύθυνση με την αλλαγή της έκφρασης (IGF2, IQGAP1, YWHAH, ΔΕΚ, TP53, OAS1, RaRb, και PDCD10), τρία από αυτά ( IGF2, ΤΡ53 και RaRb), που ανήκει στην ομάδα των ευρείες κατηγορίες που σχετίζονται με τον κυτταρικό πολλαπλασιασμό και την απόπτωση. Οι άλλες πέντε γονίδια που αναφέρθηκαν από Cardoso et al. ήταν στην πραγματικότητα δεν υπάρχουν σε μία από τις δύο μελέτες GEP αναφέρεται στην μετα-ανάλυση.
Το δεύτερο μέρος της ανάλυσης γίνεται χρήση των ελεύθερα διαθέσιμα εργαλεία εμπλουτισμού για τον εντοπισμό ποια GO κατηγορίες ή πορείες KEGG ήταν σημαντικά υπερεκπροσωπούνται στο τρία σετ γονιδίων που προέρχονται από τις μελέτες έκφρασης προφίλ 23 γονιδίου (1475, 124 ή 54 λίστα γονίδιο). Εδώ, προσπαθήσαμε να ξεπεράσουμε τις γνωστές διαφορές στα αποτελέσματα της ανάλυσης υπερεκπροσώπηση με τη χρήση έως και δέκα διαφορετικές αναλύσεις ενικό εμπλουτισμού (ΣΠΕ ή κατηγορίας Ι) ο εμπλουτισμός εργαλεία. Έχουμε επιλέξει μόνο τις κατηγορίες που αναφέρθηκαν να υπερεκπροσωπούνται από διάφορα εργαλεία και σε τουλάχιστον δύο από τους τρεις καταλόγους γονιδίου ως συνέπεια εμπλουτίζεται κατηγορίες. Γονίδιο που εμπλουτισμό εργαλεία ανάλυσης (GSEA ή κατηγορίας II) δεν θεωρήθηκαν, δεδομένου ότι απαιτούν μια συνοψίζονται βιολογικής αξίας (π.χ. έκφραση αλλαγή φορές) για καθένα από τα γονίδια στην είσοδο, η οποία δεν ήταν διαθέσιμη για τις περισσότερες από τις μελέτες. Πρόσφατα αναπτύχθηκαν εργαλεία ανάλυσης σπονδυλωτή εμπλουτισμού (ΜΕΑ ή την κατηγορία ΙΙΙ) θεωρούν ότι μεταξύ των σχέσεων των όρων GO, αλλά απαιτούν σχετικά μεγάλες λίστες εισόδου γονίδιο για μια βιολογικά ουσιαστική ανάλυση [6], και αυτό δεν ήταν η περίπτωση στη μελέτη μας.
εργαλεία Εμπλουτισμός υποφέρουν από αρκετούς περιορισμούς, οι οποίες έχουν περιγραφεί λεπτομερώς αλλού [6], [7], και συνιστάται να δοκιμάσει πολλά εργαλεία, ακόμη και αν έχουν παρόμοιες δυνατότητες και λειτουργίες [7]. Για παράδειγμα, έχει παρατηρηθεί ότι για την ίδια δεδομένα εισόδου, δέκα διαφορετικές οντολογικές προγράμματα ανάλυσης οδήγησαν σε τιμές P κυμαίνονται κατά πολλές τάξεις μεγέθους για ορισμένες GO όρων [7]? το ίδιο αποτέλεσμα παρατηρήθηκε στη μελέτη μας. μονοπάτια KEGG αντιπροσωπεύουν σχετικά καλά καθορισμένες γνωστές βιολογικές οδούς, παρά τις πιο ευρείες κατηγορίες GO. Η χρήση των εργαλείων ταξινόμησης οδού δεν είναι ούτως ή άλλως χωρίς δυσκολίες [20]. Μια πρόσφατη ανάλυση υπερεκπροσώπηση των μονοπατιών από τα δεδομένα της μελέτης σύνδεσης γονιδίωμα-ευρεία ανέφερε επίσης διαφορές στο αποτέλεσμα μεταξύ των τριών από τα εργαλεία εμπλουτισμού μονοπάτι που χρησιμοποιήσαμε (DAVID, να συγκεντρώσει και WebGestalt) [20]. Παράγοντες που μπορεί να προκαλέσουν αυτές οι διαφορές στα αποτελέσματα περιλαμβάνουν: τις πηγές και τις εκδόσεις των αρχείων σχολιασμού? το στατιστικό μοντέλο που εφαρμόζεται για την ανάλυση εμπλουτισμού? το σύνολο των γονιδίων αναφοράς βάσει του οποίου υπολογίζονται οι τιμές P για κάθε όρο στα αποτελέσματα? και η μέθοδος διόρθωσης για πολλαπλά πειράματα [21]. Στην ανάλυσή μας, ο ολόκληρο το γονιδίωμα χρησιμοποιήθηκε ως πλαίσιο αναφοράς, και ένα κατώφλι σημασία διορθωμένη τιμή Ρ & lt? 0.05 χρησιμοποιήθηκε σε όλες τις αναλύσεις. Παρά την ομοιομορφία των συνθηκών που χρησιμοποιούνται, παρατηρήσαμε επίσης μία σημαντική μεταβλητότητα του αριθμού των αναφερθέντων εμπλουτισμένο κατηγοριών και στις τιμές Ρ. Έτσι, αυτή η μεταβλητότητα μπορεί να αποδοθεί στο στατιστικό μοντέλο που εφαρμόζεται για την ανάλυση εμπλουτισμού, με τη μέθοδο της διόρθωσης για πολλαπλές δοκιμές, και σε διαφορές στις εκδόσεις της GO και πηγές δεδομένων KEGG χρησιμοποιείται. Ωστόσο, και παρά αυτή την προφανή παραλλαγή, τα περισσότερα από τα εμπλουτισμένα κατηγορίες που αναφέρθηκαν από τις αυστηρότερες εργαλεία συμπεριλήφθηκαν σε αυτές που αναφέρονται από τους εργαλεία αναφοράς ένα μεγαλύτερο αριθμό όρων, καταδεικνύοντας τη χρησιμότητα της στρατηγικής μελέτης μας. Έτσι, εργαλείων βιοπληροφορικής εμπλουτισμός είναι μια ισχυρή προσέγγιση για τον εντοπισμό βιολογικών διεργασιών σε υψηλής απόδοσης ανάλυση των δεδομένων, αλλά η επιλογή του εμπλουτισμένου κατηγορίες με βάση μόνο ένα εμπλουτισμό εργαλείο φαίνεται να είναι αρκετά αυθαίρετο.
Τέλος, μετά την εφαρμογή της αυστηρής επιλογής κριτηρίων, συνολικά 18 κατηγορίες (11 GO όρων και επτά μονοπάτια KEGG) θεωρήθηκαν ως υπερεκπροσωπούνται σταθερά στις λίστες γονίδιο που εξάγεται από τις 23 διαφορετικές μελέτες GEP στο CRC πρόγνωση. Στη λίστα γονίδιο 124, ένα πολύ υψηλό επικάλυψη των γονιδίων μεταξύ των 18 κατηγοριών παρατηρήθηκε, μειώνοντας τον αριθμό των κατηγοριών με βιολογική σημασία σε τρεις σαφώς διαφορετικές ομάδες. Πρώτον, μια πολύ γενική ομάδα που σχετίζονται με τον πολλαπλασιασμό των κυττάρων, την απόπτωση και δεσμευτική πρωτεΐνη, η οποία περιελάμβανε ένα υψηλό ποσοστό των γονιδίων από κάθε μία από τις τρεις ομάδες γονιδίων. Δεύτερον, και πιο ενδιαφέρον, η αλυσίδα οξειδωτική φωσφορυλίωση, μεταξύ των οποίων επτά γονιδίων (ATP5C1, ATP6AP1, ATP6V1H, COX5B, COX6B1, NDUFA1 και UQCRC1) (Σχήμα S1), πέντε εκ των οποίων από κοινού με του Huntington και η νόσος κατηγορίες KEGG Πάρκινσον. Ήδη πριν από αρκετές δεκαετίες, προτάθηκε ότι μειωμένη οξειδωτικού μεταβολισμού μπορεί να προκαλέσει κακοήθη ανάπτυξη [22]. Αυτή η υπόθεση, που είναι γνωστή ως υπόθεση Warburg, έχει ανακαλύφθηκε από ένα ευρύ φάσμα πειραματικών προσεγγίσεων που δείχνει την αλληλεπίδραση του μιτοχονδριακού μεταβολισμό και την ανάπτυξη του όγκου [23], [24]. Προστέθηκε στο ότι, οι μεταλλάξεις βλαστικής σειράς στην αφυδρογονάση μιτοχονδριακό ηλεκτρικό (σύμπλεγμα II της αλυσίδας οξειδωτική φωσφορυλίωση) υπομονάδων SDHD, SDHC, και SDHB είναι μια συχνή αιτία του παραγαγγλιώματα της κεφαλής και του λαιμού και του φαιοχρωμοκυττωμάτων [25]. Επίσης Huntington και η νόσος του Πάρκινσον, οι άλλες δύο εμπλουτισμένο KEGG τις οδούς με γονίδια από την αλυσίδα οξειδωτική φωσφορυλίωση, συνδέονται με μιτοχονδριακή δυσλειτουργία [26]. Τρίτον, τόσο KEGG όρους εξωκυττάρια αλληλεπίδραση υποδοχέα μήτρας και εστιακής προσκόλλησης περιλαμβάνονται τέσσερα κοινά γονίδια (COL5A1, FN1, SPP1 και TNXB) (Εικόνα S2). Ειδικές αλληλεπιδράσεις των μορίων εξωκυττάριας μήτρας ελέγχουν κυτταρικές δραστηριότητες όπως προσκόλληση, η διαφοροποίηση, την απόπτωση και τον πολλαπλασιασμό [27]. Έτσι, και με βάση τις λειτουργικές κατηγορίες των γονιδίων, φαίνονται ελπιδοφόρα για μελέτες με στόχο να διερευνηθεί η πιθανή τους επίδραση στην πρόγνωση της CRC. Ειδικά, η KEGG τις οδούς οξειδωτική φωσφορυλίωση, η αλληλεπίδραση εξωκυττάριο υποδοχέα μήτρας και εστιακής προσκόλλησης μπορεί να παρέχει νέους στόχους για την ανάπτυξη φαρμάκων. Έξι από τις 23 ανεξάρτητες μελέτες GEP πραγματοποιηθεί μια ανάλυση εμπλουτισμό των GO ή /και KEGG κατηγορίες με κατάλογο των διαφορικά εκφρασμένων γονιδίων, σε όλες τις περιπτώσεις, χρησιμοποιώντας μόνο ένα εμπλουτισμό εργαλείο. Μόνο η μελέτη GEP από Jorissen et al. [16] ανέφεραν δύο μονοπάτια KEGG αναφέρθηκε επίσης στην ανάλυσή μας (αλληλεπίδραση ECM-υποδοχέα και εστιακή πρόσφυση). Όταν έψαξε για υπερεκπροσωπούνται κατηγορίες σε μεμονωμένες μελέτες GEP, παρατηρήθηκαν σαφείς διαφορές μεταξύ των μελετών. Παρά το γεγονός ότι όσον αφορά τους συγκεκριμένους KEGG τις οδούς οξειδωτική φωσφορυλίωση και μόρια εξωκυττάριας ουσίας αναφέρθηκαν συχνά, οι γενικοί όροι GO αναφερθεί σε παγκόσμιο επίπεδο μας προσέγγιση εντοπίστηκαν μόνο από ορισμένες από τις μελέτες. Αυτά τα αποτελέσματα δείχνουν ότι η προσέγγισή μας συνδυάζει τα δεδομένα των 23 μεμονωμένων μελετών GEP είναι σε θέση να προσδιορίσει τις κοινές οδούς που αναφέρθηκαν από μεμονωμένες μεγάλες μελέτες όχι μόνο, αλλά είναι επίσης σε θέση να αναφέρουν μυθιστόρημα με συνέπεια υπερεκπροσωπούνται οδών, η οποία μπορεί να χαθεί σε μικρές μελέτες.
Εν κατακλείδι, βάσει διαδρομής ανάλυση εμπλουτισμός μας της 23ης ανεξάρτητη έκφραση γονιδίου profiling μελέτες σχετικά με την πρόγνωση του CRC έδειξε την οξειδωτική φωσφορυλίωση αλυσίδας, η κατηγορία αλληλεπίδραση υποδοχέα εξωκυτταρική μήτρα, και μια γενική κατηγορία που σχετίζονται με τον κυτταρικό πολλαπλασιασμό και την απόπτωση ως σημαντικά και σταθερά υπερεκπροσωπούνται προγνωστική κατηγορίες για CRC. Οι κατηγορίες αυτές έχουν λειτουργικά σαφώς σχετίζονται με την εξέλιξη του καρκίνου, και χρήζουν περαιτέρω διερεύνησης. Θα ήταν ιδιαίτερο ενδιαφέρον εάν μελλοντικές μελέτες GEP πραγματοποιήθηκαν σε μεγάλες ομάδες του δείγματος θα μπορούσε να επικυρώνει τα αποτελέσματά μας και να εντοπίσει αυτές τις κατηγορίες ως ταξινομητές για την κακή πρόγνωση.
Υλικά και Μέθοδοι
Γονιδιακή έκφραση προφίλ (GEP) μελέτες
Ένα σύνολο των 27 μελετών GEP για την πρόβλεψη πρόγνωση του CRC συμπεριλήφθηκαν στην ανάλυση (Πίνακας 1): οι μελέτες 16 GEP το όνομα σε δύο πρόσφατες αξιολογήσεις [2], [3], τρεις πρόσθετες μελέτες που περιλαμβάνονται στο μια μετα-ανάλυση [4], και οκτώ πιο πρόσφατες μελέτες (αναζήτηση PubMed από τον Ιανουάριο 2009 έως Μάρτιος 2010) που δεν περιλαμβάνονται στο προηγούμενο σχόλια /μετα-ανάλυση. Τέσσερις από τις 27 μελέτες που χρησιμοποιήθηκαν εν μέρει επικαλυπτόμενες δειγμάτων [28] – [31], και μια άλλη μελέτη [32] ήταν στην πραγματικότητα μια συνέχεια της προηγούμενης [33], μειώνοντας τον συνολικό αριθμό των ανεξάρτητων μελετών σε 23. Σύμφωνα με το διερευνηθεί χαρακτηριστικό που σχετίζονται με την εξέλιξη της νόσου, επτά από τις μελέτες βασίστηκαν στην ύπαρξη επανάληψης, δεκατρία σχετικά με την παρουσία της μετάστασης, δύο σε δεδομένα επιβίωσης, και ένα σε ένα συνδυασμό των στοιχείων επιβίωσης και υποτροπής. Λόγω της ανομοιογένειας των διαθέσιμων στοιχείων, δεν έγινε καμία προσπάθεια για να εκτελέσει ποσοτικές μετα-αναλύσεις.
σετ Gene συλλογή
Έχει αναφερθεί ότι ο τύπος του γονιδίου αναγνωριστικό χρησιμοποιείται για να καθορίσει το διαφορικά ρυθμιζόμενα γονίδια μπορεί ενδεχομένως να επηρεάσουν τα αποτελέσματα της επακόλουθης ανάλυσης [21]. Χρησιμοποιήσαμε το επίσημο σύμβολο του γονιδίου HUGO ως συνεπή αναγνωριστικό για τα αναφερόμενα γονίδια. Αν το σύμβολο γονίδιο δεν αναφέρθηκε στη μελέτη GEP, χρησιμοποιήσαμε τα παρακάτω εργαλεία για να μετατρέψετε τις αναφερόμενες αναγνωριστικά μέσα στο σύμβολο γονίδιο: NetAffx από Affymetrix (www.affymetrix.com), EntrezGene από NCBI (www.ncbi.nlm.nih. gov /γονίδιο /), και το εργαλείο μετατροπής Gene ID από τις βιοπληροφορική πόρους DAVID [34]. Σε πολλές περιπτώσεις, ο αριθμός των γονιδίων αναγνωριστικά (IDs) που αναφέρθηκαν από τη μελέτη GEP πραγματικότητα δεν αντιστοιχούν στα σχολιασμένα γονίδια, αλλά με ανιχνευτές στη συστοιχία έκφρασης ή GenBankIDs. Προστέθηκε σε αυτό, αρκετές μελέτες μετρήθηκαν μερικά γονίδια περισσότερο από μία φορά. Ως εκ τούτου, ο σημερινός αριθμός των σχολιασμένα γονίδια που χρησιμοποιούνται τελικά ήταν χαμηλότερο από εκείνο που αναφέρθηκε από την πλειοψηφία των μελετών GEP (Πίνακας 1).
καταλόγους Gene
Οι κατάλογοι των σχολιασμένη γονίδια που αναφέρθηκαν από κάθε από τις 23 ανεξάρτητες μελέτες GEP για πρόγνωση της CRC συμπεριλήφθηκαν στην ανάλυση συνενώθηκαν προκειμένου να προσδιοριστούν αυτά τα γονίδια που αναφέρθηκαν σε δύο ή περισσότερες μελέτες. Τρεις διαφορετικές λίστες γονίδιο ελήφθησαν υπόψη για την μετέπειτα ανάλυση εμπλουτισμού: όλα μοναδικά, σχολιασμένη γονίδια αναφερθεί (1475 γονίδια) (Πίνακας S2)? εκείνα τα γονίδια που αναφέρθηκαν σε τουλάχιστον δύο μελέτες GEP (124 γονίδια) (Πίνακας S1)? και αυτά που επιπλέον έδειξε την ίδια κατεύθυνση με την αλλαγή της γονιδιακής έκφρασης, είτε πάνω ή προς τα κάτω ρύθμιση, σε δύο μελέτες GEP (54 γονίδια) (Πίνακας S1).
Εμπλουτισμός ανάλυση
πραγματοποιείται εμπλουτισμός αναλύει τη χρήση των βάσεων δεδομένων GO (βιολογική διαδικασία και Μοριακής Λειτουργία) και μονοπάτια KEGG. Για όλα τα εργαλεία εμπλουτισμού, το σύνολο γονίδιο εισόδου αποτελείται από τη λίστα γονιδίου 1475, τον κατάλογο 124 γονιδίου, ή τη λίστα 54 γονιδίων, αντίστοιχα.
Δέκα εμπλουτισμό εργαλεία λογισμικού (δείτε τις διευθύνσεις URL) επιλέχθηκαν με βάση την δωρεάν διάθεση τους , η συχνή εμφάνισή τους τα τελευταία δημοσιεύματα και φιλική προς το χρήστη εφαρμογή τους. Προεπιλεγμένη επιλογές εφαρμόστηκαν σε όλα τα εργαλεία, με ένα κατώφλι σημασία του 0,05 για ρυθμισμένη τιμή Ρ, τουλάχιστον δύο γονίδια από τη λίστα εισόδου στον εμπλουτισμένο κατηγορία, και το σύνολο του γονιδιώματος ως φόντο αναφοράς. Για τη συλλογή, η συνιστώμενη ln (παράγοντας Bayes) & gt? 6 χρησιμοποιήθηκε ως όριο σημασία. Το λογισμικό Ingenuity κάνει χρήση των δικών δύο βάσεις δεδομένων, Λειτουργία Top Bio και Top Canonical Pathways, η οποία όμως είναι συγκρίσιμα με τον Συνήγορο του Πολίτη και τις βάσεις δεδομένων KEGG, αντίστοιχα, που χρησιμοποιούνται από τα άλλα εργαλεία εμπλουτισμού. Τα βασικά στατιστικά και πολλαπλές μεθόδους διόρθωσης δοκιμής που χρησιμοποιούνται από κάθε εργαλείο παρουσιάζεται στον Πίνακα S8.
Σταθερά εμπλουτίζεται κατηγορίες
Μόνο ο Συνήγορος του Πολίτη ή τις κατηγορίες KEGG φέρεται να εμπλουτιστεί σημαντικά με διάφορα εργαλεία εμπλουτισμού σε ένα γονίδιο κατάλογος θεωρήθηκαν ως υπερεκπροσωπούνται συνέπεια. Σε μια προσπάθεια να επιλέξετε μόνο κορυφαία κατηγορίες, λάβαμε υπόψη τις διαφορές μεγέθους μεταξύ GO και KEGG κατηγορίες, καθώς και τις διαφορές στον αριθμό των κατηγοριών που αναφέρονται από κάθε εργαλείο. Ο αριθμός των μέσων που έχουν καθιερωθεί ως όριο ήταν, για κάθε λίστα γονιδίων και GO ή KEGG βάσεις δεδομένων, η μία αναφορά τουλάχιστον πέντε κοινά εμπλουτισμένο κατηγορίες για αυτόν τον αριθμό των εργαλείων (Πίνακας S6). Τόσο για το 54 και ο κατάλογος 124 γονίδιο, το όριο ήταν τρεις εμπλουτισμό εργαλεία για GO βιολογική διαδικασία και Μοριακής Λειτουργία, και δύο εμπλουτισμό εργαλεία για μονοπάτια KEGG. Για τη λίστα γονιδίου 1475, το όριο ήταν πέντε εμπλουτισμό εργαλεία για GO βιολογική διαδικασία και Μοριακής Λειτουργία, και τέσσερις εμπλουτισμό εργαλεία για μονοπάτια KEGG (Πίνακας S6). Δεδομένου ότι οι τρεις καταλόγους γονίδιο σχετίζεται (ο κατάλογος 54 γονίδιο περιλαμβάνεται στον κατάλογο 124 γονίδιο, το οποίο αποτελεί μέρος της λίστας 1475 γονίδιο), επιλέξαμε επιπροσθέτως τις κατηγορίες που αναφέρθηκαν να εμπλουτιστεί στο μεγάλο κατάλογο 1475 γονίδιο και τουλάχιστον ένα από τα
You must be logged into post a comment.