PLoS One: dbCerEx: μια web-based βάση δεδομένων για την ανάλυση του Καρκίνου του Τραχήλου της Μήτρας Transcriptomes


Οι

Αφηρημένο

Ιστορικό

καρκίνων του τραχήλου κατετάγη η δεύτερη πιο επικίνδυνες ασθένειες μεταξύ των γυναικών σε όλο τον κόσμο. Κατά τις δύο τελευταίες δεκαετίες, έχουν τεχνολογίες μικροσυστοιχιών έχουν εφαρμοστεί για τη μελέτη γονιδίων που εμπλέκονται στην εξέλιξη κακοήθεια. Ωστόσο, στις περισσότερες από τις δημοσιευμένες μελέτες μικροσυστοιχίας, μόνο λίγα γονίδια έχουν αναφερθεί αφήνοντας μάλλον μία μεγάλη ποσότητα δεδομένων αχρησιμοποίητο. Επίσης, RNA-Seq δεδομένων έχει γίνει πιο πρότυπο για την ανάλυση μεταγραφικό και εφαρμόζεται ευρέως σε μελέτες για τον καρκίνο. Υπάρχει μια αυξανόμενη ζήτηση για ένα εργαλείο για να βοηθήσει τα πειραματικά ερευνητές που επιθυμούν να εξερευνήσουν τραχήλου της μήτρας γονιδιακή θεραπεία του καρκίνου, αλλά η έλλειψη τεχνογνωσίας υπολογιστή για πρόσβαση και ανάλυση των δεδομένων γονιδιακής έκφρασης υψηλής απόδοσης.

Περιγραφή

Η βάση δεδομένων dbCerEx έχει σχεδιαστεί για την ανάκτηση και δεδομένα από δείγματα καρκίνου του τραχήλου γονιδιακής έκφρασης διαδικασία. Περιλαμβάνει τα προφίλ έκφρασης του γονιδιώματος πάνω από δείγματα καρκίνου του τραχήλου, καθώς επίσης και ένα βοηθητικό πρόγραμμα web σε γονίδια σύμπλεγμα με παρόμοια πρότυπα έκφρασης. Αυτό το χαρακτηριστικό θα βοηθήσει τους ερευνητές να διεξάγουν περαιτέρω έρευνα για να αποκαλύψει νέες λειτουργίες γονίδιο.

Συμπέρασμα

Η βάση δεδομένων dbCerEx είναι ελεύθερα διαθέσιμο για μη εμπορική χρήση σε https://128.135.207.10/dbCerEx/, και θα ενημερωθεί και θα ενσωματωθεί με περισσότερες δυνατότητες, όπως απαιτείται

Παράθεση:. Zhou L, Zheng W, Luo Μ, Feng J, Jin Ζ, Wang Υ, et al. (2014) dbCerEx: μια web-based βάση δεδομένων για την ανάλυση του Καρκίνου του Τραχήλου της Μήτρας Transcriptomes. PLoS ONE 9 (6): e99834. doi: 10.1371 /journal.pone.0099834

Επιμέλεια: Ι Ο βασιλιάς της Ιορδανίας, Georgia Institute of Technology, Ηνωμένες Πολιτείες της Αμερικής

Ελήφθη: 12 του Νοεμβρίου του 2013? Αποδεκτές: 19 Μαΐου, 2014? Δημοσιεύθηκε: 11, Ιούν του 2014

Copyright: © 2014 Zhou et al. Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της άδειας χρήσης Creative Commons Attribution, το οποίο επιτρέπει απεριόριστη χρήση, τη διανομή και την αναπαραγωγή σε οποιοδήποτε μέσο, ​​με την προϋπόθεση το αρχικό συγγραφέα και την πηγή πιστώνονται

Χρηματοδότηση:. Αυτή η μελέτη υποστηρίζεται από το Εθνικό Φυσικών Επιστημών ιδρύει της Κίνας (Πρόγραμμα Νο 31202013), Εξειδικευμένες Ταμείο Έρευνας για τον Διδακτορικό Πρόγραμμα της Ανώτατης Εκπαίδευσης της Κίνας (Πρόγραμμα Όχι 20120146120007), Θεμελιωδών Κονδυλίων Έρευνας για τις Κεντρικές πανεπιστήμια (Πρόγραμμα No.2011QC075). Οι χρηματοδότες δεν είχε κανένα ρόλο στο σχεδιασμό της μελέτης, τη συλλογή και ανάλυση των δεδομένων, η απόφαση για τη δημοσίευση, ή την προετοιμασία του χειρογράφου

Αντικρουόμενα συμφέροντα:. Η εμπορική εταιρεία (Γιτσάνγκ Humanwell Pharmaceutical Co, Ltd,), μαζί με τυχόν άλλα που σχετίζονται με την απασχόληση, την παροχή συμβουλών, διπλώματα ευρεσιτεχνίας, τα προϊόντα στην ανάπτυξη ή την εμπορία των προϊόντων, κλπ, έχουν δηλώσει ότι δεν ανταγωνιστικά συμφέροντα και χρηματοοικονομική πληροφόρηση. Αυτό δεν αλλάζει την τήρηση των συγγραφέων να PLoS ONE πολιτικές για την ανταλλαγή δεδομένων και υλικών.

Εισαγωγή

καρκίνων του τραχήλου αποτελούν το δεύτερο πιο γυναικολογικές περιπτώσεις θανάτου από καρκίνο σε όλο τον κόσμο, και αυτή η κατάσταση είναι χειρότερη στις αναπτυσσόμενες χώρες, λόγω της έλλειψης επαρκών προγραμμάτων οργανωμένου προσυμπτωματικού ελέγχου. Πιστεύεται ότι Ιός των ανθρωπίνων θηλωμάτων (HPV), λοιμώξεις είναι οι κύριες αιτίες του διηθητικού καρκίνου του τραχήλου [1].

χον προφίλ έκφρασης του γονιδιώματος έχει ξεσηκώσει τον τρόπο μελετάμε νόσου και τα βασικά της βιολογίας. Από το 1997, ο αριθμός των δημοσιευμένων αποτελεσμάτων με βάση την ανάλυση των γονιδίων των δεδομένων των μικροσυστοιχιών έκφραση έχει αυξηθεί από 30 σε πάνω από 5.000 δημοσιεύσεις ανά έτος [2]. τεχνολογίες μικροσυστοιχιών DNA στοχεύουν στην ταυτόχρονες μετρήσεις της έκφρασης χιλιάδων γονιδίων σε ένα μόνο πείραμα. Κατά τα τελευταία χρόνια, η τεχνολογία αυτή έχει διευκολύνει την καλύτερη κατανόηση των πολύπλοκων και ετερογενή μοριακά χαρακτηριστικά των καρκίνων και συνέβαλε στη βελτίωση της θεραπείας σε καρκίνους. Για παράδειγμα, HOXC10 γονίδιο αρχικά ταυτοποιήθηκε ότι ανήκει στα 171 σημαντικά up-ρυθμιζόμενα γονίδια στην αυχενική καρκινώματα πλακωδών κυττάρων (SCC) σε σχέση με την κανονική τράχηλο δείγματα από μικροσυστοιχιών DNA, η οποία αργότερα ταυτοποιήθηκε ως ένας μεσολαβητής κλειδί της εισβολής του καρκίνου του τραχήλου της μήτρας [3]. Αρχειακό δείγματα RNA των 25 ασθενών που υποβλήθηκαν σε υβριδισμό στο Στάνφορντ μικροσυστοιχιών τσιπ για να οικοδομήσουμε ένα σύστημα βαθμολόγησης επτά γονιδίων [4]. Αυτό το πρότυπο έκφρασης του γονιδίου θα μπορούσε να βοηθήσει στην αναγνώριση ασθενών με καρκίνο του τραχήλου της μήτρας που μπορεί να αντιμετωπιστεί με ακτινοθεραπεία μόνο. επιλέχθηκαν οι συγκεκριμένες προφίλ έκφρασης των υποψηφίων γονιδίων για τον εντοπισμό ιστορικών υποτύπους του καρκίνου [5] του τραχήλου της μήτρας. Επιπλέον, πολλές υποψήφιες βιοδείκτες και θεραπευτικών στόχων έχουν ταυτοποιηθεί σε άλλους καρκίνους.

Ωστόσο, για τις περισσότερες από τις δημοσιευμένες μελέτες μικροσυστοιχίας, μόνο υποσύνολα γονιδίων έχουν αναφερθεί για να αποδειχθεί η υπόθεση των συγγραφέων. Τα πλήρη σύνολα δεδομένων μικροσυστοιχιών αποθηκεύονται σε ένα μη συστηματικό τρόπο, και χρήσιμη μόνο σε εκείνους με υπολογιστική εμπειρία. Επίσης, RNA-Seq δεδομένων έχει γίνει πιο πρότυπο για την ανάλυση μεταγραφικό και εφαρμόζεται ευρέως σε μελέτες για τον καρκίνο. Ενώ για τις περισσότερες από τις πειραματικές τους ερευνητές, υπάρχουν και εξακολουθούν να δυσκολεύονται να χρησιμοποιήσουν αυτές τις βάσεις δεδομένων του καρκίνου μικροσυστοιχιών και RNA-Seq δεδομένων για την επίλυση βιολογικά ερωτήματα. Για παράδειγμα, εάν ένας νέο γονίδιο που μας ενδιαφέρει έχει ένα συσχετισθεί (θετική ή αρνητική) μοτίβο έκφρασης με ένα γονίδιο σχετίζονται με την απόπτωση, αυτό σημαίνει ότι μπορούν να μοιράζονται το ίδιο ρυθμιστικό μηχανισμό, ο οποίος θα μπορούσε να παράσχει τη δυνατότητα πρόταση της έρευνας για την νέο γονίδιο.

Εδώ παρουσιάζουμε dbCerEx, μια βάση δεδομένων των προφίλ γονιδιακής έκφρασης που παράγεται από τα πειράματα μικροσυστοιχιών DNA και RNA δεδομένων-Seq. Η βάση δεδομένων είναι εφοδιασμένο με ένα ολοκληρωμένο web-based χρησιμότητας, η οποία έχει καταστήσει τα δεδομένα εύκολα προσβάσιμες για τον τραχήλου της μήτρας έρευνα για τον καρκίνο κοινότητα. Σύμφωνα με τη μέθοδο αυτή, οι πειραματικές ερευνητές μπορούσαν να προσδιορίσουν μυθιστόρημα του τραχήλου της μήτρας γονίδια που σχετίζονται με τον καρκίνο και να διερευνήσει τις σχέσεις μεταξύ τους.

Κατασκευή και Περιεχόμενο

μικροσυστοιχιών και RNA-Seq δεδομένων

Η δεδομένων έκφρασης μικροσυστοιχιών (αρχεία GSE μήτρα) και την πλατφόρμα σχολιασμού (GPL αρχεία) ανακτήθηκαν από την έκφραση γονιδίων Omnibus (GEO) βάση δεδομένων [6] μέσω [7] πακέτου R /Bioconductor [8] «GEOquery» [9]. Τα δεδομένα RNA-Seq ανακτήθηκαν από τον καρκίνο Genome Atlas (TCGA) Δεδομένα Portal [10], η οποία περιέχει τις κλινικές πληροφορίες, γονιδιακά δεδομένα χαρακτηρισμός και ανάλυση υψηλού επιπέδου ακολουθία των γονιδιωμάτων του όγκου. Τα δεδομένα στη συνέχεια, συνδεθείτε (βάση 2) ​​μετασχηματίζεται και μεσαίο επίκεντρο. Για να αποφύγετε υπολογιστικό σφάλμα κατά τον υπολογισμό, τη σειρά που περιείχε αξία »ΝΑ ‘θα παραλειφθεί.

Τα πειράματα σε επεξεργασία μέσω των διαφόρων πλατφορμών (Πίνακας 1). Για να κάνετε τα δεδομένα έκφραση αναζήτησης ανεξάρτητα από τις πλατφόρμες, οι ανιχνευτές σχεδιασμό του διαγράμματος με τα επίσημα σύμβολα γονιδίου. Ωστόσο, αντί του γονιδίου πληροφορίες εκχώρησης σύμβολο, ορισμένα GPL αρχεία παρέχονται μόνο NCBI GenBank [11] ή NCBI REFSEQ [12] Οι αριθμοί προσχώρησης χαρτογράφηση σε ανιχνευτές. Για να λύσει αυτό το πρόβλημα, το «gene2refseq» και αρχεία »gene2accesion ‘αυτά ανακτώνται από το διακομιστή FTP NCBI μέσω ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/. Ένα σενάριο Perl χρησιμοποιήθηκε για την χαρτογράφηση συμβόλων γονίδιο σε αυτούς τους αριθμούς προσχώρησης GenBank ή REFSEQ, και τελικά να τους ανιχνευτές μικροσυστοιχιών. Η έκφραση του γονιδίου επίπεδη αρχεία έχουν αποθηκευτεί για αργότερα προσπέλαση.

Η

Προκαθορισμένες Γονιδιακή Ρύθμιση

Ένα σημαντικό χαρακτηριστικό αυτής της βάσης δεδομένων είναι ότι επιτρέπει στους χρήστες να αναζητούν παρόμοιες υποψηφίων γονιδίων με γονίδια που μελετούν με βάση τα πρότυπα έκφρασης. Στηριζόμενη σε αυτή τη μέθοδο, οι ερευνητές μπορούν να βρουν μηχανισμούς μεταξύ αυτών των γονιδίων, που μπορεί να γίνει μια πολλά υποσχόμενη προσέγγιση για την ανακάλυψη νέων γονιδιακής λειτουργίας. Τα σετ γονιδίων προκαθοριστεί στις βάσεις δεδομένων ανακτήθηκαν από διάφορες πηγές και χωρίζονται σε δύο βασικές κατηγορίες: Γονιδιακή Οντολογία (GO) [19] και Pathway. Όπως φαίνεται στον Πίνακα 2, η σειρά GO αποτελείται από Βιολογική διαδικασία, Molecular λειτουργίες και κυτταρικό συστατικό. Ενώ το σύνολο Διαδρομή αποτελείται από KEGG [20], BIOCARTA (www.biocarta.com) και REACTOME [21]. Ανθρώπινο είδος από τα σύνολα γονιδίου χρησιμοποιήθηκαν σε αυτή την εργασία.

Η

γονιδιακής έκφρασης Cluster Analysis

Η μη επιβλεπόμενη ιεραρχικό αλγόριθμο εισήχθη για να βρείτε τα παρόμοια γονίδια που βασίζονται σε πρότυπα έκφρασης. Αυτή η προσπάθεια υποβλήθηκε σε επεξεργασία χρησιμοποιώντας έναν συνδυασμό μετρήσεων απόστασης και διασυνδέσεις. Σε αυτή τη μελέτη, η απόσταση από το γονίδιο Χ με το γονίδιο y ορίζεται ως 1-r

xy, όπου r

xy αντιπροσωπεύει τη συσχέτιση Pearson του γονιδίου x και y:

Βάση δεδομένων Εφαρμογή

Η βάση δεδομένων dbCerEx είναι μια web-based εργαλείο που συνδυάζει μια MySQL (https://www.mysql.com/) σύστημα διαχείρισης βάσεων δεδομένων [MySQL 5.5.32 (Community Server) με κινητήρα InnoDB]. Το front-end web interface ενισχύεται από ένα πλαίσιο script java, Bootstrap 2.3.1 (https://getbootstrap.com/). Η PHP [έκδοση 5.3.10] (https://www.php.net/) εφαρμογές λαμβάνουν το ερώτημα από το χρήστη, είναι συνδεδεμένα με τη βάση δεδομένων για τη συλλογή δεδομένων, καλέστε την εξωτερική Perl και R σενάρια για την επεξεργασία των στατιστικών αναλύσουν και να παράγουν HTML σελίδες που εμφανίζουν αποτελέσματα.

Utility και Συζήτηση

Η βάση δεδομένων dbCerEx παρέχεται από ένα web-based interface. Οι χρήστες μπορούν να αρχίσουν την αναζήτηση εισάγοντας ένα ενδιαφερόμενο γονίδιο στο top box εισόδου και, στη συνέχεια, κάντε κλικ στο κουμπί «Αναζήτηση». Μια λίστα γονίδιο θα εμφανίζονται σε μια νέα σελίδα για όλα τα γονίδια που σχετίζονται με τη λέξη-κλειδί γονίδιο εισόδου. Οι χρήστες μπορούν να επιλέξετε ένα γονίδιο από τη λίστα σύμφωνα με την περιγραφή για να κάνει ανάλυση της έκφρασης.

Με κλικ σε ένα γονίδιο, μια γενική σύνοψη των οποίων το ονοματεπώνυμο, ψευδώνυμα και τις εξωτερικές συνδέσεις, όπως HNGC, Εηίτεζ Gene, Ensembl. MIM και Genecard για αυτό το γονίδιο θα εμφανίζονται. Στην ίδια σελίδα, οι χρήστες έχουν τη δυνατότητα να ρυθμίσετε τις παραμέτρους της ανάλυσης έκφρασης σε καρκίνο του τραχήλου της μήτρας. Οι χρήστες μπορούν να εισέλθουν σε ενδιαφέρει γονίδιο που με το χέρι ή από το set list γονίδιο όπως KEGG, BIOCARTA, REACTOME και Gene Ontology. Οι χρήστες μπορούν να επιλέξετε το σύνολο δεδομένων από τα μεταγλωττισμένα και του τραχήλου της μήτρας σύνολα δεδομένων έκφρασης καρκίνου από μικροσυστοιχιών και RNASeq, ή απλά να παρέχουν μια σειρά ένταξης GEO. Κάνοντας κλικ στο κουμπί Query Υποβολή, τα δείγματα για το επιλεγμένο σύνολο δεδομένων θα πρέπει να αναφέρονται. Οι χρήστες μπορούν να επιλέξετε όλα ή μερικά ενδιαφέρονται δείγματα για να κάνει ανάλυση της έκφρασης.

Ένας θερμικός χάρτης εμφανίζει την ιεραρχική ομαδοποίηση των γονιδίων και τα δείγματα θα εμφανιστεί (Εικόνα 1). Επιπλέον, ένα θερμικός χάρτης που περιλαμβάνει τα σημαντικά θετικά ή αρνητικά συσχετίζεται γονίδια με τον ενδιαφερόμενο γονίδιο θα προσφέρεται επίσης (Σχήμα 2). Η συσχέτιση Pearson και p η τιμή θα εμφανίζεται ως ένα τραπέζι στη δεξιά πλευρά της heatmap.

Η

Τα γονίδια που έχουν σημαντικές Pearson συσχέτιση με τον ενδιαφερόμενο γονίδιο επιλέχθηκαν για να σχεδιάσετε ένα Heatmap. Οι δειγματολήπτες βρίσκονται στη στήλη, και κατά την έκφραση του γονιδίου που ενδιαφέρονται.

Η

Συμπέρασμα

Σας παρουσιάζουμε dbCerEx, μια βάση δεδομένων που περιέχει τραχήλου της έκφρασης των γονιδίων του καρκίνου. Επιπλέον, παρέχει μία νέα χρησιμότητα για την αναζήτηση ομοιότητας έκφραση γονιδίου εντός ορισμένων ενδιαφέρει σύνολα γονιδίων. Πιστεύεται ότι dbCerEx είναι μια ισχυρή πλατφόρμα για τη βιοπληροφορική ανακάλυψη που φέρνει τα δεδομένα στοιχεία καρκίνο του τραχήλου μικροσυστοιχιών και RNA-Seq, και την ανάλυση της αυχενικής έρευνας για τον καρκίνο κοινότητα με εύκολη πρόσβαση.

Διαθεσιμότητα και απαιτήσεις

Η ιστοσελίδα της βάσης δεδομένων dbCerEx είναι διαθέσιμα δωρεάν ως μια εφαρμογή web στη διεύθυνση:. https://128.135.207.10/dbCerEx/

You must be logged into post a comment.