You must be logged into post a comment.
Αφηρημένο
Ο εντοπισμός των γενετικών και επιγενετικών αλλαγών από πρωτογενή κύτταρα του όγκου έχει γίνει μια κοινή μέθοδος για τον εντοπισμό γονιδίων κρίσιμη για την ανάπτυξη και εξέλιξη του καρκίνου. Επιδιώκουμε να προσδιοριστούν οι γενετικές και επιγενετικές αλλοιώσεις που έχουν το μεγαλύτερο αντίκτυπο στη λειτουργία του γονιδίου εντός του όγκου. Πρώτον, έχουμε εκτελέσει μια βιοπληροφορική ανάλυση διακύμανσης αριθμού αντιγράφων (CNV) και μεθυλίωσης του DNA που καλύπτουν την γενετική τοπίο των καρκινικών κυττάρων του καρκίνου των ωοθηκών. Εξετάσαμε ξεχωριστά CNV και μεθυλίωσης του DNA για 42 πρωτοβάθμια ορώδες δείγματα καρκίνου των ωοθηκών χρησιμοποιώντας προσδιορισμούς ΜΟΜΑ-ΡΟΜΑ και 379 δείγματα όγκων αναλύθηκαν από τον καρκίνο Genome Atlas. Έχουμε εντοπίσει 346 γονίδια με σημαντικές διαγραφές ή ενισχύσεις μεταξύ των δειγμάτων του όγκου. Αξιοποιώντας τα συναφή δεδομένα γονιδιακής έκφρασης προβλέπουμε 156 γονίδια με αλλοιωμένη αριθμό αντιγράφων και συσχετισμένες αλλαγές στην έκφραση. Μεταξύ αυτών των γονιδίων CCNE1, POP4, UQCRB, PHF20L1 και C19orf2 εντοπίστηκαν μέσα σε δύο σύνολα δεδομένων. Ήμασταν ενδιαφέρονται ειδικά στο αντίγραφο παραλλαγή αριθμό ως βάση γονιδιωματικής ιδιοκτησία μας στην πρόβλεψη των καταστολείς των όγκων και των ογκογονιδίων στην αλλαγμένη όγκου των ωοθηκών. Ως εκ τούτου, να προσδιοριστούν οι αλλαγές στη μεθυλίωση του DNA και της έκφρασης για όλους τους ενισχύονται και να διαγραφούν τα γονίδια. Εμείς στατιστικά καθορίζουν ογκοκατασταλτικό και ογκογόνο χαρακτηριστικά για αυτές τις ρυθμίσεις και να εκτελέσει μια ανάλυση συσχέτισης με την έκφραση. Έχουμε προβλέψει 611 πιθανούς ογκογονίδια και καταστολείς όγκων των υποψηφίων, με την ενσωμάτωση αυτών των τύπων δεδομένων. Γονίδια με μια ισχυρή συσχέτιση των εξαρτώμενων μεθυλίωση αλλαγές έκφρασης εκτίθενται σε διάφορες αριθμό αντιγράφων εκτροπές περιλαμβάνουν CDCA8, ATAD2, CDKN2A, RAB25, AURKA, BOP1 και EIF2C3. Παρέχουμε αντίγραφο παραλλαγή αριθμός και η ανάλυση μεθυλίωσης του DNA για πάνω από 11.500 μεμονωμένα γονίδια που καλύπτει την γενετική τοπίο των όγκων του καρκίνου των ωοθηκών. Δείχνουμε την έκταση της γονιδιωματικής και επιγενετικές αλλαγές για γνωστά καταστολείς όγκων και ογκογονίδια και επίσης να χρησιμοποιήσετε αυτά τα χαρακτηριστικά που ορίζονται για τον εντοπισμό δυνητικών υποψηφίων γονίδιο του καρκίνου των ωοθηκών
Παράθεση:. Wrzeszczynski KO, Varadan V, Byrnes J, Lum Ε, Kamalakaran S, Levine DA, et al. (2011) Προσδιορισμός των καταστολείς όγκων και ογκογονίδια από Γονιδιωματική και Επιγενετική Χαρακτηριστικά στον καρκίνο των ωοθηκών. PLoS ONE 6 (12): e28503. doi: 10.1371 /journal.pone.0028503
Επιμέλεια: Xin-γιουάν Guan, Το Πανεπιστήμιο του Χονγκ Κονγκ, Κίνα
Ελήφθη: 25 Ιούλη του 2011? Αποδεκτές: ένατης Νοεμβρίου 2011? Δημοσιεύθηκε: 8 Δεκεμβρίου 2011
Copyright: © 2011 Wrzeszczynski et al. Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της άδειας χρήσης Creative Commons Attribution, το οποίο επιτρέπει απεριόριστη χρήση, τη διανομή και την αναπαραγωγή σε οποιοδήποτε μέσο, με την προϋπόθεση το αρχικό συγγραφέα και την πηγή πιστώνονται
Χρηματοδότηση:. Αυτό το έργο υποστηρίχθηκε από Υπουργείο άμυνας W81XWH-05-1-0068, Το Ίδρυμα Starr (https://www.starrcancer.org) και η Philips Research Βόρεια Αμερική. Οι χρηματοδότες δεν είχε κανένα ρόλο στο σχεδιασμό της μελέτης, τη συλλογή και ανάλυση των δεδομένων, η απόφαση για τη δημοσίευση, ή την προετοιμασία του χειρογράφου
Αντικρουόμενα συμφέροντα:. Μέρος αυτής της έρευνας χρηματοδοτείται από τη Philips Research Βόρεια Αμερική. Vinay Varadan, Sitharthan Kamalakaran και Nevenka Ντιμίτροβα είναι υπάλληλοι της Philips Research Βόρεια Αμερική. Δεν υπάρχουν διπλώματα ευρεσιτεχνίας, τα προϊόντα για την ανάπτυξη ή την εμπορία προϊόντων που να δηλώνουν. Αυτό δεν αλλάζει την τήρηση των συγγραφέων σε όλες τις PLoS ONE πολιτικές για την ανταλλαγή δεδομένων και υλικών, όπως περιγράφεται λεπτομερώς σε απευθείας σύνδεση στον οδηγό για τους συγγραφείς.
Εισαγωγή
Στις Ηνωμένες Πολιτείες, θα υπάρξουν πάνω από 22.000 νέες περιπτώσεις καρκίνου των ωοθηκών το 2011. από αυτούς, περίπου 14.000 θα υποκύψει στην ασθένεια. Προκειμένου για την καλύτερη θεραπεία αυτών των γυναικών και να βελτιώσει την επιβίωση, ο στόχος μας είναι να καθορίσει τις μοριακές αλλαγές που έχουν επέλθει στους όγκους των ασθενών, και να είναι σε θέση να ερμηνεύσει τη σημασία οι αλλαγές αυτές έχουν για την ανάπτυξη και την ανάπτυξη του όγκου. Αυτό παρεκκλίνουσα αύξηση είναι αποτέλεσμα της χρωμοσωμικές ανωμαλίες και επιγενετικές μεταβολές [1], [2]. Επιπλέον, γενικά χαμηλά ποσοστά σωματικών νουκλεοτιδίου μετάλλαξης στον καρκίνο των ωοθηκών, σε σύγκριση με άλλους συμπαγείς όγκους υποδεικνύουν έναν αυξημένο σημασία του αριθμού αντιγράφων και επιγενετικές εκτροπές. Αυτό το είδος της ρύθμισης έχει αποδειχθεί ότι επηρεάζει πολλές καταστολείς των όγκων και των ογκογονιδίων που σχετίζονται με τον καρκίνο των ωοθηκών [3].
Αντιγραφή αριθμού παραλλαγές (CNV) είναι ένα σύνηθες φαινόμενο σε όλες τις μορφές καρκίνου [4], [5] , [6], [7], [8], [9]. Ένα τυπικό δείγμα καρκίνος εμφανίζει κατά μέσο όρο 17% επιμηκύνσεις και 16% διαγραφές σε ένα ολόκληρο γονιδίωμα. έχουν αριθμό σωματικών αντίγραφο αλλαγές έχει αποδειχθεί ότι επηρεάζουν σημαντικά μονοπάτια που αφορούν κινάσης λειτουργία, ρύθμιση του κυτταρικού κύκλου, τα δίκτυα Myc και NF-κΒ και την απόπτωση [4]. Ανίχνευση αυτών των μεταβολών και ταυτοποίηση των συγκεκριμένων γονιδίων που ευθύνονται για τον πολλαπλασιασμό του καρκίνου μπορεί να βοηθήσει στην μοριακά καρκίνους υποτύπου και οδηγούν προς συγκεκριμένες θεραπείες περισσότερο εξατομικευμένη καρκίνος τύπου [7], [10], [11], [12], [13], [14], [15], [16], [17], [18], [19], [20].
Επιγενετική ιδιότητες του γονιδιώματος του καρκίνου συσχετίζεται με την ανάπτυξη και τη λειτουργία του καρκινικού κυττάρου [1], [21], [22], [23], [24]. Συγκεκριμένα, μεθυλίωση του DNA στην περιοχή του υποκινητή του γονιδίου μπορεί να ρυθμίσει την γονιδιακή έκφραση διαφόρων ογκογόνων και καταστολείς όγκων [25], [26], [27]. Έχει προταθεί ότι η συνολική κυτοσίνη DNA 5C-μεθυλίωση μεταξύ φυσιολογικών και καρκινικών κυττάρων φαίνεται να ανακατανέμονται σε συγκεκριμένες θέσεις CpG στο καρκινικό κύτταρο [28], [29]. Απώλεια της λειτουργίας ή μεταγραφική σίγηση μέσω υπερμεθυλίωση έχει προσδιοριστεί για τα ογκοκατασταλτικά γονίδια, ενώ υπομεθυλίωση έχει αποδοθεί στην ογκογένεση και την απώλεια των ιδιοτήτων αποτύπωση ορισμένων που σχετίζονται με τον καρκίνο αλληλόμορφα [1], [30].
ογκοκατασταλτικά και ογκογονίδιο γονιδιωματική και επιγενετικές χαρακτηριστικά είναι εξαιρετικά μεταβλητή στο πλαίσιο του καρκίνου [3] των ωοθηκών. Γνωστά καταστολείς όγκων και ογκογονίδια δεν εξίσου συμβάλλουν στην ανάπτυξη του καρκίνου. Ελπίζουμε να προσδιοριστούν οι γενετικές και επιγενετικές αλλοιώσεις που έχουν το μεγαλύτερο αντίκτυπο στη λειτουργία του γονιδίου εντός του όγκου. Πολλά από τα τρέχοντα πρωτόκολλα βιοπληροφορική απασχολούν μόνο την ανάλυση μόνο του τρόπου εκτέλεσης για τον προσδιορισμό του γονιδίου λειτουργία ενός συγκεκριμένου τύπου όγκου. Μια ευρεία προσέγγιση γονιδίωμα συνδυάζει πολλαπλές πηγές δεδομένων γενετικής εκτροπής είναι απαραίτητη για την πρόβλεψη ενδεχομένως συνεπής και επιγενετικώς ολοκληρωμένων διαδικασιών που λειτουργούν στην ογκογένεση. Πραγματοποιήσαμε μια ευρεία βιοπληροφορική ανάλυση του αντιγράφου παραλλαγή αριθμού, έκφρασης και επιγενετικών πληροφορίες για τον εντοπισμό δυνητικών καταστολείς όγκων και ογκογονίδια που συνδέονται με ορώδες καρκίνο των ωοθηκών. Αναλύοντας 42 ανεξάρτητες ορώδες δείγματα καρκίνου των ωοθηκών και εκμεταλλευόμενοι του καρκίνου Γονιδιώματος Atlas (TCGA? https://tcga.cancer.gov) [31] των δεδομένων για να συγκρίνετε και να ενισχύσει το πρωτόκολλο μας, έχουμε εντοπίσει μη φυσιολογικό αριθμό αντιγράφων του DNA με συσχετισμένες αλλαγές στη μεθυλίωση και έκφρασης για ορώδες γονίδια του καρκίνου των ωοθηκών. Ο συνδυασμός των επιγενετικών και της έκφρασης ανάλυση των δεδομένων μπορεί, ενδεχομένως, να παρέχουν πληροφορίες σχετικές με την μοριακή βάση του καρκίνου και του καρκίνου υποτύπους και διαλεύκανση τα γονίδια οδήγηση διαφόρων όγκων [28], [32], [33], [34], [35]. Με αυτόν τον τρόπο, τελικά επιτρέποντας στους γιατρούς να ενσωματώσει αυτούς τους τύπους ολοκληρωμένων πολυτροπικών δεδομένων αναλύει σε διαγνωστικά βιοειδικής όγκου βασίζεται και μονοπάτι κατευθύνεται θεραπευτικών [36].
Μέθοδοι
Τα δείγματα των ασθενών (MSKCC Data)
όγκων DNA από 42 ασθενείς με νέα διάγνωση, θεραπεία, προχωρημένο στάδιο, ορώδες καρκίνωμα των ωοθηκών δει στο Memorial Sloan Kettering, μεταξύ της περιόδου Μάιος 1992-Φεβρουάριος 2003 συμπεριλήφθηκαν στην παρούσα μελέτη. Τα δείγματα συλλέχθηκαν στο πλαίσιο των πρωτοκόλλων της έρευνας εγκρίθηκε από το IRB Memorial Sloan-Kettering,. Η μελέτη σχετικά με τα δείγματα και ανάλυση όλων των δεδομένων του δείγματος συμμορφωθεί με τις κατευθυντήριες γραμμές της IRB Memorial Sloan-Kettering, των ασθενών και εγκρίθηκε από το Memorial Sloan-Kettering Cancer Center IRB. Οι ασθενείς που παρέχονται μεμονωμένα γραπτή ενημερωμένη συγκατάθεση για να χρησιμοποιήσετε τα δείγματα τους για ερευνητικούς σκοπούς. Επιπλέον, χρησιμοποιήσαμε 7 ωοθηκικού ιστού φυσιολογικά δείγματα που λαμβάνονται από τον συνεταιρισμό Ανθρώπινο Δίκτυο ιστών, μια αποθήκη υλικού ιστού και του όγκου τρέχουν από τα Εθνικά Ινστιτούτα Υγείας. Αναφερόμαστε σε αυτόν τον ασθενή και κανονικό δείγμα οριστεί ως το σύνολο δεδομένων MSKCC.
Copy Number Ανίχνευση μέσω Αντιπροσωπευτικά ολιγονουκλεοτιδίων Ανάλυση μικροσυστοιχιών (ROMA)
Το πρωτόκολλο ROMA όπως προηγουμένως περιγράφεται [11], [15 ], [37] διεξήχθη σε μία συστοιχία υψηλής πυκνότητας ολιγονουκλεοτίδιο που περιέχει περίπου 85,000 χαρακτηριστικά που κατασκευάζεται από την Nimblegen Systems Inc. Εν συντομία, η πολυπλοκότητα μειωμένες παραστάσεις [38] που αποτελείται από μικρές (200-1200 bp) θραύσματα, που παράγονται με διάσπαση δειγμάτων DNA με την ενδονουκλεάση περιορισμού ΒαΙΙΙ, ενισχύθηκαν από τον προσαρμογέα μεσολάβηση PCR γονιδιακού DNA [11]. Δείγματα DNA (2 μ§) σημάνθηκαν είτε με Cy5-dCTP ή Cy3-dCTP χρησιμοποιώντας Amersham-Pharmacia Megaprime κιτ επισήμανσης και ανταγωνιστικά υβριδοποιήθηκαν με το άλλο, στην ίδια αντικειμενοφόρο [11]. Υβριδισμοί αποτελούνταν από 35 μΐ διαλύματος υβριδισμού (37% φορμαμίδιο, 4 χ SSC, 0.1% SDS, και σημασμένο DNA). Microarry εφαρμογή και ο υβριδισμός διεξήχθη όπως αναφέρθηκε προηγουμένως [11]. Σαρωθεί σε ένα σαρωτή Axon GenePix 4000B χρησιμοποιώντας ένα μέγεθος pixel από 5 μm και όλα τα δεδομένα που εισάγονται S-Plus λογισμικό ανάλυσης 2000 (Διορατικές, Seattle, WA). Οι κανονικοποιημένες αναλογίες καταγραφής από κάθε πείραμα ήταν κατά μέσο όρο ανά κατάτμησης. Στη συνέχεια εφαρμόζεται ο αλγόριθμος CBS (Εγκύκλιος Binary Τμηματοποίηση) σε αυτά τα δεδομένα. Η μέθοδος τμηματοποίησης CBS είναι η κυκλική δυαδικό αλγόριθμο κατάτμησης, όπως περιγράφεται στο Olshen, ΑΒ. et. al. [39]. Όπως και στην προηγούμενη ανάλυση, τα CNV τμήματα που ορίζονται ως περιοχές στατιστικά συνδυασμό εντάσεων καθετήρα (δείκτης) υπολογίζεται από τον αλγόριθμο CBS [39], [40]. Όλα γενική ανάλυση και στατιστικά στοιχεία υπολογίστηκαν χρησιμοποιώντας S-plus, πακέτα R και μεμονωμένες σενάρια Perl /Python. Όλα τα δεδομένα ROMA είναι MIAME συμβατό και μπορεί να βρεθεί στη βάση δεδομένων GEO (https://www.ncbi.nlm.nih.gov/geo/) για τον αριθμό υποσειρά ένταξη GSE28013.
Η μεθυλίωση Ανίχνευση μέσω Αντιπροσωπευτικά ολιγονουκλεοτιδίων Microarray Analysis (ΜΟΜΑ)
Το πρωτόκολλο ΜΟΜΑ διεξήχθη όπως περιγράφηκε προηγουμένως [41], [42]. Η διάταξη ανίχνευσης μεθυλίωσης ΜΟΜΑ έχει εκτελεστεί και πιστοποιηθεί σε κυτταρικές σειρές και τα δείγματα όγκων του καρκίνου του μαστού. Σχολιασμένη γονιδιωματικής νησί θέσεις CpG ελήφθησαν από το πρόγραμμα περιήγησης στο γονιδίωμα UCSC. Κατά τον χρόνο του πειράματος το γονιδίωμα περιέχεται 26219 νησίδες CpG στην περιοχή από 200-2000 bp. Αυτά νησί θέσεις CpG καλύφθηκαν από MspI περιορισμό του κατακερματισμού. Συστοιχίες κατασκευάστηκαν από Nimblegen Systems Inc. χρησιμοποιώντας τη μορφή 390.000 ανιχνευτές. Το νησί σχολιασμό CpG από το ανθρώπινο γονιδίωμα χτίσει 33 (hG17) χρησιμοποιήθηκε για το σχεδιασμό μιας συστοιχίας πλακόστρωση 50-μερές. Η κύρια περιοριστική ενδονουκλεάση που χρησιμοποιείται είναι MspI. Μετά οι συνδετήρες πέψη συνδέθηκαν και το υλικό καθαρίζεται με φαινόλη χλωροφόρμιο, καταβυθίζεται, φυγοκεντρείται, και επαναιωρήθηκαν. Το υλικό χωρίζεται σε δύο, ένα δεύτερο να αφομοιώνονται από την ενδονουκλεάση mcrBC σύμφωνα με τις προδιαγραφές από την New England Biolabs και το άλλο μισό να είναι πλαστή πέψη. Διαδικασίες για υβριδισμό και πλύσιμο αναφέρθηκαν προηγουμένως [41]. Η διαδικασία διεξήχθη εις διπλούν με χρωστική ουσία-ανταλλαγής για τη δεύτερη πείραμα. Οι ετικέτες ανταλλάχθηκαν μεταξύ των mcrBC αντιμετωπίζονται και εικονικές δείγματα. Για κάθε ανιχνευτή, ο γεωμετρικός μέσος των λόγων (GeoMeanRatio) του mcrBC θεραπεία και δείγματα ελέγχου υπολογίζεται στη συνέχεια ανά πείραμα και συνδέονται βαφή ανταλλαγής της. εικόνες μικροσυστοιχιών σαρώθηκαν για GenePix 4000B σαρωτή και δεδομένα που εξάγονται χρησιμοποιώντας Nimblescan λογισμικού (Nimblegen Systems Inc). Οι GeoMeanRatios όλων των δειγμάτων σε ένα σύνολο δεδομένων κατόπιν κανονικοποιήθηκαν χρησιμοποιώντας ποσοστημόριο μέθοδο κανονικοποίησης [43]. Κάθε γενική ανάλυση και στατιστικά στοιχεία υπολογίστηκαν χρησιμοποιώντας S-plus, πακέτα R και μεμονωμένες σενάρια Perl /Python. Όλα τα δεδομένα ΜΟΜΑ είναι MIAME συμβατό και να βρεθεί στη βάση δεδομένων GEO (https://www.ncbi.nlm.nih.gov/geo/) για τον αριθμό υποσειρά ένταξη GSE27940.
Γονιδιακής Έκφρασης Ανάλυση για τα Ανθρώπινα ωοθηκών δείγματα όγκου
δεδομένα γονιδιακής έκφρασης έγινε με τη χρήση του Affymetrix Human Genome U133A σειρά: GEO αναγνωριστικό πλατφόρμα GPL96. RNA απομονώθηκε χρησιμοποιώντας το πρωτόκολλο ΤπζοΙ. RNA μετατρέπεται σε cDNA και το δίκλωνο cDNA χρησιμοποιείται ως μήτρα σε μία αντίδραση μεταγραφής in-vitro που περιέχουν βιοτινυλιωμένο CTP και UTP εκτός από τα τέσσερα μη τροποποιημένα τριφωσφορικά ριβονουκλεοσίδια. Το πρότυπο πρωτόκολλο Affymetrix εφαρμόζεται. Τελική ένταση σήματος σε επεξεργασία με τη μέθοδο της κανονικοποίησης RMA στην Affy πακέτο R Bioconductor 2.5. Όλα τα δεδομένα πίνακα είναι MIAME συμβατό και αντίστοιχα αρχεία CEL μπορεί να βρεθεί στη βάση δεδομένων GEO (https://www.ncbi.nlm.nih.gov/geo/) για τον αριθμό υποσειρά ένταξη GSE27943.
Διασυνο τροπική Ανάλυση του καρκίνου Γονιδιώματος Atlas Data (δεδομένα TCGA)
Αντιγραφή δεδομένων παραλλαγή αριθμό για πρωτογενείς όγκους των ωοθηκών είχε κατεβάσει από TCGA (https://tcga.cancer.gov/) και CBS [39] αρχεία δεδομένων από η Agilent SurePrint G3 Ανθρώπινα 1 Μ CGH (Συγκριτική Γονιδιωματική υβριδοποίηση) μικροσυστοιχιών με την ετικέτα mskcc.org_OV.CGH-1 × 1M_G4447A αναλύθηκαν. Το CBS επεξεργασία δεδομένων από το TCGA στη συνέχεια σχολιασμένη με τις πληροφορίες συναρμολόγησης Browser hg18 UCSC γονιδίωμα για να εκχωρήσετε αντίγραφο παραλλαγή αριθμό seg.mean τιμές ανά γονίδιο ανά δείγμα. Για τους σκοπούς της μελέτης CNV ανά γονίδιο που περιορίζονται τα δεδομένα μας σε ένα πλήρες τμήμα του CBS ανά γονίδιο ανά δείγμα. Ως εκ τούτου, εάν ένα γονιδιακό τόπο καλύπτεται εν μέρει από δύο ή περισσότερα τμήματα του CBS ανά δείγμα δεν είχαμε συμπεριλάβει στην ανάλυσή μας. Μόνο εάν ένα πλήρες γονιδιακό τόπο ήταν μέσα σε ένα δείγμα CBS τμήματος ήταν να συμπεριληφθεί στην ανάλυση μας. Επιπλέον, αποκλείεται οποιοδήποτε τμήμα CBS με μια ενημερωτική αξία (num.info) μικρότερη από 4. Επιπλέον, προκειμένου να συλλάβει σημαντική CNV αναλύσαμε μόνο δείγματα σε 90% των στοιχείων εκτός από το 5% των δεδομένων που βρίσκεται πλησιέστερα προς ένα SEG. μέση τιμή 0 από τα θετικά και τα αρνητικά της διανομής αξίας. TCGA δεδομένα μεθυλίωση ελήφθη από τα αρχεία δεδομένων JHU-usc.edu_OV.HumanMethylation27.2.lvl-3 για κάθε αντίστοιχη όγκου και φυσιολογικό δείγμα. Αυτό είναι από τη δοκιμασία Human27-μεθυλίωσης Illumina Infinium. Μια τελική μέση τιμή για βήτα γονίδια με 2 ή περισσότερους διερευνητές ήταν υπολογίζονται ανά γονίδιο ανά δείγμα. Τέλος, τα δεδομένα έκφρασης TCGA που χρησιμοποιούνται για την ανάλυση αυτή ήταν από το αρχείο της γονιδιακής έκφρασης broad.mit.edu HT_HG-U133A για κάθε αντίστοιχη όγκου και κανονικό τρέξιμο του δείγματος στη συστοιχία Affymetrix GeneChip HT Ανθρώπινο Γονιδίωμα U133A. Εξετάσαμε 379 δείγματα από την TCGA που ήταν παρόντες κατά τη στιγμή της ανάλυσης μας. Πριν από την τελική υποβολή του χειρογράφου μας ο καρκίνος Γονιδιώματος Atlas έχει δημοσιοποιηθεί προκαταρκτική έκθεση τους στο καρκίνωμα των ωοθηκών [31]. Η χρήση των σετ δεδομένων TCGA είναι να ενισχύσει και να συγκρίνουν ογκοκατασταλτικό και ογκογονιδίου πρωτόκολλο ανακάλυψη μας που εφαρμόζονται στο σύνολο δεδομένων ΜΟΜΑ-ΡΟΜΑ (MSKCC). Αναγνωρίζουμε οποιαδήποτε παρόμοια ευρήματα που έχουμε κάνει με τη χρήση του πρωτοκόλλου μας για το σύνολο δεδομένων TCGA με αυτό που βρέθηκε στην πρόσφατη δημοσίευση TCGA.
βιοπληροφορική ανάλυση του MSKCC Αριθμός Copy (ROMA), μεθυλίωση του DNA (ΜΟΜΑ) και δεδομένων Έκφραση
Όλα ανάλυση πραγματοποιήθηκε χρησιμοποιώντας Perl, Python, Matlab, και τα πακέτα R. Η στρατηγική μας ήταν να εξεταστούν οι επιγενετικών και γονιδιωματικών χαρακτηριστικών για πιθανές καταστολείς όγκων και ογκογονιδίων σε πρωτογενείς όγκους των ωοθηκών. Με τη λειτουργία βάσης είναι παραλλαγή του αριθμού αντιγράφων εξετάζουμε τα δεδομένα μεθυλίωση και έκφρασης για κάθε γονίδιο υπό ενισχύεται ή να διαγραφούν συνθήκες αριθμό αντιγράφων. Ως εκ τούτου, ένα ογκογονίδιο κατατάσσεται ως ενισχυμένο γονίδιο που έχει χαμηλή μεθυλίωση και αυξημένη έκφραση (Σχήμα 1). Αυτό το ίδιο ενισχυμένο ογκογονίδιο μπορεί να ρυθμίζεται μέσω επιγενετικώς υπερμεθυλίωση στον καρκίνο των ωοθηκών με αποτέλεσμα μια μειωμένη έκφραση ακόμη και αν ο αριθμός αντιγράφων ενισχύεται. Αντιστρόφως, ένας καταστολέας όγκων μπορεί να έχουν χαμηλώσει αντίγραφο παραλλαγή αριθμό και να υπερμεθυλιωμένο αποτέλεσμα μειωμένη έκφραση ή ρυθμίζεται μέσω υπομεθυλίωση επιτρέποντας την έκφρασή του υπό χαμηλώσει συνθήκες CNV (Σχήμα 1). θραύσματα ROMA αποδόθηκαν σε γονίδια χρησιμοποιώντας τη διάταξη Browser hG17 UCSC γονιδίωμα. Εμείς εντοπίστηκαν μέσω της σύγκρισης του δείγματος μεταξύ της πλατφόρμας TCGA και την πλατφόρμα ROMA (για τις οποίες 7 δείγματα ήταν κοινά) μια ROMA συγκεκριμένη πλατφόρμα όριο των & lt? 0.0 seg.mean που συλλαμβάνει ένα μέγιστο ποσοστό αφαιρούμενα γονίδια, διατηρώντας παράλληλα ένα ελάχιστο ποσοστό ψευδώς θετικών του ενισχυμένου ή ουδέτερο γονίδια αντίγραφο. Τελική εκχώρηση γονίδιο μεθυλίωσης διεξήχθη χρησιμοποιώντας τη μέγιστη τιμή ανιχνευτή για κάθε τεμάχιο ΜΟΜΑ και της μέγιστης τιμής θραύσμα ΜΟΜΑ αποδόθηκε στο πλησιέστερο γονίδιο. Η Wilcoxon signed-rank test χρησιμοποιήθηκε για τον υπολογισμό εμπλουτισμό p-τιμές για CNV και τα δεδομένα της έκφρασης και τη μέθοδο Benjamini-Hochberg (BH) χρησιμοποιήθηκε για την προσαρμογή πολλαπλών δοκιμών και False Discovery Rate (FDR) έλεγχο. Ευκλείδεια αποστάσεις υπολογίστηκαν μεταξύ φυσιολογικών και καρκινικών δειγμάτων για μεθυλίωση και έκφραση σημεία δεδομένων για όλα τα γονίδια σε αμφότερες τις ομάδες δεδομένων MSKCC και TCGA. Στην περίπτωση του συνόλου δεδομένων MSKCC όταν επαρκή δεδομένα για την κανονική έκφραση δείγμα δεν ήταν διαθέσιμη, ένα 50 × bootstrap δειγματοληψία πραγματοποιήθηκε χρησιμοποιώντας τα δεδομένα φυσιολογικά δείγματα έκφραση TCGA ανά γονιδίου. Ενιαία περιγραφικές και Hotelling πολυμεταβλητή t-τεστ έγιναν σε αυτές τις αποστάσεις για να υπολογίσει όλα τα p-τιμές κατά την εκτέλεση της ανάλυσης μεθυλίωσης και της έκφρασης σε διάφορες τιμές αριθμό αντιγράφων, με στατιστικά πολλαπλές προσαρμογές δοκιμή FDR όπως παραπάνω. Προκειμένου να εντοπίσει πιθανή λειτουργική και οδός αλλαγές δεν σταματούν με ανάλυση χαρακτηριστικό μας με βάση το γονίδιο ελέγξαμε εάν η ένταξη των προβλεπόμενων γονιδίων MSKCC σε κάθε κατηγορία λειτουργία μέσα σε ένα σύνολο 173 KEGG βιολογικών οδών ήταν ανάλογη με το μέγεθός τους. Αυτό μεταφράζεται σε αναγνώριση μονοπάτια της οποίας τα μέλη του γονιδίου σε κάθε τάξη χαρακτηριστικό αποκλίνει σημαντικά από τη μηδενική, όπως ορίζεται από μια εκθετική κατανομή. Ο τελικός κατάλογος των σημαντικών οδών επιλέχθηκε μετά από έλεγχο της ψευδούς ποσοστό ανακάλυψη από Benjamini-Hochberg διόρθωση πολλαπλές δοκιμές. σενάρια Ανάλυση δεδομένων και περαιτέρω πληροφορίες ανάλυση μπορεί να βρεθεί στο Analysis S1.
Αντιγραφή παραλλαγή αριθμός είναι η γονιδιωματική χαρακτηριστικό βάση για την ταυτοποίηση μας ογκοκατασταλτικών και ογκογόνο ιδιότητες γονίδιο στον καρκίνο των ωοθηκών. Ένα ογκογονίδιο μπορεί να υπερεκφράζεται κάτω από ενισχυμένο αριθμό αντιγράφων και χαμηλή μεθυλίωση, ενώ υπερμεθυλίωση μπορεί να χρησιμοποιηθεί για τη ρύθμιση της έκφρασης σε ένα γονίδιο ενισχυμένο κατάσταση. Ομοίως, μειωμένη έκφραση ογκοκατασταλτικών μπορεί να είναι το αποτέλεσμα της μερικής απώλειας αριθμού αντιγράφων με υπερμεθυλίωση. καταστολείς όγκου μπορεί επίσης ενδεχομένως να ρυθμιστεί μέσω υπομεθυλίωση σε έναν αριθμό αντιγράφων διαγραφεί δηλώνεται. Η ανάλυσή μας είναι πρότυπο για τέτοιες ιδιότητες και η πρώτη εξετάζει το CNV ανά γονίδιο και τους αποδίδει στη συνέχεια επιγενετική μεταβολή για κάθε αριθμό αντιγράφων εκτροπή με την έκφραση του γονιδίου.
Η
Αποτελέσματα
ωοθηκών καρκινικά Copy Number παρεκκλίσεις και η μεθυλίωση του DNA
Πρέπει πρώτα ατομικά ανέλυσε τόσο τη μεταβολή του αριθμού αντιγράφων και μεθυλίωσης του DNA για κάθε γονίδιο με χρωμοσωμική θέση σε 42 ορώδες πρωτογενείς όγκους των ωοθηκών που παρέχονται από το Εργαστήριο Γυναικολογίας Έρευνα στο Memorial Sloan-Kettering, (σύνολο δεδομένων MSKCC) χρησιμοποιώντας Αντιπροσωπευτικά ολιγονουκλεοτιδίων Ανάλυση μικροσυστοιχιών (ROMA) [37], [44] και μεθυλίωση ανίχνευση ολιγονουκλεοτιδίων Ανάλυση μικροσυστοιχιών (ΜΟΜΑ) [41], [42]. Τα ενισχυμένα και διαγράφονται τόπους σημείο διακοπής καλύπτουν συνολικά 561 περιοχές μεταξύ όλων των δειγμάτων (Σχήμα 2). ROMA εντοπίζει 205 διαγραφής και 356 σημεία διακοπής ενίσχυσης. Breakpoints ορίστηκαν ως περιοχές μεταξύ κάθε τμήματος (στατιστικά συνδυασμό εντάσεις καθετήρα) υπολογίζεται χρησιμοποιώντας το CBS (κυκλική δυαδικό κατάτμησης [39], [40]) μέθοδο. Ανάμεσα στα δείγματα όγκου 42, βρίσκουμε κατά μέσο όρο 76 CBS υπολογίζεται τμήματα ανά χρωμόσωμα. καταμέτρηση Τμηματοποίηση ανά χρωμόσωμα αντιστοιχούσε με μέγεθος χρωμόσωμα εκτός από χρωμοσώματα 8, 11, 12, 17, 19, και 20 όπου η πυκνότητα τμηματοποίησης μεγαλύτερη από κανονικοποιημένη για το μέγεθος των χρωμοσωμάτων και λιγότερο για τα χρωμοσώματα 6, 9, 10, 14, 15, 16, και 18. Η μεγαλύτερη μεταβλητότητα της μεταβολής αριθμού αντιγράφων (όπως μετράται από το CBS κατάτμηση μέσες τιμές) μεταξύ όλων των δειγμάτων εμφανίζεται σε χρωμοσώματα 19, 2, 10 και 4, αντίστοιχα (Σχήμα S1). Οι πιο συχνές διαγραφές (& gt? Δείγματα% του όγκου 10) παρατηρήθηκαν σε τόπους? CHR4: Q25-q35.2, CHR7: p22.3-p15.3, CHR8: p23.3-p21.1, chr13q12.11-q34, chr14q32.2-q32.33, chr15q13.3-q21.1, chr16q11.2-q24.3, chr17p13.3-q25.3, CHR19: q13.2-q13.43 και CHR22: q11.21-q13.33 (Πίνακας 1 παρέχει το ποσοστό του συνόλου των δειγμάτων που διαγράφονται μέσα σε ένα loci). Η πιο συχνά ενισχύεται (& gt? Δείγματα% του όγκου 10) θέσεις στο πλαίσιο όλων των χρωμοσωμάτων μεταξύ όλων των δειγμάτων όγκου 42 είναι? CHR1: p34.4-p34.1, CHR1: q21.1-q21.2, CHR3: q13.2-Ε23, CHR8: q11.22-q24.3, CHR19: Q12-q13.12 και chr20: Q13. 12-q13.2 (Πίνακας 1). Τρία σημείο διακοπής συμμετρία τόπους (ενισχύσεις και τις διαγραφές σε παρόμοια γονιδιωματική θέσεις σε πολλαπλά δείγματα) βρέθηκαν? chr17: q11.2-q21.32, CHR19: q13.12-q13.2 και CHR21: q21.3-22.13. Συγκρίνοντας τα αποτελέσματα ΡΟΜΑ (Πίνακας 1) με αριθμό αντιγράφων δεδομένων των φυσιολογικών ατόμων που βρέθηκαν σε HapMap [45] δεν παρουσιάζει κανένα επικάλυψη με τις λίγες ενισχυμένες περιοχές βρίσκονται στο HapMap κανονικό σύνολο δεδομένων. Επικαλυπτόμενες περιοχές της διαγραφής μεταξύ των αποτελεσμάτων μας CNV και HapMap είναι 8ρ23 και 22q11.23 όπου και οι δύο περιοχές παρουσιάζουν συχνές ετερόζυγο απώλεια. Στη συνέχεια αναλύσαμε την μεθυλίωση του DNA σε CpG νησίδες χρησιμοποιώντας τα ίδια 42 πρωτογενείς όγκους των ωοθηκών και 7 δείγματα φυσιολογικού ιστού (Σχήμα 3). Έχουμε συντάξει τιμές μεθυλίωση για τις περιοχές υποκινητή 11.978 γονιδίων που καλύπτουν 22 χρωμοσώματα. Όταν συγκρίθηκαν απευθείας προς φυσιολογικό ιστό βρέθηκαν συνολικά 68 γονίδια να κατατάσσεται ως υπερμεθυλιωμένο και 19 κατατάσσεται ως υπο-μεθυλιώνεται εντός του 10% του συνόλου της κανονικής προς διανομή αναλογία όγκου (Πίνακας S1). Τα γονίδια που εμφανίζουν τιμές μεθυλίωσης πάνω από την κανονική δείγματα περιλαμβάνουν την PHOX2B ογκογονίδιο, το σχετικό νευροβλάστωμα γονίδιο ALX3, το κοινώς μεθυλιωμένο ομάδας γονιδίων PCDHα, POU4F2, REXO1L1, BAPX1, και το κάλιο κανάλι KCNJ8. Συγκεκριμένα, REXO1L1, (RNA εξωνουκλεάση) δείχνει υψηλά επίπεδα μεθυλίωσης τόσο του όγκου και τα κανονικά δείγματα ωστόσο υπάρχει μια αύξηση 56% της μεθυλίωσης σε δείγματα όγκων. Γονίδια με τη χαμηλότερη όγκου προς κανονικό αναλογίες μεθυλίωση περιλαμβάνουν την παραλλαγή του ογκογόνου προώθηση γονίδιο DUB3 ουβικιτίνης υδρολάσης (19% μείωση) και CAPS (ογκογονιδίου εμπλέκεται στον καρκίνο του ενδομητρίου, 25% μείωση) χρωμόσωμα 4. Άλλες μεθυλιωμένος γονίδια σε σύγκριση με συμπεριληφθούν κανονικά δείγματα? RNPC3, USP37, LDHD, GJB4 (πρωτεΐνη κενό διασταύρωση), LCN8 (εμπλακεί στην μετάσταση) και CGB1 (χοριακή γοναδοτροπίνη, βήτα πολυπεπτίδιο 1) (Πίνακας S1).
Σημείο διακοπής θέσεις του αριθμού αντιγράφων μεταβλητότητας (διαγραφές που απεικονίζεται στο οι μπλε, ενισχύσεις που απεικονίζονται με κόκκινο χρώμα) σε 22 χρωμοσώματα εμφανίζονται ως προσδιορίζεται από ΡΟΜΑ που δημιουργούνται δεδομένα τμηματοποίησης. Η αρχική διαγραφή αλλοίωση ή την ενίσχυση γονιδιωματική θέση απεικονίζεται από όλα τα 42 δείγματα καρκίνου του όγκου των ωοθηκών
Η
Ο όγκος:. Κανονικό ποσοστό λόγος για ΜΟΜΑ μεθυλίωση ανά γονίδιο από 42 δείγματα ωοθηκικού όγκου του καρκίνου και 7 ιστό φυσιολογικά δείγματα είναι περιγράφονται ανά χρωμόσωμα. Για κάθε δείγμα, η μέση τιμή μεθυλίωση υπολογίζεται από τη μέγιστη τιμή ΜΟΜΑ ανά ανιχνευτή που ενσωματώνει την περιοχή γονιδίου υποκινητή. MOMA δεδομένων μεθυλίωση καλύπτονται 11.978 περιοχές του γονιδίου υποκινητή. Ευδιάκριτη υπερμεθυλίωση (κόκκινο) και υπομεθυλίωση τα γονίδια (πράσινο) επισημαίνονται και παρέχονται στον Πίνακα S2.
Η
Οι συσχετίσεις των Gene Expression με Copy Number Τροποποίηση ή μεθυλίωσης του DNA
Εμείς χωριστά εξέτασε την εξάρτηση της γονιδιακής έκφρασης (μέσω της συστοιχίας Affymetrix Human Genome U133A, βλέπε Μέθοδοι) για την ενίσχυση του αριθμού αντιγράφων, αντιγράψτε τον αριθμό διαγραφή και μεθυλίωση προαγωγού σε όγκους του καρκίνου των ωοθηκών. Πρέπει πρώτα συνέκρινε την κατανομή της γονιδιακής έκφρασης για διακριτική υψηλής και χαμηλής γονίδια CNV βρίσκεται στο σύνολο δεδομένων MSKCC μας και το σύνολο δεδομένων TCGA. Τα δύο σύνολα δεδομένων έδειξαν παρόμοιες τάσεις στην κατανομή της έκφρασης για τα γονίδια με υψηλή και χαμηλή αντιγράφων παραλλαγή αριθμός (Εικόνα 4, Εικόνα S2). Καθώς η μεταβολή του αριθμού αντιγράφων αυξάνεται από διαγραφή σε ενίσχυση η μέση έκφραση γονιδίου αυξάνει επίσης (Σχήμα 4). Ως εκ τούτου, δείχνουν μια συσχέτιση μεταξύ της αύξησης της συνολικής γονιδιακής έκφρασης με την ενίσχυση του αριθμού αντιγράφων γονιδίου σε πρωτογενείς όγκους των ωοθηκών. Επιπλέον, μετρήθηκε η αθροιστική κατανομή της έκφρασης του γονιδίου για διαγραφεί και ενισχυμένα γονίδια. Η σωρευτική κατανομή είναι το συνολικό ποσοστό των γονιδίων που βρέθηκαν κάτω από ένα δυναμικό όριο έκφρασης. Εάν τα γονίδια με χαμηλό CNV (διαγράφεται) είναι πιο κάτω από εκφράζονται από γονίδια με μεγαλύτερο CNV (ενισχύεται και υπερεκφράζεται) τα αθροιστική καμπύλη κατανομής οδηγεί σε μια πιο απότομη άνοδο σε χαμηλότερες τιμές έκφρασης για αφαιρούμενα γονίδια (που δείχνει ένα μεγαλύτερο ποσοστό των γονιδίων που βρέθηκαν με χαμηλότερες τιμές έκφραση). Η μέγιστη σωρευτική διαφορά έκφρασης μεταξύ 7-17% παρατηρείται για τα γονίδια με μικρό αριθμό αντιγράφων σε σύγκριση με γονίδια με υψηλό αριθμό αντιγράφων (Σχήμα S3). Στη συνέχεια, θα πραγματοποιηθεί η έκφραση να CNV συσχέτιση ανά γονίδιο για όλα τα δείγματα όγκων τόσο στο σύνολο δεδομένων MSKCC και σύνολο δεδομένων TCGA. Ανακαλύψαμε 124 γονίδια με θετικό CNV με την έκφραση όρια Pearson συντελεστής συσχέτισης ≥0.8 στο σύνολο δεδομένων TCGA (τιμές p & lt? 1,0 × 10
-10, Πίνακας S2B). Η seg.mean φάσμα ενίσχυση και διαγραφή για το σύνολο δεδομένων MSKCC δεν είναι τόσο μεγάλη όσο παρατηρείται στο σύνολο δεδομένων TCGA είναι (σχήματα S1 και S2) και ως εκ τούτου λιγότερα γονίδια κατέλαβε με σημαντική CNV να συσχετισμούς έκφρασης. Ωστόσο, είμαστε σε θέση να προσδιορίσουν 32 γονίδια με Pearson values≥0.6 συσχέτιση (p-τιμές & lt? 4,0 × 10
-5, Πίνακας S2A) με 18 από τα 32 γονίδια που εντοπίστηκαν, επίσης, στο σύνολο δεδομένων TCGA (Πίνακας S2A).
Όπως μεταβολή αριθμού αντιγράφων γονιδίου αυξάνει τη διαγραφή από την ενίσχυση της γονιδιακής έκφρασης μέση αυξάνει επίσης τόσο στην MSKCC (μπλε γραμμή) και TCGA (πράσινη γραμμή) σύνολα δεδομένων.
η
Μεγαλύτερη γονίδιο διαφορές έκφρασης μεταξύ φυσιολογικών και καρκινικών δειγμάτων δεν παρατηρούνται μέχρι βασιζόμαστε μόνο σε εκείνα τα δείγματα που περιέχουν γονίδια με ακραίες ενισχύσεις και διαγραφές (Σχήμα 4). Ως εκ τούτου, η προσέγγισή μας για την ταυτοποίηση γονιδίων με αλλαγμένη παραλλαγή αριθμού αντιγράφου συσχετίζεται με έκφραση ήταν να εξεταστούν οι τιμές έκφραση γονιδίων εντός υψηλό και χαμηλό αριθμό αντιγράφων seg.mean αξίες και να συγκρίνουν την έκφραση αυτών των γονιδίων με εκείνη των κανονικών δειγμάτων ιστού. Σε μια εκδήλωση όπου υπάρχει αριθμός αντιγράφων εκτροπή σε φυσιολογικά δείγματα θα παρατηρηθεί αυτό ίδιο τύπο συσχέτισης. Εξετάσαμε μόνο δείγματα όγκων αφού το μέγεθος και την έκταση του αριθμού αντιγράφων αλλαγές είναι πιο σημαντικά ανιχνεύεται μέσω του πρωτοκόλλου μας. Αρχικά υπολογίσαμε τη μέση τιμή έκφρασης για κάθε γονίδιο όπου το 20% των δειγμάτων του όγκου έδειξε μια τιμή CNV των παραπάνω 0.50 seg.mean ή κάτω από -0,50 seg.mean και επίσης φιλτράρονται τα γονίδια για το οποίο η κανονική έκφραση δεν ήταν εντός του προτύπου απόκλιση (οι προεπιλεγμένες όρια TCGA CNV χρησιμοποιήθηκαν το οποίο αντιστοιχεί σε τουλάχιστον ένα ενισχυμένο ή διαγράφονται αντίγραφο και με την ικανότητα να συλλάβει όσες αλλαγμένη δείγματα CNV ανά γονίδιο δυνατού). Αυτό αυστηρά κριτήρια του 20% των δειγμάτων όγκου TCGA κατέλαβε 21 γονίδια (Πίνακας S3). Αυτά τα 21 γονίδια όπως CCNE1 και GSTT1 αντιπροσωπεύουν τις πιο τροποποιημένα γονίδια CNV στα δείγματα όγκου με διαφορική έκφραση σε σύγκριση με ιστό κανονικά δείγματα στο σύνολο δεδομένων TCGA. Ωστόσο αυτή η προσέγγιση είναι σε μεγάλο βαθμό εξαρτάται από τα μέσα επίπεδα έκφρασης φυσιολογικό γονίδιο. Για TCGA, κατά τον χρόνο των πληροφοριών έκφρασης ανάλυσής μας ήταν διαθέσιμα μόνο για 8 δείγματα χαρακτηρίζονται ως φυσιολογική. Ως εκ τούτου, ένα γονίδιο όπως MYC (πιο συχνά υπερεκφράζεται σε κύτταρα όγκων), η οποία έχει ένα μέσο δείγμα τιμή έκφραση των 8,93 στα οκτώ TCGA κανονικά δείγματα (Σχήμα S4) και με μέση τιμή έκφρασης δείγμα όγκου του 7,75 (από 339 δείγματα όγκων) δεν παρατηρείται με τη μέθοδο αυτή. Με την εκτέλεση του δείγματος όγκου συγκεκριμένη ανάλυση δεν μπορεί να εξαλείψει πλήρως αυτές τις παραλλαγές, αλλά ελπίζω να περιορίσουν το μέγεθος τους.
Για να μην επικαλεστεί το μικρό κανονική δειγματοληψία ιστού για τις αξίες της έκφρασης, πραγματοποιήσαμε ένα τεστ κατάταξης Wilcoxon μόνο στην έκφραση τιμές από ένα ελάχιστο 20% των δειγμάτων του όγκου μέσα σε πολύ χαμηλές και υψηλές γονίδιο αριθμού αντιγράφων seg.mean όρια. Στα δεδομένα του όγκου TCGA που αυτή παρήγαγε ένα σύνολο 54 γονιδίων σε ένα ποσοστό εσφαλμένης ανακάλυψη του 5% σε seg.mean τιμές 1,25 και -0,50 για υψηλή και χαμηλή διακύμανση αριθμού αντιγράφων, αντίστοιχα (Πίνακας 2, Πίνακας S4). Ο αριθμός των γονιδίων συλλαμβάνονται εξαρτάται από τον αριθμό αντιγράφων κατάτμηση μέση τιμή που χρησιμοποιείται ως κατώφλι φιλτραρίσματος (διατηρώντας ένα καθορισμένο όριο χαμηλού αντιγράφου στο -0,50, έτσι στο ελάχιστο τη λήψη μιας απώλειας ετεροζυγωτίας ανά γονίδιο [8]? Σχήμα S5). Ένα σύνολο από 1114 γονίδια συλλαμβάνονται (FDR & lt? 0,05) σε ένα χαμηλότερο όριο CNV 0,8 seg.mean (Σχήμα S5). Με το τεστ κατάταξης Wilcoxon βρίσκουμε γονίδια όπως MYC, CCNE1, KRAS, NDRG1, MLL4 και MTSS1 για τους οποίους τα δεδομένα που συγκεκριμένων φυσιολογική έκφραση ιστός δεν μπορεί να είναι σημαντικά διαφορετικό από όλα τα δείγματα όγκων, αλλά είναι μεταβλητή μεταξύ των δειγμάτων αριθμό όγκου χαμηλής και υψηλής αντίγραφο. Συντηρητική περιορισμοί όριο του 20% συμπερίληψη δείγμα όγκου ως αποτέλεσμα την ταυτοποίηση γονιδίων από ακραίες θέσεις CNV όπως σε χρωμοσώματα 1, 8 και 19. Είναι ενδιαφέρον, παράγοντα μεταγραφής CEPBG βρέθηκε να έχει καλή CNV να συσχέτιση έκφρασης και επίσης την έκφραση και μεθυλίωσης συσχέτιση στο σύνολο δεδομένων MSKCC. Ομοίως, την εκτέλεση της δοκιμής κατάταξης Wilcoxon σε δείγματα MSKCC όγκου σε υψηλό αντίγραφο όριο αριθμού ≥0.5 και χαμηλού αριθμού αντιγράφων ROMA συγκεκριμένη πλατφόρμα όριο & lt? 0.0 (βλέπε Μέθοδοι) που κατέλαβε 62 γονίδια σε ποσοστό εσφαλμένης ανακάλυψη ≤0.05 (Πίνακας 2 , Πίνακας S4). Γονίδια που προσδιορίζονται στο σύνολο δεδομένων MSKCC ήταν από παρόμοια γονιδιωματική τόπους όπως εκείνα που βρίσκονται στο σύνολο δεδομένων TCGA. Πέντε γονίδια είχαν προβλεφθεί και από τις δύο ομάδες δεδομένων: CCNE1, POP4, UQCRB, PHF20L1 και C19orf2 (Πίνακας 2). Έχουμε ολοκληρωμένη τα δεδομένα έκφρασης με CNV να προσδιοριστούν τα γονίδια που είναι πιο πιθανό να είναι υποψήφιοι ως γονίδια λειτουργία καρκίνου με εν δυνάμει ογκοκατασταλτικό και ογκογόνο χαρακτηριστικά CNV-έκφρασης. Αυτό κάνει τον αριθμό των γονιδίων σε περαιτέρω μελέτες πιο προσιτή για τη λειτουργική επικύρωση των γονιδίων επηρεάζεται από γενετικών ανωμαλιών.
Η
Αναλύσαμε επίσης την κλασική εξάρτηση της μεθυλίωσης του DNA σε περιοχές υποκινητή γονιδίου με αυτό της γονιδιακής έκφρασης. δεδομένων μεθυλίωση εμφανίζει φτωχότερες συσχέτιση με την έκφραση από μεταβολή του αριθμού αντιγράφων (Σχήμα S6). Προσδιορίσαμε Pearson συσχετίσεις μεταξύ μεθυλίωσης του DNA και την έκφραση του γονιδίου σε αμφότερα τα σύνολα δεδομένων των ωοθηκών πρωτογενούς όγκου MSKCC και TCGA. Pearson τιμές συσχέτισης & gt? 0,5 (ρ-τιμές & lt? 2,0 × 10
-4, χαμηλή μεθυλίωση και υψηλή έκφραση σε υψηλά μεθυλίωση και χαμηλή έκφραση) παρατηρούνται σε 86 γονίδια μεταξύ των δύο συνόλων δεδομένων. Σε περίοπτη θέση, το γονίδιο που κωδικοποιεί ουβικιτίνης Β (UBB) παρουσιάζει υψηλή συσχέτιση μεταξύ μεθυλίωσης και της έκφρασης και στα δύο σύνολα δεδομένων και RAB25 ένα γνωστό ύποπτη για καρκίνο των ωοθηκών βρίσκεται επίσης στα δεδομένα TCGA που [31], [46] (Πίνακες S2A και S2B)
You must be logged into post a comment.