PLoS One: σύνδεσης μεταξύ Response βλάβες στο DNA και Γονίδια Επισκευή και κίνδυνο διηθητικού υδαρής ωοθηκών Cancer


Αφηρημένο

Ιστορικό

Εμείς ανέλυσε τη συσχέτιση μεταξύ 53 γονίδια που σχετίζονται με την επιδιόρθωση του DNA και p53 με τη μεσολάβηση ανταπόκριση ζημιές και ορώδες τον κίνδυνο καρκίνου των ωοθηκών χρησιμοποιώντας δεδομένα ασθενών-μαρτύρων από τον ωοθηκών μελέτη Βόρεια Καρολίνα καρκίνο (NCOCS), ένα, μελέτη ασθενών-μαρτύρων με βάση τον πληθυσμό.

Μέθοδοι /Κύρια Ευρήματα

Η ανάλυση περιορίστηκε σε 364 επεμβατική ορώδες περιπτώσεις καρκίνου των ωοθηκών και 761 έλεγχοι του λευκού, μη-Ισπανόφωνος αγώνα. Η στατιστική ανάλυση ήταν δύο οργάνωσαν: μια οθόνη χρησιμοποιώντας οριακή παράγοντες Bayes (BFS) για 484 SNPs και ένα στάδιο μοντελοποίησης με τον οποίο υπολογίζεται προσαρμόζεται πολυμεταβλητή οπίσθια πιθανότητες του συνεταιρίζεσθαι για 77 SNPs που πέρασαν από την οθόνη. Αυτές οι πιθανότητες ήταν προϋπόθεση για το θέμα της ηλικίας κατά τη διάγνωση /συνέντευξη, παρτίδα, μια ποιότητα του DNA μετρικό και γονότυπους των άλλων SNPs και επιτρέπεται αβεβαιότητα στις γενετικές παραμετροποιήσεις του SNPs και τον αριθμό των συνδεδεμένων SNPs. Έξι SNPs είχαν Bayes παράγοντες μεγαλύτερη από 10 υπέρ της ένωσης με την επεμβατική ορώδες καρκίνο των ωοθηκών. Αυτά περιλαμβάνονται rs5762746 (διάμεση Ή (λόγος πιθανοτήτων)

ανά αλληλόμορφο = 0,66? 95% διάστημα εμπιστοσύνης (CI) = 0,44 έως 1,00) και rs6005835 (

διάμεση

ή

ανά αλληλόμορφο

= 0,69? 95% CI = 0,53 – 0,91

) στο

CHEK2

, rs2078486 (διάμεση τιμή ή

ανά αλληλόμορφο = 1,65? 95% CI = 01.21 – 02.25) και rs12951053 (διάμεση τιμή ή

ανά αλληλόμορφο = 1,65? 95% CI = 01.20 – 02.26) στο

TP53

, rs411697 (διάμεση τιμή ή

σπάνια ομοζυγώτες = 0,53? 95% CI = 0,35 – 0,79) στο

BACH1

και rs10131 (

μεσαίο ή

σπάνια ομοζυγώτες =

δεν μπορεί να εκτιμηθεί) στο

LIG4

. Οι έξι πιο ιδιαίτερα συνδεδεμένες SNPs είτε προβλέπεται να είναι λειτουργικά σημαντική ή βρίσκονται σε LD με μια τέτοια παραλλαγή. Οι παραλλαγές στην TP53 επιβεβαιώθηκαν να συνδέεται σε μια μεγάλη μελέτη παρακολούθησης.

Συμπεράσματα /Σημασία

Με βάση τα ευρήματά μας, περαιτέρω παρακολούθηση των οδών επιδιόρθωσης του DNA και την αντίδραση σε ένα μεγαλύτερο σύνολο δεδομένων είναι αναγκαία για να επιβεβαιώσει αυτά τα αποτελέσματα

Παράθεση:. Schildkraut JM, Iversen ES, Wilson MA, Clyde MA, Moorman PG, Palmieri RT, et al. (2010) σύνδεσης μεταξύ DNA Response ζημιών και Γονίδια Επισκευή και κίνδυνο διηθητικού υδαρής καρκίνου των ωοθηκών. PLoS ONE 5 (4): e10061. doi: 10.1371 /journal.pone.0010061

Επιμέλεια: Marie-Pierre Dube, Universite de Montreal, Καναδάς

Ελήφθη: 2 Δεκεμβρίου 2009? Αποδεκτές: 5 Μάρτη, 2010? Δημοσιεύθηκε: 8 Απριλίου του 2010

Copyright: © 2010 Schildkraut et al. Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της άδειας χρήσης Creative Commons Attribution, το οποίο επιτρέπει απεριόριστη χρήση, τη διανομή και την αναπαραγωγή σε οποιοδήποτε μέσο, ​​με την προϋπόθεση το αρχικό συγγραφέα και την πηγή πιστώνονται

Χρηματοδότηση:. Αυτό το χειρόγραφο υποστηρίχθηκε από επιχορηγήσεις από τα Εθνικά Ινστιτούτα Υγείας 1-R01-CA76016 και 1-R01-HL090559. Οι χρηματοδότες δεν είχε κανένα ρόλο στο σχεδιασμό της μελέτης, τη συλλογή και ανάλυση των δεδομένων, η απόφαση για τη δημοσίευση, ή την προετοιμασία της manuscipt

Αντικρουόμενα συμφέροντα:.. Οι συγγραφείς έχουν δηλώσει ότι δεν υπάρχουν ανταγωνιστικά συμφέροντα

Εισαγωγή

ο καρκίνος των ωοθηκών είναι η κύρια αιτία θνησιμότητας μεταξύ των γυναικολογικών καρκίνων [1]. Η εξαιρετικά θανατηφόρος ορώδες ιστολογικού τύπου περιλαμβάνει περίπου τα δύο-τρίτα των περιπτώσεων και προκαλεί περισσότερους θανάτους σχετίζονται με την ασθένεια. Αναπαραγωγικούς παράγοντες όπως η υψηλή ισοτιμία, η χρήση αντισυλληπτικών χαπιών, ο θηλασμός, υστερεκτομή, και απολίνωση των σαλπίγγων προστατεύουν από τον καρκίνο [2] των ωοθηκών, ενώ υπογονιμότητα και ενδομητρίωση αύξηση του κινδύνου [3], [4]. Οι βιολογικοί μηχανισμοί που αποτελούν τη βάση αυτούς τους παράγοντες κινδύνου δεν είναι καλά κατανοητοί, αλλά σχετίζονται με φλεγμονή οξειδωτικό στρες έχει προταθεί ως μια ενωτική θεωρία με την οποία αυτοί οι παράγοντες κινδύνου θα μπορούσαν να προκαλέσουν γονιδιωματική βλάβη που οδηγεί στην ανάπτυξη του καρκίνου [5], [6], [ ,,,0],7], [8], [9]. Εάν αυτή η θεωρία είναι σωστή, είναι εύλογο ότι ο κίνδυνος καρκίνου των ωοθηκών θα πρέπει να τροποποιηθεί με κοινή γενετικές παραλλαγές που επηρεάζουν την αποτελεσματικότητα των γονιδίων επιδιόρθωσης του DNA [10], [11].

Πολλά στοιχεία δείχνουν ότι οδούς επιδιόρθωσης του DNA διαδραματίζουν σημαντικό ρόλο στην ωοθηκών καρκινογένεση. Πρώτον, όλες οι υψηλής διεισδυτικότητας γονίδια ευαισθησίας στον καρκίνο των ωοθηκών που έχουν ταυτοποιηθεί μέχρι σήμερα παίζουν ένα ρόλο στην επιδιόρθωση του DNA. Σε αυτό το πλαίσιο, επιβλαβείς μεταλλάξεις στο

BRCA1

και

BRCA2

γονίδια μειώνουν την επισκευή των διαλειμμάτων διπλής έλικας του DNA. Επιπλέον, οι μεταλλάξεις στα γονίδια βλαστικής σειράς DNA επιδιόρθωσης αταίριαστων βάσεων που προκαλούν τον κληρονομικό καρκίνο του παχέος εντέρου μη-πολυποειδούς (HNPCC) σύνδρομο επίσης εντυπωσιακά να αυξήσει τον κίνδυνο καρκίνου των ωοθηκών [12], [13]. Δεύτερον, σωματικές μεταλλάξεις εις το

ΤΡ53

γονίδιο είναι οι συνηθέστερα αποκτήθηκαν μοριακές αλλαγές που περιγράφονται μέχρι τώρα στη υψηλού βαθμού ορώδες ωοθηκών [14], [15], [16].

ΤΡ53

εμπλέκεται στην διατήρηση της ακεραιότητας γενωμικού μέσω διαφόρων μηχανισμών συμπεριλαμβανομένης της πρόκλησης της διακοπή του κυτταρικού κύκλου σε απόκριση σε βλάβη του DNA, την επιδιόρθωση του DNA και τη ρύθμιση της απόπτωσης.

Οι παραπάνω παρατηρήσεις μας οδήγησαν στην υπόθεση ότι κοινών πολυμορφισμών σε γονίδια που συνδέονται με την απάντηση του DNA και την επισκευή ή την p53-DNA οδοφράγματος βλάβη μπορεί να αυξήσει τον κίνδυνο εμφάνισης καρκίνου των ωοθηκών. Εστιάσαμε σε 477 tagging πολυμορφισμούς μονών νουκλεοτιδίων (SNPs) και επτά επιπλέον αμινοξύ αλλάζει SNPs σε 53 γονίδια σε απάντηση βλάβες στο DNA και τις οδούς αποκατάστασης. Χρησιμοποιήσαμε ένα Bayesian στρατηγική αναζήτησης μοντέλο που ονομάζεται Multi-επίπεδο Συμπερασματολογία για SNP Association (MISA) [17] για την ανάλυση αυτών των SNPs για την απόδειξη της σύνδεσης με καρκίνο των ωοθηκών, χρησιμοποιώντας δεδομένα από τον πληθυσμό με βάση τη Βόρεια Καρολίνα των ωοθηκών Μελέτης του Καρκίνου (NCOCS).

οι Bayesian μέθοδοι γίνει πολύ πιο κοινή επιλογή για την ανάλυση των μελετών γενετικής συσχέτισης ([18] και εκεί παραπομπές). Αυτό μπορεί να οφείλεται σε διάφορους παράγοντες μεταξύ των οποίων αρκετά βασικά πλεονεκτήματα της Bayesian μοντέλο έχει πάνω από το frequentist παράδειγμα και για την αύξηση της διαθεσιμότητας του λογισμικού που έχουν σχεδιαστεί ειδικά για Μπεϋζιανή ανάλυση των δεδομένων γενετικής σύνδεσης, όπως το πακέτο MISA χρησιμοποιείται εδώ. Το κλειδί μειονέκτημα σε δοκιμές στην frequentist παράδειγμα είναι στην αποτυχία του να αντιπροσωπεύουν ρητά για την πιθανότητα του συλλόγου που απορρέουν από την εναλλακτική υπόθεση, δηλαδή να λογοδοτήσουν για την εξουσία – τα δεδομένα που δημιουργούν μια μικρή τιμή p βάσει του null μπορεί επίσης να είναι πολύ απίθανο υπό την εναλλακτική υπόθεση [18]. Σε αντίθεση, Bayesian μέθοδοι παρέχουν μέτρα του συνεταιρίζεσθαι – Bayes παράγοντες (BFS) και οπίσθια πιθανότητες – που αντιπροσωπεύουν ρητά για την πιθανότητα των δεδομένων στο πλαίσιο των ανταγωνιστικών υποθέσεων. Αυτό έρχεται στο κόστος των πρόσθετων υποθέσεων μοντελοποίησης? δηλαδή, τις προδιαγραφές των προτέρων πιθανότητες για κάθε υπόθεση και πριν από διανομές πάνω παραμέτρων του μοντέλου εξαρτάται από τις υποθέσεις.

MISA [17] βελτιώνει την (οριακή) μεθόδους SNP-σε-ένα χρόνο από το φαινότυπο μοντελοποίηση ως συνάρτηση της μια πολυμεταβλητή γενετικό προφίλ και, ως εκ τούτου, παρέχει τα μέτρα του συνδέσμου προσαρμόζεται για τις υπόλοιπες δείκτες. MISA απασχολεί Bayesian μοντέλο μέσου όρου [19], [20] για να αντιπροσωπεύουν την αβεβαιότητα στις προδιαγραφές της αληθινής μοντέλο του συλλόγου, κάτι που σταδιακά η λογιστική παλινδρόμηση και άλλα επιλογή μοντέλου προσεγγίσεις όπως λάσο δεν το κάνουμε. Αυτό έχει σημαντικές συνέπειες: οι μέθοδοι που προσδιορίζουν ένα ενιαίο μοντέλο μπορεί να χάσετε σημαντικό SNPs λόγω της δομής LD. Επιπλέον, MISA παρέχει περιλήψεις του βαθμού στον οποίο στηρίζουν τα στοιχεία σύνδεσης στο επίπεδο των επιμέρους παραλλαγές, τα γονίδια και τα μονοπάτια, ενώ επιτρέπει για συμπερασματολογία σχετικά με τη γενετική παραμετροποίηση (log-πρόσθετο, κυρίαρχη ή υπολειπόμενη) κάθε SNP. Η προηγούμενη κατανομή που απασχολούνται από MISA επιλέχθηκε προσεκτικά για τη διόρθωση πολλαπλότητα προκαλεί.

Υλικά και Μέθοδοι

Τα άτομα της μελέτης

Θήκες και έλεγχοι συμμετέχοντες στην NCOCS, η οποία διεξήχθη στο μια περιοχή 48 νομών της Βόρειας Καρολίνας. Μια λεπτομερής περιγραφή της μελέτης έχει δημοσιευτεί προηγουμένως [2], [21]. Εν συντομία, οι περιπτώσεις εντοπίστηκαν μέσα από την Βόρεια Καρολίνα Κεντρικό Αρχείο Καρκίνου χρησιμοποιώντας την ταχεία διαπίστωση περίπτωση. Επιλέξιμες περιπτώσεις, ηλικίας 20 έως 74 είχαν διαγνωστεί με επιθηλιακό καρκίνο των ωοθηκών μεταξύ των ετών 1999 και 2007. Η ιστολογική διαφάνειες ελήφθησαν και όλες οι περιπτώσεις υποβλήθηκαν σε τυποποιημένη αναθεώρηση ιστοπαθολογικές από τον παθολογοανατόμο μελέτη (RCB) για να επιβεβαιώσει τη διάγνωση. Το ποσοστό ανταπόκρισης μεταξύ των επιλέξιμων περιπτώσεις ήταν 70%. Βρήκαμε μικρή διαφορά στα δημογραφικά και κλινικά χαρακτηριστικά μεταξύ των περιπτώσεων που συμμετείχαν σε αυτή τη μελέτη σε σύγκριση με εκείνους που αρνήθηκε. οι γυναίκες τον έλεγχο εντοπίστηκαν από την ίδια περιοχή με τη χρήση τυχαίων ψηφίων κλήσης και αντιστοιχήθηκαν συχνότητα στις περιπτώσεις κατά ηλικία (κατηγορίες πενταετία) και η φυλή (μαύρο ή μη-μαύρο). Εβδομήντα τρία τοις εκατό των δυνατοτήτων τους ελέγχους που πέρασαν την εξέταση της επιλεξιμότητας συμφώνησε να σταλούν πρόσθετες πληροφορίες μελέτης. Μεταξύ εκείνων που αποστέλλονται πληροφορίες μελέτη, το ποσοστό ανταπόκρισης ήταν 64 τοις εκατό. Αν και το ποσοστό ανταπόκρισης ελέγχου είναι κάπως χαμηλή, αυτό δεν έχει επηρεάσει τις ενώσεις με τις καθιερωμένες επιδημιολογικών παραγόντων κινδύνου [2], [21]. Επιπλέον, είναι απίθανο ότι η συμμετοχή θα έχουν επηρεαστεί από το γονότυπο. Το πρωτόκολλο εγκρίθηκε από το Διοικητικό Συμβούλιο του Πανεπιστημίου Duke Medical Center Institutional Review και των επιτροπών ανθρώπινα υποκείμενα στο Κεντρικό Μητρώο Καρκίνου και κάθε νοσοκομείο, όπου εντοπίστηκαν περιπτώσεις.

Εμείς περιορίζεται η τρέχουσα αναλύει σε λευκό, μη-ισπανόφωνοι επεμβατική ορώδες περιπτώσεις καρκίνου των ωοθηκών (n = 364) και το λευκό μη-ισπανόφωνοι ελέγχου (n = 761) με τις απαιτήσεις ποιοτικού ελέγχου συνάντηση δεδομένων γονότυπο. Οι συμμετέχοντες είχαν καταρτίσει το αίμα κατά τη διάρκεια της πρόσωπο με πρόσωπο συνέντευξη τους από τη νοσοκόμα της μελέτης. Βλαστικής σειράς DNA εξήχθη από λεμφοκύτταρα περιφερικού αίματος χρησιμοποιώντας αντιδραστήρια απομόνωσης Puregene DNA, σύμφωνα με τις οδηγίες του κατασκευαστή (Gentra Systems, Minneapolis, MN).

Γονοτυπικές Μέθοδοι

Έχουμε επιλέξει μια ευρεία ομάδα των υποψηφίων γονιδίων σε τα μονοπάτια επιδιόρθωσης του DNA και της αντίδρασης (Πίνακας S1) που ενδέχεται να αλληλεπιδράσουν με το

BRCA1

ή

BRCA2

ή εμπλέκονται σε δίκλινο διάλειμμα σκέλος, επισκευή ασυμφωνία, νουκλεοτίδιο επιδιόρθωση εκτομής, ή την επισκευή βάσης εκτομή. Εμείς ετικέτα αυτούς τους 53 υποψήφια γονίδια χρησιμοποιώντας απελευθέρωση 19 (www.hapmap.org) πληθυσμός ιδρυτής [22] CEU του Διεθνούς HapMap Έργου και το πρόγραμμα ldSelect [23]. Εμείς ετικέτα την περιοχή αρχίζει 10.000 ζεύγη βάσεων ανοδικά και τελειώνει 10.000 ζεύγη βάσεων προς τα κάτω του κάθε γονιδίου έτσι ώστε να περιλαμβάνει την κωδικοποίηση, μη-κωδικοποίησης και ρυθμιστικές περιοχές. ldSelect εντοπίστηκαν κάδους των SNPs με μικρές συχνότητα αλληλόμορφο (MAF) ≥0.05 χρησιμοποιώντας ένα όριο ζεύγη ανισορροπία σύνδεσης (LD) του

r

2≥0.8. Εμείς επιλέξαμε να γονότυπο δύο ετικέτες σε κάδους, όπου όλοι οι SNPs είχαν χαμηλές βαθμολογίες σχεδιασμό Illumina να βελτιώσει την αναμενόμενη κάλυψη. Για τους σκοπούς της ανάλυσης, που διατήρησε την ετικέτα με τις πιο ακριβές κλήσεις γονότυπο όπως μετράται με βάση τη συχνότητα κλήσης και το ποσοστό αντιστοιχίας στο τρίο CEPH. Από τις 671 ετικέτες SNPs γονότυπος, 61 ήταν nonsynonymous? ένα επιπλέον 14 μη-tagging αμινοξύ αλλάζει SNPs επίσης ο γονότυπος, όταν η ετικέτα που επιλέχθηκε ήταν επίσης nonsynonymous. Περιλαμβάνονται όλοι οι nonsynonymous SNPs που πληρούσαν τα κριτήρια για τις αναλύσεις Illumina Golden Gate. Τα δείγματα γονότυπος χρησιμοποιώντας ένα Illumina Golden Gate Δοκιμασία ™ στο Duke Ινστιτούτου Genome Sciences και Πολιτικής (IGSP), με τις περιπτώσεις και τους ελέγχους αναμειγνύονται τυχαία σε κάθε ένα από 21 πλάκες. Έξι CEPH-Γιούτα τρίο (Coriell Ινστιτούτο, Camden, Ν.Ι) διανεμήθηκαν σε έξι πλάκες. Οι πλάκες υποβάλλονται σε επεξεργασία σε τέσσερις παρτίδες από την εγκατάσταση προσδιορισμού του γονότυπου. SNPs που δεν θα μπορούσε να ονομαστεί χρησιμοποιώντας το λογισμικό Illumina BeadStudio επί περισσότερο από 1% των δειγμάτων, εντός μιας ομάδας υποβλήθηκαν σε θεραπεία ως ελλείποντα για την εν λόγω παρτίδα. Χρησιμοποιήσαμε ανάλυση λογιστικής παλινδρόμησης για να προσδιοριστεί εάν παρτίδα και το DNA μετρήσεις ποιότητας συνδέθηκαν με την κατάσταση-μαρτύρων.

Είμαστε αξιολόγησε την ακρίβεια των γενετικών δεδομένων χρησιμοποιώντας SNP- και αναλύει ένα συγκεκριμένο θέμα ελέγχου της ποιότητας. Κατ ‘αρχάς, θα αφαιρεθεί από όλες ένωση αναλύσεις SNPs με έναν ή περισσότερους γονότυπους CEPH σε διαφωνία με τις δημοσιευμένες τιμές τους, δηλαδή αυτά που είχαν εκτιμώμενο ποσοστό σφάλματος είναι μεγαλύτερη από ή ίση με 1/18 υποθέτοντας ότι οι δημοσιεύονται γονότυπους είναι σωστές. Δεύτερον, χρησιμοποιήσαμε το Χ2 τεστ καλής προσαρμογής με διόρθωση συνέχειας 0,25 για τη δοκιμή για αναχωρήσεις από Hardy-Weinberg-Ισορροπία (HWE) μεταξύ των ελέγχων [24], καθώς και μεταξύ των 60 γονέων CEPH χρησιμοποιώντας δημοσιευμένες γονότυπους τους στους τόπους που παρουσιάζουν ενδιαφέρον. Αφαιρέσαμε ένα υποσύνολο των δειγμάτων με βάση την ανάλυση της αριστερής ουράς της κατανομής του ρ-τιμές για HWE. Αυτό το υποσύνολο αντιπροσώπευαν το Illumina GenCall βαθμολογίας 50ο εκατοστημόριο (GC50PCT) του κάθε δείγματος και χρησιμοποίησε την αντίστοιχη κατανομή υπολογίζεται από τα δείγματα HapMap CEPH για σύγκριση. Αναφέρθηκαν εκτιμήσεις των ανήλικων συχνότητας αλληλόμορφου (MAF) είναι το ελάχιστο των παρατηρούμενων αλληλόμορφο συχνότητες μεταξύ των ελέγχων.

Είκοσι δύο από τις 685 SNPs επιδιόρθωση του DNA για τη δοκιμασία είχαν τιμές κλήσεων κάτω από 99% σε όλες τις τέσσερις παρτίδες και ήταν αφαιρεθεί από περαιτέρω εξέταση. Τριάντα επτά από τις υπόλοιπες 663 SNPs είχαν λιγότερο από το 95% συμφωνία στα δείγματα CEPH μεταξύ γονότυπου κλήσεις μας και εκείνων που δημοσιεύονται από HapMap και απομακρύνθηκαν από την περαιτέρω εξέταση. Από αυτούς που παραμένουν, 484 ήταν μη περιττές και να συμπεριληφθεί σε όλες τις επόμενες αναλύσεις. Ένα οικόπεδο QQ της κατανομής p-value HWE πάνω από αυτά τα SNPs χρησιμοποιώντας όλα τα 787 λευκό μη-ισπανόφωνοι έλεγχοι έδειξαν απόδειξη της μια υπεραφθονία των μικρών π-αξιών σε σχέση με ό, τι αναμένεται υπό την ομοιόμορφη κατανομή. Το αντίστοιχο οικόπεδο με βάση τους γονότυπους HapMap των 60 CEPH γονείς δεν έχουν αυτή την ιδιότητα

Ο αριθμός των SNPs με p-value HWE λιγότερο από 0,01 υπολογίζονται χρησιμοποιώντας όλα τα 787 λευκό μη-ισπανόφωνοι μάρτυρες ήταν 17.? χρησιμοποιώντας το δείγμα HapMap, ήταν 5. Υποθέτοντας ότι οι p-τιμές είναι ανεξάρτητα και ομοιόμορφα κατανεμημένα τον αναμενόμενο αριθμό μικρότερο από 0,01 είναι 4,84, το 2,5

ου εκατοστημόριο της κατανομής είναι 1 και το 97,5

ου εκατοστημόριο είναι 10 .

Αυτό σημαίνει ότι, αντί να έχουν μια γενετική εξήγηση του πληθυσμού, αυτή η αναχώρηση είναι πιθανό να οφείλεται σε σφάλματα του γονότυπου. Για να το επιβεβαιώσετε αυτό, θεωρήσαμε την αφαίρεση δειγμάτων με Illumina GC50PCT λιγότερο από ένα κατώφλι μεγαλύτερο από το σύνηθες 0,7. Αυξήσαμε συστηματικά το όριο μέχρι 0,8 και διαπίστωσε ότι η κατανομή των π-αξιών HWE είχε βελτιωθεί δραματικά από το όριο του 0,789. Η επιλογή αυτή άφησε 364 (390) περιπτώσεις και 761 μάρτυρες. Χρησιμοποιώντας αυτό το όριο, υπήρχαν 9 SNPs με p-value HWE μικρότερη από 0,01. Όλες οι περαιτέρω αναλύσεις πραγματοποιήθηκαν με τη χρήση αυτών των δειγμάτων και δεδομένων γονότυπο τους για τις 484 μη απολυμένους SNPs που περνά την ανάλυση του ποιοτικού ελέγχου μας.

Στατιστικές Μέθοδοι

MISA Ανάλυση.

Χρησιμοποιήσαμε MISA για τον εντοπισμό πιθανόν ενώσεις και τις γενετικές παραμετροποιήσεις των συνδεδεμένων SNPs. MISA εφαρμόζει ένα μοντέλο αναζήτησης πάνω μοντέλα λογιστικής παλινδρόμησης για την κατάσταση περίπτωση ελέγχου δεδομένων των SNP μεταβλητές και ένα σύνολο του σχεδιασμού και τις πιθανές συγχυτικές μεταβλητές. Υπό τις τρέχουσες αναλύσεις, η ηλικία κατά τη διάγνωση /συνέντευξη, παρτίδας, την ποιότητα του DNA μετρικό GC50PCT, και τους όρους της αλληλεπίδρασης μεταξύ των παρτίδων και GC50PCT είναι οι μεταβλητές «σχέδιο» που περιλαμβάνεται σε όλα τα μοντέλα. Αναφερόμαστε στο μοντέλο με μόνο τις μεταβλητές σχεδιασμού, όπως το μοντέλο του «όχι γενετική συσχέτιση,» ή «μηδενική» μοντέλο για συντομία. Είναι iswhere D

i είναι ο δείκτης του κατά πόσον υπόκεινται

i

είναι μια περίπτωση, το Μ είναι ένα αναγνωριστικό μοντέλου, α

0 είναι το σημείο τομής, Ζ

i είναι το διάνυσμα των μεταβλητών σχεδιασμού για το θέμα

i

, και β

0 είναι το διάνυσμα των συντελεστών των μεταβλητών στο Z

i κάτω από την μηδενική μοντέλο. Προσθέτοντας κύριες επιπτώσεις για οποιονδήποτε συνδυασμό των SNPs στο μοντέλο null θα καθορίσει ένα πρότυπο καταστατικό. MISA επιτρέπει σε κάθε συμπεριλαμβάνονται SNP να έχουμε ένα αρχείο καταγραφής-πρόσθετο, κυρίαρχη ή υπολειπόμενη παραμετροποίησης. MISA χρησιμοποιεί ένα εξελικτικό αλγόριθμο Monte Carlo για να δοκιμάσουν τα μοντέλα σε αυτή την κατηγορία, σύμφωνα με οπίσθιο πιθανότητες τους. Αυτή η αναζήτηση στοχαστικής πραγματοποιείται αντί της απαρίθμησης των μοντέλων για λογαριασμό του τεράστιου αριθμού τους.

Λόγω της αστρονομικό αριθμό των στατιστικών μοντέλων της παραπάνω μορφής, MISA ενσωματώνει μια ανεκτική και μόνο SNP-σε-ένα -Ώρα οθόνη (οριακή) Bayes Factor (BF) χρησιμοποιώντας το σύνολο των μη-περιττές SNPs για την εξάλειψη των SNPs απίθανο να σχετίζεται με το πολυπαραγοντικό μοντέλο λογιστικής παλινδρόμησης. Wilson et al. [17] δείχνουν ότι η οθόνη που ακολουθείται από την πολυμεταβλητή ανάλυση προσαρμοσμένη από MISA παρέχει αυξημένη δύναμη για την ανίχνευση ενώσεων πάνω από την οριακή ανάλυση και μόνο, με ελάχιστη αύξηση των ψευδών θετικών ποσοστών. Δείχνουν ότι MISA έχει επίσης πολύ καλύτερη ισχύ από τυποποιημένες μεθόδους πολλαπλής προσαρμογής σύγκριση και ψευδείς διαδικασίες ρυθμό ανακάλυψης, σταδιακή λογιστικής παλινδρόμησης ή το λάσο.

MISA χρησιμοποιεί μια προηγούμενη διανομή πάνω παραμέτρων του μοντέλου βαθμονομηθεί για μικρές και μέτρια μεγέθη αποτέλεσμα και ένας βήτα-διωνυμική κατανομή πριν από τον αριθμό των SNPs που περιλαμβάνονται σε ένα μοντέλο. Η τελευταία κατανομή προκαλεί μια πολλαπλότητα διόρθωση καθορίζοντας μια παγκόσμια προηγούμενη απόδοση της ένωσης η οποία είναι ανεξάρτητη από τον αριθμό των SNPs ή γονιδίων στην ανάλυση. παραμέτρους του,

α = 1/8

και

b = S

(ο αριθμός των SNPs στη φάση μοντέλο αναζήτησης), επιλέχθηκαν με βάση τα αποτελέσματα ενός πειράματος προσομοίωσης για να επιτευχθεί μια επιθυμητή ισορροπία μεταξύ ψευδώς θετικά και ψευδώς αρνητικά ποσοστά. Περισσότερες λεπτομέρειες σχετικά με τις στατιστικές μεθόδους που χρησιμοποιούνται σε αυτή την ανάλυση μπορεί να βρεθεί στο Wilson et al. [17] (Κείμενο S1).

Μπεϋζιανή Συμπερασματολογία.

Τόσο η οριακή και πολυπαραγοντικές αναλύσεις χρησιμοποιούν παράγοντες Bayes (BFS) για τη μέτρηση της αποδεικτικά στοιχεία υπέρ (ή κατά) ένωση. Το BF είναι ισοδύναμα μια γενικευμένη λόγο πιθανότητας και μια αναλογία πιθανοτήτων. Στην πρώτη χαρακτηρισμό είναι ο λόγος της πιθανότητας των δεδομένων σύμφωνα με ένα μοντέλο (π.χ. ένα μοντέλο της γενετικής σύνδεσης) στον άλλο (π.χ. ένα μοντέλο χωρίς γενετική συσχέτιση). Αντί να λάβει το λόγο των μοντέλων δειγματοληψία στο πλαίσιο κάθε υπόθεση αξιολογείται σε πιθανότερη τιμή παραμέτρου (MLE) καθενός όπως στο παράδειγμα Frequentist, ο BF είναι ο λόγος της δειγματοληψίας μοντέλων κατά μέσο όρο για τις αντίστοιχες πριν κατανομές τους σχετικά με τις παραμέτρους του μοντέλου. Στην τελευταία χαρακτηρισμό, BFS ορίζονται ως ο λόγος των οπίσθιων πιθανότητες μιας υπόθεσης (ή μοντέλο) του συνεταιρίζεσθαι των προηγούμενων αποδόσεων (π /(1- π)) της εν λόγω υπόθεσης και, ως εκ τούτου, τη μέτρηση του βαθμού στον οποίο η στοιχεία

ενημέρωση

τις αποδόσεις της εν λόγω υπόθεσης της ένωσης [25], [26], [27]? με BF 10, τα οπίσθια πιθανότητες ενός συλλόγου είναι 10 φορές μεγαλύτερο από ό, τι τις προηγούμενες αποδόσεις. Σύμφωνα με μια ευρέως χρησιμοποιούμενη κλίμακα των αποδεικτικών στοιχείων [28], BFS μεταξύ 1.0 και 3.2 είναι «ασθενώς υποστηρικτική», εκείνες μεταξύ 3.2 και 10 είναι «υποστηρικτική», εκείνες μεταξύ 10 και 30 είναι «έντονα υποστηρικτική», εκείνες μεταξύ 30 και 100 ‘ πολύ ισχυρή »και εκείνων άνω των 100 είναι« αποφασιστικής σημασίας »για την υποστήριξη του συνεταιρίζεσθαι (έχουμε αλλάξει τα ονόματα πολλών από αυτές τις κατηγορίες, αλλά όχι την ερμηνεία τους). Ένα BF χωρίς σύνδεση είναι απλά το αντίστροφο του BF για μια ένωση, έτσι σε αντίθεση με τιμές p BFS μπορεί να παρέχει ένα μέτρο στήριξης υπέρ της μηδενικής υπόθεσης. BFS μπορεί να μετατραπεί σε οπίσθιο πιθανοτήτων (PO = BF χ π /(1- π)), και σε οπίσθια πιθανότητες του συνεταιρίζεσθαι (PPA = PO /(1+ PO)) για να παρέχουν ένα «απόλυτο» μέτρο των αποδείξεων της ένωσης [ ,,,0],18]. Τα οπίσθια πιθανότητες μπορεί να χρησιμοποιηθεί ως μέρος μιας ανάλυσης απόφαση να καθορίσει ποια SNPs να συνεχίσει περαιτέρω. Κατώτατο όριο του 0,5 για τον ΟΛΠ, υποθέτει ότι ψευδώς θετικά έχουν το ίδιο κόστος όπως ψευδώς αρνητικά αποτελέσματα. Για προκαταρκτικές μελέτες, ένα κατώτερο όριο μπορεί να είναι πιο κατάλληλη.

Λείπουν δεδομένα.

Δεν υπήρχαν λείπει μεταβλητές σχεδιασμού. Χρησιμοποιήσαμε fastPHASE [26] να δημιουργήσει 100 καταλογισμοί των ελλειπόντων στοιχείων γονότυπο δεδομένων των παρατηρηθεί, unphased δεδομένων γονότυπο. οριακή BFS της οθόνης υπολογίστηκαν ως ο απλός μέσος όρος των BFS για κάθε ένα από τα 100 τεκμαρτό σύνολα δεδομένων. Συγκρίναμε αυτές BFS με εκείνες που υπολογίζονται με ένα ενιαίο σύνολο δεδομένων στο οποίο τα ελλείποντα γονότυπους αντικαταστάθηκαν από τροπική αξία τους προσδιορίζεται από τις 100 καταλογισμοί. Τα δύο σύνολα BFS είχε συσχέτισης 0,998. Για το λόγο αυτό και επειδή οι υπολογισμοί εκσυγχρονιστεί σε μεγάλο βαθμό, θα χρησιμοποιείται ένα ενιαίο σύνολο δεδομένων με «τροπική γέμισμα-ins» για την ανάλυση MISA.

διαδικασία υπολογισμού των τεκμαρτών μας υποθέτει ότι λείπει γονότυπους SNP είναι ignorable, δηλαδή είτε λείπουν εντελώς τυχαία (το οποίο πρόκει- ται) ή λείπουν τυχαία (MAR). Χρησιμοποιήσαμε το οριακό λογισμικό BF για να ελέγξετε αυτή την υπόθεση ερευνώντας αν μοτίβο ενός SNP της missingness ήταν υπό όρους ανεξάρτητα από την κατάσταση case-control, δεδομένης της παρατηρούμενης δεδομένα που έχουμε για την εξήγηση missingness. Οι μεταβλητές σχεδιασμού σε αυτή την ανάλυση ήταν τα ίδια όπως χρησιμοποιούνται στην οθόνη και στη MISA. Για τους σκοπούς του εν λόγω υπολογισμού, χρησιμοποιήσαμε το δείκτη 0-1 για missingness SNPs στη θέση των δεδομένων γονότυπο του και υπολογίζεται BFS σύνδεσης του εν λόγω δείκτη για την κατάσταση περίπτωση ελέγχου σύμφωνα με το μοντέλο log-πρόσθετο για SNPs με πέντε ή περισσότερες τιμές που λείπουν (60 SNPs)

Οι μεταβλητές σχεδιασμού

Η λογιστική ανάλυση παλινδρόμησης της κατάστασης ασθενών-μαρτύρων σε παρτίδα και GC50PCT έδειξε μια ισχυρή επίδραση παρτίδα (p & lt? 10ε

-7).., κυρίως οδικών από την άνιση κατανομή των υποθέσεων και των ελέγχων σε παρτίδα τέσσερις και αλληλεπίδραση παρτίδα-GC50PCT (p = 0.02). Με βάση αυτή την ανάλυση, θα περιλαμβάνουν παρτίδα, GC50PCT, την αλληλεπίδραση μεταξύ των παρτίδων και GC50PCT σε όλα τα μοντέλα σύνδεσης μαζί με την ηλικία.

απλότυπος ανάλυση.

Ενώσεις με μία ή περισσότερες SNPs σε ένα γονίδιο μπορεί να συμβεί όταν οι εν λόγω παραλλαγές επισημάνετε ένα απλότυπος κίνδυνο. Χρησιμοποιήσαμε Haploview 4.1 για τη διεξαγωγή δοκιμών σύνδεσης απλότυπος να διαπιστωθεί αν αυτό θα μπορούσε να συμβαίνει στα γονίδια που περιέχουν την πιο υψηλή συνδεδεμένων SNPs.

Αποτελέσματα

NCOCS υποψήφια DNA Γονιδιακή Επισκευή Ανάλυση

στην οριακή ανάλυση SNP-σε-ένα-χρόνο των 484 μη απολυμένους SNPs που περνά τον έλεγχο της ποιότητας, S = 77 SNPs περάσει το οριακό οθόνη (μέγιστη οριακή BF & gt? 1,0). (Τα αποτελέσματα της φάσης ανάλυσης διαλογής, συμπεριλαμβανομένων μέση περίεργο αναλογίες (ΕΑΠ), το 95% αξιόπιστη διαστήματα (ΠΙ) και MAFs για όλα τα 484 SNPs που φαίνονται στον Πίνακα S2.) Τρέξαμε MISA χρησιμοποιώντας τα 77 SNPs που πέρασαν από την οθόνη με παραμέτρους

a = 1/8

και

S = 77

, η οποία οδηγεί σε οριακό πριν πιθανότητες του συνεταιρίζεσθαι σε αυτό το υποσύνολο 1 /AXS = 0,0016. Ο Πίνακας 1 παραθέτει τα SNP ειδικής BFS για τις 41 SNPs σε 25 γονίδια που είχαν μια MISA BF & gt? 1,0. Ο πίνακας αναφέρει επίσης το πιο πιθανό γενετικό μοντέλο για κάθε SNP, το οπίσθιο πιθανότητα ότι το μοντέλο και η διάμεση ΕΑΠ και 95% τις εκτιμήσεις CI.

Η

Από αυτά τα 41 SNPs, έξι SNPs σε τέσσερα γονίδια (

CHEK2

,

TP53

,

BACH1

και

LIG4

) έχουν MISA BF & gt? 10 παρέχει στοιχεία για μια συσχέτιση μεταξύ αυτών των SNPs και του καρκίνου των ωοθηκών. Αυτά είναι rs5762746 (BF = 28.940) και rs6005835 (BF = 28.028) σε

CHEK2

, rs2078486 (BF = 19.604) και rs12951053 (BF = 14.062) σε

TP53

, rs411697 (BF = 15.909) στο

BACH1

και rs10131 (BF = 10.864) σε

LIG4

. Δεκατέσσερις SNPs σε επτά γονίδια, συμπεριλαμβανομένων

GADD45B

,

MSH3

,

MSH6

,

NBS1

,

RAD52

,

TP53

,

και XRCC5

είχε BFS κυμαίνονται 3,39 – 9,09, με οπίσθιο πιθανότητες που είναι 3,39 έως 9,09 φορές μεγαλύτερο από ό, τι τις προηγούμενες αποδόσεις. Οι Παράγοντες SNP ειδικά Bayes είναι σύνθετα μέτρα που κατά μέσο όρο πάνω από στατιστικά μοντέλα του συλλόγου που περιλαμβάνουν ότι SNP, ενώ την προσαρμογή για άλλους που πιθανόν να σχετίζονται SNPs και τη γενετική παραμετροποιήσεις τους. Ως εκ τούτου, αντιπροσωπεύουν ρητά για την αβεβαιότητα στην προδιαγραφή της στατιστικό μοντέλο του συνεταιρίζεσθαι

Το σχήμα 1 συνοψίζει τις ενώσεις των 20 SNPs με MISA BF & gt?. 3.2. Το οικόπεδο αυτό συνοψίζει τα 100 κορυφαία μοντέλα επιλέγονται βάσει της οπίσθιας μοντέλο πιθανοτήτων τους. Τα μοντέλα παραγγείλει στον χ-άξονα κατά φθίνουσα πιθανότητα και το πλάτος της στήλης που σχετίζεται με ένα μοντέλο είναι ανάλογη με εκείνη πιθανότητα. SNPs εκπροσωπούνται στο y-άξονα. Παρουσία ενός SNP σε ένα μοντέλο υποδεικνύεται από ένα έγχρωμο μπλοκ στη διασταύρωση της στήλης του μοντέλου και σειράς του SNP του. Το χρώμα του μπλοκ δείχνει την γενετική παραμετροποίηση του SNP στο συγκεκριμένο μοντέλο: το μωβ για log-πρόσθετο, μπλε για υπολειπόμενο και κόκκινο για κυρίαρχη. Ένα μοτίβο σκακιέρας, σε αντίθεση με ένα μοτίβο της ισχυρής κάθετες λωρίδες δείχνει ουσιαστική μοντέλο αβεβαιότητα. Εβδομήντα οκτώ από τα 100 κορυφαία μοντέλα που απεικονίζεται στο Σχήμα 1, συμπεριλαμβανομένων των κορυφαίων 48 μοντέλα, περιλαμβάνουν μόνο μία απλή SNP εκτός από τις μεταβλητές σχεδιασμού. Μόνο 22 από τα 100 κορυφαία μοντέλα περιλαμβάνονται δύο SNPs και κανένας από αυτούς δεν περιλαμβάνονται περισσότερα από δύο. Το κορυφαίο μοντέλο περιλαμβάνει μόνο το αρχείο καταγραφής-προσθετικό γενετικό παραμετροποίηση του rs6005835 στο

CHEK2

με μια εκτίμηση Μέγιστη A Priori (MAP) του OR 0,70. Ο δεύτερος κατετάγη δείγμα μοντέλο αποτελείται από το log-προσθετικό γενετικό παραμετροποίηση του rs5762746 στο

CHEK2

με ένα χάρτη ή 0,73. SNPs rs6005835 και rs5762746 στο

CHEK2

έχουν μια μέτρια LD, μετρούμενη ως r

2 0.5.

Ατομική SNPs εκπροσωπούνται στο y-άξονα με ετικέτες που φέρουν το γονίδιο και RS αριθμό για το SNP και διέταξε, βάσει του Συντελεστή Bayes υπέρ του συνεταιρίζεσθαι SNP, τα οποία δίνονται στον y-άξονα στη δεξιά πλευρά του οικοπέδου. Η παρουσία ενός SNP σε ένα μοντέλο υποδεικνύεται από ένα έγχρωμο μπλοκ στη διασταύρωση της στήλης του μοντέλου και σειράς του SNP, ενώ το χρώμα του μπλοκ υποδεικνύει την παραμετροποίηση του SNP: πορφυρό για log-πρόσθετο, μπλε για υπολειπόμενο και κόκκινο για την κυρίαρχη.

η

μοντέλα που ενσωματώνουν πολλαπλές SNPs αντιπροσωπεύουν 22 από τις 100 κορυφαία μοντέλα από τον αριθμό, αλλά μόνο το 7,8% των συνολικών οπίσθια μάζα τους. Η χαμηλή σχετική στάθμιση αυτής της κατηγορίας των μοντέλων είναι σε μεγάλο βαθμό αποτέλεσμα της ισχυρής διόρθωσης πολλαπλότητα MISA που ελέγχει το ποσοστό ψευδώς θετικών που σχετίζονται με τις κλήσεις που γίνονται στη βάση των SNP-ειδικών BFS. Η υψηλότερη κατάταξη multi-SNP μοντέλο (rank = 49) περιλαμβάνει rs5762746 CHEK2 και rs2078486 TP53. Αυτές οι παραλλαγές είναι συμπληρωματικές παράγοντες πρόβλεψης, κάθε εξηγώντας όσο μεταβλητότητα σε κατάσταση-μαρτύρων όταν μοντελοποιούνται μόνο του, όπως όταν διαμορφώνεται με την παρουσία του άλλου. Αυτό υποδηλώνει ότι SNPs από πολλαπλά γονίδια που σχετίζονται με την επισκευή βλάβης του DNA παρέχουν συμπληρωματικές πληροφορίες για τον χαρακτηρισμό του κινδύνου καρκίνου των ωοθηκών.

απλότυπος ανάλυση.

Ένα Haploview [29] ανάλυση των CHEK2, TP53, BACH1 και LIG4 , που περιέχει τις έξι πρώτες SNPs, δεν έδειξε στοιχεία για multi-SNP (απλότυπος-based) γονότυπους κινδύνου.

Ανάλυση των δεδομένων που λείπουν.

από τους 60 SNPs με περισσότερα από 4 λείπει γονότυπους SNP , μόνο έξι είχαν BFS & gt? 1.0 για την εξάρτηση από όρους του καθεστώτος case-control για missingness δεδομένων των μεταβλητών σχεδιασμού. Τέσσερα από αυτά τα BFS ήταν στην περιοχή από 1,01 να 1,49 και δεν αφορούν. Τα υπόλοιπα δύο, rs11571789 στο BRCA2 (BF = 3.80) και rs1805794 στο NBS1 (BF = 4.60), ήταν «υποστηρικτική» του συνεταιρίζεσθαι. Αυτά μπορεί να οφείλεται είτε στην τύχη ή στην παρουσία ενός μη μετρήσιμους παράγοντας σύγχυσης και αντικατοπτρίζουν ένα μοτίβο μη ignorable missingness. Λείπει καταλογισμοί δεδομένα που αγνοούν τη δυνατότητα των πολυμορφισμών χαμηλής συχνότητας τα οποία παρεμβαίνουν με την ικανότητα να δοκιμασία έναν ανιχνευτή που δεν θα αντιπροσωπεύουν το LD μεταξύ του σπάνια σχετίζεται παραλλαγή και το SNP με ελλιπείς τιμές. Το τελικό αποτέλεσμα κατά την τοποθέτηση των μοντέλων σύνδεσης για αυτόν τον SNP θα είναι για την προφανή επίδραση SNPs να είναι μεροληπτική. μέγιστη οριακή BF BRCA2 rs11571789 για συσχέτιση με καρκίνο των ωοθηκών ήταν 0,26 ( «υποστηρικτικές» καμία ένωση) και δεν συμπεριλήφθηκε στην ανάλυση MISA. μέγιστη οριακή BF rs1805794 του NBS1 ήταν 1,76 και MISA BF της ήταν 3,82. Αυτή η μικρή αποδεικτικά στοιχεία υπέρ του συνεταιρίζεσθαι πρέπει να ερμηνεύεται υπό το πρίσμα των δυνατοτήτων για το σκοπό αυτό να έχει ανατραπεί.

Συζήτηση

Τα αποτελέσματα αυτής της μελέτης παρέχουν στοιχεία για μια συσχέτιση μεταξύ αρκετών γονιδίων σε η επιδιόρθωση του DNA και τις οδούς απόκριση και κίνδυνο διηθητικού ορώδες καρκίνου των ωοθηκών. Υπήρξε ισχυρή στήριξη για τις ενώσεις μεταξύ καρκίνου των ωοθηκών και δύο SNPs σε

CHEK2

, δύο SNPs σε

TP53

,

και

ένα SNP καθένα σε

BACH1

,

και LIG4

. Οι αναλύσεις μας είναι επίσης υποστηρικτική των ενώσεων μεταξύ τεσσάρων SNPs στο

NBS1

, τρία SNPs στο

MSH3

, τρία SNPs στο

RAD52

, και ένα SNP καθένα στο

GADD45B

,

MSH6

,

TP53

,

και XRCC5

και επεμβατική ορώδες καρκίνο των ωοθηκών. Για τις γνώσεις μας, αυτή είναι η πρώτη μελέτη που υποδηλώνει συσχέτιση μεταξύ καρκίνου των ωοθηκών και SNPs στο

CHEK2

,

BACH1

,

XRCC5

,

NBS1

,

MSH6

,

RAD52

,

και GADD45B

. . Όπως συζητείται παρακάτω, υπάρχουν ενδείξεις ότι πολλές από τις πλέον συνδεδεμένες SNPs μπορεί να έχει λειτουργική σημασία

Χρησιμοποιήσαμε SNPInfo ανάλυση [30] για να καθορίσει εάν κάποια από τις έξι SNPs με MISA BF & gt? 10 ήταν σε LD με ένα υποθετικό λειτουργική παραλλαγή ή προβλέπεται να έχουν λειτουργική σημασία. Εξετάσαμε κάθε HapMap SNP με LD 0.5 ή νεότερη έκδοση σε ένα από τα έξι κορυφαία SNPs. Πίνακας S3 αναφέρει κατά πόσον η παραλλαγή αναμένεται να επηρεάσει ένα δεσμευτικό παράγοντα μεταγραφής περιοχή, μια περιοχή ματίσματος, μία θέση πρόσδεσης miRNA ή να τροποποιήσει τη δομή ενός προϊόντος πρωτεΐνης. Επιπλέον, υποδεικνύει εάν ο SNP είναι ένα μη-συνώνυμη ή ανοησία παραλλαγής και εκθέσεις ρυθμιστική δυναμικού και αλληλουχία βαθμολογίες διατήρησής του. Με βάση αυτή την ανάλυση, οι δύο rs10131 στο

LIG4

και rs9587535 στο ABHD13, ένα SNP σε υψηλή LD με rs10131 (LD = 0822) οι προβλεπόμενες από Miranda [31] για να επηρεάσει μια θέση πρόσδεσης miRNA. Επιπλέον, rs10131 έχει υψηλή προβλεπόμενη βαθμολογία συντήρηση αλληλουχίας (για μια μη κωδικοποιητική παραλλαγή). Δύο άλλα

LIG4

LD SNPs (rs1931336 και rs9587535 με LD 0,59 και 0,82 με rs10131, αντίστοιχα) έχουν επίσης αυτή την ιδιότητα. Αρκετές παραλλαγές σε ασθενή LD (0,5 & lt? LD & lt? 0,7) με

Τα TP53

rs12951053 προβλέπεται να επηρεάσει ένα δεσμευτικό παράγοντα μεταγραφής site? ένα από αυτά (rs17882227) είναι σε τέλεια LD με

TP53

rs2078486, ένα από τα πιο ιδιαίτερα συνδεδεμένες SNPs. Επιπλέον, rs2287498 στο

WDR79

(σε τέλεια LD με rs2078486 και LD (R

2 = 0,62) με rs12951053) προβλέπεται να επηρεάσει τη λειτουργία του σε μια θέση ματίσματος και ένα μη-συνώνυμη παραλλαγή (rs2287499 ) στο

WDR79

σε ασθενή LD με τα δύο πιο πολύ σχετίζεται

TP53

SNPs προβλέπεται από PolyPhen [32] να είναι καλοήθεις. Αρκετά από τα μη-κωδικοποίησης

TP53

παραλλαγές έχουν υψηλή ρυθμιστική δυναμικό ή /και τα αποτελέσματα της διατήρησης ακολουθία? αυτών rs17882227 είναι στο υψηλότερο LD (1.0) με ένα κορυφαίο υποψήφιο (rs2078486). SNP rs388707 σε LD με

BACH1

rs411697 αναμένεται να επηρεάσει το μάτισμα, ενώ ένα άλλο SNP (rs425989) σε LD με rs411697 προβλέπεται από Miranda να επηρεάσει μια θέση πρόσδεσης miRNA. Επιπλέον, τρεις ιντρονικές SNPs στο LD με μας

BACH1

υποψήφιος έχουν βαθμολογίες συντήρηση αλληλουχίας μεγαλύτερη από 0,1, υποδεικνύοντας ότι μπορεί να είναι λειτουργικά ενδιαφέρουσα. Αρκετές παραλλαγές μέσα και κοντά στο

CHEK2

αποδεικνύουν τη δυνατότητα να επηρεάσουν τη λειτουργία.

You must be logged into post a comment.