PLoS One: ανίχνευση του καρκίνου του Gene Δίκτυα χαρακτηρίζεται από επαναλαμβανόμενες Γονιδιωματική Μεταβολές σε έναν πληθυσμό


Αφηρημένο

υψηλής ανάλυσης, χαρακτηρισμούς για ολόκληρο το σύστημα έχει αποδείξει την ικανότητα να εντοπίσει περιοχές του γονιδιώματος που υποβάλλονται σε γονιδιωματική εκτροπές. Τέτοιες ερευνητικές προσπάθειες συχνά στοχεύουν στην σύνδεση των περιοχών αυτών με την αιτιολογία της νόσου και την έκβαση. Ο εντοπισμός των αντίστοιχων βιολογικές διεργασίες που είναι υπεύθυνες για τη νόσο και την έκβασή της παραμένει προκλητική. Χρησιμοποιώντας νέες μεθόδους αναλυτικής που χρησιμοποιούν τη δομή των βιολογικών δικτύων, είμαστε σε θέση να προσδιορίσει τα συγκεκριμένα δίκτυα που είναι ιδιαίτερα σημαντικά, nonrandomly μεταβληθεί από περιοχές της ενίσχυσης του αριθμού αντιγράφων που παρατηρούνται σε μια ανάλυση των συστημάτων κλίμακα. Έχουμε αποδείξει αυτή τη μέθοδο για τον καρκίνο του μαστού, όπου η κατάσταση ενός υποσυνόλου των οδούς που εντοπίστηκαν μέσα από αυτές τις περιοχές φαίνεται να είναι ιδιαίτερα σχετίζεται με την επιβίωση της νόσου και στην επανάληψη

Παράθεση:. Efroni S, Ben-Hamo R, Edmonson M, Greenblum S, Schaefer CF, Buetow KH (2011) ανίχνευση του καρκίνου του Gene Δίκτυα χαρακτηρίζεται από επαναλαμβανόμενες Γονιδιωματική Μεταβολές σε έναν πληθυσμό. PLoS ONE 6 (1): e14437. doi: 10.1371 /journal.pone.0014437

Επιμέλεια: Toshi Σιόντα, Γενικό Νοσοκομείο της Μασαχουσέτης, Ηνωμένες Πολιτείες της Αμερικής

Ελήφθη: 17 Ιούν 2010? Αποδεκτές: 8 Οκτωβρίου του 2010? Δημοσιεύθηκε: 4 Ιανουαρίου, 2011

Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της δήλωσης Creative Commons Public Domain που ορίζει ότι, μόλις τοποθετηθεί στο δημόσιο τομέα, το έργο αυτό μπορεί να αναπαραχθεί ελεύθερα, διανεμηθεί, μεταδοθεί, τροποποιηθεί, χτισμένο πάνω, ή ειδάλλως να χρησιμοποιηθεί από οποιονδήποτε για οποιονδήποτε νόμιμο σκοπό

Χρηματοδότηση:. SE χρηματοδοτείται από την Ευρωπαϊκή Ένωση μέσω του προγράμματος διεθνείς υποτροφίες επανένταξης (IRG). Οι χρηματοδότες δεν είχε κανένα ρόλο στο σχεδιασμό της μελέτης, τη συλλογή και ανάλυση των δεδομένων, η απόφαση για τη δημοσίευση, ή την προετοιμασία του χειρογράφου

Αντικρουόμενα συμφέροντα:.. Οι συγγραφείς έχουν δηλώσει ότι δεν υπάρχουν ανταγωνιστικά συμφέροντα

Εισαγωγή

Βιολογικός φαινότυποι προκύπτουν ως συνέπεια των γονιδίων που αλληλεπιδρούν μέσω πολύπλοκων δικτύων. Ογκογένεση έχει αποδειχθεί ότι εξαρτάται από βιολογική δίκτυα που ελέγχουν τις διαδικασίες όπως απόπτωση, γήρανση, πολλαπλασιασμό και την αγγειογένεση [1], [2]. Ωστόσο, είναι σαφές ότι η τρέχουσα γνώση των οποίων επεξεργάζεται επίδραση διαφορετικών φαινοτύπων του καρκίνου είναι ατελής. Αυτό ισχύει ιδιαίτερα όταν πρόκειται για την κατανόηση των διαδικασιών που σχετίζονται με την έκβαση της νόσου.

Μια σύνθετη συλλογή γονιδιωματικού μεταβολές συμβαίνουν κατά τη διάρκεια της εξέλιξης των καρκινικών κυττάρων, συμπεριλαμβανομένων των μεταλλάξεων, μεταθέσεις, και τον αριθμό αντιτύπου αλλοιώσεις. Για παράδειγμα, το γονιδίωμα-ευρεία ανάλυση των όγκων του μαστού με πολυάριθμες τεχνικές έχουν αναπαραγώγιμα απέδειξαν επαναλαμβανόμενα μοτίβα του αριθμού αντιγράφων αλλοίωση (CNA) [3], [4], [5], [6], [7], [8], [ ,,,0],9], [10], [11]. Η έκφραση των γονιδίων μέσα σε αυτά τα μεταβληθεί τμήματα έχει αποδειχθεί ότι συσχετίζεται με τον αριθμό αντιγράφου κατάσταση της περιοχής [3], [9], [12], [13], [14], [15], [16], [17], [18], [19]. Ωστόσο, δεν είναι σαφές αν αυτές οι επαναλαμβανόμενες μοτίβα αποτελούν το σημαντικότερο σύνολο προσαρμογείς CNA ή αντιπροσωπεύουν μόνο ένα υποσύνολο των βασικών περιοχών.

Μοτίβα του αριθμού αντιγράφων αλλοίωση έχουν αποδειχθεί πολύτιμες για την ταξινόμηση των υποτύπων καρκίνου και μπορεί να χρησιμεύσει ως προάγγελοι της έκβαση των ασθενών [19]. Αυτές οι αλλαγές στοχεύουν τα γονίδια που επηρεάζουν τα δίκτυα που παρέχουν στους όγκους με ένα εκλεκτικό πλεονέκτημα σε σχέση με τα κύτταρα των φυσιολογικών σύνθεσης. Λαμβάνοντας υπόψη τη σχέση τους με αποτέλεσμα, είναι πιθανό επίσης να επηρεάσουν τις διαδικασίες που οδηγούν κλινικών φαινοτύπων και την ανταπόκριση στις παρεμβάσεις.

Ο εντοπισμός των διεργασιών που καλύπτεται από τις περιοχές που προσδιορίζονται μέσω της ανάλυσης σε ολόκληρο το σύστημα είναι πολύπλοκο. Για παράδειγμα, ο αριθμός αντιτύπων αναλλοίωτα περιοχές περιέχουν μεγάλο αριθμό γονιδίων. Υπάρχει επίσης ένα τεράστιο βαθμό μεταξύ των ατόμων ετερογένεια στην απογραφή των περιοχών που βρέθηκαν να τροποποιηθεί.

Οι εργασίες από τους άλλους να προσδιορίσει τις διαδικασίες που διέπουν πολύπλοκα χαρακτηριστικά έχει συνδυάσει κληρονομήσει παραλλαγές και ανάλυση του δικτύου για να χαρτογραφήσει πολυπαραγοντική, ετερογενή φαινοτύπους της νόσου [20]. Σε αυτή την εργασία, οι συγγραφείς επεκτείνουν τις παραδοσιακές προσεγγίσεις χαρτογράφηση γονιδίων με τη συμπερίληψη υποτιθέμενο αλληλεπιδράσεις γονιδίων για την αντιμετώπιση της ετερογένειας. Άλλοι έχουν εξετάσει πολυδιάστατα σύνολα δεδομένων που περιλαμβάνουν διαφορετικές μετρήσεις γονιδίωμα κλίμακας ταυτοχρόνως στο πλαίσιο των οδών [21], [22], [23] .. Ισχύουν στατιστική μέθοδος για τη μέτρηση εμπλουτισμού οδό και να χρησιμοποιήσει τα δεδομένα γονιδιακής έκφρασης για την αξιολόγηση της μεταβολής μονοπάτι δραστηριότητα. Μέσα από τέτοιες αναλύσεις που υποθέτουν νέες λειτουργίες των κυττάρων.

Στην εργασία παρουσιάζονται εδώ, μπορούμε να συγχαρώ και να επεκτείνει αυτές τις προσεγγίσεις για να αναλύσει συστηματικά σωματικά CNAs να εντοπίσει βιολογικό δίκτυα που στηρίζουν φαινοτύπων του καρκίνου. Έχουμε αποδείξει την μέθοδο που χρησιμοποιεί το σετ δεδομένων του καρκίνου του μαστού του Chin et al [24]. Εντοπίζουμε αλλαγμένη οδών διαφορικά στοχευμένες με βάση τον αριθμό αντιγράφων εκτροπών.

Παρόμοια με προηγούμενες προσεγγίσεις, μπορούμε addresse την ετερογένεια των προτύπων, αναγνωρίζοντας ότι οι διαφορετικές μορφές του ΚΥΠΕ μπορεί να αντιπροσωπεύουν εναλλακτικές διαδρομές που μπορούν να λάβουν τα καρκινικά κύτταρα για να αλλάξει το ίδιο σύνολο βασικών των κοινών βιολογικών διεργασιών. Η φαινόμενη ετερογένεια στην τοποθεσία χάρτη που σχετίζεται με CNAs μπορεί να αντικατοπτρίζει απλώς το γεγονός ότι τα γονίδια που περιλαμβάνει ένα δεδομένο δίκτυο κατανέμεται σε όλο το γονιδίωμα. Ως εκ τούτου, ελέγξτε αν οι επιμέρους κανονικών μονοπατιών είναι μη-τυχαία απευθύνονται σε όλες τις περιφέρειες της αλλαγής του αριθμού αντιγράφων. Σε αντίθεση με προηγούμενες προσεγγίσεις, έχουμε μόχλευση υπάρχουσα δομή του δικτύου, σε αντίθεση με de novo δημιουργία δικτύων. Η δομή της αλληλεπίδρασης του δικτύου για αυτά τα κανονικά δίκτυα στη συνέχεια μόχλευση για φαινοτύπους χαρτογράφησης. Χρησιμοποιούμε μεθόδους που περιγράφηκαν προηγουμένως [25], για να διαπιστωθεί αν αλλαγμένη κατάσταση της μη-τυχαία αλλάξει διαδικασίες μπορεί να προβλέψει το αποτέλεσμα του ασθενούς.

Αποτελέσματα

Chin et al. έχουν αναφερθεί στο παρελθόν αριθμό αντιγράφων του γονιδιώματος σε επίπεδο και την ανάλυση γονιδιακής έκφρασης από 145 πρωτογενείς όγκους του καρκίνου του μαστού [19]. Οι μεταβολές αυτές προσδιορίστηκαν χρησιμοποιώντας συστοιχία γονιδίωμα BAC CGH [26], [27], [28], [29] που αποτελείται από 2464 BACs επιλέγονται σε περίπου μέγα διαστήματα βάσης κατά μήκος του γονιδιώματος, όπως περιγράφεται προηγουμένως [26], [28]. Χρησιμοποιώντας αυτό το σύνολο δεδομένων και τη διαδικασία που περιγράφεται στο Υλικά και Μέθοδοι, το περιεχόμενο γονίδιο του κάθε τμήματος που περιγράφεται στο Chin et al. ταυτίστηκε.

Πληροφορίες για τη δομή Canonical δίκτυο βιολογικών και γονίδιο περιεχόμενο που προέρχονται από δημόσιες πηγές [30], [31], εξετάστηκαν [32] .A συνολικά 565 κανονικών μονοπατιών. Αυτά τα μονοπάτια αποτελούν συλλογές των αλληλεπιδράσεων που είναι υποσύνολα των μεγαλύτερων βιολογικών δικτύων επιμέλεια για να συλλάβει ειδικές λειτουργίες. Ως εκ τούτου, το περιεχόμενο γονίδιο τους δεν είναι μοναδική. Το περιεχόμενο γονίδιο αυτών των οδών κυμαίνεται δραματικά. Για παράδειγμα, καθώς το μονοπάτι «αποικοδόμηση του RAR και RXR από το πρωτεάσωμα [33]) περιέχει μόνο 2 γονίδια ενώ IL12 μονοπάτι σηματοδότησης» [34], [35], [36]) περιέχει 80.

για να ληφθεί υπόψη η ετερογένεια της εμπλοκής γονιδίου όταν ανάλυση πραγματοποιείται με τη χρήση ενός μοντέλου δικτύου ορίζουμε μια νέα στατιστική μέτρηση (που περιγράφεται στις εξισώσεις (2.5) και (2.6) στο Υλικά και Μέθοδοι). Σημασία για κάθε μονοπάτι κατά μήκος δειγμάτων εκτιμήθηκε χρησιμοποιώντας Omnibus του Fisher της [49] και προσαρμόζεται για πολλαπλές συγκρίσεις χρησιμοποιώντας τη μέθοδο ΒοηίεΓοηϊ.

Η εφαρμογή των μεθόδων με τα στοιχεία που παρέχονται από Chin et al., Εντοπίζουμε μονοπάτια στα οποία οι γονίδια μεταβληθεί από προσαρμογείς CNA είναι ιδιαίτερα σημαντικά υπερεκπροσωπούνται σε σύγκριση με τυχαία προσδοκίες (Πίνακας S1).

για να δείξει τις ποικίλες υπερ-εκπροσώπηση σχέδια για ένα δεδομένο δίκτυο παρουσιάζουμε τα γεγονότα CNA συνδέονται με την οδό «CDC25 και CHK1 «[37] (Εικόνα 1). Στο σχήμα, ενίσχυση γονιδίου συμβολίζεται μέσα από ένα μωβ πλατεία και διαγραφή του γονιδίου μέσω μαύρα τετράγωνα.

Μωβ ορθογώνια σημαίνει ενίσχυση του γονιδίου και μαύρα τετράγωνα σημαίνει διαγραφή. Κάθε στήλη αντιπροσωπεύει ένα τυχαία επιλεγμένο θέμα με συνολικά 18 άτομα. Κάθε σειρά αντιπροσωπεύει ένα διαφορετικό γονίδιο των γονιδίων οδού. Διάφορα θέματα στοχεύουν στην «CDC25 και CHK1″ μονοπάτι μέσα από εναλλασσόμενες γονιδιωματικής στρατηγικές. Η οδός ως μονάδα, ωστόσο, είναι στοχευμένη σε όλο τον πληθυσμό.

Η

Όπως Σχήμα 1 δείχνει, όχι μόνο γονίδιο εντός της οδού φαίνεται να είναι η διαφορική στόχος του CNA σε όλη δειγμάτων καρκίνου του μαστού 18 δείχνεται … ή όταν εξετάζεται σε όλα τα υπόλοιπα 127 άτομα στη μελέτη.

από την άλλη πλευρά, μπορούμε να δούμε ότι η οδός, ως μονάδα, απευθύνεται σχεδόν σε κάθε θέμα στον πίνακα (το σύνολο του πίνακα των θεμάτων για αυτή η οδός περιλαμβάνεται στον πίνακα S2). Σημειώστε, η μετρική (βλέπε Υλικά και Μέθοδοι) αντισταθμίζει το μέγεθος της οδού. Ως εκ τούτου, για να αποκτήσει ένα σημαντικό p-value, μεγαλύτερες πορείες πρέπει να συσσωρεύουν ένα μεγαλύτερο αριθμό ενισχύσεις γονιδίου ή διαγραφών.

επόμενο αξιολογήσει κατά πόσον τα δίκτυα προσδιορίζονται από υπερ-εκπροσώπηση των CNA συνδέονται με την έκβαση της νόσου. Χρησιμοποιώντας δραστηριότητα μονοπάτι και βαθμολογίες οδός συνέπειας [26], έχουμε συγκεντρωμένα τα άτομα ανάλογα με τις μετρήσεις μονοπάτι τους και εκτελείται ανάλυση επιβίωσης. Όταν διαστρωμάτωση των ασθενών σε δύο ομάδες, μπορούμε να βγάλουμε τις καμπύλες επιβίωσης και ελέγξτε για να δείτε αν το διαχωρισμό του πληθυσμού σε σημαντικό βαθμό (Σχήμα 2).

Αυτό το μονοπάτι, το οποίο έχει επισημανθεί με ιδιαίτερα σημαντική της p-value ως στόχο γονιδιωματική αλλαγές, είναι ιδιαίτερα σημαντική στην ικανότητά της να διαστρωμάτωση πρόγνωση των ασθενών. Η εικόνα δείχνει πόσο σημαντική γονιδιωματική αλλαγές δείχνουν τη σημασία ενός μονοπατιού ως εργαλείο διαστρωμάτωσης

Η

επανάληψη κατά την είσπραξη των εκατοντάδων των οδών, βρίσκουμε 29 μονοπάτια που πληρούν τα κριτήρια σημαντικότητας p & lt?. 0.05 (Πίνακας S3) . Ωστόσο, κατά την προσαρμογή για πολλαπλές δοκιμές με τη μέθοδο Bonferroni μόνο δύο πορείες σημαντικά στόχο γονιδιωματικής αλλαγές είναι επίσης ιδιαίτερα που σχετίζονται με την επιβίωση? »« Υποξική και ομοιόσταση του οξυγόνου ρύθμιση του HIF-1-άλφα »[38], [39], [40] και γλυκοζαμτνογλυκανών [διαιτητές] υποβάθμιση.

Μια εναλλακτική προσέγγιση για την προσαρμογή για πολλαπλές συγκρίσεις για την αξιολόγηση της σημασίας είναι για την επικύρωση ευρήματα αυτά τα μονοπάτια που δείχνουν οριακή σημασία σε ολόκληρη σύνολα δεδομένων. Δύο σύνολα δημόσια δεδομένα με τα δεδομένα της έκφρασης και την έκβαση της νόσου επιλέχθηκαν από τη βάση δεδομένων Omnibus γονιδιακής έκφρασης (https://www.ncbi.nlm.nih.gov/geo) [41] Το πρώτο σετ δεδομένων (GSE2990) [42] που περιλαμβάνονται 189 άτομα. Η δεύτερη (GSE3494) [43] που περιλαμβάνονται 251 άτομα. Η γονιδιακή έκφραση σε αμφότερες τις σειρές δεδομένων που χρησιμοποιούνται στην πλατφόρμα Affymetrix για προσδιορισμό της κατάστασης έκφρασης του γονιδίου. Από τους αρχικούς 29 οδούς παρατηρήθηκε ότι σχετίζονται με την επιβίωση σε Chin et al. [19], 8 παρατηρήθηκαν να είναι σημαντικές σε GSE2990 και 8 παρατηρήθηκαν να είναι σημαντική σε GSE3494. Ένα σύνολο από 4 πορείες παρατηρήθηκαν να είναι σημαντική σε όλα τα τρία σύνολα δεδομένων. Συμφωνία μεταξύ των συνόλων δεδομένων είναι περισσότερο από ό, τι θα αναμενόταν από την τύχη και μόνο. ​​

Συζήτηση

Τα παραπάνω αποτελέσματα δείχνουν ότι τα γονίδια στο ΚΥΠΕ στοχεύουν μη-τυχαία διαδικασίες σημαντικές για ογκογόνο κατάσταση. Στο έργο παρουσιάζονται εδώ, παρέχει ένα μέσο για την αντικειμενική αναγνώριση των βιολογικών διεργασιών που μπορεί να είναι ο στόχος αυτών των αλλαγών. Επιπλέον, τα μονοπάτια υπερεκπροσωπούνται σε αυτά τα τμήματα παρουσιάζουν διαφορές στη δραστηριότητα και τη συνέπεια που σχετίζεται με την έκβαση του καρκίνου.

Ο συνολικός αριθμός των οδών χαρακτηριστεί ως μη-τυχαία στοχευμένες είναι εντυπωσιακή. Μια πιθανή εξήγηση είναι η έλλειψη ανεξαρτησίας του περιεχομένου γονιδίου που σχετίζεται με κάθε οδό. Ιεραρχική συσταδοποίηση των οδών χρησιμοποιώντας την τιμή ρ που σχετίζεται με το μη-τυχαία στόχευση (Πίνακας S4) επιβεβαιώνουν ότι πορείες με συναφείς ονομασίες συνήθως σύμπλεγμα με υψηλή συσχέτιση (r & gt? 0.5, τα δεδομένα δεν παρουσιάζονται). Επιθεώρηση των p-τιμές μονοπάτι κατά μήκος των ατόμων παρουσιάζει τεράστιες διακυμάνσεις (Πίνακας S4). Αυτό υποδηλώνει διαφορετικές υποκείμενες μοριακών μηχανισμών ογκογένεσης οδήγηση. Δυστυχώς, καμία εμφανής από την ομαδοποίηση των ατόμων προκύπτει από την ανάλυση της πορείας ειδικά μεταβλητότητα.

ΚΥΠΕ έχουν προηγουμένως αποδειχθεί για να δείξει συσχέτιση με την έκβαση των ασθενών [44], [45], [46], [47] ). Στην Chin et al. [19] ατομικό αντίγραφο αριθμός μεταβάλλεται τμήματα έδειξε συσχέτιση με την επιβίωση και την ασθένεια υποτροπή, αλλά εκτελούνται άνισα. Όταν λαμβάνεται ως ένα σύνολο, βρήκαν ότι η αλλοίωση οποιουδήποτε από αυτά που χαρακτηρίζονται ως «επαναλαμβανόμενες αμπλικόνια» συνδέθηκε με μειωμένη διάρκεια επιβίωσης (p & lt? 0,04) και απομακρυσμένη υποτροπή (p & lt? 0,01).

Τα αποτελέσματα που προέκυψαν από την ανάλυση βάσει διαδρομής του ίδιου συνόλου δεδομένων παράγουν μια εντυπωσιακή βελτίωση και δείχνουν ότι οδοί μπορεί να αντιπροσωπεύει έναν καλύτερο τρόπο για την αξιολόγηση επαναλαμβανόμενες αλλαγές. Δύο πορείες δείχνουν μια πολύ σημαντική συσχέτιση στο Chin et al. μόνο και 4 μονοπάτια δείχνουν σημασία σε πολλαπλά σύνολα δεδομένων έκφρασης των δεδομένων. Λόγω της υψηλής διαστάσεων των δεδομένων συστημάτων κλίμακα, υπάρχει πάντα ο κίνδυνος της άνω εξαρτήματος. Ως εκ τούτου, τα αποτελέσματα από ένα άτομο μελέτης θα πρέπει να αντιμετωπίζεται με σκεπτικισμό. Ωστόσο, η σημαντική αντιστοιχία σε πολλαπλές παρέχει ανεξάρτητη επικύρωση.

Η αυξημένη επαναληψιμότητα και το μέγεθος της επίδρασης που συνδέονται με την κατάσταση της οδού σε σύγκριση με εκείνη που παρατηρήθηκε στην άμεση εξέταση των «επαναλαμβανόμενων» περιοχών μπορεί να αποδοθεί σε διάφορους παράγοντες. Σε ένα μηχανικό επίπεδο, η εξέταση των δεδομένων σε επίπεδο οδού επιτρέπει οι πληροφορίες από διαφορετικές περιοχές να ενσωματωθούν σε όλο το δίκτυο. Το γεγονός ότι κάθε δεδομένη επαναλαμβανόμενες περιοχή ενισχύεται δεν είναι πλέον η κρίσιμη πρόβλεψης. Αυτό που προκύπτει, αντίθετα, είναι η σημασία των συνόλων των αλλαγμένη περιφερειών των οποίων μεμονωμένα μέλη χτυπήσει διαφορετικά μέρη μιας στοχευμένης οδού. Πορείες προσυγκεντρωτικούς τις επιπτώσεις των πολλαπλών γονιδίων. Ως εκ τούτου, είναι δυνατόν να ανιχνεύσει αλληλεπιδράσεις πολυγονιδιακής που επηρεάζουν φαινοτύπων του καρκίνου, αλλά οι οποίες, εάν δεν συγκεντρώνονται σε ένα μονοπάτι, ενδέχεται να μην πληροί το κριτήριο της στατιστικής σημαντικότητας σε ένα μικρό σύνολο δεδομένων.

ΚΥΠΕ είναι μόνο ένας παράγοντας που θα μπορούσε να οδηγείτε συμμετοχή μονοπάτι στο φαινοτύπους. Πολλές άλλες γονιδιωματικές μηχανισμούς (π.χ. επιμέρους γονιδιακές μεταλλάξεις, επιγενετικές ενεργοποίηση /αποσιώπηση) μπορούν να επηρεάσουν την κατάσταση του μονοπατιού. Ως τέτοιες, οι οδοί που προσδιορίζονται εδώ αντιπροσωπεύουν μια υποομάδα αυτών που πιθανόν εμπλέκονται.

Εννοιολογικά, είναι πιθανό ότι, επειδή η οδός είναι η υποκείμενη μονάδα του φαινοτύπου, με έμφαση σε μονοπάτια αυξάνει σήματος και μειώνει το θόρυβο. Genomic μεταβολές που συσσωρεύονται κατά τη διάρκεια της ογκογένεσης και της εξέλιξης της νόσου εμφανίζονται τυχαία. Η παρατηρούμενη συνοχή πιθανόν προκύπτει επειδή ορισμένες διεργασίες πρέπει να τροποποιηθούν για να φθάσει στη δεδομένη φαινότυπο. Εμφανής γονιδιωματικής ετερογένεια, «θόρυβο», προκύπτει επειδή υπάρχουν πολλοί τρόποι για ένα μονοπάτι μπορεί να αλλάξει. Όλους αυτούς τους τρόπους είναι «σήμα» από την προοπτική ενός μονοπατιού.

Είναι δυνατόν να υποθέσουμε ότι η ανάλυση παρόμοια με εκείνα που εκτελούνται για τον αριθμό αντιγράφων μεταβολή οδού (παραπάνω) μπορεί να αποδειχθεί χρήσιμη για άλλες γονιδιώματος αναλύσεις όπως γονιδίωμα-ευρεία μεταλλάξεων οθόνες ή μελέτες σύνδεσης. Για παράδειγμα, τα πολύπλοκα τύπων μεταλλάξεων φαίνεται στα 1.672 γονίδια που χαρακτηρίζεται από το ανθρώπινο καρκίνο του μαστού και [48] είναι όλα παρατηρούνται να μεταλλάσσονται γονίδια σε μία ή περισσότερες από 6 κανονικών κατάσταση οδούς που εντοπίστηκαν από δεδομένα γονιδιακής έκφρασης τα οποία καθολικά διαφοροποιεί όγκου από κανονικές [25] . Ομοίως, συγκρότημα, χαμηλή μονές αναλογίες ενώσεις απλότυπος μοτίβα μπορεί να αντικατοπτρίζει ετερογενή διαδρομές για να αλλάξει κοινές οδούς. Οι παραπάνω παρατηρήσεις έχουν αρκετές πρακτικές συνέπειες κατά την εξέταση των στρατηγικών παρέμβασης της επόμενης γενιάς. Πρώτον, τα δίκτυα παρέχουν τη βάση για το σχεδιασμό συνδυαστικών θεραπειών. Η εξέταση των δικτύων, και των κρατών τους δραστηριότητα, παρέχει μια ορθολογική μέσα για τον προσδιορισμό συνδυασμό γονιδίων πρέπει να απευθύνονται προκειμένου να αλλάξει την κατάσταση των κρίσιμων κόμβων. Είναι επίσης ενδιαφέρον ότι δεν είναι όλες οι μεταβολές στις οδούς μέλη επηρεάζουν το αποτέλεσμα. Αυτή η παρατηρούμενη διαφορά στην επίδραση στο αποτέλεσμα, το οποίο μπορεί να αντανακλά το αποτέλεσμα των φυσικών πειραμάτων από τον όγκο, μπορεί επίσης να αποδειχθεί σημαντική στην ιεράρχηση ποια γονίδια και τις αλληλεπιδράσεις ενδέχεται να έχουν ως στόχο πιο παραγωγικά για τη βελτίωση της έκβασης.

Υλικά και Μέθοδοι

Χαρτογράφηση Εηίτεζ Gene στο Golden Path

βάση δεδομένων Entrez Gene NCBI περιέχει 36.470 ανθρώπινα εγγραφές, 25.441 από αυτούς περιγράφονται ως κωδικοποιεί την πρωτεΐνη. Για κάθε γονίδιο σε αυτό το σύνολο θα χρησιμοποιηθεί μια ποικιλία μεθόδων για να βρει θέση αλληλουχία του γονιδιώματος χρυσό μονοπάτι. Έκδοση (hg18) της βάσης δεδομένων γονιδίωμα περιέχει εκτενή σχόλια, τα οποία θα χρησιμοποιούνται, όπου είναι δυνατόν. Σε ορισμένες περιπτώσεις χρησιμοποιείται BLAT να βρούμε γονιδιωματικής θέσεις.

Οι θέσεις των γονιδίων περίπου 18.342 (~54%) σχολιάστηκαν άμεσα σε πίνακες refLink και refGene χρυσό μονοπάτι του. Ενώ αυτή είναι η πιο απλή αναφορά, αφήνει 18.128 γονίδια unmapped, 6.757 (~18.5%) από αυτούς που κωδικοποιεί την πρωτεΐνη.

Στις περιπτώσεις όπου η άμεση γονίδιο σχολιασμός δεν ήταν διαθέσιμο, ψάξαμε σχολιασμούς χρυσό μονοπάτι για το θέσεις των συνδεδεμένων αλληλουχίες από μια ποικιλία πηγών, που αναφέρονται παρακάτω κατά σειρά προτίμησης:

προσχωρήσεις mRNA από τον πίνακα «gene2accession» Εηίτεζ του Gene

διασταυρώνονται σε προσχωρήσεις από τη βάση δεδομένων HUGO

διασταυρώνονται σε προσχωρήσεις από τη βάση δεδομένων uniSTS

πρωτογενή αντιπροσωπευτική αλληλουχία από τη συναφή ομάδα UniGene

αλληλουχιών mRNA από σχετίζεται σύμπλεγμα UniGene

EST αλληλουχίες από σχετίζεται UniGene σύμπλεγμα

Προσχωρήσεις συγκεντρώθηκαν από κάθε μία από αυτές τις πηγές με τη σειρά του, και στη συνέχεια κοίταξε σε διάφορους πίνακες χρυσό μονοπάτι σχολιασμού (all_mrna, stsMap, clonePos και all_est). Ένα τοπικά ενσωματωμένο βάση δεδομένων του mRNA και των αποτελεσμάτων REFSEQ BLAT (συναρμολογούνται από τον Robert Clifford) επίσης αναζήτηση, παρέχοντας κάποια επιπλέον αγώνες. Οι προκύπτουσες γονιδιωματικής θέσεις των αλληλουχιών αναζήτησης συγκεντρώθηκαν, και έγινε αποδεκτή η θέση του γονιδίου, αν οι θέσεις μειώθηκαν μέσα σε μια περιοχή 3 mb (3 mb είναι κάπως αυθαίρετη αποκοπή με βάση το μεγαλύτερο παρατηρούμενο χαρτογράφηση γονιδίων refLink με βάση περίπου 2,3 mb). Εάν ένας σχολιασμός χρωμόσωμα ήταν διαθέσιμο από Εηίτεζ Gene, HUGO, ή uniSTS, γονιδιωματική θέσεις συμπεριλήφθηκαν μόνο αν ήταν στο ίδιο χρωμόσωμα. Μια γνωστή σχολιασμό χρωμόσωμα που απαιτούνται στην περίπτωση των UniGene mRNA και αναζητήσεις ακολουθία EST.

Στις περιπτώσεις όπου οι σχολιασμοί ένταξη ήταν διαθέσιμα, αλλά οι θέσεις δεν βρέθηκαν, πραγματοποιήσαμε τις δικές μας αναζητήσεις BLAT. Αυτό ήταν απαραίτητο για ορισμένες κατηγορίες προσχωρήσεων που δεν εμφανίζονται στη Χρυσή δεδομένων διαδρομής (π.χ. η σειρά «XM_» της προβλεπόμενης refseqs). Εάν ένας σχολιασμός χρωμόσωμα ήταν διαθέσιμη για το γονίδιο, μια αναζήτηση BLAT είχε τρέξει μόνο κατά της εν λόγω χρωμόσωμα, διαφορετικά όλα τα χρωμοσώματα ερευνήθηκαν. Τα αποτελέσματα συγκεντρώνονται και έγινε αποδεκτή η θέση του γονιδίου αν έπεσε μέσα σε 10 mb ή μικρότερη περιοχή. Αυτή είναι μια λιγότερο αυστηρή απαίτηση από χρησιμοποιούνται στο σύστημα χαρτογράφησης ένταξη που βασίζεται, ωστόσο μπορεί να παρέχει τουλάχιστον μια γενική θέση, πολύ πιο συγκεκριμένο από μια κυτταρογενετική βασίζεται σε συντεταγμένων (το μόνο πληροφορίες χαρτογράφησης διαθέσιμες για ορισμένες εγγραφές Entrez Gene). Αν εύλογη αντιστοιχία δεν βρέθηκε σε πολλαπλά χρωμοσώματα, η χαρτογράφηση του γονιδίου απορρίφθηκε ως διφορούμενη.

Τα BLAT αποτελέσματα που έχουν επισημανθεί με μία από τις τέσσερις κατηγορίες των τύπων αντιστοίχισης, έτσι ώστε οι σχολιασμοί μπορεί να αποκλειστεί αργότερα, αν θεωρούνται υπερβολικά ευρεία. Οι τέσσερις κατηγορίες είναι οι εξής:

Ένα ενιαίο τέλειο ταίρι για την ακολουθία ερώτημα βρέθηκε. Το ιδανικό αποτέλεσμα χαρτογράφηση.

Περισσότερα από ένα τέλειο ταίρι για την ακολουθία ερώτημα βρέθηκε.

Ένα ενιαίο σχεδόν τέλειο αγώνα (τουλάχιστον 95% αλλά λιγότερο από 100% ταυτότητα) βρέθηκε.

Πολλαπλές σχεδόν τέλεια αντιστοιχία δεν βρέθηκε

η

Προνομιακή μεταχείριση δόθηκε σε τέλεια REFSEQ ταιριάζει στα αποτελέσματα – δηλ. μια τέλεια αντιστοιχία BLAT σε REFSEQ θεωρήθηκε γενωμική θέση του γονιδίου, ανεξάρτητα από την παρουσία άλλων σχεδόν τέλεια αγώνες στα αποτελέσματα

Αν χαρτογράφηση απέτυχε με οποιαδήποτε από τις παραπάνω μέθοδοι προσπάθησαν μερικές μεθόδους του αργού έσχατο:.

εάν ένα γονίδιο που είχε τοποθετηθεί σε μια γονιδιωματική αλληλουχία NCBI contig (NC_ * σειρά ένταξης, μέσω τραπέζι «gene2refseq» EG του), και ένα γειτονικό γονίδιο στο ίδιο χρωμόσωμα, το βραχίονα,

και η ζώνη θα μπορούσε να βρεθεί στο Golden Path, η σχετική

απόσταση μεταξύ των δύο γονιδίων με τη σειρά NCBI

εφαρμόστηκε στο χρυσό μονοπάτι συντονίζει την προσέγγιση

τη θέση του.

η

Αν ένα γονίδιο είχε μόνο μια κυτταρογενετική διαθέσιμη τοποθεσία, συντεταγμένες της Χρυσής Path-χαρτογραφήθηκαν γονίδια με τον ίδιο κυτταρογενετική θέση συγκεντρώθηκαν και μια ένωση της θέσης τους δημιουργείται. Οι προκύπτουσες αντιστοιχίσεις είναι εξαιρετικά ευρύ, αλλά τουλάχιστον σημείο σε μια γενική μοριακή περιοχή, η οποία μπορεί να εξακολουθεί να είναι χρήσιμη σε ορισμένες περιπτώσεις.

Η

Χαρτογράφηση ΠΑ στο Golden Path

Το δεύτερο σύνολο δεδομένων πρέπει να χαρτογραφηθούν στο Golden Path αποτελούνταν από το σύνολο των BACs χρησιμοποιήθηκαν στις συστοιχίες CGH από Chin et al [24]. Όπως και με τη διαδικασία χαρτογράφησης Εηίτεζ Gene, το Golden βάση δεδομένων Path σχολιασμό περιέχει ένα ιδανικό τραπέζι για τους σκοπούς μας, «bacEndPairs», κρατώντας τα γονιδιωματική θέσεις της ΠΑ των οποίων οι σειρές τέλος και οι δύο έχουν χαρτογραφηθεί. Ωστόσο, μόνο περίπου το 39% των BACs στο σύνολο μας περιέχουν μια καταχώρηση στον πίνακα αυτό. Η «fishClones» πίνακα που αντιστοιχίσεις για ένα επιπλέον 6% των ΠΑ. Για το υπόλοιπο θα χρησιμοποιηθεί BAC που σχετίζονται με σχολιασμούς ως βάση για τη χαρτογράφηση.

Το NCBI κλώνος μητρώο παρείχε μια σημαντική πηγή BAC σχολιασμούς. Από αυτό, εξάγαμε BAC που σχετίζονται με την ένταξη, τέλος ακολουθίας, STS και πληροφορίες χρωμόσωμα. Το μητρώο παρέχεται επίσης διασυνδέσεις με uniSTS, από την οποία συγκεντρώθηκαν επιπλέον σχετικές εντάξεις. Ψάξαμε για τις προκύπτουσες ακολουθίες σε all_mrna χρυσό μονοπάτι, το clonePos, stsMap και all_ests πίνακες. Πήραμε επίσης ειδική σημείωση για τυχόν αγώνες για το τέλος BAC αλληλουχιών. Εκτός από τον κλώνο μητρώου, χρησιμοποιήσαμε επίσης σχολιασμούς από τις συστοιχίες UCSF 2.0 (στοιχεία από https://cancer.ucsf.edu/array/analysis/), καθώς και τα αρχεία της GenBank αναφορά ονόματα BAC στο μπλοκ του τίτλου. αντιστοιχίσεις γονιδίωμα έγιναν αποδεκτές για τις ΠΑ, εάν δεν ήταν πλέον από 500 kb σε μήκος, και αντιστοιχίσεις με διφορούμενη χρωμοσώματα απορρίφθηκαν.

Για την ΠΑ η οποία δεν θα μπορούσε να βρεθεί χρησιμοποιώντας NCBI κλώνο μητρώου ή συστοιχία UCSF σχολιασμούς, προσπαθήσαμε μια προσέγγιση χαρτογράφηση υποκατάστατο με βάση. Chin et als [1] σχολιασμούς array CGH παρέχεται τραχιά γονιδιωματικής θέσεις (σε μεγαβάσεων), των οποίων οι συντεταγμένες ευθυγραμμιστεί περισσότερο με μια παλαιότερη κατασκευή του γονιδιώματος, HG16. Για κάθε BAC, εξάγαμε αναγνωριστικά σειρά από HG16 που σχολιάστηκαν ως κοντά σε αυτή τη θέση. Σετ ακολουθίες εξήχθησαν από κάθε ένα από τα all_mrna, stsMap και all_est πίνακες σχολιασμό. Για mRNAs και STSs, χρησιμοποιήσαμε ακολουθίες που βρίσκονται εντός συν ή πλην 5 kb της θέσης στόχου. Για ESTs, πήραμε αλληλουχίες εντός συν ή πλην 1 kb της θέσης στόχου. Αυτά προέρχονται ακολουθίες χρησιμοποιήθηκαν ως υποκατάστατα για τα ΠΑ, και κοίταξε στα hg18, αναζήτηση (κατά σειρά προτίμησης) mRNA, STSs, και ESTs. Αυτή η προσέγγιση χρησιμοποιήθηκε για να δημιουργήσει hg18 θέσεις περίπου 8,7% των BACs.

Για BACs που δεν μπορούσαν να χαρτογραφηθούν σε hg18 χρησιμοποιώντας οποιαδήποτε από τις παραπάνω μεθόδους, ένα δεύτερο πέρασμα διεξήχθη για να βρείτε παράγουν κατά προσέγγιση θέσεις με βάση την παρεμβολή γειτονικές θέσεις ΠΑ. Για κάθε BAC, προσπαθήσαμε να βρούμε συνοδευτικά ΠΑ με hg18 αντιστοιχίσεις. Στη συνέχεια εφαρμόστηκε σε σχέση μετατοπίσεις στις θέσεις hg18 με βάση τις αποστάσεις στις θέσεις HG16. Αυτό απαιτείται μόνο για περίπου το 1,4% των ΠΑ.

BAC προεπεξεργασία.

Δύο σύνολα των τροποποιημένων γονιδιωματικής θέσεις που δημιουργούνται για κάθε BAC, η οποία αναφερόμαστε, όπως διευρύνθηκε και επεκτάθηκε συντεταγμένες.

Διευρυμένη συντεταγμένες είναι μια προσπάθεια να αντισταθμίσει τις πολλές περιπτώσεις όπου οι πληροφορίες χαρτογράφησης BAC και τέλος ακολουθίας είναι ελλιπής. Σκοπός τους είναι να εξασφαλίσουν ότι όλα τα ΠΑ καλύπτουν ένα ελάχιστο ποσό του γονιδιώματος, και ότι οι πλήρως χαρτογραφηθεί BACs δεν παραγκωνίζει ΠΑ έχει λιγότερο πλήρης σχολιασμούς χαρτογράφησης. Προβλέπει την επέκταση χαρτογραφηθεί BAC συντονίζει μέχρι περίπου 165kb, η οποία είναι η παρατήρηση μας το μέσο μέγεθος της ΠΑ, όπου και οι δύο ακραίες αλληλουχίες έχουν χαρτογραφηθεί. Συντεταγμένες δεν επεκτείνονται σε περιπτώσεις όπου και οι δύο ακραίες αλληλουχίες έχουν χαρτογραφηθεί, ή εάν οι υπάρχουσες πληροφορίες χαρτογράφησης εκτείνεται 100kb ή και περισσότερο. Εάν ένα μόνο χαρτογράφηση άκρο αλληλουχία είναι γνωστή, η επέκταση γίνεται μακριά από το αγκυροβολημένο τέλος, αλλιώς οι συντεταγμένες επεκταθεί εξίσου σε κάθε κατεύθυνση. Οι συγκρούσεις κατά τη διάρκεια της διαστολής μεταξύ στενά χαρτογραφήθηκαν BACs ανιχνεύονται και να επιλυθεί με μια διαδικασία multi-pass, όπου ο διαθέσιμος χώρος παρεμβαίνει αποδίδεται εξίσου μεταξύ ΠΑ. Εάν επέκταση προς μία κατεύθυνση προκαλεί μια σύγκρουση με ένα γειτονικό BAC, κατάλληλα αντισταθμιστικά επέκταση επιχειρείται προς την άλλη κατεύθυνση, εκτός αν η λήξη καθορίζεται από την παρουσία ενός γνωστού τέλος ακολουθία.

Εκτεταμένη συντεταγμένες βασίζονται στις επεκταθεί αντιστοιχίσεις διαιρώντας ανεκχώρητο περιοχές του γονιδιώματος μεταξύ γειτονικών ΠΑ. Αυτό παρέχει κάλυψη ψευδο-πλακόστρωση του γονιδιώματος, επιτρέποντας σε οποιαδήποτε δεδομένη περιοχή να σχετίζεται με την πιο κατάλληλη BAC στο σύνολο. Δημιουργώντας εκτεταμένη συντεταγμένες απαιτεί επεκταθεί συντεταγμένες για να υπολογιστεί κατ ‘αρχάς, να επιτρέψει την πιο δίκαιη κατανομή των παρεμβαίνει περιοχές.

Διευρυμένη και επεκτάθηκε συντεταγμένες υπολογίζονται δυναμικά με βάση την ένταξη BAC του array CGH να συνεργαστεί με. Ενώ οι HG16 που βασίζεται συστοιχίες CGH είχαν ως στόχο να δοκιμάσετε το γονιδίωμα σε τακτά χρονικά διαστήματα, υπολογίζονται οι θέσεις τους στο hg18 δεν είναι τόσο τακτοποιημένα απόσταση. Για τους σκοπούς αυτούς οι BACs ήταν τοποθετημένα όπως τους παρατηρείται σε hg18.

Υπάρχουν περιπτώσεις όπου BAC συντονίζει επικάλυψη. Σε περιπτώσεις όπου ένα BAC υπολογίζεται να βρίσκεται εξ ολοκλήρου μέσα σε ένα μεγαλύτερο BAC, το μικρότερο BAC λαμβάνει τις ίδιες τελικές συντεταγμένες ως το μεγαλύτερο BAC (είναι ουσιαστικά θεωρείται ένα αντίγραφο). Σε περιπτώσεις όπου ένα BAC επικαλύπτει μερικώς με ένα άλλο, οι συντεταγμένες της περιοχής επικάλυψης παραμείνει αμετάβλητη, και όχι την επέκταση ή την επέκταση πραγματοποιείται στο τέλος με την επικάλυψη.

Η συσχέτιση ΠΑ με γονίδια

υπάρχουν τρεις βασικοί τύποι διασταυρώσεις μεταξύ γονιδίων και συντονίζει BAC:

χαρτογράφηση του γονιδίου εμπίπτει εξ ολοκλήρου χαρτογράφηση του BAC του

χαρτογράφηση του γονιδίου έγκειται εν μέρει, εντός χαρτογράφηση του BAC και εν μέρει εκτός

χαρτογράφηση του γονιδίου είναι μεγαλύτερη από τη χαρτογράφηση του BAC του. Αυτό μπορεί να συμβεί για τα γονίδια με πολύ ευρεία κυτταρογενετικά που προέρχονται από αντιστοιχίσεις γονίδιο.

Η

Gene-to-BAC ενώσεις του πρώτου τύπου είναι ασήμαντο για τον υπολογισμό. Οι δύο τελευταίες περιπτώσεις απαιτούν κάποια επιπλέον βήματα για να καθοριστεί αν ένα γονίδιο πρέπει να συνδεθεί με ένα BAC ή όχι. Ενώσεις γενικώς απορρίπτεται εάν το μήκος της χαρτογράφησης BAC είναι λιγότερο από το ένα τρίτο του μήκους της χαρτογράφησης γονιδίου. Αυτό αποτρέπει τις ενώσεις από το να διαμορφώνεται με βάση την επουσιώδη επικαλύψεις. Αν συντεταγμένες χρησιμοποιείται το εκτεταμένο σύνολο των BAC, μια ένωση απορρίπτεται, εκτός εάν τουλάχιστον το 50% των συντεταγμένων του γονιδίου βρίσκονται εντός συντεταγμένες του BAC του. Δεδομένου ότι σε όλο το ΠΑ λειτουργία κεραμίδι το γονιδίωμα εντελώς, αυτό το βήμα εξασφαλίζει ότι τα γονίδια στις παραμεθόριες περιοχές, θα ανατεθεί σε ένα BAC αποκλειστικά. Συγκεκριμένες ενώσεις BACs και γονιδίων τους έχει περιγραφεί προηγουμένως στο Chin et al. [24].

Ο εντοπισμός γονιδίων στο Copy Number Altered Περιφερειών. Προκειμένου να εντοπίσει τα γονίδια στον αριθμό των αντιγράφων αλλοιωθεί περιοχές ήταν αναγκαία η μετάφραση ΠΑ συντεταγμένων που χρησιμοποιείται στη συγκριτική γονιδιωματική υβριδισμού (CGH) δοκιμασίες σε συντεταγμένες γονιδιώματος. Αυτό περιελάμβανε χαρτογράφηση η βάση δεδομένων Entrez γονίδιο και το BACs CGH σε έναν κοινό χώρο συντεταγμένων (Χρυσή Path ανθρώπινο γονιδίωμα build hg18), και στη συνέχεια υπέρθεση των αποτελεσμάτων. Οι διαδικασίες αυτές περιγράφονται στο συμπληρωματικό υλικό [19].

Γονίδια Χαρτογράφηση να Pathways

Εμείς καθορίζεται ο κατάλογος των γονιδίων που χρησιμοποιούνται σε κάθε μονοπάτι στο αίτημά της βάσης δεδομένων Pathway Αλληλεπίδραση [49].

p-value για γονιδιωματική μεταβολές ενός μονοπατιού σε ένα συγκεκριμένο δείγμα

Κάθε δίκτυο μονοπάτι έχει ληφθεί ως ένα σύνολο γονιδίων. Δηλαδή, για κάθε διαδρομή, και σύμφωνα με την (2.4), έχουμε απαριθμούνται τα γονίδια που είναι μέλη του μονοπατιού.

Για να προσδιοριστεί η πιθανότητα ότι μια οδός είναι να πληγεί από ακριβώς k επιτυχίες, πρέπει πρώτα να υπολογίσει η πιθανότητα ότι η οδός είναι τυχαία χτύπησε φορές. Με G γονίδια ποσοτικοποιείται σε μια δεδομένη πλατφόρμα (για παράδειγμα, μία πλατφόρμα που καλύπτει ολόκληρο το γονιδίωμα θα καλύπτει περίπου G = 24.000), και Ν

i γονιδίων σε ένα μονοπάτι i (N

i είναι συνήθως μεταξύ 10-70 γονίδια) έχουμε: (2.4) Η πιθανότητα τυχαία χτύπημα μηδέν έως

k

i

,

ι

γονίδια, δεδομένου ότι

M

ι

τα γονίδια μεταβάλλονται σε δείγμα

ι

είναι η υπεργεωμετρική αθροιστική συνάρτηση κατανομής: (2.5) η σχετική τιμή p ως εκ τούτου, ορίζεται ως εξής: (2.6)

p-value για μια παγκόσμια οδό στοχεύοντας σε ένα πληθυσμό

για να είναι σε θέση να ποσοτικοποιήσει στατιστικά γονιδιωματικής στόχευση ενός μονοπατιού σε ένα πληθυσμό των θεμάτων που πρέπει να επαναλάβει όλη την p-τιμές που ορίζονται στο (2,5). Αυτό είναι στην πραγματικότητα ένας συνδυασμός μονόπλευρη διωνυμική δοκιμές. Αυτό έχει επιλυθεί με διαφορετικές τεχνικές, συμπεριλαμβανομένων του Fisher Omnibus [50], τα οποία χρησιμοποιούμε εδώ. Αυτή η στατιστική δοκιμασία για την πορεία

i

εκφράζεται εδώ ως: (2.7) και την αντίστοιχη τιμή p είναι: (2.8) όπου είναι η Chi-square αθροιστική συνάρτηση κατανομής και

δ

είναι η τον αριθμό των βαθμών ελευθερίας (αριθμός δειγμάτων).

Υποστήριξη Πληροφορίες

πίνακα S1. διόρθωση Bonferroni

εφαρμόστηκε στις τιμές p υπολογίζεται χρησιμοποιώντας τη δοκιμασία Fisher Omnibus, προκειμένου να αντιμετωπιστεί το πρόβλημα των πολλαπλών συγκρίσεων. Η τιμή για σημασίας ήταν εκχωρήσετε ως 8.834 × 10

-5, το οποίο είναι 0,05 /566 (όταν 566 είναι ο αριθμός των οδών). Πίνακας S1 δείχνει όλες τις 566 πορείες που υπολογίζεται από το σύνολο δεδομένων Chin με την p-τιμή που υπολογίζεται μέσω της δοκιμής Fisher Omnibus. Επιπλέον, κάθε p-αξία προσαρμόστηκε και οδός σημασία επανεκχωρήθηκε

doi:. 10.1371 /journal.pone.0014437.s001

(0.65 MB DOC)

Πίνακας S2.

Πίνακας S2 δείχνει το σύνολο του πίνακα των θεμάτων για τα ακόλουθα μονοπάτι «cdc25 και Chk1 ρυθμιστικής οδού σε απόκριση σε βλάβη του DNA». Αυτή η οδός αποτελείται από 9 γονιδίων. Αυτός ο πίνακας δείχνει τον αριθμό αντιγράφων αλλαγές σε όλη την ασθενή με καρκίνο του μαστού 145: -1 σημαίνει διαγραφή, 1 υποδηλώνει ενίσχυση και 0 δείχνει καμία σημαντική αλλαγή

doi:. 10.1371 /journal.pone.0014437.s002

(0,19 MB DOC )

Πίνακας S3.

Πίνακας S3, που παρουσιάζονται εδώ, παρουσιάζει όλα τα μονοπάτια που βρέθηκε να είναι σημαντική, χρησιμοποιώντας ανάλυση επιβίωσης Kaplan-Meier. Όλες οι οδοί που παρουσιάζονται εδώ βρέθηκαν να στοχεύουν σημαντικά μέσω αριθμού αντιγράφων μεταβολή χρησιμοποιώντας το τεστ Fisher Omnibus (μετά την διόρθωση). Όλα τα 29 μονοπάτια εξετάστηκαν σε δύο ακόμη δημόσια σύνολα δεδομένων λάβουν από GEO (https://www.ncbi.nlm.nih.gov/geo). . Α – δραστηριότητα, C – συνέπειας

doi: 10.1371 /journal.pone.0014437.s003

(0,05 MB DOC)

Πίνακας S4.

Ο πίνακας λεπτομέρειες αξία Omnibus του Fisher για κάθε διαδρομή.

You must be logged into post a comment.