PLoS One: Πρόβλεψη και Έλεγχος Βιολογικών Δικτύων Πίσω από καρκίνο του εντέρου


Abstract

Ο ορθοκολικός καρκίνος εξελίσσεται μέσω μιας συσσώρευση σωματικών μεταλλάξεων, μερικά από τα οποία κατοικούν στην λεγόμενη γονίδια «οδηγός» που παρέχουν ένα πλεονέκτημα ανάπτυξης στον όγκο. Να εντοπίσει τα σημεία τομής μεταξύ οδών γονίδιο του οδηγού, έχουμε εφαρμόσει ένα πλαίσιο ανάλυσης του δικτύου με τη χρήση πρωτεϊνικών αλληλεπιδράσεων για την πρόβλεψη πιθανό συνδέσεις – τόσο προηγουμένου και νέα – μεταξύ των βασικών γονιδίων οδηγού στον καρκίνο. Εφαρμόσαμε το πλαίσιο για να βρείτε σημαντικές συνδέσεις μεταξύ δύο γονιδίων,

Αρο

και

Cdkn1a

(

p21

), είναι γνωστό ότι είναι συνεργιστική στην ογκογένεση σε μοντέλα ποντικών. Στη συνέχεια αξιολογείται η λειτουργική συνοχή του προκύπτοντος

Αρο-Cdkn1a

δίκτυο από μηχανική

in vivo

ενιαίο διαταραχές κόμβο του δικτύου: μοντέλα ποντικών μεταλλαχθεί μεμονωμένα σε

Αρο

(

Αρο

1638N +/-

) ή

Cdkn1a

(

Cdkn1a

– /-

), ακολουθούμενη από μετρήσεις των μεταβολών πρωτεΐνης και γονιδιακή έκφραση στο εντερικό επιθηλιακό ιστό . Υποθέσαμε ότι, εάν η προβλεπόμενη δίκτυο είναι βιολογικά συνεκτικό (λειτουργική), τότε οι προβλεπόμενες κόμβοι πρέπει συνδέουν ειδικότερα με απορρυθμισμένη γονίδια και πρωτεΐνες από στοχαστικά επιλεγμένα γονίδια και πρωτεΐνες. Η προβλεπόμενη

Αρο-Cdkn1a

δίκτυο ήταν σημαντικά ενόχλησή στο mRNA επίπεδο και από τις δύο μόνο knockouts γονίδιο, και οι προβλέψεις ήταν επίσης υποστηρίζεται σθεναρά με βάση τη φυσική εγγύτητα και mRNA συν-έκφραση της πρωτεΐνωμα. Αυτά τα αποτελέσματα υποστηρίζουν την λειτουργική συνοχή της προτεινόμενης

Αρο-Cdkn1a

δικτύου και επίσης να δείξει πώς οι προβλέψεις με βάση το δίκτυο μπορεί να ελεγχθεί στατιστικά με τη χρήση υψηλής απόδοσης βιολογικών δεδομένων

Παράθεση:. Patel VN, Bebek G, Mariadason JM, Wang D, Augenlicht LH, Chance MR (2010) Πρόβλεψη και Έλεγχος Βιολογικών Δικτύων Πίσω από καρκίνο του εντέρου. PLoS ONE 5 (9): e12497. doi: 10.1371 /journal.pone.0012497

Συντάκτης: Τσαντ Creighton, Baylor College of Medicine, Ηνωμένες Πολιτείες της Αμερικής

Ελήφθη: May 16, 2010? Αποδεκτές: 26, Ιουλ 2010? Δημοσιεύθηκε: 1 του Σεπτέμβρη, 2010

Copyright: © 2010 Patel et al. Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της άδειας χρήσης Creative Commons Attribution, το οποίο επιτρέπει απεριόριστη χρήση, τη διανομή και την αναπαραγωγή σε οποιοδήποτε μέσο, ​​με την προϋπόθεση το αρχικό συγγραφέα και την πηγή πιστώνονται

Χρηματοδότηση:. Αυτό το έργο έχει υποστηριχθεί από τα Εθνικά Ινστιτούτα Υγείας επιχορηγήσεις UL1-RR024989 από το Εθνικό Κέντρο Έρευνας Πόρων (Κλινική και Μεταγραφική Science Awards) και Ρ30-CA043703 από το Πανεπιστήμιο Case Western Reserve Περιεκτική Κέντρο Καρκίνου. Οι χρηματοδότες δεν είχε κανένα ρόλο στο σχεδιασμό της μελέτης, τη συλλογή και ανάλυση των δεδομένων, η απόφαση για τη δημοσίευση, ή την προετοιμασία του χειρογράφου

Αντικρουόμενα συμφέροντα:.. Οι συγγραφείς έχουν δηλώσει ότι δεν υπάρχουν ανταγωνιστικά συμφέροντα

Εισαγωγή

Η πλειοψηφία των nonhereditary ορθοκολικών όγκων προκύπτουν μέσω της διαδοχικής συσσώρευση μεταλλάξεων σε βασικούς γονίδια οδηγού, όπου μια μετάλλαξη σε ένα ογκοκατασταλτικό (π.χ.

Αρο

) ή ογκογονιδίου (π.χ.

Kras

) κινεί τη διαδικασία, καθώς και μια σειρά σωματικών μεταλλάξεων ακολουθεί [1]. Αν και αυτές οι μεταλλάξεις κλασικά πιστεύεται ότι αποτελείται από λίγα γονίδια (π.χ.

Αρο

,

Kras

,

Trp53

), πρόσφατες μεγάλης κλίμακας προσπάθειες προσδιορισμού αλληλουχίας αποκάλυψε ότι κάθε δεδομένη όγκων περιλαμβάνει (κατά μέσο όρο) 80 μεταλλάξεις, με όσο το 15 που βρίσκεται σε συχνά μεταλλαγμένα γονίδια «οδηγός» [2]. Προς στήριξη της υπόθεσης ότι αυτά τα βασικά γονίδια λειτουργούν συνεργατικά στην οδήγηση ογκογένεση, μοντέλα ποντικών μεταλλαχθεί σε δύο γονίδια οδηγού ταυτόχρονα έχουν δείξει μια συνεργιστική αύξηση της επιβάρυνσης του όγκου, συμπεριλαμβανομένων:

PTEN-Αρο

[3],

KRAS-TGFb

[4], και

Αρο-Trp53

[5]. Η απόδειξη της συνεργιστική, δηλαδή μη προσθετικά, αυξήσεις φορτίο όγκου υποδεικνύουν ότι τα μονοπάτια σηματοδότησης των δύο μεταλλαγμένα γονίδια μπορούν να τέμνονται προς τα κάτω, και, κατά συνέπεια, την πρόβλεψη και ανακρίνει αυτά τα σημεία τομής –

ως ένα βιολογικό δίκτυο

– είναι σημαντικό ενδιαφέρον. Να εντοπίσει τις συνδέσεις μεταξύ των γονιδίων, μια ποικιλία από σύνολα δεδομένων υψηλής απόδοσης – π.χ. αλληλεπιδράσεις πρωτεΐνης-πρωτεΐνης (PPIs), γονίδιο συνέκφραση, και οι σχέσεις παράγοντα μεταγραφής – έχουν χρησιμοποιηθεί για να συναχθεί λειτουργικές ενώσεις που προσφέρονται για ανάλυση όπως δίκτυα, στα οποία κάθε γονίδιο ή πρωτεΐνη αναπαρίσταται ως έναν κόμβο και μία αλληλεπίδραση ως άκρη. Επιπλέον, οι αναλύσεις που βασίζεται σε δίκτυο μπορεί να χρησιμοποιηθεί για τον προσδιορισμό βιοδεικτών [6], για να προβλέψει την εξέλιξη του όγκου [7], ή να αποκαλύψει τις μοριακές αλλαγές υποκείμενη νόσο [8].

Ωστόσο, οι σημερινές μας γνώσεις των βιολογικών δικτύων απέχει πολύ από την ολοκλήρωσή της. Η κάλυψη των τρεχουσών βάσεων δεδομένων interactome εκτιμάται ότι είναι λιγότερο από το 10% του συνολικού αριθμού των αλληλεπιδράσεων [9]. Έτσι, όταν παρεμβολής τις συνδέσεις μεταξύ των γονιδίων του οδηγού, οι αναλύσεις που βασίζεται σε δίκτυο που βασίζονται αποκλειστικά στην επιβεβαίωσε αλληλεπιδράσεις μπορεί να στερούνται βασικές συνδέσεις. Ως ένας στόχος της έρευνάς μας είναι να προβλέψουμε και να αναλύσει τις λειτουργικές διαδρομές μεταξύ των γονιδίων του οδηγού, ένα κρίσιμο βήμα ήταν να αναπτύξει μια έξυπνη πλαίσιο να συμπεράνουμε και την αξιολόγηση νέων συνδέσεων μεταξύ των γονιδίων. Το πλαίσιο που προτείνεται εδώ (σύμφωνα με το πρότυπο Pathfinder [10]) συνάγει λείπει άκρα τους, χρησιμοποιώντας προβλέψεις από οικογενειακές σχέσεις πρωτεΐνη και φιλτράρει αυτές τις διαδρομές βασίζεται σε γνωστά κανόνες συσχέτισης. Από την άλλη πλευρά, δεδομένου ότι ένα γονίδιο του καρκίνου συμμετέχει σε πολλαπλά μονοπάτια σηματοδότησης, μπορεί να υπάρχουν δεκάδες – αν όχι εκατοντάδες – διαδρομών με την οποία δύο πρωτεΐνες αλληλεπιδρούν λειτουργικά. Έτσι, μια υπολογιστική προσέγγιση απαιτείται για να περιορίσει το χώρο του δικτύου στο συγκεκριμένο βιολογικό πλαίσιο ενδιαφέροντος. Για να εξαγάγετε λειτουργικά σχετικές υποδίκτυα, το πλαίσιο ανιχνεύει πολύ πιθανή μονοπάτια σηματοδότησης με βάση το γονίδιο γονίδιο συν-έκφραση mRNA και Gene Ontology [11] κανόνων συσχέτισης που εξορύσσεται από τις δημοσιευμένες πορείες.

Χρησιμοποιήσαμε την υπολογιστική μέθοδος για να φωτιστούν οι συνδέσεις μεταξύ ενός γνωστό γονίδιο οδηγός του καρκίνου του εντέρου,

Αρο

(

αδενωματώδη πολυποδίαση coli

), σε ένα άλλο γονίδιο που εμπλέκεται επίσης σε καρκίνο,

Cdkn1a

(παλαιότερα γνωστή ως

p21

). Αν και

Cdkn1a

δεν φάνηκε να να μεταλλαχθεί σε πληθυσμούς ανθρώπινων ορθοκολικών καρκίνων έχουν μελετηθεί μέχρι σήμερα [2], το επίπεδο έκφρασης του συσχετίζεται με νεοπλαστική εξέλιξη και έχει προγνωστική αξία μεγαλύτερη από εκείνη του

Trp53

[12]. Υποστηρίζοντας περαιτέρω τη σημασία της σε νεοπλασία, το διπλό μεταλλαγμένο ποντίκι,

Αρο

1638N +/- Cdkn1a

– /-

, εμφανίζει μία συνεργιστική αύξηση της επιβάρυνσης του όγκου της [13]. Μετά την πρόβλεψη του δικτύου που συνδέει

Αρο

και

Cdkn1a

, αξιολογήσαμε τη σημασία αυτών των προβλέψεων με το χειρισμό του υποκείμενου συστήματος: παραγωγή

in vivo

διαταραχές του δικτύου σε δύο μοντέλα ποντικών, ακολουθούμενη από μική μετρήσεις συστήματα επιπέδου »από το μικρό εντερικό επιθήλιο. Οι «μική μετρήσεις – τόσο πρωτεομική και γονιδιωματική – του ενόχλησή του συστήματος χρησιμοποιήθηκαν για τη στατιστική δοκιμή της προβλεπόμενης δικτύου, εισάγοντας έτσι την έννοια της αξιολόγησης

in silico

προβλέψεις έναντι βιολογικών δεδομένων συγκεκριμένο πλαίσιο

.

Υλικά και Μέθοδοι

πλαίσιο ανάλυσης δικτύων

το πλαίσιο ανάλυσης δικτύου (που απεικονίζεται στο Σχήμα 1, και εξήγησε στις μεθόδους S1) απασχολεί η αρχιτεκτονική PathFinder περιγράφεται προηγουμένως [10]. Η ακατέργαστη δίκτυο των διαθέσιμων στο κοινό φυσικές αλληλεπιδράσεις πρώτα κλαδεύονται των λανθασμένων θετικών χρησιμοποιώντας ένα μοντέλο λογιστικής παλινδρόμησης που ενσωματώνει (i) τον αριθμό των φορών παρατηρείται ΠΠΑ, (ii) την Pearson συσχέτιση των μετρήσεων έκφρασης για τα αντίστοιχα γονίδια, (iii) μικρό συντελεστή κόσμο ομαδοποίηση των πρωτεϊνών », και (iv) η πρωτεΐνη υποκυτταρικά στοιχεία εντοπισμού αλληλεπίδρασης εταίρων. Τα θετικά (1000 PPIs από τα MIPS [14] βάση δεδομένων των αλληλεπιδράσεων) και αρνητικά δεδομένα εκπαίδευσης σύνολα (1000 τυχαία επιλεγμένα PPIs που δεν είναι σε MIPS) που χρησιμοποιούνται σε 1000 δοκιμές διασταυρούμενης επικύρωσης για να αποκτήσει τις παραμέτρους που μεγιστοποιούν την πιθανότητα μιας πραγματικής αλληλεπίδρασης .

Η διαδικασία αρχίζει με μια διαδικασία φιλτραρίσματος δύο σταδίων να λογοδοτήσουν για ψευδώς θετικά και ψευδώς αρνητικά σε βάσεις δεδομένων αλληλεπίδρασης. Μετά την επιλογή των γονιδίων οδηγός του ενδιαφέροντος, τα μονοπάτια προβλέψει και στη συνέχεια να κλαδεύονται χρησιμοποιώντας τόσο GO κανόνες συσχέτισης όρος και αξίες συνέκφραση γονιδίων-γονιδίου. Τέλος, τα σημαντικά τμήματα της οδού συγχωνεύονται για να καταλήξουμε σε ένα δίκτυο που συνδέει τα δύο γονίδια του οδηγού. Το πλαίσιο περιλαμβάνει ιστού-ειδικό mRNA συνέκφραση σε δύο επίπεδα: στην κατά ζεύγη φιλτράρισμα των ψευδώς θετικών? και στο φιλτράρισμα των διαδρομών κατά μέσο συν-έκφραση. Το μοντέλο λογιστικής παλινδρόμησης έχει εκπαιδευτεί σε βάσεις δεδομένων interactome χρυσό πρότυπο (βλέπε Μέθοδοι S1 για περισσότερες λεπτομέρειες).

Η

ψευδώς αρνητικών αλληλεπιδράσεων έχουν συναχθεί χρησιμοποιώντας σχέσεις ομολογία αλληλουχίας. Παρατηρήθηκε ότι οι πρωτεΐνες με παρόμοιες αλληλουχίες μοιράζονται όμοια εταίρων αλληλεπίδρασης με τον ίδιο οργανισμό [15], και, ως εκ τούτου, οι πρωτεΐνες από την ίδια οικογένεια είναι επίσης πιθανό να έχουν παρόμοια πρότυπα αλληλεπίδρασης. Η βάση δεδομένων Pfam, χρησιμοποιώντας πολλαπλές στοιχίσεις και κρυμμένα μοντέλα Markov (ΗΜΜ), χρησιμοποιεί ομοιότητα ακολουθίας να διατυπώσει την οικογένεια πρωτεϊνών ταξινομήσεων [16] και χρησιμεύει ως ένα χρήσιμο εργαλείο για την αξιοποίηση αυτών των σχέσεων. Ως εκ τούτου, έχουμε υποθέσει μια άκρη αλληλεπίδραση εάν (i) δύο πρωτεΐνες δεν αλληλεπιδρούν μεταξύ τους στο δίκτυο ΠΠΑ, και (ii) υπάρχει τουλάχιστον μία αλληλεπίδραση μεταξύ των οικογενειών αυτών των δύο πρωτεϊνών.

Για τον εντοπισμό αυτά τα μονοπάτια που σχετίζονται με το σύστημα το μοντέλο μας ενδιαφέρουν, τα δεδομένα συνέκφραση βασίζονται σε πειράματα μικροσυστοιχιών από το

Αρο

Min /+

ποντίκι μικρό εντερικό επιθήλιο ελήφθησαν από τον Gene Expression Omnibus (σειρά GSE422 [17])? Αυτή η μελέτη χρησιμοποίησε λέιζερ συλλαμβάνει μικροδιατομής να δοκιμάσουν τις κρύπτες των αδενωμάτων, καρκινώματα και φυσιολογικό επιθήλιο. Στην εφαρμογή μας, χρησιμοποιήσαμε την απελευθέρωση Pfam 23.0 [16] και την απελευθέρωση Gene Ontology τον Αύγουστο του 2008 [11]. Ο αλγόριθμος αναζήτησης επεκτάθηκε για να βρείτε μονοπάτια έως 6 κόμβους σε μήκος, και το όριο για το μέσο συνέκφραση των οδών ήταν.

Ποντίκι εντερικό επιθήλιο Απομόνωση

Όλα τα ζώα αντιμετωπίζονται αυστηρά σύμφωνα με καλών πρακτικών των ζώων, όπως ορίζεται από τους αρμόδιους φορείς σε εθνικό ή /και τοπικό καλή διαβίωση των ζώων, καθώς και η εργασία των ζώων εγκρίθηκε από την Επιτροπή Θεσμικών ζωικά Φροντίδα και Χρήση (IACUC) του Albert Einstein College of Medicine (αριθμός άδειας 20070805).

Αρο

1638N +/-

και

Cdkn1a

– /-

C57BL6 /J ποντικοί δημιουργήθηκαν όπως περιγράφηκε προηγουμένως [13] και δείγματα ιστών συλλέχθηκαν χρησιμοποιώντας την μέθοδο που περιγράφεται από Weiser κ.ά., με αποτέλεσμα την κρύπτη και λάχνης πληθυσμούς κυττάρων από το λεπτό έντερο του

Αρο

1638N +/-

,

Cdkn1a

-. /-

και άγριου τύπου ποντίκια [18].

2D Διαφορικές Σε Gel Ηλεκτροφόρηση

2D Διαφορικές Σε Gel ηλεκτροφόρηση (2D-ΨΗΦΟ) πραγματοποιήθηκε όπως περιγράφηκε προηγουμένως [19]. Διαφορικά εκφρασμένων πρωτεϊνών από τα κλάσματα κρύπτης και λάχνης εντοπίστηκαν στην μεταλλαγμένα ποντίκια (

Αρο

1638N +/-

και

Cdkn1a

– /-

) σε σχέση με τα αντίστοιχα κλάσματα από άγρια -τύπου ποντικούς (4 αντίγραφα το καθένα). Μονοπαραγοντική t-τεστ (άνισες διακυμάνσεις και ίση μεγέθη του δείγματος) και πολυμεταβλητή γραμμική παλινδρόμηση (κωδικοποιημένη στο πακέτο R LIMMA [20]) πραγματοποιήθηκαν. κηλίδες Gel επιλέχθηκαν για ταυτοποίηση LC-MS /MS με βάση αυτές τις δύο t-στατιστικές σε επίπεδο σημαντικότητας 0.05.

κηλίδες Gel αποκόπηκαν, θρυψίνη πέψη, και τα πεπτίδια στη συνέχεια αναλύθηκαν με διαδοχική LC-MS /MS σε ένα LC Συσκευασίες /Dionex Ultimate 3000 HPLC-Orbitrap XL (Finnigan, San Jose, CA) σύστημα [19]. Για την ερμηνεία της MS /MS φάσματα, το πακέτο λογισμικού ΜΑΣΚΩΤ χρησιμοποιήθηκε για να αναζητήσετε τη βάση δεδομένων SwissProt? μια μηδενική βάση δεδομένων του αντιστραφεί πεπτιδικών αλληλουχιών αναζητήθηκε ταυτόχρονα να λογοδοτήσει για ψευδή θετικά. προσδιορίζονται οι πρωτεΐνες που αναφέρονται στον πίνακα S1. Τα αρχεία μασκότ DAT γίνει διαθέσιμο στο κοινό μέσω της βάσης δεδομένων Πρωτεομική Αναγνωριστικά [21], αριθμός πρόσβασης 10638.

γονιδιακής έκφρασης

μελέτες μικροσυστοιχιών για κρύπτης και λάχνης πληθυσμών από

Αρο

1638N + /

Cdkn1a

– /-

και άγριου τύπου ποντίκια (4 επαναλήψεις το καθένα) διεξήχθησαν σε Affymetrix Mouse Genome 2,0 μάρκες σύμφωνα με δημοσιευμένες διαδικασίες [22] . Όλα τα δεδομένα είναι MIAME συμβατό και τα πρωτογενή δεδομένα δημοσιοποιήθηκαν μέσω του βάση δεδομένων συμβατή MIAME, γονιδιακής έκφρασης Omnibus [23], αριθμός ένταξης GSE19338.

Ανάλυση mRNA Δίκτυο

Πρώτες .CEL αρχεία αυτά υποβάλλονται σε επεξεργασία σε MATLAB χρησιμοποιώντας την Στιβαρή multiarray διαδικασίας μέσου όρου [24]. Να ασχοληθεί με πολλαπλούς ανιχνευτές σύλληψη διάφορες πτυχές της συμπεριφοράς ενός προϊόντος γονιδίου, χρησιμοποιήσαμε όλους τους ανιχνευτές για να αντιπροσωπεύουν ένα γονίδιο. Έτσι, στην ανάλυση που ακολουθεί, κάθε

Αρο-Cdkn1a

κόμβο του δικτύου,

i

, εκπροσωπήθηκε από τον

k

i

ανιχνευτές στη συστοιχία, με αποτέλεσμα ένα μήτρα του μεγέθους

q

×

ν

, όπου και. Για να προσδιορίσετε αν το

Αρο-Cdkn1a

κόμβους του δικτύου συλλογικά διαφορικά εκφράζεται σε ένα διαμέρισμα ιστών (κρύπτες ή λαχνών), επεκτείναμε

Τ

2

στατιστική Hotelling – μια κλασική προσέγγιση χρήσιμη για την ομάδες γονίδιο δοκιμής [25] – να ενσωματώσει πολλαπλά πειράματα, ως εξής: όπου είναι το διάνυσμα της μέσης έντασης mRNA για όλα τα

q

ανιχνευτές για ένα γενετικό υπόβαθρο,

G

, όπου (

Αρο

αναφέροντας

Αρο

1638N +/-

?

Cdkn1a

αναφέροντας

Cdkn1a

– /-

? και

WT

υποδεικνύοντας άγριου τύπου C57BL6 /J).

S

είναι η απόλυτη τιμή της αμερόληπτη συγκεντρωμένων πίνακα συνδιακύμανσης του δείγματος για κάθε μεταλλαγμένο: όπου

Mutant

μπορεί να αναφέρεται είτε

Αρο

1638N +/-

ή

Cdkn1a

– /-

, και η απόλυτη τιμή στο

S

χρησιμοποιείται για να αποφευχθεί φανταστικά συστατικά όταν παίρνετε το αντίστροφο ρίζα του

S

στο. Θα πρέπει να σημειωθεί ότι οι ανιχνευτές που αντιστοιχούν σε

Αρο

και

Cdkn1a

ίδιοι αποκλείστηκαν, όπως αυτά αναμένεται να έχουν εξαιρετικά χαμηλές τιμές έντασης (στις αντίστοιχες μεταλλάξεις) που θα τοποθετείται λοξά το αντιληπτό συνολικό δίκτυο αποτέλεσμα. Στην, η διαφορά των μέσων, για κάθε μετάλλαξη μπορεί να είναι θετικό ή αρνητικό για έναν ανιχνευτή

i

, έτσι, σε αντίθεση με

Τ

2

,

V

2

μπορεί να είναι είτε θετική είτε αρνητική.

Δεδομένου ότι, οι εκτιμήσεις covariance δείγμα δεν είναι θετικά ορισμένος, και, ως εκ τούτου, το αντίστροφο είναι μοναδική. Για να παρακάμψουν αυτό το θέμα, θέτουμε όλες τις συνδιακυμάνσεις στο μηδέν για αρχικό υπολογισμό του

V

2

και στη συνέχεια να υπολογίσει τη σημασία του

V

2

χρησιμοποιώντας μία δοκιμασία μετάθεσης (δηλαδή στοχαστικά δημιουργώντας νέες «

μεταλλαγμένο

» και ετικέτες φαινότυπος) «

άγριου τύπου

«, διατηρώντας έτσι την υποκείμενη δομή συνδιασποράς στη μηδενική κατανομή. Ρύθμιση των off-διαγώνια στοιχεία του

S

στο μηδέν απλοποιεί

V

2

σε: Έτσι,

V

2

είναι απλά το άθροισμα του προϊόντος κλιμακωμένων t-στατιστικές υπολογίζονται για κάθε ανιχνευτή, σε καθεμιά από τις δύο πειραματικές διαταραχές. Καθώς ο αριθμός των δειγμάτων ήταν μικρή (για μεταλλάξεως και αγρίου-τύπου, το κάθε ένα), τυχαίο θόρυβο προστέθηκε σε κάθε παραλλαγμένο μήτρα για να ληφθεί ένα παρεμβολής και εξομαλύνεται εμπειρική διανομή null? η τυπική απόκλιση,, του θορύβου για κάθε ανιχνευτή,

q

, στο γενετικό υπόβαθρο,

G

, εκτιμήθηκε από την τυπική απόκλιση του δείγματος της κάθε ανιχνευτή. 10000 τέτοιες μεταθέσεις υπολογίστηκαν για την απόκτηση των null διανομές, η οποία -όπως αναμενόταν – μοιάζουν με F-κατανομές (βλέπε Εικόνα S1). Δεδομένου ότι

Αρο

και

Cdkn1a

είναι δύο καταστολείς των όγκων και υπέθεσε να επηρεάσει το δίκτυό μας ενδιαφέρουν με παρόμοιο τρόπο, αναμένουμε τα t-στατιστικές να μεταβάλλεται προς την ίδια κατεύθυνση, αν η μηδενική υπόθεση ( καμία κοινή δράση) πρέπει να απορριφθεί. Ως εκ τούτου, υπολογίζουμε το

σ

-τιμή του

V

2

καθώς ο αριθμός των null παρατηρήσεις μεγαλύτερη από αυτή που παρατηρήθηκε αξία μας

V

2

. Υπολογίζοντας το

σ

-τιμή για το αρνητικό άκρο της κατανομής θα ήταν χρήσιμο εάν οι διαταραχές αυτές αναμένεται να έχουν αντίθετα αποτελέσματα μοριακών (π.χ.

Αρο

+/-

σε συνδυασμό με ένα

Stat3

+/-

hypomorph).

Ενώ έχουμε παρουσιάσει μια ανάλυση για ένα 2-κόμβος διαταραχή ενός δικτύου, η ανάλυση αυτή είναι επεκτάσιμη έως

k

πειραματική διαταραχές υπολογίζοντας ζεύγη

V

2 & στατιστικές, με αποτέλεσμα σε μια μήτρα: Πού αντιπροσωπεύει το στατιστικό μεταξύ διαταραχών

ι

και

k

? όπως φαίνεται, η διαγώνια μειώνει σε μια κλίμακα εκδοχή της Hotelling του

T

2

στατιστική για κάθε πείραμα. Δεδομένου ότι οι στατιστικές είναι το καθένα από διαφορετική κλίμακα, δεν μπορούν να συγκριθούν άμεσα, και, ως εκ τούτου, θα πρέπει να υπολογίζεται η σημασία κάθε στοιχείου μήτρας (όπως παραπάνω) μέσω μιας δοκιμής μετάθεσης. Στη συνέχεια, για τη μήτρα του

p-τιμές

, τα διαγώνια στοιχεία παρέχουν πληροφορίες για τη σημασία των επιμέρους πειράματα, ενώ οι off-διαγώνια τιμές παρέχουν πληροφορίες σχετικά με την πειραματική ζεύγη σημασία. Η συνολική πειραματική υποστήριξη για διαταραχές του δικτύου μπορεί στη συνέχεια να υπολογίζεται με την άθροιση off-διαγώνια

σ

-τιμές, π.χ. με την μέθοδο του Fisher [26]. Σας προτείνουμε αυτή την προσέγγιση για την αντιμετώπιση των διαταραχών? για διαταραχές, όπως στην περίπτωσή μας, το

σ

-τιμές μπορεί να ερμηνευθεί άμεσα.

Ανάλυση πρωτεΐνωμα

Για να αξιολογηθεί η σημασία της σωματικής εγγύτητας, η τοπολογική απόσταση μεταξύ

Αρο

Cdkn1a

κόμβους του δικτύου και των αντίστοιχων πρωτεΐνωμα υπολογίστηκε. Φυσική δίκτυα ΠΠΑ συγκεντρώθηκαν από BioGRID [27], η βάση δεδομένων του Ανθρώπου πρωτεΐνης αναφοράς (HPRD) [28], και ανέπαφα [29]. Κάθε κόμβος του δικτύου δοκιμάστηκε ανεξάρτητα για τον αριθμό των διαδρομών 2-hop τη σύνδεσή του με μια σειρά από

ν

πειραματικά μετρούμενη πρωτεΐνες, που εκφράζονται ως εξής: Πού είναι η είσοδος σε σειρά

i

και στήλη

ι

στην πίνακας γειτνίασης,

Μια

, του δικτύου PPI?

i

είναι μια πρωτεΐνη στο

Αρο-Cdkn1a

δίκτυο?

ι

είναι ένα ενδιάμεσο πρωτεΐνη? και

k

είναι ένας πειραματικά μετρούμενη πρωτεΐνη. Στην περίπτωση αυτή, τα πειραματικά πρωτεΐνες ήταν οι πρωτεΐνωμα είτε από

Αρο

1638N +/-

ή

Cdkn1a

– /-

ποντίκια. Αν υπάρχει τουλάχιστον ένα ενδιάμεσο πρωτεΐνης,

ι

, για τα οποία υπάρχει ένα μονοπάτι δύο-hop μεταξύ των κόμβων

i

και

k

, τότε η απόσταση 2-hop, , είναι 1? το συνολικό συνδεσιμότητα, της πρωτεΐνης

i

στο σύνολο των στόχων 2D-ΨΗΦΟ είναι απλά το άθροισμα των. Σημασία υπολογίστηκε κατά εμπειρικό null διαμορφώνονται από 10.000 που δημιουργείται τυχαία σύνολα των πρωτεϊνών και του μεγέθους

n

.

Για να αξιολογήσει τα πρότυπα της από κοινού ρύθμισης, οι τιμές συν-έκφραση mRNA (συντελεστής συσχέτισης του Spearman) υπολογίστηκαν από το αντίστοιχο σύνολο των κανονικοποιημένων πειραμάτων μικροσυστοιχιών, που εκτείνονται σε άγριου τύπου,

Αρο

1638N +/-

, και

Cdkn1a

– /-

κρύπτες και λαχνών? ο ανιχνευτής με μέγιστη ένταση χρησιμοποιήθηκε ως αντιπρόσωπος για ένα γονίδιο. Για να ελέγξετε τη σημασία των συσχετίσεων mRNA επίπεδο, μια τροποποιημένη δοκιμή στατιστική Kuiper, το

Κ

, υπολογίστηκε μεταξύ των συσχετίσεων της ομάδας (δηλαδή όλοι οι ανιχνευτές στη συστοιχία) και το δείγμα συσχετίσεις (δηλαδή σύνολο των στόχων 2D-ΨΗΦΟ) για κάθε κόμβο του δικτύου ανεξάρτητα? υπολογίζεται ως το άθροισμα της μέγιστης και ελάχιστης αποκλίσεις του δείγματος, και ελέγχου (δηλ ολόκληρης της συστοιχίας),

F

, συνάρτηση κατανομής [30]: Όπως ανά τις υποδείξεις του Subramanian et al. [31], το στατιστικό στοιχείο του Kuiper, το

Κ

, τροποποιήθηκε για να βελτιώσει την ικανότητά της να ανιχνεύει δικόρυφη μετατοπίσεις στη θέση της κατανομής του δείγματος (όπως θα περίμενε κανείς συνεκφράζονται ομάδες των πρωτεϊνών για να δείξει τόσο θετικές όσο και αρνητικές συσχετίσεις): όπου

S

είναι το σύνολο των πρωτεϊνών που δοκιμάζεται (είτε το

Αρο

1638N +/-

ή

Cdkn1a

– /-

2D-ΨΗΦΟ στόχους) ?

r

είναι η διέταξε διάνυσμα των συντελεστών συσχέτισης μεταξύ των αντίστοιχων στόχων 2D-ΨΗΦΟ και ένα μόνο κόμβο του δικτύου? και ομαλοποιεί να έχουν άθροισμα 1. δοκιμές σημαντικότητα διεξήχθη χρησιμοποιώντας κανονική προσέγγιση της εμπειρικής null: η εμπειρική null συναρμολογήθηκε από το τροποποιημένο

K

υπολογίζεται για 500 τυχαία επιλεγμένα σύνολα πρωτεΐνη, καθένα από τα μέγεθος, και μέγιστης πιθανοφάνειας εκτίμηση χρησιμοποιήθηκε για να χωρέσει μια κανονική κατανομή. Για να εξερευνήσετε και να απεικονίζει τις συνδέσεις των σημαντικών (

α

= 0,05) κόμβους του δικτύου, εξετάζουμε το υποσύνολο των συσχετίσεων,

r

y

, όπου τέτοια ώστε και? και το υποσύνολο των συσχετίσεων,

r

p

, όπου τέτοια ώστε και (ανάλογη με την «αιχμή» υποσύνολο της GSEA [31]). Για τον προσδιορισμό των διαφορικά εκφρασμένων κόμβους, εμείς επιλέξαμε αυτούς τους κόμβους όπου το t-στατιστικό (άνιση διακύμανση) της μέγιστης καθετήρα ένταση ήταν τέτοια ώστε είτε στην κρύπτη ή το διαμέρισμα λάχνης, όπου είναι η κανονική αντίστροφη αθροιστική συνάρτηση κατανομής.

ο έλεγχος κάθε κόμβου στο

Αρο-Cdkn1a

δίκτυο ανεξάρτητα οδήγησε σε μια

σ

-τιμή για κάθε μία από τις μηδενικές υποθέσεις, όπου, και κάθε υπόθεση,, υποθέτει ότι δεν υπάρχει καμία σχέση ( φυσική-based ή συνέκφραση-based) μεταξύ του

Αρο-Cdkn1a

κόμβο του δικτύου,

i

, και οι στόχοι 2D-ΨΗΦΟ. Για να ελεγχθεί η υπόθεση null ομάδα που όλα είναι ταυτόχρονα αληθινή,

σ

-τιμές συγκεντρώνονται σε ένα στατιστικό στοιχείο,

τ

, που προτείνεται από Fisher? σημαντικότητα αξιολογήθηκε έναντι διανομής με 2

ν

βαθμούς ελευθερίας [26] (βλέπε επίσης Μέθοδοι S1). Το μεταλλαγμένο κόμβου (

Αρο

στο

Αρο

1638N +/-

ή

Cdkn1a

στο

Cdkn1a

– /-

) αποκλείστηκε από τις αντίστοιχες αναλύσεις, όπως ακραίες μορφές έκφρασης τους παραποιήσει τα ομάδα-σοφός αποτελέσματα.

αποτελέσματα

Προγνωστικά Δίκτυο Gene Driver

Η διπλή μετάλλαξη

Αρο

1638N +/- Cdkn1a

– /- ποντικό

προηγουμένως αποδειχθεί ότι εμφανίζουν μία συνεργιστική αύξηση φορτίο όγκου του σε σύγκριση με τα απλά μεταλλάγματα [13]. Να εντοπίσει τις πιθανές συνδέσεις μεταξύ των

Αρο

και

Cdkn1a

, κατασκευάσαμε μια έξυπνη πλαίσιο που, αφενός, μαθαίνει τα πρότυπα σχολιασμό χαρακτηριστικό των γνωστών οδών σηματοδότησης (π.χ. εκείνα που βρίσκονται σε KEGG [32] και άλλους) και, στη συνέχεια, τα ζευγάρια αυτά τα μοτίβα με συγκεκριμένα δεδομένα συνέκφραση ιστό να εξάγει τις πιο πιθανές αλυσίδες αλληλεπιδρώντων πρωτεϊνών που εμπλέκονται στην

ΑΡΟ-Cdkn1a

σηματοδότησης (που απεικονίζεται στο Σχήμα 1). Για να προσδιορίσετε μόνο οδών υψηλής εμπιστοσύνης, μια διαδικασία φιλτραρίσματος δύο φάσεων εφαρμόστηκε για πρώτη φορά στο παγκόσμιο δίκτυο ΠΠΑ. Στην πρώτη φάση, τα άκρα – που καταρτίζονται από τις αλληλεπιδράσεις των θηλαστικών σε BioGRID [27] και HPRD [28] – είχαν κλαδευτεί από το δίκτυο αν δεν μοιάζουν με πιθανό αλληλεπιδράσεις (όπως ορίζεται από ένα μοντέλο λογιστικής παλινδρόμησης), με στόχο τη μείωση των ψευδών θετικά από τους αναφέρθηκαν αλληλεπιδράσεις. Να λογοδοτήσουν για ψευδώς αρνητικά (Φάση 2), αλληλεπιδράσεις προστέθηκαν στο δίκτυο συνάγοντας σχέσεις που πρωτοφανή σε οργανισμούς μοντέλο βασίζεται στην οικογένεια πρωτεϊνών σχέσεις. Μετά την εφαρμογή αυτών των μέτρων για να δημιουργήσει ένα συνθετικό δίκτυο, ψάξαμε για πιθανή σύνδεση μεταξύ

Αρο

και

Cdkn1a

με βάση τα δεδομένα συν-έκφραση των γονιδίων και κανόνες συσχέτισης Gene Ontology.

Για να τονίσει κόμβους και ακμές που σχετίζονται με το βιολογικό μας σύστημα, εισαγάγαμε μια προκατάληψη ιστο-ειδική στην αναζήτησή μας για

Αρο

Cdkn1a

συνδέσεις με τη χρήση των δεδομένων γονιδιακής έκφρασης από το εντερικό επιθήλιο του

Αρο

Min /+

ποντίκια. Από αυτά τα δεδομένα, υπολογίσαμε την τιμή συνέκφραση mRNA επιπέδων για τα επιμέρους άκρα μέσω του συντελεστή συσχέτισης Pearson γονίδιο-γονίδιο. Στη συνέχεια, όλοι οι δρόμοι στο συνθετικό δίκτυο που συνδέει τα προϊόντα του γονιδίου του

Αρο

και

Cdkn1a

είχαν ερωτηθεί, και οι προβλεπόμενες διαδρομές διηθούνται με βάση (i) την υποστήριξη των κανόνων συσχέτισης για GO σχολιασμούς και (ii) ο μέσος συνέκφραση κατά μήκος μιας διαδρομής? Το αποτέλεσμα (σε επίπεδο σημαντικότητας του

α

= 0.01) παρουσιάζεται στο Σχήμα 2. Η

Αρο

Cdkn1a

δίκτυο περιλαμβάνει μια σειρά από προηγουμένως γνωστές αλληλεπιδράσεις (στερεό γραμμές), καθώς και προβλεπόμενες αλληλεπιδράσεις (διακεκομμένες γραμμές) με βάση: (i) οικογένεια πρωτεϊνών σχέσεις, (ii) δύναμη του κανόνες συσχέτισης GO, και (iii) microarray συνέκφραση κατά μήκος της διαδρομής που συνδέει ειδική

Αρο

να

Cdkn1a

. Όπως γενετικές αλληλεπιδράσεις που περιλαμβάνονται στις αρχικές βάσεις δεδομένων αλληλεπίδραση, η προβλεπόμενη δίκτυο περιλαμβάνει τόσο τη σωματική και λειτουργικές σχέσεις

Στερεά άκρες αντιπροσωπεύουν ήδη γνωστές αλληλεπιδράσεις.? διακεκομμένες ακμές αντιπροσωπεύουν προβλεπόμενες αλληλεπιδράσεις? και τα άκρα που σημειώνονται με ένα «ν» αποτελούν προβλεπόμενες αλληλεπιδράσεις που έχουν επικυρωθεί πρόσφατα στη δημοσιευμένη βιβλιογραφία.

Η

Σε ένα σύστημα-επίπεδο, η προτεινόμενη

Αρο-Cdkn1a

δίκτυο φέρει ο στατιστικά απίθανο ιδιότητα να κορεσμένο με ογκογονίδια: 8 από τις 20 πρωτεΐνες περιγράφονται ως ογκογονίδια στο ΟΜΙΜ (

σ

-τιμή & lt? 5 × 10

-10 από το ακριβές τεστ του Fisher, δείτε Μέθοδοι S1), και πολλά από τα υπόλοιπα γονίδια έχουν δειχθεί πειραματικά για να ενεργεί ως ογκογονίδια (π.χ.

ErbB3

[33], [34],

Shc1

[35],

Map2k1

[36 ]). Αν και το

Αρο

Cdkn1a

δίκτυο περιέχει πολλά καλά μελετημένο πρωτεϊνών, ο βαθμός κόμβου (δηλαδή τον αριθμό των αλληλεπιδράσεων) εντός του υποδικτύου δεν είναι απολύτως συσχετίζονται με το βαθμό κόμβο στο αφιλτράριστο βάση δεδομένων αλληλεπίδρασης (συσχέτισης του Pearson = 0,51). Για παράδειγμα, ενώ ΑΚΤ1 έχει πολλές γνωστές αλληλεπιδράσεις, συνήθως μελέτησε τη βιολογική τους εταίρους της – δηλαδή, GSK3B και PTEN (δύο εκ των οποίων σχετίζονται με το

Αρο

[3] και

Cdkn1a

[37] σηματοδότησης ) – δεν εμφανίζονται στο δίκτυο. Άλλες γνωστές αλληλεπιδράσεις, όπως εκείνη μεταξύ SHC1 και SRC [38], είναι επίσης απουσιάζουν από το δίκτυο. Δεδομένου ότι ο αλγόριθμος μας προβλέπει συνδέσεις προκατειλημμένη από τη βιολογία των υπό μελέτη συστήματος (μέσω της χρήσης των δεδομένων γονιδιακής έκφρασης από το

Αρο

Min /+

ποντίκι εντερικό ιστό), μια συγκεκριμένη πρωτεΐνη ή ακμή μπορεί να μην εμφανιστεί στην το δίκτυο, αν η οδός (π.χ. αλυσίδα των πρωτεϊνών), στην οποία κατοικεί δεν πληροί το γονίδιο συν-έκφραση και /ή GO όρια κανόνων συσχέτισης

Αντίθετα, η

Αρο

-.

Cdkn1a

δίκτυο περιλαμβάνει νέες ενώσεις: εκείνα που δεν περιλαμβάνονται μεταξύ των βάσεων δεδομένων πηγής (διακεκομμένες ακμές στο Σχήμα 2). Αρκετές από αυτές τις αλληλεπιδράσεις έχουν πρόσφατα επικυρωθεί εστιασμένο μελέτες (βλέπε Πίνακα 1), παρέχοντας την εμπιστοσύνη ότι το πλαίσιο είναι χρήσιμη. Επιπλέον, η

Αρο

Cdkn1a

δίκτυο υποδεικνύει επίσης ότι ορισμένες αλληλεπιδράσεις προηγουμένως συνδέονται με άλλα μοντέλα του καρκίνου – όπως τη λειτουργική ένωση SRC-CCND1 βρέθηκαν στον καρκίνο του προστάτη [39], ή η φωσφορυλίωση της CDK4 από SRC σε μια κυτταρική γραμμή [40] – είναι σχετικές με αυτό το μοντέλο του καρκίνου του παχέος εντέρου

η

Ενιαίου Κόμβος Διαταραχές:. mRNA Profiling

Καθώς η

Αρο- Cdkn1a

δίκτυο αντιπροσωπεύει την διασταύρωση των οδών σηματοδότησης που προέρχονται από

Αρο

και από το

Cdkn1a

, περιμένουμε να παρατηρήσουμε λειτουργικές αλλαγές στις πρωτεΐνες του δικτύου που σχετίζονται απαντώντας σε διαταραχές είτε σε

APC

ή

Cdkn1a

. διαταραχές ενιαίο κόμβο αναπτύχθηκαν σε μοντέλα ποντικών με μεταλλάξεις είτε στο

Αρο

(δηλαδή,

Αρο

1638N +/-

) ή

Cdkn1a

(

Cdkn1a

– /-

). Ενώ η

Αρο

Cdkn1a

δίκτυο δημιουργήθηκε χρησιμοποιώντας ογκοειδικό

Αρο

Min /+

δεδομένων – ένα μοντέλο που φιλοξενεί μια σειρά υπόβαθρο γενετικών βλαβών [41 ] – το εντερικό ιστό που λαμβάνεται από το

Αρο

1638N +/-

και

Cdkn1a

– /-

ποντίκια σε ηλικία 3 μηνών είναι σχετικά πολύποδα δωρεάν, επιτρέποντας έτσι μας να μετρήσει την επίδραση μιας ενιαίας γενετικής διαταραχής στην προ-νεοπλασματικών επιθήλιο. Παρά το γεγονός αυτό αφαιρεί πιθανή προκατάληψη που εισάγεται από τις μεταγενέστερες μεταλλάξεις των νεοπλασματικών ιστών, η προσέγγιση αυτή μπορεί επίσης να μετριάσει τη ροή των πληροφοριών μεταξύ των δύο γονιδίων.

Από τη στιγμή που με τη χρήση των δύο διαταραχών για να καθορίσει πόσο καλά το

APC-Cdkn1a

δίκτυο μπορεί να συλλάβει βιολογικά φαινόμενα, εισαγάγαμε μια πολυμεταβλητή στατιστική,

V

2

για να ελέγξετε εάν οι διαφορές στη μέση αφθονία mRNA υπάρχουν από κοινού μεταξύ του

APC

1638N + /-

και

Cdkn1a

– /-

μοντέλα. Με τη χρήση

V

2

, όπως απεικονίζεται στο Σχήμα 3, τα γονίδια με ήπια διαφορική έκφραση των δύο επιμέρους μεταλλάξεις μπορεί να συμβάλει στη συνολική υποστήριξη του δικτύου, όπως

V

2

ανταμείβει αυτά τα γονίδια, όπου κάθε μία από τις δύο ανεξάρτητες t-στατιστικές είναι τόσο μεγαλύτερη από 1. η στατιστική σημαντικότητα των

V

2

ελέγχθηκε έναντι ενός null μετάθεση, και, ως διαταράξεις μας περιελάμβανε δύο καταστολείς όγκων αναμένεται να έχουν μοριακά προς την ίδια κατεύθυνση, χρησιμοποιήσαμε το θετικό ουρά της κατανομής. Γνωρίζοντας ότι πολλά μόρια «διακόπτη» έκφραση (δηλαδή υψηλή προς χαμηλή, ή το αντίστροφο) κατά τη μετάβαση από κρύπτες σε λάχνες [19], τα σύνολα δεδομένων μικροσυστοιχιών για αυτές τις δύο βιολογικών διαμερίσματα ελέγχθηκαν ξεχωριστά. Βρήκαμε ότι το

Αρο-Cdkn1a

δίκτυο υποστηρίζεται σθεναρά (

σ

-τιμή = 0,002) από την κοινή διαφορική έκφραση του mRNA σε κρύπτη διαμέρισμα των δύο μεταλλάξεις ». συνοχή του δικτύου ήταν ασθενέστερη (

σ

-τιμή = 0,060) στο διαμέρισμα λάχνης, και το δίκτυο στο σύνολό της δεν ήταν διαφορικά εκφράζονται στο λαχνών είτε μεταλλαγμένων, επισημαίνεται στις δύο

V

2

μήτρες «

p

-τιμές: σε περίπτωση που, όπως αναφέρθηκε, τα διαγώνια στοιχεία δείχνουν τη σημασία της διαφορικής έκφρασης

μέσα

ένα μεταλλαγμένο (όπως ανά Hotelling του

Τ

2

), και οι off-διαγώνια στοιχεία δείχνουν τη σημασία της κοινής διαφορικής έκφρασης

σε ολόκληρη

μεταλλάξεις (όπως ανά

V

2

). Στις κρύπτες, το δίκτυο διαφορικά εκφρασμένο σε

Cdkn1a

– /-

(

σ

-τιμή = 0.009), αλλά όχι σε

Αρο

1638N +/-

(

σ

-τιμή = 0.871), και, ακόμη, υποστηρίχθηκε από κοινού από διαφορική έκφραση στα δύο μοντέλα ποντικών (

σ

-τιμή = 0,002). Αυτό δείχνει ότι οι μικρές αλλαγές mRNA επιπέδου που μοιράζονται μεταξύ πολλών διαταραχών – με βάση το γονίδιο-προς-γονίδιο – παρέχουν από κοινού υποστήριξη για την υπόθεση του δικτύου, ενώ κάθε επιμέρους διαταραχή μπορεί να αποτύχει να αποδείξει τον ισχυρισμό

Κάθε. γονίδιο δίκτυο εκπροσωπείται από δύο επικαλυπτόμενες φυσαλίδες χρωματιστό σύμφωνα με τα t-στατιστικών (άνιση διακύμανση) στις δύο μεταλλάξεις: η κάτω αριστερή φούσκα ενός γονιδίου αντιστοιχεί στο t-στατιστική για

Αρο

1638N +/-

, και η επάνω αριστερή φούσκα στην t-στατιστική για

Cdkn1a

– /-

. Το σημείο τομής των δύο φυσαλίδων αντιστοιχεί στο άθροισμα των t-στατιστικών, που απεικονίζει το πώς μπορεί να ενισχυθεί η σημασία των μικρών επιδράσεων όταν εξετάζονται από κοινού. Οι κόμβοι μειωτικά στο μεταλλαγμένο χρωματισμένο ροζ, εκείνοι υπερεκφράζονται στο μεταλλαγμένο είναι κίτρινα, και ουδέτερα t-στατιστικές είναι γκρι.

You must be logged into post a comment.