PLoS One: Λειτουργία του καρκίνου που συνδέεται γονίδια αποκάλυψε από τη σύγχρονη μονοπαραγοντική και πολυπαραγοντική Συλλόγου Tests


Αφηρημένο

Αντιγραφή παραλλαγή αριθμό (CNV) παίζει ρόλο στην παθογένεση πολλών ανθρώπινων ασθενειών, ιδιαίτερα του καρκίνου. Αρκετές μελέτες συσχέτισης CNV ολόκληρο το γονιδίωμα έχουν πραγματοποιηθεί για τον προσδιορισμό της ταυτότητας του καρκίνου που σχετίζεται CNVs. Εδώ αναλάβαμε μια νέα προσέγγιση για ολόκληρο το γονιδίωμα ανάλυση CNV, με στόχο να προσδιορισμός των ενώσεων μεταξύ CNV διαφορετικών γονιδίων (CNV-CNV) σε όλη 60 ανθρώπινες καρκινικές κυτταρικές σειρές. Υποθέτουμε ότι οι ενώσεις αυτές δείχνουν τους ρόλους των συνδεδεμένων γονιδίων στον καρκίνο, και μπορεί να είναι δείκτες της θέσης τους σε δίκτυα γονίδιο διεργασιών καρκίνο οδήγησης. Πρόσφατες μελέτες δείχνουν ότι οι ενώσεις του γονιδίου είναι συχνά μη-γραμμική και μη-μονότονη. Για να αποκτήσει μια πιο ολοκληρωμένη εικόνα όλων των ενώσεων CNV, πραγματοποιήσαμε omnibus μονοπαραγοντική ανάλυση χρησιμοποιώντας δοκιμές σύνδεσης dCov, MIC, και HHG, η οποία είναι ικανή να ανιχνεύσει οποιοδήποτε τύπο σύνδεσης, συμπεριλαμβανομένων των σχέσεων μη μονότονο. Για σύγκριση χρησιμοποιήσαμε δοκιμές σύνδεσης Spearman και Pearson, η οποία ανιχνεύουν μόνο γραμμική ή μονότονο σχέσεις. Εφαρμογή των δοκιμών dCov, MIC και HHG οδήγησε στην ταυτοποίηση διπλάσιες ενώσεις σε σύγκριση με εκείνα που βρέθηκαν από Spearman και Pearson μόνο. Είναι ενδιαφέρον, οι περισσότερες από τις νέες ενώσεις ανιχνεύτηκαν με τη δοκιμή HHG. Στη συνέχεια, θα χρησιμοποιηθεί η ικανότητα dCov και HHG να εκτελέσει πολυπαραγοντική ανάλυση. Δοκιμάσαμε συνδέσεως μεταξύ γονιδίων άγνωστης λειτουργίας και γνωστές οδούς σχετίζονται με τον καρκίνο. Τα αποτελέσματά μας δείχνουν ότι η πολυπαραγοντική ανάλυση είναι πολύ πιο αποτελεσματική από ό, τι μονοπαραγοντική ανάλυση για το σκοπό της αποδίδουν βιολογικούς ρόλους για τα γονίδια άγνωστης λειτουργίας. Καταλήγουμε στο συμπέρασμα ότι ένας συνδυασμός πολλών μεταβλητών και μονομεταβλητών δοκιμές σύνδεσης omnibus μπορεί να αποκαλύψει σημαντικές πληροφορίες σχετικά με δίκτυα γονιδίων των διεργασιών της νόσου οδήγηση. Αυτές οι μέθοδοι μπορούν να εφαρμοστούν σε κάθε μεγάλο γονίδιο ή οδός σύνολο δεδομένων, επιτρέποντας πιο ολοκληρωμένη ανάλυση των βιολογικών διεργασιών

Παράθεση:. Gorfine Μ, Goldstein Β, Fishman Α, Heller R, Heller Υ, Lamm AT (2015) Λειτουργία του καρκίνου του Associated γονίδια αποκάλυψε από τη σύγχρονη μονοπαραγοντική και πολυπαραγοντική Συλλόγου δοκιμές. PLoS ONE 10 (5): e0126544. doi: 10.1371 /journal.pone.0126544

Ακαδημαϊκό Συντάκτης: Lin Chen, Το Πανεπιστήμιο του Σικάγο, Ηνωμένες Πολιτείες |

Ελήφθη: 27 του Σεπτεμβρίου 2014? Αποδεκτές: 3 Απρ 2015? Δημοσιεύθηκε: May 12, 2015

Copyright: © 2015 Gorfine et al. Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της άδειας χρήσης Creative Commons Attribution, το οποίο επιτρέπει απεριόριστη χρήση, τη διανομή και την αναπαραγωγή σε οποιοδήποτε μέσο, ​​με την προϋπόθεση το αρχικό συγγραφέα και την πηγή πιστώνονται

Δεδομένα Διαθεσιμότητα: Όλα τα σχετικά δεδομένα είναι εντός του Υποστηρίζοντας αρχεία πληροφοριών του χαρτιού και

Χρηματοδότηση:. το έργο αυτό χρηματοδοτήθηκε από το Εθνικό Ινστιτούτο Υγείας (επιχορήγηση P01CA53996 με MG), ο ισραηλινός Κέντρα Έρευνας αριστείας (Ι-CORE) πρόγραμμα (Κέντρο Όχι . 1796/12 για ATL), Το Ίδρυμα Ισραήλ Science (επιχορήγηση Νο 644/13 για την ATL). ATL είναι ένα συντροφικό Taub – υποστηρίζεται από το Ίδρυμα Taub. Οι χρηματοδότες δεν είχε κανένα ρόλο στο σχεδιασμό της μελέτης, τη συλλογή και ανάλυση των δεδομένων, η απόφαση για τη δημοσίευση, ή την προετοιμασία του χειρογράφου

Αντικρουόμενα συμφέροντα:.. Οι συγγραφείς έχουν δηλώσει ότι δεν υπάρχουν ανταγωνιστικά συμφέροντα

Εισαγωγή

παραλλαγές αριθμού αντιγραφής (CNV) είναι ένα μέρος της κανονικής Ανθρωπίνων γενετικής ποικιλομορφίας. Δεκάδες χιλιάδες CNVs έχουν αναφερθεί στη βάση δεδομένων του Γονιδιωματική παραλλαγές (DGV) βασίζονται σε δείγματα υγιούς ελέγχου [1,2]. Ωστόσο, CNVs είναι επίσης ένα σημαντικό στοιχείο της διακύμανσης του κινδύνου της νόσου και εμφάνιση πολλών ασθενειών και διαταραχών, συμπεριλαμβανομένου του καρκίνου, λοίμωξη HIV, αυτισμό, και των ψυχιατρικών ασθενειών [3-5]. Στον καρκίνο, CNV είναι ένα από τα πιο σημαντικά σωματικά εκτροπές βρέθηκε [6]. Σήμερα ανάλυση CNV έχει γίνει ένα κεντρικό μέρος της έρευνας για τον καρκίνο και πολλές μελέτες επικεντρώνονται στην ανίχνευση CNVs στο ανθρώπινο γονιδίωμα σε κανονικές και νοσούντων ιστών και κυττάρων. ([7,8], DGV (https://projects.tcag.ca/variation)). Σε κλινικές ένας αυξανόμενος αριθμός των CNV χρησιμοποιούνται για τη διάγνωση και εξατομικευμένη θεραπεία.

Αν και μεμονωμένα CNVs μπορεί να ανιχνευθεί με φθορίζοντα in situ υβριδισμού (FISH), ολόκληρο το γονιδίωμα ανίχνευση CNV απαιτεί μικροσυστοιχιών με βάση συγκριτική γονιδιωματική υβριδισμού (array CGH ) ή αλληλουχίας επόμενης γενιάς (NGS) πλατφόρμες [6]. Αυτές οι πλατφόρμες δημιουργούν πολύ μεγάλους όγκους δεδομένων, κάνοντας την ανάλυση πολύ δύσκολο. Ένα σημαντικό έργο της ανάλυσης των δεδομένων CNV είναι η αναγνώριση και χαρακτηρισμό ενώσεων μεταξύ CNVs και ασθένειες, οι οποίες μπορεί ενδεχομένως να οδηγείται από βιολογικά σχετικών μηχανισμών [9-11].

Αρκετές μελέτες συσχέτισης έχουν πραγματοποιηθεί για το σκοπό της σύνδεσης CNVs σε ασθένειες [7,8,12]. Για παράδειγμα, Σταμούλης et al. [11] επικεντρώνεται στις σχέσεις μεταξύ μονόχρωμων CNV εντός και μεταξύ χρωμοσώματα? Bussey et al. [12] εξέτασε τη συσχέτιση Pearson μεταξύ CNV και τα επίπεδα γονιδιακής έκφρασης. Ενώ οι περισσότερες μελέτες που σχετίζονται CNV με το προφίλ γονιδιακής έκφρασης, πολύ λίγα, αν υπάρχουν, έχουν γίνει προσπάθειες να συνδέσει μεταξύ CNVs διαφορετικών γονιδίων ανιχνεύθηκαν σε νοσούντα ιστό, αν και η αναγνώριση των ενώσεων μεταξύ των γονιδίων είναι εξαιρετικά σημαντική για την κατανόηση των βασικών βιολογικών διεργασιών και μοντελοποίηση γονίδιο ρυθμιστικών δικτύων. Στην εργασία αυτή ανέλαβε μια τέτοια προσέγγιση για την ανάλυση που σχετίζονται με τον καρκίνο των δεδομένων CNV. Το σκεπτικό ήταν ότι από την ίδρυσή CNV είναι μέρος της καρκινογένεσης, οι ενώσεις μεταξύ CNVs γονιδίων θα είναι ενδεικτική των ρόλων τους στην καρκινογένεση. Επιπλέον, η ταυτοποίηση των ενώσεων αυτών μπορεί να επιτρέψει τη δημιουργία ενός δικτύου γονιδίων των διαδικασιών οδήγηση νόσου.

Μέχρι σήμερα, οι πιο συχνά χρησιμοποιούμενες δοκιμασίες σύνδεσης με βάση το συντελεστή συσχέτισης του Pearson ή Spearman του. δοκιμή Pearson είναι ευαίσθητος προς τη γραμμική συνιστώσα σε μια σχέση μεταξύ δύο μεταβλητών, ενώ δοκιμή Spearman ανιχνεύει μονότονο σχέσεις, όπως ένα σιγμοειδές. Ως εκ τούτου, οι δύο δοκιμές δεν είναι σε θέση να ανιχνεύσει τις σχέσεις μη μονότονο, όπως σε σχήμα U, έλλειψη, ημιτονοειδής, κλπ Πρόσφατες μελέτες δείχνουν ότι οι ενώσεις του γονιδίου είναι συχνά μη-γραμμική και μη-μονότονη [13-15]? Ως εκ τούτου, προκειμένου να αποκτήσει μια πλήρη αμερόληπτη εικόνα όλων των ενώσεων γονιδίου πρέπει να εφαρμοστούν άλλες στατιστικές μεθόδους.

Πρόσφατα, προτάθηκαν διάφορα στατιστικά τεστ για την ανίχνευση κάθε είδους σχέσεων, συμπεριλαμβανομένων των μη-μονότονη αυτά. Ειδικότερα, Szekely et al. [16,17] πρότεινε ένα τεστ, που ονομάζεται dCov, με βάση την απόσταση συνδιακύμανσης και την απόσταση συσχέτιση? Reshef et al. [18] παρουσίασε ένα τεστ που βασίζεται σε ένα μυθιστόρημα μέτρο της εξάρτηση του συντελεστή μέγιστο αριθμό πληροφοριών (MIC)? και Heller et al. [19] πρότεινε μια δοκιμασία με βάση τάξεις των αποστάσεων, που ονομάζεται HHG. Οι εκτεταμένες μελέτες προσομοίωσης σύγκριση μεταξύ HHG, dCov, MIC, Spearman και Pearson έχουν πραγματοποιηθεί [13,19]. Τα κυριότερα συμπεράσματα τους ήταν ότι HHG είναι συνήθως πιο ισχυρή από ό, τι dCov και dCov είναι συνήθως πιο ισχυρή από ό, τι MIC σε μη-μονότονη ρυθμίσεις.

Εκτός από τους είναι μονοπαραγοντική εργαλεία ανάλυσης ικανά αναγνώρισης του ένα ευρύ φάσμα τύπων σύνδεσης , dCov και HHG ισχύουν επίσης για την πολυπαραγοντική ανάλυση, δηλαδή, τον έλεγχο για την εξάρτηση μεταξύ των μεταβλητών Χ και Υ, όταν τα Χ και Υ είναι φορείς και όχι μόνο μεταβλητές. Έτσι, αυτές οι δοκιμές μπορούν να χρησιμοποιηθούν για την ταυτοποίηση συσχετίσεων μεταξύ οδών ή μεταξύ ενός γονιδίου και μίας οδού, ακόμη και όταν το μέγεθος του δείγματος είναι πολύ μικρότερη από τη διάσταση του είτε Χ ή Υ

Ο δεύτερος στόχος αυτής της εργασίας ήταν αποδεικνύουν η αποτελεσματικότητα του τεστ ένωση, η οποία είναι επίσης ικανή να ανιχνεύει τις σχέσεις μη μονότονο, όπως dCov, MIC και HHG για την ανάλυση των δεδομένων ολόκληρη την ένωση του γονιδιώματος. Για το σκοπό αυτό χρησιμοποιήσαμε τις δοκιμές αυτές, παράλληλα με την πρότυπη δοκιμή Spearman και Pearson στην ανάλυση των δεδομένων που προέρχονται από CNV 60 ανθρώπινες κυτταρικές γραμμές καρκίνου (NCI-60) [12]. Έχουμε βρει ότι η εφαρμογή του τεστ ικανό να ανιχνεύει κάθε είδους σχέσεις, όπως dCov και HHG, για μονοπαραγοντική ανάλυση, οδηγεί σε αναγνώριση του διπλάσιες ενώσεις σε σύγκριση με εκείνα που βρέθηκαν από Spearman και Pearson μόνο. Οι περισσότερες από τις νέες ενώσεις ανιχνεύτηκαν με τη δοκιμή HHG. Επιπλέον, πολυπαραγοντική ανάλυση μέσω dCov και HHG ήταν σε θέση να συνδέσει μεταξύ γονιδίων άγνωστης λειτουργίας από το σύνολο δεδομένων μας και τις βασικές βιολογικές πορείες, παρέχοντας μια ένδειξη για τις πιθανές βιολογικές λειτουργίες αυτών των γονιδίων.

Οι μέθοδοι που παρουσιάζονται εδώ μπορεί να είναι χρήσιμη σε πολλές άλλες ρυθμίσεις που απαιτούν την ανίχνευση των ενώσεων των γονιδίων και των οδών, όπως η ανακατασκευή των δικτύων και των οδών, ένα σημαντικό έργο στη βιολογία συστημάτων [20]. Η μελέτη αυτή αποδεικνύει ότι με τη χρήση αυτών των μεθόδων οι ερευνητές μπορούν να αποκαλύψουν περισσότερες ενώσεις διαφόρων τύπων, και έτσι έχουν μια ευρύτερη εικόνα στη διάθεσή τους όταν προσπαθούν να μελετήσουν βιολογικά φαινόμενα.

Αποτελέσματα

Αναγνώριση γονίδιο- από-Gene Σύλλογοι

για να βρούμε συσχετίσεις μεταξύ του καρκίνου που σχετίζονται με CNVs, χρησιμοποιήσαμε δεδομένα CNV που λαμβάνονται από ένα array CGH από 60 ανθρώπινες καρκινικές κυτταρικές σειρές (το NCI-60? [12]). Εντός του array CGH επιλέξαμε κλώνους που έχουν γνωστά σύμβολα γονίδιο και, για λόγους συνέπειας, κανένα τιμές που λείπουν σε κάθε κυτταρική γραμμή. Το αποτέλεσμα περιείχε 99 γονίδια. Εκτός από τις παραδοσιακές εξετάσεις σύνδεσης, Spearman και Pearson, εφαρμόσαμε τρεις δοκιμές, dCov, MIC και HHG, τα οποία είναι επίσης ικανή να ανιχνεύει τις σχέσεις μη μονότονο. Μια ένωση θεωρήθηκε σημαντική εάν το FDR προσαρμοσμένη τιμή p ήταν μικρότερη από 0,05 χρησιμοποιώντας τη διαδικασία Benjamini-Hochberg [21]. Από 4851 ζεύγη συγκρίσεις, Pearson ή Spearman εντοπιστεί 254 σημαντικές ενώσεις, dCov εντοπιστεί 256, MIC εντοπιστεί 157 και HHG εντοπιστεί 400 σημαντικές ενώσεις (βλέπε Σχήμα 1, Πίνακας 1, S1 σχήμα, και S1 πίνακα για τα λεπτομερή αποτελέσματα). Σύγκριση των τριών δοκιμών ικανή να ανιχνεύει κάθε είδους σχέσεις, δηλαδή dCov, MIC και HHG, αποκάλυψε ότι μοιράζονται 139 κοινά σημαντικά αποτελέσματα. Επιπλέον, 44 σύλλογοι βρέθηκαν σημαντικές μόνο από dCov? 11 μόνο από MIC και 183 μόνο από HHG (S1 σχήμα, πάνω δεξιά). Συγκρίνοντας Pearson και Spearman με dCov και HHG αποκάλυψε ότι το 29 σημαντικές συσχετίσεις έχουν ανακαλυφθεί μόνο από Pearson ή Spearman, μόνο 10 αποκλειστικά από dCov ενώ 184 είχαν ανακαλυφθεί μόνο από HHG (Σχήμα 1).

MIC είχε αποκλειστεί λόγω του μικρό αριθμό σημαντικών ευρημάτων που παρέχεται από αυτή τη μέθοδο. Το εμβαδόν κάθε οβάλ αντιπροσωπεύει τον αριθμό των σημαντικών δοκιμών της κάθε μεθόδου, και διασταυρώσεις (τονίζεται με διαφορετικά χρώματα) αντιπροσωπεύουν κοινές ανακαλύψεις. Προφανώς, Pearson ή Spearman, dCov και HHG μερίδιο 185 ανακαλύψεις? 184 δοκιμές ήταν σημαντικές από HHG αλλά όχι από Pearson, Spearman ή dCov? 10 δοκιμές ήταν σημαντικές από dCov και όχι από Pearson, Spearman ή HHG? 29 δοκιμές ήταν σημαντικές από Pearson ή Spearman, αλλά όχι από dCov ή HHG? dCov και HHG μοιράζονται 26 ανακαλύψεις? Pearson ή Spearman και dCov μοιράζονται 35 ανακαλύψεις? και Pearson ή Spearman και HHG μοιράζονται μόνο 5 ανακαλύψεις.

Η

Από τον αριθμό των σημαντικών στατιστικών ενώσεις που βρέθηκαν από dCov, MIC ή HHG, αλλά όχι από Pearson ή Spearman, ο αριθμός βρέθηκε από HHG ήταν εξαιρετικά μεγάλο. Συγκεκριμένα, ενώ ο αριθμός των σημαντικών ενώσεων μοιράζονται Pearson ή Spearman και HHG είναι 190, Pearson και Spearman έχασε 210 ενώσεις που βρέθηκαν από HHG, ενώ HHG έχασε μόνο 64 ενώσεις που βρέθηκαν από Pearson ή Spearman. Στην παραπάνω ανάλυση, συνδυάσαμε τα αποτελέσματα Pearson και Spearman του που είχε προσαρμοσμένη τιμή p μικρότερη από 0,05, σαν να ήταν μια ενιαία μέθοδο, έστω και αν αυτό δίνει συνέχεια ένα πλεονέκτημα σε σχέση με άλλες μεθόδους. Με δεδομένο αυτό, είναι ακόμη πιο ενδιαφέρον το γεγονός ότι HHG Βρήκαμε 57% περισσότερες ενώσεις στη συνέχεια Pearson και Spearman. Ως εκ τούτου, καταλήγω στο συμπέρασμα ότι η ανάλυση που βασίζεται στις παραδοσιακές δοκιμές σύνδεσης Pearson και Spearman θα μπορούσε να λείπει ένα σημαντικό ποσοστό του συνόλου των πιθανών συσχετίσεων μεταξύ γονιδίων.

Για να καταδειχθεί η βιολογική σημασία των ενώσεων ανιχνεύεται από HHG πήραμε μια πιο προσεκτική ματιά στους ανιχνεύονται συνδέονται ζεύγη γονιδίων. Ένα παράδειγμα μιας ένωσης που βρέθηκαν μόνο από HHG είναι η ένωση μεταξύ των γονιδίων LYN και CTSB (Σχήμα 2). LYN κωδικοποιεί μία μη-υποδοχέα κινάσης τυροσίνης-πρωτεΐνης, έναν ρυθμιστή πολλών μονοπατιών μεταγωγής σήματος, ενώ CTSB κωδικοποιεί καθεψίνη Β, μία θειόλη πρωτεάση που συμμετέχουν σε ενδοκυτταρική αποικοδόμηση και ο κύκλος εργασιών των πρωτεϊνών. Δεν απευθείας βιολογικές αλληλεπιδράσεις μεταξύ αυτών των δύο πρωτεϊνών είναι γνωστές, ωστόσο οι δύο αλληλεπιδρούν άμεσα με μία τρίτη πρωτεΐνη, σφιγγοσινικής κινάσης 1 (SPHK1). SPHK1 καταλύει την φωσφορυλίωση της σφιγγοσίνης προς σχηματισμό σφιγγοσίνης-1-φωσφορικής (S1P), ένα βασικό μόριο σηματοδότησης σφιγγολιπίδιο που εμπλέκονται στην κυτταρική ανάπτυξη, την επιβίωση, τη διαφοροποίηση και την κινητικότητα. Η αλληλεπίδραση μεταξύ LYN και SPHK1 είναι απαραίτητη για την ενεργοποίηση των SPHK1 [22]. Από την άλλη πλευρά, η αλληλεπίδραση μεταξύ Cathespin Β και SPHK1 έχει δειχθεί ότι ρυθμίζει προς τα κάτω τα επίπεδα SPHK1

in vivo

[23] και για να το διασπάσει

in vitro

[24]. Αυτό πειραματικά δεδομένα αποδεικνύουν ότι η σχέση μεταξύ LYN και CTSB προσδιορίζονται από HHG είναι πράγματι βιολογικά σχετικό. Επιπλέον, η ύπαρξη της σχέσης μεταξύ CNV των LYN και CTSB σημεία για να LYN- SPHK1 και CTSB- SPHK1 αλληλεπιδράσεις ως σημαντική για την καρκινογένεση

Πρώτη γραμμή αποτελείται από τρεις ευρήματα μόνο από Spearman ή Pearson.? δεύτερη, μόνο από HHG? τρίτο, μόνο από dCov? και το τέταρτο, μόνο με MIC. Οι Ρ-τιμές (μετά την προσαρμογή για πολλαπλές δοκιμές) δηλώνεται σε κάθε οικόπεδο.

Η

Ένα άλλο παράδειγμα για μια ένωση που βρέθηκαν μόνο από HHG είναι η ένωση μεταξύ των γονιδίων CDKN1A και TKT (Σχήμα 2). κωδικοί CDKN1A για CDK-πρωτεΐνη αλληλεπίδρασης 1 (ρ21), ένας ισχυρός αναστολέας κινάσης που εξαρτάται από κυκλίνη, που ρυθμίζει την εξέλιξη του κυτταρικού κύκλου μέσω της G1 /S σημείο ελέγχου. κωδικοί TKT για transketolase, ένα κεντρικό ένζυμο της οδού της φωσφορικής πεντόζης. Η συσχέτιση μεταξύ CDKN1A και TKT ανιχνεύεται από HHG αντανακλά στην πραγματικότητα μια σχέση μεταξύ των οδών αυτά τα δύο γονίδια που ανήκουν. Μετά την πρόοδο του κυτταρικού κύκλου από G1 προς τη φάση S, υπάρχει μια άνω ρύθμιση του οδού της φωσφορικής πεντόζης, η οποία είναι υπεύθυνη για την παραγωγή ριβόζη-5-φωσφορικό άλας (R5p), που απαιτούνται για τη σύνθεση των νουκλεοτιδίων και των νουκλεϊκών οξέων [25] . Όλα τα γονίδια στα παραδείγματα παραπάνω βρίσκονται σε διαφορετικά χρωμοσώματα ή μακριά ο ένας από τον άλλο στο ίδιο χρωμόσωμα? ως εκ τούτου, η φυσική εγγύτητα δεν μπορεί να εξηγήσει τις ενώσεις CNV-based.

Αναγνώριση της λειτουργίας των γονιδίων χρησιμοποιώντας πολυπαραγοντική δοκιμές σύνδεσης

Ανίχνευση των ενώσεων μεταξύ των ζευγών των γονιδίων από μονοπαραγοντική ανάλυση είναι μια καλή αρχή προς την κατεύθυνση που απορρέουν βιολογικές πληροφορίες από δεδομένα CNV, όπως φαίνεται παραπάνω. Ωστόσο, όταν πρόκειται για ένα μεγάλο αριθμό γονιδίων, η λειτουργία και η σχέση με βιολογικές οδούς πολλών γονιδίων είναι συχνά άγνωστη. Η εύρεση ενώσεων με γνωστά γονίδια μπορεί να ρίξει φως στην πιθανή λειτουργία τους, αλλά και πολυπαραγοντική ανάλυση θα μπορούσε να παρέχει πρόσθετες σημαντικές πληροφορίες. Ως εκ τούτου, έχουμε εφαρμόσει τις πολυπαραγοντική δοκιμές για την εξάρτηση μεταξύ αρκετών γονιδίων άγνωστης λειτουργίας στο σύνολο δεδομένων μας και γνωστές οδούς, χρησιμοποιώντας δοκιμές πολυπαραγοντική dCov και HHG. Συγκεκριμένα, από τις 99 γονιδίων σε σύνολο δεδομένων μας, δώδεκα γονίδια δεν έχουν καμία γνωστή λειτουργία ή σχέση με ένα βιολογικό μονοπάτι (Σχήμα 3), όπως προσδιορίζεται με τη χρήση KEGG οδού ([26,27]? https://www.genome.jp/kegg /εργαλείο /map_pathway1.html). Για την ανίχνευση των ενώσεών τους με γνωστά μονοπάτια, έχουμε την πρώτη ανάθεση το υπόλοιπο των γονιδίων σε οδούς με βάση KEGG οδού mapper (S2 Πίνακα), και στη συνέχεια επέλεξε οκτώ πειραματικά αποδεδειγμένο βιολογικά μονοπάτια που περιέχουν τουλάχιστον πέντε γονίδια από το σύνολο δεδομένων μας (Σχήμα 3). Επιπλέον, η οδός της απόπτωσης, είναι ένας από τους βασικούς μηχανισμούς που σχετίζονται με τον καρκίνο, συμπεριλήφθηκε στη μελέτη μας, ακόμη και αν έχουν μόνο δύο γονίδια από το σύνολο δεδομένων μας έχουν ανατεθεί. Στη συνέχεια, θα δοκιμαστεί για τις ενώσεις μεταξύ κάθε ζεύγους γονιδίων-μονοπάτι μεταξύ των δώδεκα γονιδίων και εννέα μονοπάτια. Εφαρμόσαμε dCov και HHG που ήταν, από τις δοκιμές που χρησιμοποιήσαμε παραπάνω, τα δύο μόνο δοκιμές ικανή πολυπαραγοντική ανάλυση, δηλαδή, τη δοκιμή σύνδεσης μεταξύ των φορέων (περισσότερες πληροφορίες διατίθενται στα Υλικά και Μέθοδοι τμήμα). Συνολικά, 108 δοκιμές πραγματοποιήθηκαν με κάθε μέθοδο και ένα αποτέλεσμα της δοκιμής θεωρήθηκε σημαντική, αν FDR προσαρμοσμένη τιμή p ήταν μικρότερη από 0,05 χρησιμοποιώντας τη διαδικασία Benjamini-Hochberg [21]. Από τα δώδεκα γονίδια, έξι γονίδια έδειξε σημαντικές συσχετίσεις με μονοπάτια (Σχήμα 3Α και S3 πίνακα).

Στο πάνελ Α και Β, τα γονίδια (στα αριστερά) και μονοπάτια (στα δεξιά) αναλύθηκαν για σύνδεση με HHG και dCov. Οι σημαντικές συσχετίσεις (μετά την προσαρμογή για πολλαπλές δοκιμές) που συνδέονται με γραμμές: διακεκομμένη για HHG, διάστικτη για dCov, και τα στερεά και για τα δύο. Α) σημαντικές συσχετίσεις μεταξύ γονιδίων με άγνωστη λειτουργία και σχετίζονται με τον καρκίνο μονοπάτια. Οι ενώσεις που βρέθηκαν από dCov και HHG σήμανση. Β) Σημαντικές συσχετίσεις μεταξύ γονιδίων με γνωστά λειτουργία και σχετίζονται με τον καρκίνο μονοπάτια. Μόνο οι ενώσεις που βρέθηκαν από dCov εμφανίζονται ως σημαντικές ενώσεις βρέθηκαν από HHG.

Η

Δύο γονίδια, LRRC32 και SPI1, βρέθηκαν να σχετίζονται με τις περισσότερες από τις οδούς, γεγονός που υποδηλώνει ότι θα μπορούσε να είναι ενδιάμεσα μεταγωγής σήματος , που ρυθμίζουν προς τα κάτω στόχοι που ανήκουν σε αυτές τις πορείες. Τα ευρήματα αυτά είναι σε συμφωνία με τα αποτελέσματα της μονοπαραγοντική ανάλυση, η οποία σχετίζεται σημαντικά και τα δύο γονίδια με σερίνη /θρεονίνη ΡΑΚ1 κινάσης και το γονίδιο SPI1 επίσης με HRAS, ένα ΟΤΡάσης της οικογένειας RAS. Πράγματι, σύμφωνα με KEGG μονοπάτι mapper ΡΑΚ1 και HRAS ανήκουν τα περισσότερα από τα μονοπάτια με τα οποία βρέθηκαν LRRC32 και SPI1 να συνδέονται. Επιπλέον, τόσο ΡΑΚ1 και HRAS εμπλέκονται στη μεταγωγή των σημάτων πολλαπλασιασμού και miss-ρύθμισή τους οδηγεί σε μη φυσιολογική μεταγωγή σήματος και τον καρκίνο [28,29]. Έτσι, ενώ μια μονοπαραγοντική ανάλυση θα μπορούσε να βρει συσχέτιση μεταξύ γονιδίων άγνωστης λειτουργίας και μεμονωμένα γονίδια με γνωστή λειτουργία, η παραπάνω πολυπαραγοντική ανάλυση θα μπορούσε να επισημάνει τις ενώσεις τους με βιολογικές διεργασίες.

Η υπόλοιπα τέσσερα που σχετίζεται γονίδια, AFF2, CLCN5, MYCN, και TCL1A, βρέθηκαν να σχετίζονται καθένα σε ένα ή δύο συγκεκριμένα μονοπάτια υποδηλώνοντας ότι αποτελούν καθοδικούς τελεστές σε αυτές τις πορείες (βλέπε παραδείγματα παρακάτω). Δεν συσχετίσεις βρέθηκαν μεταξύ των άλλων έξι γονίδια και οποιοδήποτε από τα μονοπάτια.

Στην πολυπαραγοντική ανάλυση που εφαρμόζεται πάνω σε γονίδια άγνωστης λειτουργίας, dCov και HHG ανακαλύψει παρόμοιο αριθμό σημαντικών πολυμεταβλητή σχέσεων, 15 από dCov, και 13 με HHG, ενώ 8 ανιχνεύθηκαν με τις δύο μεθόδους. Ως εκ τούτου, η ανάλυση μας δεν αποκάλυψε καμία σαφή απόδειξη της ανωτερότητας μιας μεθόδου πάνω στο άλλο σε αυτή την συγκεκριμένη εφαρμογή.

Εκτός από την πολυμεταβλητή ανάλυση εφαρμόζεται σε γονίδια άγνωστης ρόλο στον καρκίνο, πήραμε δύο γονίδια από το σύνολο δεδομένων , PIK3CA και MSH2, οι οποίες έχουν συσταθεί βιολογική λειτουργία και δεν ανήκουν σε καμία από τις οκτώ οδών σύμφωνα με KEGG, και εκτελούνται γονίδιο-μονοπάτι πολυπαραγοντική δοκιμές του συνεταιρίζεσθαι dCov και HHG, παρόμοιες με εκείνες που εκτελούνται παραπάνω για τα γονίδια άγνωστης λειτουργίας. Ενώ dCov βρέθηκαν 13 σημαντικά αποτελέσματα, HHG βρέθηκε κανένα (Σχήμα 3Β και S4 πίνακα).

Οι ενώσεις, που ανιχνεύεται από dCov, μεταξύ MSH2 και του κυτταρικού κύκλου, απόπτωση, εστιακή πρόσφυση, RAS, WNT και μονοπάτια ακτίνης είναι συνεπείς με τη λειτουργία του στην επισκευή ασυμφωνία του DNA και τη σύνδεσή της με την κυτταρική διαίρεση [31]. Ομοίως, οι ενώσεις μεταξύ PIK3CA, καθώς και τις ακόλουθες οδούς: Οι απόπτωση, ακτίνη, Focal πρόσφυση, σηματοδότηση FOXO, σηματοδότηση του υποδοχέα των Τ κυττάρων, καθοδήγηση Axon και Wnt (Σχήμα 3Β και S4 πίνακα) που υποστηρίζεται από μεγάλη βιολογικών δεδομένων [32-35]. Η σχέση του PIK3CA σε αυτά τα μονοπάτια, καθώς και κεντρικό ρόλο σε ανθρώπινους καρκίνους, είναι συνέπεια του ότι είναι ένας βασικός παράγοντας στην ενεργοποίηση των καταρρακτών που εμπλέκονται στην κυτταρική ανάπτυξη, την επιβίωση, τον πολλαπλασιασμό, κινητικότητα και μορφολογία [36] σηματοδότησης. Η ασυμφωνία στα σημερινά αποτελέσματα των dCov και HHG (Σχήμα 3Β) οφείλεται στην γραμμική φύση της σχέσης μεταξύ αυτών των γονιδίων και των οδών, καθώς και το γεγονός ότι η δύναμη της HHG είναι στην εξεύρεση σχέσεις μη μονότονο. Για παράδειγμα, dCov ανακάλυψε σημαντική συσχέτιση μεταξύ PIK3CA και την πορεία καθοδήγηση Axon. Ανατρέχοντας στην μονοπαραγοντική ανάλυση (S1 πίνακα) βλέπουμε ότι PIK3CA βρέθηκε να σχετίζεται σημαντικά με HRAS, το οποίο ανήκει στο μονοπάτι καθοδήγηση Axon, και η συσχέτιση αυτή βρέθηκε επίσης από Pearson ή Spearman. Τέτοια αποτελέσματα δείχνουν ισχυρή γραμμική σχέση μεταξύ PIK3CA και HRAS (Σχήμα 4). Ομοίως, η ένωση βρέθηκε από dCov, αλλά όχι από HHG, μεταξύ MSH2 και των Ras μονοπάτι σηματοδότησης μπορεί να εξηγηθεί από τη σημαντική συσχέτιση βρέθηκε από Pearson ή Spearman μεταξύ MSH2 και γονίδιο REL, το οποίο ανήκει σε αυτό το μονοπάτι (S1 πίνακα και το σχήμα 4 ). Αναμένεται ότι γνωστές σχέσεις μεταξύ των γονιδίων που ανακαλύφθηκε από εργαστηριακές μεθόδους (όπως συν-IP) ή με βιοπληροφορική ανάλυση των δεδομένων υψηλής απόδοσης που βασίζεται στην κλασική γραμμική ή μεθόδους μονότονο προσανατολισμό θα πρέπει να μεροληπτεί έντονα προς γραμμική ή μονότονο σχέσεις.

οικόπεδα διασπορά των PIK3CA έναντι HRAS (αριστερό πάνελ) και MSH2 έναντι REL (δεξιά πλευρά).

η

Συνολικά, τα αποτελέσματα αυτά παρέχουν μια απόδειξη της έννοιας για την ικανότητα της πολυπαραγοντική ανάλυση για να αποκαλύψει βιολογικά σχετικό γονίδιο -pathway ενώσεις.

Συζήτηση

στην εργασία αυτή ανέλαβε μια νέα προσέγγιση για ολόκληρο το γονιδίωμα ανάλυση CNV, με στόχο να προσδιορισμός των ενώσεων μεταξύ CNV διαφορετικών γονιδίων (CNV-CNV) σε όλη 60 ανθρώπινων καρκινικών κυτταρικών σειρών. Χρησιμοποιήσαμε μοντέρνα δοκιμές ένωση που μπορεί να ανιχνεύσει μη γραμμικών και μη-μονότονο ενώσεις και τις εφάρμοσε σε μονοπαραγοντική ρυθμίσεις, σε μια προσπάθεια να εντοπιστούν οι ενώσεις γονίδιο-γονιδίου. Τους χρησιμοποιούνται επίσης στην πολυμεταβλητή ρυθμίσεις, σε μια προσπάθεια να εντοπιστούν οι ενώσεις των γονιδίων άγνωστης λειτουργίας με τις καθιερωμένες σχετίζονται με τον καρκίνο μονοπάτια.

Συλλογικά, μονοπαραγοντική ανάλυση μας δείχνει ότι οι ενώσεις μεταξύ CNV των γονιδίων που βρέθηκαν από HHG αντικατοπτρίζει την πραγματική βιολογικών διεργασιών . Αυτό υποδηλώνει ότι η μονοπαραγοντική ανάλυση με τη βοήθεια στατιστικών δοκιμών οι οποίες στοχεύουν μόνο γραμμική ή μονότονο ενώσεις μπορεί να οδηγήσει σε πολλά βιολογικά σημαντικά ευρήματα που απομένει unrevealed. Επιπλέον, σε αυτό το σύνολο δεδομένων, η ανωτερότητα της δοκιμής HHG πάνω από τα άλλα τεστ ικανό να ανιχνεύσει τις σχέσεις μη μονότονο είναι προφανής.

Στην πολυπαραγοντική ρύθμιση, η διαφορά μεταξύ των άκρως συνδεδεμένων γονιδίων (LLRC32 και SPI1) και οι άλλες τέσσερις συνδέονται γονιδίων είναι ένα παράδειγμα του πώς πολυμεταβλητή ανάλυση μπορεί υπονοούν την θέση ενός γονιδίου μέσα σε ένα μονοπάτι. Εφαρμόζεται σε ένα μεγαλύτερο σύνολο δεδομένων και συνδυάζεται με μονοπαραγοντική ανάλυση, η ανάλυση αυτή θα επέτρεπε ακόμη πιο εκλεπτυσμένη τοποθέτηση ενός γονιδίου μέσα σε ένα μονοπάτι.

Έξι γονίδια δεν συνδέουν με οποιαδήποτε από τις οδούς. Αυτό μπορεί να οφείλεται σε διάφορους λόγους? ένας από αυτούς είναι ο περιορισμένος αριθμός των βιολογικών οδών με τις οποίες συνδέονταν τα γονίδια άγνωστης λειτουργίας, ως συνέπεια ενός περιορισμένου αριθμού γονιδίων (99) με πλήρη δεδομένα CNV στη βάση δεδομένων που χρησιμοποιείται για αυτή τη μελέτη. Ένας άλλος λόγος μπορεί να είναι τα περιορισμένα βιολογικά δεδομένα που αναφέρονται στο KEGG, ωστόσο, η κατάσταση αναμένεται να βελτιωθεί σημαντικά στο εγγύς μέλλον λόγω της συνεχούς συσσώρευσης των δεδομένων από τις μελέτες της βιολογίας συστημάτων.

Σε περίπτωση LRRC32 και SPI1 συζητήθηκε παραπάνω, οι μονοπαραγοντική και πολυπαραγοντική αποτελέσματα αλληλοσυμπληρώνονται, όπως διαπιστώθηκε αυτά τα γονίδια να συνδέονται με μονοπάτια από την πολυπαραγοντική ανάλυση και στα συγκεκριμένα μέλη αυτών των μονοπατιών από την μονοπαραγοντική ανάλυση. Ωστόσο, είναι σημαντικό να σημειωθεί ότι αυτό δεν είναι ένα γενικό κανόνα. Ως μια πολυπαραγοντική δοκιμασία της ανεξαρτησίας προσδιορίζει εξάρτησης μεταξύ των δύο φορέων, ενώ μια μονοπαραγοντική μέθοδος βρόχων μόνο κατά ζεύγη των στοιχείων και των δοκιμών για την εξάρτηση μεταξύ κάθε ζεύγους των μεταβλητών. Ως εκ τούτου, είναι δυνατόν να ληφθεί μη σημαντική μονοπαραγοντική δοκιμές, αλλά μια σημαντική πολυμεταβλητή δοκιμής για το ίδιο σύνολο δεδομένων. Στην πραγματικότητα υπάρχει πιθανότητα χωρίς σύνδεση μεταξύ δύο οποιωνδήποτε μεμονωμένων γονιδίων και ακόμη ενός πολυμεταβλητή σύνδεσης με την πλήρη οδό. Αυτό μπορεί να συμβεί λόγω των συνδυασμένων επιπτώσεων των μεταβλητών στην πολυπαραγοντική δοκιμασία. Για παράδειγμα, AFF2 βρέθηκε να σχετίζεται σημαντικά με την οδό καθοδήγηση άξονα (προσαρμοσμένη τιμή p = 0,022) από πολυπαραγοντική ανάλυση, ενώ δεν υπάρχουν σημαντικές συσχετίσεις μεταξύ AFF2 και οποιοδήποτε από τα γονίδια που αποτελούν το μονοπάτι καθοδήγηση νευράξονα βρέθηκαν από την μονοπαραγοντική ανάλυση. Αυτό μπορεί να είναι το αποτέλεσμα της αδύναμης συσχετίσεις μεταξύ AFF2 και των μελών της οδού, ή, εναλλακτικά, λόγω της ισχυρής σύνδεσης με ένα μέλος μονοπάτι που δεν είχε συμπεριληφθεί στα δεδομένα. Σε κάθε περίπτωση, ο ανακάλυψε πολυπαραγοντική ανάλυση σύνδεσης γονίδιο-μονοπάτι δεν μπορούσε να συναχθεί με βάση τα αποτελέσματα μονοπαραγοντική ανάλυση.

Στην αντίθετη περίπτωση, τα δύο γονίδια, Α και Β, μπορεί να σχετίζεται με μονοπαραγοντική ανάλυση, ενώ καμία συσχέτιση μεταξύ του γονιδίου Α και το γονίδιο Β μονοπάτι ανήκει βρίσκεται από πολυπαραγοντική ανάλυση. Για παράδειγμα CLCN5 βρέθηκε από την μονοπαραγοντική ανάλυση πρέπει να συνδέονται με την ΚΟΑ και BCL2, δύο εκ των οποίων ανήκουν στο Focal μονοπάτι πρόσφυσης, το οποίο δεν συνδέεται με CLCN5 από πολυπαραγοντική δοκιμές. Μια πολυπαραγοντική ανάλυση έδειξε, ωστόσο, συσχετίσεις μεταξύ CLCN5 και την καθοδήγηση και RAS μονοπάτια Axon (Σχήμα 3). Και οι δύο αυτές πορείες περιέχουν ΚΟΑ, το μόνο μέλος οδός βρέθηκε να σχετίζεται με CLCN5 από την μονοπαραγοντική ανάλυση. Τέτοια αποτελέσματα αναμένονται από το ΜΕΤ είναι ένας υποδοχέας κινάσης τυροσίνης, μεταγωγή σημάτων από έξω από το κύτταρο, και ως εκ τούτου είναι στην ίδια την έναρξη πολλών μονοπατιών, ενώ BCL2 είναι ένα τερματικό πρωτεΐνη σε πολλές οδούς. Αυτό σημαίνει ότι μια μονοπαραγοντική σύνδεσης με τους δεν είναι αρκετά ισχυρή για να ανιχνευθεί μια ένωση οδό. Επιβεβαίωση ότι CLCN5 CNVs συνδέονται με την οδό καθοδήγηση Axon προέρχεται από την παρατήρηση ότι το 65,9% των καρκίνων του κεντρικού νευρικού συστήματος έχουν μια απώλεια ενός ή δύο αντίγραφα του γονιδίου CLCN5 (COSMOS, [30]).

Αυτά παραδείγματα καταδεικνύουν την πιθανή πλεονέκτημα της πολυπαραγοντική δοκιμές της ανεξαρτησίας πάνω μονομεταβλητών δοκιμές, όταν ο στόχος είναι η εξεύρεση μιας σχέσης μεταξύ ενός γονιδίου και μια ομάδα γονιδίων, όπως ένα μονοπάτι, ή να βρουν μια ένωση μεταξύ δύο ομάδες γονιδίων (π.χ. δύο οδών). Σε γενικές γραμμές, προκειμένου να αποκτήσει μια πλήρη εικόνα, τόσο ένωση δοκιμές θα πρέπει να εφαρμόζονται οι τύποι.

Η dCov και οι δοκιμές HHG είναι δοκιμές μετάθεση, και ο υπολογισμός των πολλών δοκιμών αυτών μπορεί να είναι υπολογιστικά δύσκολο. Διανομής χωρίς μονοδιάστατες δοκιμές γεύση παρόμοια με HHG πρόσφατα εισήχθη στο [37]. Οι δοκιμές αυτές μπορεί να είναι χρήσιμες εναλλακτικές λύσεις για τη δοκιμή HHG όταν ένας μεγάλος αριθμός των μονομεταβλητών δοκιμών εξετάζονται ταυτόχρονα

Εν κατακλείδι, τα αποτελέσματά μας υποδεικνύουν: (1). Πολυπαραγοντική ανάλυση είναι ένα πολύ χρήσιμο εργαλείο για αποδίδουν βιολογικούς ρόλους για τα γονίδια άγνωστης λειτουργίας? (2) μονοπαραγοντική ανάλυση όλων, δηλαδή με τη χρήση τεστ που ανιχνεύουν όλους τους τύπους των σχέσεων, θα μπορούσε να αποκαλύψει πολλά νέα σημαντικές ενώσεις που δεν μπορεί να ανιχνευθεί από τα κοινά γραμμική και σύνδεσης μονότονο δοκιμές? (3) Η δοκιμή HHG ξεπέρασε όλες τις άλλες δοκιμές για την εξεύρεση μονοπαραγοντική συλλόγους? Και το πιο σημαντικό, (4) Χρησιμοποιώντας έναν συνδυασμό πολλών μεταβλητών και μονομεταβλητών ενώσεις τεστ μπορεί να αποκαλύψει σημαντικές πληροφορίες σχετικά με δίκτυα γονιδίων και, στο σημερινό πλαίσιο, σχετικά με τις διαδικασίες καρκίνο οδήγηση.

Υλικά και Μέθοδοι

CNV βάσεις δεδομένων

Συγκριτική γονιδιωματική υβριδοποίησης (CGH) δεδομένα από ένα πάνελ 60 ανθρώπινων καρκινικών κυτταρικών σειρών (το NCI-60) ελήφθη από [12,38]. Το CGH περιέχει 349 κλώνους. Μετά την αφαίρεση των κλώνων με τις τιμές που λείπουν και οι κλώνοι με σύμβολα άγνωστο γονίδιο, η ανάλυση μας διεξήχθη σε ένα σύνολο 99 CGH κλώνοι, που αντιπροσωπεύουν το 99 γονίδια. S5 πίνακας περιέχει aCGH ανεπεξέργαστα δεδομένα από το NCI-60.

μονοπαραγοντική ανάλυση

ανάλυση σύνδεσης πραγματοποιήθηκε στις 99 κλώνων με βάση τον αριθμό αντιγράφων τους σε κάθε μία από τις 60 κυτταρικές σειρές από NCI-60. Δοκιμάσαμε όλα τα πιθανά ζεύγη ενώσεων μεταξύ των 99 κλώνων, δημιουργώντας 4851 ζεύγη. Χρησιμοποιήσαμε τις ακόλουθες δοκιμές της ανεξαρτησίας: (i) δοκιμασία με βάση το συντελεστή συσχέτισης Pearson [39] (ii) δοκιμή με βάση Spearman rank συντελεστή συσχέτισης [40] (iii) απόσταση συνδιακύμανση (dCov) [16,17]? (Iv) συντελεστής μέγιστο αριθμό πληροφοριών (MIC) [18]? και (v) δοκιμασία βασίζεται σε τάξεις αποστάσεων (HHG) [19]. Για κάθε μέθοδο που προσαρμόζεται για πολλαπλές συγκρίσεις με FDR των Benjamini και Hochberg [21], και το αποτέλεσμα της δοκιμής θεωρείται ως σημαντική εάν προσαρμοσμένη τιμή p ήταν μικρότερο ή ίσο του 0,05.

Στη συνέχεια παρέχουμε περίληψη των δοκιμών. Ας υποθέσουμε ότι έχουμε

Ν

ανεξάρτητες παρατηρήσεις (

X

i

,

Y

i

),

i

= 1, …,

Ν

, από την κοινή διανομή (

X

,

Y

),

X

,

Y

R

και στόχος μας είναι να ελέγξετε αν υπάρχει σχέση μεταξύ των

X

και

Y

.

εγώ. Pearson συντελεστής συσχέτισης.

Το δείγμα Pearson συντελεστής συσχέτισης, που συμβολίζεται με

r

p

, είναι givenwhere και ορίζεται ομοίως με βάση

Y

1, …,

Y

Ν

. Η αξία των

r

p

είναι μεταξύ -1 και 1.

r

p

ισούται με 1 ή -1 αντιστοιχεί σε σημεία δεδομένων που βρίσκεται ακριβώς πάνω σε μια γραμμή. Η τιμή 0 σημαίνει ότι δεν υπάρχει γραμμική συσχέτιση μεταξύ του

X

και

Y

. Αν (

X

,

Y

) ακολουθεί την διμεταβλητή κανονική κατανομή, υπό την μηδενική υπόθεση της μη γραμμικής σχέσης μεταξύ

X

και

Y

(π.χ. η πραγματική συντελεστής συσχέτισης ισούται με 0), ακολουθεί

t

κατανομή του Student με το

Ν

– 2 βαθμούς ελευθερίας [39]. Αυτό Φοιτητών

t

διανομής κατέχει επίσης περίπου, αν η κατανομή των (

X

,

Y

) δεν είναι φυσιολογικό, αλλά το μέγεθος του δείγματος είναι αρκετά μεγάλο. Εφαρμόσαμε αυτό το τεστ με τη χρήση του cor.test συνάρτηση με τη μέθοδο της παραμέτρου = ‘Pearson »στο πακέτο

στατιστικά

του R (https://www.r-project.org).

ii. Spearman συντελεστής συσχέτισης.

Spearman συντελεστής συσχέτισης, που συμβολίζεται με

r

s

, ορίζεται ομοίως να

r

σ

, αλλά αντί να χρησιμοποιούν τις παρατηρούμενες τιμές που χρησιμοποιούνται στις τάξεις τους [40]. Σε περίπτωση δεμένα αξιών, ένα βαθμό ίσο με το μέσο όρο των θέσεών τους στην αύξουσα σειρά των τιμών έχει εκχωρηθεί. Η τιμή 1 ή -1 για

r

s αντιστοιχεί στην περίπτωση κατά την οποία

X

και

Υ

είναι τέλεια λειτουργίες μονότονο από την άλλη. Κάτω από τη μηδενική υπόθεση της μη σχέσης μονότονο μεταξύ των μεταβλητών και μεγάλο μέγεθος δείγματος, ακολουθεί

t

κατανομή του Student με το

Ν

– 2 βαθμούς ελευθερίας [40]. Εφαρμόσαμε αυτό το τεστ με τη χρήση του cor.test συνάρτηση με τη μέθοδο της παραμέτρου = ‘Spearman »στο πακέτο

στατιστικά

του R (https://www.r-project.org).

iii. . Η δοκιμή dCov

Η δοκιμή απόστασης συνδιασποράς [16,17] χρησιμοποιεί όλα τα ζεύγη Ευκλείδεια απόσταση

μια

ij

= |

X

You must be logged into post a comment.