PLoS One: ποσοτικά μέτρα Δίκτυο ως βιοδείκτες για την ταξινόμηση του καρκίνου του προστάτη Νόσος μελών: Συστήματα Μια προσέγγιση για την Διαγνωστικό Biomarkers


Αφηρημένο

Ο εντοπισμός διαγνωστικές βιοδείκτες βασίζονται σε γενωμική χαρακτηριστικά για την ακριβή ταξινόμηση των ασθενειών είναι ένα πρόβλημα μεγάλης σημασίας για την δύο, βασική ιατρική έρευνα και την κλινική πρακτική. Στο έγγραφο αυτό, έχουμε εισαγάγει ποσοτικά μέτρα δικτύου, όπως

διαρθρωτικές βιοδείκτες

και να διερευνήσει την ικανότητά τους για την ταξινόμηση νοσηρές συναχθεί από τα δεδομένα γονιδιακής έκφρασης από καρκίνο του προστάτη. Έχουμε αποδείξει τη χρησιμότητα της προσέγγισής μας με τη χρήση ιδιοτιμών και εντροπία με βάση σταθερές γράφημα και να συγκρίνουν τα αποτελέσματα με μια συμβατική ανάλυση βιοδείκτη των υποκειμένων των δεδομένων γονιδιακής έκφρασης

Παράθεση:. Dehmer Μ, Mueller LAJ, Emmert-Streib F (2013) μέτρα Ποσοτική δικτύου ως βιοδείκτες για την ταξινόμηση του καρκίνου του προστάτη Νόσος μελών: Συστήματα Μια προσέγγιση για την Διαγνωστικό βιοδείκτες. PLoS ONE 8 (11): e77602. doi: 10.1371 /journal.pone.0077602

Επιμέλεια: Francesco Pappalardo, Πανεπιστήμιο της Κατάνια, Ιταλία

Ελήφθη: 3 Ιούλ 2013? Αποδεκτές: 3 Σεπ 2013? Δημοσιεύθηκε: 13 Νοεμβρίου, 2013

Copyright: © 2013 Dehmer et al. Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της άδειας χρήσης Creative Commons Attribution, το οποίο επιτρέπει απεριόριστη χρήση, τη διανομή και την αναπαραγωγή σε οποιοδήποτε μέσο, ​​με την προϋπόθεση το αρχικό συγγραφέα και την πηγή πιστώνονται

Χρηματοδότηση:. Matthias Dehmer χάρη οι αυστριακές Επιστήμη ταμεία για την υποστήριξη αυτού του έργου (project P22029-N13). Οι συγγραφείς ευχαριστήσω επίσης την «Zentraler Informatikdienst» του Τεχνικού Πανεπιστημίου της Βιέννης για την παροχή υπολογιστικών πόρων για την εκτέλεση μεγάλων υπολογισμούς κλίμακας στο Φοίνιξ Cluster. Επίσης, Matthias Dehmer και Laurin Mueller ευχαριστήσω την Standortagentur Tirol για την υποστήριξη αυτού του έργου. Οι χρηματοδότες δεν είχε κανένα ρόλο στο σχεδιασμό της μελέτης, τη συλλογή και ανάλυση των δεδομένων, η απόφαση για τη δημοσίευση, ή την προετοιμασία του χειρογράφου

Αντικρουόμενα συμφέροντα:.. Οι συγγραφείς έχουν δηλώσει ότι δεν υπάρχουν ανταγωνιστικά συμφέροντα

Εισαγωγή

Μοριακή και clinal βιοδείκτες έχουν διερευνηθεί εκτενώς στην ιατρική και σε συναφείς τομείς [1], [2], [3], [4]. Ειδικότερα, οι βιοδείκτες έχουν χρησιμοποιηθεί για την ανάλυση του καρκίνου, τον έλεγχο του καρκίνου και τη διαστρωμάτωση και διάγνωση [1], [2], [3], [4]. Κλασικά, διαγνωστικά βιοδείκτες αντιπροσωπεύουν μόρια, έτσι ώστε εμφάνιση ή η συγκέντρωσή τους σε δείγματα ιστών ή αίματος είναι αντιπροσωπευτική για ένα συγκεκριμένο κράτος καρκίνο, δείτε [5]. Πολυάριθμες μελέτες έχουν πραγματοποιηθεί για την απόδειξη της χρησιμότητας και των επιπτώσεων αυτών των βιοδεικτών στην έρευνα για τον καρκίνο και συναφείς τομείς [1], [2], [3], [4].

Το παραπάνω αποτελέσματα που ασχολούνται με την έρευνα των βιοδεικτών βασίζονται στην ευρέως αποδεκτή κλασική άποψη ότι διαφορικά εκφραζόμενων γονιδίων μπορεί να ερμηνευθεί ως δείκτες των ασθενειών. Ωστόσο, πρόσφατη έρευνα αποκάλυψε ότι η κλασική μονού γονιδίου βιοδείκτη είναι συχνά λιγότερο σημαντικός για την ανάλυση των ασθενειών από τη χρήση βιοδεικτών που βασίζεται σε δίκτυο, δείτε [6], [7], [8], [9]. Εδώ, μονοπάτια που εκπροσωπούν πολύπλοκα δίκτυα [10], [6], [7] να χρησιμεύσει ως βιοδείκτες των ασθενειών. Τώρα σκίτσο εν συντομία τις σχετικές συναφείς εργασίες των λεγόμενων βιολογικών δεικτών με βάση το δίκτυο ως εξής. Για παράδειγμα, μία μέθοδος πρωτεΐνη-με βάση το δίκτυο για τον εντοπισμό βιοδείκτες υποδίκτυα συναχθεί από τις βάσεις δεδομένων πρωτεϊνικών αλληλεπιδράσεων έχει αναπτυχθεί από Chuang et al. [11]. Αυτή η μέθοδος έχει αποδειχθεί χρήσιμη κατά την ταξινόμηση αυτών των υποδικτύων για διακρίσεις υπογραφή της νόσου [11]. Μια παρόμοια προσέγγιση λόγω Chen et al. [12] να δώσει προτεραιότητα γονίδια ασθενειών και υποδίκτυα αλληλεπίδρασης πρωτεΐνης αποδείχθηκε ότι είναι χρήσιμα επίσης όπως αυτά τα υποδίκτυα μπορεί να διακρίνει υπογραφές ασθένεια. Guyon et al. [8] που χρησιμοποιείται υποστήριξη φορέα μηχανή ταξινόμησης έτσι ώστε η μέθοδος αυτή λαμβάνει αλληλεπιδράσεις δικτύου υπόψη όχι μόνο μεμονωμένων γονιδίων. Jin et al. [9] ερμήνευσε ορισμένα υπογράφων, για παράδειγμα γραφήματα τρίγωνο, ως βιοδείκτες των πρωτεϊνών και πραγματοποίησε μια στατιστική ανάλυση αυτών, βλέπε [9]. Τέλος Barabási et al. [13] χρησιμοποιούνται, π.χ., δομικές ιδιότητες των γραφημάτων με τη χρήση μέτρων κεντρικότητα και διανομές βαθμό να βρει βιοδείκτες που βασίζεται σε δίκτυο μέσω της επιλογής χαρακτηριστικών.

Σε αυτό το έγγραφο, έχουμε εισαγάγει ποσοτικά μέτρα του δικτύου ως δομικά βιοδείκτες και να διερευνήσει την ικανότητά τους κατά την κατάταξη των νοσηρών καταστάσεων συναχθεί από καρκίνο του προστάτη (βλέπε ενότητα «δεδομένα»). Το πρόβλημα της εύρεσης κατάλληλων μέτρων δίκτυο το οποίο σύλληψη δομικές πληροφορίες μοναδικά και, ως εκ τούτου, το πρόβλημα του προσδιορισμού κατάλληλων υποψηφίων οι διαρθρωτικές βιοδείκτες είναι περίπλοκη. Αυτό σχετίζεται με το ανοικτό πρόβλημα ότι δεν είναι a priori σαφές τι είδους δομικών χαρακτηριστικών θα μπορούσε να είναι καλύτερη, καθώς υπάρχουν απείρως πολλά χαρακτηριστικά που είναι σταθερές γράφημα [14], [15] για τον χαρακτηρισμό της δομής των οδών (σύνθετα δίκτυα), δείτε επίσης, [14], [16], [17], [18].

Η κύρια συνεισφορά της παρούσας εργασίας είναι η εξής. Χρησιμοποιούμε ιδιοτιμές των βιολογικών δικτύων συνάγεται από τα στοιχεία καρκίνου του προστάτη μικροσυστοιχιών ως δομικό βιοδείκτες με τη χρήση εποπτευόμενων μάθησης. Πιο συγκεκριμένα, έχουμε αποδείξει ότι αυτές οι διαρθρωτικές βιοδείκτες, που αντιπροσωπεύουν ιδιοτιμή με βάση σταθερές γράφημα, μπορεί να χρησιμοποιηθεί για την ταξινόμηση του καρκίνου του προστάτη με νόημα? Στο πλαίσιο αυτό, έχουμε λάβει την εύλογη αποτελέσματα κατά την ταξινόμηση του καρκίνου εναντίον καλοήθη ιστό, βλέπε επίσης [19].

Μέθοδοι

Διαρθρωτικά Biomarkers

Σε αυτό το έγγραφο, έχουμε εισαγάγει ποσοτικούς δικτύου μέτρα όπως τα διαρθρωτικά βιοδείκτες. Αυτό σημαίνει ότι ξεκινώντας από βιολογικά δίκτυα προκύπτει από τα δεδομένα μικροσυστοιχιών (βλέπε ενότητα «Δεδομένα»), υπολογίζουμε ποσοτικά μέτρα γραφική παράσταση μέτρα πολυπλοκότητα του δικτύου και απασχολούν εποπτευόμενης μάθησης. Εάν αυτά τα δομικά χαρακτηριστικά μπορούν να ταξινομούν /διακρίσεις νοσηρές καταστάσεις, που αναφέρονται ως δομική βιοδείκτες. Στην πραγματικότητα, αυτό ανοίγει νέες προοπτικές στην έρευνα βιοδεικτών ως (i) απείρως πολλά διαρθρωτικά χαρακτηριστικά (π.χ., σταθερές γράφημα) υπάρχουν για τον χαρακτηρισμό των διαρθρωτικών δικτύου και (ii) υπάρχουν αρκετές μηχανική μάθηση και στατιστικές μεθόδους για να χρησιμοποιήσετε τις παράγωγες δομικά χαρακτηριστικά για την ταξινόμηση /διακρίσεις.

Όπως διαρθρωτικές βιοδείκτες, πρόκειται να χρησιμοποιήσει eigenvalue- και τις ποσότητες εντροπία που βασίζεται. Ξεκινάμε εξηγώντας τη διαδικασία για να αποκομίσουν ιδιοτιμή που βασίζεται σε σταθερές γράφημα. Αν υποδηλώνει ένα δίκτυο, τα μέτρα τότε ιδιοτιμή που βασίζεται μπορεί να υπολογιστεί με τη χρήση ενός γραφήματος-θεωρητική μήτρα [20] συνάγεται από. Τέλος έχουμε δώσει. (1)

Στην εργασία αυτή, θέτουμε και. είναι η μήτρα γειτνίαση και είναι η μήτρα απόσταση, αντίστοιχα [17], [20]. Με την επίλυση του αλγεβρική εξίσωση. (2) παίρνουμε τις μη μηδενικές ιδιοτιμές και. Όπως και είναι συμμετρικές για undirected γραφήματα, που κατέχει. Από την σχεδιαστούν υπολογισμό των ιδιοτιμών με τη χρήση προκύπτει από, ορίζουμε τα μέτρα [17], [21], [22]:

(3) (4) (5) (6) (7) και

(8) (9) (10) (11)

για να υπολογίσετε τα μέτρα συγκεκριμένα με τη χρήση R, θέτουμε. είναι η Laplacian του και ιδιοτιμών του αυτού [23].

Η δεύτερη κατηγορία μέτρων γράφημα που απασχολούν ως δομικό βιοδείκτες αντιπροσωπεύουν εντροπία μέτρα για γραφήματα. Τα μέτρα αυτά έχουν διερευνηθεί εκτενώς από Dehmer et al. [24], [25], [26] και αρχικά από Mowshowitz [27], [28], [29], [30]. Τα εν λόγω μέτρα βασίζονται στην εντροπία του Shannon και, ως εκ τούτου, ένα κατανομές πιθανοτήτων πρέπει να ανατεθεί σε ένα γράφημα. Αυτό το πρόβλημα είναι περίπλοκο καθώς, και πάλι, υπάρχουν απείρως πολλά δομικά χαρακτηριστικά (π.χ., βαθμοί κορυφή, κορυφές, ακμές, αποστάσεις, και χωρίσματα αυτών) να ορίσουν εντροπίας μέτρα σε ένα δίκτυο.

Βασικά, υπάρχουν δύο μέθοδοι για να συμπεράνει μια κατανομή πιθανοτήτων ενός γραφήματος με τη λήψη διαρθρωτικών χαρακτηριστικών της υπόψη. Η πρώτη μέθοδος βασίζεται στον προσδιορισμό κατατμήσεις χρησιμοποιώντας ένα αυθαίρετο διάγραμμα αμετάβλητες και ισοδυναμία κριτήριο [31], [27]. Η δεύτερη διαδικασία βασίζεται στη χρήση λεγόμενη συναρτησιακά πληροφορίες και για την ανάθεση μιας τιμής πιθανότητας σε κάθε κορυφή. έχουν ιδιότητες του entropies γράφημα βάσει δύο μέθοδοι έχουν διερευνηθεί σε [24], [25], [26], [16]. Ως αποτέλεσμα της εκτεταμένης έρευνας σε αυτόν τον τομέα από τις τρεις τελευταίες δεκαετίες, έχουν αναπτυχθεί μέτρα εντροπία πολλές γράφημα, βλέπε, π.χ., [31], [32], [24], [27], [33], [34 ]. Θα πάμε πέρα ​​από το πεδίο εφαρμογής του χαρτιού για να εξετάσει όλα τα υφιστάμενα μέτρα γράφημα εντροπία ως υποψήφιοι για τις διαρθρωτικές βιοδείκτη. Παρ ‘όλα αυτά, θα χρησιμοποιηθούν τα ακόλουθα entropies από διαφορετικά παραδείγματα (ως αποτέλεσμα της διαδικασίας επιλογής χαρακτηριστικών, βλέπε επίσης «Αποτελέσματα» τμήμα) [31], [24]:

Dehmer εντροπίας χρησιμοποιώντας τις πληροφορίες λειτουργική (κορυφή κεντρικότητα), βλέπε [24].

τοπολογικές πληροφορίες περιεχομένου [35].

Γράφημα Vertex Complexity Index [36].

Η μέση περιεκτικότητα σε πληροφορίες της ισότητας απόσταση μοιρών [ ,,,0],31].

η μέση περιεκτικότητα σε πληροφορίες σχετικά με την ισότητα άκρη [31].

δείκτης Balaban [37].

δείκτης συμμετρίας μικροσκοπική εντροπία [38].

δείκτης Μπόντσεφ [31].

Dehmer-εντροπίας χρησιμοποιώντας τις πληροφορίες λειτουργική (-spheres), βλέπε [24].

δείκτης Μπόντσεφ [31].

η

οι συγκεκριμένοι τύποι τους και οι τεχνικές λεπτομέρειες μπορούν να βρεθούν στο [31], [24].

δεδομένα

Το σύνολο των δεδομένων που χρησιμοποιούμε σε αυτό το έγγραφο δεν έχει χρησιμοποιηθεί ποτέ για τον καρκίνο ταξινόμηση νοσηρών καταστάσεων. Για να δημιουργήσετε το σύνολο των βιολογικών δικτύων, χρησιμοποιήσαμε επτά διαθέσιμα στο κοινό σύνολα δεδομένων (βλέπε πίνακα 1) που σχετίζονται με τον καρκίνο του προστάτη από το NCBI GEO [39] και EBI ArrayExpress [40]. Τα σύνολα δεδομένων που έχουν επιλεγεί σε συνεργασία με το Τμήμα Ουρολογίας στο Ιατρικό Πανεπιστήμιο του Innsbruck για τον εντοπισμό μεταγραφική αλλαγές στον καρκίνο του προστάτη, συμπεριλαμβανομένων των όγκων με γονιδιακές αναδιατάξεις ERG, βλέπε [19]. Ένα πρώτο αποτέλεσμα με τη χρήση αυτών των δεδομένων δεν έχει επιτευχθεί από Massoner et al. [19] καθώς βρήκαν ισχυρή πληθυσμού-ανεξάρτητο μεταγραφικό αλλαγές και τα σημάδια της ERG ανακατατάξεις που προκαλεί μεταβολικές αλλαγές στα καρκινικά κύτταρα, ενεργοποιώντας κύρια μεταβολική μόρια σηματοδότησης όπως NPY.

Η

Εμείς να αναλύονται τα διαθέσιμα δημόσια σύνολα δεδομένων (βλέπε Πίνακας 1) και τεκμαιρόμενη βιολογικών δικτύων με τη χρήση της μεθόδου συμπέρασμα C3NET [41]. Αυτό είχε ως αποτέλεσμα επτά δίκτυα C3NET αντιπροσωπεύει την καλοήθη ιστό (από την ομάδα ελέγχου) και επτά δίκτυα που εκπροσωπούν καρκινικό ιστό. Εδώ, καλοήθης σημαίνει ότι αναφερόμαστε σε αρρώστους με όγκο.

Για να αποκτήσετε ένα μεγαλύτερο σύνολο των δικτύων, χρησιμοποιήσαμε το γονίδιο οντολογία (GO) της βάσης δεδομένων [42] για την εξαγωγή υπογράφων από αυτά τα δίκτυα. Για κάθε δίκτυο και κάθε GO διάρκειας στην κατηγορία «βιολογική διαδικασία», εξάγουμε ένα υπογράφημα που περιέχουν τα γονίδια που σχετίζονται με αυτό το συγκεκριμένο GO-όρος με αποτέλεσμα και 108 δίκτυα που εκπροσωπούν καλοήθη και καρκίνου ιστό, αντίστοιχα. Έχουμε καθορίζεται το πράσινο όρους με τη χρήση του Bioconductor Πακέτο goProfiles.

Τα προκύπτοντα μεγέθη των λαμβανόμενων τάξεων είναι δυνητικά διαφορετικά, διότι οι δομές του δικτύου της και είναι διαφορετικές και, ως εκ τούτου, δεν είναι όλα τα μονοπάτια συλλαμβάνεται από αυτά τα δίκτυα. Επιπλέον, έχουμε αποκλείσει ένα υποδίκτυο όταν περιέχει λιγότερο ότι τα γονίδια που σχετίζονται με ένα συγκεκριμένο GO διάρκειας. Τα λαμβανόμενα δύο σύνολα των δικτύων μπορεί να ερμηνευθεί ως μια προσέγγιση των δύο λαών. Ένας πληθυσμός αντιπροσωπεύει το

καλοήθεις

κράτος και το δεύτερο το

καρκινικά

κατάσταση. Σημειώνουμε ότι αυτό το σύνολο των βιολογικών δικτύων έχει ήδη χρησιμοποιηθεί στο [43], όταν καταδεικνύοντας τη λειτουργικότητα του αναπτύχθηκε πρόσφατα R-πακέτο QuACN

Αποτελέσματα

Ταξινόμηση:. Καρκίνος του προστάτη Δίκτυα εναντίον Gene biomarkers έκφραση

για την αξιολόγηση της απόδοσης των νέων διαρθρωτικών βιοδείκτες, συγκρίνουμε την κατάταξη των δικτύων με την ταξινόμηση των ίδιων των δεδομένων γονιδιακής έκφρασης με τη χρήση εποπτευόμενων μάθησης. Για την ταξινόμηση των δεδομένων γονιδιακής έκφρασης κανονικοποιούνται με τη χρήση των συνόλων δεδομένων που περιγράφονται στην ενότητα «Δεδομένα», συνδυάσαμε τα δείγματα των επτά μελετών (βλέπε πίνακα 1) με τον προσδιορισμό της τομής των μετρούμενων γονιδίων. Αυτό οδηγεί σε μια διάνυσμα χαρακτηριστικών που περιέχει όλα τα γονίδια που μετρώνται σε καθένα από τα επτά διαφορετικές μελέτες. Για να επιλέξετε τα πιο σημαντικά γονίδια, έχουμε εφαρμόσει ένα μηχανισμό επιλογής χαρακτηριστικών με βάση τη μέθοδο

Πληροφορίες αποκτήσουν

[44]. Στη συνέχεια ταξινομούμε τα δεδομένα που χρησιμοποιώντας τα 10 πιο σημαντικά χαρακτηριστικά ως ένα διάνυσμα χαρακτηριστικών γνωρισμάτων με τη χρήση SVM ταξινόμησης [45] με συνάρτηση πολυωνυμικού πυρήνα. Για την εκτέλεση της κατάταξης, εφαρμόζουμε τον R-εφαρμογή της Libsvm [46] και για την εκμάθηση τις βέλτιστες παραμέτρους, μπορούμε να εκτελέσουμε μια 10-πλάσια επικύρωση σταυρό.

Για να επιτύχει την καλύτερη απόδοση ταξινόμησης εκτιμούμε τα ακόλουθα ρυθμίσεις παραμέτρων για την ταξινόμηση περιοριστικά: (12) και

(13) για τις τρεις που μελετήθηκαν μέτρα, τα αποτελέσματά τους με τη μορφή των μέτρων σφάλμα της ταξινόμησης συνοψίζονται στον πίνακα 2. για τα εν λόγω μέτρα, βρήκαμε τη βέλτιστη ρυθμίσεις παραμέτρων που χρησιμοποιούνται για την ανάλυση αυτή:. (μέτρα εντροπία-based),, (μέτρα ιδιοτιμών-based),,, και, (δεδομένα γονιδιακής έκφρασης)

Η

από την αριθμητική μας ταξινόμηση των δεδομένων, συνοψίζονται στον πίνακα 2, προκύπτει ότι η προσέγγιση βασίζεται σε δίκτυο ιδιοτιμές (δεύτερη στήλη) και η ανάλυση βιοδείκτης των δεδομένων γονιδιακής έκφρασης (τέταρτη στήλη) την καλύτερη απόδοση. Συγκεκριμένα, η κατάταξη των βιοδεικτών γονιδιακής έκφρασης είναι πάντα καλύτερο, αλλά τα ιδιοτιμή μέθοδος καταλήγει σε ανάλογη απόδοση, μέσα σε ένα τυπικό σφάλμα. Λόγω του γεγονότος ότι όλα τα μέτρα σφάλματος είναι τυχαίες μεταβλητές, εκτιμάται από μια φορές σε σταυρό επικύρωσης, φαίνεται λογικό να εξετάσει

διαστήματα απόδοση

, που δίνεται από το μέσο όρο και το τυπικό σφάλμα, παρά το σημείο εκτιμητές. Αυτό θα οδηγήσει σε πιο ισχυρή δηλώσεις σχετικά με τις ληφθείσες τιμές απόδοσης.

Σε αντίθεση με την μέθοδο ιδιοτιμή και την έκφραση του γονιδίου βιοδεικτών, η μέθοδος ταξινόμησης με βάση τις entropies των δικτύων οδηγεί σε χαμηλότερη απόδοση για όλα τα μέτρα σφάλμα, ωστόσο , εξακολουθεί να δίνει μια λογική απόδοση ταξινόμησης δείχνει ότι και αυτή η μέθοδος είναι ικανή για τη διάκριση των δύο βιολογικές τάξεις, τουλάχιστον σε κάποιο βαθμό.

ιδιοτιμών-based Ανάλυση Κατασκευών του καρκίνου του προστάτη Δίκτυα

σε αυτή την ενότητα, εξετάζουμε κάποιες ιδιότητες των ιδιοτιμών με τη χρήση των δικτύων του καρκίνου του προστάτη που εκπροσωπούν δύο κατηγορίες (καρκίνο και καλοήθη ιστό). Τα πρώτα αποτελέσματα συνοψίζονται στο Σχήμα 1, 2 και το Σχήμα 3, 4. απεικονίζονται όλα ιδιοτιμές για τον καρκίνο και καλοήθη δικτύων με χρήση της μήτρας γειτνίαση και την απόσταση, αντίστοιχα. Με τη χρήση του πίνακας γειτνίασης, οι ιδιοτιμές των καλοήθων δίκτυα δείχνουν μια χαρακτηριστική κατανομή όπου σχεδόν όλες οι ιδιοτιμές βρίσκονται σε μια οριζόντια λωρίδα. Στην πραγματικότητα, το 64% αυτών των ιδιοτιμών είναι αρνητικά και το 36% είναι θετικές. Το οικόπεδο των δικτύων καρκίνου με τη χρήση της γειτνίασης φαίνεται πολύ παρόμοια. Εδώ, η αναλογία των θετικών και αρνητικών ιδιοτιμή είναι το ίδιο όπως με τη χρήση των καλοήθη δίκτυα. Το γεγονός ότι αυτές οι διανομές να μοιάζει μπορεί επίσης να εξηγηθεί από το επιχείρημα με τα αντίστοιχα μηδενικού ελεύθερες περιοχές (π.χ., ταινία-όπως περιοχές στις οποίες δεν μηδενικά του χαρακτηριστικού πολυωνύμου ψέμα). Όπως αναφέρθηκε στην ενότητα «διαρθρωτικών βιοδείκτες», ιδιοτιμές είναι τα μηδενικά (αυτό σημαίνει ότι οι λύσεις της εξίσωσης) του χαρακτηριστικού πολυωνύμου χρησιμοποιώντας μια μήτρα γράφημα-θεωρητική (εδώ, χρησιμοποιούμε και). Στη συνέχεια, βλέπουμε ότι οι μηδενικές ελεύθερες περιοχές της καλοήθους εναντίον δικτύων καρκίνου με τη χρήση του πίνακας γειτνίασης μοιάζουν πολύ. Αλλά από αυτό, δεν μπορούμε να συμπεράνουμε ότι οι ιδιοτιμές είναι γενικά ακατάλληλο για τη διάκριση των δύο κατηγοριών του δικτύου όπως φαίνεται στην ενότητα «Κατάταξη: Καρκίνος του προστάτη Δίκτυα εναντίον Biomarkers Γονιδιακής Έκφρασης». Με τη χρήση του πίνακα αποστάσεων, έχουμε δώσει τα ιδιοτιμή-αναλογίες 74% αρνητικές και 26% θετικές για καλοήθεις? 76% αρνητικές και 24% για τα δίκτυα του καρκίνου. Σε αντίθεση με τις κατανομές με τη χρήση του πίνακας γειτνίασης, τις οριζόντιες λωρίδες και, ως εκ τούτου, ο μηδενικός ελεύθερες περιοχές είναι διαφορετικές. Αυτό μπορεί να γίνει κατανοητό από την ανάλυση των κατανομών των στοιχείων μήτρας του πίνακας γειτνίασης και την απόσταση. Το γεγονός ότι αυτά είναι διαφορετικά συνεπάγεται επίσης ότι οι συντελεστές που προκύπτουν χαρακτηριστικά πολυώνυμα διαφέρουν σημαντικά.

Η

Η

Εν κατακλείδι, μπορούμε να συμπεράνουμε ότι ορισμένα μέτρα ιδιοτιμή που βασίζεται χρησιμοποιώντας την πίνακας γειτνίασης και την απόσταση συλλάβει δομικές πληροφορίες με διαφορετικό τρόπο. Εδώ, αυτό μπορεί να σημαίνει ότι ορισμένα από τα μέτρα αυτά με τη χρήση του πίνακα αποστάσεων είναι πιο ευαίσθητοι απέναντι ελαφρές διαρθρωτικές αλλαγές στο δίκτυο. Η ισχύς αυτής της υπόθεσης μπορεί να υποστηρίζεται από την αξιολόγηση της δύναμης των διακρίσεων των μέτρων ιδιοτιμών-based. Αυτό σχετίζεται με τον προσδιορισμό κατά πόσον το μέτρο συλλαμβάνει διαρθρωτικές πληροφορίες μοναδικά, δείτε [47], [16], [14]. Για παράδειγμα, αν η δομή του δικτύου είναι ελαφρώς αλλαγμένη, το μέτρο πρέπει να ανιχνεύσει αυτή την διαρθρωτική αλλαγή, δίνοντας διακριτές τιμές. Στο έγγραφο αυτό, μετράμε τη δύναμη διακρίσεων ή μοναδικότητα από την ποσότητα, εκφράζοντας τις

μη διακρίνονται τιμές

από ένα συγκεκριμένο μέτρο ιδιοτιμή που βασίζεται. Αυτό είναι για να υπολογίσει NDV, υπολογίζουμε όλα τα μέτρα σχετικά με τα δίκτυα και τον καθορισμό του αριθμού των γραφημάτων που δεν μπορούν να διακριθούν από αυτούς. Είναι σημαντικό, τα δίκτυα πρέπει να είναι δομικά μη-ισοδύναμη (μη-ισομορφικός) για να εκτελέσετε αυτή τη μελέτη με νόημα? τονίζουμε ότι τα δίκτυα του καρκίνου που χρησιμοποιούνται σε αυτή τη μελέτη έχουν ελεγχθεί ότι είναι δομικά μη-ισοδύναμο. Με την επιθεώρηση Πίνακας 3, βλέπουμε πρώτα απ ‘όλα ότι πολλά από τα υπολογισμένα μέτρα ιδιοτιμή που βασίζονται πλήρως μοναδική? * Για την εξομάλυνση των τιμών, χρησιμοποιήσαμε το μέτρο της ευαισθησίας Κωνσταντίνοβα, ανατρέξτε στην ενότητα [48], [17]. * Αυτό σημαίνει ότι δομικά διακρίνουν τα δίκτυα από τις τιμές τους με μοναδικό τρόπο. Το μόνο μέτρο που παράγει εκφυλισμένη τιμές είναι, δείτε Εξίσωση 5. Επιπλέον, παρατηρούμε ότι είναι πιο μοναδική από αυτή που μπορεί να δει κανείς από τα NDV-αξίες. Έτσι, μπορούμε να συμπεράνουμε ότι ο πίνακας αποστάσεων κωδικοποιεί δομικές πληροφορίες πιο ουσιαστική από ό, τι με τη χρήση του πίνακας γειτνίασης, όταν χρησιμοποιεί το μέτρο.

Η

Σημειώστε ότι τα συμπληρωματικά αρχεία (File S1, S2, S3) περιέχουν τις τιμές των calucated δικτύων.

Συζήτηση και Συμπεράσματα

στα τελευταία χρόνια υπάρχει μεγάλο ενδιαφέρον για τον προσδιορισμό των βιολογικών δεικτών εντός γονιδιωματικής σύνολα δεδομένων. Συνήθως, εάν τα δεδομένα γονιδιακής έκφρασης που χρησιμοποιείται από τα πειράματα μικροσυστοιχιών DNA, ένας βιολογικός δείκτης θεωρείται ως ένα γονίδιο, ή ένα σύνολο γονιδίων, για τις οποίες υπάρχουν διαθέσιμα στοιχεία γονιδιακής έκφρασης. Στη συνέχεια, οι μέθοδοι ταξινόμησης με βάση τα δεδομένα γονιδιακής έκφρασης αυτών των βιοδεικτών που οδηγεί σε βιολογικά ερμηνεύσιμα αποτελέσματα σε σχέση με τις ικανότητές τους κατάταξη, π.χ., για διαγνωστικούς σκοπούς. Αντίθετα, στην παρούσα εργασία υποθέσαμε

διαρθρωτικές βιοδείκτες

, που προέρχεται από ρυθμιστικά δίκτυα γονίδιο που συνάγεται από τα δεδομένα γονιδιακής έκφρασης, και να χρησιμοποιηθούν αυτά για να προβεί σε ταξινόμηση των νοσηρών καταστάσεων. Από την αριθμητική ανάλυση μας βρήκαμε ότι οι βιοδείκτες της γονιδιακής έκφρασης και χαρακτηριστικά ιδιοτιμή με βάση την εκτέλεση Ομοίως, αν και οι βιοδείκτες γονιδιακής έκφρασης εκτελούν ελαφρώς καλύτερη.

Αυτό το αποτέλεσμα είναι ενδιαφέρον γιατί δείχνει, πρώτον, ένα βιοδείκτη δεν χρειάζεται να να είναι ένα γονίδιο, αλλά μπορεί να είναι ένα αφηρημένο ιδιότητα ενός βιολογικού συστήματος, π.χ. μέτρα δίκτυο ιδιοτιμή με βάση, όπως στην περίπτωσή μας. Κατ ‘αρχήν, αυτή η ιδέα δεν είναι νέα. Ωστόσο, αυτό που είναι νέο είναι ότι έχουμε αποδείξει αυτό ρητά, δίνοντας ένα παράδειγμα για τις διαρθρωτικές βιοδείκτες. Ως εκ τούτου, παρέχουμε πρακτικά στοιχεία σε αυτό το επιχείρημα που συνήθως συζητείται μόνο argumentatively αντί αριθμητικά. Δεύτερον, ο τρόπος που οι διαρθρωτικές βιοδείκτες μας ορίζεται έχει πλέον επιτρέπει να πούμε, π.χ., «γονίδιο Α και το γονίδιο Β ‘είναι σε θέση να διακρίνουν τις βιολογικές προϋποθέσεις υπό εξέταση. Αντ ‘αυτού, τα χαρακτηριστικά μας, αντίστοιχα βιοδείκτες, αντιστοιχούν στα χαρακτηριστικά της

σύστημα

και ως τέτοιο γονίδιο ανεξάρτητη, αλλά αντικατοπτρίζουν τις συλλογικές τους ιδιότητες, όπως συλλαμβάνεται από τις ρυθμιστικές δίκτυα τεκμαιρόμενη γονίδιο. Ως εκ τούτου, η προσέγγισή μας αντιπροσωπεύει μια πρακτική υλοποίηση του

συστήματα ιατρικής

.

Για μια μελλοντική ανάλυση θα ήταν ενδιαφέρον να χρησιμοποιήσουν τα δεδομένα της έκφρασης της πρωτεΐνης αντί για τα δεδομένα γονιδιακής έκφρασης για να επαναλάβει μια παρόμοια ανάλυση. Μια τέτοια ανάλυση θα επιτρέψει να αποκτήσουν γνώσεις σχετικά με την ευρωστία των αποτελεσμάτων μας σε σχέση με την αλλαγή του μοριακό επίπεδο, όπως προβλέπεται από αλληλεπιδράσεις πρωτεϊνών. Συγκεκριμένα, αυτό θα βοηθήσει να καταλάβουμε αν καθαρό [49] ή μικτούς τύπους αλληλεπίδρασης, όπως αντιπροσωπεύεται από ρυθμιστικά δίκτυα γονιδίων, είναι πιο κατάλληλα για την κατασκευή των διαρθρωτικών βιοδείκτες.

Σε γενικές γραμμές, τα αποτελέσματά μας παρέχουν πολλά υποσχόμενες ενδείξεις ότι

none -γονίδιο βιοδείκτες

μπορεί να είναι ένα ωφέλιμο μέσο για την ταξινόμηση των νοσηρών καταστάσεων από τα δεδομένα γονιδιακής έκφρασης για διαγνωστικούς σκοπούς.

προσάρτημα

για λόγους πληρότητας, στους πίνακες 4, 5, 6, 7, 8, 9, 10, δείχνουμε τα ίδια αποτελέσματα όπως στον πίνακα 3, αλλά για τα επιμέρους σύνολα δεδομένων, όπως παρατίθενται στον πίνακα 1.

η

η

η

Υποστήριξη Πληροφορίες

αρχείου S1.

R αρχείο δεδομένων που περιέχει τιμές Περιγραφέας

doi:. 10.1371 /journal.pone.0077602.s001

(Τ.Κ.)

αρχείου S2.

Excel αρχείο που περιέχει τις τιμές Περιγραφέας με τη χρήση ιδιοτιμών που βασίζεται μέτρα

doi:. 10.1371 /journal.pone.0077602.s002

(CSV)

αρχείου S3.

αρχείο Excel που περιέχει τις τιμές Περιγραφέας με μέτρα μη ιδιοτιμή που βασίζεται

doi:. 10.1371 /journal.pone.0077602.s003

(CSV)

You must be logged into post a comment.