You must be logged into post a comment.
Αφηρημένο
ανάλυση δικτύου που βασίζεται έχει αποδειχθεί χρήσιμη σε βιολογικά προσανατολισμένες περιοχές, π.χ., να διερευνήσει τις δυναμικές και την πολυπλοκότητα των βιολογικών δικτύων. Ερευνώντας μια σειρά δικτύων επιτρέπει απορρέουν γενικές γνώσεις σχετικά με τις υποκείμενες τοπολογικές και λειτουργικές ιδιότητες. Η ολοκληρωμένη ανάλυση των δικτύων συνδυάζει χαρακτηριστικά των δικτύων από διάφορες μελέτες που διερευνούν τις ίδιες ή παρόμοιες ερευνητικά ερωτήματα. Για να εκτελέσετε μια ολοκληρωμένη ανάλυση είναι συχνά απαραίτητο να συγκρίνει τις ιδιότητες που ταιριάζουν άκρες σε όλη τη σειρά δεδομένων. Αυτή η αναγνώριση των κοινών ακμών είναι συχνά επαχθείς και υπολογιστικής έντασης. Εδώ, σας παρουσιάζουμε μια προσέγγιση που είναι διαφορετική από συνάγοντας ένα νέο δίκτυο που βασίζεται σε κοινά χαρακτηριστικά. Αντ ‘αυτού, επιλέξτε ένα δίκτυο ως ένα πρωτότυπο διάγραμμα, το οποίο στη συνέχεια αντιπροσωπεύει ένα σύνολο συγκρίσιμων αντικείμενα δικτύου, καθώς έχει τη μικρότερη μέση απόσταση σε όλα τα άλλα δίκτυα στο ίδιο σετ. Έχουμε αποδείξει τη χρησιμότητα της προσέγγισης πρωτοτύπων γράφημα σε ένα σύνολο δικτύων καρκίνου του προστάτη και ένα σύνολο αντίστοιχων καλοήθεις δικτύων. Δείχνουμε επίσης ότι οι αποστάσεις εντός της ομάδας του καρκίνου και η καλοήθης ομάδα είναι στατιστικά διαφορετικές ανάλογα με την χρησιμοποιούμενη μέτρο απόσταση
Παράθεση:. Kugler KG, Mueller LAJ, Graber Α, Dehmer Μ (2011) Βιολογία Ολοκληρωμένες δικτύου: γράφημα Πρωτότυπα για την ταυτόχρονη έκφραση του Καρκίνου Δικτύων. PLoS ONE 6 (7): e22843. doi: 10.1371 /journal.pone.0022843
Επιμέλεια: Dongxiao Zhu, Πανεπιστήμιο της Νέας Ορλεάνης, Ηνωμένες Πολιτείες της Αμερικής
Ελήφθη: 22 του Μαρτίου του 2011? Αποδεκτές: 30 Ιουνίου, 2011? Δημοσιεύθηκε: 29 του Ιούλη 2011
Copyright: © 2011 Kugler et al. Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της άδειας χρήσης Creative Commons Attribution, το οποίο επιτρέπει απεριόριστη χρήση, τη διανομή και την αναπαραγωγή σε οποιοδήποτε μέσο, με την προϋπόθεση το αρχικό συγγραφέα και την πηγή πιστώνονται
Χρηματοδότηση:. Αυτό το έργο υποστηρίχθηκε από το Tiroler Zukunftsstiftung και το Tiroler Wissenschaftsfonds. Το έργο αυτό χρηματοδοτείται επίσης από το COMET Κέντρο ONCOTYROL και χρηματοδοτείται από το Ομοσπονδιακό Υπουργείο Μεταφορών Καινοτομίας και Τεχνολογίας (BMVIT) και του Ομοσπονδιακού Υπουργείου Οικονομίας και Εργασίας /το Ομοσπονδιακό Υπουργείο Οικονομίας, Οικογένειας και Νεολαίας (BMWA /BMWFJ), η Tiroler Zukunftsstiftung (TZS) και το κράτος της Στυρίας εκπροσωπείται από τον Οργανισμό Προώθησης της Στυρίας Επιχειρήσεων (SFG). Οι χρηματοδότες δεν είχε κανένα ρόλο στο σχεδιασμό της μελέτης, τη συλλογή και ανάλυση των δεδομένων, η απόφαση για τη δημοσίευση, ή την προετοιμασία του χειρογράφου
Αντικρουόμενα συμφέροντα:.. Οι συγγραφείς έχουν δηλώσει ότι δεν υπάρχουν ανταγωνιστικά συμφέροντα
Εισαγωγή
για πολλές ασθένειες δεν είναι πλέον ενιαία γονίδια δρουν ως δείκτη, αλλά ένα σύνολο αλληλεπιδρώντων γονιδίων μπορεί να χρησιμοποιηθεί για τον χαρακτηρισμό ή τη διάγνωση μιας παθολογικής διαδικασίας [1]. Καθοδηγείται από την εν λόγω ορθολογική μια πληθώρα νέων μεθόδων ανάλυσης των δεδομένων προέκυψαν τα τελευταία χρόνια, καθώς η ανάγκη για μεθόδους που είναι σε θέση να συλλάβει προέκυψαν οι σχετικές περιπλοκές. Ένα απλό παράδειγμα είναι να ψάξουν για αντικείμενα που είναι ιδιαίτερα συνδεδεμένα με άλλα αντικείμενα και μπορούν, συνεπώς, διαδραματίζουν κεντρικό ρόλο στις κανονιστικές διαδικασίες. Η ανάλυση βασίζεται σε δίκτυο [2] των βιολογικών δεδομένων είναι ένα σχετικό τομέα στη βιολογία συστημάτων [3]. Λαμβάνοντας υπόψη ότι η κλασική ανάλυση δεδομένων οδηγήθηκε από μια αναγωγική άποψη, η σύγχρονη βιολογία δίκτυο στοχεύει στην αντίληψη των δεδομένων ολιστικά [3]. Χρησιμοποιώντας δίκτυα επιτρέπει αφήνοντας πίσω τη στατική εξερεύνηση του ένα χαρακτηριστικό σε έναν χρόνο, και που καθιστά δυνατή την έρευνα του πιο ρεαλιστική δυναμική φύση των βιολογικών και ιατρικών δεδομένων. Η δυναμική βρίσκονται σε διάφορες διαστάσεις, όπως τα συστήματα αλλάζουν με την πάροδο του χρόνου [4], αντιδρούν σε διαταραχές [5], ή είναι απλά αποτελείται από βιολογικές λειτουργίες, οι οποίες είναι αλληλένδετες σε σύνθετα καταρράκτες [6]. Ταυτόχρονα, συνδυάζοντας διαφορετικές πηγές δεδομένων έχει γίνει μια τυπική διαδικασία που ακολουθείται στη σύγχρονη υπολογιστική βιολογία. Είτε πρόκειται μέσω της ενοποίησης δεδομένων ή την κλασική μετα-ανάλυση, πολλή προσπάθεια ακόμα τεθεί σε τυποποίηση των προσεγγίσεων που επιτρέπουν μια ολοκληρωμένη ανάλυση [7]. Ολοκληρωμένες προσεγγίσεις επιτρέπουν την αύξηση της βάσης τεκμηρίωσης για τα νέα ευρήματα με το συνδυασμό πληροφοριών από διάφορες πηγές. Σε μια ενσωμάτωση κλασική προβολή δεδομένων αναφέρεται στην ενσωμάτωση των δεδομένων διαφορετικής φύσης (π.χ. γονιδιακή έκφραση και πρωτεομική). Στην παρούσα εργασία, αναφέρεται επίσης στην ένταξη του ίδιου τύπου δεδομένων όπως ενοποίησης δεδομένων
Η έρευνα για το συνδυασμό της βιολογίας του δικτύου και ολοκληρωμένη ανάλυση των δεδομένων έχει ακμάσει κατά τη διάρκεια των τελευταίων ετών [8] -. [10]. Αυτό επιτρέπει απορρέουν γενικεύσεις από ένα σύνολο διαφορετικών δικτύων που διερευνούν τις ίδιες ή παρόμοιες ερευνητικά ερωτήματα. Τέτοιες γενικές διαπιστώσεις μπορούν να χρησιμοποιηθούν για την απάντηση βιολογικές ερωτήσεις ή για τη δημιουργία νέων υπόθεση για υποκείμενες διαδικασίες. Η μέτρηση της ομοιότητας μεταξύ των δικτύων έχει αποδειχθεί χρήσιμη για την αξιολόγηση συστηματική επίδραση του χρόνου πορεία για μεταβολική δίκτυα [8], που ταιριάζουν ρυθμιστικές αλληλεπιδράσεις [9] ή για την ταυτοποίηση παρόμοιων υπογράφων σε ζεύγη των δικτύων [10]. Μια άλλη εφαρμογή της συγκριτικής ανάλυσης του δικτύου είναι η συστηματική σύγκριση των δύο δικτύων ένωση που κόπηκαν για μερική συσχετίσεις [11]. Ωστόσο, την ανίχνευση και συνάγοντας γνώση σχετικά με κοινές ιδιότητες για ένα σύνολο δικτύων είναι ένα δύσκολο έργο, δεδομένου σύγκριση δικτύων εξαρτάται από τον ορισμό του υποκείμενου μέτρου ομοιότητας. Ωστόσο, η ομοιότητα μεταξύ οποιωνδήποτε αντικειμένων δεν ορίζεται μονοσήμαντα από το πολύπλευρες πτυχές, όπως τη δομή, τη λειτουργία και τη σημασιολογία που εμπλέκονται [12]. Ως εκ τούτου, είναι απαραίτητο να βρούμε παρόμοια χαρακτηριστικά σε βιολογικά δίκτυα. Συχνά αυτό γίνεται με την ανίχνευση κοινές ακμές ή κορυφές, και η σύγκρισή τους ή κατανομές τους [13], [14]. Για την αντιμετώπιση του ζητήματος της νόημα σύγκριση βιολογικών δικτύων έχει αναπτυχθεί ένα πλήθος μεθόδων. Εμείς εδώ μπορεί να παρουσιάσει μόνο μια μικρή επιλογή από αυτές τις προσεγγίσεις και τις εφαρμογές τους. Piruzian et al. μισθωτούς τοπολογικές πληροφορίες για την ενσωμάτωση transcriptomic και πρωτεομική δεδομένων σε μια προσέγγιση κατάταξη με βάση [15]. Μια γενικευμένη μορφή της κατανομής βαθμό, το λεγόμενο graphlet διανομής βαθμό, μπορεί να εφαρμοστεί για τον προσδιορισμό της ομοιότητας του δικτύου [16]. Graphlets χρησιμοποιήθηκαν επίσης για την ευθυγράμμιση των δικτύων ΠΠΑ από ανθρώπινο και ζύμη [17]. Μια στατιστική μέθοδος για τη σύγκριση των μεγάλων δικτύων της νόσου συναχθεί από τον καρκίνο του τραχήλου της μήτρας χρησιμοποιώντας μια αποσύνθεση δέντρο και τεχνική εναρμόνιση προτάθηκε επίσης στο [18]. Εδώ, θα επικεντρωθεί στην εφαρμογή της σύγκρισης των δικτύων, που προέρχονται από τον ίδιο τύπο των δεδομένων και χρησιμοποιούνται ως αναπαραστάσεις για μια κατηγορία δείγματος. Ως εκ τούτου, αναλύουμε ένα σύνολο δικτύων σύνδεσης που προέρχεται από τα δεδομένα γονιδιακής έκφρασης του καρκίνου του προστάτη. Με τη χρήση αυτού του συνδυασμού είναι δυνατό να αντλήσει γενικευμένη πληροφορίες σχετικά με τα πορίσματα με βάση το δίκτυο που σχετίζονται με ορισμένες ασθένειες ή αναπτυξιακές καταστάσεις. Μια κοινή προσέγγιση στο πρόβλημα της ανάλυσης ιδιότητες δικτύου μέσω της μετα-ανάλυσης είναι να συγκρίνει την επικάλυψη των άκρων σε διαφορετικά δίκτυα. Έχουμε αποδείξει τη χρησιμότητά του για την ολοκλήρωση του δικτύου που βασίζεται σε μια προηγούμενη μελέτη [19]. Μια παρόμοια προσέγγιση για τις κοινές ακμές δόθηκε από Cootes et al. [10]. Μια εναλλακτική μέθοδος παρουσιάστηκε από τον Wang et al., Που χρησιμοποιούνται πληροφορίες σχετικά με την επίδραση μεγέθους να συνδυάσει στοιχεία από ένα σύνολο του δικτύου [20]. Ωστόσο, αυτή η προσέγγιση απαιτεί πληροφορίες σχετικά με την επίδραση μεγέθους να είναι διαθέσιμες. Ανίχνευση κοινές ακμές σε ένα δίκτυο είναι ένα δύσκολο έργο, αν δεν υπάρχει σωστή αντιστοίχιση μεταξύ των ετικετών κορυφή είναι διαθέσιμη. Κατά την εξέταση των δικτύων συν-έκφραση, οι ετικέτες κορυφή αναφέρονται σε ονόματα γονίδιο. Για να δημιουργηθεί ένας κοινός χώρος όνομα μεταξύ των διαφόρων δικτύων, είναι επομένως χρήσιμο να καταγράψουμε τη μελέτη ειδικών, πλατφόρμα-εξαρτιόταν γονίδιο αναγνωριστικά σε άλλα αναγνωριστικά στοιχεία, π.χ. γονίδιο Εηίτεζ αναγνωριστικά.
Στην παρούσα εργασία δείχνουμε μια εναλλακτική προσέγγιση για την συναγωγή κοινή τοπολογικές ιδιότητες για ένα σύνολο δικτύων. Εδώ, γράφημα πρωτοτύπων μπορεί να γίνει κατανοητή ως μια μέθοδος που επιλέγει ένα υπάρχον δίκτυο από ένα σύνολο δικτύων ως εκπρόσωπος για το πλήρες σύνολο, σε σχέση με μια υποκείμενη απόσταση γράφημα μέτρο [21]. Αυτό σημαίνει ότι η δομική πρωτότυπο γράφημα αντιπροσωπεύει τις τοπολογικές ιδιότητες ενός πλήρους συνόλου δικτύων, ανάλογα με το κριτήριο επιλογής που ορίζεται από τα μέτρα απόστασης γράφημα. Μια σχηματική απεικόνιση για την επιλογή ενός πρωτοτύπου γραφική παράσταση δίνεται στο Σχ. 1. Σημειώνεται ότι άλλοι ορισμοί των πρωτοτύπων γραφήματος όπως το λεγόμενο συναίνεση δέντρο [22] έχουν επίσης διερευνηθεί. Αλλά αυτά δεν θα συζητηθούν στο παρόν έγγραφο. Έτσι, αυτό το πρωτότυπο δίκτυο μπορεί στη συνέχεια να χρησιμοποιηθεί για την εκτέλεση μιας τοπολογική ανάλυση και συνάγοντας νέα γνώση, καθώς αντιπροσωπεύει τις ιδιότητες όλων των άλλων δικτύων από το ίδιο σύνολο. Ένα ισχυρό σημείο αυτής της μεθόδου είναι ότι ο εντοπισμός των κοινών ακμών ή κόμβοι μπορεί να καταστεί περιττή, ανάλογα με τα μέτρα που χρησιμοποιούνται απόσταση γράφημα. Στη συνέχεια, είναι σημαντικό χρησιμοποιώντας ένα μέτρο απόσταση γράφημα του οποίου η πολυπλοκότητα είναι πολυωνυμική. Για την εφαρμογή γράφημα πρωτοτύπων, επιλέγουμε κατάλληλα μέτρα απόσταση γράφημα που είναι σε θέση της ουσιαστικά την ποσοτικοποίηση της απόστασης μεταξύ δύο δικτύων. Ως μέρος της συνεισφοράς μας περιγράψει τέσσερα μέτρα απόσταση που βασίζονται στις κατανομές της πιθανότητας των ιδιοτήτων δικτύου. Αυτό είναι ένα άλλο ισχυρό σημείο αυτής της μεθόδου, καθώς μπορεί να τροποποιηθεί ώστε να κάνουν χρήση των άλλων, προσαρμοσμένες μέτρα απόσταση γράφημα. Για να καταδειχθεί η επιλογή ενός πρωτοτύπου γράφημα [21], [23] κάνουμε χρήση των μελετών γονιδιακής έκφρασης του καρκίνου του προστάτη. 25% των νεοδιαγνωσθέντων αρσενικό καρκίνων στις ΗΠΑ είναι του προστάτη [24], η οποία είναι ένας ελκυστικός στόχος για τη συνεχή βιοϊατρική έρευνα κάνει. Ένα ευρύ φάσμα των μελετών που έχουν διεξαχθεί τα τελευταία χρόνια, και πολλά από τα αντίστοιχα στοιχεία είναι διαθέσιμα σε αποθετήρια δημόσια δεδομένα [25] – [27]. Εφαρμόζουμε τη μέθοδο μας σε ένα σύνολο επτά μελέτες για τον καρκίνο του προστάτη [28-24], η οποία αποτελείται από δείγματα καρκίνου και δείγματα από καλοήθεις ή τους υγιείς ιστούς. Περιμένουμε μια δύο φορές αποτέλεσμα: Πρώτον, περιμένουμε να δούμε σημαντικές διαρθρωτικές διαφορές μεταξύ καλοήθους και του καρκίνου μελέτες με τη χρήση τοπογραφικών μέτρων. Δεύτερον, περιμένουμε να δούμε σημαντικές διαφορές μεταξύ των αποστάσεων εντός των δικτύων δεδομένων για τον καρκίνο και τις αποστάσεις εντός των καλοήθων δίκτυα δεδομένων. Αυτό θα μπορούσε να δείξει ότι όχι μόνο οι ίδιοι οι δίκτυα διαφέρουν, αλλά ότι ακόμη και οι ομοιότητες μεταξύ των δύο ομάδων διαφέρουν. Εάν ναι, οι παθογόνοι διεργασίες που προκαλούνται από τον καρκίνο είναι πιθανότερο υπεύθυνοι για να εξηγήσει αυτές τις παρατηρήσεις. Με βάση την προηγούμενη εργασία [19] αναμένουμε να παρατηρήσουμε υψηλότερο ομοιότητες εντός της ομάδας του καρκίνου. Πιο συγκεκριμένα, περιμένουμε αποστάσεις μέσα σε σύνολα δεδομένων από μια ομάδα του καρκίνου να είναι μικρότερες από εκείνες από καλοήθη σύνολο.
Αυτό το σχήμα δείχνει σχηματικά την παραγωγή του πρωτοτύπου γράφημα.
Η
Η εργασία οργανώνεται ως εξής: στην ενότητα ‘δεδομένα και Μέθοδοι’ παρουσιάζουμε τις αξιοποιηθούν σύνολα δεδομένων και τη διαδικασία εξαγωγής συμπερασμάτων των δικτύων. Στη συνέχεια, περιγράφουμε την προσέγγιση προτυποποίηση γράφημα και τα απασχολούνται μέτρα απόσταση γράφημα λεπτομερώς. συνοψίζει και «Αποτελέσματα» της η ενότητα περιγράφει τα αποτελέσματα που προέκυψαν. Η ενότητα «Συζήτηση και Προοπτικές», τελειώνει το χαρτί με τη συζήτηση τα αποτελέσματά μας και ακολουθείται από μερικές τελικές παρατηρήσεις.
Υλικά και Μέθοδοι
προστάτη καρκίνο Δεδομένα
Έχουμε αποδείξει το γράφημα προσέγγιση πρωτοτύπων χρησιμοποιώντας ένα σύνολο από μελέτες για τον καρκίνο του προστάτη. Δεδομένου ότι αυτός ο καρκίνος έχει διερευνηθεί διεξοδικά τα τελευταία χρόνια, ένας μεγαλύτερος αριθμός των δεδομένων γονιδιακής έκφρασης είναι στη διάθεσή σας μέσω της δημόσιας αποθετήρια. Για την παρουσίασε μελέτη η έρευνα για τα αποθετήρια NCBI GEO [25], EBI ArrayExpress [26] και Oncomine [27] διεξήχθη. Για ένταξη σε μελέτες ανάλυσή μας πρέπει να αναφέρουν τα επίπεδα γονιδιακής έκφρασης από καρκίνο του προστάτη και καλοήθη δείγμα χρησιμοποιώντας μικροσυστοιχίες. Καλοήθης δείγμα είναι είτε δείγματα από φυσιολογικό ιστό δίπλα σε όγκους ή υγιείς άνδρες. Εμείς expurgate μεταστατικό μορφές από τα δείγματα καρκίνου για αυτή τη μελέτη, ώστε να μειωθεί η ετερογένεια στα δίκτυα. δεδομένα έκφρασης γραμμή κυττάρων επίσης εξαιρούνται. . Για να μειωθεί η προετοιμασία των δεδομένων και την προσπάθεια χαρτογράφησης που περιλαμβάνουν μόνο Affymetrix πλατφόρμες μικροσυστοιχιών σε αυτή τη μελέτη
Για τη διενέργεια αυτής της ανάλυσης επιλέγουμε επτά σύνολα δεδομένων [28] – [34] από την πισίνα δεδομένα που αναφέρονται στον Πίνακα 1. για να διερευνηθεί η επίδραση του μεγέθους του δείγματος εντός των μελετών σχετικά με τα αποτελέσματά μας ένα ευρύ φάσμα μεγεθών των δειγμάτων (από τις μικρές μελέτες για να μεγαλύτερες) επιτρέπεται. Μετά την επιλογή των μελετών που πρέπει να περιλαμβάνονται, έχουμε εκ νέου την εκτέλεση των μικροσυστοιχιών προεπεξεργασία. Τα δεδομένα μεγέθη δείγματος στον Πίνακα 1 αναφέρονται στην κατάσταση ελέγχου μετά ποιότητας. Που επιτρέπουν τη σύγκριση μεταξύ μελέτη των γονιδίων, οι αρχικές αναγνωριστικά αντιστοιχίζονται με τα αναγνωριστικά γονίδιο Εηίτεζ χρησιμοποιώντας το πακέτο Biomart [35] για Bioconductor [36]. Όπου πολλαπλές probesets χάρτη με ένα αναγνωριστικό γονίδιο Entrez, διατηρούμε τη μέτρηση με τη μεγαλύτερη διακύμανση. Μετά από αυτή τη χαρτογράφηση είναι 8906 γονίδια κοινά μέσα σε όλες τις επτά μελέτες που έφυγε για περαιτέρω ανάλυση. Για την εξαγωγή ενός κατάλληλου αναπαράσταση του δικτύου των δεδομένων, η δημιουργία δικτύων σύνδεσης επιλέχθηκε. Ωστόσο, οι μέθοδοι που παρουσιάζονται κατωτέρω ισχύουν για μια σειρά άλλων τύπων δικτύου πάρα πολύ, αν εγκριθεί σωστά.
Η
Δίκτυο Συμπερασμός
Για να συναχθεί μια σωστή εκπροσώπηση του δικτύου του υποκείμενου των δεδομένων είναι ένα σημαντική πρόκληση σε δίκτυο που βασίζεται σε έρευνα [37] – [39]. υπάρχει ένα ευρύ φάσμα των παραστάσεων του δικτύου για τα βιολογικά δεδομένα [39] – [41], και η μέθοδος γράφημα πρωτοτύπων που παρουσιάζονται στη συνέχεια μπορούν να εφαρμοστούν για τα περισσότερα από αυτά. Εδώ, χρησιμοποιούμε πληροφορίες σχετικά με τη σύνδεση μεταξύ δύο γονιδίων. Ως εκ τούτου, τα προκύπτοντα δίκτυα ονομάζονται τα δίκτυα σύνδεσης. Για συνάγοντας και ανάλυση δεδομένων γονιδιακής έκφρασης, όπως τα δίκτυα σύνδεσης, σχέσεις συν-έκφρασης έχουν συχνά χρησιμοποιηθεί [42]. Σημειώστε, ότι ένωση δεν σημαίνει απαραίτητα αιτιότητα. Ένας τρόπος για να αντιμετωπιστεί αυτό το πρόβλημα είναι να εφαρμοστεί η έννοια της αιτιώδους ιδιότητα μέλους [43], όπου τα γονίδια έχουν λειτουργικά κατηγοριοποιηθεί.
Εδώ, χρησιμοποιούμε την αμοιβαία πληροφόρηση ως μέτρο για τη σύνδεση, όπως περιγράφεται στο [39 ]. Για συνάγοντας τα δίκτυα από τα δεδομένα γονιδιακής έκφρασης, κάνουμε χρήση του αλγορίθμου MRNETB [38]. Να δημιουργήσει σύνολα δεδομένων για την επιλογή ενός πρωτοτύπου γράφημα, μπορούμε συμπεράνουμε δύο δίκτυα από κάθε μελέτη. Ένα δίκτυο που βασίζεται στις πληροφορίες από τα καλοήθη δείγματα σε μια μελέτη, και ένα δίκτυο από τα δείγματα καρκίνου στην ίδια μελέτη. Αυτό οδηγεί σε 6 καλοήθη δίκτυα, και 7 δίκτυα του καρκίνου, όπως έχουμε αφαιρέσει την καλοήθη δικτύου από τα δεδομένα Wang. Αυτό γίνεται λόγω του μικρού μεγέθους του δείγματος (), δεδομένου ότι θεωρούμε την τεκμαιρόμενη δικτύου ως ελάχιστη αξιοπιστία. Σε γενικές γραμμές, συνάγοντας ένα δίκτυο για κάθε ομάδα ασθενών χωριστά επιτρέπει την εκτέλεση τοπογραφικών συγκρίσεις και έτσι προκύπτουν νέα στοιχεία σχετικά με τις υποκείμενες λειτουργικές διαφορές.
Επιλογή ενός γραφήματος Πρωτότυπο
Για να γενικεύσουμε το πρόβλημα ομοιότητα γράφημα [ ,,,0],21], έχει αποδειχθεί από Dehmer et al. ότι μία γραφική παράσταση μπορεί να χρησιμοποιηθεί για να αντιπροσωπεύσει ένα σύνολο άλλων συγκρίσιμων γραφημάτων [21]. Το έργο της τον καθορισμό αυτής της λεγόμενης γράφημα πρωτότυπο μπορεί να λυθεί με την εφαρμογή απόσταση ή ομοιότητα μέτρα [21], [44]. Αφήνω είναι ένα δίκτυο, και είναι ένα μέτρο απόσταση γράφημα. Έχοντας ένα σύνολο δικτύων, το πρωτότυπο γράφημα μπορεί να εκφραστεί από [21], [23], [45] 🙁 1) Βλέπουμε ότι στην Εξ. 1 δίνει τη μέση απόσταση από δίκτυο σε όλα τα άλλα δίκτυα σε. Συμβολίζουμε αυτό ως. Ο στόχος μας στην παρούσα εργασία είναι να εφαρμόσει μια επιλογή των μέτρων απόσταση γράφημα για την επιλογή πρωτοτύπων γράφημα από ένα σύνολο δικτύων καρκίνου του προστάτη και ένα σύνολο αντίστοιχων καλοήθεις δικτύων. Η εφαρμογή των διαφόρων μέτρων απόσταση γράφημα σημαίνει ότι μπορούμε να καλύψουμε διάφορες πτυχές της δομικής ομοιότητας. Σε γενικές γραμμές, είναι ένα ακόμα εξαιρετικό πρόβλημα ποια πτυχή της δομικής ομοιότητας μιας υποκείμενης μέτρο συλλαμβάνει [44]. Εάν διαφορετικά μέτρα απόσταση γράφημα επιλέξετε το ίδιο δίκτυο με ένα πρωτότυπο διάγραμμα για ένα σύνολο δικτύων, αυτό αυξάνει το κύρος της επιλογής. Όσον αφορά τη μισθωτή μέτρο απόσταση το πρωτότυπο διάγραμμα αντιπροσωπεύει τις τοπολογικές ιδιότητες των άλλων δικτύων από το ίδιο σύνολο. Ως εκ τούτου, μπορεί να χρησιμοποιηθεί για την εκτέλεση μιας τοπολογική και λειτουργική ανάλυση.
Γράφημα Απόσταση Μέτρα
Για να εκτελέσετε γράφημα προτυποποίηση είναι απαραίτητο για τη μέτρηση της απόστασης μεταξύ των δύο δικτύων. Σε αυτή την υποενότητα παρουσιάζουμε δύο προσεγγίσεις για την επίτευξη αυτού του έργου. Η πρώτη προσέγγιση βασίζεται στη χρήση ανακριβείς ταιριάζουν γράφημα. Συγκεκριμένα, επιλέγουμε τη λεγόμενη απόσταση γράφημα επεξεργασία (
GED
) [46]. Η δεύτερη προσέγγιση βασίζεται στην σύγκριση των δύο διακριτές κατανομές πιθανοτήτων [47], τα οποία συνάγονται από που προέρχονται τα διαρθρωτικά χαρακτηριστικά των δικτύων.
Το
GED
είναι το ελάχιστο κόστος μιας ακολουθίας για την μετατροπή ενός γράφημα σε ένα άλλο γράφημα χρησιμοποιώντας λειτουργίες επεξεργασίας (διαγραφή και εισαγωγή άκρες ή διαγραφή, εισαγωγή, και υποκαθιστώντας κορυφές) [46]. Το βασικό πρόβλημα (για να συγκρίνετε δύο γραφήματα δομικά) μπορεί να θεωρηθεί ως μια γενίκευση της μεθόδου Levenshtein του [48] για τη σύγκριση χορδές. Σε γενικές γραμμές, ο υπολογισμός του
GED
για (μη επισημασμένα) γραφικές παραστάσεις είναι υπολογιστικά απαιτητική, δεδομένου ότι είναι NP πλήρης [49]. Για το σκοπό μας η πολυπλοκότητα μπορεί να μειωθεί λόγω τρία γεγονότα [50]: i) Όλα τα δίκτυά μας έχουν τον ίδιο αριθμό (καμία σχέση) κορυφές, ii) όλες οι κορυφές επισημαίνονται με μοναδικό τρόπο, και iii) επιλέγοντας μόνο τα γονίδια που είναι παρούσα σε όλες τις μελέτες, όλα τα δίκτυα έχουν το ίδιο σύνολο των κορυφών, η οποία μας ελευθερώνει από τη διαγραφή, εισαγωγή ή υποκατάσταση οποιεσδήποτε κορυφές. Έτσι, μειώνοντας την υπολογιστική πολυπλοκότητα σε [49]. Για τη μέτρηση των αποστάσεων μεταξύ των δύο δικτύων, απασχολούμε μια κανονικοποιημένη μορφή, η οποία δίνεται από το ποσοστό
GED
(
pGED
) [51] 🙁 2), όπου είναι ο αριθμός των μέγιστης δυνατής ακμές σε, και ο παράγοντας αναφέρεται στη μη-κατευθυνόμενη φύση των άκρων. Σταθμίσουμε όλα τα υπόλοιπα μετασχηματισμούς επεξεργασία (εισαγωγή, διαγραφή) εξίσου από την ανάθεση ενός βάρους.
Ένα θεωρίας της πληροφορίας προσέγγιση για την ποσοτικοποίηση αποστάσεις μεταξύ των γραφημάτων μπορεί να οριστεί με βάση την απόκλιση Kullback-Leibler (
KLD
) [47]. Ορίζουμε δύο διακριτή κατανομή πιθανότητας και, έτσι ώστε η
KLD
δίνεται ως [47] 🙁 3) Το
KLD
ορίζεται πάντοτε θετικά για την απόσταση μεταξύ και. Σημειώστε, ότι. Καθώς το
KLD
είναι ασύμμετρη και δεν ικανοποιεί την τριγωνική ανισότητα, δεν είναι μετρικό [52]. Μπορούμε στη συνέχεια να υπολογίσει το πρωτότυπο γράφημα θέτοντας στο
KLD
στην Εξ. 1. Αριθμητική σταθερότητα διασφαλίζεται με τον καθορισμό των πιθανοτήτων από το μηδέν έως.
Μια τυπικά διανομής που χρησιμοποιείται συχνά στη Βιολογία Συστημάτων είναι η διανομή βαθμό. Σε undirected δίκτυα, ο βαθμός δίνει τον αριθμό των γειτόνων για μια κορυφή. Αν ορίσουμε να είναι ο αριθμός των κορυφών με τις γειτονικές χώρες, μπορούμε να αντλήσουμε μια κατανομή πιθανοτήτων, ώστε: (4), όπου είναι ο μέγιστος αριθμός των γειτονικών κορυφών του. Σύκο. 2 δείχνει τις κατανομές βαθμός των καλοηθών και καρκίνος δίκτυα. μπορεί να χρησιμοποιηθεί για να χαρακτηρίσει ένα δίκτυο [9], [42], [53] – [55], και έχει αποδειχθεί ότι είναι χωρίς κλίμακα και ακολουθούν μια κατανομή ισχύος δικαίου για διάφορους τύπους βιολογικών δικτύων [42], [ ,,,0],53] – [55]. κατανομές ισχύος του νόμου των βαθμών μπορεί επίσης να φανεί στην Εικ. 2. Εδώ, χρησιμοποιούμε για τον υπολογισμό του
KLD
, το οποίο, ως εκ τούτου δηλώνουν ως.
Οι κατανομές βαθμό για τις καλοήθεις δεδομένων (επάνω) και τα δεδομένα του καρκίνου (κάτω). Για την εμφάνιση λόγους που στολισμένα τον αριθμό των μετρήσεων σε 300.
Η
Οι αποστάσεις παρούσας άλλη εξέχουσα δίκτυο αμετάβλητες. Για μια κορυφή η απόσταση από όλες τις άλλες κορυφές δίνεται από (5), όπου είναι η συντομότερη διαδρομή μεταξύ των κορυφών και. Αν αφήσουμε να είναι η πληθικότητα του συνόλου των αποστάσεων με το μήκος, τότε η κατανομή σύμφωνα απόστασης δίνεται ως (6) όπου είναι ο αριθμός των διαδρομών. Βλέπουμε ότι. Σημειώστε, ότι είναι η διάμετρος του, που είναι η μέγιστη από τις συντομότερες διαδρομές μεταξύ όλων των ζευγών των κορυφών. Οι κατανομές απόσταση για τα δίκτυα παρουσιάζεται στο Σχ. 3. Σας απασχολούν τα απόσταση κατανομές των περιλαμβάνονται δίκτυα, προκειμένου να ποσοτικοποιηθεί η απόσταση μεταξύ των δύο δικτύων, το οποίο συμβολίζεται ως.
Τα απόσταση κατανομές για τα καλοήθη δεδομένων (επάνω) και τα δεδομένα του καρκίνου (κάτω).
η
Αν και για τα τρία μέτρα απόσταση που παρουσιάσαμε πάνω από την πλήρη, ασύνδετα δίκτυο αναλύθηκε, τώρα παρουσιάζουν δύο μέτρα απόσταση που λειτουργούν μόνο σε συνδεδεμένη γραφήματα. Αυτό σημαίνει ότι πρέπει να συμπεράνουμε το μεγαλύτερο συνδεδεμένο υπογράφο του κάθε δικτύου και να εφαρμόσουν τα δύο μέτρα απόσταση από αυτούς. Η τρίτη διανομή που έχουμε συμπεριλάβει στο
KLD
μας -με βάση τα μέτρα απόστασης βασίζεται σε πιθανότητες κορυφή [56]. Μια πιθανότητα κορυφή εκχωρεί μια τιμή πιθανότητας σε μια κορυφή, κάνοντας χρήση μιας λεγόμενης λειτουργική κορυφή [56] 🙁 7) Βλέπουμε ότι. Στην εργασία αυτή χρησιμοποιούμε την ακόλουθη κορυφή λειτουργική [56] 🙁 8) Ο αριθμός των κορυφών στο -ου σφαίρα δίνεται για κάθε κορυφή ως [56]. Βλέπουμε ότι βασίζεται σε έμμετρο ιδιότητες των γραφημάτων [57]. Εδώ, αφήνουμε οι παράγοντες στάθμισης μειώνονται με εκθετικό τρόπο. Αυτό μας επιτρέπει να τονίσουμε τις κορυφές αρκετά κοντά, καθώς είναι πιθανότατα ισχυρότερη πραγματοποιείται από τις πληροφορίες που απλώνεται από το [56].
Τέλος, χρησιμοποιούμε μια κατανομή που μπορεί να υπολογιστεί με τη χρήση του περιεχομένου τοπολογικές πληροφορίες που βασίζονται στις τροχιές κορυφής [58], [59]. Μια τροχιά περιέχει τοπολογικά ισοδύναμες κορυφές [58], και παρέχει πληροφορίες σχετικά με τον αριθμό των κορυφών που ανήκουν στο -ου τροχιά κορυφής [58]. Εμείς εδώ καθορίσει μια κατανομή πιθανοτήτων αθροίζοντας τον αριθμό των τροχιών που μοιράζονται τον ίδιο αριθμό των κορυφών μέσα σε ένα δίκτυο. Αφήνω είναι ο αριθμός των τροχιών που περιέχει κορυφές. Αν έχει τροχιές κορυφή τότε παίρνουμε την κατανομή τροχιά (9) Σημείωση, ότι, όπου είναι το άθροισμα του αριθμού των τροχιών που περιέχουν τον ίδιο αριθμό κορυφών. Οι πληροφορίες σχετικά με την κατανομή των τοπογραφικών ισοδύναμο κορυφές σε κάθε ένα από τα δίκτυα μας μπορεί στη συνέχεια να χρησιμοποιηθεί για να συνδυάσει τις πληροφορίες για ένα σύνολο δικτύων με τη μέθοδο. Αναφερόμαστε σε αυτό ως.
Με κάθε μία από τις τέσσερις αυτές παρουσιάζονται κατανομές πιθανοτήτων μπορούμε να καλύψουμε διάφορες πτυχές της τοπολογικές ιδιότητες των δικτύων μας. Η κατανομή πιθανοτήτων για αυτή βασίζεται σε πληροφορίες σχετικά με το πώς συνδέονται τα γονίδια σε κάθε ένα από τα δίκτυα. Πληροφορίες σχετικά με τις αποστάσεις επικοινωνία μεταξύ γονιδίων αντικατοπτρίζεται από τη διανομή που χρησιμοποιείται σε. βασίζεται σε μια κατανομή πιθανότητας που περιγράφει τη διάδοση των πληροφοριών σε ένα δίκτυο, ενώ η κατανομή πιθανοτήτων στις αντανακλά τοπολογική ισοδυναμία των κορυφών. Ο Πίνακας 2 συνοψίζει τα μισθωτούς μέτρα απόσταση. Αφού εισήγαγε επίσημη συσκευή μας, υπολογίζουμε τις αποστάσεις και το γράφημα πρωτότυπο για τις δύο ομάδες δειγμάτων (καλοήθεις και καρκίνο). Για τους υπολογισμούς και στατιστική ανάλυση που κάνουν χρήση του στατιστικού προγραμματισμού γλώσσας R (https://www.r-project.org). Οι κατανομές πιθανοτήτων για τον υπολογισμό και υπολογίζονται με τη χρήση του πακέτου QuACN [60].
Η
Αποτελέσματα
Ο Πίνακας 3 παρέχει μια σύνοψη των μέσων αποστάσεων για τα πέντε μέτρα απόσταση και τις δύο ομάδες . Κατά τον υπολογισμό του βλέπουμε ότι η μέση απόσταση για τις έξι δίκτυα κυμαίνεται από στην καλοήθη ομάδα, και από προς τα επτά δίκτυα στην ομάδα του καρκίνου. Οι μέσες τιμές είναι (καλοήθης) και (καρκίνος). Σύκο. 4 παρέχει μια απεικόνιση όλων των μεμονωμένων αποστάσεις από το ένα δίκτυο για όλους τους άλλους στην ίδια ομάδα. Μία διάκριση μεταξύ της κατανομής του μεταξύ του καρκίνου και καλοήθεις δείγμα μπορεί να θεωρηθεί. Για την καλοήθη ομάδα, το δίκτυο που βασίζεται στα δεδομένα από τον Yu επιλέγεται ως γραφική παράσταση πρωτότυπο, ενώ για την ομάδα του καρκίνου η μορφή του δικτύου έχει επιλεγεί ο Wang δεδομένα. Η μέση απόσταση για τα δεδομένα Yu είναι και για τα δεδομένα Wang. Το δίκτυο-ειδική μέση απόσταση από τις σειρές από έως για τα δίκτυα από τα καλοήθη στοιχεία, αντίστοιχα προς τα δεδομένα για τον καρκίνο του προστάτη. Οι μέσες τιμές είναι (καλοήθης) και (καρκίνος). Σύκο. 5 οπτικοποιεί τα αποτελέσματα. Τα επιλεγμένα πρωτότυπα γράφημα είναι Yu (καλοήθης) με μέση απόσταση και Wang (καρκίνο) με μέση απόσταση. , Η οποία βασίζεται στη διανομή απόσταση μέσα σε ένα δίκτυο, επιλέγει τα δίκτυα από τα Singh δεδομένα (καλοήθης) και τα δεδομένα Wang (καρκίνου) ως πρωτότυπα γράφημα. Τα πρωτότυπα γράφημα έχουν μια μέση απόσταση (καλοήθης) και (καρκίνος). Οι μέσες αποστάσεις από το ένα δίκτυο σε όλους τους άλλους στις ίδιες ομάδες για κάθε ομάδα είναι (καλοήθεις) και (καρκίνος). Τα λεπτομερή αποτελέσματα απεικονίζονται στο Σχ. 6. Τα δίκτυα από Yu (καλοήθεις) και Wang (καρκίνος) είναι και πάλι επιλεγεί ως πρωτότυπα γράφημα κατά τη χρήση. Το ελάχιστο είναι για τον καλοήθη πρωτότυπο γράφημα, αντίστοιχα για το πρωτότυπο διάγραμμα καρκίνου. Οι μέσες τιμές είναι (καλοήθης) και (καρκίνος). Οι αποστάσεις από το ένα δίκτυο σε όλα τα άλλα δίκτυα εντός της ίδιας ομάδας που απεικονίζεται ως Boxplots στο Σχ. 7. Μαζί με το αυτό αντιπροσωπεύει τις δύο περιπτώσεις, όπου η απόσταση εντός του δεδομένων για τον καρκίνο είναι μεγαλύτερο τότε εντός των καλοήθων δεδομένων. Για το μέτρο που βασίζεται στις τροχιές οι αποστάσεις από τα πρωτότυπα γράφημα είναι για την καλοήθη δίκτυο Yu και για το δίκτυο του καρκίνου που βασίζεται σε δεδομένα Wang. Οι μέσες αποστάσεις είναι (καλοήθης) και (καρκίνος), όπως φαίνεται στο Σχ. 8.
Αυτό το σχήμα δείχνει τις αποστάσεις από το ένα δίκτυο σε όλα τα άλλα δίκτυα, με βάση την κανονικοποιημένη Γράφημα Επεξεργασία Απόσταση
pGED
. Στο αριστερό τμήμα απεικονίζει τις αποστάσεις μεταξύ ενός καλοήθους δικτύου και όλων των άλλων καλοηθών δίκτυα, ενώ στο δεξί μέρος απαριθμεί τις αποστάσεις για το ένα δίκτυο καρκίνο σε όλα τα άλλα δίκτυα καρκίνου. Τα δίκτυα που έχουν επιλεγεί ως πρωτότυπα γράφημα τονίζεται σε διάφορα χρώματα (καλοήθης = μπλε, του καρκίνου = καφέ).
Η
Εδώ, δείχνουμε τις αποστάσεις μεταξύ ενός δικτύου και όλα τα άλλα δίκτυα όπως Boxplots, μετράται με η απόκλιση Kullback-Leibler, η οποία βασίστηκε στη διανομή βαθμό. Στο αριστερό μέρος δείχνουμε τα καλοήθη δεδομένων, και στο δεξί μέρος οι αποστάσεις από τα δεδομένα του καρκίνου. Τα πρωτότυπα γράφημα τόνισε.
Η
Αυτή η εικόνα εμφανίζει τις αποστάσεις μεταξύ των δικτύων, όπως Boxplots. Οι αποστάσεις με βάση την κατανομή των αποστάσεων μεταξύ των κορυφών και την απόκλιση Kullback-Leibler. Στο αριστερό μέρος είναι οι αποστάσεις μεταξύ των καλοήθων δίκτυα, και στο δεξί μέρος οι αποστάσεις μεταξύ των δικτύων καρκίνου.
Η
Εδώ, προβάλλουμε τις αποστάσεις με βάση την απόκλιση Kullback-Leibler, με βάση το συναρτησιακά σφαίρα κορυφή. Στο αριστερό μέρος δείχνουμε τα καλοήθη δείγματα και στο δεξί μέρος τις αποστάσεις για τα δείγματα καρκίνου. Τα επιλεγμένα πρωτότυπα γράφημα τόνισε.
Η
Αυτή η εικόνα απεικονίζει τις αποκλίσεις Kullback-Leibler για τις κατανομές τροχιά πιθανοτήτων. Στο αριστερό μέρος απαριθμεί τα καλοήθη δείγματα, και στο δεξί μέρος τα δείγματα καρκίνου από τις μελέτες.
Η
κύρια υπόθεσή μας είναι ότι υπάρχει μια σημαντική διαφορά μεταξύ των αποστάσεων στην ομάδα του καρκίνου δειγμάτων και οι αποστάσεις στην ομάδα των καλοηθών δειγμάτων. Για τη δοκιμή αυτής της υπόθεσης χρησιμοποιούμε ένα τεστ Wilcoxon (βλέπε πίνακα 4) για καθένα από τα πέντε μέτρα απόσταση στο σύνολο των αποστάσεων από τα δείγματα του καρκίνου και των καλοηθών δειγμάτων. Διορθώνουμε για πολλαπλές δοκιμές με τη μέθοδο Bonferroni. ,, Παρουσιάζουν μια σημαντική διαφορά (), όπως μπορεί να φανεί στον Πίνακα 4. Η παρατηρούμενη τα αποτελέσματα υποστηρίζουν την υπόθεση, δείτε Boxplots στα σχετικά στοιχεία.
Η
Για την ανίχνευση μοτίβα στο σύνολο των αποστάσεων που απασχολούν ομαδοποίηση. Ως εκ τούτου, έχουμε ομαλοποίηση το αποτέλεσμα κάθε μέτρο απόστασης χωρίς τις πληροφορίες ομάδας. Αυτό γίνεται για κάθε μέτρο απόστασης χωριστά, έτσι ώστε η ελάχιστη κάθε μέτρου απόστασης έχει οριστεί σε και η μέγιστη να. Στη συνέχεια εφαρμόζουμε ιεραρχική ομαδοποίηση. Για κάθε δίκτυο έχουμε ένα διάνυσμα χαρακτηριστικών, η οποία αποτελείται από τη μέση απόσταση από όλα τα άλλα δίκτυα για κάθε ένα από τα πέντε μέτρα απόσταση που χρησιμοποιούνται. Έτσι, για τη συνολική ομαδοποίηση έχουμε μια μήτρα με 5 σειρές και 13 στήλες. Το αντίστοιχο θερμικός χάρτης, χρησιμοποιώντας την Ευκλείδεια απόσταση και πλήρης σύνδεση, απεικονίζεται στο Σχ. 9. Θα εφαρμόζεται επίσης μέσο σύνδεσης, όπως η λειτουργία clustering, οι οποίες οδηγούν στο ίδιο αποτέλεσμα. Ως εκ τούτου, θεωρούμε την παρατηρούμενη αποτέλεσμα ως σταθερές σε σχέση με αυτές τις δύο λειτουργίες σύνδεσης. Τα αποτελέσματα δείχνουν ότι τρία από τα δίκτυα του καρκίνου (Tsavachidou, Wallace, Singh, Liu) σχηματίζουν ένα ξεχωριστό σύμπλεγμα, ενώ όλα τα άλλα δίκτυα συγκεντρωμένα. Στη δεύτερη συστάδα παρατηρούμε ότι τρία από τα δίκτυα του καρκίνου (Chandran, Wang, και Yu) σύμπλεγμα στενά με τρεις καλοήθεις δίκτυα (Yu, Singh, Tsavachidou).
Εμείς εδώ δείχνουν η μέση απόσταση από το ένα δίκτυο στο τα άλλα δίκτυα εντός του ίδιου ομίλου (καλοήθεις ή καρκίνο). Για την ομαδοποίηση εμείς τότε παραλείπονται τα στοιχεία της ομάδας. Εμείς ανεξάρτητα προσθέσετε τις πληροφορίες του ομάδα ως καφέ μπαρ (καρκίνος) και μπλε γραμμές (καλοήθης).
Η
Με βάση τα αποτελέσματα από την προτυποποίηση γράφημα επιλέγουμε το δίκτυο από τα δεδομένα Yu ως γράφημα πρότυπο για την καλοήθη σύνολο, και το δίκτυο από τα δεδομένα Wang ως γράφημα πρότυπο για το σύνολο του καρκίνου. Για την ανάλυση των τοπολογικές ιδιότητες των δικτύων ερευνούμε τα γονίδια πλήμνης. Η κατανομή των 15 ως επί το πλείστον συνδέονται μοίρες πλήμνη παρουσιάζεται στον Πίνακα 5. Παρατηρούμε ότι τα κύρια γονίδια κόμβο στο δίκτυο του καρκίνου είναι αξιοσημείωτα μικρότερες από εκείνες στην καλοήθη δίκτυο. Αυτό είναι σύμφωνο με γνωστά αποτελέσματα του οποίου εφαρμόζεται καταμέτρηση των ψήφων άκρη για την ανάλυση ενοποιητική δίκτυο [19]. Σε αυτή τη μελέτη παρατηρήθηκε επίσης αρκετά μικρό βαθμούς στο κοινό δίκτυο καρκίνου. Μία απορύθμιση των γονιδίων πλήμνη, που συνδέεται με τη διάρκεια του κύκλου των κυττάρων, μπορεί να παίζει έναν σημαντικό ρόλο στην ανάπτυξη μιας επιθετική μορφή του καρκίνου του προστάτη [61]. Παρόμοια με άλλες κλιμακούμενων δικτύων [62], [63], βιολογικά δίκτυα ενδέχεται να είναι ευάλωτοι σε επιθέσεις εναντίον ενός τα λίγα κεντρική γονίδια κόμβο. Ωστόσο, έχει αποδειχθεί πρόσφατα ότι κόμβο γονίδια δεν πρέπει απαραίτητα να πληρούν τις προϋποθέσεις ως εύθραυστη και ότι άλλα μέτρα για αυτό το ξενοδοχείο θα μπορούσε να είναι πιο κατάλληλη [64]. Αναλύοντας τις αποστάσεις μεταξύ των κορυφών επιτρέπει τον χαρακτηρισμό των διαδικασιών επικοινωνίας σε ένα βιολογικό δίκτυο. Ως εκ τούτου, έχουμε διερευνήσει τις αποστάσεις μεταξύ των κορυφών των δύο πρωτότυπα γράφημα. Εξ ορισμού, η εκκεντρότητα μιας κορυφής είναι η μέγιστη από τις συντομότερες διαδρομές από σε όλες τις άλλες κορυφές. Για την καλοήθη γράφημα πρωτότυπο την πλειοψηφία των κορυφών έχουν ένα του, ενώ για το πρωτότυπο διάγραμμα καρκίνο η πλειοψηφία των κορυφών έχουν ένα 1. Συγκρίνουμε τις κατανομές εκκεντρικότητα των δύο δικτύων με ένα τεστ Kolmogorov-Smirnov, που οδηγεί σε μια πολύ σημαντική διαφορά (). Ένα άλλο ενδιαφέρον χαρακτηριστικό του δικτύου είναι η διάμετρος του δικτύου, που είναι η μέγιστη όλων. Για τα δύο πρωτότυπα γράφημα οι διάμετροι είναι 17 (καλοήθεις) και 12 (καρκίνος).
You must be logged into post a comment.