PLoS One: Ο εντοπισμός του καρκίνου του ήπατος και των σχέσεών της με τις ασθένειες, τα ναρκωτικά, και γονίδια: Μια Λογοτεχνία-Based Approach


Αφηρημένο

Στη βιοϊατρική, επιστημονική βιβλιογραφία είναι μια πολύτιμη πηγή για την άντληση γνώσεων. γνώση εξόρυξης από δεδομένα κειμένου έχει γίνει ποτέ σημαντικό έργο, όπως ο όγκος της επιστημονικής βιβλιογραφίας αυξάνεται άνευ προηγουμένου. Στην εργασία αυτή, προτείνουμε ένα πλαίσιο για την εξέταση ορισμένων ασθενειών με βάση τις υπάρχουσες πληροφορίες που παρέχονται από την επιστημονική βιβλιογραφία. οντότητες που σχετίζονται με την ασθένεια που περιλαμβάνουν τις ασθένειες, τα φάρμακα, και τα γονίδια συστηματικά εξάγονται και αναλύονται χρησιμοποιώντας μια προσέγγιση που βασίζεται σε δίκτυο τριών επιπέδων. Ένα δίκτυο χαρτί-φορέα και ένα δίκτυο οντότητα συνύπαρξη (μακρο-επίπεδο) είναι διερευνηθεί και χρησιμοποιούνται για την κατασκευή ειδικών δικτύων έξι οντότητα (μεσο-επίπεδο). Οι σημαντικές ασθένειες, φάρμακα, και τα γονίδια καθώς και εμφανή σχέσεων οντότητα (μικρο-επίπεδο) που προσδιορίζονται από τα δίκτυα αυτά. Τα αποτελέσματα που προκύπτουν από τη βιβλιογραφία που βασίζεται εξόρυξης λογοτεχνία μπορεί να χρησιμεύσει για να βοηθήσει κλινικές εφαρμογές

Παράθεση:. Zhu Υ, Τραγούδι Μ, Yan Ε (2016) Προσδιορισμός του καρκίνου του ήπατος και των σχέσεών της με τις ασθένειες, τα ναρκωτικά, και Γονίδια: A Λογοτεχνία-Based Approach. PLoS ONE 11 (5): e0156091. doi: 10.1371 /journal.pone.0156091

Επιμέλεια: Ying Xu, Πανεπιστήμιο της Γεωργίας, Ηνωμένες Πολιτείες |

Ελήφθη: 24 Αυγούστου του 2015? Αποδεκτές: 9η Μαΐου 2016? Δημοσιεύθηκε: 19 του Μάη 2016

Copyright: © 2016 Zhu et al. Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της άδειας χρήσης Creative Commons Attribution, το οποίο επιτρέπει απεριόριστη χρήση, τη διανομή και την αναπαραγωγή σε οποιοδήποτε μέσο, ​​με την προϋπόθεση το αρχικό συγγραφέα και την πηγή πιστώνονται

Δεδομένα Διαθεσιμότητα:. Όλη η δεδομένα είναι εντός του Υποστηρίζοντας αρχεία πληροφοριών του χαρτιού και: S1 αρχείου. πίνακας οντότητα για τα γονίδια, τα ναρκωτικά και τις ασθένειες. S2 αρχείου. Χαρτί πίνακα ένωση οντότητα

Χρηματοδότηση:. Κατέστη Το έργο αυτό είναι δυνατόν εν μέρει από το Ινστιτούτο Μουσείο και Βιβλιοθήκη Υπηρεσίες (Αριθμός Βραβείο Grant: RE-07-15-0060-15), για το έργο με τίτλο «Building μια οντότητα που βασίζεται πλαίσιο της έρευνας για την ενίσχυση των ψηφιακών υπηρεσιών για την ανακάλυψη γνώσης και της παράδοσης ». Επιπλέον, το έργο υποστηρίχθηκε εν μέρει από το Πρόγραμμα Βιο-Synergy Research (NRF-2013M3A9C4078138) του Υπουργείου Επιστημών, των ΤΠΕ και μελλοντικό σχεδιασμό μέσω του Εθνικού Ιδρύματος Ερευνών

Αντικρουόμενα συμφέροντα:. Οι συγγραφείς έχουν δηλώσει ότι δεν υπάρχουν ανταγωνιστικά συμφέροντα.

Εισαγωγή

η επιστημονική βιβλιογραφία είναι η κύρια πηγή για τους μελετητές να επικοινωνούν με τους άλλους, καθώς και το κοινό. Οι μελετητές δημοσιεύει έγγραφα και να παρουσιάσει τα αποτελέσματα της έρευνας σε συνέδρια για να μεταφέρω τις ιδέες και τη διάδοση της γνώσης για την κοινότητα. Όπως η επιγραμμική προσβασιμότητα στην επιστημονική βιβλιογραφία είναι αυξημένη, ο ρυθμός ανάπτυξης της ακαδημαϊκής βιβλιογραφίας είναι άνευ προηγουμένου υψηλό. Μια γραμμική αύξηση των δημοσιεύσεων έχει αναφερθεί για τομείς όπως η βιοπληροφορική [1]. Μια ανησυχία ως αποτέλεσμα τέτοιος πολλαπλασιασμός είναι η χρονική υστέρηση κατανάλωση επιστημονική βιβλιογραφία. Για να αντιμετωπιστεί αυτή η ένταση, οι μελετητές έχουν προσπαθήσει να εφαρμόσει μια ποικιλία από τεχνικές εξόρυξης κειμένου, όπως εξαγωγή πληροφοριών [2], το θέμα μοντελοποίηση [3], και το έγγραφο περιλήψεων [4], για την απόσταξη συστηματική γνώση από μεγάλη επιστημονική βιβλιογραφία σώματα.

στη βιοϊατρική, επιστημονική βιβλιογραφία, κυρίως από PubMed [5] -ένα δωρεάν πύλη για δημοσιεύσεις και παραπομπή στο Medline, έχει χρησιμοποιηθεί σε σχέση με τεχνικές εξόρυξης κειμένου για να βοηθήσουν τη βιοϊατρική έρευνα. Η εστίαση είναι συνήθως σε απόσπασμα των σχέσεων μεταξύ των βιοϊατρικών οντότητες, όπως οι ενώσεις πρωτεΐνης νόσο [6], το γονίδιο σχέσεις [7], οι σχέσεις του γονιδίου-φαρμάκου [8, 9, 10], οι σχέσεις γονίδιο-νόσου [11, 12], και πρωτεΐνες -πρωτεΐνη αλληλεπιδράσεις [13, 14]. Al-Mubaid 2) Ποια ζεύγη φορείς έχουν τη δυνατότητα να έχουν νόημα σχέσεις για την ανακάλυψη πληροφοριών, οντότητα και σύσταση σχέση οντότητα, και άλλα ανάκτηση και κλινικές εφαρμογές; Με αυτή την έννοια, οι διακομιστές της μελέτης μας ως μια γέφυρα που συνδέει προηγούμενες μελέτες για τη βιοϊατρική εξόρυξης κειμένου με πρακτικές εφαρμογές για να βοηθήσει περισσότερο εστιασμένη έρευνα μέσω οντότητες και τις σχέσεις τους υψίστης σημασίας. Για την επίτευξη αυτού του στόχου, προτείνουμε ένα πλαίσιο για τον προσδιορισμό των σημαντικών ασθενειών, τα ναρκωτικά, και τα γονίδια για μια συγκεκριμένη ασθένεια. Το πλαίσιο αποτελείται από μια μέθοδο εκχύλισης οντότητα και μια προσέγγιση που βασίζεται σε δίκτυο τριών επιπέδων για την ανάλυση της βιβλιογραφίας με βάση το σύνολο δεδομένων.

Ο καρκίνος είναι μια κύρια αιτία θανάτου σε όλο τον κόσμο, μεταξύ των οποίων, ο καρκίνος του ήπατος είναι η δεύτερη κύρια αιτία των θανάτων από καρκίνο [24]. Όπως πολλοί ως 564.000 άνθρωποι διαγιγνώσκονται με καρκίνο του ήπατος κάθε χρόνο, και η τάση τείνει να συνεχιστεί για αρκετές δεκαετίες σε πολλές ανεπτυγμένες χώρες, όπως οι Ηνωμένες Πολιτείες [25]. Είναι γνωστό ότι οι περισσότερες περιπτώσεις καρκίνου του ήπατος που ξεκίνησε από άλλα μέρη του σώματος και διάφορους τύπους όγκων μπορεί να αυξηθεί στο ήπαρ, διότι το ήπαρ περιλαμβάνει διαφορετικούς τύπους κυττάρων [26]. Έτσι, σε αυτό το ευρύ πεδίο της μελέτης καρκίνο του ήπατος λογοτεχνία-βάση, τον εντοπισμό σημαντικών οντοτήτων και των σχέσεων μεταξύ των οντοτήτων που έχουν στενή σχέση με τον καρκίνο του ήπατος θεωρείται επωφελής. Σε αυτό το πλαίσιο, έχουμε εφαρμόσει τις προτεινόμενες μεθόδους σε ένα σύνολο δεδομένων δημοσίευση να κατανοήσουν την ασθένεια, χρησιμοποιώντας αυτή την πλούσια πηγή της επιστημονικής βιβλιογραφίας.

Δεδομένα και μέθοδοι

Δεδομένα

«καρκίνο του ήπατος «επιλέχθηκε ως ο όρος σπόρος για την αναζήτηση PubMed. Εμείς ανακτηθεί 169.774 PubMed αρχεία και να τα κατεβάσετε σε μορφή XML. Στη συνέχεια αναλύεται το κατεβάσει τα αρχεία για να εξαγάγετε τίτλους και περιλήψεις για την εξόρυξη οντότητα με την εφαρμογή μιας μονάδας SAX Parsing. συνόλου δεδομένων μας περιλαμβάνει 16.568 πρόσωπα (S1 αρχείου. Προσώπων) και 1.023.204 οντότητα-φορέα και το χαρτί-οντότητα σχέσεις (S2 αρχείων. Βιβλίο-Οντότητα Σχέσεων). Ο Πίνακας 1 δείχνει το ποσοστό του κάθε τύπου οντοτήτων μεταξύ όλων 16.568 πρόσωπα. Η διαδικασία της εξόρυξης οντότητα από τα κατεβάσει τα αρχεία θα συζητηθεί στην ενότητα μέθοδο.

Η

Μέθοδοι επισκόπηση

Νοσημάτων, τα ναρκωτικά, και οντοτήτων γονίδιο που εξάγεται από τα τεχνουργήματα που λαμβάνονται από το PubMed. εξάγονται οντότητες που χρησιμοποιούνται για την κατασκευή ενός δικτύου χαρτί-οντότητα, καθώς και ένα δίκτυο οντότητα συνύπαρξη. Τα δίκτυα αυτά μακρο-επίπεδο περαιτέρω αναλυθούν σε τρεις τύπους δικτύων μεσο-επίπεδο (δηλαδή, τα δίκτυα της νόσου, τα δίκτυα των ναρκωτικών, και τα δίκτυα γονιδίων). Αυτά τα οντότητα ειδικών δικτύων που χρησιμοποιούνται για τη διερεύνηση σημαντικών ασθενειών, τα ναρκωτικά, και τα γονίδια καθώς και εμφανή σχέσεων σε κάθε οντότητα του ομίλου. Σχήμα 1 δείχνει το σχηματικό διάγραμμα για τη μέθοδο προτείνουν.

Η

Έχουμε εξηγήσει δύο βασικά στάδια της ανάλυσης προτεινόμενης μεθόδου, η εξαγωγή πληροφοριών και δικτύων, στις ακόλουθες υποενότητες.

Εξαγωγή Πληροφορίας.

Έχουμε εφαρμόσει ένα εξάρτημα εκχύλισης οντότητα με την επέκταση του Στάνφορντ CoreNLP [27]. Stanford CoreNLP παρέχει μια σειρά από επεξεργασία φυσικής γλώσσας (NLP) εργαλεία ανάλυσης που μπορεί να πάρει αγγλική γλώσσα τα κείμενα και να εκτελέσει μια ποικιλία από NLP εργασίες όπως φράση διάσπαση, μέρος του λόγου (POS) tagging, και της εξάρτησης ανάλυσης. Η μονάδα εκχύλισης οντότητα πέρασε από τα παρακάτω τέσσερα βήματα. Το πρώτο βήμα είναι να χωρίσει ένα αρχείο σε προτάσεις. Χρησιμοποιήσαμε το «ssplit» σωλήνα που προβλέπονται στο Στάνφορντ CoreNLP. Το δεύτερο βήμα είναι να οικοδομήσουμε τρία λεξικά για τις ασθένειες, τα γονίδια, και τα ναρκωτικά. Χρησιμοποιήσαμε τη βάση δεδομένων CTD (https://www.ctdbase.org/) για να δημιουργήσετε τα τρία λεξικά. Συνολικά, το λεξικό του φαρμάκου περιλαμβάνει 151.729 ονόματα των ναρκωτικών? το λεξικό της νόσου περιλαμβάνει 11.937 ονόματα της νόσου? και το λεξικό γονίδιο περιλαμβάνει 297.514 ονόματα γονίδιο. Το τρίτο βήμα είναι να ενσωματώσει PubTator [28] για την ενίσχυση των Εγκατεστημένος λεξικά. Πραγματοποιήσαμε μια προκαταρκτική δοκιμή για την εξαγωγή βιολογικών οντοτήτων μόνο με τα λεξικά CTD-based και διαπίστωσε ότι η ποιότητα της εξόρυξης οντότητα δεν ήταν ικανοποιητικές. Έτσι, αποφασίσαμε να προσθέσουμε PubTator να ενισχύσει περαιτέρω τα λεξικά. PubTator, αναπτύχθηκε για να εκπληρώσει δύο επιμέλεια τα καθήκοντα-έγγραφο διαλογή και βιο-έννοια σχολιασμό, περιέχει σχολιασμούς βιο-φορέα για αρκετές οντότητες, όπως τα χημικά προϊόντα, τις ασθένειες, τα γονίδια, οι μεταλλάξεις και τα είδη. Από αυτούς τους τύπους, μας ενδιαφέρει μόνο σε τύπους της νόσου, τα ναρκωτικά, και το γονίδιο. Pubtator περιέχει 16.582.474 γονίδια, 26788622 ασθένειες, και 24.915.999 φάρμακα. Όταν συγχωνεύονται τρία λεξικά CTD με τρία λεξικά PubTator για τα ναρκωτικά, τη νόσο, και το γονίδιο, ελέγξαμε αν υπάρχει ένα κοινό λεξικό εισόδου μοιράζεται στα δύο λεξικά. Αν βρεθεί, κρατήσαμε μόνο μία καταχώρηση. Αυτό διπλούν βήμα εξάλειψη καταλήγει σε 25.053.123 ονομάτων των φαρμάκων για το λεξικό φάρμακο, 26791436 ονόματα ασθένεια για το λεξικό ασθένεια, και 16.761.566 ονόματα γονίδιο για το λεξικό γονίδιο. Το τέταρτο βήμα είναι να ταιριάζει με φράσεις tokenized στα τρία λεξικά. Σε αυτό το βήμα, θα χρησιμοποιηθούν τα ακόλουθα τρία υπο-βήματα: tokenization, λημματοποίησης και την ομαλοποίηση

Tokenization.. Χρησιμοποιήσαμε την τεχνική tokenization Στάνφορντ PTBTokenizer [29]. PTBTokenizer έχει σχεδιαστεί για να είναι μια γρήγορη, βασισμένο σε κανόνες tokenizer να συμμορφώνονται με τις συμβάσεις tokenization Penn Treebank [29].

λημματοποίησης. Χρησιμοποιήσαμε την τεχνική λημματοποίησης το οποίο είναι διαθέσιμο στο πακέτο Στάνφορντ CoreNLP. Παρέχει πλήρη μορφολογική ανάλυση για την ακριβή ταυτοποίηση του λήμματος για κάθε λέξη. Λημματοποίησης είναι παρόμοια με την λέξη που προκύπτουν, αλλά αντί να παράγουν ένα στέλεχος της λέξης, το οποίο αντικαθιστά το επίθημα για να πάρει την κανονικοποιημένη μορφή λέξη.

Κανονικοποίηση. Χρησιμοποιήσαμε την τεχνική κορδόνι εξομάλυνση για να μειωθεί η διακύμανση εγχόρδων κατά περίπτωση ευαισθησία και ειδικούς χαρακτήρες, συμπεριλαμβανομένων +, *,? Και _. Οι χορδές με κεφαλαία άλλαξε σε εκείνους με πεζά, και /ή οι όρισε ειδικούς χαρακτήρες αφαιρεθεί από όλα τα κείμενα εισόδου και λεξικό δεδομένων. Στην περίπτωση του ειδικού χαρακτήρα »-«.., Έχει αντικατασταθεί από κενά, επιτρέποντας για τις γενικές τάσεις όνομα της οντότητας

Ανάλυση Δικτύων

Η ανάλυση του δικτύου αποτελείται από έξι βήματα (Σχήμα 2) : 1) την κατασκευή ενός δικτύου χαρτί οντότητα? 2) τον προσδιορισμό των κορυφαίων φορέων? 3) την κατασκευή ενός δικτύου οντότητας συνύπαρξη? 4) ο προσδιορισμός των οντοτήτων εξαιρετικά συν-συνέβη με κορυφαίους φορείς? 5) η κατασκευή συγκεκριμένη οντότητα δικτύων (PageRank- και betweenness-based)? και 6) η διερεύνηση των συγκεκριμένων δικτύων οντότητας. Αυτά τα βήματα εκπονήθηκε στις επόμενες παραγράφους.

Η

Ένα δίκτυο χαρτί οντότητα κατασκευάστηκε χρησιμοποιώντας τις εξάγεται οντότητες. Είναι μια ετερογενής, μη σταθμισμένο δικτύου που περιέχει τέσσερις τύπους κόμβων: χαρτιά, ασθένειες, φάρμακα, και τα γονίδια. Το δίκτυο συλλαμβάνει τις σχέσεις μεταξύ χαρτιά και οντότητες έτσι ώστε να υπάρχει μια ακμή εάν ένα έγγραφο περιλαμβάνει μια οντότητα (δηλαδή, μια ασθένεια, φάρμακο, ή γονιδίων). Το δίκτυο χαρτί οντότητα αποτελεί τη βάση για τον προσδιορισμό των σημαντικών φορέων μέσω των τοπογραφικών ερευνών. Δύο μέτρα με βάση το δίκτυο, PageRank και betweenness κεντρικότητα, χρησιμοποιήθηκαν για τον προσδιορισμό σημαντικών φορέων από αυτό το δίκτυο. PageRank είναι ένας αλγόριθμος που χρησιμοποιείται για την κατάταξη ιστοσελίδες ανάλογα με τον αντίκτυπο της inlinks [30]. Οντότητες που κατατάσσονται σε μεγάλο βαθμό από το PageRank είναι εκείνες με τη μεγαλύτερη επίπτωση. Betweenness κεντρικότητα είναι ένας δείκτης για τη μέτρηση της επίδρασης των κόμβων από την άποψη της ικανότητας για τη μεταφορά πληροφοριών σε ένα δίκτυο [31]. Έτσι, ένας κόμβος με υψηλή κεντρικότητα betweenness σημαίνει ότι παίζει σημαντικό ρόλο στη μεταφορά πληροφοριών σε άλλους. Στο δίκτυο χαρτί-οντότητα, οντοτήτων με υψηλή κεντρικότητα betweenness διαδραματίζουν βασικό ρόλο στο σύνολο του δικτύου συνδέοντας άλλες οντότητες. Αυτές οι δύο αλγόριθμοι έχουν εφαρμοστεί σε ορισμένους τομείς για τον εντοπισμό σημαντικών αντικειμένων και ηθοποιούς. Για παράδειγμα, Zhu & amp? Γιαν [32] εφαρμόζονται PageRank για τον εντοπισμό σημαντικών υποπεδίο εντός επιστήμη των υπολογιστών να κατανοήσουν τα πρότυπα διάχυσης της γνώσης του? Jing & amp? Baluja [33] εφαρμόζονται PageRank για να ανακτήσετε πολύ σημαντικές εικόνες σε μια αναζήτηση εικόνων. Ομοίως, betweenness κεντρικότητα είχε χρησιμοποιηθεί για τον εντοπισμό σημαντικών κόμβων για να λύσει το πρόβλημα του ελέγχου του δικτύου σε δίκτυα επικοινωνίας [34]? που εφαρμόστηκε επίσης σε ένα δίκτυο συμμαχία για να εξερευνήσουν νέες τεχνολογίες [35].

Ένα δίκτυο συνύπαρξη στη συνέχεια κατασκευάστηκε από το δίκτυο χαρτί-οντότητα. Το δίκτυο συν-εμφάνιση είναι μια ετερογενής, σταθμισμένη δίκτυο περιλαμβάνει τις ασθένειες, τα φάρμακα, και τα γονίδια. Χαρτί-οντότητα σχέσεις χρησιμοποιήθηκαν για τον υπολογισμό των τιμών συνύπαρξη. Δηλαδή, αν συν-συνέβη δύο ή περισσότερες οντότητες μέσα σε ένα έγγραφο, ο αριθμός των συν-εμφάνισης καταγράφηκε και να αντιμετωπίζεται ως το βάρος στο δίκτυο οντότητα συνύπαρξη. Τα δίκτυα συνύπαρξη μελετηθεί ευρέως [36, 37], που βασίζεται στην ιδέα ότι οι οικονομικές οντότητες έχουν ισχυρές αλληλεπιδράσεις μεταξύ τους τείνουν να συν-συμβαίνουν συχνά. Έτσι, οι σχέσεις συνύπαρξης είναι ένα σημαντικό χαρακτηριστικό στην εξέταση μεταξύ, σχέσεις οντότητας.

Σε ένα δίκτυο οντότητα συνύπαρξη, ασθένειες που πολύ συν-συνέβη με κορυφαία ασθένειες που χαρακτηρίζονται από το δίκτυο χαρτί οντότητα στη συνέχεια εξάγεται . Επειδή έχουμε δύο σύνολα των κορυφαίων ασθενειών προσδιορίζονται χωριστά από PageRank και betweenness κεντρικότητα, συλλέχθηκαν δύο συγκεκριμένη ασθένεια σύνολα δεδομένων. Τέσσερις περισσότερα σύνολα δεδομένων (δηλαδή, για τα ναρκωτικά και τα γονίδια) έχουν επίσης κατασκευαστεί ξεχωριστά, χρησιμοποιώντας την ίδια μέθοδο. Έτσι, κάθε ένα από τα έξι σύνολα δεδομένων περιλαμβάνει κορυφαία πρόσωπα και οντότητες που πολύ συν-συνέβη με αυτές τις κορυφαίες οντότητες. Τα έξι σύνολα δεδομένων χρησιμοποιήθηκαν στη συνέχεια για την κατασκευή έξι ομοιογενή δίκτυα (δηλαδή, δύο δίκτυα της νόσου (PageRank που βασίζεται και betweenness κεντρικότητα-based), δύο δίκτυα των ναρκωτικών, και τα δύο δίκτυα γονιδίων) διατηρώντας την τιμή συνύπαρξη ως βάρος σύνδεσμο. Αυτά τα έξι δίκτυα είναι τα μεταμορφωμένα δίκτυα του προηγούμενου δικτύου οντότητα συνύπαρξη περιλαμβάνοντας μόνο έναν τύπο οντοτήτων, καθώς και ένα μικρό σύνολο των σημαντικών φορέων. Οι οντότητα ειδικών δικτύων είναι κατασκευασμένα για να πάρετε μια συμπυκνωμένη και ουσιαστική προβολή της νόσου σπόρων. Σε κάθε μία από τις έξι δίκτυα οντότητα, εξάγαμε επίσης εξαιρετικά συν-συνέβη ζεύγη οντότητα. Επειδή κάθε τύπο οντότητας που σχετίζονται με συγκεκριμένες δίκτυα δύο οντότητας (PageRank που βασίζεται και betweenness κεντρικότητα-based), εντοπίστηκαν δύο σύνολα ζευγών μέσα σε ένα τύπο οντότητας.

Αποτελέσματα

Σε αυτό το τμήμα, αναφέρουμε διαδοχικά σημαντικές ασθένειες, φάρμακα, και των οντοτήτων καθώς και σημαντικά ζεύγη των φορέων στον τομέα της έρευνας για τον καρκίνο του ήπατος.

σημαντικές προσώπων

Ο Πίνακας 2 παρουσιάζει δύο σύνολα top 10 της νόσου, τα ναρκωτικά , και γονίδια: ένα που βασίζεται σε PageRank και το άλλο με βάση betweenness. Συζητάμε αυτές τις σημαντικές οντότητες στις ακόλουθες τρεις υποενότητες.

Η

Ασθένειες.

Όπως φαίνεται στον Πίνακα 2, τρεις ασθένειες (δηλαδή, του όγκου, του καρκίνου, και ηπάτωμα) εμφανίστηκε και στις δύο λίστες

. Ηπατοκυτταρικό καρκίνωμα, HCC, και ηπάτωμα υποδηλώνουν την ίδια έννοια και το ίδιο κάνουν και κίρρωση και κίρρωση του ήπατος. Το ηπατοκυτταρικό καρκίνωμα είναι ένας κοινός τύπος καρκίνου του ήπατος που προκαλείται από κίρρωση στις περισσότερες περιπτώσεις. Κίρρωση /κίρρωση του ήπατος μπορεί να προκαλείται από ηπατίτιδα [38]. Σύγκριση με PageRank, betweenness κεντρικότητα περιλαμβάνει περισσότερους ειδικούς όρους (δηλαδή, αυτοσωματικό υπολειπόμενο, κληρονομική διαταραχή, ενδοηπατική και extrahepatic χολαγγειοκαρκίνωμα, και CRLM και επιπλέον ηπατική νόσο) και όρους που δεν μπορεί εύκολα να συνδεθεί με τον καρκίνο του ήπατος, όπως θυρεοτοξίκωση, μιτοχονδριακή δυσλειτουργία, και HPV. συνδέσεις αυτές τις ασθένειες »σε καρκίνο του ήπατος μπορεί να είναι αυτοί που έχουν τη δυνατότητα να γίνει περισσότερο κατανοητή.

Ναρκωτικά.

Σε αντίθεση με τις ασθένειες, μόνο ένα φάρμακο (δηλαδή, τυροσίνη) εμφανίστηκε και στις δύο λίστες. αναστολέας της τυροσίνης ή της κινάσης της τυροσίνης (ΤΚΙ) είναι ένα φάρμακο που χρησιμοποιείται για τη θεραπεία του καρκίνου του ήπατος με αναστολή κινασών τυροσίνης οι οποίες είναι ένζυμα που χρησιμοποιούνται από τα κύτταρα για τη μετάδοση καλλιέργεια και τη διαίρεση σήματα [39, 40]. Η τραστουζουμάμπη χρησιμοποιείται για τη θεραπεία του καρκίνου του μαστού και κακοήθεις όγκους [41] και φολλινικό ασβέστιο χρησιμοποιείται για να μειώσει τις παρενέργειες που προκαλούνται από τη χρήση ορισμένων αντικαρκινικών φαρμάκων [42]. Betweenness κεντρικότητα κατατάσσεται χημικές ενώσεις ιδιαίτερα όπως metallocorrole, [11C] CH3OTf, 3-μεθυλχολανθρενίου, CBD (κανναβιδιόλη), και diethylnitrosamine. Δίνουμε s σύντομη επισκόπηση για ορισμένα σημαντικά φάρμακα σε αυτή την ενότητα

Η σισπλατίνη:.. Η σισπλατίνη χρησιμοποιείται για τη θεραπεία διαφόρων μορφών καρκίνου, συμπεριλαμβανομένου του καρκίνου του ήπατος [43]

Γλυκόζη: Τα ηπατικά κύτταρα είναι γνωστό ότι παράγουν γλυκόζη η οποία βοηθά την ανθρώπινη διατήρηση υγιών επιπέδων σακχάρου στο αίμα. Εάν αυτά τα κύτταρα γίνονται καρκινικά, τότε χάνουν την ικανότητα και αυτό κάνει τα καρκινικά κύτταρα πολλαπλασιάζονται [44]

5-FU:.. 5-φθοριοουρακίλη είναι ένα φάρμακο που χρησιμοποιείται για τη θεραπεία του καρκίνου [45]

γλουταθειόνη: γλουταθειόνη, επίσης γνωστή ως γ-γλουταμυλίου, είναι μια ουσία που περιέχεται στα κύτταρα. Λαμβάνεται να αποτοξινώσει και την πρόληψη καρδιακών νόσων, διαφόρων μορφών καρκίνου, κλπ. [46]

Η

Εκτός από αυτά τα φάρμακα, ορισμένα βασικά στοιχεία, όπως το οξυγόνο, το αμινοξύ, τυροσίνη (ένα από τα 22 αμινο οξέα) είναι επίσης πολύ ανάλογα με το PageRank. Τα στοιχεία αυτά έχουν την ικανότητα να διεγείρει τις λειτουργίες του σώματος και τους ιστούς του σώματος επισκευής.

Τα γονίδια.

Σε αντίθεση με τις ασθένειες και τα ναρκωτικά, δύο λίστες στον πίνακα 2 δεν μοιράζονται κανένα κοινό γονίδιο. Επειδή τα γονίδια είναι πιο κοκκώδη οντότητες από τις ασθένειες και τα ναρκωτικά, μπορεί να μην αφορούν αποκλειστικά τον καρκίνο του ήπατος. Οι αναγνώστες μπορούν να επισκεφθούν GeneCards (https://www.genecards.org), μια βάση δεδομένων ανθρώπινο γονίδιο, για περισσότερες πληροφορίες σχετικά με αυτά τα γονίδια.

Χαρακτηριστικά Δίκτυο της Οντότητας Δικτύων

Top οντότητες που φαίνονται στον Πίνακα 2 χρησιμοποιήθηκαν για την ταυτότητα άλλες οντότητες που πολύ συν-συνέβη με τις οντότητες αυτές σε δίκτυα οντότητα συνύπαρξη. Στη συνέχεια, αυτές οι οντότητες συνολικά σχηματίζουν δύο δίκτυα της νόσου (PageRank που βασίζεται και betweenness κεντρικότητα-based), δύο δίκτυα των ναρκωτικών, και τα δύο δίκτυα γονιδίων, από την οποία εντοπίστηκαν πάνω ζεύγη των ασθενειών, τα ναρκωτικά, και τα γονίδια. Ο Πίνακας 3 δείχνει τα στατιστικά του κάθε δικτύου.

Η

Όπως φαίνεται στον Πίνακα 3, δίκτυα PageRank που βασίζεται έχουν υψηλότερο μέσο όρο βαθμών καθώς και μέσο σταθμικό βαθμούς. Αυτό δείχνει ότι οι φορείς των δικτύων PageRank που βασίζεται αλληλεπιδρούν πιο ενεργά με το άλλο. Για μέσο μήκος διαδρομής, κάθε δίκτυο έχει ένα παρόμοιο μέσο μήκος διαδρομής (δηλαδή, περίπου 3). Όλα τα δίκτυα είναι αραιή με πυκνότητα γράφημα μικρότερη από 0,1. Διαμορφωσιμότητα χρησιμοποιείται για τη μέτρηση της πιθανότητας ότι ένα δίκτυο μπορεί να διαιρεθεί σε κοινότητες [47]. δικτύων νόσο έχουν χαμηλότερη σπονδυλωτής από τα δίκτυα των ναρκωτικών και του γονιδίου. Αυτό συμβαίνει επειδή ασθενειών γενικά αλληλεπιδρούν με πολλές άλλες ασθένειες. Ενώ betweenness δίκτυα κεντρικότητα που βασίζονται έχουν περισσότερες κοινότητες από δίκτυα PageRank που βασίζεται, το δίκτυο της νόσου PageRank βασίζεται σε έχει μόνο δύο κοινοτήτων, το οποίο είναι πολύ χαμηλότερο από τον ελάχιστο αριθμό των κοινοτήτων των άλλων δικτύων. Betweenness κεντρικότητα που βασίζεται σε δίκτυο γονιδίων που καταγράφονται κατά μέσο όρο συντελεστή ομαδοποίησης του μηδενός. Αυτό σημαίνει ότι δεν υπάρχει τρίγωνο σε αυτό το δίκτυο, όπως τα γονίδια φαίνεται στον Πίνακα 2 (betweenness κεντρικότητα-based) έχουν μάλλον διακριτά χαρακτηριστικά.

Κυριότερα Ζεύγη ασθένειες, ναρκωτικά, και Γονίδια

Πίνακας 4 δείχνει ιδιαίτερα συν-συνέβη ζεύγη των ασθενειών, των ναρκωτικών, και τα γονίδια. Αυτά τα ζεύγη χωρίστηκαν σε τρεις ομάδες με βάση τον αριθμό των συνύπαρξη. Συζητάμε αυτά τα σημαντικά ζεύγη οντότητα στις ακόλουθες τρεις υποενότητες.

Η

Ασθένειες.

Τα δίκτυα κεντρικότητα που βασίζεται νόσο PageRank που βασίζεται και betweenness οπτικοποιούνται σε ετικέτες Σχήμα 3. Κόμβος είναι ανάλογη με σταθμισμένος βαθμός και το εύρος των δεσμών είναι ανάλογη με τον αριθμό των συν-εμφάνισης μεταξύ των δύο ασθενειών.

PageRank που βασίζεται (α) και Betweenness κεντρικότητα-based (β) τα δίκτυα της νόσου.

η

Το πιο σημαντικό οντότητα στο σχήμα 3 (Α) είναι του όγκου. Tumor υψηλά συν-συνέβη με ηπατοκυτταρικό καρκίνωμα, HCC, καρκίνο, και ηπατώματος. Σημαντικές ασθένειες σε σχήμα 3 (Α) είναι γενικά οι ίδιες ασθένειες που είναι ιδιαίτερα ανάλογα με τη PageRank στον Πίνακα 2.

Ασθένειες σε Σχήμα 3 (Β) έχουν την τάση να συν-συμβαίνουν συχνά με το άλλο, το οποίο είναι σε αντίθεση με το δίκτυο της νόσου PageRank που βασίζεται. Μια πιθανή εξήγηση είναι ότι η κορυφή ασθένειες με υψηλό betweenness κεντρικότητα δεν μελετήθηκαν πολλά χαρτιά? ως εκ τούτου, δεν συνυπάρχουν συχνά με άλλες ασθένειες.

Έξι ζεύγη των ασθενειών (π.χ., καρκίνωμα του όγκου στο ήπαρ, όγκου-HCC, όγκου-μετάσταση στο ήπαρ, καρκίνο-HCC, όγκου-μετάσταση και ηπάτωμα -hepatitis Β) εμφανίστηκε και στις δύο λίστες. Οι σχέσεις αυτών των ασθενειών είναι αυτονόητα, ίσως με την εξαίρεση του «καρκίνου του ηπατώματος-μαστού». Πρόσφατες ανακαλύψεις έχουν βρει ότι ο καρκίνος του μαστού, παρόμοια με καρκίνους όπως ο καρκίνος του παχέος εντέρου, ο καρκίνος της ουροδόχου κύστης και του καρκίνου του νεφρού, είναι ένας από τους καρκίνους που μπορεί να εξαπλωθεί σε συκώτια [48].

Drugs.

το σχήμα 4 δείχνει δύο τύπους δικτύων ναρκωτικών κατασκευάστηκε από το δίκτυο χαρτί-φορέα και του δικτύου οντότητα συνύπαρξη.

PageRank που βασίζεται (α) και Betweenness κεντρικότητα-based (β) τα δίκτυα των ναρκωτικών.

Δέκα πιο ορατές οντότητες που φαίνεται στο Σχήμα 4 (Α) είναι ακριβώς η ίδια όπως top 10 φορείς ανάλογα με PageRank στον πίνακα 2, ενώ το επίπεδο προβολής είναι διαφορετική.

Δύο σημαντικά φάρμακα στο σχήμα 4 (Β) είναι τυροσίνη και diethylnitrosamine. Τυροσίνη, όπως αναφέρθηκε στο προηγούμενο τμήμα, χρησιμοποιείται για τη θεραπεία του καρκίνου του ήπατος με αναστολή κινασών τυροσίνης [36]. Diethylnitrosamine, κατετάγη δεύτερη, συν-συνέβη 392 φορές με άλλα φάρμακα. Η κατάσταση της diethylnitrosamine είναι περισσότερο εμφανής στο συγκεκριμένο δίκτυο φάρμακο (κατετάγη δεύτερη) από ό, τι στο δίκτυο χαρτί-οντότητα (κατετάγη το 10ο). Το εύρημα αυτό έχει υποστηρίξει την ανάγκη να κατασκευάσει ειδικά τέτοια οντότητα δίκτυα-με αυτόν τον τρόπο, είμαστε σε θέση να αποκτήσουν πιο αναλυτική κατανόηση της διαδραστικότητας των οντοτήτων που μπορεί να αγνοηθεί στο παγκόσμιο δίκτυο.

Top 15 ζεύγη ναρκωτικών φαίνονται στον πίνακα 4. δύο ζεύγη (δηλαδή, τυροσίνη-σερίνη και τυροσίνη-imatinib) εμφανίζονται στις δύο PageRank- και betweenness λίστες κεντρικότητα που βασίζεται. Τόσο τυροσίνη και σερίνη ανήκουν στους ίδιους ομάδα- proteingenic αμινοξέα τα οποία είναι δομικά στοιχεία των πρωτεϊνών [49]. Το imatinib είναι ένα είδος αναστολέα tyrpsine-κινάσης που χρησιμοποιείται για τη θεραπεία καρκίνων. Στη λίστα των betweenness κεντρικότητας, δεν υπάρχει ζεύγος εμφανίστηκαν πάνω από 100 φορές.

Σχέσεις φαίνονται στον Πίνακα 4 εξετάστηκαν με αναφορά σε απευθείας σύνδεση πόρους, συμπεριλαμβανομένων WebMD (https://www.webmd.com) και τα ναρκωτικά. com (https://www.drugs.com). Οι ιστοσελίδες αυτές παρέχουν λεπτομερείς πληροφορίες σχετικά με τα ναρκωτικά, καθώς και υπηρεσίες πούλι αλληλεπίδρασης φαρμάκων. Οι σχέσεις που αναφέρθηκαν από τους δύο σε απευθείας σύνδεση πόροι ήταν τολμηρό-που αντιμετωπίζουν στον Πίνακα 4. Μόνο δύο σχέσεις (δηλαδή, χολερυθρίνη-ασπαρτικό και τυροσίνη-σερίνη) δεν επιβεβαιώθηκαν στη λίστα PageRank που βασίζεται, ενώ στην κεντρικότητα που βασίζεται σε λίστα betweenness, δύο σχέσεις (δηλαδή, γ-γλουταμυλ-γλουταμυλ και τυροσίνη-imatinib) επιβεβαιώθηκαν. Έτσι, η λογοτεχνία προσέγγιση είναι ένας πολύτιμος τρόπος για να βοηθήσει τις κλινικές δοκιμές.

Τα γονίδια.

Σχήμα 5 απεικονίζει δύο ειδικών δικτύων γονίδιο κατασκευάστηκε από μια συλλογή από τα κορυφαία γονίδια και τα γονίδια που πολύ συν-συνέβη με αυτά τα γονίδια.

PageRank που βασίζεται (α) και Betweenness κεντρικότητα-based (β) τα δίκτυα γονιδίων.

η

Betweenness κεντρικότητα που βασίζεται σε δίκτυο γονίδιο περιλαμβάνει 47 σημαντικές γονίδια, η οποία έχει λιγότερες γονίδια από το ένα PageRank που βασίζεται που έχει 67 γονίδια. Ένα χαρακτηριστικό της σχήμα 5 (Β) είναι ότι τα περισσότερα γονίδια συν-σημειώθηκε λιγότερο από πέντε φορές με άλλα γονίδια. Αυτό υποδηλώνει ότι δεν ήταν ευρέως μελετηθεί σε προηγούμενη βιβλιογραφία και αλληλεπιδράσεις μεταξύ αυτών των γονιδίων και του καρκίνου του ήπατος μπορεί να χρειαστεί να διερευνηθεί περαιτέρω.

Ο Πίνακας 4 παρουσιάζει κορυφαία ζεύγη 15 γονίδιο που προσδιορίζονται από το γονίδιο κεντρικότητα που βασίζεται PageRank- και betweenness δίκτυο. Όλα τα ζεύγη στον κατάλογο των betweenness κεντρικότητας σημειώθηκε λιγότερο από 50 φορές. Διερεύνηση των αλληλεπιδράσεων μεταξύ ασθενειών και γονιδίων μπορεί να είναι πιο δύσκολο από ό, τι ψάχνετε μέσα στις σχέσεις μεταξύ ασθενειών και ασθενειών /φάρμακα, επειδή τα γονίδια είναι πιο κοκκώδη οντότητες και μπορεί ενεργά ή λανθάνοντα αφορούν μια πληθώρα ασθενειών ή φαρμάκων. Με αυτή την έννοια, οι αλληλεπιδράσεις εμφανίζονται σε αυτή τη μελέτη μπορεί να χρησιμοποιηθεί για να ξεκινήσει μια ουσιαστική έρευνα.

Για την εξέταση του γονιδίου σχέσεις στον Πίνακα 4, που αναφέρεται σε απευθείας σύνδεση πόρους, συμπεριλαμβανομένων BioGRID (https://www.thebiogrid.org), Βιογραφικό (https://www.biograph.be), CTD (https://www.ctdbase.org), και GeneCards (https://www.genecards.org). BioGRID επιβεβαίωσε τρία σχέσεις (δηλαδή, p53-Bcl-2, ρ53-Bax, και ιστόνης HDAC-), Biograph επιβεβαιώθηκε μία σχέση (δηλαδή, ρ53-ρ21), και CTD επιβεβαιώθηκε μία σχέση (δηλαδή, ινσουλίνη-γλυκαγόνη). Οι σχέσεις που επιβεβαιώθηκαν από αυτές τις ηλεκτρονικές πόροι ήταν έντονους χαρακτήρες στον πίνακα 4. Σε αντίθεση με τις ασθένειες και τα φάρμακα, ένας αριθμός γονίδιο σχέσεων στον Πίνακα 4 δεν επιβεβαιώθηκαν από τις κλινικές δοκιμές. Αυτό πιθανώς οφείλεται στο μεγάλο όγκο των γονιδίων και των σχέσεών τους, που μπορεί να σχετίζονται με τον καρκίνο του ήπατος.

Συζήτηση και Συμπεράσματα

Σε αυτή τη μελέτη, πρότεινε μια προσέγγιση της βιβλιογραφίας που βασίζεται για τον εντοπισμό της νόσου που σχετίζονται με τις οντότητες που περιλαμβάνουν ασθένειες, φάρμακα, και τα γονίδια για τον καρκίνο του ήπατος. Μια σειρά από προσεγγίσεις που βασίζονται σε δίκτυο εφαρμόστηκαν για τον εντοπισμό σημαντικών φορέων μεταξύ των εξάγεται οντότητες. Top ασθένειες, φάρμακα, και τα γονίδια που εντοπίστηκαν από δύο διαφορετικά μέτρα και ελήφθησαν thusly δύο ομάδες οντοτήτων. Μια ομάδα, που σχηματίζεται με βάση τις οντότητες που έχουν την υψηλότερη βαθμολογία PageRank, περιλαμβάνει οντότητες που κέρδισε τη δημοτικότητα και ευρέως ερευνηθεί στη λογοτεχνία. Οντότητες που περιλαμβάνονται σε αυτή την ομάδα είναι σημαντική για την κατανόηση των ασθενειών. Η άλλη ομάδα, που σχηματίζεται με βάση τις οντότητες που έχουν την υψηλότερη betweenness κεντρικότητα, περιλαμβάνει οντότητες που έπαιξε καθοριστικό ρόλο σ ‘ολόκληρο το δίκτυο για τη σύνδεση άλλων φορέων. Οντότητες σε αυτή την ομάδα, ενδεχομένως, έχουν τοπολογική σημασία στη μελέτη της συγκεκριμένης ασθένειας. Έξι οντότητα συγκεκριμένα δίκτυα κατασκευάστηκαν συνδυάζοντας την οντότητα του δικτύου συνύπαρξη και των εντοπισθέντων κορυφή φορείς να ανακαλύψουν εμφανή σχέσεων οντότητα. Ένα τμήμα των ανακαλύψει σχέσεις οντότητας επιβεβαιώθηκε από κλινικές δοκιμές

λήφθηκαν Βασικές διαπιστώσεις:. 1) PageRank και betweenness κεντρικότητα είναι συμπληρωματικές στον εντοπισμό σημαντικών φορέων. Όπως PageRank προσδιορίζει δημοφιλή πρόσωπα, ενώ betweenness κεντρικότητα εντοπίζει σημαντικούς φορείς, η συνδυαστική χρήση των δύο είναι μια λογική και αποτελεσματικός τρόπος για να επιλέξετε και να εξετάσει σημαντικά πρόσωπα? 2) η ολοκληρωμένη χρήση των παγκόσμιων και περιφερειακών δικτύων εντοπίζει αποτελεσματικά παγκόσμιες οντότητες καθώς και οντότητες που είναι σημαντικές, αλλά δεν είναι αισθητή στην παγκόσμια τοπολογία. Περιφερειακών δικτύων καθιστούν δυνατό τον προσδιορισμό σημαντικών ζεύγη φορέων από ένα μεγάλο όγκο των συνδέσεων στην παγκόσμια δίκτυα? 3) ασθένειες, φάρμακα, και γονίδια που υπάρχουν διαφορετικά χαρακτηριστικά στον εντοπισμό σημαντικών φορέων και τα ζεύγη των φορέων που σχετίζονται με τον καρκίνο του ήπατος. Προσδιορίζονται ασθένειες και τα ζεύγη των ασθενειών έχουν την υψηλότερη οικειότητα, ενώ η ερμηνεία της εντοπίστηκαν τα ναρκωτικά και τα γονίδια επιβάλλει περισσότερες προκλήσεις, όπως φαίνεται στην εγκάρσια επικύρωση των αποτελεσμάτων με εξωτερικούς πόρους. Αυτό συνεπάγεται αυξημένο επίπεδο demandingness στην έρευνα βιο-οντότητα και η μελετημένη οντότητες γίνει πιο κοκκώδη. Έτσι, παρόμοια έρευνα σε ένα πιο λεπτομερές επίπεδο είναι πολλά υποσχόμενη και κριτική στην προώθηση της λογοτεχνίας που βασίζεται σε βιοϊατρική έρευνα? και 4) μερικά σχέσεις που προσδιορίζονται από την προτεινόμενη μέθοδο έχουν υψηλή συνοχή με τις κλινικές δοκιμές (δηλαδή, οι σχέσεις του φαρμάκου), ενώ μερικοί δεν (δηλαδή, γονίδιο σχέσεις). Ανεπιβεβαίωτες σχέσεις δεν σημαίνει ασήμαντο σχέσεις? μάλλον, ξεχωρίζουν μεταξύ πολλών άλλων, επειδή σημαίνουν δυνητικά σημαντικές σχέσεις που θα μπορούσαν να επικυρωθούν σε μελλοντική έρευνα. Οι ερευνητές και οι επαγγελματίες μπορούν να λάβουν τα αποτελέσματα της λογοτεχνίας προσέγγιση ως κίνησης σημείο της έρευνάς τους. Η προτεινόμενη μέθοδος μπορεί να χρησιμοποιηθεί για να βοηθήσει τις κλινικές δοκιμές για τον εντοπισμό σημαντικών σχέσεων οντότητα.

Αυτή η μελέτη έχει κάποιους περιορισμούς. Δεσμών μεταξύ των οντοτήτων βασίστηκαν σε συνύπαρξη σχέσεις. Co-εμφάνιση δεν μπορεί να αποδείξει άμεσα τις πραγματικές αλληλεπιδράσεις μεταξύ των οντοτήτων.

You must be logged into post a comment.