PLoS One: Μια προστάτη Μοντέλο Καρκίνου Κατασκευάστηκε από ένα μυθιστόρημα SVM-ID3 Hybrid Χαρακτηριστικό Μέθοδος επιλογής χρησιμοποιώντας τόσο Γονοτυπικές και του φαινοτύπου Δεδομένα από dbGaP


Αφηρημένο

Μέσω Γονιδιώματος Wide Σπουδών Association (GWAS) πολλά πολυμορφισμού ενός νουκλεοτιδίου (SNP ) σύμπλοκο σχέσεις ασθένεια μπορεί να διερευνηθεί. Η έξοδος της GWAS μπορεί να είναι υψηλή σε ποσότητα και υψηλής διαστάσεων, επίσης, οι σχέσεις μεταξύ των SNPs, φαινότυποι και οι ασθένειες είναι πιο πιθανό να είναι μη γραμμική. Για να χειριστεί διαστάσεων δεδομένων μεγάλου όγκου-υψηλό και να είναι σε θέση να βρει τις μη γραμμικές σχέσεις που έχουμε χρησιμοποιούνται προσεγγίσεις εξόρυξης δεδομένων και ένα μοντέλο επιλογής υβριδικό χαρακτηριστικό της μηχανής διανυσμάτων υποστήριξης και δέντρο αποφάσεων έχει σχεδιαστεί. Το σχεδιασμένο μοντέλο έχει δοκιμαστεί σε δεδομένα του καρκίνου του προστάτη και για πρώτη φορά χρησιμοποιούνται συνδυασμένες πληροφορίες γονότυπο και φαινότυπο του να αυξήσει την διαγνωστική απόδοση. Ήμασταν σε θέση να επιλέξετε φαινοτυπικά χαρακτηριστικά, όπως ο δείκτης εθνικότητα και το σώμα μάζας, και SNPs εκείνων χάρτη σε συγκεκριμένα γονίδια, όπως

CRR9

,

TERT

. Τα αποτελέσματα απόδοσης του προτεινόμενου υβριδικού μοντέλου, στο σύνολο δεδομένων του καρκίνου του προστάτη, με 90,92% ευαισθησίας και 0,91 της περιοχής κάτω από την καμπύλη ROC, δείχνει τις δυνατότητες της προσέγγισης για την πρόβλεψη και την έγκαιρη διάγνωση του καρκίνου του προστάτη.

Παράθεση : Yücebaş SC, Aydın Υιός Υ (2014) μια προστάτη Μοντέλο Καρκίνου Κατασκευάστηκε από ένα μυθιστόρημα SVM-ID3 Hybrid Χαρακτηριστικό Μέθοδος επιλογής χρησιμοποιώντας τόσο Γονοτυπικές και του φαινοτύπου δεδομένα από dbGaP. PLoS ONE 9 (3): e91404. doi: 10.1371 /journal.pone.0091404

Επιμέλεια: Γιώργος Γάκης, Πανεπιστήμιο Eberhard-Karls, Γερμανία

Ελήφθη: 16 Ιούλη 2013? Αποδεκτές: 12, Φεβρουαρίου, 2014? Δημοσιεύθηκε: 20 του Μάρτη του 2014

Copyright: © 2014 Yücebaş, Aydın Υιός. Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της άδειας χρήσης Creative Commons Attribution, το οποίο επιτρέπει απεριόριστη χρήση, τη διανομή και την αναπαραγωγή σε οποιοδήποτε μέσο, ​​με την προϋπόθεση το αρχικό συγγραφέα και την πηγή πιστώνονται

Χρηματοδότηση:. Αυτοί οι συγγραφείς δεν έχουν καμία υποστήριξη ή χρηματοδότηση για να αναφέρετε

Αντικρουόμενα συμφέροντα:.. Οι συγγραφείς έχουν δηλώσει ότι δεν υπάρχουν ανταγωνιστικά συμφέροντα

Εισαγωγή

σε Γονιδιώματος Wide Μελέτες σύνδεσης (GWAS) ενός νουκλεοτιδίου οι πολυμορφισμοί (SNP) σύμπλοκο ενώσεις ασθένεια αναζήτηση όπως, σχετίζεται με την ηλικία εκφύλιση της ωχράς κηλίδας [1], οι καρδιοπάθειες [2], του διαβήτη [3], η ρευματοειδής αρθρίτιδα [4], νόσο του Crohn [5], Hypertension [6], Multiple σκλήρυνση [7] και τύπους καρκίνου [8] – [9] – [10] νευροεκφυλιστικές ασθένειες [11] και των ψυχιατρικών ασθενειών όπως η διπολική διαταραχή [12]. Τρέχουσα GWAS του προφίλ SNP με τέτοιες χρόνιες και περίπλοκες ασθένειες οδηγούν στην ανακάλυψη των διαφορετικών γενετικών τόπων και των ατομικών SNPs που σχετίζονται με τις συνθήκες, αλλά η σχέση του μόνο SNP προφίλ του γονότυπου δεν είναι αρκετά ισχυρή για την πρόβλεψη της κατάστασης της νόσου. Έτσι, η μελέτη αυτή έχει σχεδιαστεί για να ελεγχθεί η υπόθεση, εάν και σε ποιο βαθμό ενσωμάτωσης προφίλ γονότυπος και τα φαινοτυπικά χαρακτηριστικά? συμπεριλαμβανομένων των δημογραφικών πληροφοριών, περιβαλλοντικούς παράγοντες, τον τρόπο ζωής συνήθειες, μαζί με τα κλινικά ευρήματα του ασθενούς θα ενισχύσει την κατηγορηματικό επιδόσεις των μοντέλων της νόσου. Μέχρι στιγμής δεν υπάρχει καμία δημοσίευση που συνδυάζει πολλαπλές γονοτυπική και πολλαπλές φαινοτυπικά χαρακτηριστικά, τα οποία θα απαιτούν την εφαρμογή των νέων εργασιών εξόρυξης δεδομένων που μπορεί να χειριστεί τα δεδομένα με τέτοια διαφορετικά χαρακτηριστικά και ακόμη μεγαλύτερη διάσταση.

Οι μέθοδοι που χρησιμοποιούνται στην GWAS μπορούν να ομαδοποιηθούν σε δύο βασικές κατηγορίες οι οποίες είναι παραμετρικές και μη παραμετρικές [13]. Μη-παραμετρικές μέθοδοι δεν απαιτούν ένα γενετικό μοντέλο δεδομένη εκ των προτέρων? αντί να χτίζουν τα δικά τους μοντέλα με βάση τα δεδομένα στοιχεία από τη χρήση της εξόρυξης δεδομένων και μηχανικής μάθησης [13]. Οι μη-παραμετρικές μέθοδοι προτιμούνται λόγω της μεγάλης διάστασης των γενετικών δεδομένων στην οποία οι παραδοσιακές μέθοδοι στατιστικής δεν είναι αρκετά επαρκής για την ανάλυση [14]. Σχεδόν όλοι οι αλγόριθμοι μάθησης, γνωστή μηχανή έχει χρησιμοποιηθεί σε GWAS, μερικά από τα κύρια μεθόδους είναι Δένδρα Απόφασης [15] – [16], Τεχνητά Νευρωνικά Δίκτυα [16], Bayesian Δίκτυα πίστη [17], Support Vector Machines [18] – [ ,,,0],19] – [20] και Γενετικοί Αλγόριθμοι [21]. Για την ανάλυση των δεδομένων προσδιορισμού γονοτύπου, όπως παρατηρείται από διάφορες εφαρμογές της εξόρυξης δεδομένων, δεν υπάρχει σαφής απόδειξη ότι οποιαδήποτε από τις μεθόδους αποδίδει καλύτερα από άλλους [13]. Όλες οι μέθοδοι έχουν τα δικά τους πλεονεκτήματα και τα μειονεκτήματα, και η επιλογή της κατάλληλης μεθόδου βασίζεται κυρίως στο συγκεκριμένο πρόβλημα, το είδος των δεδομένων, ο σχεδιασμός της μελέτης και σκοπός του έργου. Υπάρχουν επίσης μερικά παραδείγματα για την εφαρμογή διαφορετικών εξόρυξης υβριδικών δεδομένα προσεγγίσεις με δεδομένα GWAS για να αυξηθεί η κατηγορηματικό απόδοση, στην οποία επιλέγεται μία κύρια μέθοδο και γενετικούς αλγόριθμους που βασίζονται, χρησιμοποιούνται ως το δεύτερο βήμα για τη βελτιστοποίηση της κύριας μεθόδου [22 ].

Εδώ, για πρώτη φορά εισάγουμε ένα υβριδικό μοντέλο επιλογής χαρακτηριστικών που συνδυάζει δύο μη-παραμετρικές μέθοδοι εξόρυξης δεδομένων, SVM και ID3, για τον προσδιορισμό των πιο έξυπνη φαινοτυπική και γονοτυπική χαρακτηριστικά που σχετίζονται με μια πολύπλοκη ασθένεια. Όπως διακρίνεται από πολλά έργα στην βιβλιογραφία, στην παρούσα μελέτη έχουμε χρησιμοποιήσει και τις δύο μεθόδους ξεχωριστά και όχι μόνο τη βελτιστοποίηση της κύριας μεθόδου. Τα δεδομένα του καρκίνου του προστάτη χρησιμοποιείται ως μελέτη περίπτωσης και έχουμε αποδείξει ότι ο συνδυασμός πληροφορίες γονότυπο με φαινοτύπους έχει καλύτερη προβλεπτική απόδοση από τη χρήση μόνο γονότυπους ή φαινοτύπων μόνο στη διάγνωση της νόσου, ενώ η υπέρβαση της απόδοσης του ειδικού προστατικού αντιγόνου (PSA) διαλογή δοκιμής [23 ].

Υλικά και Μέθοδοι

Καρκίνος του προστάτη Data Set

Το σύνολο των δεδομένων, «Multi Ethnic Γονιδιώματος Ευρεία Σάρωση του καρκίνου του προστάτη», που χρησιμοποιείται στην παρούσα εργασία έχει κατεβάσει από dbGaP NCBI του βάση δεδομένων και έχει δοθεί αριθμός εισδοχής phs000306 έκδοση 2. η παρούσα δεδομένων αποτελείται από 4650 περιπτώσεις και 4795 ελέγχους με τρεις διαφορετικές εθνότητες, Αφροαμερικανοί, Λατίνοι και οι Ιάπωνες. Κάθε άτομο στη μελέτη έχει 600.000 SNPs και 20 φαινοτύπων και τον αριθμό των ατόμων που περιέχει και φαινοτυπική και γονοτυπική χαρακτηριστικά είναι 9130.

Δεδομένα Προεπεξεργασία

Δεδομένα προεπεξεργασία αποτελείται από τρία βήματα. Στο πρώτο βήμα Ρσυνδετήρ ανάλυση διεξήχθη προκειμένου να βρεθεί η στατιστική ισχύς των σχέσεων μεταξύ του γονότυπου και την συγκεκριμένη ασθένεια. Το όριο για τη σύνδεση των SNPs με καρκίνο του προστάτη καθορίστηκε ως p & lt? 0.005 μετά την GWAS και 22848 SNPs πληρούν την προϋπόθεση αυτή αποτέλεσε το πρώτο αντιπροσωπευτικό υποσύνολο. Στο δεύτερο ΑΗΡ βήμα METU-SNP του (Αναλυτική Ιεραρχική Διαδικασία) χαρακτηριστικό χρησιμοποιήθηκε για να δώσει προτεραιότητα SNPs με βάση τη βιολογική και τη στατιστική σημαντικότητα, η οποία φιλτράρεται το συνδεδεμένων SNPs κάτω στο 2710 SNPs.

Τα στοιχεία που ταιριάζουν, τον καθαρισμό και τη μετατροπή ήταν γίνει στο τελικό στάδιο της προεπεξεργασίας δεδομένων. Η γονοτυπική και τα φαινοτυπικά χαρακτηριστικά των ατόμων που συνδυάζονται με το στάδιο αντιστοίχιση δεδομένων με βάση το θέμα ταυτότητας και τις μετατροπές που υπόκεινται ID δίνονται στα προφανή στοιχεία. Κατά τη φάση καθαρισμού ελλείπουσες τιμές που προκαλείται από τα φαινοτυπικά χαρακτηριστικά αντικαταστάθηκαν ανά κατηγορία μέσου υπολογισμού και το χαρακτηριστικό διαγράφηκε όπου τάξης μέση δεν μπορεί να υπολογιστεί. μετασχηματισμό των δεδομένων ήταν απαραίτητη για να κωδικοποιήσει τα αλληλόμορφα επειδή SVMs χρησιμοποιούν αριθμητικές τιμές αντί κατηγορηματική αυτά. Στη βιβλιογραφία οι συνδυασμοί αλληλόμορφων κωδικοποιούνται από τρία αριθμητικές τιμές που βασίζονται στις ομόζυγα και ετερόζυγα μεγάλες αλληλόμορφα [18]. Μειονέκτημα αυτών των συστημάτων είναι ότι «

τα αλληλόμορφα δεν αντιμετωπίζονται συμμετρικά

[

18

]». Καθώς η μητρική προέλευσης δεν αναφερόταν στα δεδομένα μας χρησιμοποιήσαμε ένα εναλλακτικό σύστημα κωδικοποίησης, στην οποία οι συμμετρικές αλληλόμορφα αντιμετωπίζονται με τον ίδιο τρόπο. Αυτό το σύστημα κωδικοποίησης παρουσιάζονται στον Πίνακα 1.

Η

Ανάλυση

Σύμφωνα με τη βιβλιογραφία τα πιο ευρέως χρησιμοποιούμενα αλγόριθμους για την ανίχνευση των σχέσεων μεταξύ των πληροφοριών γονότυπο και την ασθένεια είναι ANN, SVM και της απόφασης δέντρα. Υπάρχουν επίσης παραδείγματα για τις εφαρμογές των διαφορετικών προσεγγίσεων εξόρυξης δεδομένων σε ένα υβριδικό τρόπο για την αύξηση της κατηγορηματικό απόδοση όπου επιλέγεται μία κύρια μέθοδος και οι γενετικοί αλγόριθμοι βασίζονται χρησιμοποιηθεί ως η δεύτερη βαθμίδα για τη βελτιστοποίηση της κύριας μεθόδου [15] – [22].

Στο μοντέλο μας έχουμε συνδυασμό δύο διαφορετικών μεθόδων, SVM και ID3, καθώς και για κάθε μία από αυτές τις μεθόδους κατάλληλη βελτιστοποίησης εφαρμόστηκε παρά συνδυάζοντας μια κύρια μέθοδο με ένα προηγμένο βελτιστοποίησης όπως αναφέρεται ανωτέρω. Με αυτόν τον τρόπο, αντί να επωφελούνται από μια ισχυρή μέθοδο, έχουμε συνδυασμό των πλεονεκτημάτων των διαφορετικών μεθοδολογιών? ευρωστία ID3 για το θόρυβο και outliers [24], καθώς και την εξουσία της να χειριστεί μη γραμμικών προβλημάτων και την απόδοση πρόβλεψης SVM πάνω μη γραμμική δυαδικά προβλήματα ταξινόμησης. Επίσης, και οι δύο μέθοδοι είναι πιο ερμηνεύσιμη σε σύγκριση με άλλες μεθόδους.

SVM-ID3 υβριδικό μοντέλο μας κατασκευάστηκε το RapidMiner 5.0 το οποίο είναι ένα δωρεάν εργαλείο λογισμικού ανοικτού κώδικα για εφαρμογές εξόρυξης δεδομένων και προτιμώνται σε διάφορες εφαρμογές στη βιβλιογραφία όπως ως [25]. Για τη φάση SVM RBF πυρήνα επιλέγεται. Αυτός ο πυρήνας χρησιμοποιείται ευρέως σε GWAS [19] και προτιμάται στη μελέτη μας για μεγαλύτερη ταχύτητα μάθησης και πλεονέκτημα του να χρησιμοποιηθεί και ως γραμμικό πυρήνα και σιγμοειδές πυρήνα σε ορισμένες ειδικές συνθήκες [26]. Εκτός από την λειτουργία του πυρήνα SVM έχει δύο σημαντικές παραμέτρους (C, γ) εάν δεν ρυθμίζεται καλά, θα μπορούσε να προκαλέσει overfitting ή underfitting της κατάστασης. Η

C

σταθερά χρησιμοποιείται για να προσαρμόσει το περιθώριο της υπερεπίπεδο που χωρίζει τις τάξεις και την παράμετρο γάμμα δίνει το σχήμα του με την απόφαση όριο. Βελτιστοποίηση των παραμέτρων αυτών έχει αναφερθεί προηγουμένως [27], και έχουμε επιλέξει να εφαρμόσει την προσέγγιση αναζήτηση πλέγμα για τη βελτιστοποίηση, η οποία έχει περιγραφεί προηγουμένως [28]. Οι περιοχές τιμών για το C και γάμμα, που χρησιμοποιούνται κατά τη διάρκεια της αναζήτησης του δικτύου αποφασίζεται με βάση την βιβλιογραφία [27] μαζί με τη δική μας εμπειρία με τα δεδομένα. Για γάμα το εύρος τιμών επιλέγεται μεταξύ [0,0001, 100] με δυνάμεις του δέκα και το εύρος τιμών για το C επιλέγεται μεταξύ [0-10] με πέντε γραμμική βήματα. Η αναζήτηση του δικτύου για τη βελτιστοποίηση SVM διήρκεσε περίπου δέκα ώρες για να ολοκληρωθεί σε ένα σύστημα με 16 GB μνήμης και 3.4 GHz Intel Core i7 επεξεργαστή, αποκαλύπτοντας 42 συνδυασμούς.

Στη βιβλιογραφία υπάρχουν διάφορες μελέτες που συνδυάζουν SVMs και την απόφαση δέντρα. Αν και στο παρελθόν έχει δημοσιευθεί υβριδικά μοντέλα SVM και δέντρα απόφασης (SVM-DT) χρησιμοποιούνται συνήθως για multi-ταξινόμηση και πολυ-ομαδοποίηση προβλήματα, υπάρχουν επίσης παραδείγματα των συνδυασμών SVM-DT χρησιμοποιήθηκε για τα δυαδικά προβλήματα ταξινόμησης [29]. Σε όλες τις περιπτώσεις, τα μοντέλα SVM-DT, SVM εφαρμόζεται για πρώτη φορά, προκειμένου να βελτιστοποιήσει τις παραμέτρους και τα σύνολα δεδομένων που πρέπει να χρησιμοποιούνται δίπλα στο δέντρο απόφασης. Στη μελέτη μας, έχουμε εφαρμόσει επίσης SVM στο πρώτο βήμα, ωστόσο, αντί της κατάταξης τα χαρακτηριστικά και την επιλογή των κορυφαίων αναφέρονται αυτά σύμφωνα με SVM βάρη, τα οποία παρουσιάζουν κίνδυνο για την απώλεια των πληροφοριών, έχουμε χρησιμοποιήσει το σύνολο των βαρών SVM ως χαρακτηριστικό βάρους σε ID3. Αυτά τα βάρη για τα χαρακτηριστικά ID3 υπολογίζεται σύμφωνα με τον τύπο που δίνεται below.The ID3 Δέντρο υλοποιείται σε RapidMiner με στάθμιση στρατηγική εξηγήθηκε παραπάνω. Μια δεύτερη έρευνα πλέγμα τρέχει για να βρει την καλύτερη δυνατή τιμή για το σταθμισμένο δείκτη κέρδους πληροφορίες. Το εύρος για την τιμή αυτή ορίστηκε στο εύρος [10

-3, 10] και έψαξε από 50 λογαριθμική βήματα που οδήγησαν σε 51 συνδυασμούς και ολοκληρώθηκε σε 11 ώρες.

Η συνολική ροή εργασίας για την προ δεδομένων -Μεταποίηση, η οποία περιλαμβάνει επίσης GWAS και την ολοκλήρωση των δεδομένων φαινότυπο και του γονότυπου, και το υβριδικό μοντέλο SVM-Tree περιγράφεται εδώ συνοψίζεται στο Σχήμα 1.

σε γενικές γραμμές ροής εργασίας ξεκινά με προεπεξεργασία δεδομένων, όπου αντιπροσωπευτικό υποσύνολο SNP σχηματίζεται από Ρσυνδετήρ και METU-SNP ανάλυση, φαινότυπο και του γονότυπου δεδομένα ενσωματώνονται και οι τιμές που λείπουν είτε να εξαλειφθούν ή χειροκίνητα συμπληρώθηκε ανά κατηγορία σημαίνει υπολογισμού. Μετά την προεπεξεργασία των δεδομένων, ενιαίο σύνολο δεδομένων τροφοδοτείται σε υβριδικό μοντέλο όπου SVM μοντέλο δίνει τα βάρη χαρακτηριστικό που χρησιμοποιούνται σε ID3.

Η

Αποτελέσματα

Κατά την πρώτη φάση μόνο SVM μοντέλο τρέχει να παρουσιάσει την απόδοση ταξινόμησης του stand-alone μέθοδο σε τρία διαφορετικά σύνολα δεδομένων. Πρώτο και το δεύτερο σετ ήταν είτε μόνο του γονότυπου ή φαινοτύπου των δεδομένων και το τρίτο σύνολο δεδομένων που περιλαμβάνονται τόσο τα δεδομένα του γονότυπου και φαινότυπου. Τα αποτελέσματα της αυτόνομο μοντέλο SVM δίνονται στον Πίνακα 2.

Η

Αυτά τα αποτελέσματα στον Πίνακα 2 δείχνει σαφώς ότι ο συνδυασμός φαινοτυπική πληροφοριών με δεδομένα γονότυπο αυξήθηκε ελαφρώς την απόδοση απόφασης σε όλες τις πτυχές της ακρίβειας, την ακρίβεια, θυμηθούμε και την AUC. Το μοντέλο-ID3 SVM υβριδικό συνέχεια εφαρμόζεται στις ίδιες τρεις σύνολα δεδομένων και η σύγκριση των επιδόσεων παρουσιάζεται στον Πίνακα 3.

Η

Σύμφωνα με SVM ID3 υβριδική δομή μοντέλο, δίδεται στο Δέντρο S1, το πιο σημαντικό χαρακτηριστικό είναι η εθνικότητα. Το μοντέλο μας έκανε μια αυστηρή διάκριση χαρακτηριστικό εθνότητα, η οποία οδηγεί διαφορετικά μονοπάτια απόφαση για την αφρικανική αμερικανική, Latino και Ιαπώνων. Για όλες τις εθνότητες το χαρακτηριστικό δείκτη μάζας σώματος (ΔΜΣ) είναι η δεύτερη περιγραφικό χαρακτηριστικό της διαδρομής απόφασης. Για την αφρικανική αμερικανικού πληθυσμού περιγραφικό φαινοτύπων σε διαφορετικά επίπεδα του δέντρου είναι τα χαρακτηριστικά που δείχνουν το κάπνισμα και η κατανάλωση αλκοόλ συνήθειες. Παραδόξως μόνο φαινοτυπική ιδιότητα που βρέθηκαν για τα ιαπωνικά πληθυσμού είναι ο ΔΜΣ. Τα χαρακτηριστικά αναφέρει οικογενειακό ιστορικό, σωματική δραστηριότητα, πρόσληψη λυκοπενίου και την καπνιστική συμπεριφορά που παρατηρείται για τη Λατινική πληθυσμού. Η συνολική δομή δέντρου του υβριδικού μοντέλου παρουσιάζεται στο Σχήμα 2.

Το κύριο δέντρο δίνεται στο υλικό Δέντρο S1 επειδή η δομή είναι πολύ μεγάλο. Το ποσοστό αυτό είναι μια μικρή αναπαράσταση κύριο δέντρο. Απόφαση ξεκινά με την εθνικότητα και Αφροαμερικανοί αντιπροσωπεύονται από ΑΑ, Ιάπωνες από ΕΚΑ και Latinos από LAT. Για όλες τις εθνότητες η πιο περιγραφική φαινοτυπική χαρακτηριστικό είναι ο δείκτης μάζας σώματος (ΔΜΣ). Άλλα φαινοτυπικά χαρακτηριστικά που βρίσκονται σε ανώτερα επίπεδα του δέντρου είναι το κάπνισμα συμπεριφορά, το οικογενειακό ιστορικό, η πρόσληψη λυκοπενίου και τη σωματική δραστηριότητα. Ο αριθμός των SNPs στους κόμβους δείχνει το συνολικό αριθμό των SNPs βρίσκονται σε διαφορετικά επίπεδα σε αυτό το συγκεκριμένο μονοπάτι του δέντρου.

Η

Μερικά από τα εξέχοντα μονοπάτια απόφαση που προέρχονται από το δέντρο οποίες βασίζονται κυρίως στην εθνότητα. Για παράδειγμα, αν η εθνικότητα του θέματος είναι αφροαμερικάνων και ΔΜΣ του είναι στην πρώτη κατηγορία, η οποία είναι ο ΔΜΣ & lt? 22.5, κοιτάζοντας rsid 11.729.739 υβριδικό σύστημα μας μπορεί να αποφασίσει αν το θέμα είναι μια υπόθεση ή τον έλεγχο. Εάν το προφίλ αλληλομόρφων για αυτό το SNP είναι ΤΤ τότε το υποκείμενο καλείται ως υπόθεση, αλλά αν το θέμα είναι ετερόζυγο μεταφοράς CT, από το υποκείμενο καλείται ως μάρτυρας. Όταν εξετάζονται τα αποτελέσματα του υβριδικού συστήματος για την ιαπωνική πληθυσμού, ο ΔΜΣ ήταν επίσης στο πρώτο επίπεδο της διαδρομής απόφασης. Αν τα θέματα είναι στο τέταρτο σκέλος του ΔΜΣ, η οποία είναι & gt? = 30, τότε αυτά τα θέματα ταξινομούνται άμεσα ως υπόθεση. Αν τα θέματα είναι στο πρώτο σκέλος του ΔΜΣ, τότε η απόφαση λαμβάνεται με βάση τα rs2442602 SNP? οι ομοζυγώτες για το μείζον αλληλόμορφο (με ΑΑ γονότυπος) θέματα όπως ονομάζεται περιπτώσεις, αλλά οι αποφάσεις για τα θέματα που μεταφέρουν άλλα αλληλόμορφα απαιτούν διερεύνηση των πρόσθετων SNPs.

Η δομή δέντρου δείχνει ότι η διαδρομή απόφαση για τη Λατινική πληθυσμού είναι πιο περίπλοκη από ό, τι οι Ιάπωνες ή Αφρικανικός Αμερικανός πληθυσμούς. Αν τα θέματα είναι στην πρώτη κατηγορία BMI τότε το υποκείμενα ετεροζυγώτες για το SNP rs17799219, μεταφέρουν AG, καλούνται υγιή. Αν τα θέματα είναι στην τρίτη κατηγορία ΔΜΣ, η οποία είναι & lt? 29.9, στη συνέχεια, ένα δεύτερο φαινοτυπική ιδιότητα, πρέπει να εξεταστεί το οικογενειακό ιστορικό. Εάν αυτά τα άτομα έχουν συγγενείς πρώτου βαθμού με καρκίνο του προστάτη, τότε SNP rs6475584 εξετάζεται, για να καλέσετε αν το θέμα είναι μια υπόθεση ή όχι. Πολλοί κανόνες, όπως αναφέρονται ανωτέρω, μπορεί να εξαχθεί από τη δομή δέντρου δίνονται στο Δέντρο S1.

Συνολικά υβριδικό μοντέλο μας εντοπίστηκαν 28 SNPs για αφροαμερικάνων, 22 SNPs για την ιαπωνική και 65 SNPs για Latino πληθυσμούς. Ερευνήσαμε τη χαρτογράφηση SNPs σε γονίδια εντός της βάσης δεδομένων SNPNexus [30] και των μη-κωδικοποίησης SNPs μέσω RegulomeDB [31], προκειμένου να διαπιστωθεί εάν έχουν συνδεθεί με τον καρκίνο του προστάτη ή οποιαδήποτε άλλη κατάσταση πριν.

όταν οι SNPs που βρέθηκαν από υβριδικό μοντέλο αναζήτηση μέσω SNPnexus, 107 μοναδικά rsIDs συνδυάζεται με 62 μοναδικά Εηίτεζ GeneID και 42 από αυτούς είχαν προηγουμένως βρεθεί να σχετίζεται με μια πάθηση που αναφέρονται στο Γενετική Ένωση Complex Ασθένειες και διαταραχές της βάσης δεδομένων (GAD). Ένα αντιπροσωπευτικό σύνολο των genes- φαινοτύπων και τάξεις της νόσου δίνεται στον Πίνακα 4 και ολόκληρη η λίστα μπορεί να βρεθεί στο υλικό Πίνακα S1.

Η

Οι μη-κωδικοποίησης SNPs στο τελικό μοντέλο της νόσου μας διερευνώνται μέσω RegulomeDB, η οποία έδειξε ότι οι SNPs που βρέθηκαν από υβριδικό μοντέλο μας έχουν ρυθμιστικές επιδράσεις. Ο Πίνακας 5 παρακάτω δείχνει τα SNPs με βαθμολογία χαμηλότερη από 4 από RegulomeDB. Ολόκληρη η λίστα δίνεται στο υλικό Πίνακα S2.

Η

Συζήτηση

Εδώ, έχουμε παρουσιάσει ένα μοντέλο διάγνωσης της νόσου με τη χρήση μεθόδων εξόρυξης δεδομένων, με βάση τα δεδομένα φαινότυπο και του γονότυπου για τον προστάτη Καρκίνος. Συνολικά αποτελέσματα μας έδειξαν ότι το υβριδικό μοντέλο που αναπτύχθηκε από την ενσωμάτωση μεθόδων SVM και ID3 είναι σε θέση να χρησιμοποιούν τόσο τις πληροφορίες γονότυπο και φαινότυπο ως είσοδο, και έχει την καλύτερη απόδοση για την πρόβλεψη της υπόθεσης εναντίον τους ελέγχους.

SVM έχει επιλεγεί ως το πρώτο βήμα σε υβριδικό μοντέλο μας, όπως είναι γνωστή για την υψηλή απόδοσή του σε GWAS [26], και την ικανότητα να ταξινομήσει μη διαχωρίσιμες προβλήματα. Η λογική πίσω από την απόφαση ΤΝΔ, η οποία μπορεί επίσης να χρησιμοποιηθεί για GWAS, δεν είναι πολύ σαφής, λόγω του μαύρου δομής κουτί του. Επίσης ΤΝΔ έχουν πολλές παραμέτρους για να ρυθμίσετε όπως ο αριθμός των στρωμάτων, ο αριθμός των κόμβων σε στρώματα, ο αριθμός των εποχών και ρυθμός μάθησης, και το πιο σημαντικό ΤΝΔ έχουν το μειονέκτημα του να κολλήσει σε τοπικά ελάχιστα. Από την άλλη πλευρά SVMs έχει σαφή λογική απόφαση [20], έχει μικρότερο αριθμό παραμέτρων και λόγω της τετραγωνική δομή πρόβλημα που προσφέρει μόνο μία λύση, η οποία είναι παρούσα σε παγκόσμια ελάχιστα. Ως δεύτερο βήμα στο υβριδικό μοντέλο μας, το δέντρο απόφασης ID3 έχει επιλεγεί για ισχυρές επιδόσεις της στην κατάταξη των διακριτών αποτιμώνται σύνολα δεδομένων όπως στο GWAS. ID3 είναι εύκολο να κατασκευάσει και λειτουργεί με καλή απόδοση σε θορυβώδη δεδομένων με τις τιμές που λείπουν, και εύκολο να ερμηνεύσει με οπτικά χαρακτηριστικά του [24]. ID3 είναι επίσης επωφελής πάνω C4.5 και ΚΑΛΑΘΙ δέντρα γιατί αυτές οι μέθοδοι κατασκευάσει τα δέντρα από το κλάδεμα που θα κρύψει κάποια μονοπάτια απόφαση για την ασθένεια, και ID3 είναι επίσης πιο κατάλληλη για κατηγορικά δεδομένα.

Για το καλύτερο της γνώσης μας , δεν υπάρχει παρόμοιο υβριδικό ή stand-alone μέθοδο εξόρυξης δεδομένων που αποτελεί το χρυσό πρότυπο για την έγκαιρη διάγνωση του καρκίνου του προστάτη. Έτσι, τα αποτελέσματα απόδοσης του υβριδικού μοντέλου έπρεπε να συγκριθεί με το αυτόνομο SVM και μοντέλα ID3. Το προτεινόμενο υβριδικό μοντέλο είχε καλύτερη ισχύ κατάταξη πάνω από το αυτόνομο SVM και το μοντέλο ID3 με τα τρία σύνολα δεδομένων, όπου χρησιμοποιείται είτε μόνο του γονότυπου ή δεδομένα φαινότυπο και για το ενιαίο σύνολο δεδομένων γονότυπου-φαινότυπου. Στο ενιαίο σύνολο δεδομένων του γονότυπου-φαινότυπου το υβριδικό SVM-ID3 μοντέλο με 90,92% ευαισθησία και 0.910 AUC ξεπέρασε το αυτόνομο SVM, και αυτόνομο δέντρο αποφάσεων που έχουν 71.34% ευαισθησία και 0.829 AUC και 81,33% ευαισθησία και 0,732 AUC αντίστοιχα. Επιπλέον, μια προς τα εμπρός πίσω διάδοσης δομή ANN τρεις ζωοτροφών στρώμα χτίστηκε το Rapid Miner και έτρεξε στο ίδιο συνδυασμένο σύνολο δεδομένων γονοτύπου-φαινοτύπου για τη σύγκριση των επιδόσεων. Η πορεία εκτέλεσης για 3 ημέρες για να ολοκληρωθεί και τα αποτελέσματα των επιδόσεων όσον αφορά την ακρίβεια, την ακρίβεια και την ανάκληση ήταν όλα κάτω από 55%. Απόδοση ANN θα μπορούσε να αυξηθεί με τη βελτιστοποίηση των παραμέτρων που χρησιμοποιούνται, αλλά αυτό θα μπορούσε να προκαλέσει το χρόνο εκτέλεσης για να αυξηθεί ακόμη υψηλότερο. Ακόμη και αν η ANN θα μπορούσε να φθάσει την ίδια απόδοση με το υβριδικό μοντέλο, το μεγάλο χρονικό διάστημα εκτέλεσης θα σταθεί ως ένα άλλο μεγάλο μειονέκτημα, εκτός από το ότι είναι ένα μαύρο κουτί αλγόριθμο.

Σε γενικές γραμμές, υβριδικό μοντέλο μας ήταν σε θέση να αποτελεσματικά χρησιμοποιώντας την υψηλής Τόμος, μεγάλων διαστάσεων ολοκληρωμένη γονότυπου και τα δεδομένα φαινότυπο ως είσοδο. Επί του παρόντος, υπάρχουν πολλές δημοσιευμένες μελέτες επικεντρώθηκε στην ανάλυση των δεδομένων προσδιορισμού του γονότυπου, αλλά κανένα παράδειγμα του συνδυασμού φαινοτύπου με προφίλ γονοτυπική έχει παρουσιαστεί ακόμα. Μπάζωμα αυτό το κενό, για τα πρώτα χρονικά δεδομένα του γονότυπου και φαινότυπου ενσωματωθεί μαζί για να οικοδομήσουμε ένα μοντέλο διάγνωσης της νόσου του καρκίνου του προστάτη. Όπως έχουμε παρουσιάζονται στον Πίνακα 3, ενσωματώνοντας τα δεδομένα φαινότυπο και γονότυπο αύξησε την απόδοση απόφασης από την άποψη της ευαισθησίας και της AUC. Η ευαισθησία του προτεινόμενου υβριδικού μοντέλου σε ένα σύνολο δεδομένων με μόνο γονότυπους είναι 68,69%, με μόνο φαινότυποι είναι 83,78% όπου η ευαισθησία αυξάνεται σε 90,92%, όταν του γονότυπου είναι ενσωματωμένη με τα δεδομένα φαινότυπο. Παράλληλα με την ευαισθησία τιμή AUC αυξάνεται επίσης? AUC μόνο για τον προσδιορισμό του γονότυπου των δεδομένων τα δεδομένα και μόνο φαινότυπο είναι 0.674 και 0.857, αντίστοιχα, αλλά όταν και οι δύο δεδομένα χρησιμοποιούνται αυξάνει την AUC σε 0.910

Εκτός από την καλύτερη απόδοση ταξινόμησης του, τα αποτελέσματά μας έδειξαν ότι η προτεινόμενη SVM -. ID3 υβριδικό μοντέλο ήταν επίσης σε θέση να προσδιορίσουν τις λειτουργικές και ρυθμιστικές SNPs που σχετίζονται με τον καρκίνο του προστάτη. Τα επιλεγμένα SNPs και οι σχέσεις γονίδιο-ασθένειά τους ελέγχεται με τη χρήση των βάσεων δεδομένων, όπως SNPnexus και RegulomeDB, το οποίο ενσωματώνει πληροφορίες τρίτων από διαφορετικές βάσεις δεδομένων και μελέτες σε SNP-centric μορφή. Αυτό σημαίνει ότι οι SNPs που επιλέγονται για την κατασκευή του μοντέλου διαγνωστική ασθένεια με την προτεινόμενη υβριδική μέθοδος είναι επίσης υποψήφιες για περαιτέρω βιολογική έρευνα της μοριακής αιτιολογία του καρκίνου του προστάτη.

Η προτεινόμενη υβριδική μέθοδος εντόπισε 107 μοναδικές SNPs για τη διαγνωστική μοντέλο από 2710 υψηλής συνδεδεμένων SNPs που επιλέγονται μετά από GWAS. Όταν αυτά τα 107 SNPs αναζήτηση στο SNPnexus και RegulomeDB ορισμένοι από αυτούς βρέθηκαν να σχετίζονται με συγκεκριμένα γονίδια και άλλοι επηρεάζουν τη ρύθμιση και δεσμευτική. Για παράδειγμα, rs2853668 είναι γνωστό ότι σχετίζονται με το

CRR9, TERT

η οποία διαδραματίζει σημαντικό ρόλο στη ρύθμιση της δράσης της τελομεράσης. Η rs11790106 επηρεάζει τη ρύθμιση του

ATP2B2

γονίδιο το οποίο είναι σημαντικό για την παραγωγή ενέργειας και τη μεταφορά του ασβεστίου των κυττάρων. rs12644498 επηρεάζει ρύθμιση του

ARL9

γονιδίου και rs6887293 επηρεάζει τη ρύθμιση του

AGBL4

που είναι επίσης σημαντικό για τον κύκλο ATP /GTP στα κύτταρα. Αυτά τα γονίδια είναι στενά συνδεδεμένα με

IGF1

γονίδιο το οποίο παίζει σημαντικό ρόλο στο μεταβολισμό της ινσουλίνης. Πολλά από τα γονίδια, οι 107 SNPs στο μοντέλο νόσου χάρτη για, σχετίζεται με τις διεργασίες ανάπτυξης και την ενέργεια. Αυτές οι μοριακές λειτουργίες είναι στην πραγματικότητα σχετίζονται με το ΔΜΣ, που η πιο σημαντική φαινοτυπική χαρακτηριστικό για όλες τις εθνότητες που βρέθηκαν από υβριδικό μοντέλο μας.

Με αποτέλεσμα το σύνολο των δυνατοτήτων του υβριδικού μοντέλου μας εξετάστηκε και χαρακτηριστικό φαινοτυπική εθνικότητα βρέθηκε να είναι η πιο σχετίζονται χαρακτηριστικό με το καρκίνο του προστάτη. Αυτό το αποτέλεσμα δεν ήταν έκπληξη, επειδή πολλά έργα στη βιβλιογραφία ήδη έδειξαν ότι υπάρχει σχέση με εθνικά χαρακτηριστικά και την ασθένεια του καρκίνου του προστάτη. έργο Kleinmann δείχνει ότι η εθνοτική καταγωγή των ασθενών παίζει σημαντικό ρόλο στην σχετίζονται με την ποιότητα του καρκίνου του προστάτη της ζωής [32]. Σύμφωνα με τον Hoffman, η αιτιολογία του καρκίνου του προστάτη εξαρτάται ιδιαίτερα από την εθνότητα και την αφρικανική αμερικανική έχει τον υψηλότερο κίνδυνο για καρκίνο του προστάτη που έχουν [33]. Ως αποτέλεσμα υποστήριξη, υβριδικό μοντέλο μας χωρίζει αυστηρά το σύνολο δεδομένων του προστάτη, σύμφωνα με την εθνικότητα και για κάθε εθνικότητα παρατηρήθηκαν διαφορετικά μονοπάτια.

Αν και μονοπάτια απόφαση για εθνοτήτων είναι όλα διαφορετικά, σε δεύτερο επίπεδο, όλοι οι δρόμοι απόφαση αναφέρει ο ΔΜΣ ιδιότης. ΒΜΙ είναι ήδη γνωστή για τις σχέσεις της με διαφορετικούς τύπους καρκίνου, όπως ο καρκίνος του μαστού [34] και του οισοφάγου [35], και είναι επίσης ένας ισχυρός φαινοτυπικό χαρακτηριστικό για τον καρκίνο του προστάτη [36]. Στη λογοτεχνία, μαζί με το ΔΜΣ, την ηλικία και το οικογενειακό ιστορικό, τα οποία είναι επίσης μεταξύ των επιλεγμένων χαρακτηριστικών με υβριδικό μοντέλο μας, έχει έδειξε να είναι εξίσου σημαντικά χαρακτηριστικά για τη διάγνωση του καρκίνου του προστάτη [36]. Η προληπτική δράση των υψηλών τιμών ΔΜΣ πέραν του 30 kg /m

2 έχουν δηλώσει στο παρελθόν [36], και έχει ενδιαφέρον για την ιαπωνική πληθυσμού έχουμε παρατηρήσει επίσης το ίδιο προληπτικό αποτέλεσμα του ΔΜΣ για νοσογόνο παχυσαρκία περιπτώσεις στα χαμηλότερα επίπεδα της διαδρομής απόφασης . Επιπλέον, άλλες πιο κοινές φαινοτυπικές ιδιότητες στα μονοπάτια απόφαση, όπως το οικογενειακό ιστορικό, η συνήθεια του καπνίσματος, σωματική δραστηριότητα και η πρόσληψη λυκοπενίου επίσης συνδέεται με τον καρκίνο του προστάτη στο παρελθόν [37]. Συνολικά, τα αποτελέσματά μας δείχνουν ότι το προτεινόμενο υβριδικό μοντέλο περιλαμβάνονται αποδίδει το είχαν καθοριστεί προηγουμένως φαινοτυπική για τον καρκίνο του προστάτη.

Σήμερα, τα ειδικά επίπεδα (PSA) προστατικό αντιγόνο στο αίμα είναι ο χρυσός κανόνας για την έγκαιρη ανίχνευση της κατάστασης του καρκίνου του προστάτη πριν από τη βιοψία, με τη μέγιστη ευαισθησία αναφέρθηκε ως 86%, και ειδικότητα 33% με AUC 0.67 [23] – [42]. επίπεδα PSA κάτω από 4 ng /ml θεωρείται φυσιολογικό, τα επίπεδα μεταξύ 4 ng /ml-10 ng /ml είναι γνωστά ως ύποπτες και επίπεδα υψηλότερα από 10 ng /ml είναι γνωστό ότι σχετίζονται με υψηλό κίνδυνο [38]. Το πρόβλημα με την εξέταση PSA είναι καθορισμό των κατώτατων ορίων. Το εύρος μεταξύ 4 ng /ml-10 ng /ml είναι μια γκρίζα ζώνη για την απόφαση και ενώ ορισμένα θέματα κάτω από 4 ng /ml μπορεί να έχει καρκίνο του προστάτη, αλλά μερικοί πάνω από 10 ng /ml μπορεί να εξακολουθεί να είναι υγιής [39]. Επιπλέον, οι αποκομμένοι τιμές αλλάζουν επίσης σε σχέση με την ηλικία του ατόμου [40]. Αυτό εισάγει ένα σοβαρό πρόβλημα και ως διάφορα βιβλιογραφία κράτος δεν θα πρέπει να χρησιμοποιείται το PSA ως ένα πρώιμο εργαλείο διάγνωσης του καρκίνου του προστάτη [41] μέχρι την απόδοσή της αυξάνεται όσον αφορά την ευαισθησία και την ειδικότητα [42]. Όταν θεωρείται τα διαγνωστικά αποτελέσματα απόδοσης του προτεινόμενου υβριδικού μοντέλου με 90,92% ευαισθησία και 0,91 AUC, παρουσιάζει ένα δυνητικά καλό εργαλείο για την έγκαιρη ανίχνευση του καρκίνου του προστάτη. Μετά την επικύρωση με πιλοτικές μελέτες, το προτεινόμενο μοντέλο το οποίο απαιτεί μόνο ένα στοματικό ανταλλαγής θα σταθεί ως μια καλή εναλλακτική λύση για την εξέταση PSA στο αίμα.

Εδώ, για πρώτη φορά έχουμε προτείνει ένα κατηγορηματικό μοντέλο της νόσου ενσωμάτωση δεδομένων του γονότυπου και φαινότυπου μέσω μια υβριδική επιλογή χαρακτηριστικό, το οποίο συνδυάζει δύο μη-παραμετρικές μέθοδοι εξόρυξης δεδομένων, SVM και ID3. Όπως διακρίνεται από πολλά έργα στην βιβλιογραφία, στην παρούσα μελέτη έχουμε χρησιμοποιήσει και τις δύο μεθόδους ξεχωριστά και όχι μόνο τη βελτιστοποίηση της κύριας μεθόδου. Τα δεδομένα του καρκίνου του προστάτη χρησιμοποιείται ως μελέτη περίπτωσης και έχουμε αποδείξει ότι το μοντέλο που συνδυάζει πληροφορίες γονότυπο με φαινοτύπους δίδει μια καλύτερη απόδοση από ό, τι χρησιμοποιώντας μόνο δεδομένα γονότυπο ή φαινότυπο σε διάγνωση της νόσου, ενώ επίσης υπερβαίνει την απόδοση του ειδικού προστατικού αντιγόνου (PSA) δοκιμή διαλογής [23].

Συμπεράσματα

Στη μελέτη αυτή για πρώτη φορά δεδομένα του γονότυπου και φαινότυπου έχουν ενσωματωθεί και ένα υβριδικό μοντέλο SVM-ID3 για τον καρκίνο του προστάτη είναι να οικοδομήσουμε. Μια σημαντική συνεισφορά του έργου αυτού ήταν η ενσωμάτωση των γονοτυπική με δεδομένα φαινότυπο. Επίδραση αυτής της ολοκλήρωσης έχει δοκιμαστεί τόσο σε stand-alone SVM και υβριδικό μοντέλο SVM-ID3. Όσον αφορά τα μέτρα απόδοσης, όπως η ευαισθησία και η AUC το ολοκληρωμένο σύνολο δεδομένων ξεπέρασε τα σύνολα δεδομένων με μόνο γονότυπο και φαινότυπο μόνο στα δύο μοντέλα. Η ευαισθησία και η AUC του ολοκληρωμένου συνόλου δεδομένων για stand-alone SVM ήταν 71,34% και 0,829 αντίστοιχα. Όταν το ίδιο το ενιαίο σύνολο δεδομένων χρησιμοποιείται στην ευαισθησία υβριδικό μοντέλο αυξήθηκε στο 90,92% και την AUC αυξήθηκε σε 0,91, επίσης ξεπερνώντας την εξέταση PSA στο αίμα. Το μοντέλο ήταν σε θέση να εντοπίσει τον καρκίνο του προστάτη που σχετίζεται SNPs που είτε χάρτη σε καρκίνο συγκεκριμένα γονίδια, όπως

CRR9, τ

,

ATP2B2

,

ARL9, και AGBL4

και /ή με τις ρυθμιστικές επιπτώσεις. Πειραματικές και κλινικές επικύρωση των περιγραφόμενων ενώσεων για τον καρκίνο του προστάτη μπορεί να μας οδηγήσει να κατανοήσουμε καλύτερα την εξέλιξη της νόσου σε μοριακό επίπεδο. Επιπλέον, τα περιγραφικά φαινότυποι που επιλέγονται από το υβριδικό μοντέλο ήταν επίσης προηγουμένως εντοπιστεί χαρακτηριστικά για τις σχέσεις τους με τον καρκίνο του προστάτη σε προηγούμενες μελέτες. Εθνότητα παρατηρήθηκε να είναι στη ρίζα της δομής δέντρου απόφασης, ενώ ο ΔΜΣ, το οικογενειακό ιστορικό και το κάπνισμα ήταν οι άλλες φαινοτύπους που βρίσκονται στα ανώτερα επίπεδα του μοντέλου απόφασης. Συνολικά, η μελέτη μας έδειξε ότι το μοντέλο πρόβλεψης της νόσου χτίσει με την υβριδική προσέγγιση SVM-ID3 με βάση την γονοτυπική και τα δεδομένα φαινότυπο παρέχει ένα πολλά υποσχόμενο εργαλείο για την έγκαιρη ανίχνευση του καρκίνου του προστάτη. Μετά την επικύρωση του προτεινόμενου μοντέλου με πιλοτικές μελέτες, μπορεί να εφαρμοστεί ως μια κλινική μονάδα υποστήριξης αποφάσεων για την αξιολόγηση του κινδύνου στους ασθενείς να αναπτύξουν καρκίνο του προστάτη, και οι φαινότυποι που σχετίζονται με τον τρόπο ζωής (ΔΜΣ, άσκηση, κάπνισμα, κλπ ..) που έχουν υψηλή επίπτωση στον κίνδυνο οι ασθενείς μπορεί να προσδιοριστεί για κάθε άτομο να παρακολουθείται στις επόμενες επισκέψεις.

Περαιτέρω μελέτες σχετικά με τη μέθοδο που προτείνεται υβριδικό SVM-ID3 και άλλες εξόρυξης δεδομένων προσεγγίσεις για την ολοκληρωμένη ανάλυση των αποτελεσμάτων GWAS και φαινοτυπική πληροφορίες θα βοηθήσει στην ανάπτυξη των άλλων επιτυχημένα μοντέλα της νόσου, η οποία θα υπερέχουν τη μετάφραση των ευρημάτων ένωση παραλλαγή της νόσου σε κλινικό περιβάλλον για την ανάπτυξη των νέων εργαλείων υποστήριξης αποφάσεων και εξατομικευμένες προσεγγίσεις ιατρικής.

υποστήριξη Πληροφορίες

Πίνακας S1.

όλη τη λίστα των αποτελεσμάτων SNPnexus

doi:. 10.1371 /journal.pone.0091404.s001

(DOCX)

Πίνακας S2.

όλη τη λίστα των αποτελεσμάτων RegulomeDB

doi:. 10.1371 /journal.pone.0091404.s002

(DOCX)

Δέντρο S1.

εκπροσώπηση Κείμενο της δομής δέντρου. Η δομή δέντρου του υβριδικού μοντέλου SVM-ID3

doi:. 10.1371 /journal.pone.0091404.s003

(DOCX)

Ευχαριστίες

Εκφράζουμε την ειλικρινή εκτίμησή μας προς Prof Δρ. Nazife Μπαϊκάλ, ο καθηγητής Δρ Hayri Sever, Αναπλ. Prof. Dr. Χασάν Ογκιούλ, Επίκ. Prof. Dr. Aybar Γ Acar για την καθοδήγηση και τη διορατικότητά τους σε όλη τη μελέτη. Πολύτιμη συνεισφορά του Remzi Τσελεμπή αναγνωρίζεται με ευγνωμοσύνη.

You must be logged into post a comment.