PLoS One: Ιεραρχική γονιδίου επιλογής και Γενετικής Ασαφή Σύστημα για τον καρκίνο μικροσυστοιχιών δεδομένων Classification


Αφηρημένο

Αυτό το έγγραφο εισάγει μια νέα προσέγγιση για την επιλογή του γονιδίου που βασίζεται σε μια ουσιαστική τροποποίηση των αναλυτικών διαδικασία ιεράρχησης (AHP). Το τροποποιημένο ΑΗΡ ενσωματώνει συστηματικά τα αποτελέσματα των επιμέρους μεθόδων φίλτρου για να επιλέξετε τις πιο κατατοπιστική γονίδια για την ταξινόμηση των μικροσυστοιχιών. Οι πέντε επιμέρους μέθοδοι κατάταξης συμπεριλαμβανομένων t-test, εντροπία, λειτουργικού χαρακτηριστικού δέκτη (ROC) καμπύλη, Wilcoxon και λόγο σήματος προς θόρυβο που χρησιμοποιείται για την κατάταξη των γονιδίων. Αυτές κατατάσσονται γονίδια τότε θεωρείται ως εισροές για την τροποποιημένη ΑΗΡ. Επιπλέον, μια μέθοδος που χρησιμοποιεί ασαφή πρότυπο μοντέλο πρόσθετο (FSAM) για την ταξινόμηση του καρκίνου βασίζονται σε γονίδια που επιλέγονται από ΑΗΡ προτείνεται επίσης σε αυτό το έγγραφο. Παραδοσιακά μάθηση FSAM είναι μια υβριδική μέθοδο που περιλαμβάνει μη επιβλεπόμενη μάθηση δομή και εποπτευόμενων ρύθμιση παραμέτρων. Γενετικό αλγόριθμο (GA) ενσωματώνεται στο ενδιάμεσο χωρίς επίβλεψη και εποπτευόμενη εκπαίδευση για τη βελτιστοποίηση του αριθμού των ασαφών κανόνων. Η ενσωμάτωση της GA επιτρέπει FSAM να ασχοληθεί με τη φύση μεγάλων διαστάσεων χαμηλής δείγμα των δεδομένων των μικροσυστοιχιών και έτσι να ενισχύσει την αποτελεσματικότητα της ταξινόμησης. Τα πειράματα εκτελούνται σε πολυάριθμες σύνολα δεδομένων μικροσυστοιχίας. Τα αποτελέσματα αποδεικνύουν την κυριαρχία των επιδόσεων της επιλογής γονιδίου ΑΗΡ-based ενάντια στις μεθόδους ενιαίου κατάταξης. Επιπλέον, ο συνδυασμός του ΑΗΡ-FSAM δείχνει μεγάλη ακρίβεια στην ταξινόμηση των δεδομένων μικροσυστοιχιών σε σύγκριση με διάφορα ανταγωνιστικά ταξινομητές. Ως εκ τούτου, η προτεινόμενη προσέγγιση είναι χρήσιμη για τους ιατρούς και κλινικούς ιατρούς ως ένα σύστημα υποστήριξης αποφάσεων που μπορούν να εφαρμοστούν στην πραγματική ιατρική πρακτική

Παράθεση:. Nguyen Τ, Khosravi Α, Creighton D, Nahavandi S (2015) Ιεραρχική Gene επιλογή και Γενετική Ασαφή Σύστημα ταξινόμησης δεδομένων Καρκίνου μικροσυστοιχιών. PLoS ONE 10 (3): e0120364. doi: 10.1371 /journal.pone.0120364

Ακαδημαϊκό Επιμέλεια: Enrique Hernandez-Lemus, Εθνικό Ινστιτούτο Γονιδιωματική Ιατρική, ΜΕΞΙΚΟ

Ελήφθη: 20 Νοέμβρη, 2014? Αποδεκτές: 8 Φλεβάρη, 2015? Δημοσιεύθηκε: 30, Μαρτίου 2015

Copyright: © 2015 Nguyen et al. Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της άδειας χρήσης Creative Commons Attribution, το οποίο επιτρέπει απεριόριστη χρήση, τη διανομή και την αναπαραγωγή σε οποιοδήποτε μέσο, ​​με την προϋπόθεση το αρχικό συγγραφέα και την πηγή πιστώνονται

Δεδομένα Διαθεσιμότητα: Δύο σύνολα δεδομένων DLBCL και λευχαιμία μπορείτε να το κατεβάσετε από τις 2 παρακάτω συνδέσμους: https://old.biolab.si/datasets/DLBCL.tab https://old.biolab.si/datasets/leukemia.tab Έντεκα σύνολα δεδομένων για την ανεξάρτητη επικύρωση της προτεινόμενης μέθοδος μπορεί να μεταφορτωθεί από τον ακόλουθο σύνδεσμο:. https://linus.nci.nih.gov/~brb/DataArchive_New.html

Χρηματοδότηση: Αυτή η έρευνα υποστηρίζεται από το Συμβούλιο έρευνας της Αυστραλίας (Discovery Grant DP120102112) και το Κέντρο Τεχνολογίας Ευφυών Συστημάτων Ερευνών (άδΚ) στο Πανεπιστήμιο Deakin

Αντικρουόμενα συμφέροντα:.. Οι συγγραφείς έχουν δηλώσει ότι δεν υπάρχουν ανταγωνιστικά συμφέροντα

Εισαγωγή

Ένας μεγάλος αριθμός των γονίδια δεν μπορεί να ενδεχομένως να αναλυθούν με παραδοσιακές μεθόδους. DNA μικροσυστοιχία είναι μια τεχνική που επιτρέπει στους ερευνητές να αναλύσουν την έκφραση πολλών γονιδίων ταχέως. DNA μικροσυστοιχία περιλαμβάνει μια διαδικασία που σημασμένο mRNA από ένα δοκιμαστικό σωλήνα απλώνεται πάνω στο microarray, το οποίο αποτελείται από χιλιάδες κηλίδες. Κάθε κηλίδα ϋΝΑ, το οποίο αντιπροσωπεύει ένα γονίδιο, περιέχει πολλαπλές ταυτόσημες κλώνους του DNA. Τα επισημασμένα μόρια mRNA κινούνται γύρω από το μικροσυστοιχιών για να βρείτε και να επιμείνουμε σε τέλεια αγώνες τους. Η ποσότητα του mRNA που δεσμεύεται σε κάθε σημείο πάνω στη συστοιχία προσδιορίζει το επίπεδο έκφρασης των διαφόρων γονιδίων.

Κατά συνέπεια, η τεχνολογία μικροσυστοιχιών DNA βοηθά τους επιστήμονες να ανακαλύψουν τις γενετικές αιτίες των ανωμαλιών που προκύπτουν στη λειτουργία του ανθρώπινου σώματος. Μια μικροσυστοιχία DNA επιτρέπει στους ερευνητές να προσδιορίσουν όλες τις διαφορές στην έκφραση των γονιδίων ανάμεσα σε δύο διαφορετικούς τύπους κυττάρων, π.χ. μεταξύ της κανονικής (υγιείς) και νοσούντα κύτταρα (καρκίνος), σε ένα μόνο πείραμα. Εφαρμογές των δεδομένων μικροσυστοιχιών DNA για την ταξινόμηση των ασθενειών που βασίζονται σε διαφορετικά πρότυπα γονιδιακής έκφρασης διαδραματίζουν κεντρικό ρόλο στην ιατρική έρευνα. Ταξινόμηση των δεδομένων των μικροσυστοιχιών είναι απαραίτητη για την πραγματική κλινική πρακτική, ιδιαίτερα στην διάγνωση της καρδιακής νόσου, μολυσματική ασθένεια και τη μελέτη του καρκίνου. Αυτό το έργο δημιουργεί μια τεράστια πρόκληση για τους ερευνητές στον τομέα των στατιστικών, αλλά και υπολογιστική νοημοσύνη, λόγω της φύσης μεγάλων διαστάσεων χαμηλής δείγμα των δεδομένων των μικροσυστοιχιών.

Wu et al. [1] χρησιμοποιείται ένα αφελές μοντέλο Bayes Laplace για την ταξινόμηση των δεδομένων των μικροσυστοιχιών. Η μέθοδος παίρνει αποτελέσματα ομάδα υπόψη και είναι ανθεκτική σε ακραίες τιμές, οι οποίες συνήθως εμφανίζονται σε δεδομένα γονιδιακής έκφρασης, επειδή είτε χημικές ή ηλεκτρικές λόγους. Chopra et al. [2] ειδάλλως να χρησιμοποιηθεί συνδυασμούς ζεύγος γονιδίων ως εισροές στους αλγόριθμους ταξινόμησης του καρκίνου και όχι την αρχική προφίλ γονιδιακής έκφρασης.

Basford et al. [3] θεωρούνται τόσο στην εποπτευόμενη και μη επιβλεπόμενη ταξινόμηση για τα δεδομένα μικροσυστοιχιών. Η επιβλεπόμενη ταξινόμηση είναι ο προσδιορισμός συστάδες των ιστών, με βάση τα γονίδια, ενώ χωρίς επίβλεψη ασχολείται τεχνική με την ομαδοποίηση των γονιδίων με βάση τους ιστούς. Εναλλακτικά, μια υπολογιστική πρωτόκολλο για την πρόβλεψη δεικτών γονιδίου σε καρκινικούς ιστούς χρησιμοποιείται για την ανάλυση πολλαπλούς τύπους καρκίνου σε Χυ et al. [4].

Yu et al. [5] πρότεινε μια μέθοδο undersampling χρησιμοποιώντας την ιδέα των μυρμηγκιών βελτιστοποίησης αποικίας να χαρακτηρίσει ισορροπημένη δεδομένα μικροσυστοιχιών DNA. Giugno et al. [6] Σε μια άλλη προσέγγιση εισήγαγε μια μέθοδο ταξινόμησης δεδομένων μικροσυστοιχιών χρησιμοποιώντας κανόνες συσχέτισης. Οι συγγραφείς πρότειναν ότι τα διαστήματα έκφραση μεταγραφή αποδείξει αρμοδίως διακρίσεις υποτύπων στην ίδια κατηγορία.

Πρόσφατα, Reboiro-Jato et al. [7] κατασκεύασε ένα web-based διαδραστικό εργαλείο για την αξιολόγηση της απόδοσης διακριτική κατάταξη των προσαρμοσμένων υπόθεση με τη μορφή βιολογικά σχετίζονται σύνολα γονιδίων. Το εργαλείο είναι σε θέση να παρέχουν πληροφορίες αποτίμησης για διαγνωστική ανάλυση και τις αποφάσεις της κλινικής διαχείρισης.

Αν και πολλές μέθοδοι έχουν προταθεί για την ταξινόμηση των δεδομένων των μικροσυστοιχιών, μπορούν να παρέχουν μόνο nonintuitive αποτελέσματα της κατάταξης, οι οποίες δεν είναι πλήρεις και ισχύουν για τους κλινικούς ιατρούς στην η πραγματική πρακτική. Η συμπεριφορά της τεχνικής ταξινόμησης πρέπει να γίνει κατανοητό από την ανθρώπινη χρήση εργαλείων όπως γλωσσικούς κανόνες. Ευτυχώς, το έργο αυτό μπορεί να επιτευχθεί με τη βοήθεια της ασαφούς λογικής, το οποίο εισήχθη το 1960. Εφαρμογή της ασαφούς λογικής μπορούν να παρέχουν οι κλινικοί γιατροί με την καλύτερη κατανόηση των δεδομένων και εξηγήσεις σχετικά με το πώς δίνονται διαγνωστεί αποτελέσματα. Επιπλέον, ασαφής λογική προσφέρει καλή ικανότητα να χειριστεί θορυβώδη /ελλείποντα στοιχεία, το οποίο είναι ένα κοινό πρόβλημα στα δεδομένα μικροσυστοιχιών [8-10].

Εμπνευσμένοι από τις παραπάνω συνθήκες, το παρόν έγγραφο προτείνει μια μέθοδο με τη χρήση ασαφούς πρότυπο μοντέλο πρόσθετης (FSAM) για την ταξινόμηση των δεδομένων καρκίνο μικροσυστοιχιών. Για την ενίσχυση της αποτελεσματικότητας της FSAM στην αντιμετώπιση δεδομένων υψηλής διαστάσεων χαμηλής δείγμα μικροσυστοιχιών, γενετικό αλγόριθμο (GA) ενσωματώνεται στη μάθηση FSAM διαδικασία για τη βελτιστοποίηση της δομής κανόνα FSAM.

Πριν από την πραγματοποίηση γενετικών FSAM για μικροσυστοιχιών ταξινόμηση δεδομένων, ένα υποσύνολο των πιο κατατοπιστική γονίδια πρέπει να επιλεγούν από χιλιάδες γονίδια. Προτείνουμε στο παρόν μια νέα επιλογή γονίδιο με τροποποίηση της παραδοσιακής διαδικασίας ιεραρχία αναλυτική (ΑΗΡ) [11] το οποίο μπορεί στη συνέχεια να αναπτυχθεί ποσοτικά για την ενσωμάτωση των αποτελεσμάτων από έναν αριθμό μεθόδων κατάταξης μεμονωμένων γονιδίων.

Μέθοδοι γονίδιο επιλογής

δεδομένα μικροσυστοιχιών συνήθως συλλέγονται με τον αριθμό των γονιδίων (συχνά σε χιλιάδες) είναι πολύ μεγαλύτερο από τον αριθμό των δειγμάτων. Ως εκ τούτου, πολλές πρότυπες τεχνικές βρίσκουν ακατάλληλο ή υπολογιστικά ανέφικτο στην ανάλυση των δεδομένων αυτών. Το γεγονός είναι ότι δεν είναι όλα τα χιλιάδες γονίδια είναι διακρίσεις και απαιτούνται για την ταξινόμηση. Τα περισσότερα γονίδια δεν έχουν σημασία και δεν επηρεάζουν την απόδοση ταξινόμησης. Τη λήψη αυτών των γονιδίων υπόψη διευρύνει τη διάσταση του προβλήματος, οδηγεί στην υπολογιστική επιβάρυνση, και παρουσιάζει περιττό θόρυβο στην πρακτική κατάταξης [9]. Έτσι, είναι σημαντικό να επιλέξετε ένα μικρό αριθμό γονιδίων, που ονομάζεται ενημερωτικό γονίδια, τα οποία μπορεί να επαρκεί για την καλή κατάταξη. Ωστόσο, το καλύτερο υποσύνολο των γονιδίων είναι συχνά άγνωστη [12].

Κοινό γονίδιο προσεγγίσεις επιλογής είναι μέθοδοι φίλτρο και περιτύλιγμα. μεθόδους φίλτρο κατατάξουν όλα τα χαρακτηριστικά όσον αφορά την καλοσύνη τους, χρησιμοποιώντας τη σχέση του κάθε απλού γονιδίου με την ετικέτα τάξη βασίζεται σε μια μονοπαραγοντική μετρικό βαθμολόγησης. Τα κορυφαία γονίδια επιλέξει πριν έχουν αναπτυχθεί τεχνικές ταξινόμησης. Σε αντίθεση, οι μέθοδοι απαιτούν την περιτύλιγμα τεχνική επιλογής γονίδιο να συνδυάσει με ένα ταξινομητή για την αξιολόγηση των επιδόσεων ταξινόμηση του κάθε γονιδίου υποσύνολο. Η βέλτιστη υποσύνολο των γονιδίων που προσδιορίζεται με βάση την κατάταξη των επιδόσεων που προέρχεται από την ανάπτυξη του ταξινομητή σε όλα βρέθηκαν υποσύνολα. Η διαδικασία φίλτρο δεν είναι σε θέση να μετρήσει τη σχέση μεταξύ γονιδίων, ενώ η προσέγγιση περιτύλιγμα απαιτεί μεγάλη υπολογιστική βάρος [13].

Συνοπτική επισκόπηση της βιβλιογραφίας των μεθόδων επιλογής γονιδίων

Έχουν υπάρξει ένας αριθμός γονιδίων τεχνικές επιλογής στη βιβλιογραφία για την ταξινόμηση των δεδομένων των μικροσυστοιχιών DNA. Liu at al. [14] εισήγαγε ένα σύνολο μέθοδο επιλογής γονιδίων με βάση την υπό όρους αμοιβαίας πληροφόρησης για την ταξινόμηση του καρκίνου μικροσυστοιχιών. Πολλαπλές υποσύνολα γονίδιο χρησιμεύουν για να εκπαιδεύσει τους ταξινομητές και οι έξοδοι συνδυάζονται με μια προσέγγιση ψήφου.

Επίσης, Leung και Hung [15] ξεκίνησε μια προσέγγιση πολλαπλών φίλτρων-πολλαπλών-περιτύλιγμα στην επιλογή γονιδίων για να ενισχύσει την ακρίβεια και την ευρωστία του η κατάταξη των δεδομένων των μικροσυστοιχιών. Liu et al. [16] πρότεινε μια άλλη μέθοδο, που ονομάζεται ensemble επιλογή γονιδίων με ομαδοποίηση, να αντλήσει πολλαπλές υποσύνολα γονιδίων. Η μέθοδος βασίζεται στην αρετή της θεωρίας πληροφοριών και τον κατά προσέγγιση κουβέρτα Markov.

Bolon-Canedo et al. [17] Σε μια άλλη προσέγγιση διερευνάται μια μέθοδο επιλογής γονίδιο που περιλαμβάνει ένα σύνολο φίλτρων και ταξινομητές. Μια προσέγγιση της ψηφοφορίας χρησιμοποιήθηκε για να συνδυάσει τις εξόδους των ταξινομητών που βοηθούν στη μείωση της μεταβλητότητας των επιλεγμένων λειτουργιών σε διαφορετικούς τομείς ταξινόμησης.

Από την άλλη πλευρά, Bicego et al. [18] πρότεινε ένα υβριδικό παραγωγικό διακριτική προσέγγιση χρησιμοποιώντας ερμηνεύσιμη χαρακτηριστικά που εξάγονται από το θέμα μοντέλα ταξινόμησης δεδομένων μικροσυστοιχιών έκφρασης. Orsenigo και Vercellis [19] εξέτασε μη γραμμικές τεχνικές μάθησης συλλέκτη για τη μείωση της διάστασης για την ταξινόμηση των δεδομένων των μικροσυστοιχιών. Ομοίως, Ramakrishnan και Neelakanta [20] μελέτησαν μια πληροφορία-θεωρητικά εμπνευσμένη προσέγγιση συνύπαρξη εντροπίας για την επιλογή χαρακτηριστικών για την ταξινόμηση των δεδομένων των μικροσυστοιχιών DNA.

Πρόσφατα, Du et al. [21] πρότεινε μια προς τα εμπρός αλγόριθμος επιλογής γονιδίων για να επιλέξετε αποτελεσματικά τα πιο κατατοπιστική γονίδια από τα δεδομένα μικροσυστοιχιών. Ο αλγόριθμος συνδυάζει την επαυξημένη τεχνική δεδομένων και πρόστιμο L

2-νόρμα για να ασχοληθεί με το πρόβλημα των μικρών δειγμάτων »και την ικανότητα επιλογής της ομάδας, αντίστοιχα.

Σε αυτό το χαρτί, για να ενισχυθεί η ευρωστία και η σταθερότητα των ταξινομητές δεδομένων μικροσυστοιχιών , εισάγουμε μία νέα μέθοδο επιλογής γονίδιο με βάση μια τροποποίηση του ΑΗΡ. Η ιδέα πίσω από αυτή την προσέγγιση είναι να συγκεντρώσει τις ελίτ γονίδια από διάφορες μεθόδους επιλογής γονιδίων κατάταξη μέσα από μια συστηματική ιεραρχίας.

Οι επόμενες υποενότητες ελέγχει φόντο των μεθόδων επιλογής γονιδίων κοινών φίλτρων, τα οποία ακολουθούνται από την πρότασή μας.

Σημειώστε ότι οι παρακάτω μέθοδοι επιλογής γονιδίων επιτυγχάνεται με την κατάταξη των γονιδίων μέσω μετρήσεων βαθμολόγησης. Είναι στατιστικό τεστ βασίζεται σε δύο δείγματα δεδομένων στο δυαδικό πρόβλημα ταξινόμησης. Οι δείγμα μέσα συμβολίζεται ως μ

1 και μ

2, ενώ σ

1 και σ

2 είναι οι τυπικές αποκλίσεις του δείγματος, και

ν

1 και

ν

2 είναι τα μεγέθη των δειγμάτων.

δύο δείγμα t-test

Το t-test δύο-δείγμα είναι ένα παραμετρικό τεστ υπόθεση που εφαρμόζεται σε σύγκριση αν η μέση διαφορά μεταξύ δύο ανεξάρτητων δειγμάτων δεδομένων είναι πραγματικά σημαντική. Η στατιστική δοκιμή εκφράζεται από: (1) Κατά την εφαρμογή του t-test για την επιλογή γονιδίων, η δοκιμή εκτελείται σε κάθε γονίδιο, με τον διαχωρισμό των επιπέδων έκφρασης με βάση την μεταβλητή της κατηγορίας. Η απόλυτη τιμή του

t

χρησιμοποιείται για την αξιολόγηση της σημασίας μεταξύ των γονιδίων. Όσο υψηλότερη είναι η απόλυτη τιμή, τόσο πιο σημαντικό είναι το γονίδιο.

Εντροπία δοκιμή

Σχετική εντροπία, επίσης γνωστή ως Kullback-Liebler απόσταση ή απόκλισης είναι μια δοκιμή υποθέτοντας τάξεις είναι κανονικά κατανεμημένα. Η βαθμολογία εντροπία για κάθε γονίδιο υπολογίζεται χρησιμοποιώντας την ακόλουθη έκφραση: (2) Μετά ο υπολογισμός πραγματοποιείται για κάθε γονίδιο, γονίδια με τις υψηλότερες βαθμολογίες εντροπίας θα επιλεγούν να υπηρετήσουν ως εισροές στις τεχνικές ταξινόμησης

Δέκτης. λειτουργούν χαρακτηριστικό (ROC) καμπύλη

Δείξτε τις λειτουργίες διανομής των

x

στους δύο πληθυσμούς, όπως

F

1 (

x

) και

F

2 (

x

) Οι λειτουργίες της ουράς καθορίζονται αντίστοιχα

T

i (

x

) = 1

F

i

(

x

),

i

= 1,2. Η

ROC

δίνεται ως εξής: (3) και η περιοχή μεταξύ της καμπύλης και της ευθείας (AUC) υπολογίζεται από: (4) Όσο μεγαλύτερη είναι η

AUC

, τόσο μικρότερη είναι η επικάλυψη των τάξεων. Για εφαρμογή επιλογής γονίδιο, γονίδια με τη μεγαλύτερη

AUC

έτσι θα επιλεγεί.

Wilcoxon μέθοδος

Η δοκιμή αθροίσματος κατάταξης Wilcoxon είναι ισοδύναμο με το Mann-Whitney U-test , η οποία είναι μια δοκιμή για την ισότητα των τοποθεσιών πληθυσμού (διάμεσοι). Η μηδενική υπόθεση είναι ότι οι δύο πληθυσμοί περικλείουν πανομοιότυπα καθήκοντα διανομής, ενώ η εναλλακτική υπόθεση αφορά την περίπτωση δύο κατανομές διαφέρουν όσον αφορά τις διαμέσους. Η υπόθεση ομαλότητα όσον αφορά τις διαφορές μεταξύ των δύο δειγμάτων δεν είναι απαραίτητη. Αυτός είναι ο λόγος για τον οποίο η δοκιμή αυτή χρησιμοποιείται αντί του t-test δύο δείγματος σε πολλές εφαρμογές, όταν αφορά την υπόθεση της κανονικότητας

Τα κύρια στάδια της δοκιμασίας Wilcoxon [22] συνοψίζονται παρακάτω:.

Συγκεντρώστε όλα δείγματα των δύο πληθυσμών και να τους ταξινομήσετε με την αύξουσα σειρά.

Η στατιστική Wilcoxon υπολογίζεται από το άθροισμα όλων των βαθμίδων που συνδέονται με τα δείγματα από τη μικρότερη ομάδα.

Η απόφαση υπόθεση είναι έκανε με βάση το p-value, η οποία βρίσκεται από τον πίνακα κατάταξης κατανομή ποσού Wilcoxon.

η

στις εφαρμογές του τεστ Wilcoxon για την επιλογή γονιδίων, οι απόλυτες τιμές των τυποποιημένων στατιστικών Wilcoxon χρησιμοποιούνται για να κατατάξουν τα γονίδια

λόγος σήματος προς θόρυβο (SNR)

SNR ορίζει τη σχετική κατηγορία διαχωρισμό μετρικούς από:. (5) όπου

γ

είναι το διάνυσμα τάξη,

στ

i

είναι η

i

ου διάνυσμα χαρακτηριστικών. Με τη θεραπεία κάθε γονίδιο ως ένα χαρακτηριστικό, θα μετατρέψει το SNR για την επιλογή χαρακτηριστικών στο πρόβλημα επιλογής γονιδίων για την ταξινόμηση των δεδομένων των μικροσυστοιχιών.

SNR σημαίνει ότι η απόσταση μεταξύ των μέσων των δύο κατηγοριών είναι ένα μέτρο για το διαχωρισμό. Επιπλέον, η μικρή τυπική απόκλιση ευνοεί ο διαχωρισμός μεταξύ των τάξεων. Η απόσταση μεταξύ των μέσων τιμών έτσι ομαλοποιηθεί από την τυπική απόκλιση των τάξεων [23].

Μια νέα επιλογή γονιδίων με τροποποιημένο ΑΗΡ

Κάθε ένα από τα παραπάνω κριτήρια μπορούν να χρησιμοποιηθούν για τον υπολογισμό της κατάταξης των γονιδίων και, στη συνέχεια, να επιλέξετε το μεγαλύτερο κατάταξης γονίδια για τις μεθόδους ταξινόμησης. Η εμπιστοσύνη του χρησιμοποιώντας ένα μόνο κριτήριο για την επιλογή των γονιδίων δεν επιτυγχάνεται πάντα. Λαμβάνοντας υπόψη το οποίο το κριτήριο θα πρέπει να χρησιμοποιείται είναι άτολμος. Το ερώτημα αυτό εμπνέει μια ιδέα, λαμβάνοντας υπόψη την κατάταξη όλων των κριτηρίων για την αξιολόγηση των γονιδίων. Μέσα από αυτό τον τρόπο, ελίτ γονίδια του κάθε κριτηρίου θα συναρμολογηθούν συστηματικά για να σχηματίσουν τις πιο κατατοπιστική και σταθερή υποσύνολα γονίδιο για την ταξινόμηση. Είναι μια δύσκολη πρακτική να συνδυάσει την κατάταξη όλων των κριτηρίων, επειδή οι σειρές των στατιστικών κριτηρίων είναι διαφορετικά. Το κριτήριο δημιουργεί ένα υψηλότερο φάσμα στατιστικών στοιχείων θα κυριαρχήσουν εκείνες με χαμηλότερο εύρος. Για να αποφευχθεί αυτό το πρόβλημα, χρησιμοποιούμε ΑΗΡ στην αξιολόγηση γονίδια. Η ανάπτυξη ΑΗΡ συνήθως αντιμετωπίζεται με ποιοτικά κριτήρια, όπου οι αξιολογήσεις τους προέρχονται από ειδικούς. Παρ ‘όλα αυτά, η γνώση των εμπειρογνωμόνων περιορίζεται συχνά ιδιαίτερα όταν το πρόβλημα λύνεται πραγματοποιείται σε ένα ευρύ αριθμό κριτηρίων που αναφέρονται σε διάφορες περιοχές της γνώσης. Αυτό συνηγορεί υπέρ της χρήσης των ποσοτικών κριτηρίων στην ΑΗΡ. Το παρακάτω παρουσιάζει μια νέα πρόταση έναντι των αναληφθεισών κατάταξης διαδικασία να χρησιμοποιήσει ποσοτικά κριτήρια για την ΑΗΡ για το πρόβλημα επιλογής γονιδίων. Τα κριτήρια που χρησιμοποιούνται στο παρόν είναι τα πέντε στατιστικά τεστ δηλαδή t-test, εντροπία, ROC, Wilcoxon, SNR.

Η μέθοδος ΑΗΡ όπως εφαρμόστηκε ευρέως το συγκρότημα πολλαπλών κριτηρίων λήψης αποφάσεων εκτελείται συχνά με μια δομή δέντρου των κριτηρίων και υπο-κριτήρια [24]. Λόγω της φύσης των επιλεγέντων κριτηρίων εδώ, η δομή δέντρου έχει τρία επίπεδα ιεραρχίας όπως απεικονίζεται στο Σχ. 1.

Η

Τα πέντε κριτήρια που θεωρείται ταυτόχρονα κατά τη διάρκεια υλοποίησης ΑΗΡ. Τα πέντε κριτήρια είναι όλα ποσοτικά, ώστε να μπορούμε να βάλουμε διαισθητικά πραγματικά ποσά των εν λόγω κριτηρίων σε στοιχεία της κατά ζεύγη μήτρα κατάταξη. Αυτό όμως θα στρεβλώσει τον πίνακα σε σχέση με άλλες μήτρες που περιγράφουν εκτιμήσεις και κρίσεις αναφορικά με άλλα κριτήρια. Συμβατικές εφαρμογές της ιεραρχικής ανάλυσης συχνά αντλήσει από την κλίμακα Saaty αξιολόγησης [1, 9] και τραχύ αναλογίες, π.χ. 1, 3, 5, 7, 9 για την κατασκευή κατά ζεύγη μήτρες σύγκρισης [24, 25]. Σε αυτή την έρευνα, προτείνουμε την κλίμακα [1, 10] για την κατάταξη σημασία ή τη σημασία ενός γονιδίου σε σύγκριση με άλλα γονίδια. Η κλίμακα αυτή θα εφαρμόζεται σε όλα τα κριτήρια για την εφαρμογή AHP.

Ας υποθέσουμε ότι

X

= (

x

ij

) είναι το

ν

×

ν

-dimension ζεύγη μήτρα απόφαση με την οποία κάθε στοιχείο

x

ij

αντιπροσωπεύει τη σχετική σημασία του γονιδίου

i

πάνω γονίδιο

j

σε σχέση με ένα καθορισμένο κριτήριο,

n

είναι ο αριθμός των γονιδίων. Η αμοιβαία χαρακτηριστικό προκαλεί τα ακόλουθα προβλήματα (6) (7) Αν το γονίδιο

i

είναι απολύτως πιο κατατοπιστική από γονίδιο

ι

, τότε έχουμε

x

ij = 10. Συνεπώς γονίδιο

ι

πρέπει να είναι απολύτως λιγότερο σημαντικό από το γονίδιο

i

και

x

ji = 1/10. Όπου

x

ij = 1, αυτό δείχνει ότι δύο γονίδια είναι εξίσου κατατοπιστική. Όσο υψηλότερη είναι η τιμή του

x

ijε [1,10], το πιο σημαντικό είναι το γονίδιο

i

είναι σε σύγκριση με το γονίδιο

ι

. Στοιχείο

x

ij ότι είναι μεγαλύτερη από 1 ονομάζεται ανώτερο στοιχείο. Διαφορετικά

x

ij ονομάζεται κατώτερη στοιχείο καθώς είναι μικρότερες από 1.

Ας ορίσει απόσταση

δ

ij μεταξύ δύο γονιδίων

i

και

ι

σε σχέση με ένα δεδομένο κριτήριο (π.χ. t-test, εντροπία, ROC, Wilcoxon ή SNR) από την απόλυτη τιμή της αφαίρεσης μεταξύ δύο στατιστικών

γ

i

και

γ

ι

των δύο γονιδίων.

(8)

Σημειώστε ότι για όλα τα κριτήρια, τόσο μεγαλύτερη είναι η στατιστικό στοιχείο, το πιο σημαντικό είναι το γονίδιο είναι. Η διαδικασία για την απόκτηση στοιχείων σύγκρισης αμοιβαία μητρών περιγράφεται παρακάτω όπου

c_max

είναι η μέγιστη απόσταση των γονιδίων που αφορούν το συγκεκριμένο κριτήριο,

c_max

=

max

(

δ

ij

), ∀

i

,

ι

∈ [0,

ν

], και

γ

είναι μια προσωρινή μεταβλητή.

διαδικασία Κατάταξη.

για όλα τα ζεύγη των δύο γονιδίων

i

και

ι

(9) IF (

γ

i

γ

ι

) ΤΟΤΕ

x

ij

=

γ

ΑΛΛΟ

x

ij

= 1 /

γ

ΤΕΛΟΣ ΕΑΝ

ΤΕΛΟΣ ΓΙΑ

Οι εκφράσεις x

ij εξασφαλίζουν ότι τα ανώτερα στοιχεία των πινάκων απόφαση θα διανεμηθεί στο διάστημα [1, 10]. Σημειώστε ότι μέσω υπολογισμών της μεθόδου ποσοτικής κατάταξης, οι ανώτερες αναλογίες επιτρέπεται να είναι πραγματικοί αριθμοί στο [1, 10], έτσι ώστε να μπορούν να χαρακτηρίζουν με μεγαλύτερη αυστηρότητα τη σημασία απόφαση κατά την αρχική κλίμακα διαβάθμισης Saaty. Για παράδειγμα, σκεφτείτε τέσσερα ποσοτικά κριτήρια Α, Β, C και D με τις αντίστοιχες τιμές 0.9, 1.3, 8.7 και 9.2. Σύμφωνα με την κλίμακα αξιολόγησης Saaty, τα κριτήρια Β ​​και Α (Α και C) θεωρείται «εξίσου σημαντική» και οι αναλογίες

x

BA

και

x

DC

θα ανατεθεί εξίσου σε 1:

x

BA

=

x

DC

= 1. Προφανώς, η διαφορά μεταξύ του Β και Α (ή Α και C), αν και μικρή, παραμελείται. Ωστόσο, με τη μέθοδο κατάταξης μας, οι αναλογίες

x

BA

και

x

DC

έχουν ανατεθεί με μεγαλύτερη ακρίβεια και με διαφορετικό τρόπο 1.4337 =

x

BA

x

DC

= 1,5422. Ομοίως, στην κλίμακα αξιολόγησης Saaty, το κριτήριο Γ θεωρείται απολύτως πιο σημαντικό από ό, τι το κριτήριο Α και Β, και η αναλογία

x

Καλιφόρνια

και

x

CB

και οι δύο έχουν ανατεθεί 9. Στην κλίμακα μας, η αναλογία

x

Καλιφόρνια

και

x

CB

θα ανατεθεί διαφορετικό 9,4578 και 9,0241 αντίστοιχα. Εξ ου και η «απόλυτη σημασία» απόφαση είναι χαλαρή και να αντικατασταθεί από πιο αυστηρές αποφάσεις με διαφορετικούς πραγματικούς αριθμούς 9,4578 και 9,0241 και όχι το ίδιο τραχύ αριθμό 9 και για τους δύο

x

CA

και

x

CB

.

Μετά μήτρες σύγκρισης κατασκευάζονται, ιεραρχική ανάλυση υπολογίζει ιδιοδιανύσματα που αποδεικνύουν κατάταξης βαθμολογίες των γονιδίων. Οι υπολογισμοί της ΑΗΡ περιγράφονται συνοπτικά στον Πίνακα 1.

Η

Κατά την εφαρμογή της AHP, η μήτρα πρέπει να είναι συνεπής και ως εκ τούτου τα στοιχεία του πρέπει να είναι μεταβατική, δηλαδή

x

ik

=

x

ij

x

JK. Να ελεγχθεί η συνέπεια της μήτρας σύγκρισης Χ, Saaty [25] πρότεινε τον υπολογισμό του δείκτη συνάφειας (CI) και, στη συνέχεια, Λόγος Συνοχή (CR) με βάση μεγάλα δείγματα των μητρών καθαρά τυχαία αποφάσεων. Ας

ε

= [

ε

1, …,

ε

ν

]

T είναι ένα ιδιοδιάνυσμα και λ μια ιδιοτιμή της πλατείας πίνακα

X

, οπότε: (10) (11) (12) CR δεν πρέπει να υπερβαίνει το 0,1, εάν το σύνολο των αποφάσεων είναι συνεπής αν και ΗΣΚ περισσότερο από 0,1 (αλλά όχι πάρα πολύ περισσότερα ) μερικές φορές πρέπει να γίνουν δεκτές στην πράξη. CR ίσο με 0 συνεπάγεται οι αποφάσεις είναι απόλυτα συνεπείς.

Όταν ολοκληρωθούν οι υπολογισμοί για πέντε κριτήρια, παίρνουμε το λεγόμενο πίνακα επιδόσεων επιλογή που αποτελείται από πέντε ιδιοδιανύσματα που έχει τη μορφή που φαίνεται στον Πίνακα 2.

Τέλος, η κατάταξη των γονιδίων είναι ο πολλαπλασιασμός της μήτρας απόδοση και το φορέα που εκπροσωπούν το σημαντικό βάρος κάθε κριτηρίου. Ο φορέας βάρος μπορεί να ληφθεί με την αξιολόγηση της σημαντικό επίπεδο κάθε κριτήριο σχετικά με τον στόχο με την ίδια διαδικασία όπως περιγράφηκε παραπάνω. Ωστόσο, για να αποφευχθεί μια κρίση προκατάληψη, θεωρούμε πέντε κριτήρια που έχει έναν εξίσου σημαντικό επίπεδο όσον αφορά το στόχο. Στη συνέχεια, το διάνυσμα βάρους είναι (1/5? 1/5? 1/5? 1/5? 1/5)

T. Είναι επομένως προφανές ότι η κατάταξη των γονιδίων είναι αυτόματα ομαλοποιημένη και δείχνει το σημαντικό επίπεδο του κάθε γονιδίου, λαμβάνοντας υπόψη όχι μόνο ένα κριτήριο, αλλά όλα τα κριτήρια ταυτόχρονα. Οι υψηλότερη κατάταξη γονίδια στη συνέχεια επιλέγονται για την ταξινόμηση των υστέρων. Στο έγγραφο αυτό, να καταθέσουν την απόδοση των τεχνικών ταξινόμησης, ένας μεγάλος αριθμός φάσμα των γονιδίων προσδιορίζεται. Οι λεπτομέρειες για τον αριθμό των γονιδίων που επιλέγονται παρουσιάζονται στο πειραματικό τμήμα.

Γενετική Ασαφή Σύστημα Ταξινόμησης Δεδομένων μικροσυστοιχιών

Ασαφής καθιερωμένο μοντέλο πρόσθετο (FSAM)

Το σύστημα FSAM

F

:

R

ν

→ R

p

αποτελείται από

m

αν-τότε ασαφείς κανόνες, η οποία μαζί μπορούμε ομοιόμορφα κατά προσέγγιση συνεχή και οριοθετείται μετρήσιμες λειτουργίες σε μια συμπαγή τομέα [26, 27]. Αν-τμήμα ασαφή σύνολα

Μια

ι

R

n

μπορεί να είναι οποιοδήποτε είδος των συναρτήσεων συμμετοχής. Ομοίως, τότε μέρος ασαφή σύνολα

Β

ι

R

p

μπορεί να επέλεξε αυθαίρετα, επειδή FSAM χρησιμοποιεί μόνο το κέντρο βάρους

γ

ι

και τον όγκο

V

ι του

Β

ι

για τον υπολογισμό της εξόδου

F

(

x

) δίνεται το διάνυσμα εισόδου

x

εr

n.

(13)

Κάθε ένα από τα

m

ασαφείς κανόνες με τη μορφή λέξη

«Αν x = a

ι

στη συνέχεια, Υ = Β

ι

«

αντιπροσωπεύεται από έναν ασαφή κανόνα επίθεμα της μορφής Α

j × Β

j⊂R

n × R

p. Ως εκ τούτου, FSAM καλύπτει γραφικά τη γραφική παράσταση της approximand

στ

με

m

ασαφή μπαλώματα κανόνα. Αν-μέρος σετ

Μια

ι

R

ν

χαρακτηρίζεται από την κοινή δέσμη λειτουργία

α

ι

:

R

ν

[0, 1], ότι παράγοντες:. Στη συνέχεια, μέρος ασαφές σύνολο B

j⊂R

σ ομοίως ως πρότυπο από τη λειτουργία των μελών

β

ι

:

R

p

[0, 1] που έχει όγκο (ή περιοχή)

V

ι και κέντρο βάρους

γ

ι

. Οι κυρτές βάρη που εκφράζονται από: (14) επάγουν την παραγωγή FSAM

F

(

x

) ως ένα κυρτό σύνολο του τότε μέρος σετ κέντρα βάρους. FSAM ιδίως ή ασαφές σύστημα γενικότερα απαιτεί τη σειρά των

k

n + p-1 κανόνες για να χαρακτηρίσει τη λειτουργία

στ

:

R

ν

→ R

p

σε μια συμπαγή περιοχή.

η μάθηση είναι μια ζωτικής σημασίας διαδικασία της FSAM να κατασκευάσει μια βάση γνώσης που είναι μια δομή των ασαφών κανόνων αν-τότε. Η διαδικασία της μάθησης FSAM περιλαμβάνει συμβατικά δύο βασικά στάδια: α) χωρίς επίβλεψη μάθηση για την κατασκευή αν-τότε ασαφείς κανόνες και β) που εποπτεύονται μαθαίνοντας για τις παραμέτρους κανόνα συντονισμού [28]

Η εποπτευόμενη μάθηση ξεκινάει συχνά από ένα τυχαία αρχικοποίηση σύνολο. παραμέτρων και τελειώνει όταν πληροί τα προκαθορισμένα κριτήρια διακοπή. Ως εκπαιδευτική διαδικασία κοστίζει πολύ χρόνο και συχνά παγιδεύονται σε τοπικά ελάχιστα, η αρχικοποίηση των παραμέτρων είναι έτσι μια μη τετριμμένη θέμα. Η μη επιβλεπόμενη διαδικασία μάθησης, η οποία είναι συχνά επιτυγχάνεται με μια μέθοδο ομαδοποίησης, π.χ. fuzzy c-means, βοηθά να προετοιμαστεί παραμέτρους της ασαφούς κανόνες πιο επιδέξια (Εικ. 2).

Η

δεδομένα μικροσυστοιχιών συνήθως συνδέονται με την υψηλή τρισδιάστατη φύση που οδηγεί την κατάταξη FSAM σε ένα σύστημα κανόνα έκρηξη που αντιμετωπίζει η κατάρα των διαστάσεων [29]. Με ένα μεγάλο αριθμό κανόνων, FSAM απαιτεί ένα μεγάλο αριθμό δειγμάτων για να εκπαιδεύσει το σύστημα. Αυτό όμως έρχεται σε αντίθεση με το χαρακτηριστικό χαμηλής δείγμα των δεδομένων γονιδιακής έκφρασης μικροσυστοιχιών. Είναι ως εκ τούτου σημαντικό να βελτιστοποιήσει τη δομή κανόνα για την ενίσχυση της αποτελεσματικότητας της διαδικασίας μάθησης και την ικανότητα γενίκευσης της FSAM.

Στην εργασία αυτή, προτείνουμε τη χρήση μιας εξελικτικής διαδικασίας μάθησης, δηλαδή GA, για τη βελτιστοποίηση του αριθμού των ασαφών κανόνων, πριν εκτελεστεί η εποπτευόμενη μάθηση. Η εξελικτική συνιστώσα της μάθησης έχει σχεδιαστεί επίσης για να ανακουφίσει το υπολογιστικό κόστος της επιτυχίας εποπτευόμενης μάθησης. Ολόκληρη η ολοκλήρωση μεταξύ GA και FSAM να διαμορφώσει ένα γενετικό ασαφούς σύστημα απεικονίζεται στο Σχ. 3. Λεπτομέρειες για κάθε μάθηση συστατικό που παρουσιάζονται στις παρακάτω υποενότητες.

Η

Μη επιβλεπόμενη μάθηση από τα fuzzy c-means (FCM) ομαδοποίηση

Η μέθοδος FCM ομαδοποίησης [30] εφαρμόζεται να προετοιμάσει τις παραμέτρους της FSAM. Οργανώνουμε τα αντίστοιχα δεδομένα εισόδου και εξόδου σε μια μοναδική παρατήρηση του ρ + 1 διαστάσεις όπου

σ

είναι ο αριθμός των εισόδων και μία έξοδο που αντιστοιχεί στην κατηγορία που ταξινομούνται. Δηλώνουν

x

i είναι η

i

ου οργανωμένη παρατήρηση (

i

= 1, …,

Ν

),

x

i παρουσιάζεται ως εξής: (15) όπου είναι η

ι

ου εισόδου του

i

η παρατήρηση και

εξόδου

i

είναι η έξοδος του

i

η παρατήρηση. Με την ομαδοποίηση του δείγματος των

Ν

παρατηρήσεις που έχουν την παραπάνω μορφή, είμαστε σε θέση να αντλήσει το

C

προκύπτει συστάδες που αντιστοιχεί με το

C

ασαφείς κανόνες της FSAM. Μόλις η ομαδοποίηση FCM έχει ολοκληρωθεί, τα κέντρα των συστάδων που προκύπτουν ανατεθεί σε κέντρα των συναρτήσεων συμμετοχής (αμοιβαία κεφάλαια). Τα κέντρα της εξόδου του κάθε κανόνα θα ανατεθεί ίση με την τιμή εξόδου του αντίστοιχου συμπλέγματος. Τα πλάτη των αμοιβαία κεφάλαια της κάθε κανόνα προετοιμαστεί με βάση την τυπική απόκλιση των δεδομένων.

Το

sinc

συνάρτηση συμμετοχής

αμαρτία

(

x

) /

x

συνιστάται ως το καλύτερο σχήμα για ένα ασαφές σύνολο σε συνάρτηση με την προσέγγιση που χρησιμοποιείται για την κατασκευή αν-τότε ασαφείς κανόνες [31]. Η

ι

ου σετ sinc λειτουργία (Εικ. 4) επικεντρώνεται σε

m

ι

και πλάτους d

ι

& gt ? 0 ορίζεται ως εξής:. (16) Η λειτουργία του FCM ομαδοποίηση αρκετές φορές ίσο με το μέγεθος του πληθυσμού GA, είμαστε σε θέση να αποκτήσει την αρχική του πληθυσμού για GA, η οποία περιγράφεται στον ακόλουθο

Η

Ασαφής βελτιστοποίησης δομής κανόνα από GA

ένα GA [32] είναι μια ανορθόδοξη έρευνα ή βελτιστοποίηση τεχνική λειτουργεί σε έναν πληθυσμό

ν

τεχνητή άτομα. Τα άτομα που χαρακτηρίζονται από χρωμοσώματα (ή γονιδιώματα)

S

k,

k = {

1,

,

n}

. Το χρωμόσωμα είναι ένα κορδόνι από σύμβολα, τα οποία ονομάζονται γονίδια, S

k = (S

k1

, …, S

kM

), και

Μ

είναι ένα μήκος συμβολοσειράς. Τα άτομα που αξιολογούνται μέσω υπολογισμού της συνάρτησης καταλληλότητας. Να εξελίσσεται μέσα από διαδοχικές γενιές, GA εκτελεί τρεις βασικές γενετικές φορείς:. Επιλογής, διασταύρωσης και μετάλλαξης

Μια μέθοδος επιλογής ρουλέτα χρησιμοποιείται για την επιλογή των ατόμων που πηγαίνουν για να παραχθεί ένα ενδιάμεσο πληθυσμό. Οι γονείς επιλέγονται με βάση την καταλληλότητά τους. Χρωμοσώματα έχουν περισσότερες πιθανότητες να επιλεγεί αν είναι καλύτερα (έχουν υψηλότερο fitness) από τους άλλους. Φανταστείτε όλα τα χρωμοσώματα του πληθυσμού τοποθετούνται σε μία ρουλέτα, και το καθένα έχει τη θέση του μεγάλου σύμφωνα με την συνάρτηση καταλληλότητας του.

Ο τροχός περιστρέφεται και το σημείο επιλογής δείχνει ποιο χρωμόσωμα επιλέγεται όταν ο τροχός σταματήσει. Είναι προφανές ότι το χρωμόσωμα με μεγαλύτερα fitness θα επιλεγεί περισσότερες φορές (ανταγωνίζονται κανόνας στην εξελικτική θεωρία).

Ο χειριστής επιλέγει τυχαία crossover ζεύγη από το ενδιάμεσο πληθυσμό και εκτελεί 1-σημείο διασταύρωσης. Τα γονίδια από γονέα χρωμοσώματα επιλέγονται για τη δημιουργία νέων απογόνους.

Τέλος, τα άτομα τα μεταλλαγμένα και αποτελούν το νέο πληθυσμό. Οι προλαμβάνει μετάλλαξη υπάγονται όλες τις λύσεις του πληθυσμού σε ένα τοπικό βέλτιστο του προβλήματος που λύνεται. Μερικά τυχαία επιλεγμένα κομμάτια σε λειτουργία 1-0 ή από 0 έως 1.

Μέσα από την εξέλιξη χρωμοσώματα », GA αναζητά την καλύτερη λύση (ες) με την έννοια της δοθείσας συνάρτησης καταλληλότητας. Απασχολούμε GA για να εκπαιδεύσει το περίπλοκο FSAM περιλαμβάνει πολλές παραμέτρους. Η λειτουργία καταλληλότητας είναι σχεδιασμένο με σκοπό να μειωθεί ο αριθμός των ασαφών κανόνων και επίσης να μειώσει την εκμάθηση σφάλμα κατά την ίδια στιγμή. Ο ακόλουθος τύπος προτείνεται: (17) όπου

m

είναι ο αριθμός των ασαφών κανόνων,

n

είναι ο αριθμός των δειγμάτων δεδομένων, και είναι ο όρος σφάλματος ορίζεται από την ακόλουθη εξίσωση 🙁 18) όπου

y

i

είναι η πραγματική αξία και

F

(

x

i

) είναι η έξοδος του FSAM. Οι παράμετροι της FSAM κωδικοποιούνται στα γονίδια των χρωμοσωμάτων GA /ιδιώτες.

You must be logged into post a comment.