PLoS One: Μια Συγκριτική Ανάλυση της γονιδιακής έκφρασης δεδομένων πολλαπλών τύπων του καρκίνου


Abstract

Μια συγκριτική μελέτη των δεδομένων του δημόσιου έκφρασης των γονιδίων των επτά τύπους καρκίνων (μαστού, κόλου, νεφρού, πνεύμονα, παγκρέατος, του προστάτη και καρκίνος του στομάχου) διεξήχθη με σκοπό να απορρέουν γονίδια δείκτες, μαζί με τα συνδεδεμένα οδούς, οι οποίες είναι είτε κοινά σε πολλούς τύπους καρκίνων ή ειδικά για επιμέρους καρκίνους. Τα αποτελέσματα της ανάλυσης δείχνουν ότι (α) κάθε ένα από τα επτά τύπους καρκίνου μπορούν να διακριθούν από τα αντίστοιχα ιστό ελέγχου με βάση τα πρότυπα έκφρασης ενός μικρού αριθμού γονιδίων, π.χ., 2, 3 ή 4? (Β) τα σχήματα έκφρασης ορισμένων γονιδίων μπορεί να διακρίνει πολλαπλούς τύπους καρκίνου από αντίστοιχους ιστούς ελέγχου τους, δυνητικά, ως γενικές δείκτες για το σύνολο ή ορισμένες ομάδες καρκίνων? (Γ) οι πρωτεΐνες που κωδικοποιούνται από ορισμένα από αυτά τα γονίδια αναμένεται να είναι εκκριτικό αίμα, παρέχοντας έτσι εν δυνάμει δείκτες καρκίνου στο αίμα? (Δ) οι αριθμοί των διαφορικά εκφραζόμενων γονιδίων σε διάφορους τύπους καρκίνου σε σύγκριση με τους ιστούς του ελέγχου τους συσχετίζονται καλά με τα ποσοστά πενταετούς επιβίωσης που συνδέονται με τις μεμονωμένες καρκίνους? και (ε) μερικές μεταβολικές και οδών σηματοδότησης είναι ασυνήθιστα ενεργοποιηθεί ή να απενεργοποιηθεί σε όλους τους τύπους καρκίνου, ενώ άλλες οδοί είναι πιο ειδικά για ορισμένες μορφές καρκίνου ή ομάδες καρκίνων. Τα νέα ευρήματα αυτής της μελέτης προσφέρουν σημαντική γνώση σε αυτούς τους επτά τύπους καρκίνου και έχουν τη δυνατότητα να παρέχουν συναρπαστικές νέες κατευθύνσεις για διαγνωστικούς και θεραπευτικούς ανάπτυξη

Παράθεση:. Xu K, Cui J, γερο-V, Yang Q, Puett D, Xu Y (2010) Συγκριτική Ανάλυση της γονιδιακής έκφρασης δεδομένων πολλαπλών τύπων του καρκίνου. PLoS ONE 5 (10): e13696. doi: 10.1371 /journal.pone.0013696

Συντάκτης: Vladimir Brusic, Dana-Farber Cancer Institute, Ηνωμένες Πολιτείες της Αμερικής

Ελήφθη: 22 Ιουλίου του 2010? Αποδεκτές: 4, Οκτωβρίου 2010? Δημοσιεύθηκε: 27 του Οκτώβρη 2010

Copyright: © 2010 Xu et al. Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της άδειας χρήσης Creative Commons Attribution, το οποίο επιτρέπει απεριόριστη χρήση, τη διανομή και την αναπαραγωγή σε οποιοδήποτε μέσο, ​​με την προϋπόθεση το αρχικό συγγραφέα και την πηγή πιστώνονται

Χρηματοδότηση:. Αυτή η μελέτη υποστηρίχθηκε εν μέρει από το Εθνικό Ίδρυμα Επιστημών (DBI-0354771, ITR-IIS-0407204, CCF-0621700, DBI-0542119), τα Εθνικά Ινστιτούτα Υγείας (1R01GM075331), ένα «Διακεκριμένοι Μελετητή» επιχορήγηση από την Γεωργία Συνασπισμό του Καρκίνου, και αρχική χρηματοδότηση από το Πανεπιστήμιο της Γεωργίας. Οι χρηματοδότες δεν είχε κανένα ρόλο στο σχεδιασμό της μελέτης, τη συλλογή και ανάλυση των δεδομένων, η απόφαση για τη δημοσίευση, ή την προετοιμασία του χειρογράφου

Αντικρουόμενα συμφέροντα:.. Οι συγγραφείς έχουν δηλώσει ότι δεν υπάρχουν ανταγωνιστικά συμφέροντα

Εισαγωγή

Ο καρκίνος είναι μια βασική απειλή για την υγεία και τη ζωή των ανθρώπων, που αντιπροσωπεύουν περίπου 13% όλων των θανάτων που προκαλούν ασθένειες στον κόσμο [1]. Το 2007, 7,6 εκατομμύρια άνθρωποι πέθαναν από καρκίνο παγκοσμίως. Στην Η.Π.Α., πάνω από 1,4 εκατομμύρια νέα κρούσματα καρκίνου έχουν αναφερθεί κάθε χρόνο τα τελευταία χρόνια, και ο καρκίνος γίνεται η δεύτερη συχνότερη αιτία θανάτου μετά από καρδιακή νόσο. Στατιστικά στοιχεία από τις εκθέσεις SEER δείχνουν ότι το ποσοστό θνησιμότητας σε όλους τους τύπους καρκίνου στις ΗΠΑ αυξήθηκε από 195,4 ανά 100.000 περιπτώσεις το 1950, συνέχισε την ανοδική τάση μέχρι το 1978 φθάνοντας 204,4, και στη συνέχεια σταδιακά μειώθηκε σε 184,0 το 2005 [2]. Αυτή η πτωτική τάση οφείλεται κυρίως στις βελτιωμένες διαγνωστικές τεχνικές για την ανίχνευση της πρώιμο στάδιο του καρκίνου. στατιστικές Γενική επιβίωση του καρκίνου υποδηλώνουν ότι η έγκαιρη διάγνωση και θεραπεία είναι το κλειδί για την επιβίωση πλέον σε όλους τους τύπους καρκίνου.

Προκλήσεις σε έγκαιρη ανίχνευση του καρκίνου προκύπτουν κυρίως από την πραγματικότητα ότι οι περισσότεροι ασθενείς είναι ασυμπτωματικοί στα αρχικά στάδια του καρκίνου, και μόνο λίγες αποτελεσματικές δοκιμές καρκίνου του προσυμπτωματικού ελέγχου είναι κλινικά διαθέσιμες. Ενώ μερικές δοκιμές έχουν αποδείξει ότι είναι αποτελεσματικά για την ανίχνευση του καρκίνου σε πρώιμο στάδιο, είναι συχνά πολύ επεμβατικές, όπως κολονοσκόπηση, που πρέπει να χρησιμοποιείται σαν ρουτίνα κατά τη διάρκεια της τακτικής physicals και επί του παρόντος περιορίζεται σε μόνο ένα μικρό αριθμό τύπων καρκίνου. Συχνά ο καρκίνος είναι ήδη σε προχωρημένο στάδιο, όταν η διάγνωση? Σαφώς, οι πιο αποτελεσματικές τεχνικές για την έγκαιρη ανίχνευση του καρκίνου χρειάζεται.

Έχει προταθεί ένας αριθμός γενετικών δεικτών για διάφορους καρκίνους, όπως BRCA1 και BRCA2 για τον καρκίνο του μαστού και Cdh1 για καρκίνο του στομάχου. Επιπλέον, ένας αριθμός πολλά υποσχόμενων δείκτες ορού για τον καρκίνο έχουν χρησιμοποιηθεί κλινικά. Μεταξύ αυτών, η PSA (ειδικό προστατικό αντιγόνο) είναι η πιο καλά γνωστή και έχει χρησιμοποιηθεί ευρέως για τη διάγνωση του καρκίνου του προστάτη μέσω εξετάσεων αίματος [3]. Ωστόσο, η αποτελεσματικότητα της ανίχνευσης είναι μακριά από επαρκής, ευρέως θεωρείται ότι έχει ποσοστό ψευδώς θετικών που είναι πάρα πολύ υψηλό για να είναι ένας αξιόπιστος δείκτης του καρκίνου [4]. Παρόμοιες παρατηρήσεις έχουν γίνει για τους άλλους δείκτες του ορού, όπως CA125 για τον καρκίνο των ωοθηκών [5].

Εδώ παρουσιάζουμε μια υπολογιστική μελέτη για την πρόβλεψη των δύο γενετικών και στον ορό δεικτών για επτά τύπους καρκίνου, με βάση δημόσια γονίδιο- μικροσυστοιχιών στοιχεία έκφρασης και ένα πρόγραμμα υπολογιστή για την πρόβλεψη του αίματος-εκκριτικών πρωτεϊνών [6]. Σε σύγκριση με προηγούμενες μελέτες για την ταυτοποίηση δείκτη του καρκίνου, συμπεριλαμβανομένης της μετα-αναλύσεις σχετικά με multi-τύπων καρκίνων [7], η παρούσα μελέτη έχει τα ακόλουθα μοναδικά χαρακτηριστικά: (i) την εστίαση στην ταυτοποίηση των δεικτών πολλαπλών γονιδίων μέσω εξαντλητική ανάλυση όλων των πιθανών συνδυασμούς γονιδίων, να επωφεληθούν πλήρως από τη διαθέσιμη ισχύ υψηλού επιπέδου πληροφορικής, αντί να χρησιμοποιούν ευρετική προσεγγίσεις που μπορεί να μην βρείτε κατ ‘ανάγκη τις βέλτιστες δείκτες? (Ii) μια προσπάθεια να βρουν δείκτες για τις ομάδες των καρκίνων πέραν εκείνων για τις μεμονωμένες καρκίνους? (Iii) μια προσπάθεια να συνδέσει τις πληροφορίες που προέρχονται από transcriptomic δεδομένων των ιστών με την πρόβλεψη δείκτη στον ορό με τη χρήση του νέου προγράμματος πρόβλεψης [6]? και (iv) προσδιορισμός των οδών που είναι ασυνήθιστα ρυθμίζονται, είτε κοινή σε πολλούς τύπους καρκίνου ή ειδικά για συγκεκριμένους τύπους καρκίνου. Πιστεύουμε ότι αυτά τα νέα δεδομένα θα αποδειχθεί ιδιαίτερα πολύτιμη για τη διευκρίνιση των γενετικών αλλοιώσεων σε διάφορες μορφές καρκίνου, καθώς και να προσφέρει δυναμικό κατευθύνσεις για νέες προσεγγίσεις στη διαγνωστική και θεραπευτική.

Υλικά και Μέθοδοι

1. δεδομένα γονιδιακής έκφρασης μικροσυστοιχιών για ανθρώπινους καρκίνους

είχαν κατεβάσει τα δεδομένα γονιδιακής έκφρασης μικροσυστοιχιών για επτά τύπους καρκίνου, δηλαδή, του μαστού, του παχέος εντέρου, του νεφρού, του πνεύμονα, του παγκρέατος, του προστάτη και του καρκίνου του στομάχου από τη βάση δεδομένων GEO NCBI του [8]. Για να διασφαλιστεί ότι τα αποτελέσματα πρόβλεψης μας μπορεί να γενικευθεί σε διαφορετικά σύνολα δεδομένων, δύο ανεξάρτητα σύνολα δοκιμής χρησιμοποιήθηκαν για την αξιολόγηση της ανθεκτικότητας των προβλεπόμενων δεικτών γονιδίου που λαμβάνεται από το σύνολο εκπαίδευσης. Λεπτομερείς πληροφορίες των δεδομένων που παρατίθενται στον Πίνακα S1. Σε αυτή τη μελέτη, έχουμε επιλέξει τη μεγαλύτερη διαθέσιμη σύνολα δεδομένων μικροσυστοιχιών από κάθε έναν από τους επτά τύπους καρκίνου, όπου κάθε σύνολο δεδομένων περιλαμβάνει τις (κανονικοποιημένη) επίπεδα γονιδιακής έκφρασης του κάθε γονιδίου και στα δύο του καρκίνου και τον έλεγχο των ιστών του κάθε ασθενή, μαζί με τις πληροφορίες σκηνή για η πλειονότητα των δειγμάτων καρκίνου (ορισμένα από τα δεδομένα δεν έχουν αυτή την πληροφορία). Σημειώστε ότι όλα τα σύνολα δεδομένων που χρησιμοποιούνται μικροσυστοιχιών κανονικοποιούνται χρησιμοποιώντας RMA, η οποία έχει αναφερθεί ότι είναι πιο ακριβή από αντανακλαστική βιολογικές αλλαγές σε σύγκριση με άλλες μεθόδους, όπως MAS5 (Affymetrix). Οι κατανομές των πολλαπλών μεταβολών (FC) των μεμονωμένων γονιδίων σε όλους γονιδίων μεταξύ του καρκίνου και των αντίστοιχων ιστών ελέγχου για τα επτά τύπους καρκίνων ελέγχθηκαν και βρέθηκαν να είναι πολύ παρόμοιες. Σχήμα S1 δείχνει μία τέτοια σύγκριση των κατανομών FC μεταξύ καρκίνου του μαστού και του καρκίνου του πνεύμονα? ως εκ τούτου, πιστεύουμε ότι οι συγκρίσεις των πολλαπλών μεταβολών σε διάφορα σύνολα δεδομένων καρκίνο στη μελέτη μας είναι ουσιαστική.

2. Ταυτοποίηση διαφορικά εκφραζόμενων γονιδίων

Για σύνολα δεδομένων με μη ζευγαρωμένα καρκίνο και ελέγχου δείγματα από τους ίδιους ασθενείς, Mann-Whitney test εφαρμόστηκε για την ταυτοποίηση γονιδίων που εκφράζονται διαφορικά σε καρκινικά

έναντι δειγμάτων ελέγχου

. Για εκείνα τα σύνολα δεδομένων με συζευγμένες πληροφορίες η δοκιμή έχει ως εξής: Λόγω της υπόθεσης ότι ένα συγκεκριμένο γονίδιο δεν εκφράζεται διαφορικά σε καρκίνο

έναντι

η ομάδα ελέγχου, η απόρριψη αυτής της υπόθεσης σημαίνει ότι το γονίδιο εκφράζεται διαφορικά σε καρκίνο . Αφήνω και, είναι τα επίπεδα έκφρασης του γονιδίου για τον έλεγχο και τον καρκίνο των ιστών του

i

-ου ασθενούς,

i = 1 … m

, και

m

είναι ο αριθμός των ασθενών . Είναι προφανές ότι, αν η υπόθεση είναι αληθινή, τότε η πιθανότητα = = 0.5, υποθέτοντας έκφραση του γονιδίου είναι μια συνεχής τυχαία μεταβλητή. Ας

K

είναι ο αριθμός των ασθενών με, τότε η τυχαία μεταβλητή

K /m

ακολουθεί περίπου κανονική κατανομή (σύμφωνα με το Κεντρικό Οριακό Θεώρημα ή de Moivre-Laplace Θεώρημα) με μέση τιμή = 0,5 και τυπική απόκλιση =, ή ακολουθεί μια κανονική κατανομή

Ν

(0,1). Έτσι, η

σ

-τιμή μπορεί να εκτιμηθεί ως

P

(

X

& gt?), Όπου ο αριθμός των ασθενών που ικανοποιεί. Σε γενικές γραμμές, θεωρούμε ένα γονίδιο που εκφράζεται διαφορικά εάν η στατιστική σημασία,

σ

-τιμή, είναι μικρότερη από 0,05 και πολλαπλή μεταβολή του είναι τουλάχιστον 2.

3. Πρόβλεψη του αίματος εκκρινόμενων πρωτεϊνών

Όλα τα γονίδια προβλέπεται να εκφράζονται διαφορικά μεταξύ καρκίνου και τα αντίστοιχα δείγματα ελέγχου αναλύθηκαν για να προβλέψει εάν πρωτεΐνες τους είναι αίμα-εκκριτικά, χρησιμοποιώντας ένα πρόγραμμα που αναπτύχθηκε πρόσφατα η ομάδα μας [6]. Η βασική ιδέα του αλγορίθμου είναι να εκπαιδεύσει ένα διάνυσμα υποστήριξης μηχανής (SVM) -με βάση ταξινομητής για τη διάκριση μεταξύ του αίματος-εκκριτικές πρωτεΐνες και πρωτεΐνες που δεν εκκρίνονται, χρησιμοποιώντας διάφορα χαρακτηριστικά αλληλουχία που βασίζονται όπως πεπτίδια σήματος, διαμεμβρανικές περιοχές, θέσεις γλυκοζυλίωσης και τα μέτρα πολικότητα. Σε ένα μεγάλο ανεξάρτητο σύνολο δοκιμής που περιέχει 105 εκκριτικών πρωτεϊνών και 7.258 μη-εκκριτικών πρωτεϊνών του ανθρώπου, ο ταξινομητής επιτυγχάνεται περίπου 94% ευαισθησία πρόβλεψη και ~ 98% ειδικότητα πρόβλεψη.

4. Πρόβλεψη των γονιδίων σήμανσης για κάθε τύπο καρκίνου

Για κάθε

k

-γονίδιο συνδυασμό από τα διαφορικά εκφρασμένων γονιδίων που ορίζονται στην παραπάνω ενότητα, ένα SVM-based ταξινομητή είχε εκπαιδευτεί για να επιτευχθεί η υψηλότερη δυνατή ακρίβεια ταξινόμησης που ορίζονται aswhere

TP

και

NP

είναι οι αριθμοί της πραγματικής θετικά και τα αρνητικά, αντίστοιχα, και

Ν

είναι ο συνολικός αριθμός των δειγμάτων. Μια γραμμική συνάρτηση πυρήνα χρησιμοποιήθηκαν για την κατάρτιση μέσω LIBSVM [9]. Για κάθε τύπο καρκίνου, όλοι οι δείκτες ταξινομήθηκαν σύμφωνα με την 5-πλάσια απόδοση διασταυρωμένης επικύρωσης για το σύνολο δεδομένων εκπαίδευσης. Για να βρούμε τους δείκτες που είναι γενικευμένες και σε άλλα σύνολα δεδομένων, ελέγξαμε τις προβλεπόμενες δείκτες γονίδιο σε δύο ανεξάρτητα σύνολα δεδομένων δοκιμής.

5. Πρόβλεψη των δεικτών για πολλούς τύπους καρκίνου

Για την αναγνώριση

k

-γονίδιο διευκρινιστές για πολλούς τύπους καρκίνου, θεωρήθηκαν όλα τα γονίδια που εμφανίζουν σταθερά απόκλιση εκφράσεις σε τουλάχιστον δύο τύπους καρκίνου. Για κάθε

k

-γονίδιο συνδυασμό μεταξύ αυτών των γονιδίων, ακρίβεια ταξινόμησης του ανάμεσα σε κάθε τύπο καρκίνου και των αντίστοιχων ιστών έλεγχο υπολογίστηκε. Στη συνέχεια, το

k

-γονίδιο συνδυασμούς παρουσιάζουν απαιτητικό ισχύος σε πολλούς τύπους καρκίνου προσδιορίστηκαν. Τα κορυφαία διευκρινιστές για τους τύπους πολλαπλών καρκίνου επιλέχθηκαν με τη χρήση ενός σταθερού cut-off στην ακρίβεια ταξινόμησης. Σε όλο το υπόλοιπο αυτού του εγγράφου,

k

-γονίδιο ομάδες αναφέρονται σε συνδυασμούς

k

-genes για k = 1, 2, 3, 4, εκτός αν αναφέρεται διαφορετικά.

6. ανάλυση εμπλουτισμό μονοπάτι των διαφορικά εκφρασμένων γονιδίων

Λειτουργική ανάλυση και ανάλυση εμπλουτισμό της οδού διεξήχθησαν χρησιμοποιώντας DAVID [10], όταν οι πληροφορίες μονοπάτι βασίζεται στο σχολιασμό από KEGG, BBID και BIOCARTA. Ένα

σ

-τιμή & lt? 0,05 χρησιμοποιήθηκε για να εγγυηθούν το επίπεδο σημαντικότητας ενός εμπλουτισμένου οδού

Αποτελέσματα

Αυτή η μελέτη επικεντρώνεται σε επτά από τις πιο διαδεδομένες μορφές καρκίνου σε. ο κόσμος, οι οποίες έχουν επίσης μεγάλα σύνολα δεδομένων μικροσυστοιχιών γονιδιακής έκφρασης διαθέσιμη στο δημόσιο τομέα, που συλλέγονται σε κλίμακα γονιδιώματος από τους ιστούς του κάθε τύπου καρκίνου, καθώς και από τις αντίστοιχες noncancerous ιστούς ελέγχου. Δουλεύοντας σε πολλαπλούς τύπους καρκίνου του ταυτόχρονα, μπορούμε να αντλήσουμε δυναμικό δείκτες είτε ειδικά για μεμονωμένους τύπους καρκίνου ή γενικά σε όλες ή ομάδες των καρκίνων, καθώς και για τον εντοπισμό ασυνήθιστα ενεργοποιηθεί ή να απενεργοποιηθεί οδών.

1. Προβλεπόμενη γονίδια-δείκτες για τους επιμέρους τύπους καρκίνου

Έχουμε ψάξει για μεμονωμένα γονίδια και συνδυασμούς γονιδίων των οποίων τα πρότυπα έκφρασης μπορεί καλύτερα τη διάκριση μεταξύ του καρκίνου και των γύρω ιστών ελέγχου για κάθε τύπους καρκίνου. Συγκεκριμένα, όλοι οι συνδυασμοί 1-, 2-, 3- και 4-γονίδιο που κωδικοποιείται στο ανθρώπινο γονιδίωμα κατατάχθηκαν σε όρους απαιτητικό δύναμη τους στη διάκριση των δειγμάτων καρκίνου από τα αντίστοιχα δείγματα ελέγχου για κάθε τύπο καρκίνου. Επιπλέον, έχουμε επίσης κατετάγη

k

-γονίδιο συνδυασμούς, με βάση την απαιτητικό δύναμή τους από τις αρχές του δείγματα καρκίνου και δείγματα ελέγχου, εφόσον είναι διαθέσιμα και αρκετά μεγάλα τα σχετικά δεδομένα.

Α. Ο καρκίνος του μαστού.

Η ανάλυση έγινε σε ένα σύνολο δεδομένων γονιδιακής έκφρασης που αποτελείται από 43 ζεύγη καρκίνου του μαστού και καρκίνου των παρακείμενων ιστών ελέγχου από τους ίδιους ασθενείς [11]. Από τα 43 δείγματα, 32 ήταν καρκίνοι πρώιμου σταδίου (στάδια Ι και II). 294 γονίδια βρέθηκαν να εκφράζονται σταθερά και ασυνήθιστα με τουλάχιστον 2-φορές μεταβολή στην έκφραση τους σε όλη την καρκίνου και των ιστών ελέγχου, 81 από τις οποίες ρυθμίζεται πάνω και 213 ήταν ρυθμισμένα προς τα κάτω στους ιστούς του καρκίνου. Μεταξύ των διαφορικά εκφρασμένων γονιδίων, 69 από κωδικοποιημένων πρωτεϊνών τους προβλέπονται να είναι εκκριτική αίμα με πρόγραμμα πρόβλεψης μας [6], και θα μπορούσε έτσι να χρησιμεύσει ως πιθανοί βιοδείκτες ορού (Συμπληρωματικό S1 Πληροφορίες αρχείων).

ανάλυση ταξινόμησης ήταν τότε διεξαχθεί (βλέπε Υλικά και Μέθοδοι), με στόχο τον προσδιορισμό

k

-γονίδιο συνδυασμοί των οποίων τα πρότυπα έκφρασης μπορούν με ακρίβεια διάκριση μεταξύ του καρκίνου και των δειγμάτων ελέγχου. Σχήμα 1 (Α) και (Δ) δείχνουν οι ακρίβειες ταξινόμησης των καλύτερων 100

k

-γονίδιο συνδυασμούς για το σύνολο εκπαίδευσης και το σύνολο εκπαίδευσης που περιέχει μόνο δείγματα πρώιμο στάδιο, αντίστοιχα. Δύο ανεξάρτητα σύνολα αξιολόγησης για την εκτίμηση της γενικότητας των προσδιορισμένων δεικτών γονίδιο, το οποίο αποτελείται από 31 και 68 του καρκίνου του μαστού, και 27 και 61 δείγματα ελέγχου [12], αντίστοιχα. Το Σχήμα 1 (Β) και (C) δείχνουν την απόδοση ταξινόμησης από το εκπαιδευμένο ταξινομητές για τα δύο σύνολα αξιολόγησης. Ο αναλυτικός κατάλογος αυτών των 100

k

-γονίδιο συνδυασμούς δίνεται στο Suppplementary Πληροφορίες S1

Για κάθε πίνακα, ο άξονας Χ είναι η λίστα των 100

k

. – γονιδιακοί δείκτες κατά την απόδοση κατάταξη τους στις σύνολα δεδομένων εκπαίδευσης, και ο y-άξονας αντιπροσωπεύει την ακρίβεια ταξινόμησης. (Α) ακρίβειες ταξινόμησης από την κορυφή 100

k

-γονίδιο συνδυασμούς μεταξύ καρκίνου του μαστού και των δειγμάτων αναφοράς στο σύνολο εκπαίδευσης, και (Β) και (Γ) για τις δύο σειρές δοκιμών? (D) ακρίβειες ταξινόμησης από κορυφαία 100

k

-γονίδιο συνδυασμούς μεταξύ πρώιμο καρκίνο του μαστού και τα αντίστοιχα δείγματα αναφοράς στο σύνολο της κατάρτισης και (Ε) για το σύνολο ελέγχου.

Η

Όπως φαίνεται στο Σχήμα 1, το μεγαλύτερο μέρος της κορυφής

k

-γονίδιο συνδυασμούς, ιδιαίτερα για

k

& gt? 1, αποδίδει καλά τόσο την κατάρτιση και τα ανεξάρτητα σύνολα δοκιμής με συνολική ακρίβεια καλύτερη από το 85% αν και τους κατάταξη παραγγελίες για τα δύο σύνολα δεδομένων δεν μπορεί να είναι καλά διατηρημένα. Οι διακυμάνσεις στην ακρίβειες κατάταξη τους πιστεύεται ότι οφείλεται στο μικρό μέγεθος των δεδομένων εκπαίδευσης. Παρόμοιες παρατηρήσεις έγιναν σε όλες τις προβλεπόμενες κορυφή δείκτες στους επτά τύπους καρκίνου.

Οι καλύτερες τρία μονά διευκρινιστές γονίδιο είναι PCOLCE2, ANGPTL4 και LEP, με 88,4%, 88,4% και 87,2% ακρίβεια ταξινόμησης στο σύνολο εκπαίδευσης και 94,8% και 84,1%, 84,5% και 79. 5% και 96,6% και 96,1% για τα δύο σύνολα δοκιμών, αντίστοιχα. Οι τρεις πρώτες 2-, 3- και 4-γονιδίου συνδυασμοί είναι {TACSTD2 + CHRDL1, TACSTD2 + CAV1, PPARG + TMEM97}, {RRM2 + COL1A1 + PPARG, RRM2 + COL1A1 + PCOLCE2, RRM2 + GPR109B + SPINT2} και { RRM2 + COL1A1 + GPR109B + SPINT2, RRM2 + GPR109B + INHBA + SPINT2, TACSTD2 + IGFBP6 + IGF1 + TF}, αντίστοιχα. Ομοίως, για πρώιμο καρκίνο του μαστού, τα τρία καλύτερα

k

-γονίδιο διευκρινιστές είναι {GPR109B, PCOLCE2, PCSK5}, {PCSK5 + COL10A1, FERMT2 + SPINT2, MAOA + IGJ}, {COL1A1 + PCSK5 + TF, GPX3 + COL1A1 + SPINT2, GPX3 + FAP + TMEM97} και {RRM2 + COL1A1 + GPR109B + IGJ, RRM2 + COL1A1 + GPR109B + IGJ, RRM2 + COL1A1 + GPR109B + SPINT2}, αντίστοιχα.

Αν και η τρεις καλύτερες διευκρινιστές αντιπροσωπεύουν νέες ανακαλύψεις, έχουμε παρατηρήσει ορισμένες χαμηλότερη κατάταξη γονίδια έχουν εξεταστεί όσο το δυνατόν δείκτες καρκίνου του μαστού από προηγούμενες μελέτες. Για παράδειγμα, ADIPOQ (αντιπονεκτίνης) βρέθηκε να συνδέεται στενά με τον κίνδυνο καρκίνου του μαστού [13]. Η SPINT2, ένας αναστολέας του ενεργοποιητή HGF, αναφέρθηκε ότι έχουν υψηλότερα επίπεδα έκφρασης σε πρώιμο στάδιο καρκίνου του μαστού και συνδέεται με κακή πρόγνωση [14], σύμφωνα με τα ευρήματα μας. Μερικά άλλους που εμπλέκονται στις δραστηριότητες των καρκινικών κυττάρων σε γενικές γραμμές. Για παράδειγμα, CAV1, κάτω-ρυθμίζονται στα δείγματα καρκίνου, βρέθηκε να αναστέλλουν την ανάπτυξη του καρκίνου του μαστού και τη μετάσταση [15]? η προς τα κάτω ρύθμιση PPARG συνδέεται με τοπική υποτροπή και μετάσταση στον καρκίνο του μαστού [16]? και ANGPTL4 μπορεί να δρα ως ρυθμιστής της αγγειογένεσης [17]. Στην καλύτερη δυνατή γνώση μας, όλα τα 2-, 3- και 4-γονιδίου διευκρινιστές αντιπροσωπεύουν νέες ανακαλύψεις.

Παρόμοιες αναλύσεις έχουν διεξαχθεί σε έξι άλλους τύπους καρκίνου. Τα βασικά συμπεράσματα για κάθε μία από αυτές τις έξι τύπους καρκίνου που επισημαίνονται παρακάτω, με την περίληψη που δίνονται στον Πίνακα S2 και τα ονόματα των γονιδίων που περιλαμβάνονται στο Συμπληρωματικό S1 Πληροφορίες αρχείου. Επιπλέον, οι συμπληρωματικές πληροφορίες αρχείου S2 δείχνουν οι ακρίβειες ταξινόμησης από τα καλύτερα 100

k

-γονίδιο διευκρινιστές τόσο για την κατάρτιση και τα σύνολα δοκιμών για κάθε τύπο καρκίνου, αντίστοιχα.

Β. Καρκίνος του παχέος εντέρου.

Η ανάλυσή μας έγινε σε ένα σύνολο δεδομένων μικροσυστοιχίας που αποτελείται από 53 καρκίνου του παχέος εντέρου και του καρκίνου του 28-γειτονικούς ιστούς ελέγχου από τους ίδιους τους ασθενείς (μερικά από τα δείγματα δεν έχουν καρκίνο δείγματα αναφοράς) [18]. 247 γονίδια βρέθηκαν να είναι σταθερά και ασυνήθιστα εκφράζεται με τουλάχιστον 2-φορές μεταβολή στην έκφραση τους σε όλη την καρκίνου και των ιστών ελέγχου σε δεδομένα εκπαίδευσης μας, 56 από τα οποία ρυθμίζονται up-και 191 ρυθμίζονται προς τα κάτω στο παχύ έντερο καρκινικούς ιστούς . Δύο ανεξάρτητοι σετ δοκιμών, που αποτελείται από 24 και 22 καρκίνο του παχέος εντέρου και 24 και 20 δείγματα του ελέγχου του καρκίνου γειτονικά από τους ίδιους ασθενείς [19], αντίστοιχα, χρησιμοποιήθηκαν για την εκτίμηση της γενικότητας των προβλεπόμενων δεικτών.

Βρήκαμε οι τρεις καλύτερες διευκρινιστές μονού γονιδίου για τον καρκίνο του παχέος εντέρου είναι ΜΜΡ7, DPT και MMP1 με 97,5%, 96,3% και 95,1% ακρίβεια ταξινόμησης στο σύνολο εκπαίδευσης, και το 97,9% και 90,9%, 97,9% και 74,6%, και 91,7% και 84,1 % για τα δύο σύνολα δοκιμών, αντίστοιχα. Οι τρεις πρώτες διευκρινιστές 2-γονιδίου είναι SLIT3 + ΜΜΡ7, MATN2 + ΜΜΡ7, και ΜΜΡ7 + PTGS1. Μερικά από τα κορυφαία διευκρινιστές μας έχουν προηγουμένως μελετηθεί στο πλαίσιο του καρκίνου του παχέος εντέρου. Για παράδειγμα, ΜΜΡ1 είναι ένα παράγοντας εισβολή προαγωγής, και προς τα πάνω ρύθμιση του, όπως παρατηρείται στα δεδομένα μας, συνδέεται με την ικανότητα εισβολής του καρκίνου [20]. ΜΜΡ7 είναι γνωστό ότι παίζουν σημαντικό ρόλο στην ανάπτυξη του καρκίνου, και up-ρύθμιση του θα μπορούσε να είναι ένας βασικός μηχανισμός για τη διαφυγή των καρκινικών κυττάρων »από το ανοσοποιητικό επιτήρησης [21].

C. καρκίνου του νεφρού.

Η ανάλυση πραγματοποιήθηκε σε ένα σύνολο δεδομένων μικροσυστοιχία έκφρασης των γονιδίων που αποτελείται από 49 καρκίνο του νεφρού και 23 δείγματα ιστού του ελέγχου του καρκίνου γειτονικά από τους ίδιους ασθενείς [22]. 231 γονίδια βρέθηκαν να εκφράζονται σταθερά και ασυνήθιστα με τουλάχιστον 2-φορές μεταβολή στην έκφραση τους σε όλη του καρκίνου και ελέγχου των ιστών σε δεδομένα εκπαίδευσης μας, 129 από τα οποία είναι ρυθμισμένα προς τα πάνω και 102 ρυθμίζονται προς τα κάτω στον καρκίνο. Δύο ανεξάρτητοι σετ αξιολόγησης, που αποτελείται από 35 και 36 δείγματα καρκίνου του νεφρού και 12 και 9 δείγματα ελέγχου του καρκίνου γειτονικά από τους ίδιους τους ασθενείς, αντίστοιχα, χρησιμοποιήθηκαν για την εκτίμηση της γενικότητας των προβλεπόμενων δεικτών [23], [24]. Οι τρεις καλύτερες ενιαίο διευκρινιστές γονίδιο βρέθηκε να είναι UMOD, ACPP και CCL18 για τον καρκίνο του νεφρού, που έχει την ίδια ακρίβεια ταξινόμησης, 98,6% για το σύνολο εκπαίδευσης και 100% και 94,4%, 95,7% και το 86,11% και το 89,4% και 68,1% για τα δύο σύνολα δοκιμών, αντίστοιχα. Οι τρεις κορυφαίοι συνδυασμοί 2-γονιδίου είναι EGF + ALB, ACPP + UMOD, και UMOD + ALB. Μεταξύ των κορυφαίων διακρίσεως, UMOD έχει αναφερθεί ότι σχετίζεται με νεφρική νόσο. [25] SERPINA5, ρυθμισμένα προς τα κάτω στον καρκίνο, ρυθμίζει την επιθετική πιθανότητα ανάπτυξης καρκίνου του νεφρού και εισβολή. Άλλα κορυφαία διευκρινιστές αντιπροσωπεύουν νέες ανακαλύψεις. Για παράδειγμα, AFM δεν έχει αναφερθεί ότι σχετίζεται με τον καρκίνο, και C6orf155 δεν έχει χαρακτηριζόμενη λειτουργία.

D. Ο καρκίνος του πνεύμονα.

Η ανάλυση έγινε σε ένα σύνολο δεδομένων μικροσυστοιχίας που αποτελείται από 58 πνευμονικού ιστού καρκίνου και 49 δειγμάτων ιστού του ελέγχου του καρκίνου γειτονικά από τους ίδιους ασθενείς [26]. 683 γονίδια βρέθηκαν να εκφράζονται σταθερά και ασυνήθιστα με τουλάχιστον 2-φορές μεταβολή στην έκφραση τους σε όλη του καρκίνου και ελέγχου των ιστών σε δεδομένα εκπαίδευσης μας, 255 από τα οποία είναι ρυθμισμένα προς τα πάνω και 428 ρυθμίζονται προς τα κάτω σε ιστούς καρκίνου του πνεύμονα. Δύο ανεξάρτητα σύνολα, που αποτελείται από 27 και 20 του καρκίνου του πνεύμονα και 27 και 19 δείγματα ελέγχου του καρκίνου γειτονικά από τους ίδιους ασθενείς [27], χρησιμοποιήθηκε για την εκτίμηση της γενικότητας των προβλεπόμενων δεικτών.

Ο καλύτερος τρία μόνο γονίδιο διευκρινιστές είναι CAV1, SFTPC και VWF για τον καρκίνο του πνεύμονα, που έχουν την ίδια ακρίβεια ταξινόμησης, 99,1% για το σύνολο εκπαίδευσης και το 98,2% και 100%, 96,3% και 82,5%, και 88,9% και 100% για τα δύο σύνολα δοκιμής, αντίστοιχα. Οι τρεις κορυφαίοι συνδυασμοί 2-γονιδίου είναι FERMT2 + GREM1, ΤΕΚ + NFASC, CAV1 + ΜΜΡ1. Μεταξύ των κορυφαίων διακρίσεως, CAV1 έχει βρεθεί να ρυθμίζεται προς τα κάτω στον καρκίνο του μαστού [28], και έχει αναφερθεί ότι σχετίζεται με μετάσταση στον καρκίνο του πνεύμονα [29]. SFTPC έχει αναφερθεί ότι συνδέεται με διάμεση πνευμονοπάθεια [30]. FAM107A, η οποία καταστέλλει την ανάπτυξη των κυττάρων, μπορεί να παίζει ένα ρόλο στην ανάπτυξη του καρκίνου [31]. Άλλα κορυφαία διευκρινιστές αντιπροσωπεύουν νέες παρατηρήσεις. Για παράδειγμα, TNXB, SPP1 και EMCN δεν έχουν προηγουμένως αναφερθεί ως σχετίζονται με τον καρκίνο.

Ε. Ο καρκίνος του παγκρέατος.

Η ανάλυση έγινε σε ένα σύνολο δεδομένων μικροσυστοιχιών που αποτελείται από 39 ζεύγη καρκίνου του παγκρέατος και δείγματα ιστών ελέγχου του καρκίνου, δίπλα από τους ίδιους τους ασθενείς [32]. 885 γονίδια βρέθηκαν να εκφράζονται σταθερά και ασυνήθιστα με τουλάχιστον 2-φορές μεταβολή στην έκφραση τους σε όλη του καρκίνου και ελέγχου των ιστών στα δεδομένα εκπαίδευσης, 616 εκ των οποίων ρυθμίζονται up-και 269 ρυθμίζονται προς τα κάτω σε καρκίνο του παγκρέατος. Δύο ανεξάρτητες ομάδες, που αποτελείται από 36 και 29 του παγκρέατος δείγματα καρκίνου και 16 και 5 δείγματα ελέγχου του καρκίνου, δίπλα από τους ίδιους τους ασθενείς [33], χρησιμοποιήθηκε για την αξιολόγηση της γενικότητας των προβλεπόμενων δεικτών.

Ο καλύτερος τρία μονά -γονίδιο διακρίσεως είναι KRT17, COL10A1 και CTHRC1 για τον καρκίνο του παγκρέατος, που έχει την ίδια ακρίβεια ταξινόμησης, 93,6% για το σύνολο εκπαίδευσης και το 88,5% και 80,4%, 84,6% και 73,2%, και 84,6% και 85,7% για τα δύο σύνολα δοκιμών, αντίστοιχα. Οι τρεις 2- και 3-γονιδίου top διευκρινιστές είναι {ΜΜΡ7 + AZGP1? ΜΜΡ7 + FGL1? ΜΜΡ7 + PLA2G1 Β} και {CTHRC1 + SGPP2 + CCL18? TNFRSF21 + EGFL6 + CTHRC1? COL10A1 + S100A6 + RSAD2}, αντίστοιχα. Μεταξύ των κορυφαίων διακρίσεως, KRT17 είναι γνωστό ότι εμπλέκεται στην επιδιόρθωση των ιστών [34]. AZGP1 έχει αναφερθεί ότι προκαλεί εκτεταμένη απώλεια του λίπους, που συχνά συνδέονται με προχωρημένους καρκίνους [35]. Άλλα κορυφαία διευκρινιστές αντιπροσωπεύουν νέα ευρήματα. Για παραδείγματα, RSAD2, που εμπλέκονται στην αντιιική άμυνα, δεν έχει αναφερθεί ότι έχουν σχέση με τον καρκίνο, καθώς και SGPP2, είναι γνωστό ότι εμπλέκονται σε προ-φλεγμονώδη σηματοδότηση [36], και CST4.

F. Ο καρκίνος του προστάτη.

Η ανάλυση έγινε σε ένα σύνολο δεδομένων μικροσυστοιχίας που αποτελείται από 65 καρκίνου του προστάτη και 63 δείγματα ιστού του ελέγχου του καρκίνου γειτονικά από τους ίδιους ασθενείς [37]. 118 γονίδια βρέθηκαν να εκφράζονται σταθερά και ασυνήθιστα με τουλάχιστον 2-φορές μεταβολή στην έκφραση τους σε όλη του καρκίνου και ελέγχου των ιστών σε δεδομένα εκπαίδευσης μας, εκ των οποίων 23 ρυθμίζονται up-και 95 ρυθμίζονται προς τα κάτω σε ιστούς καρκίνου του πνεύμονα. Δύο ανεξάρτητες ομάδες, που αποτελείται από 62 και 53 δείγματα καρκίνου του προστάτη και 47 και 14 δείγματα ελέγχου του καρκίνου, δίπλα από τους ίδιους τους ασθενείς [38], χρησιμοποιήθηκε για την αξιολόγηση της γενικότητας των προβλεπόμενων δεικτών.

Ο καλύτερος τρία μονά γονίδιο διακρίσεως είναι MYLK, PALLD και CAV1 για τον καρκίνο του προστάτη, που έχει 73,4%, 71,9% και 71,1% ακρίβεια ταξινόμησης στο σύνολο εκπαίδευσης και το 83,5% και 62,3%, 69,6% και 72,6%, και 94,2% και 75,5% για τα δύο τεστ θέτει, αντίστοιχα. Οι τρεις 2- και 3-γονιδίου top διευκρινιστές είναι {LTF + IGF1? LTF + SPARCL1? SMTN + CCK}, {SMTN + CCK + CCL2? SMTN + CCK + COMP? SMTN + CCK + PLA2G7}, αντίστοιχα. Μεταξύ των κορυφαίων διακρίσεως, LTF είναι γνωστό ότι αναστέλλει την ανάπτυξη των όγκων [39]. IGF1, ένας αυξητικός παράγοντας, παίζει ένα ρόλο στην ανάπτυξη του καρκίνου του προστάτη [40] και έχει αναφερθεί ως δείκτης του προχωρημένου καρκίνου του προστάτη [41]. Άλλα κορυφαία διευκρινιστές αντιπροσωπεύουν νέες ανακαλύψεις. Για παράδειγμα, CHRDL1 μπορεί να παίζει ένα ρόλο στη ρύθμιση της αγγειογένεσης [42], αλλά δεν έχει αναφερθεί ότι σχετίζεται με τον καρκίνο. Το ίδιο με SMTN.

G. καρκίνο του στομάχου.

Η ανάλυση έγινε σε ένα σύνολο δεδομένων μικροσυστοιχιών που αποτελείται από 89 καρκίνου του στομάχου και 23 καρκίνου παρακείμενους ιστούς έλεγχο από τους ίδιους τους ασθενείς [43]. Από τα δείγματα ιστού 89 του καρκίνου, 31 είναι καρκίνοι πρώιμου σταδίου. 311 γονίδια βρέθηκαν να εκφράζονται σταθερά και ασυνήθιστα με τουλάχιστον 2-φορές μεταβολή στην έκφραση τους σε όλη του καρκίνου και ελέγχου των ιστών σε δεδομένα εκπαίδευσης μας, 166 από τα οποία είναι ρυθμισμένα προς τα πάνω και 145 ρυθμίζονται προς τα κάτω σε ιστούς καρκίνου του πνεύμονα. Δύο ανεξάρτητα σύνολα, που αποτελείται από 38 και 16 δείγματα καρκίνου του στομάχου και 31 και 13 δείγματα ελέγχου του καρκίνου γειτονικά από τους ίδιους ασθενείς [44], [45] χρησιμοποιήθηκε για την αξιολόγηση της γενικότητας των προβλεπόμενων δεικτών, εκ των οποίων 12 είναι δείγματα πρώιμο στάδιο μερικώς σε συνδυασμό με 10 δείγματα ελέγχου.

Οι τρεις καλύτερες διευκρινιστές ενός μόνο γονιδίου είναι SERPINH1, BGN και COL12A1 για τον καρκίνο του στομάχου, έχοντας 99.1%, 98.2% και 98.2% ακρίβεια ταξινόμησης στο σύνολο εκπαίδευσης και το 94,2% και 96,7 %, 88,4% και 93,3%, και 84,1% και 75,8% για τα δύο σύνολα δοκιμών, αντίστοιχα. Οι τρεις κορυφαίοι συνδυασμοί 2-γονιδίου είναι CHGA + SERPINH1, TGFBI + CHGA και PGC + SERPINH1, αντίστοιχα. Για τον πρώιμο καρκίνο του στομάχου, οι τρεις καλύτερες

1

-γονίδιο διευκρινιστές είναι επίσης SERPINH1, BGN και COL12A1, αντίστοιχα. Μεταξύ των κορυφαίων διακρίσεως, BGN είναι γνωστό ότι έχει ένα ρόλο στον έλεγχο της ανάπτυξης των κυττάρων στον καρκίνο [46]. Η ανώμαλη έκφραση των CTHRC1, ένας ρυθμιστής της εναπόθεσης μήτρας, έχει ευρέως βρεθεί σε διάφορους στερεών καρκίνων και θεωρείται ότι σχετίζεται με την εισβολή καρκίνου και μετάσταση [34]. Ιδιαίτερου ενδιαφέροντος είναι ότι PGC έχει προταθεί ως δείκτης γαστρικού καρκίνου [47], και το επίπεδο των PGC ορού χρησιμοποιήθηκε ως βιολογικός δείκτης για προκαρκινικές αλλοιώσεις του στομάχου [48]. Άλλα κορυφαία διευκρινιστές αντιπροσωπεύουν νέες ανακαλύψεις. Για παράδειγμα, ABCA5, ADAMTS12 και CLEC3B δεν έχουν αναφερθεί να σχετίζονται με τον καρκίνο.

Είναι ενδιαφέρον ότι, ο αριθμός των διαφορικά εκφρασμένων γονιδίων σε διάφορους τύπους καρκίνου έχει μια μεγάλη εξάπλωση, που κυμαίνονται από 118 (προστάτη), 231 (νεφρού ), 247 (κόλον), 294 (μαστού), 311 (στομάχι) σε 683 (πνεύμονα) και 885 (παγκρέατος). Μια πιθανή εξήγηση είναι ότι οι αριθμοί αυτοί μπορεί να αντανακλά την επιθετικότητα των αντίστοιχων καρκίνων. Κάναμε παρατηρήσετε ότι υπάρχει ισχυρή συσχέτιση μεταξύ του αριθμού των διαφορικά εκφραζόμενων γονιδίων σε ένα συγκεκριμένο τύπο καρκίνου και το ποσοστό πενταετούς επιβίωσης των ασθενών με καρκίνο του εν λόγω [49] (Σχήμα 2). Τα λεπτομερή στατιστικά στοιχεία δίνονται στον Πίνακα S3. Μια άλλη ενδιαφέρουσα παρατήρηση είναι ότι, ενώ η πλειοψηφία των διαφορικά εκφραζόμενων γονιδίων με τουλάχιστον μία αλλαγή 2 φορές σε πέντε τύπους καρκίνου (του μαστού, του παχέος εντέρου, του πνεύμονα, του προστάτη, του στομάχου) είναι ρυθμισμένα προς τα κάτω, στο νεφρό και του παγκρέατος, η πλειοψηφία από τα εν λόγω γονίδια ρυθμισμένα προς τα πάνω, ενδεχομένως υποδηλώνει μοναδικά χαρακτηριστικά αυτών των δύο τύπων καρκίνου.

Η

2. Μαρκαδόροι για πολλούς τύπους καρκίνου

Έχουμε επίσης προσπαθήσει να εντοπίσει τα γονίδια που θα μπορούσαν να χρησιμοποιηθούν ως δείκτες για τον καρκίνο γενικά ή για μια ομάδα καρκίνων. Είναι δυνατό να βρεθεί κοινή γονίδιο «δείκτες» σε διάφορους τύπους καρκίνου, λόγω της παρατήρησης ότι η πλειοψηφία των καρκίνων, αν όχι όλες, υποβάλλονται σε ένα κοινό σύνολο των αλλαγών [50] κατά τη διάρκεια της ογκογένεσης, όπως αυτάρκεια σε σήματα ανάπτυξης, αναισθησία σε antigrowth σήματα, φοροδιαφυγή της απόπτωσης, και εισβολή ιστού και μετάσταση. Μερικές από αυτές τις βιολογικές διεργασίες μπορούν να διενεργούνται από τις ίδιες τις ομάδες των πρωτεϊνών κατά τον σχηματισμό και την εξέλιξη των διαφόρων μορφών καρκίνου, ως εκ τούτου, είναι πιθανόν να προκαλέσουν κοινών δεικτών για διαφορετικούς τύπους καρκίνου.

Α. Ταυτοποίηση των γονιδίων που εκφράζονται διαφορικά σε πολλούς τύπους καρκίνου.

Έχουμε εξετάσει διαφορικά εκφρασμένων γονιδίων με τουλάχιστον 2 φορές αλλαγές μεταξύ του καρκίνου και των αντίστοιχων ιστών ελέγχου σε όλους τους επτά τύπους καρκίνου και προσπάθησε να βρει εκείνα τα κοινά σε πολλούς καρκίνο γονίδια τύπους. Τα βασικά συμπεράσματα συνοψίζονται στον Πίνακα 1.

Η

Τα 85 γονίδια βρέθηκαν να εκφράζονται διαφορικά σε τρεις τουλάχιστον τύπους καρκίνου (Πίνακας S4), μεταξύ των οποίων 19 γονίδια είναι πάνω από τουλάχιστον τέσσερις τύπους καρκίνου, και πέντε γονίδια (ABCA8, DPT, FHL, CDC2 και TOP2A) σε πέντε τύπους καρκίνου. Οι διαφορές στη γονιδιακή έκφραση σε διάφορους τύπους καρκίνου μπορεί να υποδηλώνει είτε μια γενική ή ειδική σχετικότητα του γονιδίου προς τις αντίστοιχες μορφές καρκίνου, η οποία έχει επιβεβαιωθεί εν μέρει από τη λειτουργική ανάλυση και μια εκτεταμένη βιβλιογραφική έρευνα. Η λεπτομερής μοριακή λειτουργία αυτών των γονιδίων συνοψίζεται στον Πίνακα S4. 63 από τα 85 γονίδια έχουν αναφερθεί να είναι από καρκίνο που σχετίζεται με προηγούμενες μελέτες. Για παράδειγμα, CDC2, επάνω ρυθμισμένη σε πέντε από τις επτά καρκίνους που μελετήθηκαν, έχει αναφερθεί ότι σχετίζεται με κόλον, του προστάτη και καρκίνο του στομάχου, το οποίο δεν αποτελεί έκπληξη δεδομένου του ρόλου της στη ρύθμιση του κυτταρικού κύκλου, π.χ. καταχώρηση από το G

1 έως S? TOP2A, πάλι επάνω ρυθμισμένη σε πέντε από τις επτά καρκίνων, έχει αναφερθεί ότι σχετίζεται με γαστρικό [51], του μαστού [52] και τον καρκίνο των ωοθηκών [53], συνάδει με τη λειτουργία του στην ρύθμιση κλώνο DNA? Και οι δύο αυτών των δύο γονιδίων έχουν θεωρηθεί ως δείκτες καρκίνου πολλαπλού τύπου με μια προηγούμενη μετα-ανάλυση των δεδομένων για τον καρκίνο των μικροσυστοιχιών [7]. RRM2, επάνω ρυθμισμένη σε τέσσερις από τις επτά καρκίνων, έχει προταθεί ότι σχετίζεται με οισοφάγου και του γαστρικού καρκίνου και του καρκίνου του προστάτη, σύμφωνα με τον κρίσιμο ρόλο του στη σύνθεση του DNA τα οποία πρέπει να διατηρούνται σε ταχέως διαιρούμενα κύτταρα. Επιπλέον, έχουν 49 γονίδια έχουν αναφερθεί να είναι σχετικές με ασθένειες του ανοσοποιητικού, όπως CXCL12, COL1A1, ΜΜΡ9, και CD36 [54], [55], [56], [57], πιθανόν αντανακλώντας την απόκριση φλεγμονώδους τύπου συχνά συνδέονται με καρκίνο. Μεταξύ αυτών, ΜΜΡ9, σημαντικό στην αποικοδόμηση εξωκυττάριας μήτρας, είναι επάνω ρυθμισμένη σε τρεις από τις επτά καρκίνων, και CD36, το οποίο μπορεί να λειτουργήσει στην κυτταρική προσκόλληση, ρυθμίζεται προς τα κάτω σε τρεις από τις επτά καρκίνων?

You must be logged into post a comment.