PLoS One: Συμφωνία του Gene Expression και λειτουργικό μοντέλο συσχέτισης για τις NCI-60 κυτταρικές γραμμές και ο καρκίνος Γονιδιώματος Atlas γλοιοβλάστωμα Samples


Αφηρημένο

Ιστορικό

Η NCI-60 είναι μια ομάδα 60 διαφορετικές ανθρώπινες καρκινικές κυτταρικές σειρές που χρησιμοποιούνται από το Εθνικό Ινστιτούτο Καρκίνου των ΗΠΑ για τη διαλογή ενώσεων για αντικαρκινική δράση. Είμαστε συγκεντρωμένοι πρόσφατα γονίδια βασίζεται σε συσχέτιση προφίλ έκφρασης σε όλη την NCI-60. Πολλά από τα προκύπτοντα συμπλέγματα χαρακτηρίζονταν από καρκίνο που σχετίζεται με βιολογικές λειτουργίες. Το σύνολο των δεδομένων που επιμελήθηκε γλοιοβλαστώματος γονιδιακής έκφρασης (GBM) από την πρωτοβουλία του καρκίνου Γονιδιώματος Atlas (TCGA) έχει γίνει πρόσφατα διαθέσιμα. Έτσι, είμαστε πλέον σε θέση να καθορίσει ποια από τις διεργασίες είναι δυναμικά από κοινού από τις δύο τις αθανατοποιημένες κυτταρικές σειρές και κλινικές μορφές καρκίνου.

Αποτελέσματα

κεντρική παρατήρησή μας είναι ότι κάποια σύνολα υψηλή συσχέτιση γονιδίων σε τα στοιχεία έκφρασης ΝΟΙ-60 είναι επίσης υψηλή συσχέτιση στα δεδομένα έκφρασης GBM. Επιπλέον, μια στρατηγική «διπλό αλιεία» προσδιορίζονται πολλά σύνολα γονιδίων που δείχνουν Pearson συσχέτιση ≥0.60 τόσο στην NCI-60 και τα δεδομένα GBM θέτει σε σχέση με ένα δεδομένο γονίδιο «δόλωμα». Ο αριθμός αυτών των συνόλων γονιδίων υπερβαίνει κατά πολύ τον αριθμό που αναμένεται από την τύχη.

Συμπέρασμα

Πολλές από τις συσχετίσεις γονιδίων-γονίδιο βρέθηκε στο NCI-60 δεν αντικατοπτρίζουν μόνο τις συνθήκες κυτταρικές σειρές σε Πολιτισμός; μάλλον, αντικατοπτρίζουν τις διαδικασίες και τα δίκτυα γονίδιο που επίσης λειτουργούν

in vivo

. Ένας αριθμός των συσχετισμών δικτύου γονιδίου συν-συμβαίνουν στα σύνολα δεδομένων NCI-60 και GBM, αλλά υπάρχουν και άλλα που συμβαίνουν μόνο σε NCI-60 ή μόνο στην GBM. Εν ολίγοις, η ανάλυση αυτή παρέχει μια πρόσθετη διάσταση τόσο τη χρησιμότητα και τους περιορισμούς του NCI-60 στην προώθηση της κατανόησης των καρκίνων του

in vivo

Η

Παράθεση:. Zeeberg BR, Kohn KW, Kahn Α, Larionov V, Weinstein JN, Reinhold W, et al. (2012) Συμφωνία της Gene Expression και λειτουργικό μοντέλο συσχέτισης για τις NCI-60 Γραμμές κυττάρων και τα δείγματα του καρκίνου Γονιδιώματος Atlas γλοιοβλάστωμα. PLoS ONE 7 (7): e40062. doi: 10.1371 /journal.pone.0040062

Επιμέλεια: Javier Σ Castresana, Πανεπιστήμιο της Ναβάρα, Ισπανία

Ελήφθη: 11 Απρ, 2012? Αποδεκτές: 31η Μάη του 2012? Δημοσιεύθηκε από: July 26, 2012 |

Copyright: © Αυτό είναι ένα άρθρο ανοικτής πρόσβασης, χωρίς όλα τα πνευματικά δικαιώματα, και δεν μπορεί να αναπαραχθεί ελεύθερα, διανεμηθεί, να μεταδοθεί, τροποποιηθεί, χτισμένο πάνω, ή ειδάλλως να χρησιμοποιηθεί από οποιονδήποτε για οποιονδήποτε νόμιμο σκοπό. Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της άδειας χρήσης Creative Commons Attribution, το οποίο επιτρέπει απεριόριστη χρήση, τη διανομή και την αναπαραγωγή σε οποιοδήποτε μέσο, ​​με την προϋπόθεση το αρχικό συγγραφέα και την πηγή πιστώνονται

Χρηματοδότηση:. Αυτή η έρευνα υποστηρίχθηκε εν μέρει από το εσωτερικό ερευνητικό πρόγραμμα των National Institutes of Health, National Cancer Institute, Center for Cancer Research. Το έργο της JNW υποστηρίχθηκε εν μέρει από Grant Αριθμός U24CA143883 από το National Cancer Institute (UT-MD Anderson TCGA Γονιδιώματος Κέντρο Ανάλυσης Δεδομένων), με ένα δώρο από τον Η.Α. Μαίρη Ίδρυμα Κ Chapman, και με επιχορήγηση από τον Michael & amp? Susan Ίδρυμα Dell τιμώντας Lorraine Dell. Οι χρηματοδότες δεν είχε κανένα ρόλο στο σχεδιασμό της μελέτης, τη συλλογή και ανάλυση των δεδομένων, η απόφαση για τη δημοσίευση, ή την προετοιμασία του χειρογράφου

Αντικρουόμενα συμφέροντα:. Ένας συγγραφέας, ο Δρ Ari Kahn, συνδέεται με μια εμπορική εταιρεία SRA International Inc . Αυτό δεν αλλάζει την τήρηση των συγγραφέων σε όλες τις PLoS ONE πολιτικές για την ανταλλαγή δεδομένων και υλικών.

Εισαγωγή

Η NCI-60 [1] είναι μια ομάδα 60 ανθρώπινων καρκινικών κυτταρικών σειρών χρησιμοποιείται από την Αναπτυξιακή Therapeutics Program (DTP) του Εθνικού Ινστιτούτου Καρκίνου των ΗΠΑ να ελέγξουν & gt? 100.000 ενώσεις συν φυσικά προϊόντα από το 1990. Ο πίνακας NCI-60 περιλαμβάνει καρκίνους του παχέος εντέρου (CO), νεφρική (RE), των ωοθηκών (OV), προστάτη (PR), των πνευμόνων (LC), του μαστού (BR), και το κεντρικό νευρικό σύστημα (ΚΝΣ) προέλευσης, καθώς και λευχαιμίες (LE) και μελανωμάτων (ΜΕ). Εμείς και πολλοί συνάδελφοι μας σε όλο τον κόσμο έχουν προφίλ το NCI-60 πληρέστερα στο DNA, RNA, πρωτεΐνη, η μετάλλαξη, λειτουργική, και φαρμακολογικά επίπεδα από κάθε άλλο πάνελ διαφορετικών τύπων κυττάρων που υπάρχουν. Τα δεδομένα NCI-60 έχουν χρησιμοποιηθεί ευρέως στην έρευνα και βιοπληροφορικής καρκίνο, αλλά οι πολλαπλές σειρές δεδομένων μπορεί να είναι πιο κατατοπιστική για την αναγνώριση των πολύπλοκων «βιοσημάδια ‘(α’ biosignature» περιλαμβάνει ένα σύνολο γονιδίων των οποίων τα χαρακτηριστικά είναι προγνωστική). Ανάλυση αυτών των βιοσημάδια έχει οδηγήσει σε αύξηση της κατανόησης των κυτταρικών φαινοτύπων και των σχέσεων οδού.

Όταν έχουμε συγκεντρωμένα πρόσφατα γονιδίων βασίζεται στην συσχέτιση του προφίλ έκφρασης σε όλη την NCI-60 [2], πολλές από τις συστάδες αυτές συνδέονται με τον καρκίνο -σχετικών βιολογικές λειτουργίες. Ο αριθμός αυτών των συσπειρώσεων υπερέβαινε κατά πολύ ό, τι θα αναμενόταν από την τύχη. Μία από τις ομάδες, που ορίζονται ως «σύμπλεγμα 52 του 160-cut», αποτελούνταν από σημαντικές κατηγορίες που γενικά αντανακλά την ανάπτυξη των νευρώνων, η ανοσολογική απόκριση, και επιθηλιακών να μεσεγχυματικά μετάβαση (ΕΜΤ) πέραν της μετανάστευσης των κυττάρων. Σε αντίθεση, σύμπλεγμα 68 του 160-cut επικεντρώθηκε σε μεγάλο βαθμό από μια ενιαία βιολογική διαδικασία, δηλαδή τη λειτουργία του ανοσοποιητικού.

Οι αριθμοί πλήρες μέγεθος είναι διαθέσιμα ως Σχήματα S1 και S2. Οι αριθμοί που επισυνάπτεται μετά το όνομα του γονιδίου αναφέρονται στην NCI-60 σύμπλεγμα στο οποίο το γονίδιο εμφανίστηκε.

Η

Μια προηγούμενη μελέτη [3] σε σύγκριση με τα προφίλ της γονιδιακής έκφρασης μεταξύ κυτταρικές γραμμές και δείγματα καρκινικού ιστού του μαστού. Οι συγγραφείς παρατήρησαν ότι: «κυτταρικές σειρές και όγκους μοιράζονται πολλές πτυχές των προτύπων γονιδιακής έκφρασης τους, που μπορεί να σχετίζονται με την κανονική και παθολογική φυσιολογία που διακρίνει τους τύπους κυττάρων του μαστού

in vivo

. Αυτά τα σύνολα γονιδίων περιλαμβάνουν 1) τη βασική επιθηλιακά συμπλέγματος, 2) η επιθηλίου του αυλού /ER + σύμπλεγμα, 3) η ΕΚΒΒ2 + αμπλικόνιο σύμπλεγμα, 4) το σύμπλεγμα πολλαπλασιασμό, και 5) το σύμπλεγμα ιντερφερόνη. «

Η

τα καρκινικά κύτταρα σε καλλιέργεια υπόκεινται σε πολύ διαφορετικές συνθήκες από ό, τι τα καρκινικά κύτταρα στον ξενιστή. Έχουν αφαιρεθεί από φυσιολογικό της περιβάλλον τους από άλλους τύπους κυττάρων, η αρχιτεκτονική του ιστού, ορμονικές επιρροές, και αυτοκρινείς /παρακρινείς σήματα. Έτσι, το ερώτημα παραμένει:. «Τι σημαίνει η συμπεριφορά του συνεταιρίζεσθαι σε καλλιέργεια κυττάρων μας πείτε για τα καρκινικά κύτταρα in vivo»

Για να διερευνήσουν αυτή την ερώτηση, αναλύσαμε το εξαιρετικά επιμεληθεί γλοιοβλάστωμα (GBM) απομαγνητοφώνηση σύνολο δεδομένων έκφρασης που παράγεται από την πρωτοβουλία ο καρκίνος Γονιδιώματος Atlas (TCGA) [4]. TCGA ιδρύθηκε για να χτίσουν έναν περιεκτικό κατάλογο των γονιδιωματικών και φαινοτυπικών ανωμαλιών που οδηγούν καρκινογένεση και ενδεχομένως να επηρεάσει θεραπεία σε & gt? 20 διαφορετικά είδη όγκων. Ειδικότερα, TCGA έχει παράσχει τώρα μία λεπτομερής όψη του γενωμικού εκτροπές σε μία ομάδα GBM αποτελείται από 206 δείγματα ασθενών. Verhaak και Hoadley

et al.

[5] περιέγραψε πρόσφατα μια μοριακή ταξινόμηση των GBM γονιδιακής έκφρασης που βασίζεται σε Προνευρικά, Νευρωνικά, Κλασική και μεσεγχυματικά υποτύπους και ολοκληρωμένη πολλαπλών τύπων γονιδιωματικής δεδομένων για τη δημιουργία μοντέλων της σωματικής μετάλλαξης, DNA αντίγραφο της αλλαγής του αριθμού και της γονιδιακής έκφρασης.

η

στην παρούσα ανάλυση, ελέγξαμε εάν σύνολα των γονιδίων που έχουμε διαπιστώσει στο παρελθόν να (1) υψηλής συν-εκφράζεται σε όλη την NCI-60, και (2) λειτουργικά συνεκτική ήταν επίσης εξαιρετικά συν-εκφράζεται σε όλα τα δείγματα GBM. Στη συνέχεια επεκτάθηκε ότι η βασική ανάλυση από μια στρατηγική «διπλό αλιεία». Δηλαδή, προσδιορίσαμε σειρές των γονιδίων που έδειξε συσχέτιση ≥0.60 τόσο τα δεδομένα NCI-60 και GBM θέτει σε σχέση με ένα δεδομένο γονίδιο «δόλωμα». Βρήκαμε ότι ο αριθμός των εν λόγω συνόλων γονιδίων υπερέβη κατά πολύ τον αριθμό που αναμένεται από την τύχη. Η ανάλυση αυτή δεν σημαίνει ότι τα καρκινικά κύτταρα στο μετοχικό πολιτισμό όλα, ή ακόμη περισσότερο, των χαρακτηριστικών τους με κύτταρα in vivo, αλλά δεν αναφέρει τις ομοιότητες.

Η

Μέθοδοι

σύνολα δεδομένων

για τα δεδομένα της έκφρασης GBM, τα αρχεία

unifiedScaled.txt

(το οποίο περιέχει ένα πλήρες σύνολο των δεδομένων της έκφρασης, που αναφέρεται ως

TCGA.GBM.complete

)

TCGA_unified_CORE_ClaNC840.txt

(που περιλαμβάνει τις ετικέτες υπότυπο του κάθε δείγματος) είχαν κατεβάσει από την ιστοσελίδα TCGA https://tcga-data.nci.nih.gov/docs/publications/gbm_exp/.

Χρησιμοποιήσαμε όλα τα 202 δείγματα GBM που είναι διαθέσιμα, που αντιπροσωπεύουν περίπου το συγκρίσιμο αριθμό των δειγμάτων κάθε υπότυπο. Δεδομένου ότι οι υπολογισθείσες τιμές συσχέτισης θα είναι πιο ακριβή εάν προέρχονται από ένα πιο ποικίλο πληθυσμό δειγματοληψίας, θέλαμε να διατηρήσουμε όσο το δυνατόν μεγαλύτερη ποικιλομορφία κοιτάζοντας όλους τους υποτύπους μαζί, έτσι δεν αναφέρουν συν-έκφραση εντός ή μεταξύ των υποτύπων.

Οι αριθμοί πλήρες μέγεθος είναι διαθέσιμα ως Σχήματα S3 και S4. Οι αριθμοί που επισυνάπτεται μετά το όνομα του γονιδίου αναφέρονται στην NCI-60 σύμπλεγμα στο οποίο το γονίδιο εμφανίστηκε.

Η

Το πλήρες μέγεθος CIM είναι διαθέσιμο ως σχήμα S5. Το όνομα του γονιδίου δίνεται ως επικεφαλίδα της στήλης είναι ο εκπρόσωπος του καταλόγου των γονιδίων. Ο πλήρης κατάλογος των γονιδίων είναι διαθέσιμη στο HTGM Λήψη S1.

Η

NCI-60 δεδομένα έκφρασης ελήφθησαν από CellMiner [6]. Προσδιορισμός των σύνθετων επιπέδων έκφρασης για κάθε γονίδιο πραγματοποιήθηκε όπως περιγράφηκε προηγουμένως [7] – [9]. Ένα ειδικό αίτημα υποβλήθηκε στο διαχειριστή του συστήματος για την πλήρη σειρά των προφίλ γονιδιακής έκφρασης (που αναφέρεται ως

NCI-60.complete

). Αυτό λήψη θα ήταν πολύ μεγάλο για να εκτελέσετε μέσα από το πρότυπο web interface. Περαιτέρω λεπτομέρειες παρέχονται στο [2]). Εν συντομία,

NCI-60.complete

ήταν προ-επεξεργασία, επιλέγοντας μόνο τα γονίδια που έχουν τόσο σύμβολο HGNC και σχολιασμού στην οντολογία διαδικασία πάει Βιολογικά. Κάθε φορέας προφίλ γονιδιακής κλιμακώθηκε με μηδενική μέση τιμή και μονάδα διακύμανσης. Ότι μειώνεται το σύνολο δεδομένων αναφέρεται εδώ ως

NCI-60.BP.

Η

Όπως αναφέρθηκε παραπάνω για τα δείγματα GBM, προσπαθούμε να επιτύχουμε ένα υψηλό βαθμό ποικιλότητας όσο το δυνατόν στο κελί γραμμές, έτσι ώστε το εξαιρετικά ετερογενές μίγμα των κυτταρικών σειρών που αντιπροσωπεύεται από τον NCI-60 είναι ιδανικό. Για παράδειγμα, σκεφτείτε δύο γονίδια. Ψάχνουμε να δούμε αν τα επίπεδα έκφρασης των δύο αυτών γονιδίων ανεβοκατεβαίνει μαζί καθώς διασχίζουν τις 60 κυτταρικές σειρές. Αν όλες οι γραμμές κυττάρων ήταν ουσιαστικά πανομοιότυπα μεταξύ τους, δεν θα υπήρχε διαφοροποίηση και εμείς δεν μπορούσαμε να δούμε πώς τα δύο γονίδια που σχετίζονται με διαφορετικές συνθήκες.

Για τις περισσότερες από τις μελέτες που αναφέρονται εδώ, τα δεδομένα έκφρασης για GBM και για NCI-60 περιορίστηκαν σε εκείνα τα γονίδια που ήταν παρόντες σε δύο

TCGA.GBM.complete

και

NCI-60.BP

.

Η

R γλώσσα

κωδικός R γλώσσα [10] αναπτύχθηκε για να διαβάσετε και να ενσωματώσει τα δεδομένα στις δύο κατεβάσει τα αρχεία, καθώς και να παρέχουν υποστήριξη για τη βασική και πιο σύνθετα ερωτήματα [

π.χ.

, αυτόματα βρείτε σύνολα γονιδίων που πληρούν ορισμένους όρους όσον αφορά τόσο NCI-60 και GBM και στη συνέχεια να δημιουργήσει μια σχετική σειρά της έκφρασης ή της συσχέτισης συγκεντρωμένα χάρτες εικόνας (CIMs)]. Ιστορικά, CIMs εισήχθησαν για πρώτη φορά στο [11], [12].

Μελέτες στηρίζεται σε προ-υπάρχουσες συσχετίσεις Σε όλες τις NCI-60

Το βασικό ερώτημα που απευθύνεται εδώ ήταν το αν τα γονίδια που συν -clustered σε σχέση με το προφίλ έκφρασης τους σε όλα τα κύτταρα NCI-60, επίσης, συν-συγκεντρωμένα σε σχέση με το προφίλ έκφρασης τους σε όλα τα δείγματα GBM. Για να διευκολυνθεί η ανάλυση, πήραμε πλεονέκτημα της συνάρτησης R γλώσσα

cutree ()

. Μια βασική παράμετρος στο

cutree ()

είναι «Κ» ο αριθμός των clusters στην οποία το δέντρο συμπλέγματος είναι να διαιρεθεί. Στο σύμπλεγμα 52 και σύμπλεγμα 68 μελέτες (

δηλ.,

Σύνολα γονιδίων που αναφέρονται στο [2]), προκαταρκτικές μελέτες έδειξαν ότι k = 2 ήταν βέλτιστη για συμπλέγματα NCI-60 έκφρασης. Κάθε τέτοιο σύνολο γονίδιο είχε προέρχεται από μια μελέτη ομαδοποίησης χρησιμοποιώντας μια απόλυτη μετρική αντιστοιχία, και ως εκ τούτου είχε δύο σημαντικές διαχωριστικά (

π.χ.

, Τα Σχήματα 1Α, S1). Οι δύο διαχωριστικά που χαρακτηρίζονται ως «συμπλέγματος 1» και «cluster 2″, και οριοθετείται από τον αριθμό που προσαρτάται στο όνομα κάθε γονιδίου στο δεξί του CIM. Τα γονίδια εντός ενός ενιαίου στεγανοποίηση είναι αμοιβαία θετικά συσχετίζονται, και όλα τα γονίδια σε σύμπλεγμα 1 αρνητικώς συσχετίζονται με όλα τα γονίδια στη συστάδα 2. Μπορούμε κοινώς αναφέρονται στη μεγαλύτερη συστάδα (στην περίπτωση των Σχημάτων 1Α, S1, αυτό θα είναι συστάδα 2) όπως τα γονίδια «θετικά-συσχετίζονται» και το μικρότερο σύμπλεγμα ως τα γονίδια «αρνητικώς συσχετίζονται». Σε αντίθεση με k = 2 για NCI-60, δεν υπήρχε

a priori

βάση για την επιλογή ενός συγκεκριμένου τιμή του k για την ομαδοποίηση απέναντι GBM, οπότε επιτρέπεται k για GBM να κυμαίνεται από 2 έως 8.

Για να προσδιοριστεί η βέλτιστη τιμή του k, κατασκευάσαμε έναν πίνακα έκτακτης 2 × k (

π.χ.,

Πίνακας 1), κάθε κύτταρο

i, j εκ ​​των οποίων περιέχει τον αριθμό των γονιδίων που είναι και οι δύο στο i

ου σύμπλεγμα του NCI-60 ομαδοποίηση και την ι

ου σύμπλεγμα της ομαδοποίησης GBM. Υπολογίσαμε την ακριβή τιμή p ενός Fisher για την μηδενική υπόθεση που θα μπορούσε να έχει συμβεί διανομή τόσο ακραία, όπως την παρατηρούμενη κατανομή κατά τύχη. Επιπλέον, έχουμε τυχαία τα ονόματα γονιδίων μεταξύ εκτέλεση των NCI-60 και GBM clusterings, για να καθορίσει εάν ακριβείς p-value Η παρατηρούμενη Fisher θα μπορούσε να επιτευχθεί για ένα τυχαίο σύνολο γονιδίων.

De novo Προσδιορισμός των συνόλων γονιδίων με συσχέτιση ≥0.60 στις δύο NCI-60 και GBM

Χωρίς αναφορά σε καμία προηγούμενη ανάλυση ομαδοποίησης, το πρόγραμμα κατασκευάστηκε

de novo

μια λίστα με όλα τα ζεύγη των γονιδίων που έχουν σχέση ≥0.60 σε σχέση με προφίλ έκφρασης τόσο NCI-60 και GBM. Το όριο των 0,60 επιλέχθηκε για τους υπολογισμούς, διότι είχε χρησιμοποιηθεί σε μια προηγούμενη μελέτη του γονιδίου-γονιδίου συσχετίσεις να ελαχιστοποιηθεί ο αριθμός των ψευδώς θετικών. Γονίδια κατατάχθηκαν σε σχέση με τη συχνότητα εμφάνισης στον εν λόγω κατάλογο. Κάθε γονίδιο «G» με συχνότητα ≥5 στη συνέχεια χρησιμοποιείται για να «εκπροσωπεί» το σύνολο των γονιδίων που έδειξαν συσχέτιση ≥0.60 με G. Το κορυφαίο γονίδιο G ήταν ΗΤΑΝ (49 γονίδια είχαν σχέση ≥0.60 με WAS). Πολλοί από τους καταλόγους του γονιδίου κατασκευάστηκε με τη μέθοδο αυτή ήταν άκρως περιττή σε σχέση με ένα άλλο (

δηλ.

, Τα ζεύγη των καταλόγων μπορεί να έχει πολλές γονίδιο στο κοινό). Για να αμβλυνθεί το πρόβλημα απολύσεων, υπολογίσαμε την ομοιότητα μετρικό Jaccard (το Jaccard μέτρα συντελεστή ομοιότητας μεταξύ των σετ δείγματος, και ορίζεται ως το μέγεθος της τομής διαιρούμενο με το μέγεθος της Ένωσης των σύνολα δειγμάτων [13]) θα εξαλειφθεί άκρως περιττή (τιμή Jaccard ≥0.90? 0,90 προσδιορίστηκε να είναι βέλτιστη σε προκαταρκτικές μελέτες δεν φαίνεται εδώ) σετ γονιδίων από περαιτέρω ανάλυση. Έτσι, χρησιμοποιείται μια λιγότερο περιττή σύνολο 68 σετ γονιδίων (από μια αρχική επιλογή της κορυφής (ενδεχομένως περιττή) 100 γονίδιο σετ) για την ανάλυση.

Θα ήθελε να καθορίσει αν ο αριθμός των ζευγών των γονιδίων που έχουν σχέση ≥0.60 σε σχέση με τα δύο προφίλ έκφρασης NCI-60 και GBM υπερβεί τον αριθμό που αναμένεται από την τύχη. Ως εκ τούτου, πραγματοποιήθηκε μια σειρά από 10 μελέτες στις οποίες τυχαιοποιήθηκαν τα ονόματα γονιδίων στα προφίλ έκφρασης GBM. Ο αριθμός αυτών των ζευγαριών που λαμβάνονται στο πραγματικό μελέτης ήταν 2708. Αντίθετα, ο αριθμός των μελετών τυχαιοποίηση ήταν μικρή σε σύγκριση με (193 ± 14).

Λειτουργική Κατηγοριοποίηση

Λειτουργική κατηγοριοποίηση των γονιδίων λίστες διεξήχθη χρησιμοποιώντας το πρόγραμμα High-Throughput GoMiner (HTGM) [14]. Οι παράμετροι που χρησιμοποιούνται στη λειτουργία HTGM φαίνονται στον Πίνακα S1.

συμπλέγματος Εικόνα Χάρτες

Εμείς χρησιμοποιηθεί είτε το πρόγραμμα Genesis clustering [15] ή το δικό μας το σπίτι-R γλώσσα κώδικα για να κατασκευάσει CIMs παρουσιάζονται εδώ.

Αποτελέσματα και Συζήτηση

Μελέτες στηρίζεται σε Υφιστάμενες συσχετίσεις σε όλες τις NCI-60

πρόσφατα συγκεντρωμένα τα γονίδια που βασίζονται σε συσχετισμό των προφίλ έκφρασης σε όλη την NCI-60 [2 ]. Πολλές από αυτές τις συστάδες χαρακτηρίζονταν από καρκίνο που σχετίζεται με βιολογικές λειτουργίες.

Χρησιμοποιώντας τα προφίλ έκφρασης για το σύμπλεγμα των γονιδίων 52 κατά μήκος των κυτταρικών σειρών NCI-60 και επίσης κατά μήκος των δειγμάτων GBM, ήμασταν σε θέση να παράγει συσχέτιση έκφρασης CIMs και στα δύο από αυτά τα σύνολα των προφίλ έκφρασης (Εικόνες 1Α, S1, 1Β, S2). Τα διαφορετικά πρότυπα του κόκκινου και του πράσινου στην NCI-60 συσχετισμό CIM (Σχήματα 1Α, S1) προκύπτει από το γεγονός ότι η συστάδα 52 είχε προέρχεται από την ομαδοποίηση των προφίλ έκφρασης στις κυτταρικές γραμμές ΝΟΙ-60 χρησιμοποιώντας μια απόλυτη συσχέτιση μετρικών. Έτσι, σύμπλεγμα 52 αποτελείται από «αρνητικά» και «θετικά» συσχετίζονται υποομάδες. Δεν αποτελεί έκπληξη, τα μοτίβα του κόκκινου και του πράσινου είναι λιγότερο διακριτά στο συσχετισμό GBM CIM (Εικόνες 1Β, S2), αφού σύμπλεγμα 52 είχε οριστεί σε σχέση με το NCI-60, δεν GBM, πρότυπα έκφρασης. Αν και λιγότερο διακριτά από ό, τι για NCI-60, το πρότυπο GBM έχει υψηλή συσχέτιση με το πρότυπο για το NCI-60. Αυτή η σχέση είναι προφανής με οπτική επιθεώρηση. Ο παρακάτω ποσοτική ανάλυση επιβεβαιώνει την οπτική εντύπωση.

Σε αντιστοιχία CIMs, θα επισυνάπτεται έναν αριθμό (1 ή 2) με τα ονόματα των γονιδίων, που αντιστοιχεί σε συμμετοχή σε δύο μεγάλες συστάδες στο NCI-60 CIM. Αυτοί οι ίδιοι αριθμοί διατηρήθηκαν στα ονόματα γονίδιο για την GBM CIM που επιτρέπουν την ταυτοποίηση της συστάδας στην οποία αυτό το γονίδιο ανήκε στην NCI-60 CIM. Το μοτίβο της ομαδοποίησης στην συσχέτιση GBM CIM (Σχήματα 1Β, S2) είναι αισθητά παρόμοια με εκείνη του NCI-60 CIM. Η παρατήρηση αυτή δείχνει ότι ορισμένες μορφές του γονιδίου συν-έκφραση στον πίνακα NCI-60 ανθρώπινου όγκου κυτταρική γραμμή διατηρείται σε κλινικές γλοιοβλάστωμα, και υποστηρίζει εικασία μας είναι ότι οι συσχετισμοί έκφρασης NCI-60 γονίδιο μπορούν να δείξουν σε μεγάλο βαθμό ισχύουν οι σχέσεις γονίδιο-γονιδίου.

Πιο συγκεκριμένα, ο Πίνακας 1 δείχνει ότι υπάρχουν 15 γονίδια σε σύμπλεγμα 1 και 64 γονίδια σε σύμπλεγμα 2, σε σχέση με το προφίλ έκφρασης NCI-60. Τριάντα τέσσερα από τα 64 συμπλέγματος 2 γονίδια είναι τα κυρίαρχα μέλη της συστάδας GBM 2. Το υπόλοιπο NCI-60 συστάδα είναι 2 γονίδια κατανέμεται σε συστάδες GBM 1 και 3. Η αντιστοιχία μεταξύ των προτύπων ομαδοποίηση σε NCI-60 και GBM είναι ιδιαίτερα σημαντική (Πίνακας 2). ακριβή τιμή p του Fisher για k = 3 (0.00039) είναι εντυπωσιακά χαμηλότερη από ό, τι για τις τυχαιοποιημένες ελέγχου (0.46 ± 0.28). Επιπλέον, η μεγάλη πλειοψηφία των γονιδίων που συσχετίζονται μεταξύ τους ή αντι-συσχετίζεται στο NCI-60 διατηρείται αυτή τη σχέση στα δείγματα ιστού GBM. Οι ταυτότητες των σχετικών γονιδίων φαίνονται στον Πίνακα 3.

Ένα αξιοσημείωτο εύρημα είναι ότι σχεδόν το ήμισυ των γονιδίων σε GBM συστάδα 2 (Σχήματα 1 Β, S2) είναι γονίδια που είχαν προηγουμένως βρεθεί να εμπλέκονται στην κυτταρική προσκόλληση /μετανάστευση και να σχηματίσουν μια αμοιβαία-υψηλή υποσύνολο συσχέτιση της συστάδας 52 γονίδια [16]. Επιπλέον, εκείνα τα γονίδια βρέθηκαν να λειτουργήσει συνεκτικά σε μια συγκεκριμένη πτυχή της διαδικασίας κυτταρικής μετανάστευσης. Με την εξαίρεση των ALCAM και EGFR, την κυτταρική πρόσφυση /μετανάστευση σφιχτά γονίδια συμπλέγματος εμπίπτουν στο σύμπλεγμα GBM 2. Δεκαέξι από είκοσι τέσσερα γονίδια της εν λόγω σφιχτό πτώση σύμπλεγμα σε σύμπλεγμα GBM 2. Έτσι, μια σειρά γονιδίων που βρέθηκαν στο παρελθόν να είναι στενά συνδεδεμένες τόσο στην γονιδιακή έκφραση και τη λειτουργία στις κυτταρικές σειρές NCI-60 [2], [16] είναι τώρα βρέθηκε να συν-εκφράζεται επίσης σε κλινικά δείγματα γλοιοβλάστωμα.

για να διερευνήσουν άλλα πιθανά παραδείγματα της συνοχής μεταξύ της γονιδιακής έκφρασης συστάδες σε κυτταρικές γραμμές ΝΟΙ-60 και δείγματα GBM, επαναλάβαμε ότι η ανάλυση με το ανοσοποιητικό σύστημα σύμπλεγμα που σχετίζονται με 68 γονίδια [2] (πίνακες 4-6? Σχήματα 2Α, S3, 2Β, S4). Και πάλι, η ακριβής τιμή p του του Fisher (0.00001) (Πίνακας 5) επικυρώνει την οπτική εντύπωση ότι υπάρχει μια σημαντική συμφωνία μεταξύ του NCI-60 και την ομαδοποίηση GBM.

De novo Ταυτοποίηση σύνολα γονιδίων με Συσχέτιση ≥0.60 στις δύο NCI-60 και TCGA GBM

Υπήρχαν 34.865 ζεύγη γονιδίων με συσχέτιση ≥0.60 στα NCI-60 σετ δεδομένων, αλλά όχι στην GBM, 87.556 στην GBM, αλλά όχι στην NCI-60, και 2708 τόσο στην NCI-60 και GBM. Το γονίδιο υψηλότερη κατάταξη του 2708 ήταν ήταν? 49 γονίδια έδειξε συσχέτιση ≥0.60 με WAS. Από τις 100 κορυφαίες γονίδια (

δηλαδή

, τα γονίδια με το μεγαλύτερο αριθμό των συσχετισμών ≥0.60), 68 ήταν μη-περιττές (

δηλαδή

, οι κατάλογοι του συσχετισμού των γονιδίων είχαν αξία Jaccard ≤0.90) . Λειτουργική κατηγοριοποίηση αυτών των 68 γονιδίων λίστες με High-Throughput GoMiner (HTGM) αποκάλυψε ένα πολύπλοκο σύνολο των σημαντικών κατηγοριών (σχήματα 3, S5). Ο αριθμός των γονιδίων και τις γενικευμένες λειτουργικές συσχετίσεων για τα κορυφαία 68 μη περιττών σύνολα γονιδίου παρατίθενται στον Πίνακα 7. Όπως είναι εμφανές από τον Πίνακα 7, το ανοσοποιητικό κατηγορίες κυριαρχούν, αλλά Πίνακα 7 και το Σχήμα S5 αποκαλύπτουν ότι υπήρχαν επίσης κατηγορίες που εκπροσωπούν

π.χ.

απόπτωση, χημειοταξία, την επιδιόρθωση του DNA, χρωματίνης συναρμολόγηση, την αγγειογένεση, και την πρόσφυση.

τα γονίδια στη συστάδα 52 ή ένα σύμπλεγμα 68 είχε ληφθεί από την προηγούμενη ομαδοποίηση των προφίλ γονιδιακής έκφρασης σε όλη NCI-60 κυττάρων γραμμές, αλλά όχι σε δείγματα TCGA GBM. Περιμένουμε να βρούμε ότι ορισμένα από τα

δεν novo

λίστες γονίδιο που προέρχεται από την ταυτόχρονη εξέταση των δύο NCI-60 κυτταρικές γραμμές και δείγματα TCGA GBM μπορεί να επικαλύπτονται με γονίδια στους καταλόγους γονίδιο συμπλέγματος 52 ή σύμπλεγμα 68. Στην πραγματικότητα, ο Πίνακας 7 δείχνει ότι τα γονίδια σε ορισμένα από τα

de novo

λίστες γονιδίων επικαλύπτεται με τα γονίδια στο NCI-60 συμπλέγματα 52 (μετανάστευση κυττάρων) και 68 (ανοσοποιητικού). Μια τέτοια επικάλυψη είναι ιδιαίτερα ισχυρή για σύμπλεγμα 68.

Αυτή η ανάλυση δείχνει τους τρόπους με τους οποίους ισχυρές συσχετίσεις γονιδίων-γονιδίου και λειτουργική κατηγοριοποίηση (

δηλ.,

GO αναθέσεις) που λαμβάνονται για τις κυτταρικές σειρές NCI-60 σε όλους τους τύπους των όγκων μπορεί να αντανακλά

in vivo

σχέσεις. Δείχνει επίσης τους περιορισμούς της εν λόγω ομοιότητας. Οι δύο τύποι των συνόλων δείγμα αντιπροσωπεύουν σημαντικές πρωτοβουλίες του Εθνικού Ινστιτούτου Καρκίνου (NCI), όσον αφορά τόσο βάρος και τις επενδύσεις στην έρευνα. Ως εκ τούτου, η οριοθέτηση των ομοιοτήτων και των διαφορών παραμένει ένα αντικείμενο σημαντικών πρακτική σημασία.

Υποστήριξη Πληροφορίες

Σχήμα S1.

Η πλήρης έκδοση του Σχήματος 1Α

doi:. 10.1371 /journal.pone.0040062.s001

(PDF)

Εικόνα S2.

Η πλήρης έκδοση του σχήματος 1Β

doi:. 10.1371 /journal.pone.0040062.s002

(ΔΕΘ)

Εικόνα S3.

Η πλήρης έκδοση του Σχήματος 2Α

doi:. 10.1371 /journal.pone.0040062.s003

(PDF)

Εικόνα S4.

Η πλήρης έκδοση του σχήματος 2Β

doi:. 10.1371 /journal.pone.0040062.s004

(PDF)

Εικόνα S5.

HTGM GO κατηγορίες

έναντι

γονίδιο που CIM για τα σύνολα των γονιδίων με συσχέτισης ≥ 0,60 ταυτόχρονα τόσο NCI-60 και TCGA GBM

doi:. 10.1371 /journal.pone.0040062.s005

(PNG)

πίνακα S1.

Οι παράμετροι που χρησιμοποιούνται στο τρέξιμο HTGM

doi:. 10.1371 /journal.pone.0040062.s006

(JPG) Κατεβάστε τις S1.

Zip αρχείο των αποτελεσμάτων HTGM

doi:. 10.1371 /journal.pone.0040062.s007

(Τ.Κ.)

Ευχαριστίες

Θα θέλαμε να ευχαριστήσουμε τον Δρ Roel GW Verhaak για χρήσιμες συζητήσεις σχετικά με τα σύνολα δεδομένων TCGA.

You must be logged into post a comment.