ShinyGO 0.80

Mpo win 77

21/04/2024: Menambahkan istilah GO ke diagram batang baru.

12/04/2024: Ukuran set maksimum ditingkatkan dari 2000 menjadi 5000. Beberapa istilah GO yang bermakna (Proses biosintetik RNA) mencakup lebih dari 4000 gen.

Versi yang lebih lama (ShynyGO V0. 77) juga tersedia. Untuk mendukung upaya ini, silakan kutip makalah kami seperti yang telah dilakukan lebih dari 2000 orang. Mencantumkan URL saja tidak cukup. Mirror sever http://ge-lab. org/go/ Dihosting oleh JetStream2 yang didanai NSF. Untuk pertanyaan, saran dan data silahkan menghubungi Jenny di gelabinfo@gmail. com. Ikuti Dr. Kuzu di Twitter dan LinkedIn.

11 Februari 2022: Suka ShynyGO, tetapi genom Anda tidak tercakup? SinyGO yang disesuaikan sekarang tersedia. Basis data berisi beberapa genom khusus yang diminta oleh pengguna. Silakan isi formulir ini untuk menambahkan spesies/genom baru.

GO Enrichment analysis, plus a lot more!

Cukup tempelkan daftar gen Anda dan dapatkan persyaratan GO yang diperkaya dan jalur lain untuk lebih dari 14. 000 spesies berdasarkan anotasi dari Ensembl dan STRING-db. Hasilkan diagram jalur KEGG dengan gen yang disorot, pohon pengelompokan hierarki, dan jaringan yang merangkum istilah/jalur yang tumpang tindih, jaringan interaksi protein-protein, plot tanda tangan gen, dan motif promotor yang diperkaya.

Methods

Semua gen kueri dikonversi menjadi ID gen ENSEMBL atau ID protein STRING-db. Sebagian besar data pemetaan ID gen dan jalur berasal dari dua sumber ini. Untuk spesies yang paling banyak diteliti, kami juga secara manual mengumpulkan daftar jalur yang luas dari berbagai database publik.

Nilai P untuk pengayaan diperoleh dengan menggunakan uji hipergeometri. False Discovery Rate (FDR) dihitung menggunakan metode Benjamini-Hochberg untuk mengoreksi beberapa pengujian. Pengayaan Lipatan suatu jalur didefinisikan sebagai rasio persentase gen dalam daftar dengan persentase terkait pada gen latar belakang.

Ini dapat mencakup semua gen yang lolos filter minimal dalam analisis RNA-seq. Jika tidak ada gen latar belakang yang diunggah, pengaturan defaultnya adalah menggunakan semua gen pengkode protein. Alternatifnya, Anda dapat memilih opsi ‘Gunakan DB jalur untuk jumlah gen’. Opsi ini menghitung latar belakang berdasarkan jumlah total gen unik dalam database jalur yang dipilih dan menetapkan batas atas antara 5. 000 dan 30. 000 gen. Jika opsi ini dipilih, gen dalam daftar asli pengguna yang tidak ada dalam database jalur akan dikecualikan.

Analisis pengayaan hanya mempertimbangkan jalur dalam batas ukuran yang ditentukan. Setelah analisis, jalur pertama-tama difilter berdasarkan batas FDR yang ditentukan pengguna. Jalur yang signifikan diberi peringkat berdasarkan FDR, Pengayaan Lipat, atau metrik lainnya. Jika Anda memilih opsi ‘Urutkan berdasarkan peringkat rata-rata (FDR & Pengayaan Lipat)’, jalur akan diurutkan berdasarkan rata-rata peringkatnya berdasarkan FDR dan Pengayaan Lipat. Urutkan berdasarkan FDR, lalu berdasarkan Pengayaan Lipat terlebih dahulu akan memfilter jalur berdasarkan FDR, lalu mengurutkan jalur berdasarkan Pengayaan Lipat. Opsi “Hapus redundansi” menghilangkan jalur serupa yang berbagi 95% gen dan 50% kata nama dan mewakilinya dengan jalur yang paling penting.

Interpreting GO Enrichment Results

Gene Ontology (GO) berisi lebih dari puluhan ribu istilah (kategori fungsional), yang masing-masing diuji secara individual untuk pengayaan. Hasil ini diberi peringkat dan hanya hasil teratas yang ditampilkan. Memahami proses ini sangat penting untuk menafsirkan hasil pengayaan GO.

  • Nilai P: mencerminkan signifikansi statistik pengayaan. Nilai yang lebih rendah menunjukkan bahwa hasil tersebut kecil kemungkinannya disebabkan oleh kebetulan (hipotesis nol). Nilai FDR q menyesuaikan nilai P untuk beberapa pengujian dan mengontrol tingkat kesalahan tipe I.
  • Pengayaan Lipat: Mengukur besarnya pengayaan. Semakin tinggi nilainya, semakin tinggi pula derajat pengayaannya, yang merupakan indikator penting dari ukuran efek.
  • Gen Jalur: Jumlah total gen yang termasuk dalam jalur atau istilah GO.
  • nGenes: Jumlah gen dalam jalur yang tumpang tindih dengan daftar gen.

Perhatian harus diberikan ketika nilai FDR dari istilah GO adalah 0, 01 atau 0, 001. Daftar gen dengan ukuran yang wajar akan memberikan hasil yang lebih signifikan (FDR< 1E-5) are expected.

Jalan masuk skala besar, seperti siklus sel, sering kali memiliki kekuatan deteksi statistik yang tinggi, sehingga FDR sering menjadi lebih kecil, tetapi jalan masuk kecil mungkin memiliki FDR yang tinggi meskipun hubungan biologisnya yang tinggi. Analisis pengayaan cenderung lebih suka jalan masuk yang lebih besar.

Jika ukuran sampel besar, perbedaan kecil mungkin terlihat sangat signifikan. Oleh karena itu, peringkat hanya FDR jarang bermakna. Saat memprioritaskan jalan masuk, itu juga harus dianggap sebagai konsentrasi lipatan yang mencerminkan kekuatan pengayaan. Berikan beberapa cara untuk memperhitungkan nilai Q FDR dan pengayaan lipatan.

Banyak istilah GO terkait erat (misalnya, kontrol siklus sel, siklus sel), dan dapat memonopoli 20 teratas untuk membuat lorong lain tidak jelas. Untuk menghindari ini, pertimbangkan untuk memeriksa 50 item teratas. Selain itu, menggunakan plot pohon dan plot jaringan, cluster istilah go terkait diidentifikasi, dan tema komprehensif terungkap.

Diskusikan jalan masuk yang paling penting, bahkan jika itu tidak sesuai dengan cerita Anda.

Sort Pathway by
x-axis
Color
Size
Font Size
Circle Size
Color:High
Color:Low
Chart type
Aspect Ratio
Plot theme:

Unduh plotnya

A hierarchical clustering tree summarizes the correlation among significant pathways listed in the Enrichment tab. Pathways with many shared genes are clustered together. Bigger dots indicate more significant P-values. The width of the plot can be changed by adjusting the width of your browser window.
Aspect Ratio

unduh Perubahan tata letak Plot statis

Edge cutoff:

SMS kembali

Similar to the Tree tab, this interactive plot also shows the relationship between enriched pathways. Two pathways (nodes) are connected if they share 20% (default) or more genes. You can move the nodes by dragging them, zoom in and out by scrolling, and shift the entire network by click on an empty point and drag. Darker nodes are more significantly enriched gene sets. Bigger nodes represent larger gene sets. Thicker edges represent more overlapped genes.
Please select KEGG from the pathway databases to conduct enrichment analysis first. Then you can visualize your genes on any of the significant pathways. Only for some species.
Your genes are highlighted in red. Downloading pathway diagram from KEGG can take 3 minutes.

Penjelasan terperinci

Your genes are grouped by functional categories defined by high-level GO terms.
The characteristics of your genes are compared with the rest in the genome. Chi-squared and Student’s t-tests are run to see if your genes have special characteristics when compared with all the other genes or, if uploaded, a customized background.

Unduh Plot Kepadatan Mengunduh grafik batang

Window Size(Mb)
Steps in a window
FDR cutoff for windows

Label gen Hanya pengkodean gen Plot statis

The genes are represented by red dots. The purple lines indicate regions where these genes are statistically enriched, compared to the density of genes in the background. We scanned the genome with a sliding window. Each window is further divided into several equal-sized steps for sliding. Within each window we used the hypergeometric test to determine if your genes are significantly overrepresented. Essentially, the genes in each window define a gene set/pathway, and we carried out enrichment analysis. The chromosomes may be only partly shown as we use the last gene’s location to draw the line. Mouse over to see gene symbols. Zoom in regions of interest.

Jaringan PPI DEG

Pengayaan fungsi

To validate your results independent of our algorithm and database, your genes are sent to STRING-db website for enrichment analysis. This also enables the retrieval of a protein-protein network. If it is running, please wait until it finishes. The second time it is faster.

Sinygo dikembangkan dan dikelola oleh tim kecil Universitas Negeri Dakota Selatan (SDSU). Tim kami terdiri dari Xijin GE (Kepala Peneliti), Jianli Qi (peneliti), dan dua mahasiswa pascasarjana yang sangat baik (Emma Spors dan Ben Derenge). Kami tidak dilatih sebagai insinyur perangkat lunak. Namun, hasrat untuk mengembangkan alat yang mudah digunakan dibagikan untuk semua ahli biologi, terutama mereka yang tidak dapat mengakses Biogenichan.

Silakan kirim pendapat Anda, tayangan, laporan bug, permintaan fungsi, dll. Ke repositori GitHub. Untuk informasi lebih lanjut, lihat makalah kami dan demonstrasi terperinci. Shinygo berbagi banyak fungsi dan database dengan IDEP.

Kutipan (tidak cukup untuk mengisi URL!): GE SX, Jung D & amp; Yao R, Bioinformatika 36: 2628-2629, 2020. Jika Anda menggunakan diagram KEGT, Anda juga dapat mengutip Pathview dan Kapers Kapers.

Versi sebelumnya akan tetap berfungsi: ShinyGO V0. 77 (berdasarkan Ensembl Release 104, diarsipkan 5 Januari 2024) ShinyGO V0. 76 (berdasarkan Ensembl Release 104 (termasuk revisi), diarsipkan 2 September 2022 Diarsipkan) ShinyGO V0. 75 ( berdasarkan Ensembl Rilis 104 (termasuk revisi), diarsipkan pada 4 April 2022) ShinyGO V0. 74 (berdasarkan Ensembl Rilis 104, diarsipkan pada 8 Februari 2022) ShinyGO V0. 65 ( Berdasarkan Ensembl Rilis 103, diarsipkan 15 Oktober, 2021). 15, 2021 ShinyGO V0. 61, berdasarkan Ensembl Rilis 96, diarsipkan pada 23 Mei 2020 ShinyGO V0. 60, berdasarkan Ensembl Rilis Versi 96, diarsipkan pada 6 November 2019 ShinyGO V0. 51, berdasarkan rilis Ensembl versi 95, diarsipkan pada 20 Mei 2019 ShinyGO V0. 50, berdasarkan rilis Ensembl versi 92, diarsipkan pada 29 Maret 2019 ShinyGO V0. 41, berdasarkan rilis Ensembl versi 91 Diarsipkan pada 11 Juli 2018

Genomes based on STRING-db is marked as STRING-db. If the same genome is included in both Ensembl and STRING-db, users should use Ensembl annotation, as it is more updated and is supported in more functional modules.

Input:

Daftar ID gen yang dipisahkan berdasarkan tab, spasi, koma, dan karakter baris baru. ID gen Ensembl digunakan secara internal untuk mengidentifikasi gen. Jenis ID lainnya dipetakan ke ID gen Ensembl menggunakan informasi pemetaan ID yang tersedia di Ensembl BioMart.

Output:

Syarat dan jalur GO yang diperkaya:

Selain tabel pengayaan, sekumpulan plot juga dibuat. Jika Anda memilih database KEGG, diagram jalur yang diperkaya akan ditampilkan dengan gen Anda disorot:

Banyak istilah GO yang terkait. Beberapa bahkan berlebihan, seperti “siklus sel” dan “proses siklus sel.” Untuk memvisualisasikan asosiasi tersebut dalam hasil pengayaan, kami menggunakan pohon dan jaringan pengelompokan hierarki. Dalam pohon pengelompokan hierarki ini, istilah-istilah GO terkait dikelompokkan berdasarkan jumlah gen yang dimiliki bersama. Ukuran lingkaran padat sesuai dengan pengayaan FDR.

Dalam jaringan di bawah ini, setiap node mewakili istilah GO yang diperkaya. Istilah GO terkait dihubungkan dengan garis, yang ketebalannya mencerminkan persentase gen yang tumpang tindih. Ukuran node sesuai dengan jumlah gen.

Jaringan interaksi protein-protein (PPI) juga diperoleh melalui akses API ke STRING-db. Selain gambar jaringan statis, Anda juga dapat mengakses grafik interaktif di server web di www. string-db. org.

SinyGO juga mendeteksi motif pengikatan faktor transkripsi (TF) yang diperkaya dengan promotor gen pengguna.

Sources for human pathway databases:

Nama subtipe/database

ontologi gen

Proses Biologis (BP)

Komponen seluler (CC)

Fungsi molekul (MF)

Jalur Commons V9

Jalur Commons V9

Jalur Commons V9

Jalur Commons V9

Jalur Commons V9

Jalur Commons V9

Rilis sirkuit regulasi 1. 0

miRNA. target

MSigDB. Komputasi

kumpulan gen komputasi

MSigDB. Dikurasi

MSigDB. Ciri khas

MSigDB. Imunitas

MSigDB. Lokasi

MSigDB. motif

Motif TF dan miRNA

MSigDB. Onkogenik

Jalur Commons V9

Jalur Commons V9

Jalur Commons V9

Jalur Commons V9

Jalur Commons V9

Jalur Commons V9

Jalur Commons V9

Sources for mouse pathway databases:

ekspresi bersama

Gen yang diekspresikan secara berbeda dari 2526 penelitian

Basis data tanda tangan molekul, v. 6. 0

Daftar, v. 2006. 2

daftar gen kanker

database tanda tangan gen

Jalur metabolisme dan sinyal

Database jalur berbasis ontologi, v. 3. 4. 1

Platform terbuka untuk kurasi jalur

Mengintegrasikan objek jaringan dan hierarki

jalur transduksi sinyal

jalur metabolisme, R. 82. 0

Jaringan Metabolik Manusia Edinburgh

Jalur biokimia tikus, v2013. 7

Basis data toksikogenomik komparatif

sumber efek samping

Basis data ekspresi gen manusia

Buka data database obat/target

Database jalur molekul kecil

prediksi dan anotasi target miRNA, v. 5. 0

Target miRNA yang diprediksi, v. R 2010

Target miRNA yang diprediksi, v. 6. 2

Target miRNA yang Divalidasi Secara Eksperimental, v. 6. 0

Target miRNA yang divalidasi secara eksperimental, V6. 1

Situs miRNA yang diprediksi, v. 2007. 3

Target TF yang diprediksi

Gen target TF yang dikonfirmasi, v. 2013. 7

Regulasi campuran miRNA dan TF, v. 2012

Situs pengikatan TF yang dikonfirmasi, v7. 0

Lokasi genom pada kromosom, v. 2017

Ontologi Fenotip Manusia

Jaringan interaksi kimia dan protein

Ontologi Fenotip Mamalia

Database racun umum dan targetnya

Basis data interaksi jalur

Metilasi DNA manusia dan kanker

Metilasi DNA yang menyimpang pada kanker manusia

*Data sekunder dari GeneSetDB

Changes:

21/04/2024: Menambahkan istilah GO ke diagram batang baru.

20/04/2024: Penyesuaian UI

12/04/2024: Ukuran set maksimum ditingkatkan dari 2000 menjadi 5000. Beberapa istilah GO yang bermakna (Proses biosintetik RNA) mencakup lebih dari 4000 gen.

1/5/2024: ShinyGO 0. 80 sekarang menjadi default. Pertama, Anda perlu memilih spesies. Basis data telah diperbarui ke Ensembl rilis 107 dan berisi 620 spesies: 215 utama, 177 metazoa, 124 tumbuhan, 33 protista, 1 bakteri. Juga ditambahkan 14. 094 spesies dari STRING-DB 11. 5.

1/5/2023: ShinyGO 0. 80 dirilis dalam mode uji. Berkat upaya Jenny, diperbarui ke Ensembl rilis 107 dengan 620 spesies: 215 utama, 177 metazoa, 124 tumbuhan, 33 protista, 1 bakteri. Selain itu, 14. 094 spesies ditambahkan dari STRING-DB 11. 5.

19 Januari 2023 Umpan balik pengguna menemukan bug serius di Shynygo 0, 76. Karena ada gen yang diwakili oleh beberapa gen ID dalam ENSEBML, itu dihitung beberapa kali ketika menghitung konsentrasi. Saya pikir ini telah diperbaiki. Jika Anda telah menempelkan ID gen ensembled ke Sinygo 0, 76 antara 4 April 2022 dan 2023, silakan analisis lagi. Sinygo belum cukup diuji. G: Konfirmasikan kembali hasilnya dengan alat lain seperti Profiler, Enrichr, String-DB, dan David.

26 Oktober 2022: V. 0. 76. 3 Teks Hover telah ditambahkan. Ubah gaya plot. Ketika pengguna memilih “Urutkan demi pengayaan lipat”, ukuran masuk minimum dinaikkan menjadi 10 dan kebisingan dari set gen kecil telah dihapus.

28 September 2022: Di Shinygo 0. 76. 2, KEGG telah menjadi database jalur default. Lebih penting lagi adalah bahwa metode penghitungan gen default dikembalikan ke 0, 76. Dengan kata lain, secara default, semua gen kabel protein digunakan sebagai latar belakang. Fungsi baru yang menggunakan database jalan masuk untuk menentukan jumlah total gen di latar belakang, yang diperkenalkan di 0, 76, 1, dapat dihidupkan sebagai opsi (‘Gunakan database jalur untuk jumlah gen’). Ini didasarkan pada umpan balik dari beberapa pengguna bahwa metode baru akan secara signifikan mengubah nilai P saat menggunakan database jalan masuk kecil seperti KEGG.

3 September 2022: Shinygo 0. 76. 1. Perbaikan kecil ini telah meningkatkan metode penghitungan jumlah gen untuk menghitung nilai p. Gen harus cocok dengan setidaknya satu jalur dalam database jalan masuk yang dipilih. Kalau tidak, gen ini diabaikan dengan perhitungan nilai p berdasarkan distribusi geometris super. Ini berlaku untuk gen kueri dan gen latar belakang.

19 April 2022: Shinygo 0, 76 dirilis. Penyaringan masuk, jenis jalan masuk, dan unduhan angka telah ditingkatkan. Klik di sini untuk versi 0. 75.

17 April 2022: Menambahkan fleksibilitas pengunduhan dalam PDF, SVG, dan PNG resolusi tinggi.

8 April 2022: Menambahkan fungsi untuk menghapus jalan masuk yang berlebihan. Menambahkan filter untuk menghapus jalur yang sangat besar atau kecil. Diubah untuk selalu menampilkan tab KEGG.

7 Maret 2022: Memperbaiki masalah r-library yang mempengaruhi beberapa diagram KEGG.

2022 26 Februari 2022: Memperbaiki bug yang terkait dengan tab Plot saat menggunakan gen latar belakang. Gen latar tidak digunakan dengan benar dalam perhitungan distribusi berbagai karakteristik genetik. Jika plot ini penting dalam penelitian Anda, ulangi gen.

19 Februari 2022: R ditingkatkan dari 4. 05 menjadi 4. 1. 2. Ini memecahkan masalah API string. Beberapa paket biokonduktor telah ditingkatkan.

8 Februari 2022: ShinyGO v0. 75 resmi dirilis. Versi lama masih tersedia. Lihat tab terakhir.

15 November 2021 Basis data diperbarui. ShinyGO v0. 75 sekarang tersedia dalam mode uji. Termasuk pembaruan pada database Ensembl, spesies baru untuk Jamur Ensembl dan Protista Ensembl, dan pembaruan pada STRINGdb (5090 spesies) ke 11. 5.

25 Oktober 2021: Plot Genom Interaktif. Identifikasi wilayah genom yang kaya akan gen pengguna.

23 Oktober 2021 Versi 0. 741 Bagan pengayaan yang dapat disesuaikan sepenuhnya! Anda dapat beralih antara plot batang, plot titik, dan plot lollipop. Informasi genetik terperinci dengan tautan telah ditambahkan ke tab Gen.

15 Oktober 2021 Versi 0. 74. Basis data diperbarui ke Ensembl Rilis 104 dan STRING v11. Penggunaan gen latar belakang yang direkomendasikan dalam analisis pengayaan. Dengan V. 0. 74, kumpulan gen latar belakang yang besar pun dapat dianalisis lebih cepat.