În consorțiul GO, există o serie de baze de date model de organisme care sunt sursa autoritară a adnotărilor GO pentru speciile lor respective. Aceste grupuri integrează, de asemenea, adnotări din alte surse, inclusiv GOA (o resursă multi-specie) în mod regulat.

specifice speciei

GOA oferă, de asemenea, o serie de fișiere specifice speciilor pentru om, șoarece, șobolan, pește zebră, Arabidopsis, pui, câine, vacă, porc, Dictyostelium, vierme, drojdie și Drosophila. Adnotările din aceste fișiere se bazează pe intrări în proteomul de referință centrat pe genă UniProtKB (GCRP), complexe proteice (Portal complex) și ARN-uri necodificatoare (RNACentral). GOA integrează adnotări manuale de la toate celelalte grupuri GO Consortium, precum și o serie de grupuri de adnotări externe în care identificatorul de produse genetice adnotate poate fi mapat la unul dintre cei trei identificatori pe care îi acceptăm (UniProtKB, Complex Portal și RNACentral ID-uri).
Atât grupul de organisme model, cât și fișierele specifice speciilor GOA sunt disponibile pe site-ul nostru FTP.

2. De ce nu pot vedea o adnotare într-o înregistrare UniProtKB când apare în fișierul de asociere genică?


Ar putea exista o serie de motive pentru aceasta:

A. Dacă se pare că lipsește o adnotare manuală:

Dacă adnotarea GO a fost creată recent, este posibil ca UniProtKB să nu fi făcut încă referință încrucișată; poate exista un decalaj de până la 3 luni.

B. Dacă se pare că lipsește o adnotare electronică:

Dacă vă uitați la o intrare curată UniProtKB (adică una din secțiunea Swiss-Prot din UniProtKB), atunci nu toate afișările electronice sunt afișate aici. Sunt incluse doar adnotările din anumite metode, cum ar fi mapările HAMAP2GO și EC2GO.

În plus, seturile de adnotări GO afișate în UniProtKB sunt filtrate pentru a încerca să ofere un set cuprinzător, dar concis de referințe încrucișate. Pentru a trece de la înregistrarea UniProtKB la browserul QuickGO (care va afișa cel mai actualizat și complet set de adnotări manuale și electronice pentru o proteină) faceți clic pe linkul „[Vizualizați adnotarea completă GO pe QuickGO]” la partea de jos a secțiunii de referințe încrucișate GO a intrării UniProtKB.

Cu toate acestea, dacă niciunul dintre aceste motive nu se aplică adnotării dvs. lipsă, vă rugăm să ne informați și vom investiga!

3. De ce sunt diferite fișierele specifice speciei și fișierul de asociere a genelor multi-specie UniProt?


Fișierul de asociere a genei GOA UniProt conține toate adnotările manuale și electronice pe care GOA le-a atribuit intrărilor UniProtKB. Acest set de date conține adnotări la peste 800.000 de specii diferite (https://www.ebi.ac.uk/GOA/uniprot_release) și este redundant pentru adnotările electronice în care două metode electronice diferite au atribuit același termen GO sau mai puțin granular.

Fișierele specifice speciei sunt create folosind seturile complete de proteomi de referință pentru a determina compoziția proteinelor fișierelor. Fișierele specifice speciei pot conține adnotări atât pentru accesările UniProtKB revizuite (Swiss-Prot), cât și pentru cele nerevizuite (TrEMBL). Orice utilizator care dorește să identifice doar subsetul de adnotări proteice UniProt revizuit (Swiss-Prot) va putea continua să facă acest lucru folosind informațiile furnizate în fișierul gp_information.goa_uniprot, care pot fi găsite aici; ftp://ftp.ebi.ac.uk/pub/databases/GO/goa/UNIPROT/gp_ .

Ne propunem să eliminăm adnotările electronice din fișierele specifice speciei care au fost create prin aceeași tehnică și care au prezis aceiași termeni GO sau mai puțin granulari.

4. Cum schimb între accesiunile UniProt și alți identificatori, de ex. Ansamblu, EMBL, RefSeq Gene ID?


UniProt oferă un serviciu de cartografiere care poate converti accesurile UniProt la accesări din mai multe baze de date, inclusiv bazele de date de secvențe de nucleotide EMBL/Genbank/DDBJ, Ensembl, GeneID și RefSeq. si invers. Acest serviciu poate fi găsit aici. Dacă aveți nevoie de mai multe informații sau ajutor pentru utilizarea acestui serviciu, puteți trimite un e-mail la [email protected] .

5. Ce instrumente GO pot folosi pentru a afișa/compara adnotările cu proteinele/genele mele selectate?


Pe lângă QuickGO, consorțiul GO are disponibile pe site-ul lor și alte instrumente utile pentru analiza GO. Acestea pot fi găsite aici: http://amigo.geneontology.org/amigo/software_list

6. Este corect să presupunem că produsele genetice adnotate unui copil al unui termen GO vor fi considerate automat parte a termenului părinte?

Da, este sigur să presupunem acest lucru, deoarece fiecare termen GO trebuie să urmeze adevărata regulă a căii: dacă termenul copil descrie produsul genetic, atunci trebuie să se aplice și toți termenii părinți ai acestuia. Deci, dacă un produs genetic este adnotat la „activitatea proteinei tirozin kinazei”, termenii părinți cum ar fi „activitatea protein kinazei” și „fosforilarea peptidil-tirozinei” se aplică și produsului genetic.

7. Cu cine contactez dacă există o eroare de adnotare într-unul din fișierele dvs.?


Dacă găsiți o eroare de adnotare, vă rugăm să trimiteți un e-mail la GOA ([email protected]) cu cât mai multe detalii cu privire la adnotarea în cauză. Apoi, fie o vom putea corecta, fie o vom transmite la baza de date responsabilă de adnotare, astfel încât să o poată corecta.

8. Cum descarc un set masiv de adnotări GO? Ce formate există?


Toate adnotările GOA GO la accesările UniProtKB sunt disponibile de la:

Există un fișier ReadMe.txt care explică diferitele fișiere de adnotare disponibile. Generăm două formate de fișiere care sunt utilizate în consorțiul GO. Fișierul de adnotare genică (GAF) este un fișier delimitat de tabulat cu 17 coloane. Formatul de fișier este conform specificațiilor cerute de consorțiul GO și, prin urmare, sunt afișate ID-urile GO și nu numele termenilor GO. În plus față de formatul GAF, oferim și un fișier de date de adnotare a produselor gene (GPAD), care este un fișier delimitat de tabulare cu 12 coloane și este mai normalizat decât GAF. Dacă doriți o versiune mai personalizată a unui fișier de adnotări, instrumentul nostru QuickGO vă poate permite să filtrați adnotările care vă interesează și să le exportați ca fișier TSV. Formatul TSV va avea, de asemenea, atât termenul GO, cât și ID-ul termenului GO, permițându-vă să vedeți rapid la ce termen GO a fost adnotat un produs genetic.

9. GO slims - Ce sunt? Cum pot face una?


Slimurile GO sunt versiuni reduse ale ontologiilor GO care conțin termeni care acoperă principalele aspecte ale fiecăreia dintre cele trei ontologii GO. Ele oferă o imagine de ansamblu largă asupra conținutului ontologiei fără detaliile termenilor specifici cu granulație fină.

Deoarece fiecare comunitate are nevoi diferite, o varietate de fișiere subțiri GO au fost arhivate pe pagina de pornire GO de către membrii consorțiului. Documentații suplimentare și linkuri către aceste subțiri pot fi găsite la: http://www.geneontology.org/GO.slims.shtml

Instrumentul QuickGO de la GOA poate fi utilizat pentru a accesa sau modifica subțirile consorțiului GO sau pentru a crea unul de-al tău. Puteți accesa această funcționalitate din pagina Explorare biologie de pe QuickGO

10. Ce înseamnă codurile de probă?


Fiecare adnotare transmisă către GO trebuie atribuită unei surse - cum ar fi o referință din literatură, o altă bază de date sau o analiză de calcul. În plus, aceste adnotări trebuie să indice ce fel de dovezi se găsesc în sursa citată pentru a sprijini asocierea dintre produsul genetic și termenul GO. Dacă doriți să găsiți informații mai detaliate despre semnificația și utilizarea codurilor de dovezi, documentația poate fi găsită pe site-ul web GO la: http://www.geneontology.org/page/guide-go-evidence-codes

11. Cum citesc GOA?


Dacă utilizați date obținute de la GOA sau QuickGO într-o publicație, vă rugăm să citați următoarea lucrare:

Huntley RP, Sawford T, Mutowo-Meullenet P, Shypitsyna A, Bonilla C, Martin MJ, O Donovan C
Baza de date GOA: actualizări de adnotări Gene Ontology pentru 2015.
Acizi nucleici Res. 2015 ianuarie; 43: D1057-63