Scorul adnotării: 4 din 5

regulon

Scorul de adnotare oferă o măsură euristică a conținutului de adnotare al unei intrări sau proteome UniProtKB. Acest scor nu poti să fie utilizat ca o măsură a acurateței adnotării, deoarece nu putem defini „adnotarea corectă” pentru nicio proteină dată.

- Proteine ​​deduse din omologie i

Acest lucru indică tipul de dovezi care susține existența proteinei. Rețineți că dovada „existenței proteinelor” nu oferă informații cu privire la acuratețea sau corectitudinea secvențelor afișate.

Selectați o secțiune din stânga pentru a vedea conținutul.

Această secțiune oferă orice informații utile despre proteine, în principal cunoștințe biologice.

Regiuni

Această subsecțiune a secțiunii Funcție specifică poziția și tipul fiecărui domeniu de legare a ADN-ului prezent în proteină.

Informații validate manual, generate de sistemul automat de adnotare UniProtKB.

Afirmare manuală conform regulilor i

Proiectul Gene Ontology (GO) oferă un set de vocabular controlat ierarhic împărțit în 3 categorii:

GO - Funcția moleculară i

Dedus din aspectul biologic al strămoșului

Un tip de dovadă filogenetică prin care un aspect al unui descendent este dedus prin caracterizarea unui aspect al unei gene ancestrale.

Mai multe informații în ghidul codului de probă GO

Dedus din aspectul biologic al strămoșului i

GO - Proces biologic i

Se deduce din fenotipul mutant

Descrie adnotările care se concluzionează din examinarea variațiilor sau modificărilor unui produs genetic, cum ar fi mutațiile sau nivelurile anormale și include tehnici precum eliminări, supraexpresie, experimente anti-simț și utilizarea inhibitorilor de proteine ​​specifice.

Mai multe informații în ghidul codului de probă GO

Se deduce din fenotipul mutant i

Se deduce din modelul de expresie

Acoperă cazurile în care adnotarea este dedusă din momentul sau locația de exprimare a unei gene.

Mai multe informații în ghidul codului de probă GO

Dedus din modelul de expresie i

Cuvintele cheie UniProtKB constituie un vocabular controlat cu o structură ierarhică. Cuvintele cheie rezumă conținutul unei intrări UniProtKB și facilitează căutarea proteinelor de interes.

Baze de date cu enzime și căi

Colecția BioCyc de baze de date Pathway/Genome

Această secțiune oferă informații despre numele și sinonimele (proteinele) și genele și despre organismul care este sursa secvenței de proteine.

Nume și taxonomie i

Această subsecțiune a secțiunii Nume și taxonomie oferă o listă exhaustivă a tuturor denumirilor proteinelor, de la cele utilizate în mod obișnuit până la învechire, pentru a permite identificarea fără echivoc a unei proteine.

Această subsecțiune a secțiunii Nume și taxonomie indică numele (numele) genei care codifică secvența (secvențele) de proteine ​​descrise în intrare. Există patru jetoane distincte: „Nume”, „Sinonime”, „Nume de locus ordonat” și „Nume ORF”.

Această subsecțiune a secțiunii Nume și taxonomie oferă informații cu privire la numele (numele) organismului care este sursa secvenței de proteine.

Această subsecțiune a secțiunii Nume și taxonomie arată identificatorul unic atribuit de NCBI organismului sursă al proteinei. Acesta este cunoscut sub numele de „identificator taxonomic” sau „taxid”.

Această subsecțiune a secțiunii Numele și taxonomia conține linia de clasificare ierarhică taxonomică a organismului sursă. Acesta listează nodurile așa cum apar de sus în jos în arborele taxonomic, cu gruparea mai generală listată mai întâi.

Această subsecțiune a secțiunii Nume și taxonomie este prezentă pentru intrările care fac parte dintr-un proteom, adică a unui set de proteine ​​considerate a fi exprimate de organisme ale căror genomi au fost complet secvențați.

Un proteom UniProt poate consta din mai multe componente.
Numele componentei se referă la componenta genomică care codifică un set de proteine.

Baze de date specifice organismelor

Baza de date a genomului Pseudomonas

Această secțiune oferă informații despre localizarea și topologia proteinei mature din celulă.

Localizarea subcelulară i

GO - Componenta celulară i

    citosol Sursa: GO_Central Dedus din aspectul biologic al strămoșului i

    Cuvinte cheie - Componenta celulară i

    Această secțiune oferă informații despre boala (bolile) și fenotipul (ele) asociate cu o proteină.

    Patologie și Biotehnologie i

    Această subsecțiune a secțiunii „Patologie și biotehnologie” descrie efectele in vivo cauzate de ablația genei (sau a unuia sau mai multor transcrieri) care codifică proteina descrisă în intrare. Aceasta include eliminarea și eliminarea genelor, cu condiția ca experimentele să fi fost efectuate în contextul unui organism întreg sau a unui țesut specific, și nu la nivelul unei singure celule.

    Fenotip de întrerupere i

    Informații curate manual pentru care există dovezi experimentale publicate.

    Afirmație manuală bazată pe experiment în i

    Această secțiune descrie modificările post-traducere (PTM) și/sau evenimentele de procesare.

    PTM/Procesare i

    Prelucrarea moleculelor

    Această subsecțiune a secțiunii „PTM/Prelucrare” descrie întinderea unui lanț polipeptidic în proteina matură după procesare sau scindare proteolitică.

    Modificări ale aminoacizilor

    Această subsecțiune a secțiunii „PTM/Prelucrare” specifică poziția și tipul fiecărui reziduu modificat, cu excepția lipidelor, glicanilor și a reticulelor proteice.

    Afirmare manuală conform regulilor i

    Cuvinte cheie - PTM i

    Baze de date proteomice

    PaxDb, o bază de date cu abundența de proteine ​​medii în toate cele trei domenii ale vieții

    Baza de date IDEntifications PRoteomics

    Această secțiune oferă informații cu privire la expresia unei gene la nivelul ARNm sau proteine ​​în celule sau în țesuturile organismelor multicelulare.

    Baze de date de expresie genică

    Baza de date CollecTF a siturilor de legare a factorului de transcripție bacteriană

    Această secțiune oferă informații cu privire la structura terțiară și secundară a unei proteine.

    Baze de date cu structură 3D

    Depozitul SWISS-MODEL - o bază de date cu modele de structuri proteice 3D adnotate

    Baza de date a modelelor comparative de structuri proteice

    Această secțiune oferă informații despre asemănările secvenței cu alte proteine ​​și domeniul (domeniile) prezent (e) într-o proteină.

    Familia și domeniile i

    Domenii și repetări

    Această subsecțiune a secțiunii Familie și domenii descrie poziția și tipul unui domeniu, care este definit ca o combinație specifică de structuri secundare organizate într-o structură sau o pliere caracteristică tridimensională.

    Afirmare manuală conform regulilor i

    Baze de date filogenomice

    Baza de date HOGENOM a genelor omoloage din organisme complet secvențiate

    InParanoid: Grupuri de ortolog eucariot

    Identificarea ortologilor din datele complete ale genomului

    Baza de date pentru colecții complete de filogenii genetice

    Baze de date familiale și de domenii

    Baza de date a domeniilor conservate

    Adnotarea structurală și funcțională Gene3D a familiilor de proteine

    Resursă integrată de familii de proteine, domenii și site-uri funcționale

    Sistemul de clasificare PANTHER

    Baza de date a domeniului proteinei Pfam

    Instrument simplu de cercetare a arhitecturii modulare; o bază de date de domeniu proteic

    Baza de date a superfamiliei de adnotări structurale și funcționale

    TIGRFAM-uri; o bază de date a familiei de proteine

    CERE; un domeniu de proteine ​​și o bază de date familială

    Această secțiune afișează în mod implicit secvența canonică de proteine ​​și la cerere toate izoformele descrise în intrare. De asemenea, include informații relevante pentru secvență (e), inclusiv lungimea și greutatea moleculară. Informațiile sunt înregistrate în diferite subsecțiuni. Subsecțiunile actuale și conținutul acestora sunt enumerate mai jos:

    Această subsecțiune a secțiunii Secvență indică dacă secvența canonică afișată implicit în intrare este completă sau nu.

    Starea secvenței i: Complet.

    Suma de control este o formă de verificare a redundanței care este calculată din secvență. Este util pentru urmărirea actualizărilor secvenței.

    Trebuie remarcat faptul că, deși, în teorie, două secvențe diferite ar putea avea aceeași valoare a sumei de control, probabilitatea ca acest lucru să se întâmple este extrem de scăzută.

    Cu toate acestea, UniProtKB poate conține intrări cu secvențe identice în cazul mai multor gene (paralogi).

    Suma de control este calculată ca secvență 64-bit Cyclic Redundancy Check value (CRC64) folosind polinomul generatorului: x 64 + x 4 + x 3 + x + 1. Algoritmul este descris în standardul ISO 3309.

    Presă W.H., Flannery BP, Teukolsky S.A. și Vetterling W.T.
    Redundanță ciclică și alte sume de control
    Rețete numerice în ediția a II-a C, Pp896-902, Cambridge University Press (1993))

    Suma de verificare: și AD7FAEFA7F8004A3

    Informații experimentale

    Această subsecțiune a secțiunii „Secvență” raportează diferențele dintre secvența canonică (afișată implicit în intrare) și diferitele trimiteri de secvențe îmbinate în intrare. Aceste depuneri diferite pot proveni din diferite proiecte de secvențiere, diferite tipuri de experimente sau diferite probe biologice. Conflictele de secvență sunt de obicei de origine necunoscută.

    Baze de date secvențiale

    Baza de date a secvențelor de nucleotide EMBL

    Baza de date de secvențe de nucleotide GenBank

    DNA Data Bank din Japonia; o bază de date de secvențe de nucleotide

    Baza de date a secvenței de proteine ​​a resursei de informații privind proteinele

    Secvențe de referință NCBI

    Baze de date de adnotare a genomului

    Ansamblul proiectului de adnotare a genomului bacterian și arheal

    Baza de date a genelor din genomurile NCBI RefSeq

    KEGG: Enciclopedia Kyoto a genelor și genomilor

    Centrul de integrare a resurselor Pathosystems (PATRIC)

    Această secțiune oferă legături către proteine ​​similare cu secvența (secvențele) de proteine ​​descrise în această intrare la diferite niveluri ale pragurilor de identitate a secvenței (100%, 90% și 50%) pe baza apartenenței lor la clusterele de referință UniProt (UniRef).

    Proteine ​​similare i

    Această secțiune este utilizată pentru a indica informații legate de intrări și găsite în colecții de date, altele decât UniProtKB.

    Baze de date secvențiale

    Baze de date cu structură 3D

    Baze de date proteomice

    Baze de date de protocoale și materiale

    Depozitul de plasmide DNASU

    Baze de date de adnotare a genomului

    Baze de date specifice organismelor

    Baze de date filogenomice

    Baze de date cu enzime și căi

    Baze de date de expresie genică

    Baze de date familiale și de domenii

    ProtoNet; Clasificarea ierarhică automată a proteinelor

    MobiDB: o bază de date cu tulburări de proteine ​​și adnotări de mobilitate

    Această secțiune oferă informații generale despre intrare.

    Informații de intrare i

    Această subsecțiune a secțiunii „Informații despre intrare” oferă un identificator mnemonic pentru o intrare UniProtKB, dar nu este un identificator stabil. Fiecărei intrări revizuite i se atribuie un nume de intrare unic la integrarea în UniProtKB/Swiss-Prot.

    Această subsecțiune a secțiunii „Informații de intrare” furnizează unul sau mai multe numere de acces. Aceștia sunt identificatori stabili și ar trebui folosiți pentru a citi intrările UniProtKB. După integrarea în UniProtKB, fiecărei intrări i se atribuie un număr unic de accesare, numit „număr de accesare primar (citabil)”.

    Această subsecțiune a secțiunii „Informații despre intrare” arată data integrării intrării în UniProtKB, data ultimei actualizări a secvenței și data ultimei modificări de adnotare („Ultima modificare”). De asemenea, sunt afișate numărul versiunii atât pentru intrare, cât și pentru secvența canonică.

    Această subsecțiune a secțiunii „Informații despre intrare” indică dacă intrarea a fost adnotată manual și revizuită de curatorii UniProtKB sau nu, cu alte cuvinte, dacă intrarea aparține secțiunii Swiss-Prot din UniProtKB (revizuit) sau la secțiunea TrEMBL adnotată de computer (nerecomandat).

    Această secțiune conține orice informații relevante care nu se încadrează în alte secțiuni definite