Este disponibilă o versiune mai nouă a acestei documentații. Utilizați meniul de versiuni de mai sus pentru a vizualiza cea mai actualizată versiune a documentației Greenplum 5.x.

datelor

Subiectele din această secțiune descriu metodele de încărcare și scriere a datelor într-o bază de date Greenplum și cum se formată fișierele de date.

Baza de date Greenplum acceptă încărcarea și descărcarea datelor paralele de înaltă performanță, iar pentru cantități mai mici de date, un singur fișier, importul și exportul de date non-paralele.

În cel mai simplu caz, comanda COPY SQL încarcă datele într-un tabel dintr-un fișier text care este accesibil instanței principale a bazei de date Greenplum. Acest lucru nu necesită configurare și oferă performanțe bune pentru cantități mai mici de date. Cu comanda COPY, datele copiate în sau din baza de date trec între un singur fișier de pe gazda principală și baza de date. Aceasta limitează dimensiunea totală a setului de date la capacitatea sistemului de fișiere în care se află fișierul extern și limitează transferul de date la un singur flux de scriere a fișierelor.

Opțiuni mai eficiente de încărcare a datelor pentru seturi de date mari profită de arhitectura MPP a bazei de date Greenplum, folosind segmentele bazei de date Greenplum pentru a încărca date în paralel. Aceste metode permit încărcarea simultană a datelor de la mai multe sisteme de fișiere, prin mai multe NIC-uri, pe mai multe gazde, realizând rate de transfer de date foarte mari. Tabelele externe vă permit să accesați fișiere externe din baza de date ca și cum ar fi tabele obișnuite ale bazei de date. Atunci când sunt utilizate cu gpfdist, programul de distribuire a fișierelor paralele cu baza de date Greenplum, tabelele externe oferă paralelism complet utilizând resursele tuturor segmentelor bazei de date Greenplum pentru a încărca sau descărca date.

Baza de date Greenplum utilizează arhitectura paralelă a sistemului de fișiere distribuite Hadoop pentru a accesa fișierele de pe acel sistem.