Ați lucrat vreodată cu un set de date care a avut atât de multe observații și/sau variabile încât nu ați putut vedea pădurea pentru copaci? Ați dori să extrageți niște informații simple, dar nu vă puteți da seama cum să le faceți.

utilizarea

Cunoașteți Stata’s colaps comandă - este noul tău prieten. Reducerea vă permite să convertiți setul de date curent într-un set de date mult mai mic de mijloace, mediane, maxime, minime, numărare sau percentile (alegerea dvs. din care percentilă).

Să aruncăm o privire la un exemplu. În prezent, mă uit la un set de date longitudinale plin de date economice din toate cele 67 de județe din Alabama. Perioada de timp este în decenii, din 1960 până în 2000. Cinci perioade de timp din 67 de județe îmi oferă un total de 335 de observații.

Ce se întâmplă dacă aș vrea să văd niște informații despre tendințe, cum ar fi populația totală și locurile de muncă pe deceniu pentru toată Alabama? Vreau doar un tabel simplu pentru a vedea rezultatele mele, precum și un grafic. Vreau rezultate pe care să le pot copia și lipi într-un document Word.

conserva

colaps (sumă) Pop Jobs, după (an)
graph twoway (line Pop year) (line Jobs year), ylabel (, angle (horizontal))
listă

Și iată rezultatul meu:

Începând codul meu cu conserva comanda îmi readuce setul de date la starea inițială după ce mi-a oferit rezultatele dorite.

Ce se întâmplă dacă vreau să analizez variabilele care sunt în procente, cum ar fi procentul absolvenților de facultate, mobilitatea și rata de participare a forței de muncă (lfp)? În acest caz, nu vreau să însumăm valorile, deoarece acestea sunt în procente.

Calculul mediei ar da o pondere egală tuturor județelor, indiferent de mărime.

Din fericire, Stata vă oferă un mod foarte simplu de a vă cântări datele pe baza frecvenței. Trebuie să determinați ce variabilă să utilizați. În această situație voi folosi variabila populație.

Iată codarea și rezultatele mele:

Păstrați
colaps (medie) lfp College Mobil [fw = Pop], după (an)
graph twoway (line lfp year) (line College year) (line Mobil year), ylabel (, angle (horizontal))
listă



Este la fel de ușor ca asta. Acesta este unul dintre cele cinci sfaturi și trucuri pe care le voi discuta în timpul seminariului web gratuit Stata, miercuri, 29 iulie.

Jeff Meyer este consultant statistic la The Analysis Factor, un mentor statistic pentru membrii Statistic Speaking și un instructor de atelier. Citiți mai multe despre Jeff aici.