DIETĂ: Grila și Cloud Middleware

Împuternicirea computerului de înaltă performanță din 2000

DIET (Distributed Interactive Engineering Toolbox) este un middleware conceput pentru calcul de înaltă performanță într-un mediu eterogen și distribuit (stații de lucru, clustere, grile, nori).

diet

DIET a fost creat și este în continuare activ îmbunătățit și actualizat de o comunitate open-source condusă de echipa de cercetare AVALON.

Introducere în DIETĂ

Printre abordările existente pentru middleware-ul de rețea, una simplă, puternică și flexibilă constă în utilizarea serverelor disponibile în diferite domenii administrative, prin paradigmele tradiționale client-server sau Remote Procedure Call (RPC). Serverele conectate la rețea (NES) implementează acest model, numit și Grid-RPC. Clienții trimit cereri de calcul unui planificator al cărui scop este să găsească un server disponibil pe resurse.

Scopul proiectului DIET este de a dezvolta un set de instrumente pentru a construi servere de calcul. Probleme uriașe pot fi acum calculate pe internet datorită mediilor de calculare a rețelei - cum ar fi Globus sau Legion - sau prin intermediul soluțiilor Cloud - precum Amazon EC2. Deoarece majoritatea aplicațiilor actuale sunt numerice, utilizarea bibliotecilor precum BLAS, LAPACK, ScaLAPACK sau PETSc este obligatorie. Integrarea unor astfel de biblioteci în aplicații de nivel înalt care utilizează limbaje precum Fortran sau C este departe de a fi ușoară. Mai mult decât atât, puterea de calcul și nevoile de memorie ale acestor aplicații ar putea, desigur, să nu fie disponibile pe fiecare stație de lucru. Astfel, RPC pare să fie un candidat bun pentru a construi medii de rezolvare a problemelor pe rețea.

Contextul DIETEI

Probleme mari, de la simulare numerică la știința vieții, pot fi acum rezolvate prin intermediul internetului folosind middleware-ul de rețea. Există mai multe abordări pentru portarea aplicațiilor pe platformele de rețea; exemplele includ transmiterea clasică a mesajelor, procesarea batch, portalurile web și sistemele Grid-RPC. Această ultimă abordare implementează o versiune grilă a modelului clasic de procedură la distanță (RPC). Clienții trimit cereri de calcul către un planificator care localizează unul sau mai multe servere disponibile pe grilă. Programarea este frecvent aplicată pentru a echilibra munca între servere și o listă de servere disponibile este trimisă înapoi clientului; clientul poate apoi să trimită datele și solicitarea către unul dintre serverele sugerate pentru a le rezolva problema. Datorită creșterii lățimii de bandă a rețelei și a reducerii latenței rețelei, cererile de calcul relativ mici pot fi acum trimise către serverele disponibile pe rețea. Pentru a utiliza în mod eficient platformele de resurse scalabile actuale, este important să se asigure scalabilitatea în straturile de middleware.