În 2016, un supercomputer l-a învins pe campionul mondial la Go, un joc de societate complicat. Cum? Prin utilizarea învățării prin întărire, un tip de inteligență artificială prin care computerele se antrenează după ce au fost programate cu instrucțiuni simple. Calculatoarele învață din greșelile lor și, pas cu pas, devin extrem de puternice.

inginerii

Principalul dezavantaj al învățării prin întărire este că nu poate fi utilizat în unele aplicații din viața reală. Acest lucru se datorează faptului că, în procesul de instruire, computerele încearcă inițial orice sau orice înainte de a se împiedica în cele din urmă pe calea cea bună. Această fază inițială de încercare și eroare poate fi problematică pentru anumite aplicații, cum ar fi sistemele de control al climei în care schimbările bruște de temperatură nu ar fi tolerate.

Învățarea manualului șoferului înainte de pornirea motorului

Inginerii CSEM au dezvoltat o abordare care depășește această problemă. Au arătat că computerele pot fi instruite mai întâi pe modele teoretice extrem de simplificate înainte de a fi pregătite să învețe pe sistemele din viața reală. Asta înseamnă că, atunci când computerele încep procesul de învățare automată pe sisteme din viața reală, se pot baza pe ceea ce au învățat anterior pe modele. Prin urmare, computerele pot intra rapid pe calea cea bună, fără a trece printr-o perioadă de fluctuații extreme. Cercetarea inginerilor tocmai a fost publicată în IEEE Transactions on Neural Networks and Learning Systems.

„Este ca și cum ai învăța manualul șoferului înainte de a porni o mașină”, spune Pierre-Jean Alet, șeful cercetării sistemelor energetice inteligente la CSEM și coautor al studiului. „Cu acest pas de pregătire prealabilă, computerele acumulează o bază de cunoștințe pe care se pot baza, astfel încât să nu zboare orb în timp ce caută răspunsul corect”

Reducerea consumului de energie cu peste 20%

Inginerii și-au testat abordarea pe un sistem de încălzire, ventilație și aer condiționat (HVAC) pentru o clădire complexă de 100 de camere, utilizând un proces în trei pași. În primul rând, au instruit un computer pe un „model virtual” construit din ecuații simple care descriu aproximativ comportamentul clădirii. Apoi au introdus datele reale ale clădirii (temperatura, cât timp au fost deschise jaluzelele, condițiile meteorologice etc.) în computer, pentru a face antrenamentul mai precis. În cele din urmă, au lăsat computerul să ruleze algoritmii de învățare a întăririi pentru a găsi cel mai bun mod de a gestiona sistemul HVAC. Aplicații largi

Această descoperire ar putea deschide noi orizonturi pentru învățarea automată prin extinderea utilizării sale la aplicații în care fluctuațiile mari ale parametrilor de operare ar avea costuri financiare sau de securitate importante.