Universitatea Southeast, Nanjing, China

învățarea

Universitatea Southeast, Nanjing, China

Universitatea Southeast, Nanjing, China

Universitatea Southeast, Nanjing, China

Universitatea Southeast, Nanjing, China

Universitatea Southeast, Nanjing, China

A fost adăugată o nouă alertă de citare!

Această alertă a fost adăugată cu succes și va fi trimisă la:

Veți fi notificat ori de câte ori a fost citată o înregistrare pe care ați ales-o.

Pentru a vă gestiona preferințele de alertă, faceți clic pe butonul de mai jos.

Alertă de citare nouă!

Salvați în Binder
KDD '16: Lucrările celei de-a 22-a conferințe internaționale ACM SIGKDD privind descoperirea cunoștințelor și extragerea datelor

ABSTRACT

Învățarea parțială a etichetelor se ocupă de problema în care fiecare exemplu de formare este reprezentat de un vector de caracteristică în timp ce este asociat cu un set de etichete candidate, dintre care doar o etichetă este validă. Pentru a învăța din astfel de informații ambigue de etichetare, cheia este să încercați să dezambiguați seturile de etichete candidate de exemple de formare parțială a etichetelor. Strategiile de dezambiguizare existente funcționează fie prin identificarea iterativă a etichetei adevărului de bază, fie prin tratarea în mod egal a fiecărui candidat. Cu toate acestea, procesul de dezambiguizare se desfășoară, în general, concentrându-se pe manipularea spațiului etichetei și, astfel, ignoră utilizarea deplină a informațiilor potențial utile din spațiul caracteristic. În această lucrare, se propune o nouă abordare în două etape pentru a învăța din exemple de etichete parțiale bazate pe dezambiguizarea conștientă de caracteristici. În prima etapă, structura multiplă a spațiului caracteristică este utilizată pentru a genera confidențe de etichetare normalizate peste setul de etichete candidate. În cea de-a doua etapă, modelul predictiv este învățat prin efectuarea unei regresii reglate cu mai multe ieșiri peste confidențele de etichetare generate. Experimente ample pe seturi de date parțiale și artificiale, precum și pe cele reale, validă în mod clar superioritatea abordării propuse de dezambiguizare conștientă de caracteristică.