Non è possibile creare un buon modello di apprendimento automatico senza buoni dati di addestramento. Ma costruire questi set di allenamento è difficile, spesso lavoro manuale, che coinvolge l'etichettatura di migliaia e migliaia di immagini, per esempio. Con SageMaker, AWS ha lavorato a un servizio che semplifica notevolmente i modelli di apprendimento della macchina. Ma fino ad oggi, quell'attività di etichettatura era ancora valida per l'utente. Ora, tuttavia, l'azienda sta lanciando SageMaker Ground Truth, un servizio di etichettatura del set di formazione.

Utilizzando Ground Truth, gli sviluppatori possono indirizzare il servizio ai bucket di archiviazione che contengono i dati e consentire al servizio di etichettarli automaticamente. Ciò che è bello qui è che puoi sia impostare un livello di confidenza per il servizio completamente automatico o che puoi inviare i dati ai lavoratori umani. Quegli etichettatori umani, che probabilmente hanno il lavoro più avvincente in ambito tecnologico, possono essere gli utenti di Mechanical Turk della compagnia o il servizio di terze parti. Se davvero odi i tuoi dipendenti, puoi fare anche loro l'etichettatura.

Attualmente il servizio supporta la classificazione del testo, la classificazione delle immagini, il rilevamento degli oggetti e la segmentazione semantica. Gli utenti possono anche creare le proprie attività. 

Con l'arrivo dei dati di etichettatura, Ground Truth estrae alcuni oggetti e li invia a etichettatori umani per creare un nuovo modello personalizzato per l'utente.

"Questo è un cambio di gioco in grado di etichettare i tuoi dati", ha dichiarato Andy Jassy, CEO di AWS. "Così puoi costruire quei tipi di modelli che prima erano veramente difficili o quasi impossibili o troppo costosi da fare."

loading...