[#Build2019] Microsoft annuncia conversazioni 'umane' con Cortana

mag 6, 2019

L'assistente digitale Microsoft sarà in grado di dialogare in maniera naturale con gli interlocutori sulle varie piattaforme.

Conversazioni-umane-cortana
Nel corso del Day 1 di Microsoft Build 2019 Conference, in corso di svolgimento in quel di Seattle, Microsoft ha annunciato miglioramenti sensibili per il suo assistente digitale multi-piattaforma.

L'Intelligenza Artificiale alla base di Cortana consentirà di utilizzare l'assistente instaurando conversazioni 'umane', con domande e risposte che seguiranno logiche naturali di conversazioni, anziché frasi precompilate e predefinite.

Gli assistenti intelligenti di oggi sono pieni di abilità. Possono controllare il tempo, il traffico e i risultati sportivi. Possono riprodurre musica, tradurre parole e inviare messaggi di testo. Possono persino fare matematica, raccontare barzellette e leggere storie. Ma quando si tratta di conversazioni che portano da qualche parte più grandi, le ruote cadono.

"Devi cercare le magiche combinazioni di parole per far accadere diverse cose, e scopri che molte delle funzioni che ti aspetti da fare, in realtà non sono in grado di gestire", ha affermato Dan Roth, azienda vicepresidente ed ex CEO di Semantic Machines, acquisita da Microsoft nel maggio 2018 .

Ad esempio, ha spiegato, i sistemi oggi possono aggiungere un nuovo appuntamento al tuo calendario, ma non impegnarsi in un dialogo avanti e indietro con te su come destreggiarsi con una richiesta di riunione ad alta priorità. Inoltre, non sono in grado di utilizzare le informazioni contestuali di un'abilità per assisterti nel prendere decisioni da un'altra, come controllare il tempo prima di pianificare una riunione pomeridiana nel patio di un bar nelle vicinanze.

La prossima generazione di tecnologie di assistente intelligenti di Microsoft sarà in grado di fare ciò sfruttando le innovazioni nell'intelligenza artificiale e nell'apprendimento automatico conversazionale introdotte da Semantic Machines.

Il team ha svelato la sua visione per il prossimo salto nella tecnologia di interfaccia in linguaggio naturale oggi a Microsoft Build , una conferenza annuale per sviluppatori, a Seattle, e ha annunciato piani per incorporare questa tecnologia in tutti i suoi prodotti e strumenti di intelligenza artificiale, tra cui Cortana.

Contesto e concetti di insegnamento

Le interfacce in linguaggio naturale sono tecnologie che mirano a permetterci di comunicare con i computer nello stesso modo in cui parliamo l'un l'altro. Quando le interfacce del linguaggio naturale funzionano come Roth e la sua squadra immaginano, i nostri computer ci capiranno, converseranno con noi e faremo ciò che vogliamo che facciano, proprio come molte persone possono capire una richiesta complessa che richiede alcune azioni.

"Essere in grado di esprimerci nel modo in cui ci siamo evoluti per comunicare e essere in grado di legarlo in tutti questi sistemi davvero complicati senza dover sapere come funzionano è la promessa e la visione delle interfacce del linguaggio naturale", ha affermato Roth.

Dan Roth sta con le braccia incrociate davanti a un bancone con un motivo a strisce colorate

Dan Roth, vicepresidente corporate di Microsoft ed ex CEO di Semantic Machines, ha affermato che la tecnologia del suo team consentirà ai computer di capirci, conversare con noi e fare ciò che vogliamo che facciano. Foto di Dana Quigley per Microsoft.

La tecnologia del linguaggio naturale negli odierni assistenti intelligenti come Cortana fa leva sull'apprendimento automatico per comprendere l'intento del comando di un utente. Una volta determinato l'intento, viene attivato un programma scritto a mano - un'abilità - che segue una serie predeterminata di azioni.

Ad esempio, la domanda "Chi ha vinto la partita di calcio di oggi tra Liverpool e Barcellona?" Suggerisce un'abilità sportiva che segue le regole di uno script precodificato per riempire gli slot per il tipo di sport, informazioni richieste, data e squadre. "Pioverà questo fine settimana?" Suggerisce un'abilità meteorologica e segue le regole pre-sceneggiate per ottenere le previsioni del weekend.

Poiché le regole per questi scambi sono scritte a mano, gli sviluppatori devono anticipare tutti i modi in cui l'abilità potrebbe essere utilizzata e scrivere un copione per coprire ogni scenario. L'incapacità degli umani di sceneggiare ogni possibile scenario limita la portata e la funzionalità delle abilità, ha spiegato Roth.

La tecnologia Semantic Machines estende il ruolo dell'apprendimento automatico oltre gli intenti fino ad abilitare ciò che fa il sistema. Invece di un programmatore che prova a scrivere un'abilità che progetta per ogni contesto, il sistema Semantic Machines impara da solo la funzionalità dai dati.

In altre parole, la tecnologia delle macchine semantiche impara a mappare le parole delle persone ai passaggi computazionali necessari per svolgere le attività richieste.

Ad esempio, invece di eseguire un programma codificato a mano per ottenere il punteggio della partita di calcio, l'approccio Semantic Machines inizia con le persone che mostrano al sistema come ottenere punteggi sportivi in ​​una serie di contesti di esempio in modo che il sistema possa imparare a recuperare i punteggi sportivi stessi.

Inoltre, i metodi di machine learning consentono al sistema di generalizzare dai contesti che ha visto in nuovi contesti, imparando a fare più cose in più modi. Se impara come ottenere risultati sportivi, ad esempio, può anche ottenere previsioni del tempo e segnalazioni sul traffico. Questo perché il sistema ha imparato non solo una competenza, ma il concetto di come raccogliere dati da un servizio e presentarlo all'utente.

Questo manca agli odierni assistenti intelligenti, che sono programmati per fare una lista di cose isolate che un programmatore ha previsto. L'apprendimento automatico in questi sistemi si concentra principalmente sulle parole che innescano un'abilità, ha spiegato il tecnico Microsoft, Dan Klein, leader riconosciuto nel campo dell'elaborazione del linguaggio naturale e professore di informatica presso l'Università della California a Berkeley.

"Non sono concentrati sull'imparare a fare cose nuove, o mescolare e abbinare le cose che già conoscono per supportare nuovi contesti", ha detto Klein, che è stato anche co-fondatore e chief scientist di Semantic Machines.

Conversazione dinamica

Dal momento che il sistema Semantic Machines può imparare come fare cose nuove, può più facilmente impegnarsi in una conversazione dinamica con una persona, accedendo e cucendo insieme contenuti, contesto e concetti pertinenti da fonti disparate per fornire risposte, presentare opzioni e produrre risultati.

Il sistema Semantic Machines ha anche una memoria per tenere traccia del contesto in una conversazione e la cosiddetta capacità full duplex per parlare e ascoltare allo stesso tempo, al fine di mantenere il dialogo scorrevole.

"Tutto ciò che dici è contestualizzato da ciò che è venuto prima, così puoi fare cose più complicate: puoi cambiare idea, puoi esplorare", ha detto Klein. "Inoltre, una volta che le cose diventano abbastanza contestuali, la nozione di abilità inizia a dissolversi."

Questo perché la nozione di abilità confina le interazioni con i sili di dati mentre la vera conversazione si basa sulla connessione di dati da ogni parte. La tecnologia Semantic Machines orchestra la raccolta di dati e l'esecuzione di compiti sul back-end, mantenendo un dialogo fluido e naturale con l'utente sul frontend.

Ad esempio, il rimpasto della pianificazione per ospitare una riunione ad alta priorità richiede dati di calendario e dati di directory per determinare chi è libero, quando, oltre a dati contestualmente pertinenti come il tempo, i caffè nelle vicinanze e il traffico per capire dove incontrarsi e si sieda, e quando partire per arrivare in tempo.

"Una volta che inizi a lasciare che le cose evolvano e si connettano contestualmente, la nozione di abilità è troppo limitante", ha detto Klein. "Fare le cose comporta mescolare e abbinare".

Costruire con un linguaggio naturale

Alla Build, Microsoft ha presentato un'applicazione di calendario utilizzando la tecnologia Semantic Machines che può rendere l'organizzazione della giornata con un assistente intelligente un'esperienza più fluida, naturale e potente. La stessa tecnologia può essere applicata a qualsiasi esperienza di conversazione e alla fine alimenterà le conversazioni tra tutti i prodotti e i servizi Microsoft.

Ciò si baserà sulle funzionalità esistenti di Cortana , come fornire risposte alle domande, offrire anteprime della giornata e aiutarvi attraverso i vostri dispositivi, dal telefono al laptop e agli altoparlanti intelligenti.

Ad esempio, una volta incorporata la tecnologia in Cortana, è possibile fare in modo che in Office vengano eseguite operazioni su ciò che è necessario fare e meno sull'esecuzione delle attività in determinate applicazioni.

"Vogliamo che sia meno carico cognitivo, meno sentimento come devo andare a PowerPoint per questo o Word per questo, o Outlook per questo e Teams per questo, e più su preferenze personali e intenti", ha detto Andrew Shuman, Microsoft aziendale vicepresidente per Cortana.

Inoltre, ha aggiunto Roth, la tecnologia sarà resa disponibile attraverso Microsoft Bot Framework . Il suo team sta attualmente progettando un modo per gli sviluppatori che lavorano nel framework oggi di migrare i loro dati esistenti al motore conversazionale alimentato da Semantic Machines quando è pronto.

"Come sviluppatore puoi iniziare a costruire queste esperienze da solo", ha detto. "Possiamo muovere collettivamente, sulla base di questa tecnologia, oltre questa nozione di abilità e silos e semplici programmi scritti a mano nel tipo di fluide interfacce di linguaggio naturale simili a Star Trek che tutti noi vogliamo".
Fonte: Microsoft
Articolo di HTNovo
Creative Commons License

Modulo di contatto

Archivio