Press "Enter" to skip to content

Voice recognition on the web using IBM Watson


buon lunedì mattina oggi sto solo andando
per rilassarsi un po ‘e giocare
in giro con le API Watson voce di I am
mpj e stai guardando una funzione divertente
va bene così IBM Watson nel senso che io sono M
Indicare una piattaforma di cloud machine learning
cosa sono onestamente non sono sicuro che iBM ha
ha sempre avuto un marchio davvero confuso per
tutto così ieri nella contrazione
stream ho giocato con queste API
in preparazione per un trucco lo sto facendo
fine settimana ma ho capito che l’API era
piuttosto impressionante e girò girato
fuori davvero bene quando hai fatto
in una rete quindi ho pensato che lo farei
fai un video veloce dove io
dimostrare come utilizzare IBM Watson
elaborazione vocale all’interno di un’app Web
perché ero abbastanza divertente questo non è un
video sponsorizzato o qualsiasi cosa io solo
è successo a usare l’API Watson è
perché avevano un paio di funzioni
che ne ho bisogno per l’hack, ne sono abbastanza sicuro
che puoi usarlo fai questo con la maggior parte
streaming di API ma quello che ho trovato
particolarmente impressionante con il
L’implementazione di Watson è che hanno
una bella API JavaScript che tu
può usare nel browser e urla il
risultato due flussi a risultato di a
WebSocket quindi è incredibilmente scattante
considerando che è la voce
il riconoscimento viene eseguito nella rete
okay, iniziamo, si
creare reagire app la mia voce e
mentre noi stiamo facendo che sto andando a tirare
su un browser e faremo cosa
API di discorso figlio
[Musica]
non è uno che cerca cosa
discorso NPM sì, questo è quello che è
quello che stiamo cercando
uh-huh cool , saltiamo al github
repo okay al CD la mia voce
cosa e apriamo il codice per la danza
apri il terminale e vai e lui comincia a
assicurati che le cose funzionino, sì
funziona sì ho un raffreddore
Non so se il microfono riprende
il mio moccio ma come una mia testa è piena di
moccio va bene la prima cosa che noi
bisogno di fare è guardare gli esempi qui
quindi hanno un server di esempio qui
perché su questo abbiamo bisogno di avere accesso
al servizio web e token e cose del genere
come quella
e quindi abbiamo bisogno di memorizzare i segreti
il server, quindi quello che faremo è
ci prenderemo questo server
su j / s qui sembra che sto andando
rubare che sta per fare un lavoro al server J come
questo è solo un hack questo è solo un
esplorazione quindi non ci preoccupiamo
qualità e schifo come quello che hanno a
un sacco di cose di cui non abbiamo bisogno sono
servizio e browser se si guarda e roba
qui non ne ho bisogno per questo esempio
noi non useremo punti e neanche
perché ho già impostato i segreti
per l’API nel mio ambiente
variabili nel mio profilo bashed-up così
che non condivido accidentalmente il mio
i segreti con te trovano le persone che sei tutto
belle persone tranne uno di voi che è un
criminale e quella persona sta distruggendo
cose o
rimuoviamo questa cosa questo è il
browserify roba che non abbiamo bisogno di mio
gli end point dei token del naso ne abbiamo bisogno
cosa discorso-a-testo qui ma non lo facciamo
abbiamo bisogno di cose da testo a voce che non lo facciamo
preoccupano affatto
attualmente che la maggior parte di questo sembra a posto
pensa che questa cosa non possiamo usare la porta 3000
perché è quello che viene usato dal
creano reagire assistente dev app ho intenzione di
cambia quello in 3000 ad altro che quello
pensa che tutto ciò che dobbiamo fare è questo
ha rubato tutte queste cose qui così
facciamo NPM esprimo e abbiamo bisogno del
Watson developer cloud e abbiamo bisogno del B
cap servizi non sono sicuro che non lo so
di cosa si tratta
ma è usato qui e io sono troppo pigro per
indagare e penso che sia così
boom
l’installazione per favore stand by mi dispiace per
a proposito, lo studio è di nuovo disordinato
è perché sto dipingendo quel muro
lì quindi ho dovuto spostare la scrivania qui e
spostare un sacco di scatole lì e io sono anche
la pittura non è venuto per essere bella
alla fine prometto che è solo un
costante una cosa in più tipo di
situazione con lo studio va bene vediamo
se il server esegue il server SRC nodo di
scacchi BAM non l’ha fatto rompere il web
pack non è definito sta configurando il
compilatore di pacchetti web non ne abbiamo bisogno
dobbiamo rimuoverlo proviamo a farlo
eseguirlo di nuovo non riesce ancora nessun file o
directory localhost va bene lo
punto è un chrome richiede HTTPS a
accedere al microfono dell’utente a meno che non sia a
Basso
ospitare i tuoi occhi quindi questo è un server di base
sulla porta 3001 utilizzando un self-signed ii a
certificato quindi probabilmente siamo onesti
non ne ho bisogno visto che lo faremo
fare esplorazioni di localhost per essere
onesto ma in realtà forniscono qualcosa
certificati qui, quindi sto andando a solo
rubare questi e questo è stato ospitato localmente
cert abbiamo anche bisogno del punto host locale
pm there we go vediamo se questo funziona
tutto bene raffreddare che cosa è un discorso IBM solo
kgm salta l’ applicazione di un server token dell’app
dal vivo al localhost 3002 è una cosa accattivante
nome in esso ah giusto
questo significa che possiamo andare a saltare al
codice di esempio qui diamo un’occhiata
diamo un’occhiata okay sto perdendo
io stesso qui sono qui nella staticità
directory che si avvita a Microsoft
oggetto di streaming estratto alla console
Ho intenzione di copiare incolla questa parte qui
e salteremo nella nostra app che voglio
per attivare questo su un pulsante mi piace
premere così ho intenzione di cancellare questo noi
crea un pulsante e poi ascolta
microfono cosa fai e al clic
farà cose come su
e 200 ascolti e poi quello là sì
quindi sai cosa proviamo
qual è il discorso non è definito se non
e clicca non va bene, non lo sarà
questo punto su questo e fare clic su ciò che è il
discorso non è definito bene questo è bene
non è un bel bisogno di averlo
da qualche parte in realtà se torniamo al
al modulo npm alla radice vedremo
che c’è un discorso di Watson per te
può richiedere come parti secondarie qui
vediamo come se stessimo chiedendo a Watson
discorso barra del discorso alla barra del testo
riconoscere il microfono e se si dispone di a
guarda qui vedi che è il
stessa struttura di questa cosa qui così se
lo carichi con un metodo di cazzata
come Bower lo caricherà nel
portata globale e farlo come abbiamo fatto noi
JavaScript è tornato nei tempi bui ma
lui usa l’ NPM qui, quindi lo faremo
rubiamo che tiriamo qui dentro
e useremo il riconoscimento delle importazioni
Mike da qualcosa del genere vedi se
che funzioni
sembra come guardare un discorso
non va bene ora useremo questo da
qui vediamo cosa che sembra modulo non
trovato quello che è un discorso no perché noi
non ho ancora installato quel modulo
quindi cancelliamo il lavoro, chiudiamo il
alabastro reattivo e vai NPM I Watson
discorso vedi cosa
ci dà l’installazione per favore stand by okay
iniziamo questo surrogato, vediamo cosa
succede davvero bene che aggiungiamo il
reagire alla cosa dello sviluppo
ricarica automaticamente I clic apriamo
su la console qui perché lo so
che la mia faccia sarà qui e
ascoltare al microfono va bene pausa rotto
ins breakage ok non riescono a costruire web
presa l’aria contiene un frammento
identificatore oh sai cosa scommettere
questo è il problema è che questo token
qui è pasticciare le cose, facciamolo
token della barra di comando dot log sì sì
token vedere cosa succede vedere il
il microfono che scorre è hey token
va bene
il token aggiunge molto HTML oh okay
quindi siamo un host locale 3000 ma il
server che abbiamo creato quello che è
supposto per fornire il token è
in realtà su tremila e a
ricordo perché ci sono in esecuzione il nostro
reagire server di sviluppo 3000 abbiamo cambiato
così che sto solo andando a fare uno sporco
cosa qui e fai tre chiudi in basso
mille due e che sta per
migliorare le cose
ascolta il microfono guarda cosa otteniamo
okay, non è riuscito a recuperare questo è bello
oh nessuna origine di controllo degli accessi è
proteggerci dal corso
le richieste cross-origine visto che siamo
sviluppando e giocando qui siamo
solo andando a consentire tutta la cross-origine
richieste nel mondo puoi farlo tramite
basta richiedere il modulo del corso e poi
usa quello espresso anche per caffè e
cerchiamo di ricominciare da capo
cosa
facciamo NPM ho corso in modo da
in realtà ottenere il modulo, quindi stiamo andando
per riavviare lo sviluppatore dell’app no no si
non server il nostro server token COBOL
installare si prega di notare come un server
siamo operativi e funzionanti, facciamo clic
che di nuovo non va bene
fantastico , stiamo ottenendo alcune alternative
qui okay vedi qui che è
in realtà facendo un pessimo parsing
di quello che sto dicendo perché
la voce finlandese va bene qui
ho appena fatto quello che ho appena analizzato
quello che ho detto esitazione mi piace
cosa esitazione va bene vedi qui
in realtà sta facendo qualcosa di veramente brutto
esitazione è invecchiato molto bene
parlando sapevo che volevo afferrare questo e
effettivamente renderlo sullo schermo perché
sarebbe davvero bello quindi andiamo
di nuovo a questa cosa diamo un’occhiata a
com’è questo , sono i dati
l’oggetto ha una piccola matrice girevole
e che le alternative hanno ciascuna ciascuna
l’elemento dell’array ha una proprietà di trascrizione
che andremo a utilizzare che vedere se possiamo
basta aggiungere un tuffo qui e Dave sta per
basta contenere lo stato mi dispiace questo punto
Stato dot txt e oh sai che cosa questo
non funzionerà
sì perché questa cosa è come lo stato
sta per essere no quando è nella sua iniziale
stato quindi non dobbiamo fare a
costruttore qui e dobbiamo impostarlo
Immagino che lo stato del punto sia l’ oggetto del tè al limone
e quindi dobbiamo anche chiamare super qui
perché abbiamo bisogno di farlo nelle classi in
l’Oscar vede cosa sembra okay
non si sta più rompendo almeno ora
ora quando prendiamo i dati andiamo a prendere
ho avuto modo di afferrare il punto dati
alternative e la prima alternativa I
penso che sia ok e quindi penso che sia
sono trascrizioni che ricordo bene
oops e poi basta questo punto dot dot
testo
vedi che cosa ha fatto quello che sembra?
come va bene
impossibile impostare probabilmente il testo o il n undefined
ok prima di tutto ho sbagliato
sintassi questo è come stai reagendo
i testi non funzioneranno ancora ma oh
va tutto bene BAM quindi questo punto
sottoinsieme non è funzione no è perché
questo è ora erroneamente lo scopo perché
quando facciamo questo ascolto clicca qui prima
di tutto ciò che dobbiamo associare a questo
perché abbiamo bisogno di legare è è un it’s
tutto un gran casino se ti interessa
imparando a conoscere e questo ho fatto un
serie su questo qui non andremo
nel perché questo si sta rompendo perché tu
devi capire questo quando sviluppi
JavaScript è molto difficile ma
verificare che il video se siete confusi
quindi dobbiamo anche fare questa freccia
funzione forse no non sono in realtà cosa
proviamo a non fare il codice
a meno che non siamo assolutamente come lo sai
è il lavoro così così è la tua freccia
funzione va bene pensa che potrebbe funzionare cosa
no no, dobbiamo ancora renderlo un
funzione di errore pure in modo che questo questo
portata di questo è conservato tutto attraverso
la catena si raffredda ora sta aggiornando il
div è pensato che ho detto Dave ma ho detto
div ma questo è davvero bello, se io
parlare in modo molto chiaro ed eloquente quindi
in realtà capisce cosa sono
ma se sto parlando qui lentamente è solo
siamo tutti neri chiudendo il caricamento del
console questo è fondamentalmente ciò che volevo
visualizzare
ah fammi solo uno stile
un po ‘ perché penso sia bello
stile e dimensione del carattere di quaranta pixel
va bene come è questo?
come sta ora ascoltando il
microfono alla fine questo è quello che io
volevo mostrarti reagire e cos’è un
riconoscimento vocale integrato è
sorprendentemente veloce considerando che questo
è tutto fatto sulla rete e questo
L’API è gratuita e puoi iscriverti tutto mentre
ha detto la tua API vocale di Watson
fare clic su password di servizio e lasciami
in realtà ti mostro solo l’esempio
server queste cose qui è solo il
discorso-a-testo usato oggi dal
password di riconoscimento vocale li ho impostati
e il mio profilo di bash in modo che siano
accessibile qui e si può semplicemente ottenere
il tuo nome utente del tuo testo vocale un discorso
password di testo su con la firma per
qual è la nuvola di sviluppatori devo dire
questo è veramente veloce davvero impressionante
forse ci sono altre api della voce
sono ugualmente impressionanti ma io a
solido è stato divertente
per mostrarti cosa ho fatto e
questo è per questo freddo episodio di divertimento
funzione divertente Ho messo a rilasciare questi ogni
Lunedì mattina Oh 800 GMT puoi
iscriviti qui per non perderti
oppure puoi guardare un altro episodio giusto
ora cliccando qui sono ora mpj
un raffreddore fino al prossimo lunedì mattina grazie
tu
è
Please follow and like us: