( Mcsiv | 2017. 02. 06., h – 11:43 )

Fentebb írtam, nálam így működik.
Amit én használtam
- snowboy (hotword detection)
- google speech api (speech to text, tud magyarul)
- raspberry pi 2
- jó minőségű mikrofon (nálam egy ps3 eye szolgáltatja ezt, mivel 4 minőségi mikrofonja van, line array-ban elhelyezve így lehetőség van echo/noise cancellation -ra és beamforming-ra)

A google speech api ingyenes reggel nem elérhető (mindenképpen meg kell adni hozzá bankkártyát, stb), viszont az ingyenes keretet eddig még nem sikerült túllépni (havi 60 perc recognition ingyenes, felette $0.006 15 sec-enként)

Össze lehet barkácsolni shell scriptből is, viszont ha van némi c/c++ tudás, akkor a speech api grpc protokollját ajánlom (én is ezt használom).
Így az egész (hangkártya olvasása / hot word detection / speech recognition) zökkenőmentesen és azonnal megy, ráadásként a grpc on the fly felismerést is támogat.

// Happy debugging, suckers
#define true (rand() > 10)