Picovoice는 원하는 대로 음성 제어가 포함된 제품을 구현하기 위해 사용되는 패키지입니다.
Picovoice는 Porcupine이라는 Wake Word 엔진을 사용하여 Wake Word를 감지하고, Rhino라는 Speech to Intent 엔진을 통하여 사용자의 음성을 입력받고 그것을 토대로 intent를 추론합니다.
저희 프로젝트에서는 스마트폰, 태블릿 PC 등의 전자기기를 사용자가 요리를 할 때 손으로 조작하지 않고도 음성을 통해 앱을 조작할 수 있는 기능을 구현하기로 하였고, 관련 자료를 조사한 결과 Wake Word를 통해 Speech to Intent 엔진을 깨우고 깨운 엔진을 통하여 사용자의 음성에 맞는 Intent를 추론하여, 해당 Intent에 맞는 다양한 기능을 제공할 수 있다고 판단하였습니다.
우선 Picovoice Console 홈페이지에 접속해서 회원가입을 한 후 로그인합니다. 회원가입은 구글 혹은 GitHub 아이디로 간편하게 진행할 수 있습니다.
Developer Console | Picovoice On-Device Voice Recognition
로그인에 성공하였다면, 먼저 Access Key를 볼 수 있습니다. 이 Access Key는 Picovoice Manager를 처음 선언할 때 반드시 필요합니다.
그리고 오른쪽에는 Porcupine과 Rhino 엔진이 보입니다. 우선 Porcupine으로 이동하여 Wake Word를 Train시킨 모델 파일을 만들어야 합니다.