Introduction
개요
SpeechToText SDK는 Pleos Connect에서 동작하는 Infotainment Application에서 42dot 음성인식 플랫폼과 연동할 수 있도록 지원함으로써 음성 인터페이스 기반의 음성 인식 기능을 제공합니다. SpeechToText SDK 에서 제공되는 API 형식에 따라 사용자의 음성을 Speech Service 플랫폼으로 전송하고 Speech Service 플랫폼의 처리 텍스트 결과를 클라이언트에 전달합니다. Infotainment Application은 SpeechToText SDK를 사용함으로써 마이크 제어 및 입출력 관련 사항을 확인하지 않고 42dot 음성인식 서비스를 이용할 수 있습니다.
[하위 호환성을 지원하지 않습니다]
Pleos Connect SDK v2.0.5는 기존 SDK와 호환되지 않습니다. 따라서 새로운 SDK로 마이그레이션해야 합니다.
- 변경된 패키지 네이밍을 적용합니다. (모듈 단위 build.gradle, import 구문 수정)
- 매니페이스 파일에서 변경된 퍼미션 네이밍을 적용합니다.
- Pleos Connect Emulator를 다시 다운로드합니다.
개발 환경 설정
SpeechToText SDK를 사용하려면 Android Studio에 Pleos Connect Emulator를 설치한 후, AVD 설정을 진행합니다.
SpeechToText API
SpeechToText SDK가 제공하는 API 목록은 다음과 같습니다.
Function | Summary |
---|---|
initialize API | SpeechToText SDK를 사용하기 위한 API입니다. |
release API | SpeechToText SDK를 해제하기 위한 API입니다. |
registerApp API | 서버형 음성인식 기능을 사용하기 위해서 앱을 등록하는 API입니다. |
addListener API | 음성인식 결과를 받을 수 있는 이벤트 Listener 를 등록하는 API입니다. |
removeListener API | 등록한 이벤트 Listener를 해제하는 API입니다. |
request API | 앱에서 실시간으로 사용자의 음성을 인식하기 위해 요청하는 API 입니다. |
stop API | 앱에서 사용 중인 음성인식을 멈추기 위한 API 입니다. |
sendAudio API | 앱에서 저장된 PCM Audio 데이터를 텍스트로 추출할 수 있는 API 입니다. |
completeAudioSend API | 앱에서 전송할 PCM Audio 데이터가 없으면 완료되었음을 알려주는 API 입니다. |