본문으로 건너뛰기

Introduction

개요

SpeechToText SDK는 Pleos Connect에서 동작하는 Infotainment Application에서 42dot 음성인식 플랫폼과 연동할 수 있도록 지원함으로써 음성 인터페이스 기반의 음성 인식 기능을 제공합니다. SpeechToText SDK에서 제공되는 API 형식에 따라 사용자의 음성을 Speech Service 플랫폼으로 전송하고 Speech Service 플랫폼의 처리 텍스트 결과를 클라이언트에 전달합니다. Infotainment Application은 SpeechToText SDK를 사용함으로써 마이크 제어 및 입출력 관련 사항을 확인하지 않고 42dot 음성인식 서비스를 이용할 수 있습니다.

[하위 호환성을 지원하지 않습니다]

Pleos Connect SDK v2.0.5는 기존 SDK와 호환되지 않습니다. 따라서 새로운 SDK로 마이그레이션해야 합니다.

  • 변경된 패키지 네이밍을 적용합니다. (모듈 단위 build.gradle, import 구문 수정)
  • 매니페이스 파일에서 변경된 퍼미션 네이밍을 적용합니다.
  • Pleos Connect Emulator를 다시 다운로드합니다.

개발 환경 설정

SpeechToText SDK를 사용하려면 Android Studio에 Pleos Connect Emulator를 설치한 후, AVD 설정을 진행합니다.

SpeechToText API

SpeechToText SDK가 제공하는 API 목록은 다음과 같습니다.

FunctionSummary
initialize APISpeechToText SDK를 사용하기 위한 API입니다.
release APISpeechToText SDK를 해제하기 위한 API입니다.
registerApp API서버형 음성인식 기능을 사용하기 위해서 앱을 등록하는 API입니다.
addListener API음성인식 결과를 받을 수 있는 이벤트 Listener 를 등록하는 API입니다.
removeListener API등록한 이벤트 Listener를 해제하는 API입니다.
request API앱에서 실시간으로 사용자의 음성을 인식하기 위해 요청하는 API 입니다.
stop API앱에서 사용 중인 음성인식을 멈추기 위한 API 입니다.
sendAudio API앱에서 저장된 PCM Audio 데이터를 텍스트로 추출할 수 있는 API 입니다.
completeAudioSend API앱에서 전송할 PCM Audio 데이터가 없으면 완료되었음을 알려주는 API 입니다.