Gleo AI SDK Overview
개요
Gleo AI SDK는 음성 인식(SpeechToText), 음성 합성(TextToSpeech), 초거대 언어 모델(LLM) 등의 에이전트 개발을 위한 AI 기술을 API 형태로 제공합니다. 개발자들은 Gleo AI SDK를 활용하여 손쉽게 앱이나 서비스에 AI 기능을 구현하고, Gleo AI와 연동하여 사용자 경험을 강화할 수 있습니다.
- SpeechToText SDK: 차량 환경에서 높은 품질을 보여주며 온디바이스와 서버 인식 방식의 하이브리드 모드를 지원합니다.
- 네트워크 연결이 없는 상황에서 온디바이스 음성 인식을 지원하며, 네트워크 연결이 있는 경우 서버 인식을 통해서 더욱 높은 품질의 인식 결과를 제공할 수 있습니다.
- TextToSpeech SDK: 사람과 같은 자연스러운 음성을 생성하며 음성 인식과 마찬가지로 온디바이스와 서버 합성 방식의 하이브리드 모드를 지원합니다.
- 스트리밍 방식을 지원하여 LLM으로 생성되는 스트리밍 텍스트 입력에 대해서 빠른 음성 출력이 가능합니다.
- LLM SDK: 42dot LLM을 이용하여 사용자에게 적절한 답변을 보다 빠른 속도로 생성합니다.
- 향후 제공될 PEFT(parameter-efficient fine-tuning) API를 이용하여 보다 높은 품질의 답변을 제공할 수 있습니다.
제공하는 SDK
SDK 종류 | 설명 |
---|---|
SpeechToText SDK | 사용자의 음성을 실시간으로 인식하여 텍스트로 변환하는 기능을 제공합니다. |
TextToSpeech SDK | 텍스트 입력을 자연스러운 음성으로 변환하여 음성 피드백이나 읽기 기능에 활용할 수 있습니다. |
LLM SDK | 다양한 자연어 처리 기능(요약, 질의응답, 생성, 분류 등)을 지원하는 언어 모델을 제공합니다. |