Notice
Recent Posts
Recent Comments
Link
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | ||
| 6 | 7 | 8 | 9 | 10 | 11 | 12 |
| 13 | 14 | 15 | 16 | 17 | 18 | 19 |
| 20 | 21 | 22 | 23 | 24 | 25 | 26 |
| 27 | 28 | 29 | 30 |
Tags
- gpt-4o-transcribe
- flex특징
- 배열재정렬함수
- Realtime
- ime란
- 바닐라JS #바닐라JS로크롭앱만들기 #
- ES6란
- whisper-1
- 이터레이터프로토콜
- 자바스크립트filter
- 레이아웃모델
- 이터러블프로토콜
- JAVA #Swing #자바스윙 #스윙
- ime일본어처리
- 자바스크립트sort함수
- 이터레이션프로토콜
- interable
- tts-1
- javascript문법
- 자바객체 #자바인스턴스 #객체와인스턴스차이점
- iterationprotocol
- chatGPT
- OpenAI
- flex사용법
- 음성채팅
- realtimeapi
- 자바스크립트문법 #노마드코더 #
- DestructuringAssignment
- flexgrid차이점
- AI
Archives
- Today
- Total
목록2025/04/22 (1)
끄적끄적 개발기록
Realtime api가 없는 음성 채팅 방식의 구조 사용자가 음성을 모두 녹음한다.녹음이 끝난 뒤 서버로 음성 파일을 업로드한다.서버는 음성을 텍스트로 변환(STT)하고 이를 분석해 응답을 생성한다.응답 텍스트를 다시 음성(TTS)으로 변환해 사용자에게 전달한다.복잡해 보이지 않지만, 이 방식은 모든 데이터가 처리 단계를 거친 뒤에야 응답할 수 있다는 구조적인 한계를 가지고 있다. 1. 높은 지연 시간녹음, 업로드, 처리, 음성 합성이라는 단계를 거치다 보니 실시간 반응은 어렵다. 2. 실시간 피드백 부재사용자가 말을 끝내기 전까지는 아무런 반응을 줄 수 없으며, 대화 중 끼어들기나 중간 피드백이 불가능하다. 3. 자연스러운 대화 어려움억양, 강세, 감정 표현 등 사람처럼 말하기 위한 표현력이 부족하고..
개발/AI
2025. 4. 22. 14:52