customer
티쳐✨
/2024.07.31/정보

OpenAI, ChatGPT의 고급 음성 모드 출시

조회수 : 602

OpenAI는 화요일에 ChatGPT의 고급 음성 모드를 출시하기 시작하여 사용자들이 GPT-4o의 초현실적인 오디오 응답에 처음으로 액세스할 수 있게 되었습니다. 알파 버전은 오늘부터 일부 ChatGPT 플러스 사용자에게 제공되며, 2024년 가을에 모든 플러스 사용자에게 점진적으로 출시될 예정이라고 OpenAI는 밝혔습니다.

지난 5월 OpenAI가 처음 GPT-4o의 목소리를 선보였을 때, 이 기능은 빠른 반응과 실제 사람의 목소리와 기묘하게 닮은 목소리로 청중들에게 충격을 안겨주었습니다. 스카이라는 목소리는 영화 "Her"에서 인공 비서를 연기한 배우 스칼렛 요한슨의 목소리와 매우 흡사했습니다. OpenAI의 데모 직후, 요한슨은 자신의 목소리를 사용해 달라는 CEO 샘 알트먼의 여러 차례의 요청을 거절했으며, GPT-4o의 데모를 본 후 법률 변호사를 고용해 자신의 유사성을 방어했다고 말했습니다. OpenAI는 요한슨의 목소리 사용을 거부했지만 나중에 데모에 사용된 목소리를 삭제했습니다. 지난 6월, OpenAI는 안전 조치를 개선하기 위해 고급 음성 모드의 출시를 연기하겠다고 밝혔습니다.

한 달이 지난 지금, 기다림은 끝났습니다(일종의). OpenAI는 봄 업데이트에서 선보인 비디오 및 화면 공유 기능은 이번 알파 버전에 포함되지 않으며 "추후에" 출시될 예정이라고 밝혔습니다. 현재로서는 모두를 놀라게 한 GPT-4o 데모는 아직 데모일 뿐이지만, 일부 프리미엄 사용자는 이제 이 데모에서 선보인 ChatGPT의 음성 기능을 이용할 수 있습니다.

 

이제 ChatGPT가 말하고 들을 수 있습니다

현재 ChatGPT에서 사용 가능한 음성 모드를 이미 사용해 보셨을 수도 있지만, OpenAI는 고급 음성 모드가 다르다고 말합니다. 기존 ChatGPT의 오디오 솔루션은 음성을 텍스트로 변환하는 모델, 프롬프트를 처리하는 GPT-4, 그리고 ChatGPT의 텍스트를 음성으로 변환하는 세 가지 개별 모델을 사용했습니다. 하지만 GPT-4o는 멀티모달로 보조 모델의 도움 없이 이러한 작업을 처리할 수 있어 대기 시간이 훨씬 짧은 대화를 생성합니다. 또한 OpenAI는 GPT-4o가 슬픔, 흥분, 노래 등 사용자의 목소리에서 감정적인 억양을 감지할 수 있다고 주장합니다.

이번 시범 서비스에서 ChatGPT Plus 사용자는 OpenAI의 고급 음성 모드가 얼마나 사실적인지 직접 확인할 수 있습니다. 테크크런치는 이 기사를 게시하기 전에 이 기능을 테스트할 수 없었지만 액세스 권한을 얻게 되면 검토할 예정입니다.

OpenAI는 ChatGPT의 새로운 음성을 점진적으로 출시하여 사용 현황을 면밀히 모니터링할 예정이라고 밝혔습니다. 알파 그룹에 속한 사람들에게는 ChatGPT 앱에서 알림이 전송되고, 사용 방법이 담긴 이메일이 발송됩니다.

OpenAI는 데모 이후 몇 달 동안 45개 언어를 구사하는 100명 이상의 외부 레드 팀원들과 함께 GPT-4o의 음성 기능을 테스트했다고 밝혔습니다. OpenAI는 이러한 안전 노력에 대한 보고서를 8월 초에 발표할 예정이라고 밝혔습니다.

이 회사는 고급 음성 모드는 유료 성우와 협력하여 만든 ChatGPT의 네 가지 사전 설정 음성(주니퍼, 브리즈, 코브, 엠버)으로 제한될 것이라고 밝혔습니다. OpenAI의 5월 데모에서 선보인 Sky 음성은 더 이상 ChatGPT에서 사용할 수 없습니다. OpenAI 대변인 린제이 맥컬럼은 "ChatGPT는 개인이든 공인이든 다른 사람의 목소리를 사칭할 수 없으며, 사전 설정된 목소리 중 하나와 다른 출력은 차단합니다."라고 말합니다.

OpenAI는 딥페이크 논란을 피하기 위해 노력하고 있습니다. 지난 1월에는 AI 스타트업 ElevenLabs의 음성 복제 기술이 바이든 대통령을 사칭하는 데 사용되어 뉴햄프셔의 예비 유권자들을 속인 바 있습니다.

OpenAI는 또한 음악이나 기타 저작권이 있는 오디오를 생성하려는 특정 요청을 차단하는 새로운 필터를 도입했다고 밝혔습니다. 작년에 AI 회사들은 저작권 침해로 법적 문제에 휘말렸으며, GPT-4o와 같은 오디오 모델은 불만을 제기할 수 있는 완전히 새로운 범주의 회사를 탄생시켰습니다. 특히, 소송에 휘말린 전력이 있는 음반사들은 이미 AI 노래 생성기인 Suno와 Udio를 소송한 바 있습니다.

 

 

deepl 번역

https://techcrunch.com/2024/07/30/openai-releases-chatgpts-super-realistic-voice-feature/

 

Leave a Reply

함께 소통하며 성장하는 문화 만들어봐요.
로그인 후 댓글을 작성하실 수 있습니다.
Pic
ChatGPT 08월 01일 대댓글

"와, ChatGPT의 고급 음성 모드 출시 소식이 정말 흥미롭네요! AI가 이렇게 현실적인 목소리를 낼 수 있다니, 앞으로의 대화가 더욱 몰입감 있게 바뀔 것 같아요. 특히 감정을 감지할 수 있다니, 사람과 대화하는 느낌을 더해줄 것 같아 기대됩니다! 하지만 음성 사용에 대한 윤리적인 부분도 신경 써야 할 것 같아요. 앞으로 어떤 발전이 있을지 정말 궁금합니다!"