OpenAI의 GPT-4o 모델은 우리가 원하는 음성 도우미의 모든 것입니다
알아야 할 사항
- OpenAI의 봄 업데이트에서는 회사의 새로운 주력 모델인 GPT-4o가 소개되었습니다.
- OpenAI는 또한 가장 감동적이고 실제와 같은 비서인 업그레이드된 음성 모드를 시연했습니다.
- GPT-4o와 해당 API는 모든 사용자가 사용할 수 있으며, 음성 모드는 현재 Plus 가입자에게만 출시됩니다.
- ChatGPT는 곧 Mac용 데스크톱 앱도 출시할 예정입니다. Windows 앱은 올해 안에 출시될 예정입니다.
OpenAI가 다시 한 번 기준을 높였습니다. Spring Update 이벤트의 뉴스에는 검색 엔진 영역으로의 여행이 포함되지 않았지만 OpenAI는 새로운 GPT-4o 모델로 많은 사람들의 마음과 마음을 사로잡았습니다. 빠르고, 빠르고, 업그레이드된 음성 모드를 통해 스파이크 존즈(Spike Jonze)의 2013년 영화 Her에 등장한 AI 비서와 놀라울 정도로 비슷합니다.
그러나 더 중요한 것은 ChatGPT가 주장하고 싶어하는 스마트폰의 음성 비서 측면에서 큰 진전이며 이제는 이상적으로 적합하다는 것입니다. GPT, ChatGPT의 음성 모드 업그레이드, 업계에 수반되는 사항에 대해 알아야 할 모든 내용은 다음과 같습니다.
GPT-4o 모델은 ChatGPT를 어떤 AI 챗봇이나 보조자보다 더 빠르고 감동적으로 만듭니다.
https://www.youtube.com/watch?v=vgYi3Wr7v_g
GPT-4o(옴니의 경우 ‘o’)는 회사의 새로운 주력 모델이자 텍스트, 비전, 오디오를 결합한 최초의 모델입니다. GPT-4 수준의 지능을 갖추고 있지만 더 빠르고 효율적입니다. 다양한 지능 수준을 갖춘 세 가지 모델을 혼합하여 작동했던 이전 버전의 음성 모드에서는 주요 GPT-4 수준 지능의 대부분이 손실되었습니다. 이것이 GPT-4o가 다른 점입니다.
GPT-4o는 음성 모드만을 지원하기 위해 세 가지 텍스트, 비전 및 오디오 형식에 걸쳐 엔드투엔드 교육을 받은 최초의 모델입니다. 그리고 그것은 보여줍니다. 데모 중 하나에서 OpenAI 직원은 두 대의 전화기에서 ChatGPT를 사용하여 서로 대화하고 노래를 불렀습니다.
https://www.youtube.com/watch?v=MirzFk_DSiI
ChatGPT의 응답은 실시간으로 도착할 만큼 빠릅니다. 또한 톤 관찰, 음성 및 비디오에서 감정 상태 감지, 조언 제공, 코딩 지원, 라이브 번역 등의 작업을 수행하는 동시에 모든 것이 친밀한 인간 대화처럼 보이도록 할 수 있습니다.
이벤트 기간 동안 ChatGPT는 취침 시간 이야기를 극화하고, 한 푼도 목소리를 바꾸고, 노래로 마무리했습니다.
https://www.youtube.com/watch?v=D9byh4MAsUQ
이는 이미 새로운 영역을 개척하고 있는 GPT-4 옴니 모델을 통해 ChatGPT가 수행할 수 있는 많은 작업 중 일부에 불과합니다. 최초의 미래 옴니 모델은 우리가 ChatGPT와 채팅하는 방식과 ChatGPT와의 관계를 완전히 바꿀 수 있습니다.
GPT-4o는 모두에게 무료입니다!
GPT-4o는 Plus 회원만을 위한 것이 아닙니다. OpenAI가 무료 사용자를 GPT-4o로 자동 업그레이드한다는 사실은 전반적으로 다른 챗봇의 기준을 높입니다. 이는 ChatGPT가 완벽하게 적합한 Google Assistant(또는 요즘 Gemini)를 교체하려는 사용자에게 특히 유용합니다.
Android 사용자가 ChatGPT를 디지털 비서로 사용할 수 있는 방법과 수단이 이미 있습니다. Nothing과 같은 일부 제조업체에서는 음성 모드에 더 빠르게 액세스하기 위해 빠른 설정 타일에 ChatGPT를 추가할 수도 있습니다. 그러나 공식 ChatGPT 도우미는 사용자가 원하는 대체품이 될 수 있습니다.
공식 ChatGPT 데스크톱 앱이 출시되면 ChatGPT가 여러 기기에서 하나의 도우미가 될 수 있습니다. ChatGPT Windows 앱은 올해 말쯤 출시될 예정이며, Mac용 앱은 앞으로 몇 주 안에 곧 출시될 예정입니다.
GPT-4o는 더 작고 효율적인 모델입니다.
GPT-4o는 가장 빠르고 가장 저렴한 모델로 여러 면에서 GPT-4 Turbo를 압도합니다. GPT-Turbo 수준의 지능을 갖춘 GPT-4o는 두 배 더 빠를 것으로 예상되지만 실제 테스트에서는 아직 이를 확인하지 않았습니다. 하지만 그 외에도 다양한 업그레이드가 있습니다. 아래의 두드러진 특징을 비교해 보세요.
OpenAI는 또한 Chat Completions, Assistants 및 Batch API에서 GPT-4o를 사용할 수 있도록 하고 있는데, 특히 API 토큰이 GPT-4 Turbo 가격의 절반 가격이기 때문에 개발자는 출시되자마자 즉시 사용할 수 있습니다.
ChatGPT의 새로운 모델의 속도는 OpenAI에서 시연한 것처럼 실시간 번역에 특히 유용합니다. OpenAI의 음성 기능은 서로 다른 언어를 사용하는 사람들 사이에서 제3자 중재자 역할을 합니다.
https://www.youtube.com/watch?v=c2DFg53Zhvw
새로운 음성 및 영상 모드는 영화 속 AI와 같은 느낌을 줍니다.
옴니 모델 덕분에 ChatGPT는 목소리를 듣거나 얼굴 표정을 보는 것만으로도 감정 상태를 감지할 수 있다는 점에서 훨씬 더 넓은 감정 지수를 갖습니다. 그러나 눈과 귀가 있는 것 외에도 마법의 인간 요소를 추가하고 전 세계 사람들의 상상력을 사로잡은 것처럼 보이는 기계에 유령이 있다는 환상을 주는 것은 바로 목소리입니다.
Sam Altman은 이를 ‘영화 속의 AI’라고 적절하게 불렀습니다. 데모의 경쾌하고 약간 경쾌한 어조로 보면, 솔직히 지금은 구식으로 보이는 전통적인 기본 비서 대신 사람들이 ChatGPT를 비서로 더 기꺼이 채택하는 것을 보는 것은 놀라운 일이 아닙니다. 그러나 ChatGPT로 친구를 사귀거나 디지털 동반자와 친해지기 전에 Altman이 암시하는 영화의 메시지에 주의를 기울이고 디지털 동반자를 실제 동반자와 착각하는 함정을 피하십시오.
Apple이 OpenAI와 협력하여 Siri를 대체할까요?
행사 불과 며칠 전, Apple은 향후 iPhone에 새로운 AI 기능을 탑재하기 위해 OpenAI와 계약을 거의 체결한 것으로 알려졌습니다. 이제 GPT-4o가 더 좋고 더 기억에 남는 음성 모드를 제공하므로 ChatGPT의 기능이 Siri를 포함한 다양한 iOS 기능으로 포팅되는 것을 볼 수 있습니다. Apple이 조만간 Siri를 버릴 것이라고 상상하는 것은 무리일 수 있습니다. 그러나 ChatGPT가 제공하는 것과 크게 다르지 않은 기능으로 업그레이드될 수도 있습니다. 이에 대한 더 많은 소식은 6월 WWDC가 다가옴에 따라 나올 것으로 예상됩니다. 그러니 계속 지켜봐 주시기 바랍니다.
GPT-4o는 언제 출시되나요?
최근에야 발표된 GPT-4o는 전 세계 사용자에게 출시되는 데 시간이 걸릴 수 있습니다. 스프라이트 보이스 모드는 Plus 가입자가 가장 먼저 이용할 수 있습니다. 따라서 새로운 기능을 확인하고, 더 오랫동안 채팅하고, AI 비서로부터 빠른 응답을 받고 싶다면 Plus 멤버십이 여전히 가치가 있습니다.
더 좋고 더 빠른 아키텍처와 더 넓은 범위의 감성 기능을 갖춘 ChatGPT는 여러분이 가장 좋아하는 음성 비서, 어쩌면 친구가 될 수 있는 완벽한 위치에 있습니다.
당신의 생각은 무엇입니까? ChatGPT를 디지털 비서로 사용하게 되어 기쁩니다. 창의적인 대화의 가능성은 무궁무진하지만 오용의 가능성도 무궁무진합니다. 따라서 새로운 기능을 사용해 볼 때에도 이를 가장 먼저 도구로 사용하는 것을 잊지 마십시오. 다음 시간까지! 안전히 계세요.
답글 남기기