Gemini 1.5 Pro가 출시되었습니다! 한 차원 높은 오디오 인식을 경험할 준비를 하세요

2024/04/10

모든 주요 기술 대기업들이 AI 모델을 개발하고 있는데, 말하자면 Google이 Gemini의 새 버전을 출시한 것 같습니다.

Gemini 1.5 Pro가 출시되었으며 몇 가지 흥미로운 기능을 제공하므로 자세히 살펴보고 새로운 기능이 무엇인지 살펴보겠습니다.

Gemini 1.5 Pro 출시, 오디오 인식 기능 제공

Google은 최근 AI 모델을 업데이트했으며 MSPowerUser가 쓴 것처럼 Gemini 1.5 Pro는 Google AI Studio의 공개 미리보기를 통해 180개 이상의 국가에서 사용할 수 있습니다 .

이제 Gemini에는 개발자가 정보를 더 잘 분석하고 이해할 수 있는 100만 개의 컨텍스트 창이 있습니다.

그게 전부는 아닙니다. 이 버전에는 오디오 인식 기능도 있어서 음성 언어를 처리할 수 있습니다. 파일 업로드도 지원되므로 오디오 파일을 업로드하면 Gemini가 이를 분석해 드립니다.

이 기능에 대해 개발자가 말한 내용은 다음과 같습니다.

또한 이 업데이트는 개발자에게 더 큰 제어 기능과 기능을 제공하며 시스템 지침도 지원하므로 역할, 형식 및 목표를 쉽게 지정할 수 있습니다.

마지막으로, 이미지와 텍스트 모두에서 구조화된 데이터를 추출할 수 있는 JSON 모드가 있습니다. 개발자에 따르면 cURL은 현재 지원되며 Python SDK 지원도 곧 제공될 예정입니다.

이것이 Google의 전부는 아닙니다. Gemini가 곧 Android용 Gmail에 재생 제안을 제공할 것이라는 보고도 있으므로 계속 지켜봐 주시기 바랍니다.

Jeff Dean의 117,000개 이상의 토큰 강의와 같은 강의 녹음을 업로드할 수 있으며 Gemini 1.5 Pro는 이를 답안이 있는 퀴즈로 바꿀 수 있습니다.