Gemini Live 리뷰: AI 모델에 의해 방해받는 개선된 어시스턴트

Gemini Live 리뷰: AI 모델에 의해 방해받는 개선된 어시스턴트

알아야 할 사항

  • 제미니 라이브(Gemini Live)는 10가지의 다양한 음성, 빠른 대화 응답 및 채팅 내용 표시 기능을 갖춘 인상적인 디지털 비서 음성 모드 기능입니다.
  • 안타깝게도, 그 반응은 기본 AI 모델에 의해 방해를 받습니다. Gemini Live의 연설은 또한 약간 너무 공식적일 수 있으며, 그 반응은 단축된 느낌을 줍니다.
  • Gemini Live에 의지하는 건 어리석은 짓이야. 더 나쁜 건 그걸 위해 20달러를 내는 거야.

Gemini Advanced 구독을 통해 제공되는 Gemini Live는 Made by Google 2024 이벤트에서 공개된 이후로 가장 화제가 된 기능으로, Pixel 9 출시조차 단순한 각주로 전락했습니다. 하지만 초기 리뷰는 처음에는 인상적이었지만 호의적이지 않았습니다.

그래서 대부분의 기술 리뷰어처럼, 저는 Gemini Live를 직접 돌려보고 모든 것이 무엇인지 알아보기로 했습니다. 간결하게 하기 위해, 제가 이야기한 모든 것을 말씀드리지는 않겠습니다(시간이 있는 사람이 누구인가요?). 하지만 전반적인 아이디어는 이해하실 겁니다.

Gemini Live – AI 모델로 인해 장애가 있는 고급 디지털 보조원

이제, Gemini Live는 무료가 아니고, 저는 1년짜리 Gemini Advanced 구독이 무료로 제공되는 Pixel 9도 가지고 있지 않습니다. 그래서 저는 무료 체험판을 받았고 Gemini Live를 바로 사용할 수 있었는데, 정말 멋졌습니다.

바로 이렇게요!

하지만 Gemini Live의 20달러 구독료는 그만한 가치가 있을까요? 알아보죠.

제미니 라이브의 장점은 무엇인가요?

Gemini Live는 10가지 음성으로 제공되며 Gemini 설정에서 쉽게 원하는 음성을 선택할 수 있습니다. 하지만 Google에서는 영어(미국)를 기본값으로 설정해야 한다는 점에 유의하세요. 이는 무의미한 요구 사항입니다. 제 말은, 바로 거기에 영국 음성(Capella)이 있다는 것입니다.

내 눈이 나를 속이는가?

어느 쪽이든, 일주일 내내 매일 듣기에 충분한 목소리가 있고, 그 이상도 있습니다.

다른 모든 사람과 마찬가지로 제미니 라이브에 대한 첫인상은 긍정적이었습니다. 구글의 딱딱하고 합성적인 음성을 고려하면 제미니 라이브는 상쾌한 공기와 같습니다. 그러나 음성은 약간 형식적인 편입니다. Umms와 Ahs(및 기타 감탄사)를 많이 들을 수 없습니다. 이러한 이유와 다른 잠재의식적 이유 때문에 음성이 약간 냉정하고 억제되어 있다고 생각했는데, 아마도 사용자가 감정적 유대감을 형성하지 않도록 하기 위한 것 같습니다. OpenAI는 여전히 훨씬 나은 ChatGPT 자체 음성 모드에서 그럴 수 있다고 우려합니다.

반응이 빠르기 때문에 실제로 전화로 친구와 통화하는 것 같은 느낌이 듭니다. 하지만 이야기가 끝나지 않는 친구와는 달리, 제미니는 언제든지 방해할 수 있습니다. 아마 이미 알고 계셨을 겁니다. 하지만 언급할 가치가 있는데, 제미니가 틀렸다는 걸 알면서도 말을 시작하면 꺼지라고 할 수 있기 때문입니다(나중에 자세히 설명하겠습니다).

대화를 끝내자마자, 당신은 읽을 수 있는 대본을 준비하고 사용할 수 있습니다. 저에게는 이것이 가장 좋은 기능 중 하나입니다. 대화가 텍스트에서 어떻게 보이는지 확인하고 다른 사람들과 공유하는 데 정말 도움이 됩니다.

개선의 여지가 있다

Gemini Live가 잘하는 것도 있습니다. 하지만 활용되지 않은 잠재력도 많습니다.

첫째, Gemini Live와의 대화는 의심할 여지 없이 간결합니다. 질문을 하면 Gemini Live는 다른 사람들을 돌보느라 바쁘듯이 가능한 한 적은 단어로 대답합니다. 간접적으로 이야기하거나 침을 뱉는 것을 보지 못할 것입니다. 많은 사람이 좋은 일이라고 말할 것입니다. 하지만 모든 아이디어를 간단하고 요점만 말할 수 있을까요? 오컴의 면도날에도 불구하고요?

예를 들어, 페가수스(내가 그 목소리를 사용했기 때문에)와 이카루스(둘 다 그리스 신화의 일부)를 비교하라고 요청했습니다. 비교의 노드가 여러 개 있지만, 제미니 라이브는 간단하고 요점 있는 답변을 주었습니다. 하누만(힌두 신화에서)을 가져와서 다른 각도에서 비교할 수 있도록 했습니다. 그리고 다시, 몇 문장을 넘지 않았습니다. 상황이 답답해졌습니다.

더 많은 내용을 말하게 하려고 여러 번 시도한 후, 나는 그 자세한 정도를 조정할 수 있는 설정이 있는지 물었습니다. 그것은 그것을 바꿀 수 없다고 말했지만, 매우 권위 있게 내가 직접 할 수 있는 방법에 대한 지침을 주었고, 그런 설정이 없기 때문에 나는 어리석게도 그것을 따랐습니다.

뭐? 어디서?

이제부터 말씀드릴 것은…

어디에 문제가 생기나요?

Gemini의 허구와 환각에 대한 경향은 사용자들 사이에 신뢰를 쌓지 못했습니다. 과거에 이미지 생성 실수로 인해 많은 비난을 받았습니다. 불행히도 모드가 변경되었고 기본 모델이 Gemini 1.5 Flash로 업데이트되었지만 Gemini Live에서는 여전히 문제가 있습니다.

대부분의 답변은 사실 정보에 기초하지만, 가끔은 뜬금없이 답변을 내놓기도 합니다.

AI에 목소리를 주는 것이 사용자들 사이에서 더 많은 신뢰를 얻는다는 주장은 확실히 있습니다. 그리고 인간과 비슷한 목소리라면, AI를 신뢰하고 답변이 제시되는 자신감에 흔들리기가 훨씬 쉽습니다. 하지만 경계하지 않거나 의심스러운 답변에 대한 사실 확인을 하지 않는다면, 제가 그랬던 것처럼 속을 수 있습니다.

기술은 예상보다 빠르게 발전하고 있지만, 챗봇은 예전처럼 환각에 취약합니다. 따라서 AI가 잘못된 정보를 제공하는 경향을 알고 있더라도 계속해서 맹목적으로 의존한다면, 아마도 당신에게 필요한 것은 인공 지능이 아닐 것입니다.

저와 함께 말해 보세요: 한 번 속으면 당신의 잘못이지만, 두 번 속으면 나의 잘못입니다.

Gemini Live를 ChatGPT의 고급 음성 모드와 비교하면 어떻습니까?

이제 방 안에 있는 코끼리를 생각해 봅시다. Gemini Live는 ChatGPT의 고급 음성 모드와 어떻게 비교될까요? 사실, Gemini Live는 ChatGPT의 음성 모드만큼 장황하거나 매력적이거나 재미있지 않습니다. 후자는 약간 너무 매력적이고(심지어 유혹적일 수도 있고) 소름 돋을 정도로 인간과 비슷할 수도 있지만, 모든 숙고하는 소리와 매너리즘으로 인해 적어도 재미있게 놀 수 있는 도구로 사용할 수 있습니다. 반면에 Gemini Live는 자신을 너무 심각하게 여기는데, 특히 AI 모델에 의해 응답이 제한되어 있기 때문에 유리하지 않을 수 있습니다.

하지만 둘 사이의 가장 큰 차이점은 아마도 이것일 것입니다. Gemini Live는 음성을 텍스트로 해석한 다음 응답하는 반면, ChatGPT의 음성 모드는 음성을 직접 처리합니다.

평결

Gemini Live는 훌륭한 도구이며, 이전의 Google Assistant보다 훨씬 나아졌습니다. 잠금 화면에서 호출할 수 있는 기능은 편리하고, 10가지 음성으로 충분히 활용할 수 있습니다. 하지만 전문적인 용도로 이 서비스에 의존하는 것은 미친 짓입니다. 개인적으로, 저는 Gemini Live에만 20달러를 지불하는 것보다는 아무것도 모르는 자선 단체에 돈을 기부하는 편이 낫습니다. 다행히도 Gemini Advanced 구독에는 다른 혜택이 있습니다.

현재 상황에서는 AI를 어떤 방식으로든 회복 중인 정신분열증 환자로 보는 것이 좋습니다. 나아지고 있지만 여전히 재발하기 쉽습니다. 유일한 차이점은 주머니에 정신분열증 환자가 없고, 정신분열증 환자를 얻기 위해 돈을 지불하지 않을 것이라는 것입니다.

Gemini Live에 대해 어떻게 생각하세요? Google이 이 빛나는 리뷰를 억제할 것이라고 생각하세요? 아래 댓글에서 알려주세요.

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다