ChatGPT가 우연히 비밀 지침을 공개했습니다. 그 내용은 다음과 같습니다!

ChatGPT가 우연히 비밀 지침을 공개했습니다. 그 내용은 다음과 같습니다!

알아야 할 사항

  • ChatGPT는 실수로 응답을 안내하는 명령어 세트를 공개했습니다.
  • OpenAI가 그 이후 탈옥에 대한 패치를 공개했지만 ChatGPT의 교육 데이터는 이제 공개되었습니다.
  • ChatGPT 지침에는 몇 가지 기본 지침 외에 DALL-E의 사용법, 온라인에서 콘텐츠를 찾는 시기, 각 ‘개성’의 용도 등이 포함되어 있습니다.

AI 챗봇이 2022년 11월에 출시된 이래로, 기술 명탐정과 해커들은 ChatGPT의 제한을 우회하고 그것이 어떻게 작동하는지 파헤치려고 노력해 왔습니다. 하지만 보통은 움직이는 표적이었고(예를 들어, DAN), AI 챗봇을 제일브레이킹하는 것은 어린애 장난이 아닙니다. 물론 ChatGPT가 요청도 없이 모든 것을 포기하지 않는 한 말입니다.

놀랍게도 ChatGPT는 최근 완전히 우연히 사용자에게 일련의 교육 데이터를 공개했습니다. ChatGPT에게 간단한 ‘안녕’으로 인사하자 Reddit 사용자 F0XMaster는 OpenAI가 채팅에 내장한 ChatGPT의 모든 지침을 제공받았습니다. 요청하지 않은 지침 세트에는 챗봇에 대한 여러 가지 안전 및 실용적인 지침이 포함되었습니다.

다행히도, 이 문제가 해결되고 명령어 세트가 제거되기 전에 사용자는 Reddit에 모든 것을 게시했습니다. ChatGPT가 공개한 모든 것에서 몇 가지 주요 요점과 사용자 요청을 처리하는 방식에 대해 알려주는 내용이 있습니다.

ChatGPT의 비밀 지침이 공개되었습니다!

ChatGPT가 유출한 정보에는 DALL-E, 브라우저, 파이썬, 그리고 이상하게도 ChatGPT 개성 세트와 같은 다양한 도구에 대한 기본 지침과 가이드라인이 포함됩니다. 간결함을 위해 여기서는 가장 눈에 띄는 부분만 강조하겠습니다. F0XMaster의 reddit 게시물 에서 전체 지침 세트를 읽을 수 있습니다 .

기본 지침

OpenAI가 ChatGPT에 제공한 기본 지침은 다음과 같습니다. “당신은 GPT-4 아키텍처를 기반으로 OpenAI가 훈련한 대규모 언어 모델인 ChatGPT입니다.”

ChatGPT 앱을 사용하는 사람들은 한두 줄의 추가 지침을 받았습니다. “사용자와 ChatGPT iOS 앱을 통해 채팅하고 있습니다. 즉, 사용자의 요청에 추론이나 긴 형식의 출력이 필요하지 않는 한 대부분의 경우 줄은 한두 문장이어야 합니다. 명확하게 요청받지 않는 한 이모티콘은 절대 사용하지 마세요.”

그 후, ChatGPT는 2023-10년 지식 마감일을 제공했습니다.

지시 사항 측면에서 특별하거나 새로운 내용은 없지만, 말의 입에서 직접 기본적인 지시를 받는 것이 좋습니다.

그녀에게 줘

챗봇은 이미지 생성기인 DALL-E에 대한 규칙과 지침을 제공했습니다. ChatGPT는 이미지 생성을 위한 8가지 기본 지침을 포기했는데, 그 중 대부분은 저작권 침해를 피하는 것과 관련이 있습니다. 하지만 사용자가 제공할 수 있는 신속한 지침에 어긋나는 몇 가지 지침이 있었습니다.

예를 들어, OpenAI는 ChatGPT에 “사용자가 더 많이 요청하더라도 1개 이상의 이미지를 생성하지 않도록” 지시합니다.

그 이유는 이해할 수 있습니다. OpenAI가 제공할 수 있는 무료 토큰에는 한계가 있기 때문입니다. 하지만 ChatGPT가 처음부터 다중 이미지 생성 요청을 충족하지 않는다는 것을 사용자에게 알리는 것이 투명하지 않은 방식으로 제한하는 것보다 낫습니다.

ChatGPT는 또한 1912년 이후에 최신 작품이 만들어졌다면 작가의 스타일로 이미지를 만들지 않고(또는 이름을 붙이지 않고) 저작권 문제를 피하기 위해 그렇게 합니다. 어쨌든 특정 작가의 스타일로 이미지를 찾는다면 연도를 아는 것이 좋습니다. 그래서 폴록이나 다다의 작품은 아직 없습니다.

브라우저

ChatGPT는 또한 브라우저를 사용할 때 안내하는 지침을 언급했습니다. 주로 ChatGPT는 “사용자가 현재 이벤트나 실시간 정보가 필요한 것(날씨, 스포츠 경기 점수 등)에 대해 질문할 때” 브라우저 도구를 사용합니다.

ChatGPT는 사용자가 제공한 용어가 확실하지 않거나, 사용자가 명시적으로 조회하도록 요청하는 경우에도 브라우저 도구를 사용합니다.

웹에서 콘텐츠를 검색할 때 ChatGPT는 “항상 최소 3페이지, 최대 10페이지를 선택”하고 “다양한 관점을 가진 소스를 선택하고 신뢰할 수 있는 소스를 선호”하도록 지시받습니다. ChatGPT가 정보 소스를 선택하는 프로세스를 아는 것은 응답의 신뢰성을 보장하는 데 큰 도움이 되므로 좋습니다.

ChatGPT 성격

ChatGPT의 지침은 또한 ‘개성’을 강조합니다. 사용자가 발견한 바에 따르면, AI 챗봇에는 여러 가지가 있는 것으로 보입니다. OpenAI는 ChatGPT가 그 중에서 어떻게 선택해야 하는지에 대한 지침을 제시했습니다.

주요 성격은 v2 라고 합니다 . 한 사용자는 ChatGPT에서 이 성격이 어떤 것인지 알려주었습니다. ChatGPT에 따르면, “[v2] 성격은 명확하고 간결하며 도움이 되는 답변을 제공하는 데 중점을 둔 균형 잡힌 대화 톤을 나타냅니다. 친근하고 전문적인 의사소통 간의 균형을 맞추는 것을 목표로 합니다.”

ChatGPT는 v1 성격이 어떤 것인지 더욱 자세히 설명하고 v3 및 v4 성격을 어떻게 정의할 수 있는지 이론화했습니다.

v1 : 이 버전은 보다 공식적이고 사실적인 의사소통 스타일을 강조합니다. 종종 구조화되고 학문적인 톤으로 자세하고 정확한 정보를 제공하는 데 중점을 둡니다.

v3 : 이 버전은 캐주얼하고 친근한 대화 스타일로 기울어질 수 있습니다. 매력적이고 접근하기 쉬운 상호작용을 만드는 것을 우선시하여 대화가 더 편안하고 개인적인 느낌을 줍니다.

v4 : 이 버전은 특정 산업, 인구 통계 또는 사용 사례에 맞게 맞춤화된 응답을 제공하는 것과 같이 특정 상황 또는 사용자 기반에 맞게 설계될 수 있습니다. 톤과 스타일은 이러한 요구 사항에 가장 적합하도록 조정됩니다.

여러 사용자가 ChatGPT에서 ‘Hi’ 또는 간단한 요청으로 지침을 공개하도록 할 수 있었지만 OpenAI가 이러한 대부분을 패치한 것으로 보입니다. 그러나 이 전체 문제로 인해 AI 챗봇을 제일브레이킹하는 아이디어가 다시 부상했습니다.

물론, 이러한 지침 세부 사항이 공개되면 사용자는 제한을 우회하기 위해 이를 이용하려고 합니다. 그러나 이는 또한 AI 시스템이 어디에서 잘못되었는지를 강조하고 개발자가 더 큰 문제가 발생하고 회사의 이미지와 사용자의 보안 및 개인 정보 보호가 손상되지 않도록 항상 경계해야 합니다.

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다