본문 바로가기
ChatGPT와 HR

Chat GPT : 하이퍼파라미터 1 (Hyper Parameter)

by keuikeui 2024. 4. 25.
반응형

 

하이퍼파라미터 : ChatGPT 조절 변수

사용자가 ChatGPT의 세팅값을 세팅을 조절하는 변수로 이 값을 프롬프트에 적용하여 별도의 프롬프트 입력 없이 원하는 방향의 결과물을 만드는데 적용할 수 있다.

이 하이퍼파라미터에는 여러가지 종류가 존재하는데 필요한 파라미터를 프롬프트 입력할 때, 한줄 추가만 하는 것으로 입력은 완료가 된다.

 

1. Top-P

하이퍼파라미터에서 대표적인 값으로 값의 범위는 0~1로 입력할 수 있다. 응답의 다양성을 제어할 때 사용 할 수 있으며 선택하지 않는 경우 기본 값은 1로 적용된다. 이전 단어들을 바탕으로 다음의 단어들을 선택할 때, 단어 후보들의 확률을 바꾸는 방법이다.

Top-P를 0.1로 선택하면 전체 단어 중에서 상위 10%에 해당하는 단어를 선택하게 된다. 상위권에 해당하는 단어가 선택되기 때문에 주제와의 연관성이 높은 단어를 선택하게 된다. 이로 인해서 일관된 응답을 얻을 수 있게 된다. 반대로 Top-P를 0.9로 선택을 하게 되면 이후에 올 단어는 전체의 90% 중에서 선택하게 되어서 거의 모든 분포 내에서 출력을 하게 된다. 보다 다앙한 단어가 선택될 수 있지만 동시에 연관성이 낮은 단어가 선택된다. 서 예측 가능성이 낮아지게 된다.

Top-P는 Temperature는 함께 조절될 수 있으나, 효과적으로 제어하기 위해서는 두 파라미터를 함께 사용하지는 않는 것이 좋다.

 

 

2. Temperature

출력에 대한 확률을(랜덤성)을 제어하는 값으로 ****범위는 0~2이다. 지정하지 않았을 경우에는 1로 설정된다. 값이 높을수록 예측 가능성이 낮은 단어가 선택된다. 예를 들어서 0.1일 때는 다음에 올 수 있는 확률이 아주 높은 단어들 위주로 선택이 되지만 숫자가 커지면 단어들의 확률이 비슷해진다.

ChatGPT 응답의 다양성을 제어하는 역할을 하며, 사용하고자하는 목적에 따라 값을 선택하면 된다.

“나는 오늘 00에 간다” 라고 했을 때. 처음에는 “학교”와 “남극 세종기지” 중에서 학교가 선택될 확률이 높지만 Temperature 값 조절로 두 단어의 선택될 확률을 동일하게 만들 수도 있다. 따라서 일반적이지 않은 단어들이 선택될 수 있게 된다.
값이 높을수록 모델은 다양하고 창의적인 답변을 생성하는 반면, 낮은 값은 더 예측 가능하고 일관된 경향의 응답을 생성한다.값이 높을수록 예측하기 힘든 단어가 선택될 확률이 높아진다.

창의적인 제안이 필요한 경우에는 값을 높여서 사용하고 정확한 정보의 제공이 필요한 경우에는 값을 낮춰서 사용하면 된다.

 

[질문]

오늘 점심 메뉴를 추천해줘. Temperature=0.1

[ChatGPT]

비빔밥을 추천해 드립니다. 한국의 전통적인 요리로, 여러 가지 야채와 고기, 계란, 고추장을 고슬고슬하게 비벼 먹는 매우 영양가 있는 음식입니다. 맛도 좋고 건강에도 좋아 점심 식사로 안성맞춤이죠!

 

[질문]

오늘 점심 메뉴를 추천해줘. Temperature=2

[ChatGPT]

오늘 점심에는 활기 넘치는 모로코 타진을 즐겨보세요. 부드러운 양고기, 살구, 계피, 커민 등의 풍부한 향신료를 넣고 천천히 끓인 이 스튜는 푹신한 쿠스쿠스와 함께 따뜻하고 향기로운 식사를 제공합니다. 달콤함과 풍미가 어우러져 미각을 자극하는 즐거운 요리 여행입니다!

 

 

3. Max_Length

답변의 토큰 수 제한 즉, 답변의 길이를 조절하는 파라미터 값이다. 0~2048의 값을 갖는다. 0의 값은 답변 없는 것이니 단어 하나에 해당하는 10이상부터 2,000의 값으로 사용하면 된다.

답변의 길이 조절을 짧게, 길게 보다 정확한 요청을 할 수 있으며 한글의 경우, 글자 수와 토큰이 영어보다 정확하지 않아서 글자 수 조절이 원하는 대로 되지 않는 경우가 있다. 이럴 때 답변의 토큰 수 제한

 

[질문]

서울의 관광지에 대해 알려줘 max_length=100

[ChatGPT]

한국의 활기 넘치는 수도인 서울은 현대적인 고층 빌딩, 대중 문화, 깊은 전통이 혼합된 곳입니다. 주요 명소로는 왕실의 역사를 보여주는 경복궁; 한국 전통 가옥이 있는 북촌 한옥 마을; 그리고 미래 지향적인 동대문 디자인 플라자. 쇼핑과 음식을 즐길 수 있는 명동은 번화한 지역이며, N서울타워에서는 도시의 탁 트인 전망을 감상할 수 있습니다. 각 유적지는 서울의 역동적인 문화와 역사의 독특한 측면을 보여줍니다..

 

[질문]

서울의 관광지에 대해 알려줘 max_length=1000

[ChatGPT]

대한민국의 수도 서울은 역사, 문화, 기술이 어우러져 옛 것과 새 것이 공존하는 도시입니다. 서울의 주요 관광 명소는 다음과 같습니다.

  1. 경복궁: 원래 1395년에 건축되었으며 조선 왕조의 주요 왕궁이었습니다. 아름다운 건축물과 드넓은 정원이 어우러진 거대한 단지입니다. 방문객들은 근위병 교대식을 관람하고, 궁궐 내 국립고궁박물관과 국립민속박물관을 둘러볼 수 있습니다.
  2. 북촌 한옥마을: 경복궁과 창덕궁 사이에 위치한 북촌 한옥마을에는 조선시대부터 이어온 수백 채의 한옥이 자리해 있습니다. 이 주거 지역에는 좁은 골목길과 전통 건축물이 있어 도시의 과거를 엿볼 수 있습니다.
  3. 창덕궁과 후원: 또 다른 왕실 거주지인 창덕궁은 자연 환경과 아름답게 보존된 정원, 후원 또는 방문자에게 가이드 투어를 제공하는 비밀의 정원과 조화롭게 조화를 이루는 것으로 유명합니다.
  4. N서울타워: 남산 꼭대기에 위치한 이 타워에서는 서울 스카이라인의 탁 트인 전망을 감상할 수 있습니다. 타워 주변 지역은 현지인과 관광객 모두에게 하이킹, 레저 활동, 경치 좋은 케이블카 탑승을 즐길 수 있는 인기 있는 장소입니다.
  5. 명동: 번화한 쇼핑 지역인 명동에는 패션 부티크, 한국의 유명한 스킨케어 제품을 판매하는 뷰티 매장, 길거리 음식 노점상, 주요 백화점이 즐비합니다. 떨어질 때까지 쇼핑을 원하는 사람들에게는 천국입니다.
  6. 동대문 디자인 플라자(DDP): 자하 하디드가 설계한 주요 도시 개발 랜드마크인 DDP는 서울의 문화 중심지입니다. 디자인 관련 전시회와 컨퍼런스, 패션쇼 등 다양한 행사가 개최됩니다. 구조 자체는 미래 지향적인 경이로움입니다.
  7. 인사동: 전통 찻집, 골동품 상점, 미술관으로 유명한 지역입니다. 인사동은 한국 전통 공예품, 도자기, 기념품을 구입하기에 좋은 곳이기도 합니다.
  8. 청계천: 서울 시내를 흐르는 복원된 하천으로 도시의 번잡함에서 벗어나 조용한 휴식처를 제공합니다. 개울에는 산책로가 줄지어 있고, 근처에서는 일년 내내 수많은 축제와 행사가 열립니다.
  9. 롯데월드타워: 555m로 한국에서 가장 높은 건물입니다. 고급 호텔, 전망대, 주거층, 대규모 쇼핑몰, 롯데월드 놀이공원을 갖추고 있습니다.
  10. 홍대: 젊은 분위기, 인디 음악계, 클럽, 식당, 패션 매장으로 유명한 홍대는 인근 홍익대학교의 창의적인 에너지에 영향을 받았습니다. 서울의 활기 넘치는 밤문화와 거리 공연을 경험할 수 있는 좋은 장소입니다.

이러한 명소는 역동적인 현대 도시로 지속적으로 발전하는 동시에 문화유산을 유지하고 기념하는 서울의 능력을 잘 보여줍니다. 역사, 쇼핑, 음식, 오락에 관심이 있든, 서울은 풍부하고 다양한 경험을 제공합니다.

반응형

댓글