Developer's Development

[플레이데이터 SK네트웍스 Family AI 캠프 17기] 12주차 회고 본문

회고

[플레이데이터 SK네트웍스 Family AI 캠프 17기] 12주차 회고

mylee 2025. 9. 14. 22:44

Hello World 👋🏻

이번 한 주는 복잡한 이론에 머리를 싸매다가도, 제가 만든 게임 속 세상이 AI에 의해 실시간으로 펼쳐지는 것을 보며 감탄했던 짜릿한 순간들이 많았습니다.

그럼 지난 한 주, 또 무엇을 배우고 어떤 세상을 만들어봤는지, 저의 성장 기록을 시작해 볼게요!

 

📅 공부 기록

이번 주는 LLM이 단순히 정해진 답변만 하는 것을 넘어 스스로 생각하고(CoT),

특정 목적에 맞게 더 똑똑해지도록(파인튜닝) 만드는 고급 기술들을 배웠습니다.

모델의 뇌를 열어보는 듯한 복잡한 과정이었지만, 이 기술들이 왜 현대 AI의 핵심인지 이해할 수 있었어요.

 

LLM에게 복잡한 질문을 던질 때, 정답만 요구하는 것이 아니라 '생각의 과정'을 단계별로 서술하도록 유도하는 프롬프트 기법이에요.

마치 수학 문제를 풀 때 풀이 과정을 함께 적는 것처럼, 모델의 추론 능력을 극대화하여 더 정확한 답변을 얻을 수 있다는 점이 정말 흥미로웠습니다.

 

거대한 범용 LLM을 특정 도메인의 전문가로 만드는 '맞춤형 추가 학습' 과정이에요.

수억 개의 파라미터를 모두 재학습시키는 방식의 어려움과 그 대안으로 등장한 여러 기법들을 배울 수 있었습니다.

 

파인튜닝의 단점인 막대한 계산 비용과 시간을 해결하기 위한 효율적인 방법론이에요.

모델 전체가 아닌, 아주 일부의 작은 파라미터만 추가하거나 수정하여 학습시키는 방식이죠.

'가성비' 좋게 모델을 튜닝할 수 있다는 점에서 정말 기발한 아이디어라고 생각했습니다.

 

ChatGPT를 지금처럼 똑똑하고 안전하게 만든 핵심 기술이에요.

인간이 선호하는 답변에 '보상'을 주는 강화학습을 통해, 모델이 더 유용하고 무해한 방향으로 답변을 생성하도록 '교정'하는 과정이죠!

 

📝 실습 기록

  • LLM Game - 1999, IT 회사 신입사원 생존기

https://github.com/mylee99125/llm_game

 

GitHub - mylee99125/llm_game

Contribute to mylee99125/llm_game development by creating an account on GitHub.

github.com

 

LLM이 실시간으로 상황을 생성하는 텍스트 기반 TRPG(Tabletop Role-Playing Game)을 만들어봤어요.

플레이어는 1999년, 격동의 벤처 붐이 일던 시기 IT 회사에 첫 출근한 신입사원이 되어 하루 동안 살아남아야 하는 컨셉입니다.

LLM은 게임 마스터(GM)가 되어, 시대적 배경이 녹아있는 흥미로운 상황들을 텍스트로 묘사하고, 플레이어의 선택에 따라 실시간으로 다음 이야기를 만들어나가는 역할을 맡았죠.

 

❌ 발견했던 오류와 해결 과정

가장 큰 문제는 LLM(게임 마스터)이 게임의 일관성을 잃어버리는 현상이었습니다.

예를 들어, 오전에 '김대리'에게 보고서를 제출했는데, 오후에는 '김대리'를 처음 보는 사람처럼 묘사하는 등 게임의 맥락을 잊어버리는 경우가 잦았아요.

이 문제를 해결하기 위해, 매 턴마다 플레이어의 행동을 LLM에게 전달할 때, 게임의 현재 상태(State)를 명확하게 요약한 정보를 프롬프트에 함께 포함하는 방식을 사용했습니다.

멘탈, 업무 능력, 사회성 상태 정보를 명시하여, LLM이 이전 상황을 계속 기억하고 일관된 스토리를 생성하도록 유도했습니다.

최종 결과 (실시간 스탯 변화와 함께하는 TRPG 플레이)

 

💭 KPT

Keep 

 

단순히 기술을 배우는 것을 넘어, "1999년 신입사원"이라는 재미있는 컨셉을 결합하여 창의적인 프로젝트를 기획하고 완성까지 이끌어낸 점을 칭찬하고 싶습니다.

LLM의 일관성 문제를 해결하기 위해 '상태 관리 프롬프트'라는 구체적인 해결책을 고안하고 적용해 본 과정은, 문제 해결 능력을 기르는 데 큰 도움이 되었어요.

 

Problem

 

무엇보다 이번 주는 제 의지와는 상관없이 위장염과 컨디션 난조가 발목을 붙잡았던 한 주였습니다.

강의를 빠진 날이 많아 진도를 따라가기 벅찼고, 마음은 앞서는데 몸이 따라주지 않아 스스로에게 너무 답답하고 화가 나기도 했어요.

기술적인 문제보다 제 몸 하나를 제대로 관리하지 못했다는 자책감이 더 크게 다가왔던 힘겨운 여정이었습니다.

또한, 게임의 자유도를 높이다 보니 LLM이 가끔 1999년이라는 시대적 배경을 망각하고 스마트폰 같은 최신 기술을 언급하는 등, 여전히 통제가 완벽하지 않다는 기술적 한계도 느꼈어요.

 

Try 

 

가장 먼저, '꾸준함'은 '건강'이라는 기본 전제 위에서만 가능하다는 사실을 인정하고 받아들이려고 해요.

무리하지 않는 선에서 최소한의 일일 목표를 세우고, 달성 여부와 상관없이 정해진 시간에는 쉬는 연습을 해야겠습니다.

기술적으로는, 다음 프로젝트에 파인튜닝을 적용하여 모델이 특정 도메인에 대한 지식을 더 깊이 학습하도록 만들어, 프롬프트만으로는 부족했던 일관성과 컨셉 유지 능력을 강화해보고 싶습니다.

 

 

이렇게 한 주간의 회고를 정리하고 보니, 이번 주는 기술적인 성장과 함께 육체적인 어려움이 겹쳤던 힘든 시간이었네요.

때로는 복잡한 개념과 씨름하고, 예상치 못한 오류에 좌절하기도 하지만, 그 끝에서 제가 상상했던 무언가가 실제로 움직이는 것을 볼 때의 기쁨이 모든 어려움을 잊게 해주는 것 같아요.

 

하지만 분명 저뿐만 아니라, 지금 이 순간에도 보이지 않는 곳에서 묵묵히 코드를 짜고, 막막한 개념과 씨름하며 각자의 싸움을 하고 있을 우리 동기들이 있으리라 생각합니다.

모두가 비슷한 어려움 속에서도 포기하지 않고 한 걸음씩 나아가고 있다는 사실이 서로에게 정말 큰 위로와 힘이 되는 요즘이에요.

한 주 동안 모두 고생 많았고, 다가오는 주도 함께 또 한 뼘 성장해 봐요🔥