본문 바로가기
Development News/AI

오픈AI 'GPT-4', 대한민국 한의사 국가시험 통과?! AI가 한의학 국가시험에서 보여준 충격적인 성과

by Maccrey Coding 2024. 11. 9.
728x90
반응형

AI의 발전, 한의사 시험 통과 가능성을 열다

최근 한의학 분야에서도 인공지능(AI)의 가능성이 크게 주목받고 있습니다.

특히, 오픈AI의 GPT-4가 대한민국 한의사 국가시험을 통과했다는 놀라운 소식이 전해졌습니다.

그동안 AI는 다양한 분야에서 유용하게 활용되고 있었지만, 특히 인간의 전문적인 지식이 중요한 분야에서는 그 가능성에 대한 의문이 많았습니다.

그러나 이번 연구에서는 AI가 실제 한의학 시험을 통과할 수 있다는 가능성을 확인한 것입니다.

가천대학교 한의과대학 김창업 교수 연구팀은 GPT-4가 한의사 국가시험을 합격 수준으로 해결한 실험을 통해, AI가 어떻게 실제 전문지식을 이해하고 적용할 수 있는지를 보여주었습니다.

 

기존의 연구에서는 AI가 한의사 국가시험을 간신히 통과하지 못했으나, 이번 연구에서는 '프롬프트 엔지니어링'이라는 기법을 적용하여 GPT-4의 성능을 극대화한 결과, AI가 고난도 문제를 해결할 수 있음을 입증했습니다.

이 연구는 AI 기술의 한계와 가능성을 동시에 확인할 수 있는 중요한 사례가 되었으며, 향후 AI가 한의학뿐만 아니라 의학과 다른 전문 분야에서도 인간을 보조하는 중요한 역할을 할 것이라는 가능성을 제시합니다.

GPT-4의 성과, 프롬프트 엔지니어링이 만들어낸 기적

이번 연구에서는 2022년 한의사 국가시험에 포함된 340문항을 GPT-4에 제공하고, 그 결과를 평가했습니다.

놀라운 점은 GPT-4가 전체 340문항 중 66.18%를 정확히 맞췄다는 사실입니다.

특히 본초학, 소아과학, 부인과학에서는 각각 87.5%, 81.2%, 79.2%라는 매우 높은 정확도를 기록하며, 과목별로 과락 기준인 40%를 훨씬 초과하는 성과를 보였습니다.

이는 GPT-4가 기존의 언어 모델보다 한층 더 향상된 성능을 보여준 결과라 할 수 있습니다.

 

반면, 한국 한의학의 특성을 반영한 과목에서는 낮은 정확도를 기록한 점도 눈에 띕니다.

보건의약관계법규와 상한론-사상의학에서는 각각 40.0%, 43.8%라는 상대적으로 낮은 정답률을 보였는데, 이는 GPT-4가 한국의 특수성을 반영하지 못하는 한계를 보여주는 지표로 해석될 수 있습니다.

이 문제는 향후 AI가 특정 지역의 특수한 지식이나 문화를 반영할 수 있도록 개선해야 할 필요성을 시사합니다.

 

이 연구에서 가장 중요한 부분은 '프롬프트 엔지니어링'의 역할입니다. 프롬프트 엔지니어링이란, AI가 문제를 푸는 방식에 대한 최적화 기법으로, 이를 통해 GPT-4는 한국어 문항을 그대로 처리했을 때보다 더 높은 정확도를 기록할 수 있었습니다.

예를 들어, 한의학 용어를 한자로 병기하거나, 문제를 영어로 번역하여 해결했을 때 성능이 크게 향상되었습니다.

이러한 기법은 단순히 AI가 주어진 문항을 처리하는 수준을 넘어서, AI의 사고방식을 최적화하여 문제를 해결하는 방법론으로 자리잡을 수 있습니다.

 

또한, 자기일관성(Self-consistency) 기법을 활용한 결과, 같은 질문에 대해 여러 번 답변을 얻고 가장 빈도가 높은 답을 최종 답변으로 채택했을 때, 정답률이 66.18%로 높아졌습니다.

이는 AI가 인간처럼 반복적인 검토를 통해 보다 신뢰할 수 있는 답을 도출하는 방식으로 발전할 가능성을 보여줍니다.

AI가 한의사 국가시험을 통과한 의미와 미래 전망

이번 연구는 AI가 한의사 국가시험을 통과할 수 있는 가능성을 보여준 매우 중요한 사건입니다.

그동안 AI는 다양한 분야에서 이미 뛰어난 성과를 보였지만, 한의학처럼 인간의 경험과 직관이 중요한 분야에서는 그 가능성에 의문이 있었습니다.

그러나 GPT-4의 성과는 AI가 전문적인 지식을 이해하고 적용하는 데 있어 큰 진전을 이룬 사례로 볼 수 있습니다.

 

하지만 이번 연구에서는 AI의 한계도 분명히 드러났습니다. 한국의 특수한 문화와 법규를 반영해야 하는 한의학의 특성상, GPT-4는 이러한 요소들을 완벽하게 처리하지 못하는 점이 있었습니다.

이는 향후 AI 기술이 각 지역의 특수성을 반영할 수 있도록 발전해야 함을 시사합니다.

향후 AI가 의학 및 한의학 분야에서 더욱 발전하여, 의료 분야에서 인간과 협력하는 새로운 시대가 열릴 가능성도 있습니다.

 

특히, AI가 의학적 판단을 보조하거나 의사와 협력하여 더 나은 치료 방법을 제시하는 역할을 할 수 있다면, 이는 의료 산업의 혁신을 가져올 수 있을 것입니다.

이번 연구는 그 가능성의 첫걸음이 될 수 있는 중요한 이정표입니다.

당신을 위한 3줄 요약

  1. GPT-4가 한의사 국가시험을 합격 수준으로 통과한 연구 결과가 발표되었습니다.
  2. '프롬프트 엔지니어링'을 통해 AI 성능이 크게 향상되었고, 일부 과목에서는 높은 정확도를 기록했습니다.
  3. AI가 한국의 특수성을 반영하지 못한 점은 향후 AI 개선의 필요성을 보여줍니다.

3 line summary for you

  1. GPT-4 has passed the Korean Medicine National Examination at a passing level.
  2. 'Prompt engineering' significantly improved the AI's performance, with high accuracy in certain subjects.
  3. The AI's inability to reflect Korea's unique characteristics highlights the need for future improvements.

구독!! 공감과 댓글,

광고 클릭은 저에게 큰 힘이 됩니다.

 

Starting Google Play App Distribution! "Tester Share" for Recruiting 20 Testers for a Closed Test.

 

Tester Share [테스터쉐어] - Google Play 앱

Tester Share로 Google Play 앱 등록을 단순화하세요.

play.google.com

728x90
반응형