"의료"에 특화한 오픈소스 대규모 언어모델 "메디트론(Meditron)" 등장

Meta의 대규모 언어 모델(LLM)인 "Llama2"를 기반으로 의학 서적으로 트레이닝한 의료 전문 LLM 스위트 "메디트론(Meditron)"이 등장. 등장 직후이기 때문에 정규 채용은 아직 권장되지 않았지만, 의료 분야에 관한 능력이 GPT-3.5를 웃돌고 있는 것으로 보고되었다.

 


대규모 언어 모델은 인간의 말을 받아 자연스러운 말을 출력하는 처리를 할 수 있는 모델로, 채팅 서비스인 "Chat GPT"와 같은 각종 서비스에 사용되고 있으며, 금융, 과학 등 특정 분야에 특화된 모델도 속속 등장하고 있다.

의료 분야에 특화된 모델에 대해서도 다양한 대처가 이루어져 왔지만, 결과적으로 탄생한 모델은 "GPT-4"와 같은 클로즈드 소스이거나, 혹은 규모가 크지 않은 것 뿐이었는데, 이러한 상황에 눈독을 들인 스위스 연방공대 로잔의 제민 첸 씨등이 작성한 LLM 스위트가 "메디트론"으로, 발표와 동시에 LLM의 "메디트론-7B" 및 "메디트론-70B"가 공개되었다.

 


Meditron-7B와 Meditron-70B는 모두 "Llama 2"를 기반으로 PubMed의 논문과 초록, 국제적으로 인지된 의학 가이드라인을 포함한 문서로 트레이닝된 모델로, 이러한 데이터를 바탕으로 의학적 지식을 출력하도록 설계되어 있다.

 


의료 분야의 성능을 측정하는 벤치마크를 실시한 결과, Meditron-70B는 무료판 Chat GPT에 이용되는 LLM GPT-3.5나, Google의 의료용 LLM Med-PaLM을 웃돌아, GPT-4나 Med-PaLM-2에 육박하는 성능을 보였다는 것. 이러한 성능의 LLM이 새롭게 오픈소스로 공개됨에 따라, LLM의 의학적 지식과 추론 능력이 널리 사용될 것으로 기대되고 있다. 구체적으로는 진찰이나 진단 보조, 질환 정보 조회 등의 사용 사례가 상정된다고 한다.

현 시점에서, Meditron 스위트는 시험과 평가를 위한 이용이 권장되고 있고, 안전하게 혹은 전문적으로 실전 환경에서 사용하기에는 적합하지 않다고 하며, 또한 이 모델을 사용하여 텍스트를 생성하는 것은 가능하지만, 약제 등의 생산 혹은 사람에게 영향을 미칠 가능성이 있는 작업에 직접 사용해서는 안 된다고도 덧붙였다.