신약 개발 위해 생성형 AI를 발전시키는 엔비디아 네모

해당 기사와 무관한 이미지
해당 기사와 무관한 이미지

바이오네모는 사전 훈련된 LLM(대규모 언어 모델), 데이터 로더, 최적화된 훈련 방법을 갖춘 디지털 생물학 생성형 AI용 도메인 특화 프레임워크이다. 이는 표적 식별, 단백질 구조 예측, 약물 후보 스크리닝을 가속화해 컴퓨터 기반 신약 개발을 발전시키는 데 기여한다.

신약 개발 팀은 자체 데이터를 사용해 바이오네모로 모델을 구축하거나 최적화하고 이를 클라우드 기반 고성능 컴퓨팅 클러스터에서 실행할 수 있다.

이러한 모델 중 하나인 ESM-2는 단백질 구조 예측을 지원하는 강력한 LLM이다. ESM-2은 256개의 엔비디아 H100 텐서 코어 GPU(H100 Tensor Core GPUs)에서 선형에 가까운 확장을 달성한다. 연구진들은 512개의 H100 GPU로 확장해 논문에서 발표된 훈련 시간인 한 달이 아닌 며칠 만에 훈련을 완료할 수 있다.

개발자들은 6억 5천만 개 또는 30억 개의 매개변수 체크포인트를 사용해 ESM-2를 대규모로 훈련할 수 있다. 바이오네모 훈련 프레임워크에서 지원되는 추가 AI 모델로는 저분자 생성 모델 메가몰BART(MegaMolBART)와 단백질 서열 생성 모델 ProtT5가 있다.

바이오네모의 사전 훈련된 모델과 최적화된 훈련 방법은 AWS 패러렐클러스터, 아마존 ECS와 같은 자체 관리형 서비스뿐 아니라 엔비디아 DGX 클라우드와 아마존 세이지메이커를 이용한 통합 관리 서비스에서도 사용할 수 있다. 이를 통해 연구개발팀은 더 많은 신약 후보를 탐색하고, 습식 실험실을 최적화하며, 유망한 임상 후보를 더 빠르게 찾을 수 있는 기초 모델을 구축할 수 있다.

저작권자 © 티뉴스 무단전재 및 재배포 금지