IBM, 고성능 AI 모델 '그래니트 3.0' 발표…비즈니스에 최적화

[아이티비즈 김문구 기자] IBM은 연례 테크익스체인지(TechXchange) 행사에서 가장 진보된 자사 인공지능(AI) 모델 제품군인 '그래니트(Granite) 3.0'을 발표했다.

IBM의 3세대 그래니트 플래그십 언어 모델은 많은 학술 및 산업 벤치마크에서 비슷한 크기의 다른 모델들을 능가하거나 동등한 성능을 보이며, 뛰어난 성능, 투명성, 안전성을 입증했다.

IBM 그래니트 모델은 오픈소스 AI에 대한 IBM의 의지를 바탕으로 아파치 2.0 라이선스 하에 공개되어 특정 모델에 대한 비종속성은 물론 성능 및 비용 효율성 측면에 있어 기업 고객과 커뮤니티에 독보적인 가치를 제공할 것으로 예상된다.

이번에 발표된 IBM의 그래니트 3.0 제품군은 △범용/언어 모델: 그래니트 3.0 8B 인스트럭트(Instruct), 그래니트 3.0 2B 인스트럭트, 그래니트 3.0 8B 베이스(Base), 그래니트 3.0 2B 베이스 △안전 장치 및 안전성 모델: 그래니트 가디언(Guardian) 3.0 8B, 그래니트 가디언 3.0 2B △혼합 전문가 모델: 그래니트 3.0 3B-A800M 인스트럭트, 그래니트 3.0 1B-A400M 인스트럭트, 그래니트 3.0 3B-A800M 베이스, 그래니트 3.0 1B-A400M 베이스 등이다.

새로운 그래니트 3.0 8B 및 2B 언어 모델은 기업 AI에 최적화된 '주력' 모델로 설계되어, 검색 증강 생성(RAG), 분류, 요약, 엔터티 추출 및 도구 사용과 같은 다양한 작업에서 뛰어난 성능을 발휘한다. 이 모델들은 소형이면서도 매우 유연해 기업 데이터를 기반으로 세밀하게 조정할 수 있으며, 다양한 비즈니스 환경과 워크플로우에 손쉽게 통합되도록 설계되었다.

대부분의 거대 언어 모델(LLM)은 공개 데이터를 기반으로 훈련되며, 기업의 데이터를 활용하는 경우는 아직 많지 않다. IBM은 지난 5월 레드햇과 함께 선보인 혁신적인 정렬 튜닝 기법 인스트럭트랩(InstructLab)을 통해 소형 그래니트 모델과 기업 데이터를 결합하면 더 큰 모델의 성능을 훨씬 낮은 비용으로 구현할 수 있다고 믿고 있다(여러 초기 개념 증명 프로젝트 에서 대형 모델에 비해 비용이 3배에서 23배까지 절감된 것으로 나타남).

그래니트 3.0의 출시는 IBM이 AI 제품에서 투명성, 안전성, 신뢰성을 더욱 강화하겠다는 의지를 보여준다. 그래니트 3.0 기술 보고서와 사용 가이드는 이 모델들을 훈련하는 데 사용된 데이터 세트, 필터링, 정제 및 큐레이션 과정에 대한 상세 정보와 주요 학술 및 기업 벤치마크에서의 성능 결과를 제공한다.

IBM은 이번 출시의 일환으로 그래니트 가디언(Granite Guardian) 모델도 새롭게 선보였다. 이 모델은 애플리케이션 개발자가 사용자 명령어와 LLM의 답변에서 발생할 수 있는 다양한 위험 요소를 감지해 안전 장치를 구현할 수 있도록 지원한다. 그래니트 가디언 3.0 8B와 2B 모델은 현재 시장에서 가장 포괄적인 위험 및 피해 탐지 기능을 제공한다.

김문구 기자 다른기사 보기