골드스파클뉴스골드스파클뉴스

[팽동현의 테크딥다이브] AI계 롤스로이스 `클로드`… 챗GPT, 강력한 적수 만났다

[팽동현의 테크딥다이브] AI계 롤스로이스 `클로드`… 챗GPT, 강력한 적수 만났다

앤스로픽, 오푸스 등 3가지 新모델 선봬… 답변 정확도 2배 향상

환각·오류현상 있지만 논리적 설명·코딩 능력 챗GPT보다 우월


생성형AI(인공지능)를 둘러싼 글로벌 빅테크들의 기술패권 경쟁에서 구글이 주춤한 가운데 앤스로픽이 오픈AI의 대항마로 자리잡을 수 있을지 주목된다. 오픈AI 창립자 그룹 일원이었던 다니엘라 아모데이, 다리오 아모데이 남매가 2021년 설립한 앤스로픽(Anthtopic)은 최근 새로운 LLM(대규모언어모델)인 '클로드3(Claude 3)'를 발표했다. 지난해 7월 '클로드2'를 출시한 지 약 8개월 만이다.

앤스로픽은 '클로드3'를 총 세 가지 모델로 선보였다. 유료 이용자를 위한 최상위모델 '오푸스(Opus)', 홈페이지를 통해 무료로 사용할 수 있는 '소네트(Sonnet)'를 지난 4일(이하 현지시간) 먼저 내놨고, 이어 경량화 언어모델인 '하이쿠(Haiku)'를 14일 출시했다. 기본 모델명은 정보이론을 정립한 클로드 섀넌에게서 따오더니 분류 명칭에는 클래식 작품번호와 시 종류들을 붙였다.

◇클로드3, 챗GPT-4 능가했다?

앤스로픽은 '클로드3' 모델군을 내놓으면서 광범위한 지능적 작업에 대한 새로운 표준을 제시한다고 자신했다. 특히 최상위모델인 '클로드3 오푸스'에 대한 자부심을 숨기지 않았다. AI시스템에 대해 일반적으로 행해지는 여러 벤치마크 테스트에서 오픈AI GPT-4, 구글 제미나이 등 경쟁자들보다 뛰어난 성적을 기록했다.

대학 학부 수준의 전문지식(MMLU) 측정에선 86.8%를 기록해 GPT-4(86.4%)를 근소하게 앞섰고, 대학원 수준의 추론(GPQA) 역량에선 클로드3 오푸스(50.4%)뿐 아니라 소네트(40.4%)도 GPT-4(35.7%)를 앞질렀다. 기초수학(GSM8K)과 수학경시 문제(MATH) 테스트에선 제미나이 1.0 울트라가 GPT-4보다 좋은 성적을 거둔 바 있는데, 클로드3 오푸스 등장으로 그 자리도 뺏겼다. 클로드2보다 답변 정확도도 두 배 향상돼 할루시네이션(환각·오류) 현상이 덜해졌다는 게 회사의 설명이다.

클로드3는 앤스로픽의 첫 멀티모달 LLM이기도 하다. 이미지, PDF, 차트, 프레젠테이션 등 다양한 형식을 시각적으로 읽고 처리할 수 있으며, 관련 벤치마크 테스트들에서도 GPT-4보다 나은 성적을 기록했다. 다만 이미지 생성 기능은 없다. 기술은 이미 개발했지만 신중하게 적용한다는 방침이다. 다리오 아모데이 CEO(최고경영자)는 출시 당일 로이터통신에 "이미지 생성에 대한 기업 수요가 적지만 (기능 추가를) 검토할 것"이라고 밝혔다. 그는 클로드3 오푸스를 "적어도 현 시점에선 AI모델들 중 롤스로이스"라고 소개했다. 다니엘라 아모데이 사장은 "재무 분석을 정확히 처리하는 등 가장 인지적으로 복잡한 작업을 할 때 고객들은 더 높은 가격에도 오푸스를 선택할 것"이라고 말했다. 이후 일본매체 기가진은 미국 TV프로듀서 맥심 로트가 진행한 IQ 테스트에서 클로드3 오푸스가 챗GPT-4(85)뿐 아니라 인간 평균(100)을 넘는 101을 기록했다고 보도했다.

클로드3는 기본 토큰 20만개, 고객 요청에 따라 토큰 100만개 이상으로 확장 가능한 콘텍스트 창을 지원한다. GPT-4 터보(12만8000개)와 제미나이 프로 1.5(100만개)를 앞선다. 모든 모델에서 경제성도 앞세우는데, 특히 '클로드3 하이쿠'의 경우 GPT-3.5 등 동급 모델 대비 3배 빠른 속도와 절반 수준의 가격을 강조한다. 1달러에 미 연방대법원 판례 400개 또는 이미지 2500개를 처리·분석할 수 있다는 설명이다.

◇엇갈리는 평가…"그래도 제미나이보다야"

클로드3가 나오자마자 벤치마크 기록을 바탕으로 언론과 업계의 이목이 집중됐다. 다양한 사용자들도 평가를 했다. 눈에 띄는 것은 고급 사용자가 프롬프트 엔지니어링 등을 하기에 가장 적합하다는 평이다.

정지훈 DGIST(대구경북과학기술원) 교수는 "단순 조수로 실용적으로 활용하기 위해 질문은 간단히 하고, 관련 답변이 근거와 함께 잘 정리돼 빠르게 나오길 원하는 이에겐 제미나이를 권한다. 반면 CoT(사고사슬) 등의 기법을 쓰고 참고자료도 전달하면서 깊이 있는 용도로 활용하려면 현 시점에선 클로드3가 압도적인 성능을 보인다"며 "그 사이에서 무난하게 쓰고 싶다면 챗GPT"라고 평가했다.

할루시네이션에 대해서는 적잖은 지적이 나온다. 평가기준이 공개된 벤치마크 테스트 결과에 큰 의미를 부여할 필요가 없다는 의견도 있다. 클로드3는 현재 활동 중인 인물 관련 정보나 역사적인 사실 등 다른 AI챗봇들이 검색결과나 뉴스·웹문서 등을 대조해 바로잡을 만한 잘못된 정보를 그럴 듯하게 답변으로 제시한다. RAG(검색증강생성) 기술이 적용되지 않았기 때문이다. 모델 학습에 반영된 데이터도 지난해 8월까지의 정보다.

이경전 경희대 교수는 "답변 생성 속도가 빠른 점은 상당히 인상적이지만, 할루시네이션이 다른 모델들에 비해 심해 보인다. RAG를 쓰지 않아 그런 것으로 보인다"며 "한국어 구사도 부자연스러운 점이 간혹 보인다"고 지적했다.

그럼에도 클로드3의 활용 가치는 충분하다는 의견이 많다. 전용준 리비젼컨설팅 대표는 "실망스러운 제미나이와 달리 클로드3는 챗GPT의 강력한 적수"라고 평했다. 그는 "할루시네이션이 상당하지만 제미나이에 비해선 그리 심하지 않다"면서 "자연스러운 답변 문체, 심층적인 논리적 설명, 비영어권 언어 표현, 코딩 능력 등에서 챗GPT보다 우위를 보이기도 한다. 다만 GPT-4가 나온 지 1년이 된 만큼 새로운 버전이 나오면 다시 평가해야 할 것"이라고 했다.

◇오픈AI 상대 도전은 이제 시작

오픈AI에서 다니엘라 아모데이 사장은 안전성·정책 부사장을, 다리오 아모데이 CEO는 연구 부사장을 역임한 바 있다. 이들이 오픈AI에서 나와 앤스로픽을 세운 것은 AI 안전성 때문이다. 보다 이해하고 신뢰할 수 있는 AI시스템을 구현한다는 게 이들이 내건 목표다. AI 스스로 윤리원칙을 확립하고 그에 따라 행동하는 '구성적 AI(Constitutional AI)'라는 독자적인 접근방식을 취하고 있다. 설립 과정에서 오픈AI에서 9명 이상의 기술인력이 이들과 뜻을 같이해 합류한 것으로 알려졌다.

AI 안전성 이슈가 계속 불거지는 만큼 모델 성능 경쟁력이 갖춰지면 이들의 입지도 높아질 것으로 전망된다. 지난해 오픈AI, MS, 구글과 함께 백악관의 안전성 관련 회의에 초대되기도 했다. 아마존과 구글이 각각 40억달러(약 5조3280억원)와 20억달러(약 2조6640억원)를 투자하는 등 지난해 5번의 펀딩을 통해 총 73억달러(약 9조7236억원)를 끌어모았다. 국내에선 SK텔레콤도 지난해 1억달러(약 1332억원)를 투자했다.

앤스로픽이 클라우드 시장에서 가져올 변화도 주목할 부분이다. MS가 현재 클라우드 시장에서 급성장하는 것은 투자를 통해 오픈AI 모델의 클라우드상 공급을 독점한 영향이 크다. 앤스로픽 모델은 투자사인 AWS(아마존웹서비스)와 구글의 클라우드에서 먼저 제공된다. 특히 클라우드 시장 왕좌 수성에 나서는 AWS가 긴밀한 파트너십을 이어가는 게 눈에 띈다 인프라 지원과 함께 생성형AI 서비스 'AWS 베드록'을 통한 이용을 권장하는 등 다양한 협업 행보를 보인다. AWS 기술 블로그에선 AWS 검색 서비스인 '켄드라'로 클로드 모델들에 RAG를 적용해 보완하는 방법도 이미 안내하고 있다. 나아가 AWS 자체개발 칩의 최적화도 함께 추진, 지난해 말 AWS 연례 기술 컨퍼런스 'AWS 리인벤트 2023'에선 다리오 아모데이 CEO가 연단에 올라 "AWS 인퍼런시아를 최적화하고 있다"고 밝히기도 했다.

다만 오픈AI가 GPT-4.5를 곧 선보인다면 얘기가 달라질 수 있다. 최근 IT매체와 개발자 커뮤니티 등에 따르면 빙 검색엔진 등에서 GPT-4.5 터보 제품페이지의 색인이 일시적으로 생성됐다가 삭제된 일이 있었다. 보도에선 출시 시점으로 오는 6월을 꼽았다. 앤스로픽이 오픈AI 대항마로 설 수 있을지 여부도 그때 다시 평가가 이뤄질 것으로 보인다.

클로드3 오퍼스에게 챗GPT4와 비교 시 강점을 묻자 돌아온 답변. 팽동현 기자
지난해 12월 미국 라스베이거스에서 열린 'AWS 리인벤트 2023' 컨퍼런스에서 아담 셀립스키(왼쪽) AWS CEO가 다리오 아모데이 앤스로픽 CEO를 연단에서 맞이하는 모습. 팽동현 기자
칭찬하다(551)
허가 없이 전재할 수 없습니다:>골드스파클뉴스 » [팽동현의 테크딥다이브] AI계 롤스로이스 `클로드`… 챗GPT, 강력한 적수 만났다