설립 3년차 중국 AI 스타트업 혜성1조개 파라미터 모델 ‘키미 K2’ 개발해상업 이용까지 가능하도록 모델 개방주요 코딩 벤치마크서 딥시크 뛰어넘어 문샷AI의 생성형 인공지능(AI) 서비스 ‘키미(KIMI)’ 이미지 [출처 = 문샷AI 웹사이트 캡처]지난 11일 등장한 중국의 거대언어모델(LLM) ‘키미(KIMI) K2’가 뛰어난 코딩 실력으로 AI 업계에서 혜성처럼 화제를 모으고 있다.일각에서는 올해 초 파장을 일으켰던 딥시크처럼 중국 AI 스타트업이 또 한 번의 ‘딥시크 모먼트’를 가져왔다는 평가까지 나왔다.중국 스타트업 문샷AI가 선보인 모델 ‘키미 K2’는 약 1조개의 파라미터로 구성된 대형 모델이다.파라미터 수는 인간 두뇌의 시냅스에 해당하는 AI 모델의 논리 단위를 말한다. 숫자가 클수록 연산 능력이 강력한 것으로 풀이된다. 미국의 메타의 최신 AI 모델인 ‘라마4’ 중 가장 큰 모델이 4000억개, 딥시크의 R1 모델이 6710억개의 파라미터로 구성되어 있다.키미 K2는 딥시크 등 주요 AI 모델들이 활용하고 있는 ‘전문가 혼합(Mixture of Experts·MoE)’ 방식을 활용함으로써 답변을 처리할 때 모든 파라미터를 사용하지 않고 해당 작업에 필요한 일부 파라미터만 사용하는 것이 특징이다. 비용 측면에서 더 효율적이다.키미 K2의 경우 1조개의 파라미터 중 320억개의 파라미터만 활성화해 추론 작업을 수행한다. 문샷AI가 공개한 ‘키미 K2’의 주요 벤치마크 테스트 비교 표 [출처 = 문샷AI 웹사이트]키미 K2가 주목을 받은 것은 뛰어난 코딩 역량 때문이다. 문샷AI는 “수학과 코딩 등의 분야에서 최고 수준의 성능을 달성했다”며 자사 모델과 오픈AI, 앤스로픽 등 빅테크 모델의 코딩 벤치마크를 비교한 결과를 제시했다.문샷AI에 따르면 프로그래밍에 중점을 둔 벤치마크 SWE-벤치 베리파이드에서 키미 K2는 65.8%의 정확도를 기록하며 앤스로픽의 ‘클로트 4 오푸스(72.5%)’ 다음으로 2위를 기록했다.또 다른 코딩 성능 평가 벤치마크인 라이브코드벤치(LiveCodeBench)에서는 53.7% 정확도로 앤스로픽(47.4%), 오픈AI(44.7%)를 모두 제치고 1위를 기록했다.또한 키미 K2는 상업적인 이용도 가능하게끔 모델이 공개되었다. 일부 코드와 가중치를 공개한 오픈웨이트 설립 3년차 중국 AI 스타트업 혜성1조개 파라미터 모델 ‘키미 K2’ 개발해상업 이용까지 가능하도록 모델 개방주요 코딩 벤치마크서 딥시크 뛰어넘어 문샷AI의 생성형 인공지능(AI) 서비스 ‘키미(KIMI)’ 이미지 [출처 = 문샷AI 웹사이트 캡처]지난 11일 등장한 중국의 거대언어모델(LLM) ‘키미(KIMI) K2’가 뛰어난 코딩 실력으로 AI 업계에서 혜성처럼 화제를 모으고 있다.일각에서는 올해 초 파장을 일으켰던 딥시크처럼 중국 AI 스타트업이 또 한 번의 ‘딥시크 모먼트’를 가져왔다는 평가까지 나왔다.중국 스타트업 문샷AI가 선보인 모델 ‘키미 K2’는 약 1조개의 파라미터로 구성된 대형 모델이다.파라미터 수는 인간 두뇌의 시냅스에 해당하는 AI 모델의 논리 단위를 말한다. 숫자가 클수록 연산 능력이 강력한 것으로 풀이된다. 미국의 메타의 최신 AI 모델인 ‘라마4’ 중 가장 큰 모델이 4000억개, 딥시크의 R1 모델이 6710억개의 파라미터로 구성되어 있다.키미 K2는 딥시크 등 주요 AI 모델들이 활용하고 있는 ‘전문가 혼합(Mixture of Experts·MoE)’ 방식을 활용함으로써 답변을 처리할 때 모든 파라미터를 사용하지 않고 해당 작업에 필요한 일부 파라미터만 사용하는 것이 특징이다. 비용 측면에서 더 효율적이다.키미 K2의 경우 1조개의 파라미터 중 320억개의 파라미터만 활성화해 추론 작업을 수행한다. 문샷AI가 공개한 ‘키미 K2’의 주요 벤치마크 테스트 비교 표 [출처 = 문샷AI 웹사이트]키미 K2가 주목을 받은 것은 뛰어난 코딩 역량 때문이다. 문샷AI는 “수학과 코딩 등의 분야에서 최고 수준의 성능을 달성했다”며 자사 모델과 오픈AI, 앤스로픽 등 빅테크 모델의 코딩 벤치마크를 비교한 결과를 제시했다.문샷AI에 따르면 프로그래밍에 중점을 둔 벤치마크 SWE-벤치 베리파이드에서 키미 K2는 65.8%의 정확도를 기록하며 앤스로픽의 ‘클로트 4 오푸스(72.5%)’ 다음으로 2위를 기록했다.또 다른 코딩 성능 평가 벤치마크인 라이브코드벤치(LiveCodeBench)에서는 53.7% 정확도로 앤스로픽(47.4%), 오픈AI(44.7%)를