자유게시판

업스테이지 솔라 프로4에 대한 추가 정보

Fff· 2026.07.04 23:33· 조회 0
https://artificialanalysis.ai/?intelligence=artificial-analysis-intelligence-index 그림의 저 끝에 있는 것이 전 버전인 프로3입니다. 프로4의 성능은 기자간담회에서 밝힌 아티피셜 벤치의 인텔리전스 지수 부분의 44.4 점이라고 하므로, 위의 그림(방금 뜬 AAII 스샷)에서 해당 성능은 Qwen3.7 MAX 바로 아래, 미니맥스 M3 바로 위입니다. 다만, 이 정도면 전 대성공인 것 같습니다. 프로4는 상업용 모델로 공개 모델이 아닙니다. 아무래도 아래 기사 보시면 아시겠지만 컨텍스트에 차이를 두고 이름을 달리 하여 '오픈2'라는 이름으로 공개 될 예정으로, 모델 성능 자체는 같은 것 같습니다. https://v.daum.net/v/prgaeSSr7S 앞선 글에서 다 다루지 못한 부분이 있는 점이 하나 정도가 아니라 두엇이 되어 적는 글인데요. 일단 모델 사이즈가 놀랍습니다. 약 200B 정도라고 하네요. 또한 댓글 중에 에이전트 기능에 대한 언급이 있었는데, 타우2-벤치가 98%가 나왔다고 합니다. 사실 아는 사람은 아는 것이지만 타우2가 주요 벤치인 것은 맞습니다. 다만, 에이전트 관련 몇 가지가 더 있기 때문에 다른 벤치도 같이봐야 할 것입니다. https://v.daum.net/v/prgaeSSr7S 상세한 내용은 기사 내용 참고 해 보시면 좋겠습니다. # 사용 해 본 사람들의 체험 성능 에이전트 관련해서는 긍정적 이야기가 많습니다. 그러나 일방적이진 않더군요. 뭐랄까 어떤 느낌이냐면... 벤치 점수 만큼의 지능을 보이긴 보인다는 것인데, 다양한 사용자 층이 있고 그들의 눈 높이가 높아져 있는 상태여서 일부 밟히는 부분들이 없잖아 있는 모양입니다. 어떤 사용자는 제미나이 3.5 플래시 정도의 체감 성능이라 말하기도 합니다. 최종 버전이 나오게 되면 보다 안정화 되어 나올 것을 기대해 보게 합니다. # 다음과의 시너지. 제가 생각하는 AI모델들의 단점은 이 검색에 있는데요. 심지어 검색의 왕자인 구글이 만든 제미나이조차 환각이 심합니다. 이걸 원천적으로 잡는 방법을 아무도 쓰지 않는데 업스테이지가 이 방법을 쓰려고 합니다. 즉 검색 엔진을 직접 사들여서 데이터 구조를 직접 이용하는 것입니다. 과거 외부에서 가장 잘 한다고 보였던 퍼플렉시티도... 한계는 있었는데 말입니다. 다음과의 시너지로 다음 검색 능력도 더욱 강화 하고, AI모델로 같이 동반 업그레이드 되는 시나리오... 괜찮아 보입니다.
댓글 0
첫 댓글을 남겨보세요.