“남편~ 애들 수학 문제 좀 풀어줘.”
몇년 뒤, 와이프가 아이들이 가져온 어려운 수학 문제를 저에게 넘기는 상상을 해봅니다. 사실 저는 수학을 그렇게 잘하지는 못했습니다. 하지만 이제 걱정 덜었습니다. 왜냐하면 Pixtral Large 25.02 모델을 활용하면 어려운 수학 문제도, 그림으로 된 수학 문제도 AI가 풀 수 있기 때문입니다. Amazon Bedrock에서 서버리스(Serverless) 로 사용할 수 있다고 해서 제가 직접 한 번 테스트를 해봤습니다.
“Pixtral Large 25.02 모델 공개!”
얼마 전 AWS가 발표한 흥미로운 소식이 하나 있습니다. Mistral AI가 개발한 차세대 멀티모달 AI 모델, ‘Pixtral Large 25.02’가 Amazon Bedrock에서 서버리스 방식으로 정식 출시되었습니다.
이 모델이 왜 중요한지, 왜 교육·기업·글로벌 서비스 현장에서 주목해야 할지를 하나씩 살펴보겠습니다. 하지만, 이 이야기를 단순 기술 소개로 끝내기엔 아쉽죠. 우리는 이 AI가 실제 ‘사람들의 삶을 어떻게 바꾸고 있는지’를 중심으로 이야기해보겠습니다.
멀티모달 AI, 수학 문제를 푼다고?
Pixtral Large 25.02는 단순한 텍스트 기반 AI가 아닙니다. 이미지 + 텍스트, 두 개의 입력을 동시에 이해할 수 있는 멀티모달(Multimodal)능력을 갖춘 모델이죠. 예를 들어, 학생이 수학 문제집의 한 페이지를 스마트폰으로 촬영한 이미지와 함께 “풀어줘”라고 명령하면, Pixtral은 그 이미지 안의 수식, 그래프, 문제 지문, 심지어 언어까지 분석합니다.
실제 예시를 볼까요?
이렇게 텍스트로 된 문제를 풀어보도록 요청해봤습니다. 2차 방정식이고, 이 정도는 수학 시간에 졸지 않았다면 풀수 있겠죠?
이렇게 주어진 7문제를 하나씩 풀어나가네요. 이차방정식이라서 확실히 쉽게 설명이 되네요. 일단 여기까지는 다른 AI들도 텍스트 기반으로 인지해서 풀 수 있으니까 뭐 이 정도는 할 수 있겠다는 생각이 드네요.
다음으로는 이미지가 있는 그래프 문제를 한번 풀어보도록 해봤습니다. 이 문제를 직접 줘봤습니다.
아까 문제보다 조금 더 어려워 보이는데, 사실 이것도 몇 가지 개념만 알면 쉽게 풀 수 있죠. AI는 이 그림을 이해했을까요? 사실 그런데 여기에 이미지보다 글도 많이 있기 때문에, 그냥 이미지를 읽지 않아도 풀 수 있을 것 같아 보이네요.
어떤 주어진 값들을 활용해서 풀어야 되는지를 이해하고 실제로 문제를 풀었습니다.
기존 텍스트 기반 모델들은 이미지나 수식을 ‘읽을 수 없기 때문에’ 입력을 문자로 전환하는 전처리 과정이 필요했습니다. Pixtral은 그 과정을 건너뜁니다.
이제는 조금 더 쉽게 학생들도 이미지를 바로 찍어서 올리면 문제를 풀 수 있게 되니까, 학생들의 학습 부담도 줄고 교사들도 피드백 시간이 줄어서 모두에게 윈-윈이 아닐까 하는 생각이 듭니다.
서버리스의 장점은?
Pixtral은 단순히 좋은 AI라는 것을 넘어서, 누구나 쉽게 접근할 수 있도록 배포 방식 자체를 혁신했습니다. 바로 Amazon Bedrock에서 서버리스(Serverless) 방식으로 제공되는 점이 핵심입니다.
서버리스란?
- 서버를 직접 설정하거나 용량을 계획하지 않아도 된다.
- 필요한 만큼만 사용하고, 그에 따라 비용을 지불한다.
- 트래픽이 급증하면 자동으로 처리되고, 안쓰면 비용이 안 든다.
Pixtral을 Amazon Bedrock에서 사용할 경우, 복잡한 AI 인프라를 구성할 필요도, 장비를 사거나 클라우드 인스턴스를 예약할 필요도 없습니다. AI 모델을 호출하면 끝. 기업의 비용 효율성 측면에서 엄청난 장점이죠. 특히 초기 예산이 부족한 스타트업, 실험 단계의 프로젝트일수록 이 방식은 금과 같습니다.
다국어 및 다중 코드 지원은 되지만..
Pixtral은 영어는 물론이고, 한국어·일본어·프랑스어·독일어·이탈리아어 등 수십 개 언어, 그리고 Python, Java, C++, JavaScript, Fortran 등 80개 이상의 프로그래밍 언어를 지원합니다.
이게 왜 중요할까요?
- 글로벌 개발 팀이 각자의 언어로 커뮤니케이션하고, 각기 다른 코드 스타일로 작업할 수 있음
- 하나의 코드 베이스를 세계 어디든 배포하고, 지역별 언어에 맞춘 서비스 대응 가능
- AI 기반 코드 분석·리뷰·문서화 자동화 가능
예를 들어, 한국의 개발자가 한국어로 코드를 설명하면서 질문하고, 미국 팀은 영어로 결과를 받아보는 협업이 가능합니다. 언어에서 자유로워진다는 것은 전 세계 시장을 상대로 AI 서비스를 확장할 수 있다는 뜻이죠.
그런데 아직 한국어는 완벽하진 않다..
수능 킬러 문제를 풀도록 요청해봤습니다.
p+q의 값을 구하라고 했는데, 관계만 구하고 끝이 나네요.
To solve this problem, we first need to determine the function g(x)g(x) and the constant kk such that f(x)+g(x)=kf(x)+g(x)=k for 0≤x≤60≤x≤6.
Given:
- f(x)f(x) is a piecewise function that is constant within specific intervals.
From the graph, we can see the values of f(x)f(x):
- For 0≤x≤30≤x≤3: f(x)=14f(x)=41
- For 3<x≤53<x≤5: f(x)=1f(x)=1
- For 5<x≤65<x≤6: f(x)=0f(x)=0
Step-by-Step Solution:
- Determine g(x)g(x):
- For f(x)+g(x)f(x)+g(x) to be constant, g(x)g(x) must be chosen such that it complements f(x)f(x) to a constant value kk.
- Let g(x)g(x) be the function such that g(x)=k−f(x)g(x)=k−f(x).
- Find g(x)g(x) for different intervals:
- For 0≤x≤30≤x≤3:g(x)=k−14g(x)=k−41
- For 3<x≤53<x≤5:g(x)=k−1g(x)=k−1
- For 5<x≤65<x≤6:g(x)=kg(x)=k
- Calculate the probability P(6k≤Y≤15k)P(6k≤Y≤15k):
- The region where 6k≤Y≤15k6k≤Y≤15k corresponds to the area under the line y=ky=k.
- The area of the shaded region in the graph is a trapezoid.
- Calculate the area of the trapezoid:
- The base lengths of the trapezoid are 3k3k and 5k5k.
- The height of the trapezoid is 33.
- The area AA of the trapezoid is given by:A=12×(3k+5k)×3=12×8k×3=12kA=21×(3k+5k)×3=21×8k×3=12k
- Determine the total area:
- The total area under the line y=ky=k from x=0x=0 to x=6x=6 is:Total Area=6kTotal Area=6k
- Calculate the probability:
- The probability P(6k≤Y≤15k)P(6k≤Y≤15k) is the ratio of the area of the trapezoid to the total area:P(6k≤Y≤15k)=12k6k=2P(6k≤Y≤15k)=6k12k=2
- Express the probability in terms of pp and qq:
- Given P(6k≤Y≤15k)=qpP(6k≤Y≤15k)=pq:qp=2 ⟹ q=2ppq=2⟹q=2p
Conclusion:
The relationship between pp and qq is:
q=2p
Cross-Region Inference로 빠른 응답!
Pixtral은 Amazon Bedrock에서 Cross-Region Inference를 지원합니다. 무슨 말이냐고요? 간단히 말해,
- 모델이 특정 AWS 리전에 배포되어 있어도
- 사용자는 자신과 가까운 리전에서 호출할 수 있음
- 지연 시간 ↓, 데이터 주권 ↑
예를 들어 한국에서 서비스하는 글로벌 앱이 EU GDPR을 만족시켜야 한다면, 유럽 사용자의 요청은 eu.model-id
경로로 호출되고, 유럽 내에서 데이터가 처리됩니다. 반대로 미국 사용자는 us.model-id
경로를 사용하게 되죠.
이렇게 하면
- 전 세계 어디에서든 빠른 응답
- 데이터가 해당 규제 범위(리전) 내에서만 움직임
- 기업은 규제를 지키면서도 확장성 있는 서비스를 운영할 수 있음
아직 한국 리전에서는 작동하지 않는 것으로 확인이 되는데요. 앞으로 한국에서도 서비스가 되고 나면, 수학 교육과 관련된 시장에서도 활발하게 사용되지 않을까 생각이 드네요.
꼭 테스트해보세요!
백문이 불여일견. 무조건 테스트해보세요.
Pixtral Large 25.02는 다음 리전에서 사용할 수 있습니다
- 미국: US East (N. Virginia, Ohio), US West (Oregon)
- 유럽: Frankfurt, Ireland, Paris, Stockholm
콘솔, CLI, SDK를 통해 쉽게 사용할 수 있으며, 모델 ID는 다음과 같습니다:
mistral.pixtral-large-2502-v1:0
So what?
Pixtral Large 25.02의 등장은 단순한 기술 진보를 넘어서, AI가 사람의 ‘눈’과 ‘언어’를 동시에 이해하는 시대가 시작되었음을 알리는 신호탄입니다. 그리고 그 무대를 AWS가 인프라 없이, 누구나 접근 가능하도록 만들어주었습니다.
인프라와 서비스가 준비되었으니, 이제 시장의 영역입니다. 중요한 건 무엇을 만들 것인가입니다. Serverless로 Bedrock에서 활용이 가능하고, 얼마든지 API를 호출해서 사용할 수 있기 때문에 다양한 서비스에 융합되어 사용될 수 있을 겁니다.
아이디어만 있다면 얼마든지 고급 기술들을 활용할 수 있는 시대가 되었네요. 놓치지 말고 꼭 한 번씩 활용해 보시면서 앞으로 좋은 활용이 되었으면 좋겠습니다.^^