구글이 Gemma 4를 출시했습니다. 이는 새로운 오픈 소스 모델 제품군입니다.

  • Gemma 4는 Gemini 3와 동일한 기술을 기반으로 하지만, 완전한 상업용 Apache 2.0 라이선스 하에 배포되는 오픈 소스 AI 모델 제품군입니다.
  • 이 제품군은 모바일 및 엣지 디바이스부터 고성능 워크스테이션 및 GPU에 이르기까지 다양한 환경에서 작동하도록 설계된 4가지 변형(E2B, E4B, 26B MoE 및 31B Dense)을 포함합니다.
  • 이 플랫폼은 멀티모달리티(소형 모델에서는 텍스트, 이미지, 비디오 및 오디오)와 최대 256K 토큰의 컨텍스트 창을 제공하며 에이전트, JSON 및 함수 호출을 기본적으로 지원합니다.
  • 이러한 효율성 덕분에 대형 모델을 단일 80GB NVIDIA H100 GPU에서 실행할 수 있으며 온프레미스, 클라우드 및 국가 클라우드 배포가 가능하므로 규제를 받는 유럽 기업에 매우 중요합니다.

젬마 4 인공지능 모델

구글은 이번 출시를 통해 개방형 인공지능 전략에 있어 중대한 변화를 가져왔습니다. Gemma 4는 새로운 오픈 웨이트 모델 제품군입니다. 이 제품군은 고성능, 하드웨어 효율성, 그리고 상업적 용도를 위한 진정한 오픈 라이선스를 결합하는 것을 목표로 합니다. Gemini 3와 동일한 기술 기반 위에 구축된 이 제품군은 폐쇄형 클라우드 서비스에 전적으로 의존하지 않고 고급 AI를 배포하려는 대기업과 개발자 모두를 대상으로 합니다.

단순한 실험 모델이 아닌, 젬마 4는 다음과 같은 특징을 지니고 등장했습니다. 네 가지 변형에 대한 완전한 제안 이러한 솔루션은 모바일 기기, 엣지 디바이스, 개인용 컴퓨터, 고성능 GPU가 탑재된 서버에서 실행될 수 있습니다. 구글의 전략은 매개변수별로 더 높은 수준의 인텔리전스를 제공하고, 인프라 비용을 절감하는 동시에 커뮤니티와 기업이 모델을 각자의 필요에 맞게 유연하게 적용할 수 있도록 하는 데 중점을 두고 있습니다.

모바일에서 데이터 센터에 이르기까지 모든 것을 아우르도록 설계된 4가지 모델로 구성된 제품군입니다.

젬마 4 모델 변형

젬마 4 패밀리는 다음과 같이 구성되어 있습니다. 주요 크기는 E2B, E4B, 26B MoE 및 31B Dense의 네 가지입니다.처음 두 모델은 엣지 컴퓨팅 환경에 초점을 맞춘 반면, 26.000억 및 31.000억 파라미터 모델은 고성능 워크스테이션을 대상으로 합니다. 고성능 노트북 및 서버 환경.

변형 효과적인 2B(E2B) 및 효과적인 4B(E4B) 이 제품들은 안드로이드 폰, IoT 보드 등과 같이 리소스가 제한된 장치를 위해 특별히 설계되었습니다. 임베디드 시스템 라즈베리 파이나 퀄컴, 미디어텍 같은 제조업체의 하드웨어 등이 그 예입니다. 이들의 목표는 메모리, 배터리, 지연 시간 소모를 최소화하면서 우수한 추론 능력과 멀티모달 기능을 유지하는 것입니다.

위는 모델입니다. 26B는 전문가 혼합(MoE) 아키텍처를 사용합니다. 이 시스템은 응답 시간을 최소화하도록 최적화되어 있습니다. 추론 과정에서 약 3,8억 개의 파라미터만 활성화하므로 개발자 하드웨어 또는 소비자용 GPU에서 고속 토큰 생성이 가능합니다. 맞춤형 AI 칩로컬 프로그래밍 도우미 및 개발 도구에 이상적입니다.

맨 위쪽에는 다음과 같은 것이 있습니다. 젬마 4 31B 덴스밀도가 높고 작업 지향적인 이 변형 모델은 속도보다 품질과 일관성을 우선시합니다. 이 모델은 이미 Arena AI 텍스트 리더보드와 같은 오픈 소스 모델 순위에서 상위권을 차지하며, 매개변수 규모가 20배나 더 큰 시스템들과 경쟁하고 있습니다.

경량 모델과 중량 모델의 ​​조합을 통해 Gemma 4는 다양한 지역을 커버할 수 있습니다. 일상적인 모바일 사용부터 중요한 비즈니스 워크플로까지시스템 설계자에게 각 프로젝트에 따라 추론 속도 또는 분석 깊이 중 하나를 선택할 수 있는 재량권을 부여합니다.

확장된 멀티모달리티 및 긴 컨텍스트 창

Gemma 4의 다중 모드 기능

새 가족의 강점 중 하나는 협력하는 능력입니다. 다양한 콘텐츠 유형을 기본적으로 지원합니다.모든 Gemma 4 모델은 텍스트와 이미지를 처리할 수 있으며, 다양한 해상도와 화면 비율을 지원하므로 스캔 문서 분석, 인터페이스의 시각적 이해 또는 설명 생성과 같은 사용 사례를 용이하게 합니다.

게다가 버전은 E2B와 E4B는 멀티모달리티를 비디오와 오디오로 확장합니다.이를 통해 사용자는 지연 시간이 짧은 음성 인식 작업, 비디오 클립 분석 또는 증강 현실 애플리케이션을 기기에서 직접 처리할 수 있습니다. 모바일 또는 IoT 환경에서 클라우드에 지속적으로 의존하지 않고 영상 및 오디오를 실행할 수 있는 이러한 기능은 연결 문제를 줄이고 개인 정보 보호를 강화합니다.

대량의 정보 처리에 있어서 Gemma 4 제품군은 컨텍스트 윈도우 기능을 도입했습니다. 가장 큰 모델에서는 최대 256.000개의 토큰을 지원합니다.엣지 디바이스 버전은 128개의 컨텍스트를 제공하며, 26B 및 31B 버전은 최대 256개의 토큰을 지원합니다. 이를 통해 전체 코드 저장소, 대규모 문서 데이터베이스 또는 매우 긴 대화 기록을 단일 쿼리로 로드하는 등의 작업이 가능합니다.

이처럼 폭넓은 맥락은 특히 다음과 같은 경우에 유용합니다. 오프라인 코드 생성, 자동화된 기술 지원 또는 법률 문서 분석이러한 영역은 엄격한 규제를 받는 유럽 기업, 특히 정보를 자체 시스템 내에 보관해야 하는 기업에 특히 중요합니다.

구글은 멀티모달리티 및 확장된 컨텍스트와 더불어 Gemma 4의 지원 기능을 강조합니다. 140 개 이상의 언어이처럼 광범위한 언어 지원 덕분에 글로벌 기업, 유럽 공공 기관 또는 여러 가지 모델에 의존하지 않고 다국어 제품을 출시하려는 스타트업에게 매력적인 선택지가 됩니다.

자율 에이전트, JSON 및 함수 호출: Gemma 4 에이전트 기반 흐름 지향

Gemma 4와 함께하는 자영업 에이전트

Gemma 4는 기존의 텍스트 생성 방식을 뛰어넘습니다. 전체 제품군은 다음과 같은 명확한 목표를 가지고 설계되었습니다. 에이전트 기반 워크플로이는 비즈니스 및 소프트웨어 개발 환경에서 점점 더 중요해지는 추세입니다.

해당 모델에는 기본적으로 다음이 포함됩니다. 함수 호출에 대한 네이티브 지원이를 통해 시스템은 외부 API 또는 특정 도구를 제어된 방식으로 호출할 수 있습니다. 또한 구조화된 JSON 출력을 제공하여 다른 서비스 또는 마이크로서비스에서 사용할 형식화된 응답이 필요한 애플리케이션과의 통합을 용이하게 합니다.

또 다른 핵심적인 측면은 호환성입니다. 네이티브 시스템 명령어이러한 기능 덕분에 시스템의 역할을 정확하게 정의하고 모델의 동작을 규정하는 명확한 규칙을 설정할 수 있습니다. 이 기능은 고객 서비스 관리, 내부 프로세스 자동화 또는 회사 내 다양한 ​​도구의 통합을 담당하는 자율 에이전트를 구축할 때 특히 유용합니다.

구글 클라우드 임원진에 따르면 기업용 AI에는 다음과 같은 기능을 갖춘 모델이 필요합니다. 데이터를 안전한 환경 내에 유지하면서 복잡한 논리를 실행합니다.이러한 점에서 Gemma 4의 에이전트 기반 접근 방식은 온프레미스 및 제어된 클라우드 배포 옵션과 결합되어 위험을 줄이고 데이터 처리 위치와 방식에 대한 제어력을 강화합니다.

이 회사는 이러한 모델에 다음과 같은 제품을 함께 제공합니다. 에이전트 개발 키트(ADK)이 프레임워크는 에이전트 설계를 가속화하도록 설계된 모듈형 프레임워크이며, NVIDIA RTX PRO 6000 GPU(Blackwell)의 Cloud Run에서 서버리스 방식으로 고강도 워크로드를 실행할 수 있도록 지원하여 복잡한 에이전트를 실험하는 데 필요한 초기 투자 비용을 낮춥니다.

아파치 라이선스 2.0과 디지털 주권: 유럽과 스페인에 미치는 영향

이전 세대 젬마와 비교했을 때 가장 중요한 변화 중 하나는 라이선스입니다. 처음으로, Gemma 4는 완전한 개방형 라이선스인 Apache 2.0에 따라 배포됩니다. 이는 구글의 추가적인 특정 제한 없이 상업적 사용을 허용합니다.

이전 버전에서는 이용 약관에 기업 법무팀, 특히 대기업과 공공기관의 법무팀에 우려를 불러일으키는 조건들이 포함되어 있었습니다. 아파치 2.0에서 구글은 젬마 4를 다음과 같은 라이선스 범주에 포함시켰습니다... 라마와 같은 다른 개방형 참조 모델개별 협상 없이 생산 프로젝트에 쉽게 도입할 수 있도록 지원합니다.

이 결정은 명확한 유럽적 해석을 가지고 있습니다. 개방형 모델, 140개 이상의 언어와의 호환성, 그리고 주권적 배포 옵션을 제공합니다. 이는 데이터 상주 규정 및 유럽 연합의 AI 규정 관련 논의와 일맥상통합니다. 스페인 및 유럽 기업들은 Gemma 4를 자사 솔루션에 통합하여 데이터 저장 및 처리 위치를 더욱 효과적으로 관리할 수 있습니다.

구글은 Gemma 4가 다음 지역에서 사용 가능할 것으로 예상합니다. 주권 클라우드 환경 및 에어갭 구성온프레미스 설치 환경에서도 마찬가지입니다. 은행, 의료, 에너지 또는 공공 행정과 같은 규제 대상 분야의 경우, 이를 통해 민감한 정보를 유럽 지역 외부의 공유 인프라로 전송할 필요 없이 고급 AI를 활용할 수 있게 됩니다.

라이선스의 유연성은 또한 창작 활동을 장려합니다. 지역 및 특수 변형과거에도 특정 언어와 맥락에 맞춰 개발된 모델들(예: 불가리아의 BgGPT 또는 북미 대학의 의료 애플리케이션)이 이미 존재했으며, 구글은 Gemma 4가 수만 개의 커뮤니티 변형이 존재하는 "젬마버스"라고 불리는 이러한 생태계를 더욱 강화할 것으로 기대하고 있습니다.

Google 클라우드 통합, 로컬 실행 및 필요한 하드웨어

모델을 개방하는 것 외에도 구글은 다음과 같은 분야에 초점을 맞춘 지원 인프라를 구축했습니다. Vertex AI와 Google Kubernetes Engine(GKE)이러한 서비스를 통해 조직은 맞춤형 리소스를 프로비저닝하고, 추론 워크로드를 확장하며, 보안 및 규정 준수 요구 사항에 맞춰 배포를 조정할 수 있습니다.

Vertex AI에서 Gemma 4는 모델 카탈로그의 일부로 통합되어 기술 팀이 사용할 수 있습니다. 테스트, 미세 조정 및 배포 컴퓨팅 리소스에 대한 제어권을 유지하면서 맞춤형 변형을 제공합니다. GKE와의 조합을 통해 동적 확장이 가능하며, 추론 서비스 복제본 수를 실제 수요에 맞춰 조정할 수 있습니다.

중소기업에게 중요한 사실은 다음과 같습니다. 26B 및 31B 모델의 bfloat16 가중치는 80GB NVIDIA H100 GPU 하나에 저장할 수 있습니다.이는 병렬로 여러 개의 GPU를 필요로 하는 대안과 비교했을 때, 고성능 모델에 접근하는 데 필요한 최소 투자 비용을 크게 줄여줍니다.

동시에 Gemma 4는 다음 환경에서 실행되도록 최적화되어 있습니다. 소비자용 GPU부터 모바일 솔루션까지 다양한 하드웨어5G M2M 연결E2B 및 E4B 모델은 Per-Layer Embeddings(PLE)와 같은 기술을 활용하여 매개변수별 효율성을 극대화함으로써 휴대폰, 라즈베리 파이 또는 엣지 디바이스에서 매우 낮은 지연 시간으로 실행될 수 있습니다.

호환성은 다음으로도 확장됩니다. Hugging Face, Ollama, vLLM, LM Studio 또는 llama.cpp와 같은 생태계AI Studio 및 AICore(안드로이드 프로토타이핑용)와 같은 Google 개발 플랫폼도 지원합니다. 따라서 독립 개발자와 기업 팀 모두 처음부터 시작할 필요 없이 Gemma 4를 기존 워크플로에 쉽게 통합할 수 있습니다.

비즈니스, 교육 및 공공 부문에서의 잠재적 활용 분야

Gemma 4의 기능은 배포를 가능하게 합니다. 다양한 실제 응용 분야 이는 기존의 챗봇을 뛰어넘는 개념입니다. 비즈니스 환경에서 이러한 모델은 기업 문서 관련 질문에 답변하거나, 요약 보고서를 생성하거나, 여러 언어로 반복적인 작업을 자동화하는 사내 가상 비서의 기반이 될 수 있습니다.

프로그래밍 분야에서, 조합 넓은 컨텍스트 윈도우, 코드 생성 및 낮은 지연 시간 이러한 특징 덕분에 Gemma 4는 로컬 개발 지원, 자동 코드 검토 또는 전체 저장소를 한 번에 분석하는 도구에 적합하며, 코드를 회사 자체 인프라에 유지할 수 있습니다.

교육 분야에서 Gemma 4는 다음과 같은 용도로 사용될 수 있습니다. 콘텐츠에 맞춰 개인화된 튜터를 만드세요 학생 수준에서, 이들은 복잡한 텍스트를 요약하거나 이미지와 그래픽을 설명하는데, 이는 특히 접근성 관련 특별한 요구 사항이 있는 학생들에게 유용합니다.

스페인과 유럽의 공공 부문 및 행정 기관의 경우, 이러한 모델을 도입할 가능성은 다음과 같습니다. 통제된 환경에서 데이터가 유럽 영토 내에 저장됩니다.이는 시민 서비스, 파일 분석 또는 절차 자동화 분야에서 다양한 가능성을 열어주지만, 규정에서 요구하는 투명성과 인적 감독이 보장되어야 합니다.

제조, 정밀 농업 또는 인프라 관리와 같은 분야에서 엣지 컴퓨팅 장치에서의 로컬 실행은 다음과 같은 이점을 제공합니다. 클라우드에 상시 연결하지 않고도 실시간으로 데이터를 분석하세요.이는 전송 비용을 절감하고 응답 시간을 개선하며 민감한 데이터가 외부 네트워크에 노출되는 위험을 줄입니다.

로컬 AI, 비용 및 오픈 소스 모델과 독점 모델 간의 격차

젬마 4의 출시는 업계의 분명한 추세를 반영합니다. 이제 우선순위는 누가 가장 큰 모델을 보유하고 있느냐가 아니라, 용량, 비용 및 배포 용이성 사이에서 최상의 균형을 달성하는 사람구글은 이 새로운 세대의 핵심 지표로 "매개변수 지능"이라는 개념을 강조합니다.

대규모 클라우드 서비스에 항상 의존하지 않고 고급 모델을 로컬에서 실행할 수 있는 능력은 다음과 같은 점을 시사합니다. 제품 및 서비스 설계 방식의 변화일상적인 작업, 예를 들어 텍스트 요약, 알림 생성, 간단한 이미지 처리 등의 경우, 기기 자체에서 해결할 수 있다면 데이터를 원격의 대규모 모델로 전송할 필요가 거의 없습니다.

그렇긴 하지만, Gemma 4는 구글의 독자적인 모델을 대체하기 위한 것이 아닙니다. 그들을 칭찬하세요이 회사는 Gemini를 가장 진보된 폐쇄형 레이어로 유지하며, 최대 용량이 가장 중요한 사용 사례에만 사용합니다. Gemma 4는 기술적 우위 면에서는 한 단계 아래에 있지만, 개방성, 유연성 및 비용 관리 측면에서 우위를 점합니다.

IT 부서에게 있어 이는 점점 더 분명한 선택지가 되고 있습니다. 폐쇄형 모델은 개방형 모델에 비해 사용 편의성은 높지만 제어력은 떨어집니다. 이는 중기적으로 완전한 주권 확보와 경제적 최적화를 위해 인프라에 대한 보다 적극적인 관리가 필요하다.

이러한 맥락에서 스페인 및 유럽 기업의 인공지능 분야 경쟁력은 상당 부분 그들의 능력에 달려 있을 수 있습니다. Gemma 4와 같은 개방형 모델을 핵심 프로세스에 통합합니다.필요에 따라 자체 서비스와 결합하고, 데이터 보호 규정 및 향후 유럽 인공지능 관련 규정을 항상 준수합니다.

Gemma 4를 통해 Google은 접근성이 뛰어난 하드웨어에서 실행되고, 다양한 규제 프레임워크에 적응하며, 차세대 로컬 에이전트 및 애플리케이션의 기반이 될 수 있는 효율적인 개방형 모델에 대한 확고한 의지를 보여줍니다. 이러한 개방성, 성능 및 제어 기능의 조합을 활용하는 방법을 아는 사람들은 유럽의 요구 사항에 부합하는 지속 가능한 AI 솔루션을 구축하는 데 유리할 것입니다.

iot-2의 오타 업데이트 중요성
관련 기사 :
IoT의 오픈 소스: 차이를 만드는 플랫폼, 데이터 및 엣지 AI