구글 딥마인드가 현지시간 8일, 텍스트 또는 이미지 프롬프트만으로 720p 해상도, 초당 24프레임의 실시간 3D 메타버스를 생성하는 인공지능 모델 ‘Genie 3’를 발표했다. 사용자의 시선에 따라 상호작용이 반영되고, 날씨 변화나 캐릭터 등장 같은 환경 변화도 즉시 구현된다.
리얼 메타버스가 멀지 않았다. (사진=구글딥마인드 홈페이지)
구글 딥마인드의 Genie 3는 사용자의 입력을 기반으로 실시간 상호작용 가능한 3D 환경을 구현하는 AI 모델이다. 사용자가 공간을 이동하거나 사물을 조작하면 그 상태가 유지되며, 날씨 변화나 캐릭터 등장 등 ‘메타버스 생태계’에 즉시 반영된다. 이전 버전에 비해 장면 일관성이 크게 개선됐으며, 몰입형 메타버스 경험을 구현하는 데 있어 중요한 진전을 이뤘다는 평가다.
런던 연구진이 개발한 Genie 3는 현재 일부 연구자와 창작자에게만 연구용 프리뷰로 제공되고 있다. 딥마인드는 이 모델을 범용 인공지능 연구와 AI 에이전트 학습 환경으로 활용할 계획이라고 밝혔다. 이를 통해 스키장, 화산 지대, 창고 등 다양한 시나리오의 메타버스를 즉시 생성해 복잡한 상황 대응 훈련도 가능하다.
경쟁사들의 대응 전략도 발 빠르다. NVIDIA는 텍스트·이미지·영상 프롬프트로 물리 시뮬레이션 환경을 생성하는 ‘Cosmos’와 산업용 3D 개발 플랫폼 ‘Omniverse’를 운영 중이다. 특히 LATTE3D 기술을 통해 초고속 3D 오브젝트 생성이 가능해 산업·시뮬레이션 시장에서 강점을 보인다. 메타는 차세대 VR 헤드셋과 스마트 안경에 Llama 3 기반 생성형 AI를 탑재해 사용자가 직접 아바타나 가상 환경을 만들 수 있도록 준비하고 있다. 메타버스 구현에 지속적인 투자를 이어가는 모습이다.
AI 마케팅 기업 에이치엘스토리의 최진명대표는 “Genie 3는 단순 영상 생성에서 실시간 상호작용 메타버스로 기술 수준을 끌어올린 사례”라며 “향후 메타버스, 게임, AI 학습 환경 등에서 산업 전반에 변화를 촉발할 가능성이 크다”고 평가했다. 이어 “NVIDIA, 메타, 오디세이, 임프로버블 등과의 기술 경쟁이 가속화되면 메타버스 진화 속도는 지금보다 훨씬 빨라질 것”이라고 덧붙였다.