메타(Meta)가 최신 “3D Gen” 시스템을 발표했습니다. 이 시스템은 텍스트 입력을 고화질 3D 이미지로 변환하는 혁신적인 파이프라인으로, 1분 이내에 완료됩니다. 이 혁신적인 발전으로 인공지능 기반 이미지 생성 분야에서 중대한 발전이 이루어졌습니다.
또한, 이 시스템은 생성된 이미지나 예술가가 스크립트 명령어를 이용하여 작성한 이미지에 새로운 질감과 스킨을 적용할 수 있는 능력을 가지고 있다고 합니다. 메타 Gen AI의 연구팀이 최근 진행한 연구에 따르면, 3D Gen은 고해상도 질감과 재료 맵 뿐만 아니라 물리기반 렌더링(PBR) 능력 및 형성적 재형성을 지원합니다.
팀은 Meta 3D Asset Gen 모델을 사용하여 초기 3D 모델을 생성하는 데 평균적으로 30초 정도의 추론 시간이 소요된다고 추정했습니다. 사용자는 Meta 3D TextureGen을 사용하여 스크립트 명령어를 통해 모델 질감을 신속하고 직관적으로 개선하거나 대체할 수 있습니다. 이 프로세스 전체는 추론 시간으로부터 추가적인 20초 내에 완료될 것으로 예상됩니다.
3D Gen의 기능 통합을 통해 디스플레이 공간, 체적 공간 및 자외선 공간에서 삼차원 표현이 동시에 이루어질 수 있습니다. 산업 기준 모델에 대해 비교하고, 지향성 텍스트 정확도, 시각적 품질, 질감 세부 사항 및 아티팩트와 같은 요소들을 평가하여, Meta의 3D Gen 모델은 우수한 성능을 보여주었습니다.
아직 공개 사용 준비가 안 된 개발 단계에 있지만, 이 연구에서 보여준 기술적 진보는 게임 및 영화 효과부터 가상 현실 응용분야까지 다양한 창의적 분야에서 엄청난 변혁 가능성을 가지고 있습니다. 사용자가 3D 콘텐츠를 생성뿐만 아니라 쉽게 편집할 수 있도록 하는 것은 이러한 활동에 참여하는 장벽을 크게 낮춰주며, 게임 산업 내에서 특히 혁신의 새로운 가능성을 열어줄 수 있습니다.