새로운 시각에서 바라본 AI 도구: 이미지를 GIF로 변환하는 Pix2Gif

마이크로소프트의 연구부서는 최근에 ‘Pix2Gif’라는 혁신적인 AI 모델을 공개했습니다. 이 모델은 정적 이미지를 몇 초만에 애니메이션 GIF로 변환할 수 있는 능력을 갖춘데요. 이 혁신적인 도구는 다른 텍스트에서 비디오로 변환하는 AI 모델과 유사한 확산 모델을 활용하지만, Pix2Gif의 독특한 접근 방식이 이미지 변환을 더욱 돋보이게 합니다.

기존 방법은 오직 이미지 입력에만 의존하는 데 반해, Pix2Gif는 사용자가 이미지를 업로드한 후에 추가로 텍스트 지침을 제공할 수 있도록 합니다. 이미지와 텍스트 입력을 결합함으로써 이 AI 모델은 원본 이미지의 특징을 공간적으로 변형시켜 동적이고 매혹적인 GIF를 만들어냅니다.

이 AI 도구가 어떻게 작동하는지 더 잘 이해하기 위해, 연구원들은 사용자들에게 이미지 입력과 함께 텍스트 지시사항을 제공하여 모델을 이끌 것을 권장했습니다. 이 텍스트적 가이드는 원하는 동작이나 효과에 기반해 이미지의 시각적 요소를 향상시키는 데 도움이 되도록 합니다.

고정 이미지에서 GIF를 생성하는 과정은 현재 버전의 Pix2Gif를 사용하면 약 1분 정도 소요됩니다. 그러나 더 빠른 그래픽 처리 장치(GPU)를 사용하면 도구가 더 짧은 시간에 GIF를 생성할 수도 있습니다.

AI 모델을 훈련시키기 위해, 연구원들은 약 100,000개의 애니메이션 GIF와 관련 캡션을 포함한 방대한 데이터셋을 활용했습니다. 이러한 GIF에서 프레임을 추출하고, 훈련 과정 중에 캡션이 텍스트 지시로 활용되었습니다. 이 다양한 데이터 컬렉션을 활용해 Pix2Gif는 이미지를 시청자들을 사로잡는 활기찬 GIF로 변환할 수 있는 능력을 얻었습니다.

현재 이 AI 모델은 주로 연구 프로젝트로 남아 있지만, Copilot, Designer, 또는 Paint와 같은 기존의 마이크로소프트 제품에 통합될 가능성도 있습니다. 이 통합은 애니메이션 프로세스를 간소화하고 사용자들이 이미지에 AI 기반 개선 사항을 쉽게 적용할 수 있도록 할 것입니다.

훈련에 사용된 GIF의 출처는 연구자들이 공개하지 않았다는 것을 언급할 필요가 있습니다. 그러나 Pix2Gif가 완전한 마이크로소프트 제품으로 발전한다면, 훈련용 라이선스 데이터를 확보하는 것이 필수적일 것입니다.

호기심 많은 사람들과 열렌망가도 Pix2Gif의 능력을 테스트 환경에서 체험할 수 있습니다. 도구에 접속하여 이미지나 텍스트 지시를 제출하고, 신속한 GIF로 변환되는 과정을 목격해볼 수 있습니다. 마이크로소프트 또한 도구의 기능을 개선하고, 이미지 편집 애플리케이션 내에서의 기능을 확대하는 것을 계획 중입니다.

자세한 내용 보기:
– [마이크로소프트 연구](https://www.microsoft.com/en-us/research/)
– [Tom’s Guide](https://www.tomsguide.com/)

자주 묻는 질문 (FAQ)

The source of the article is from the blog hashtagsroom.com

Privacy policy
Contact