본문 바로가기
반응형

IT/AI23

알리바바 EMO AI 모델로 말하고 노래하는 인물 영상 만드는 법 알리바바 그룹의 지능형 컴퓨팅 연구소(Institute for Intelligent Computing)는 최근 EMO라는 혁신적인 AI 영상 생성 모델을 선보였습니다. 이 기술은 단순히 이미지를 변환하는 것을 넘어서, 하나의 레퍼런스 이미지와 오디오 파일을 결합하여 말하고, 노래하는 인물의 영상을 창출할 수 있는 능력을 가지고 있습니다. AI로 생성한 이미지와 오디오를 넣은 것만으로도 다음과 같이 영상이 만들어졌습니다. HTML 삽입 미리보기할 수 없는 소스 EMO의 작동 원리 EMO 모델은 사용자가 제공한 사진과 오디오 클립을 기반으로 인물이 말하거나 노래하는 영상을 생성합니다. 이 과정에서 가장 인상적인 것은 아래 사진과 같이 생성된 인물의 표정이 매우 풍부하며, 말하는 내용과 입 모양이 자연스러운 .. IT/AI 2024. 2. 28.
[AI] OpenAI Sora Text to Video 생성 모델, 게임 랜더링 기능 포함 (feat. 마인크래프트) OpenAI가 최근 발표한 동영상 생성 도구, Sora는 단순한 영상 제작을 넘어선 기능을 제공합니다. 이번에 공개된 Sora는 영화 품질의 동영상뿐만 아니라, 비디오 게임에도 활용될 수 있는 기능을 탑재하고 있습니다. 마인크래프트와 같은 게임의 영상을 구현하는 데 사용 가능하다는 점에서 큰 주목을 받고 있습니다. 이제 Sora의 주요 기능과 사용 사례에 대해 살펴보겠습니다. Sora의 영상 및 게임 시각화 기능 소개 Sora는 최대 1080p의 품질로 최대 1분 길이의 동영상을 생성할 수 있습니다. 동영상 편집, 배경 교체, 동영상의 시간을 조정하는 루핑 효과 생성 등 다양한 영상 처리 작업을 지원합니다. 사용자는 이를 통해 복잡한 동영상 작업을 손쉽게 처리할 수 있습니다. [AI] Openai Sor.. IT/AI 2024. 2. 20.
[AI] OpenAI Sora 사용법과 출시일 및 가격 정보, 텍스트로 영상 만들기 OpenAI가 선보인 SORA는 텍스트 입력을 바탕으로 최대 1분 길이의 영상을 제작할 수 있는 AI 서비스입니다. 사용자가 제공한 텍스트 설명을 기반으로 실제와 유사한 동영상을 만들어내는 이 기술을 통해, 당신도 바로 창의적인 영상 제작자가 될 수 있습니다. SORA를 이용해, 상상력을 자극하는 다양한 시나리오를 영상으로 구현해보세요. Sora와 유사한 AI 영상 플랫폼 기존 AI 기반 영상 생성 및 편집 플랫폼은 다음과 같은 것들이 있습니다. Runway: 비디오 편집 및 이미지 생성을 위한 AI 플랫폼. Runway Descript: 오디오 및 비디오의 텍스트 기반 편집을 지원하는 AI 플랫폼. Descript Synthesia: 텍스트 입력으로 비디오를 생성할 수 있는 서비스, 가상 아바타 사용... IT/AI 2024. 2. 16.
[AI] 스테이블 디퓨전 메모리 부족 문제 해결 방법 인공지능 기반 이미지 생성 도구인 Stable Diffusion을 사용하면서 마주치는 일반적인 문제, 'CUDA Out of Memory' 오류에 대해 이야기하고자 합니다. OutOfMemoryError 오류가 발생하는 원인과 해결 방법을 통해 스테이블 디퓨전을 원할하게 사용하시길 바랍니다.오류 원인 Stable Diffusion은 강력한 AI 이미지 생성 도구이지만, 메모리 사용량이 높아 메모리 부족 현상이 일어날 수 있습니다. 특히, 고해상도 이미지나 여러 이미지를 동시에 생성할 경우, GPU의 VRAM이 충분하지 않아 'CUDA Out of Memory' 오류가 발생합니다.해결방법1. 하드웨어 업그레이드가장 확실한 해결 방법은 VRAM 용량이 더 큰 GPU로 업그레이드하는 것입니다. 이는 비용이 많.. IT/AI 2023. 12. 19.
[AI] 스테이블 디퓨전 로컬 설치: 초보자를 위한 간편 가이드 스테이블 디퓨전(Stable Diffusion)은 DALL-E 3 혹은 미드저니(Midjourney)와 같은 최신 AI 기술을 활용한 이미지 생성 모델로, 사용자의 설명에 따라 고품질의 이미지를 생성할 수 있습니다. 스테이블 디퓨전 외에 ChatGPT, 빙 이미지 크리에이터 등 AI 이미지 생성이 가능한 다른 AI 모델들이 많지만 스테이블 디퓨전이 사용자 만족도가 가장 높은 것으로 나왔습니다. 이 모델은 대규모 데이터셋을 학습하여 다양한 스타일과 주제의 이미지를 만들어내는 능력을 가지고 있습니다. 사용자가 간단한 텍스트 설명을 제공하면, 스테이블 디퓨전은 이를 기반으로 상세하고 창의적인 이미지를 생성합니다. 라인에 소개된 스테이블 디퓨전 설치 방법은 정말 많지만 이 글에선 정말 놀라울 정도로 간단한 방법.. IT/AI 2023. 12. 18.
반응형