반응형
Open AI에서 만든 ChatGPT 소라에서 보여주는 텍스트 비디오 영상입니다. 생동감 있는 영상미와 AI라고는 믿기 힘든 걸음걸이 목의 주름, 피부, 주변 환경의 조명까지 정말 미쳤다는 말 밖에 나오지 않는 영상입니다. Open AI가 만드는 ChatGPT는 사람들을 어디까지 놀라게 할지 앞으로의 행보가 궁금하기도 합니다.
ChatGPT가 나온지 불과 1년 정도가 지난 시점입니다. 1년 만에 Open AI는 텍스트로 만드는 비디오를 또 출시하게 되었는데 그 1분의 영상만으로도 사람들의 이목을 집중시키고 있습니다. 영상 감상해 보시기 바랍니다.
Open AI는 이렇게 말합니다. 우리는 사람들이 실제 상호 작용이 필요한 문제를 해결하는데 도움이 되는 모델을 목표로 AI가 움직이는 물리적 세계를 이해하고 시뮬레이션 하도록 가르치고 있다. 텍스트-비디오 모델인 Sora를 소개하며, Sora는 시각적 품 짐을 유지하고 사용자의 메시지를 준수하면서 최대 1분 길이의 비디오를 생성할 수 있다.
Sora는 레드 팀 구성원들이 중요한 영역의 피해나 위험을 평가하는 데 사용할 수 있게 되었다. 우리는 창의적인 전문가에게 가장 도움이 되는 모델을 발전시키는 방법에 대한 피드백을 얻기 위해 다수의 시각 예술가, 디자이너 및 영화 제작제에게 액세스 권한을 부여하고 있따. Open AI는 외부 사람들과 협력을 시작하고 피드백을 받기 위해 연구 진행 상황을 조기에 공유하고 대중에게 곧 출시될 AI 기능에 대한 이해를 제공하고 있다.
Sora는 언어에 대한 깊은 이해를 갖추고 있어 프롬포트를 정확하게 해석하고 생생한 감정을 표한하는 매력적인 캐릭터를 생성할 수 있다. Sora는 생성된 단일 비디오 내에서 캐릭터와 시각적 스타일을 정확하게 유지하는 여러 장면을 만들 수도 있다.
현재 출시전인 Sora는 약점이 있습니다. 복잡한 장면의 물리학을 정확하게 시뮬레이션하는데 아직 어려움을 겪고 있으며 원인과 결과의 특정 사례를 이해하지 못할 수도 있기 때문에 아직 어색한 장면의 동영상이 있을 수 있으며 왼쪽과 오른쪽을 혼합하는 등의 프롬포트의 공간적 세부 사항을 혼동할 수 있다고 합니다.
Open AI는 Sora를 사용할 수 있게 되기 까지 몇 가지 중요한 안전 조치를 취할 것이라고 전했습니다. 잘못된 정보, 증오 콘텐츠, 편견과 같은 분야의 도메인 전문가인 레드 팀과 협력하여 모델을 적극적으로 테스트할 것이라고 합니다.
Sora는 아직 출시일 정확히 정해지진 않았지만 텍스트 기반 비디오라는 획기적이고 혁신적인 모델을 들고 나왔습니다. 출시가 된다면 저도 써보고 싶을 정도로 퀄리티가 너무 훌륭합니다.
반응형