최근에 OpenAI가 소라라는 비디오 생성 서비스를 출시했습니다. 관련해서 CTO가 월스트리트저널에 나와서 인터뷰를 했는데, 어떤 이야기들이 나왔는지에 대해서 리뷰해보겠습니다. |
관련 글 : 2024 OpenAI Sora 소라 소개, 예상 출시일, 논란
관련 글 : 2024 챗 GPT 플러그인 플라토로 영어 쉽게 배우는 방법 소개
안녕하세요 lifelog입니다.
오늘은 OpenAI의 새로운 서비스 소라에 관한 뉴스를 가져와봤습니다.
저는 처음에 소라를 봤을 때 정말 어마어마한 서비스가 등장하였다고 생각하였습니다.
그래서 소라의 최근 소식들을 챙겨보고 있었는데, CTO가 월스트리트저널에 나와서 인터뷰를
하였더라고요.
인터뷰를 보는데 여러 논란을 일으킬 수 있는 파괴적인 기술이라는 생각이 더 강하게 드는 것 같습니다.
인터뷰에 어떤 내용들이 있었는지 정리해보겠습니다!
OpenAI 소라 소개
개요
소라(sora)는 OpenAI에서 2024년 발표된 획기적인 인공지능 모델로서 텍스트 설명만으로 사실적이고 창의적인 비디오를 제작할 수 있습니다.
멀티모달 인공지능 분야의 발전을 보여주는 사례이며, 텍스트 프롬프트를 기반으로 최대 1분 길이의 동영상 제작이 가능합니다.
높은 수준의 창의성과 사용자 지시 준수를 바탕으로 제작되지만, 서비스 이용 약관에 따라 폭력적인 콘텐츠 제작은 금지되어 있습니다.
결과 예시
서비스의 작동 예시는 아래 공개된 유튜브 영상을 통해서 확인하실 수 있습니다.
이거는 캡쳐 화면이 아니라 꼭 영상으로 보시는 걸 추천드립니다!
제가 개인적으로 제일 놀랐던 부분은 아래 영상이었습니다.
정말 리얼한 노인의 모습을 고해상도 영상으로 생성이 가능하다는 점이 정말 놀라웠습니다.
CTO 인터뷰 내용 정리
이 유튜브 영상은 OpenAI의 CTO인 Mira Morati와의 인터뷰입니다.
이 인터뷰에서 Morati는 OpenAI의 새로운 AI 모델인 Sora에 대해 이야기합니다.
주요 질문들을 정리해보았습니다.
Q. 소라는 어떤 원리로 작동이 되나요?
A. 소라는 diffusion model이라는 기술을 사용합니다. 즉, 무작위한 노이즈에서 시작하여 이미지를 점차적으로 세련하게 만들어 실제 이미지를 생성하는 방식입니다. 텍스트 프롬프트를 입력하면 소라는 타임라인을 정의하고 각 프레임에 디테일을 추가하여 장면을 만들어낼 수 있습니다. 이러한 방식 덕분에 소라는 매우 부드럽고 사실적인 동영상을 제작할 수 있습니다.
Q. 소라는 어떤 데이터들로 학습이 되었나요?
A. 저희는 공개된 영상들을 이용해서 학습을 합니다.
주) 여기서 MC가 유튜브나 페이스북 인스타그램에 올라온 데이터들을 사용하냐고 다시금 물어보는데, CTO는 확실하지 않다는 답변으로 일관합니다.
아마, 사용할 수 있는 모든 데이터들을 사용하지만, 이것을 공개한다면 그 데이터들을 확보할 수 있는 방안이 막힐까봐 일부러 애매하게 대답하는 것 같습니다.
Q. 언제 서비스가 개시 될 것 같나요?
A. 올해 말 정도에 서비스가 개시 될 것 같습니다.
주) MC가 추가질문으로 올해 11월에 미국 대선이 있는데, 대선 전후로 발표가 될 것인지를 물어봅니다.
CTO는 이 부분도 고려를 하고 있고, 아마 대선 때 자칫 잘못하면 오용이 될 가능성이 있기 때문에 일부러 올해 말이라고 말을 하는 것 같습니다.
Q. 영화업계에는 어떤 영향이 있을 것 같나요?
A. 우리는 소라가 창의성을 더 확장시켜주는 툴로 사용되기를 바랍니다.
그리고 영화업계에 있는 사람들이 어떤 방식으로 이 툴들이 발전해나가는지를 알려주었으면 합니다.
주) 영화업계 사람들이 들으면 큰일 날 소리를 하고 있네요. 누구 때문에 시위를 하고 있는지도 모르고.
Q. 생성된 영상과 그렇지 않은 영상을 어떻게 구분할 수 있나요?
A. 현재는 다양한 방법으로 구분을 지으려고 노력하고 있습니다.
다만, 아직 방법론이 구체화되어있지 않기 때문에 소라를 대중에게 공개를 하지 않고 있습니다. 이에 대한 대비책은 충분히 마련되어야 할 것 같습니다.
주) 제가 생각해도 딥페이크 이슈는 기술이 발전되면 될수록 더 심각해질 수 밖에 없을 것 같습니다.
이에 대한 대비책이 단순히 워터마크를 붙인다거나 하는 수준이 아니라 더 확실하게 나왔으면 합니다.
마무리
오늘은 OpenAI의 CTO의 월스트리트저널 인터뷰에 대해서 요약 정리해보았습니다.
실제 인터뷰에서는 다양한 데모를 보여주면서 현재 소라의 기술 수준과 한계점들에 대해서도 많이 보여줬습니다.
관심 있으신 분들은 꼭 전체 인터뷰 영상을 확인해보셨으면 좋을 것 같습니다.
정말 이제는 비디오 생성 기술이 특이점에 다다른 것 같습니다. 앞으로 얼마나 빠르게 기술들이 발전할지는 상상도 안 가는데요. 앞으로도 꾸준히 관련 이슈들이 생기면 글을 작성해보도록 하겠습니다.
긴 글 읽어주셔서 감사합니다!