テキストによる指示で高精細な動画を生成する新しいツール「Sora」をOpenAIが発表した。作例のようなクオリティを本当に実現できるなら、これはAIモデルに命令して魔法のように映画を制作する時代の到来に向けた、長いカウントダウンの始まりかもしれない。
OpenAIの会話型AIが法科大学院に行かなくても司法試験に合格できることは、すでに知られている。そしていま、アカデミー賞が発表される直前のタイミングで、人工知能(AI)を用いたOpenAIの新たなツール「Sora」は、映画の学校に通わずとも映画制作を習得することを望んでいるのだ。
現時点では研究用のツールであるSoraは、一部の選ばれたクリエイターと、安全に関する脆弱性を評価するレッドチームの役割を担う多数のセキュリティ専門家に提供される予定である。時期は未定ながらもOpenAIはSoraをすべての“映画監督志望者”が利用できるようにする計画だが、先行してプレビューを実施することに決めたという。
グーグルのような大手企業からRunwayのようなスタートアップまで、さまざまな企業がすでにテキストを動画に変換するAIプロジェクトを公表している。しかし、OpenAIによると、Soraはそれらの競合モデルでは見たことがないような特筆すべきフォトリアリズム(写真のような写実性)と、ほかのモデルが生成する断片的な映像より長い最大1分の動画を生み出す能力において、一線を画しているという。
取材した研究者たちは、Soraがすべての映像をレンダリングするためにどれだけの時間が必要なのかを語ろうとしなかった。しかし、さらに踏み込んで尋ねたところ、「数日の休みをとる」というよりは、野球場に「ブリトーを食べに出かける」くらいの時間であると説明してくれた。実際に見せてもらった厳選された映像の事例が信じられるものだとすれば、それくらいの時間をかける価値はある。