近年さまざまな分野で注目を集めるAI(人工知能)技術の利用範囲は、芸術の分野にまで及んでいる。中でも音楽制作では、作詞・作曲・歌唱まで全てAIを用いて行うことができる。音楽制作を通じたAIと人間との関わり合いについて、3人の専門家に話を聞いた。
(取材・岡田康佑)
自動作曲で新感覚の1曲を
AIによる音楽制作は作詞にとどまらない。「Orpheus」はいくつかキーワードを与えるだけで作詞に加え、条件を設定すれば作曲、伴奏、歌唱まで全てAIが自動で行ってくれるシステムだ。インターネット上でユーザー登録をすれば誰でも作曲ができ、現在40万曲以上が作曲されている。
「私は音楽が好きで、自分でも作曲を試みましたが、なかなか納得のいく完成に至りませんでした。似た経験をした人もいるでしょう」。Orpheus開発者の嵯峨山茂樹名誉教授(東京大学)はそう話す。機械による音声認識・合成が専門だった嵯峨山名誉教授は「専門分野の確率モデルと日本語処理と音声処理に音楽理論を組み合わせれば、機械による作曲ができるのではと考え、学生と一緒にOrpheusの開発を始めました」。
Orpheusの作曲アルゴリズムでは、さぞかし大量の曲を学習に用いているのだろうと予想してしまうが、実際はそうではないという。「確かに、最近のAIでは、大量の学習データをディープニューラルネットワーク(DNN)と呼ばれる数理モデルに学習させる深層学習が盛んに使われますが、Orpheusの作曲は、大量の学習曲もDNNも使いません。代わりに、人間自身が長い歴史の中で学習して得た音楽理論を確率モデルに組み込んで作曲をします。ただし作曲とは対照的に、Orpheusの自動作詞では、大量の学習データを用いています」
Orpheusがモデル化する音楽理論とは、音楽大学の学生が勉強するような体系立った規則だという。「例えば、コード進行と旋律の関係とか、歌詞を読む抑揚に旋律の上下動を合わせるとか、いろいろな規範を与えます」。これらをより高い確率で達成するように曲が組まれる。これがOrpheusの主要な確率モデルのアルゴリズムだ(図2)。
なぜOrpheusはDNNを用いないのか。答えは「学習データにそっくりな曲の模倣生産ならDNNが有利でしょう。しかし、我々は作曲家の模倣を目指しました。作曲過程はブラックボックスではなく、多くの作曲家は理論をマスターし、それを守りつつ新しい曲を生んでいます。人間の知能は、学習データの模倣生産だけでなく、法則性を見いだしてそれを伝承し、新たな創造ができます。ここまでを可能にするのが、今後のAIの課題になるでしょう」
嵯峨山名誉教授は、AIによる作曲はあくまで「有用な道具」と位置付ける。「写真技術がやがて写真芸術を生んだように、AI作曲技術もやがて使いこなされて、いつか『自動作曲芸術』時代が来るだろうと信じています」
この記事は2020年8月4日号から転載したものです。本紙では他にもオリジナルの記事を掲載しています。
インタビュー:苦しみから新たな表現生み出す 作詞作曲家の小椋佳さんインタビュー
ニュース:課外活動施設は7/29から解禁 本郷地区キャンパス 駒場は6日から
ニュース:RNAが多様に分化 生命誕生の謎解く鍵に
ニュース:三井不動産と協定締結 新たな都市の在り方追求
企画:J-POPはどう変わったか 現代の社会と音楽を読み解く
企画:この音楽、共同制作者はAIです 音楽制作におけるAIと人間
企画:海外の流行吸収し根付く 音楽ビジネスから見るJ-POPと日本社会
取材こぼれ話
サークルペロリ:ビルボード研究会
キャンパスのひと:臼井幹博(法念)さん(文Ⅰ・2年)
※新聞の購読については、こちらのページへどうぞ。