ChatGPTなど、学習したデータを基に文章や画像などのコンテンツを生み出すことができる生成AIの普及により、AIに関する知識がない人でも容易にAIツールにアクセスできるようになった。今後、AIはさらに社会に浸透し、AIツールを使いこなす能力は欠かせないものとなっていくと考えられる。
東大も、AI利用に関する学生向けの方針を2023年5月26日付で発表し「生成系AIツールの長所短所を理解した上で、適切な活用を心掛けてください」と呼びかけている。(※)
そのような中で、学生はAIをどのように活用することができるか。活用や安全な利用のためにどのような知識が必要か。AIモデルや機械学習について学ぶサークル「東大AI研究会」の立ち上げに携わり、代表を務める近藤汰一さん(工・3年)に話を聞いた。(取材・石橋咲)
近藤汰一(こんどう・たいち)さん(工・3年)/東大AI研究会代表
東大AI研究会ウェブサイトはこちら
※AIに関する東大の動きについてはこちら
【AI×東大〜AIに東大はどう向き合うか〜】 東大新聞オンライン掲載記事まとめ(随時更新)
AIの知識はどの研究分野でも必要
━━どのようにAIを活用していますか
東大AI研究会では、生成AIツールを「息を吸うように使い倒す」ことを推奨しています。分からないことがあったときやアイデアを出したいとき、コードを書きたいときなどはまず壁打ちという形でChatGPTに聞いてみて、良いアウトプットが出ればそのまま使ったり、自分なりにカスタマイズして使ったりしています。
僕自身はインターネット技術や通信の領域に興味があるのですが、この分野は用語や歴史が複雑で、本を読んでいるだけでは分からないこともあるので、徹底的に生成AIに質問しています。例えば「この部分にはこういう技術が使われている」という記述に対して「物理的にどういう方法で実現できているのか?」という質問などです。そうすることで知識を付け、分野の解像度を上げていこうとしています。
最近はPerplexityやSearchGPTなどWebブラウザから出典を明記してくれるツールも出てきているので、回答の正確性はそういったものを使ってチェックすることが多いです。
━━一般の学生はどのような形でAIを活用できますか
まず、AIを使うことは全ての研究分野を究める上で必要であると考えています。その上で、学生には三つの層があると考えています。一つ目は現時点でAIになじみがない・使う機会が少ない層、二つ目は研究でビッグデータを扱う層、三つ目がディープラーニングを利用して新しいAIモデルを作る層です。
一つ目の層のレベルでは、生成AIツールを使いこなせることがデフォルトになると良いと思います。どのような学生生活、研究分野であろうと、インターネットでの検索と同様に、生成AIから回答を得る力は必要だと思っています。
二つ目の層については、特に社会科学や自然科学などの分野でAIを活用できると思います。AIはビッグデータから潜在的な特徴を発見する能力に長けているので、興味深い示唆を得られます。
最後に、三つ目の層が最も高度だと考えています。二つ目の層はAIモデルを使う段階にいますが、この層はそのモデル自体を作る段階にいます。2024年のノーベル化学賞を受賞したチームが開発したAIモデル「AlphaFold2」は、それまでの技術では困難だった、高い精度でのタンパク質の立体構造の予測ができます。
このように、AIを活用して社会的価値を生み出す新しいモデルを作ろうとすることは、研究者としてより高みを目指すことでもあります。
━━普段AIツールを全く使わない人もいると思います
まずはためらわずに使ってみるということが重要だと思います。登場したばかりのAIツールの第1世代を使ってみたら使いづらく、その後使わなくなってしまったという経験をした人もいるのではないでしょうか。生成AIのアップデートは非常に激しく、1カ月に1回程度の頻度で新しいモデルが公開されるので、初期のモデルの使いづらさは克服されている場合が多いです。出るたびにとりあえず使って試してみてほしいです。AIに限らず新しいモデルを追う態度が重要だと思っています。僕自身は、激しいアップデートについていくために、X上の情報を見るようにしています。
既存モデルの仕組みを学ぶことに意味
━━AIや機械学習の仕組みを学ぶことにはどのような意義がありますか
AIや機械学習(コンピューターが膨大な量のデータの背景にあるルールやパターンを自動で発見する技術)の知識は一般教養になりつつあるので、どんな専攻の人であっても理解している方が良いと思っています。
その上で、すでに開発されているさまざまなAIモデルのアルゴリズムを学ぶことは、新しいAIモデルを作るヒントになるという点でも意味があると考えています。東大AI研究会では、モデルの開発者の発想を考えてみることを「追思考」と名付けて大事にしています。
例えば、ChatGPTを対象とした「追思考」では、GPTのTが指す、Transformerと呼ばれる自然言語処理モデルの一種に着目します。Transformerにおいては、Attention機構と呼ばれる、入力されたデータのどこに注目すべきか特定する仕組みが重要な役割を持ちます。Transformerが開発される以前は、Attention機構の重要性は認識されておらず、補助的な役割で使われていました。しかし、このAttention機構をメインの機構として活用することでTransformerができ、GPTができました。なぜ開発者はAttention機構を活用しようと思いついたのか。それを自分なりに考えることが、新しいモデルを作ることにつながると考えています。
このような思考法は、あらゆる分野で重要ではないでしょうか。特にAI・機械学習の分野は、現在のモデル数も多いですし、アップデートも非常に激しいので、「追思考」を練習する対象として良いと思います。
━━一般教養として、どの程度の知識を身に付けておくべきでしょうか
本音を言うと、G検定(AIやディープラーニングの基礎知識を問う検定)レベルの知識を身に付けると良いと思っています。ただ全員が身に付けるのは現実的には難しいと思うので、Transformerなど有名なモデルの仕組みや、それらが何に強くて何に弱いのかということを知っておけば生成AIなども活用しやすくなるはずです。
━━学生がAIを利用する上で注意すべき点は
著作権の問題が非常に大きいです。生成AIを使ってピカチュウなど既存のキャラクターの類似画像が描けてしまうなどの事例も報告されているように、生成AIを使うことで、生成されたデータが基にしている著作物の作者の権利を侵害してしまう可能性があります。著作権を侵害した生成データの公開も多く、これからも問題であり続けるのではないかと思います。著作物を使用するときは、それが著作権を侵害して生成されたものでないことをチェックする必要があります。
個人情報が記載されたファイルを生成AIに入力しないことなども、当たり前のことですが徹底されていないように思います。
AIの普及に伴いセキュリティー対策の知識もアップデートされており、学生が高校や大学1年次の情報の授業で学んだような内容はすでに変わっている可能性があります。アップデートされていく知識にキャッチアップしていくことが必要です。
前期教養課程でAIを学べる授業が少ないのが問題
──近藤さんはなぜ東大AI研究会を立ち上げたのですか
僕が前期教養課程に所属していた時はAIのアルゴリズムを学ぶ授業が皆無だったんです。僕自身は独学で勉強しましたが、今重要で社会的価値がある分野なのに勉強できる環境が東大で整っていないのはおかしいと思い、友人と2人で立ち上げました。
━━東大に実施してほしい授業や取り組みは
やはり、AIについて学べる基礎的な授業が前期教養課程に少ないことは問題だと思うので、増やしていくべきだと思います。専門分野に進んだらデータサイエンスを学ぶ人が多いと思うので、1、2年生が学べるデータサイエンスレベルからG検定レベルまで幅広く授業があるとうれしいです。また、僕は工学部の3年生ですが、進学後も満足度の高い授業がないと感じているので、最新のAIモデルにキャッチアップできるようなレベルの高い授業を設置してもらいたいです。
AIを利用する上で経済的な問題もあります。利用料金が月額数万円程度など「さすがに買えない」と思うモデルもあるので、経済的なハードルを下げるために、AIツールの無償化など何らかのアクションを起こしてくれたらありがたいと思います。
━━今後、学生とAIの関係はどのようになっていくと考えますか
一昔前は自分でプログラミングのコードを書ける人しかAIを使えませんでしたが、今は「ChatGPT」と検索して質問を打ち込むだけで気軽に使えるようになりました。良いか悪いかは別として、興味がない授業のレポートはAIに書いてもらって提出することもできます。その結果、目的意識がない人はただ楽をするだけになってしまうのではないかと思います。
一方で、AIを活用すれば、やりたくないがやらざるを得ないことに時間を割かずに、課外活動や勉強、起業など本当にやりたいことに時間を費やすことができます。自分の能力が拡大され、できることがどんどん増える。僕自身、現在さまざまな活動ができているのはAIのおかげだと思っています。