AI・システムデザイン研究室
フィルター活用可能な大規模言語モデル
アマゾン ウェブ サービス ジャパン株式会社 内定
総合情報学部 総合情報学科 4年
奈良県飛鳥未来高等学校 出身
総合情報学部 総合情報学科 4年
奈良県飛鳥未来高等学校 出身
話題の「ChatGPT」関連研究に挑戦。「ChatGPT」の基盤は、大規模言語モデル(LLM)です。YESかNOといった質問や、0〜100などの数値によるフィルター活用が可能なLLMが目標。実現すれば、LLMの膨大なデータから必要な情報を取り出し、別システムに出力することも容易になるでしょう。この研究のように、ユーザーにとっての使いやすさや便利なサービスなど、細かいところまで気を遣えるエンジニアをめざします。
次にどのような単語が続くのかをモデル化したものでパラメータ数が大規模であるモデルがLLMです。そのモデルを膨大なデータを用いて学習させるのが通常です。