以下、ソース:
https://www.cyberagent.co.jp/news/detail/id=28817
やってみた記事: https://note.com/tachanwan/n/na2bc8e194da0
tags: LLM
LLM
大規模言語モデル。 サービスとして展開されている場合、入力と出力の合計のトークン分だけを、良い感じに処理できるように学習したモデルのこと。
BERT
Transformer の Encoder 部分を利用した LLM. 正解文からある程度の語句をマスク処理した穴埋め問題と、文章の関連性判定問題を同時に事前学習することが特徴。
Claude
100k トークンな LLM Anthropic 社がリリース?
FlexGen
家の PC でも LLM を動くようにしたツール。 PyTorch の上に構築される。
LangChain Agent
LangChainの機能の一つ。 LLM に「作業手順書」を出力させ、その手順をプログラム(アプリ)側で実行していくプロンプトエンジニアリングの手法の実装。
LLaMa
Meta 社が開発した、 GPT-3 相当の LLM. ひとまずは研究者のみに公開。
LLM のコピー容易性
LLM は、ある意味どのようにファインチューニングするかが本質であり、入力と出力が観測できれば、それを再現するのは容易いのではないか、という話。
PaLM
Google がリリースした LLM