LangChain
LLM をシステムに integration していくための機能たちをまとめたライブラリ。
LLM
大規模言語モデル。 サービスとして展開されている場合、入力と出力の合計のトークン分だけを、良い感じに処理できるように学習したモデルのこと。
2023/05/17 -- CyberAgent が LLM をリリースした
以下、ソース:
BERT
Transformer の Encoder 部分を利用した LLM. 正解文からある程度の語句をマスク処理した穴埋め問題と、文章の関連性判定問題を同時に事前学習することが特徴。
Chain of Thought
問いに対して、その答えに至る過程を出力させて、回答の精度を高めるプロンプトエンジニアリングの手法。
Claude
100k トークンな LLM Anthropic 社がリリース?
FlexGen
家の PC でも LLM を動くようにしたツール。 PyTorch の上に構築される。
Jupyter AI
例えば ChatGPT は、 LLM をバックエンドとして持つような、 web integration のプロダクトであって、その integration を Jupyter の文脈で行ったもの。
LangChain Chat
会話履歴から、ユーザーが次に聞きたいことを、独立して実行できるような質問へと要約し、その問いを VectorStore Index 経由で回答する。
LLM のコピー容易性
LLM は、ある意味どのようにファインチューニングするかが本質であり、入力と出力が観測できれば、それを再現するのは容易いのではないか、という話。
LLaMa
Meta 社が開発した、 GPT-3 相当の LLM. ひとまずは研究者のみに公開。
PaLM
Google がリリースした LLM