LLM
大規模言語モデル。 サービスとして展開されている場合、入力と出力の合計のトークン分だけを、良い感じに処理できるように学習したモデルのこと。
PyTorch
Deep Learning 系の機械学習を行うためのフレームワーク。 構築は基本的に conda を用いることが推奨される。
2023/05/17 -- CyberAgent が LLM をリリースした
以下、ソース:
BERT
Transformer の Encoder 部分を利用した LLM. 正解文からある程度の語句をマスク処理した穴埋め問題と、文章の関連性判定問題を同時に事前学習することが特徴。
Claude
100k トークンな LLM Anthropic 社がリリース?
Jupyter AI
例えば ChatGPT は、 LLM をバックエンドとして持つような、 web integration のプロダクトであって、その integration を Jupyter の文脈で行ったもの。
LangChain Agent
LangChain の機能の一つ。 LLM に「作業手順書」を出力させ、その手順をプログラム(アプリ)側で実行していくプロンプトエンジニアリングの手法の実装。
LangChain
LLM をシステムに integration していくための機能たちをまとめたライブラリ。
LLM のコピー容易性
LLM は、ある意味どのようにファインチューニングするかが本質であり、入力と出力が観測できれば、それを再現するのは容易いのではないか、という話。
LLaMa
Meta 社が開発した、 GPT-3 相当の LLM. ひとまずは研究者のみに公開。
PaLM
Google がリリースした LLM
チャット転生
GPT-4 に TRPG のゲームマスター的な振舞いをさせて、異世界転生の知識無双をエミュレートさせるプロンプトにより、異世界転生ゲーム的なことをやってみた記事