評価駆動開発

評価駆動開発で趣味のLLMアプリを育てきってみた【やり抜く!】

はじめまして。Insight Edgeデータサイエンティストのnakanoです。 LLMアプリケーションの開発において、「とりあえず動くもの」を作ることは比較的容易です。しかし、実用的なレベルにまで仕上げることは難しい課題です。その理由は、LLMアプリの良し悪しを…

データサイエンティストが評価駆動手法を使ってみた〜家計簿分類プロジェクトの実践記〜

こんにちは、Insight Edgeデータサイエンティストの中野です。 データサイエンスやLLMのプロジェクトを進めていると、こんな課題にぶつかった経験はありませんか? ラベル付きデータが足りず、最初からモデルを作れない 課題感はあるけど、問題定義が曖昧で…