カテゴリー: AI研究
- 大規模言語モデルの推論能力はどこまで強いのか?ある研究がLLMの限界と可能性を明らかにする
- 推論のブレークスルー:SoftCoT++はいかにLLMに「複数の道を考える」ことを可能にするか?
- Qwenのブレークスルー:「並列計算」で「パラメータの積み重ね」を代替、新手法でメモリ22倍削減、遅延6倍削減
- 直感から「深層思考」へ:多次元的に進化する大規模モデルの推論能力
- たった1つのデータで、大規模言語モデルの数学的推論能力を大幅に向上させられるのか?
- 「絶対零度」:ゼロデータ自己進化AI推論手法がSOTAを超える
- 北京大学、清華大学、UvA、CMUなどが共同発表:大規模モデルの論理的推論能力に関する最新サーベイ
- ChatGPTがいかにNLP分野全体を破壊したか:オーラルヒストリー
- 自律汎用科学者:AIとロボットが科学研究を再構築する
- 本日のAI最前線進捗速報
- 新刊「Reasoning From Scratch」第1章公開:Sebastian Raschka氏が語るLLMの推論、パターンマッチング、基本学習