カテゴリー: 自然言語処理
- 企業向けText-to-SQL:LinkedInと最先端ラボが示す5つの革新的示唆
- 512トークンに留まり続けた多言語RAGの文脈:32K時代はGranite R2から始まる
- jina-embeddings-v5-omni 発表!全モダリティ対応の小型ベクトルモデル
- 何愷明チーム、初の言語モデルを発表!105Mパラメータ、45B学習トークン、連続拡散アプローチが主流の離散DLMを正面から上回る
- OpenAI元CTOが「常在型」AIのプロトタイプを発表|Hao好聊論文
- 何愷明チームの「拡散モデル」新作:ラストワンマイルで離散デコード
- ゼロインデックス、ゼロ埋め込み、純粋なgrep:DCIが生コーパス上で直接ディープリサーチを実行
- ICML 2026|力技を拒絶、PRISMフレームワークがdLLMでも効率的なTest-Time Scalingを実現
- マルコフの亡霊——次の言葉を予測することから次の行動を予測することへ
- トークンレベルで生成長を精密制御:3BモデルがGPT-5.4やClaudeを撃破
- 近年で最も革新的なAI論文か:推論にリアルタイム字幕を付けると、AIの心理活動が衝撃的だった!
- 静的評価はもう「時代遅れ」?OpenKGがLLM知識強化の動的評価ベンチマークDynamic OneEval-202605を継続更新
- AIがついに「自己告白」!Anthropicの最新論文が衝撃、「内省アダプター」でブラックボックスモデルが自ら隠れた行動を暴露
- Subquadratic — 効率性こそが知性である
- 視覚エンコーダーを除去したら、マルチモーダルモデルがむしろ強くなった?
- Abstract-CoT:推論トークンを11.6倍削減、無語の思考連鎖がLLMの効率限界を突破
- 論文サーベイ | マルチエージェント大規模言語モデルによる知識グラフ自動拡充 (NeurIPS 2025)
- Qwen-Scope:大規模言語モデルの「本音」を見抜く
- Skills駆動推論の新パラダイム、清華大&北京大学:トークン59%削減、精度はむしろ向上
- 言葉なき思考:抽象的思考連鎖による効率的な潜在推論
- 初の時空間時系列推論フレームワーク「STReasoner」:大規模モデルに時空間データの真の理解を | ACL'26
- メモリキャッシング:メモリ容量が増大する RNN
- Qwen3.6-Max-Preview が登場!次世代フラッグシップモデルの早期プレビュー版を公開
- 大規模モデルが「その場で」パラメータを変更可能に!ByteDance Seed&北京大学の新論文:テスト時推論で層追加や再学習不要
- 「重みの凍結」はAI進歩の敵!DeepMind研究者が語る自己改善の鍵、専門家モデルの役割とは