ReactBench: A Benchmark for Topological Reasoning in MLLMs on Chemical Reaction Diagrams

发布

2026年04月20日

采集 2026年04月20日 04:00

学术前沿 6.0 分 — 揭示MLLM在拓扑结构推理上的根本性缺陷，填补了现有benchmark的空白。对VLM能力边界的研究有价值。

原文： arxiv.org

评分 6 · 来源： · 发布于 2026-04-20

评分依据：揭示MLLM在拓扑结构推理上的根本性缺陷，填补了现有benchmark的空白。对VLM能力边界的研究有价值。

Bilevel Optimization of Agent Skills via Monte Carlo Tree Search

Integrating Graphs, Large Language Models, and Agents: Reasoning and Retrieval