Skip to content
星际流动

ReactBench: A Benchmark for Topological Reasoning in MLLMs on Chemical Reaction Diagrams

发布
采集
学术前沿 6.0 分 — 揭示MLLM在拓扑结构推理上的根本性缺陷,填补了现有benchmark的空白。对VLM能力边界的研究有价值。
原文: arxiv.org

评分 6 · 来源: · 发布于 2026-04-20

评分依据:揭示MLLM在拓扑结构推理上的根本性缺陷,填补了现有benchmark的空白。对VLM能力边界的研究有价值。