$Memeye
MemEye 是一个面向多模态 Agent 长期记忆的视觉中心评测框架(visual-centric evaluation framework)。它想回答的不是“模型能不能看懂一张图”,而是: 当视觉信息分散在很长的多轮对话和多次 session 里,Agent 能不能保留关键视觉证据,并在状态不断变化时选出当前真正有效的信息? 这也是 MemEye 和很多已有 benchmark 的区别:它不是只给模型更多图片,而是专门测试那些“不能只靠文字、不能只靠 caption、不能只靠语义检索蒙过去”的视觉记忆问题 https://github.com/MinghoKwok/MemEye