在今天动辄数十亿参数、海量图文数据训练文生图模型的背景下,MiniT2I选择了另一条路。最终,仅用258M参数,就实现了不错的文生图效果。那么在文生图任务里,VAE是否真的不可替代?但到了开放式文生图任务,最自然的参考对象就变成了SD3采用的MM-DiT。(注:具体实验设置可参考文末博客链接)
2026-06-18
几何视觉并不是普通的软件开发问题。模型补全函数后,系统会直接运行单元测试,并以通过率作为最终得分。几何视觉任务,依然是目前大模型难以轻易跨越的壁垒。几何知识上的表现,普遍好于研究级实现能力。
2026-06-07