CogVLM は強力なオープンソースの視覚言語モデル(VLM)です。
現実世界の視覚と言語理解アプリケーションに使用することを目的としたオープンソースの視覚言語(VL)モデルです。
Qwen-VL はアリババクラウドによって開発された大規模視覚言語モデル(Large Vision Language Model, LVLM)です。