AI Vision Chat umožňuje chatovat s velkými jazykovými modely o obsahu obrázků. Podporuje jazykový model LLaVA, který využívá kodér vidění, a chatbota Vicuna, který umožňuje diskutovat o obsahu obrázků s použitím velkých jazykových modelů (LLM). Zahrnuje také API XRay, prostřednictvím kterého můžete zjistit, jak funguje interakce s API serverem. Kromě LLaVA-13b pracuje také s modely fuyu-8b, minigpt-4, instructblip-vicuna13b, mplug-owl a blip-2.
Pro hodnocení programu se prosím nejprve přihlaste