Die Forschungsdemo des Large Language and Vision Assistant erlaubt Usern das Hochladen eigener Bilder zum Testen multimodaler Fähigkeiten und sammelt Feedback.
Posted in Technologie
LLaVA: Multimodales offenes KI-Modell auf LLaMA-Basis liest Bilder und Sprache
Scientist 23. April 2023












































































































































































