近日,AI界掀起了一股新風潮,一款名爲Llama3-V的全新開源視覺大語言模型橫空出世!據悉,這款模型基于Llama38B和siglip-so400m,被稱爲最先进的視覺大語言模型之一。与此同时,该模型还具备快速本地推理的特点,让用户能够更加便捷地进行推理操作。
有关Llama3-V的一些关键特点包括:优于LLaVA约10-20%的性能表现、训练成本低于500美元以及可与GPT4-V、Gemini Ultra和Claude3相媲美的性能。同时,该模型的权重、训练和推理代码也将会開源发布,让更多的开发者能够参与其中。
现在,Llama3-V已经在Hugging Face平台和Github上发布,吸引了大量关注和好评。据悉,这款模型不仅能够优于以往的同类产品,还能够以更小的模型体积达到与其他大型模型相媲美的性能水平。
總的來說,Llama3-V的推出無疑將爲AI領域帶來一股新的風向,讓我們拭目以待,看這款模型能爲人工智能領域帶來怎樣的突破與創新!
HF Model:https://huggingface.co/mustafaaljadery/llama3v…
Github Repo:https://github.com/mustafaaljadery/llama3v
(舉報)