谷歌DeepMind的小模型,又上新了!就在刚刚,谷歌DeepMind发布Gemma22B。它是从Gemma227B中蒸馏而来。虽然它的参数只有2.6B,但在LMSYS竞技场上的得分,已经超越了GPT-3.5和Mixtral8x7B!在MMLU和MBPP基准测试中,它分别取得了56.1和36.6的优异成绩;比起前代模型Gemma12B,它的性能超过了10%。小模型击败了大几个数量级的大模型,再一次
-
-
英伟达 Mistral AI 联袂出击!120 亿小模型王者强势登场,碾压 Llama 3 单张 4090 可跑
GPT-4omini头把交椅还未坐热,MistralAI联手英伟达发布12B参数小模型MistralNemo,性能赶超Gemma29B和Llama38B。小模型,成为本周的AI爆点。先是HuggingFace推出了小模型SmoLLM;OpenAI直接杀入小模型战场,发布了GPT-4omini。GPT-4omini发布同天,欧洲最强AI初创公司Mistral立马发布旗下最新最强小模型——Mistra94 0 2024-07-20 16:27