有竞争力的大语言模型,有超越claude的潜力,Mistral的小型版本已开源,但是Mistral-medium暂未开源。
测试体验来看,效果能碾压90%的大语言模型,而且上下文达到了32k。
美中不足的是重复性损失很低,或者没有设置重复性损失,导致写故事很容易反反复复出现相同的内容,在同一对话内写的内容很同质化。应当和gpt一样抑制重复内容的输出会好很多。
测试体验来看,效果能碾压90%的大语言模型,而且上下文达到了32k。
美中不足的是重复性损失很低,或者没有设置重复性损失,导致写故事很容易反反复复出现相同的内容,在同一对话内写的内容很同质化。应当和gpt一样抑制重复内容的输出会好很多。