欢迎各位兄弟 发布技术文章

这里的技术是共享的

You are here

蒸馏模型 有大用 有大大用

我视频里演示用的7b模型,实际上是个蒸馏模型。并不是完整正宗的deepseek r1 给大家解释一下什么叫蒸馏模型 有两个模型。一个老师模型,一个学生模型。 学生不断向老师提问,并把“问题-答案”记录下来。然后用这些“问题-答案”的数据,来训练学生,从而让学生拥有和老师非常接近的知识和能力。这就叫:蒸馏。

普通分类: