李彦宏：大模型开源意义并不大

最近，百度创始人、CEO李彦宏发表了一个内部讲话，讨论大模型开源的价值和意义。百度布局中文大模型比较早，但他们并没有选择开源路线，李彦宏认为，第一，市场开源的大模型不止一家，不缺百度这一家；第二，闭源模型在能力上会持续领先，而不是一时领先；第三，大模型开源不能等用于软件开源的价值，闭源才会有真正的商业模式。

那么，你同意大模型闭源吗？以下是李彦宏讲话的主要内容：

为什么不开源？

一年前文心刚刚发布的时候，我们内部是有过非常激烈的讨论的，最后当然大家也知道这个结果，我们的决定是不开源。为什么不开源？当时的判断是，市场上一定会有开源的模型，而且是不止一家会开源。在这种情况下，多百度一家开源不多，少百度一家开源也不少。

我们今天看主流的开源模型：像Llama，Mistral其实都是有相当影响力的，国内的智源、百川、阿里的通义也都是开源的，这个市场上不缺我们这一家开源的模型。我们要开源还得自己去维护一套开源的版本，这是不划算的。

更重要的是，在我们的认知里，闭源模型在能力上会持续地领先，而不是一时地领先。为什么会有这个判断?

因为我们觉得模型开源的意义其实不是很大，这些开源模型都是在外头零零散散小规模地去做各种各样的验证应用，它没有经过大算力的验证。

而且模型开源也不是一个众人拾柴火焰高的情况。这跟传统的软件开源一比如Linux、安卓等等很不一样，由于是模型带来的开源，我们也不知道参数为什么变成了那个样子，这种情况下很难实现众人拾柴火焰高。虽然Llama也鼓励大家去贡献各种各样的数据、代码，但是实际上大家明白最主要的开发者就是Meta这些人，它并不是一个真正由大家一起来协同开发的产品。

反观闭源，是有真正的商业模式的，是能够赚到钱的，能够赚到钱才能聚集算力、聚集人才。其实也很简单，大家比较一下，比如硅谷有一个优秀的人才，他有OpenAI的offer，有Meta的offer，有Llama的offer，他会去哪儿？这是非常显而易见的选择。

大家以为开源是免费的，在成本上有优势，实际上我们认为也不是，闭源在成本上反而是有优势的。只要是同等能力，闭源模型的推理成本一定是更低的，响应速度一定是更快的。反过来，同等参数的情况下，闭源模型的能力也是更强的。今天不管是在中国也好、在美国也好，最强的基础模型都是闭源的，而各种各样的小模型、最好的小模型，都是通过大模型蒸馏来的。通过大模型降维做出来的模型就是更好的，这样也会导致闭源在成本上、在效率上也会有优势。