刘庆峰谈科大讯飞与华为合作:任正非高度重视,双方共同看好,非干不可

导读 原标题:刘庆峰谈科大讯飞与华为合作:任正非高度重视,双方共同看好,非干不可出品 | 搜狐科技作者 | 梁昌均在国内百模大战中,有这样...

原标题:刘庆峰谈科大讯飞与华为合作:任正非高度重视,双方共同看好,非干不可

出品 | 搜狐科技

作者 | 梁昌均

在国内百模大战中,有这样一家企业,在推出大模型之初,就明确提出迭代的时间表和里程碑。从5月6日、6月9日、8月15日,再到10月24日,每次都如期而至。

昨日,科大讯飞在其年度最重要的全球开发者节活动上,正式发布星火认知大模型V3.0,实现全面对标ChatGPT(GPT-3.5),并提出要在明年上半年对标GPT-4。

同时继联合推出星火一体机后,科大讯飞再与华为联合推出基于昇腾生态的“飞星一号”平台。这是双方打造的完全国产化的算力平台,更大规模的星火大模型将在该平台启动训练。

谈及与华为在算力国产化方面的合作,科大讯飞董事长刘庆峰与搜狐科技等媒体表示,双方共同看好,非干不可。“能走到这步,华为非常令我们骄傲,我也为自己的团队骄傲。”

据他介绍,讯飞在三年前就开始做国产化,去年10月跟华为进一步深度合作。“讯飞和华为昇腾打造的系列平台,既有讯飞的需求,也有华为的需求,所以双方能达到战略联合,任正非都高度重视。”

“最大的压力是我们做这件事的心态,最大的困难是在快速奔跑的过程中,别人用的是最豪华的武器,而你一边还在磨练武器,一边还要往前走。”刘庆峰表示,这关键要看是不是发自内心坚信通用人工智能的未来,坚信自己能做到业界领先。

他也坦言,用国产算力平台会有一个从打磨到不好用到好用,再到整个生态繁荣的过程。“早期一定是会花费更多时间,不可避免。但这个过程是值得的,除非你不想自立自强。”

他还回应了外界称讯飞是微缩版华为的说法。“我不希望大家觉得我们老在蹭华为的流量和热点,我们很羡慕华为,也得向华为学习。”刘庆峰说,讯飞跟华为的盈利能力和管理能力差得还挺大,但一样都有梦想。

目前,大模型已走过技术的喧闹。对接下来的发展趋势,刘庆峰认为有两个关键点,第一核心是能不能真正在刚需场景中落地,二是大模型还有很大的技术提升余地。

在技术层面,刘庆峰认为,大模型进化方向除了还要做更大参数规模的模型,未来主流是把它打造成每个人的助手。“这需要AI人设,需要主动问答,特别是启发式引导性的提问。”

在应用方面,刘庆峰强调,要更加关注纵深的行业应用和刚性需求,这才是真正能产生商业化的领域。“叫好不叫座,我觉得是对类似ChatGPT或讯飞星火这样的纯APP而言。”

自在9月5号开放后,讯飞星火用户已达1200万,大模型直接相关的开发者团队达到17万。刘庆峰表示,讯飞在C端先暂时免费,会先把行业场景做深。此次讯飞也联合行业龙头推出了金融、汽车、工业等12个行业大模型。

不过,大模型在落地中,企业出于场景需求或安全考虑,往往会要求定制化、私有化的解决方案,这导致高成本。对此刘庆峰表示,核心要看它是可有可无,还是真的能解决刚需。

“我们会把企业知识库学习、行业知识的学习和场景的定制等,更加工具化,让企业内部很容易就可以使用。”刘庆峰认为,当把典型场景做好以后,定制比例就会越来越低,它才能越来越好,成本也会大幅下降。

对于何时能够获得大模型投入的商业回报,刘庆峰判断,明年大模型应该会给讯飞带来明显的商业收益。

“我觉得现阶段至少到明年,不一定说投入产出要cover住,它会带来收入毛利的快速增加,但我们会把多挣的钱坚定不移投到认为该干的事情上,把速度加快。”刘庆峰说。

对于明年对标GPT-4的目标,刘庆峰表示“心中有数”,也很清楚与GPT-4在小样本快速训练、复杂推理、多模态综合使用、长文本内容等方面还有差距。

“国内大模型都有不小差距,那些说跟它差不多的,我觉得还是要更客观。要有科学精神,才能真正实现从追赶到超越。”刘庆峰说,“我们给自己留退路,但要科学的不留退路。”

以下是对话实录(经编辑整理)

谈与华为合作:任正非高度重视,最大压力是心态

媒体:此次和华为联合发布的飞星一号对有双方和行业什么意义?

刘庆峰:飞星一号是我们跟华为共同搭建的完全国产化的算力平台,双方联合研发了各种优质的算子库。华为坚定去做底座能力,而我们坚定投入应用和算法,大家共同看好,非干不可。除华为内部应用外,星火3.0可以说是国内第一个在国产算力平台上训练出来的大模型。我们大模型的训练推理效率提升一倍甚至更多,也使我们有条件和基础在明年对标GPT-4。

我们做的很多探索性的工作,包括算子库等成果,将来对其它科研单位和企业都有非常好的借鉴参考作用。跟华为一起做的工作中有一部分是华为可以公开给第三方客户使用,有一部分是双方共有知识产权,还有一部分是讯飞独有,会形成对整个产业生态善意的支撑。

媒体:讯飞和华为在算力合作上,推理和训练哪部分较多?

刘庆峰:推理相对简单,国内有一些号称自己的芯片能够做大模型,主要是推理这块。最难的是训练,华为最新芯片除了自己部分业务外,率先给讯飞搭建了完全自主可控的平台。我们下一步要对标GPT-4,训练也能做,推理同样也会做。

媒体:讯飞与华为合作去做国产化的算力平台,您觉得最难的一关是什么?

刘庆峰:最大的压力是我们做这件事的心态。本来可能一个月就能干成,现在可能三个月才能干完。假如不是用国产平台,用成型的英伟达平台,星火3.0效果可能还会更好。但这一步非走不可,能走到这步,华为非常令我们骄傲,我也为自己的团队骄傲。

最大的困难是在快速奔跑的过程中,别人用的是最豪华的武器,而你一边还在磨练武器,一边还要往前走。这对心态、未来长期战略的影响很重要,说到底是不是真的发自内心坚信通用人工智能的未来,坚信自己能够做到业界领先。

媒体:使用国产算力平台是不是意味着要花费比国外竞争对手更加长的时间,现在是完全基于华为的算力平台吗?

刘庆峰:用国产算力平台,包括早期用国产操作系统,都有一个从打磨到不好用到好用,再到整个生态繁荣的过程。如果都不往前走一步,那我们始终没有办法自立自强。但早期一定是会花费更多时间,这不可避免。没有生态,算法能不能在硬件上跑要去验证。但这个过程值得,除非你不想自立自强。星火3.0是华为平台上做出来的,4.0会完全在华为平台上。

媒体:外部环境变化非讯飞带来怎样的机遇?后期会不会开展算力租赁之类的服务?

刘庆峰:讯飞的国产化从三年前就开始,去年10月份又跟华为进一步深度合作,在星火正式研发之前,华为特战队就已经在场。讯飞和华为昇腾打造的系列平台,既有讯飞的需求,也有华为的需求,所以双方有战略联合,任正非都高度重视。

美国出台新的政策在我们预期之中,我只是觉得这件事情更加凸显了我们早做准备的必要性。对讯飞来说,按照正常节奏去发展就可以,但原来很多抱有侥幸心理的厂商,可能得赶快做调整。但租赁算力不是科大讯飞的生意,我们暂时不会做,主要还是做自己的训练和应用。开发者在我们的云平台上对外提供服务,这个有可能,但不会单独做算力服务这件事。

谈大模型发展趋势:核心在落地,技术仍有很大提升余地

媒体:您如何看待大模型走到现在的发展情况,未来行业竞争焦点会在哪里?

刘庆峰:今天大模型的能力看起来都大差不差,核心是能不能真正在刚需场景中落地,谁能够建立快速训练的机制和功能,更好的理解洞察行业需求,谁就能率先获得商业上的成功。

第二大模型还有很大的技术提升余地,比如主动对话、AI人设、架构方面等。我们看到了很清晰的未来技术提升的路径,怎么样用更多的数据,用更大的参数,更多的行业场景,更好的学习机制,有一整套方法,只是苦于时间不够,算力也不够,如果给我源源不断的算力,我明天就能做出一个比这个惊喜很多的系统。

媒体:您怎么看大模型下一步的进化方向,挑战会集中在哪些方面?

刘庆峰:我觉得方向有两个,首先还是需要做更大参数的模型;第二要打造每个人的助手,需要AI人设,需要主动问答,特别是启发式引导性的提问,这样可以把它应用到更深的行业里,我觉得这是核心主流。此外,大模型要跟行业场景做更纵深的定制和服务,要把大模型的多模态能力、知识学习表达能力跟各个场景更深融合,用大模型作为核心链接,把各种AI技术整合在一起来提供解决方案。

媒体:在大模型行业落地中,讯飞怎么去跟具体行业结合?

刘庆峰:这绝不能光靠讯飞一己之力,而是要和行业龙头企业联合打造行业大模型去推广。首先必须要有最好的底座技术,行业龙头企业才愿意来合作。第二,我们有一整套的工具能够针对行业专属内容和企业个性化内容去做训练。第三,在打造行业通用性的能力上,然后提供可以快速训练行业专属知识的工具,就比较容易做成。

为什么我们只做了12个?我们认为要把行业做透,必须要有真正懂行业、懂应用场景的龙头企业跟我们联合,而且要有心胸和气度,在企业内部用好以后可以全行业赋能,这也是我们挑选合作伙伴的基本原则。

谈大模型成本和商业化:明年会带来明显收益

媒体:大模型叫好不叫座,OpenAI运营成本非常高,怎么看国内大模型商业化的路径?

刘庆峰:叫好不叫座,我觉得是对类似ChatGPT和讯飞星火这样的纯APP而言。这样的APP更多是让大家知道技术怎么回事,做相对浅层有意思的应用。但我们要关注纵深的行业应用和刚性需求,要重视每个行业,这才是真正能够产生商业化的领域。

媒体:讯飞大模型面向公众开放后现在用户数量大概多少,后期是否会考虑收费?

刘庆峰:讯飞星火开放后各类用户已达1200万。国内各家都在说用户到底谁多谁少,这要看是什么数据,比如输入法我就不算,我们说的是大模型直接相关的应用。自5月份以来,我们新增开发者团队总量130多万,跟大模型直接相关的是17多万,其中超10万是企业级团队,7万多是个人团队。我们暂时先免费,还是要先把行业场景做深再说。

媒体:大模型落地对每个行业都有很强的定制化需求,这会导致成本过高,代码平台会是讯飞未来在B端商业化的主力吗?

刘庆峰:代码是一个非常重要的方向,而且是很重要的切入点。商业价值能不能闭环,核心要看它是可有可无,还是真的能够解决刚需。我们会把企业知识库的学习、行业知识的学习和场景的定制等,更加工具化,让企业内部很容易就可以使用。当把典型场景做好以后,它定制的比例就会越来越低,它才能越来越好,成本也会大幅下降。但龙头企业跟我们一起做纵深应用,企业用好以后在场景全面推广,这需要一个过程。

媒体:大模型什么时候能带来对业绩的提升?未来投入方面会有什么变化?

刘庆峰:大模型在我们内部已经开始出现比较好的成效,我认为到明年,大模型应该会带来非常明显的商业收益。现在还没到一个稳态的阶段,还有太多的工作要做。所以明年还会强投入,新增的收入毛利会比较明显,但会全部投到大模型的研发中。

我觉得现阶段至少到明年,还不一定说投入产出要cover住,应该说它会带来收入毛利的快速增加,带来行业市场份额和影响力、美誉度更好的提升。但同时要把多挣的钱坚定不移的投到我们认为该干的事情上,把速度加快,这是我们现在的战略选择。

媒体:您多次说到遥遥领先、如期而至等,提到明年对标GPT-4,有没有给自己留后路?

刘庆峰:我们自己给出来时间表和里程碑,确实没有给自己留退路,这是我们的梦想和发自内心的追求,所以不想给自己留退路。我们在定目标时并没有说遥遥领先,但它出来之后确实遥遥领先,比如数学能力、代码能力。

我们提出明年上半年对标GDT-4,心中也有数,也很清楚跟GPT-4的差距,比如小样本的快速训练、复杂的推理、多模态的综合使用,以及长文本内容等。国内各个大模型都有不小差距,那些说跟它差不多的,我觉得还是要更客观。要有科学精神,才能真正实现从追赶到超越。我们有里程碑时间,是要科学的不留退路,不是随便提出一个莫名其妙的目标。

免责声明:本文由用户上传,如有侵权请联系删除!