澜舟科技周明:大模型创业,也可以小而美

点击次数:   来源:中国企业家杂志   更新时间:2023/6/5 9:19:10  【打印此页】 【关闭

微信图片_20230605090923.jpg

“我知道(大模型)未来一定会兴起,要早一点做准备,否则就来不及了。”


|《中国企业家》记者 孔月昕
编辑|马吉英

图片来源|受访者


大模型是未来,周明对此早有预判。
创业之前,澜舟科技创始人兼CEO周明在微软亚洲研究院已经领导团队做了3年多的大模型。“微软跟OpenAI有合作,我们团队也跟他们有一些接触,拿他们的GPT-2做一些实验。”
2020年,周明辞去了微软亚洲研究院副院长的职位,离开了工作21年的微软,准备创业。“我知道(大模型)未来一定会兴起,要早一点做准备,否则就来不及了。”
这个决定并没有获得所有人的认同,有人劝周明,“你折腾这干什么?”很多朋友也被他的坚持所打动,选择“能帮就帮一下”。“要不看起来我苦哈哈的。”周明笑称。
有了创业的打算后,周明第一时间找到了李开复。1999年,李开复把周明从清华招聘到微软亚洲研究院。李开复对周明的创业想法表示大力支持。他首先聘请周明加入创新工场担任首席科学家,熟悉创业环境,一点点开始孵化一个NLP(自然语言处理)团队。“开复给我提供了很多帮助,包括团队方向、找人和融资等方面都给予了大力帮助。我们创业到今天还算走得顺利,在很多关键节点上开复和创新工场都给予了支持。”
2021年6月,周明创办了澜舟科技,沿着AI的NLP方向创业。他领导团队研发的“孟子预训练模型”,打造了搜索、生成、翻译、对话等一系列功能引擎和垂直场景应用。
2021年,“孟子”模型以10亿参数,登顶中文语言理解权威评测基准CLUE;孟子新一代认知服务引擎在HICOOL 2021全球创业大赛中荣获一等奖暨人工智能和金融赛道第一名。
4月底在接受《中国企业家》专访时,周明表示,他们最近又新推出了孟子GPT大模型,面向To B领域,服务企业典型场景,帮助企业降本提效。
以下为周明的采访整理,有删节。
1.两条腿走路


2022年11月30日,ChatGPT的公布让我眼前一亮。
过去,我觉得大模型是未来,但没有想到它这么快进入普通人的视线。大家都可以用(ChatGPT),而且效果如此之好,这令我非常吃惊。
我立刻意识到:人工智能的新时代要来临了。
于是,从去年12月起,我们开始行动。为了“抢跑”,我们克服困难,马上准备算力、搜集和清洗数据等工作,然后开始训练模型。在花费巨大努力后,我们终于训练出一个有多轮对话问答能力的模型 (孟子GPT模型)。
现在回看,我们算国内最早动起来的团队之一,因为我们过去两年来通过孟子模型积累了算法、工程、数据等各方面的能力,所以动起来相对比较快。
从1985年开始,我就一直从事自然语言的研究,经历过NLP的规则系统、统计模型、深度学习模型等各个时代。2017年谷歌推出Transformer的时候,我们在微软亚洲研究院也马上做了一些大模型的尝试,包括融合了BERT和GPT的优点的统一的预训练模型(UNILM)。在这过程中,我逐渐觉得大模型将是自然语言和人工智能的未来。
到了2020年,我有了创业的打算,我的设想是做一个特别好用的大模型,各行各业都可以即插即用,从而提高生产能力,所以孵化了澜舟团队。此后两年里,我们的团队就一直在做大模型。
但过程并不是一帆风顺的。一开始,我们想着炼一个大模型,但是发现代价很大。我后来仔细研究To B和To C的细分,认真分析了在这两条赛道上发展的优劣,发现创业公司在To C业务上,跟大公司相比没有竞争优势,所以我决定优先发展to B业务。后来我走访了很多客户,客户考虑到成本因素,建议我尽可能把模型轻量化。
我们当时考虑的是做To B业务,一旦拿到单子,企业就有了现金流,对增强团队信心有很大帮助。所以我决定应该先在B端炼轻量化模型。发展起来后,可考虑用To C的方式来获客。
澜舟现在的发展路线也是如此,主要做To B企业服务,将模型尝试应用在很多领域,如金融行业、网文娱乐、营销广告等。企业服务做好之后我们就有现金流回来,从而将技术打磨得更好,实现滚动式发展。
此外,我们也做了像翻译、文本生成、小说生成等To C业务借以获客。虽然用户付费意愿比较低,但如果有用户喜欢,能够帮助推广产品品牌或转换付费,形成传播/流量效应后,带来To B的合作客户。
在过去两年工作基础上,我们今年主要任务是,抓紧研究ChatGPT代表的新范式,用更多的数据、更大的模型,做出类ChatGPT模型(孟子GPT大模型),它不仅可以进行多轮对话、回答问题,也能把AI1.0的单功能引擎如翻译、搜索、信息抽取等无缝连接起来。
我们有充足的储备去支持这些工作。今年2月份,新一轮的融资已经到账,我们会把大部分资金用在算力、数据以及人才上,将To B模型做好,并获得收入,从而实现正循环。我向往“两条腿走路”,一方面炼模型,一方面用模型,两者构成反馈链,加速各自能力的提升,打造一个创新闭环。


2.做好“人”的功课


创立澜舟科技,是一个实现团队突破的过程。成功的要素很多,但是就像英伟达老板黄仁勋说的,“成功最重要的是韧性”,我对此深有同感。

从微软离开时,我没有带走团队任何一个人。这意味着起步非常困难。我当时甚至觉得人应该给自己制造一点困难,你一旦克服了困难,就能达到勇气和能力上的更高境界。
刚开始创业时,整个团队只有我自己。不久,创新工场其他团队的几位伙伴被我吸引,觉得澜舟好像有“前途”,就主动加入进来。他们并没有NLP的背景,但是在我的鼓励下,努力开始在NLP领域学习,随后我又招了两名实习生,我们5个人就慢慢开始训练模型。
招聘是我们的“老大难”。毕竟当时我们只是一个看不到明显前景的小型创业团队,也许唯一打动人的办法就是,跟面试者讲未来的机会和情怀。我也通过我的一些学生、我的老朋友等熟人的信任关系招进来第一批人,包括实习生,好不容易到了10个人。
我们这样一个“轻量化”的团队研发做出的孟子模型获得了中文预训练模型CLUE测评的第一名,我们随后又在北京HICOOL创新大赛获得最高奖。这些成绩为我们打开一定的品牌知名度,逐渐有人从各个渠道了解我们并加入进来,一点点滚雪球式地将团队发展成今天的50人团队,其中90%以上都是技术人员。
人才来了后,如何把他培养起来,并让他喜欢公司,也是一个很大的挑战。因为团队逐渐有了名气之后,其他公司的“挖角”不可避免。
为此我们做了很多功课。首先是建立企业文化,为员工树立互助的职业发展观。我们试图打造一个大家互相帮助、互相成就、新人可以得到学习、锻炼和尊重的工作环境,并提供一个施展身手的平台。
第二是组织培训讨论等形式的交流会。我们一直有每月一次(ChatGPT出现后改为两月一次)的披萨DAY“传统”,员工们可以一边吃披萨,一边交流学习,增进彼此之间的理解。每次的披萨DAY都由员工们轮流组织承办,以此锻炼每个人的协调组织能力和沟通能力。
第三,我们还鼓励员工做内部/外部讲座,让他体验到学术水平上升的成就感。
除此之外,我也不可避免地面临初创业时的茫然。毕竟之前在微软研究院时,我作为研究员/科学家,只需要注重算法技术,其他各方面都有微软平台,或者同事帮忙照顾解决。但创业之后,平台红利没有了,方方面面都要靠自己,不仅要从零建设团队,还要自己去谈融资、业务等。
这对于我来说都是全新的尝试和考验。一开始谈投资的时候,每轮我都要见至少20~30家机构,最终可能只有一两家机构愿意投。在这过程中,对内,我们要做出项目的核心技术;对外,我要表述出我们的实力以及清晰的战略方向,还要掌握与投资人的沟通技巧。
如何实现业务盈利也成了我必须要考虑的事。刚开始创业时,我既不知道用户在哪,也不知道用户需求是什么,这种情况下,做出的模型也很难被直接投入使用。
我觉得一定要走近客户,才能了解客户痛点,产出有用的产品。于是我们跟华夏基金成立一个联合实验室,经常走访,尽量了解对方的需求。带着用户的反馈,不断完善大模型能力,让我们训练的大模型真正实用。
我们在过去两年炼大模型方面积累了很多经验,而且我们在To B业务上也建立了不错的合作伙伴关系和生态,从技术到落地形成了闭环。
在ChatGPT引发大模型热潮后,我们提出了更高的目标。要储备更多算力、数据,更快地迭代模型,更好地满足客户需求,实现应用落地。
在我的规划里,澜舟团队会保持短小精干的状态。今年我们有51人,明年可能达到100人左右,未来也不会猛涨。炼大模型需要训练有素的人才,厉害的人1个可能顶10个。我认为百人团队应该是可以长期稳定的一个规模。


3.科学家创业的必备要求


最近两个月,炼模型需要不断测试、修正、训练、调优等过程。我们团队的人都感到压力很大。
不过,我并不太着急,我觉得炼大模型不要太过于着急,不可能“毕其功于一役”,它是一个持续的过程。对每个组的工作,我们都做好了规划,设立了若干check point。大家按照既定方针,按照计划紧凑、有效、有序地往前推进就可以了。
我不会推着团队去“不舍昼夜”地加班。我认为既然这是一个长期奋斗的过程,短期内不停加班赶出一个比较粗糙的模型发布出来,也许可以一时之间造势,但并不是长久之计。
某些大厂急于发布,肯定有自己的考虑,因为它可能希望造势,我们非常理解。而我追求的是稳扎稳打,把事情做得稳,真水平做出来,尤其是To B企业服务,要做到令客户满意,这才是最重要的试金石。
作为领导,我要做好统筹布局,把握好每个人的方向,促进他们互相之间的配合,使得他们能最高效地工作,而不是强求他们的最长工作时间。
作为一名科学家/研究员转型创业,面对这个全新的“工作领域”,我觉得要做很多调整。
首先要磨炼心智,因为创始人需要做各种权衡,甚至有一些痛苦的决定。
其次要做前瞻性的思考。有时我会觉得焦头烂额,没有时间去思考未来的发展,因此我试图平衡自己的时间,比如利用周末去思考未来3-5年的发展战略,想得更明白后,再跟团队进行有效沟通。
在这过程中,我每次都抱着学习的态度,我知道自己换了新的领域、新的角色,会有很多我不清楚的地方,虚心请教别人、看一些资料,试图做出对我来讲最正确的决定,不固执己见,有人提醒(有道理)我就及时调整。

由于技术发展日新月异,我虽然不能保证像以前一样读paper、看书、看资料、使劲抠算法,但我一直保持清醒的进取心,新技术出现了,我就马上去学习,去了解它的大致思路,它有什么用、谁用了,适合不适合我们澜舟发展。如果适合,我会快速指定同事去了解,想办法用在项目中。

保持对新鲜事物、新鲜技术的好奇心,这是必备的。因此,我日常的学习分散到了工作生活的点点滴滴中,比如朋友圈、新闻、论坛等等都是我的学习渠道;其次,我也会通过这些途径去与人交流,了解别人的看法。
第三就是要总结,我每周都会写周报,将我学到的知识、体会落到“纸面”上,再分享给同事们,这对于我来说是一个萃取提炼的过程,不仅能提升自己,也带给别人一些启发。
对于公司的未来发展,我给自己定下了十年的目标。我想用10年的努力,形成有战斗力的公司文化,使它可以经受任何挫折,成为中国乃至世界上最有影响力的NLP团队。



(图文来源于网络如有侵权请联系删除)

加入青商会JOIN THE ASSOCIATION

四川省商务青年企业家联合会以助力四川经济发展新格局,引领企业品牌发展新经济作为本会核心服务,是企业与政府、企业与行业、企业与社会之间的桥梁和纽带,是全省优秀青年企业家的“孵化器”和“大本营”。

申请加入青商会
联系我们