科大讯飞轮值总裁胡郁:掘金语音技术单靠To B是不够的

人浏览 | 条讨论 | 次分享 | 添加时间:

通过在教育、智慧城市、消费者业务等
三大板块的渐次布局,低调潜行十数年的
科大讯飞已逐步探索出政府补贴
这一固有商业模式之外的更多变现路径。
EW:科大讯飞的业务布局情况现在是怎样的?
HY:科大讯飞现在的业务布局主要是两部分:第一是通过人工智能技术和平台级业务,将语音识别、自然语言处理能力授权给第三方,或者与其他公司合作。目前科大讯飞重点关注的领域是移动互联网、智能家居、电信运营商智能语音服务、智能车载系统和政府便民工程。我们与第三方合作是通过科大讯飞云平台实现的,这是我们的语音能力向各个行业输出的一种方式。通过这个方式,我们很容易发现平台上面的各种应用的优缺点,我们能够获得很多有价值的数据。第二,科大讯飞正在将自己的技术与产业结合,目前我们在教育行业做得还不错。我们现在还有一个“讯飞超脑”的项目,这是科大讯飞面向人工智能领域开展的重大技术攻关项目,目标是帮助科大讯飞从机器“能听会说”到“能理解会预测”。
EW:创业初期遇到过哪些突出的问题?
HY:我们是1999年底成立的,到2004年才实现盈亏平衡,在这期间确实遇到了很多问题。主要是两个方面:首先,那时候技术并不成熟。在2000年的时候,国内有很多语音技术创业公司,科大讯飞是唯一一家生存下来并且发展壮大的,因为我们当时选择的路径还算成功,语音合成在当时是相对成熟点的技术,虽然让机器说话也说不太好。那些选择做语音识别的公司,很多没有成功,就是因为当时这个技术太不成熟。
另外,在中国做生意,比较容易成功的商人,可能是比较懂人际关系的,有一定市场经验的,但我们那时候都是一群学生出来创业,包括董事长刘庆峰,1998年还在读博士,1999年出来,对商业模式、公司管理等方面没有什么概念,经历了很长的一段摸索期。
在中国,做产品和市场的人,比做技术的人更容易成功,这是一个普遍规律。在中国做技术,很多都是在国家体制内,像研究院这样的地方或者国营企业;如果要民营的话,那么在中国的环境下寻找到合适的商业模式并且做大其实是很难的一件事情,所以中国民营的科技创新公司不多。


EW:发展到现在,经历过哪些关键时刻?
HY:我觉得有这样几个关键时刻:第一个是在2000年的时候,我们第一次能够把我们的语音合成技术卖给大客户,就是华为。那时我们的软件还很不稳定,经常崩溃,华为的团队说我们把他们当成测试员了。然后我们的创始人团队,三天三夜没睡觉,把软件做稳定了,就是为了能够通过华为的测试。
第二个关键时刻是,我们在2004年实现了盈亏平衡。当时我们找到了一种可行的商业模式——为一些大的客户提供服务,比如说呼叫中心、银行、电信等,赚到了一些钱。而同时期的很多同样的公司要么没活下来,要么就发展得很小。
第三个关键时刻就是我们2008年上市,这标志着我们在资本市场上开始有一个很好的渠道,我们可以更快地发展。
还有一个关键时刻就是,在2009年的时候,我们注意到,移动互联网来得很快,手机输入这块将会有需求,我们就做了一个讯飞语音输入法,现在是国内第二大输入法,第一是搜狗。另外,我们做了一个语音云开放平台,现在已有16万开发者连接到我们平台上,连接的设备超过了8个亿。这两者让我们在移动互联网时代能够占据一席之地,也让我们在消费者业务层面有了很大的一个突破。
最后一个关键时刻就是,我们在2009年的时候,开始在教育业务上有了突破。我们做到了可以用机器评价学生发音的准确程度,还可以评价英语口语的表达水平。另外,我们可以让机器识别出手写的卷子,实现自动批改。我们现在要攻克的是提高机器的理解能力,让机器人能够参加高考。目前机器人参加高考勉强能及格,我们原来的计划是10年内让机器考上一本,现在改成3年内考上一本。人和机器其实是相反的:人0到6岁学常识,这对人是比较容易的,人培养理解能力很容易,但是学习知识很难;而机器能够装下很多知识,但是它不懂常识,所以有人说机器达到了6岁小孩的水平,那是用人的成长阶段去衡量,其实是错的。
EW:为什么科大讯飞会选择教育这个领域?
HY:一方面,就是我们想为国家做点贡献,我们的技术能够帮助教育行业更先进;另一方面,就是我们觉得教育有比较广阔的商业前景。我们有的是政府采购给学校,也有直接卖给家长和学生的产品。我们是希望能够成为国内教育方面的人工智能的最大参与者。
我们进入教育行业,首先是从普通话水平测试开始,然后是英语口语水平测试,后来我们进入英语教学的课堂,提供一些智能设备和软件,然后我们又参与了考试,实现自动批改。学校里面会有很多智能化的系统,我们把这些东西综合起来,提供一个整体的方案。现在我们是国内教育领域用人工智能提供整体解决方案的最大厂商。
EW:这些年来,科大讯飞有哪些事情是具有开拓性意义的?
HY:第一个我觉得是把语音合成能够做到实用化,这是公司成立的基石;第二就是把语音识别做到了可用化——我们不是最早做语音识别的,但我们是把技术做得最成熟的;第三个就是我们将语音测评带进学校,开创了一个新局面,这是我们商业模式上的创新,我们现在还在努力寻找其他新的商业模式。
EW:相较时下众多创业企业,你认为科大讯飞最为显著的特色是什么?它和别的互联网技术公司有什么差别?
HY:科大讯飞本质上是一个科技创新型公司,科技创新型公司的标准,不是看它赚了多少钱,而是看它的技术是不是世界上最先进的。我们最突出的特点是,我们一直在做核心技术创新和原始创新,不是在别的技术基础上进行微创新,而是在做核心技术的突破性创新。
我觉得我们和别的互联网技术公司最大的差别是,我们比较沉得住气,方向很明确。很多公司什么方向热就做什么,比较浮躁,我们相对来说比较执着于自己原来确定的方向。
很多人对我们的评价是,做了十分才说七分。这是优点也是缺点:优点是大家对我们的印象是比较扎实的,缺点是影响力方面可能宣传不够。
EW:有人说你们在风格上更像一家硅谷公司。你认同这种观点吗?
HY:硅谷技术创新型公司的最大特点是,它不仅仅技术领先于全球,它的商业模式也是领先于全球的,而且美国公司有个很重要的特点,它们是全球化的公司。中国虽然现在有很多互联网企业,但在全球化方面还是不够。科大讯飞现在在语音技术方面,无论是合成还是识别,都能够在中文领域做到最先进,但我们也有需要突破的地方。很多人觉得我们低调,其实我觉得有一个原因是,我们的商业模式不能够跟当前世界上最主流的商业模式吻合,所以这也是科大讯飞面临的最大的挑战。
EW:能否在商业模式上稍作展开?
HY:我们原来的商业模式是To B的,就是售卖技术,用技术跟别人合作。现在我们的目标是,用技术引起一个产业的突破,从而建造新的产业生态系统。我们现在探索的新的商业模式是,更靠近消费者,就是要着重To C。这不一定得直接面对消费者,我们可以用更靠近消费者的业务来达到这个目标,比如我们和汽车厂商合作,汽车内的语音业务就是直接面对消费者的。
EW:国内语音市场这些年在你看来有哪些重要变化?
HY:2000年以前,语音并不被大家关注,那时还没有什么大的语音公司,主要是国外一些大企业像摩托罗拉、IBM等在中国做研究。那么在2000年到2010年之间,以科大讯飞为代表的国内公司逐步把语音合成和语音识别市场抢了回来,现在来看,外国公司在中国的语音业务已经很少了。
近几年有两个新的变化:一个是以BAT为代表的互联网公司已开始进入语音市场,并且投入了很大力量。但他们做语音是为自己的生态服务的,并不是想从这上面赚钱,实际上也赚不到什么钱。现在专业做语音的最大的公司应该是科大讯飞。另外一个就是,很多小的创业公司也开始进入这个市场,但做得都不是太好,技术很重要。
EW:巨头的进入会给你们带来压力吗?
HY:当然。压力不是来自于技术,我们的技术是最先进的,压力来自于商业模式。这个没办法去模仿哪家公司,都要靠自己慢慢去摸索。一个公司如果想要长期保持领先,不仅仅是技术能力,商业模式上一定要走出自己的道路并建立起自己的生态。
我们原来做的是To B ,现在To B 的公司很多,如果想要成为一个生态的话,只有这个肯定不够。我们一定要让生态里有C端用户,这就会有很多变现方式,只要我们提供的服务是用户需要的,并且是高质量的,我们就可以从用户手里赚到钱。
现在我们还是免费的服务,我们通过这种方式收集用户数据,根据这些数据来优化产品,当产品体验足够好时,用户会愿意付费。当然我们也可以有其他收费方式,提供给用户的产品可以是全程免费的,在用户和我们的机器交互时,机器会记住用户的喜好和需求,这时智能终端可以给用户推荐产品,我们可以向产品提供商收取费用,类似于广告费。当然,交互是最重要的,将来在车上、电视上、音箱上甚至玩具上都能够实现人机交互。我们现在的语音合成技术已经很成熟了,机器可以发出明星的声音,我们要不断增加语音交互中的用户体验。
EW:语音市场的竞争还不算太激烈吧?
HY:在发展的过程中,如果大家朝着一个方向的话,自然而然就会有竞争。但是现在的问题在于,我们并不知道将来的物联网时代会发展成什么样,谁也没有一个准确的方向。在一个新的时代里,观察过程会有三个阶段:第一阶段是混沌期,就是大家都不知道将来会发生什么;第二阶段叫形成期,就是大家已经有方向、有规划地发展了;第三阶段叫决胜期,就是各家开始激烈竞争赛跑,像滴滴和快的当时一样。语音市场现在处于混沌期到形成期的过渡阶段,大家都不知道怎么干,还在互相观望,互相挖点技术人才,摸索摸索方向。
EW:科大讯飞会是第一个找到方向的吗?
HY:我们一定是,但是做出来怎么样,还不知道,谋事在人,成事在天。我们现在的方向是,软硬一体化、云端一体化、技术服务一体化,我们不能做一个纯技术的公司,要把技术和内容和服务结合。比如说语音合成,我们就一定要和明星名人资源结合,我们现在可以达到让罗振宇给你读文章的水平。
EW:科大讯飞得到过一些负面评价吗?
HY:讯飞的体量在去年的时候只有二十多亿,今年也就四五十个亿。现在市盈率已达到150倍。我们的市盈率不太稳定,因为大家看好一个东西,但这个东西一直没出来,所以就会不稳定。很多人说我们都在靠政府补贴,其实是这样,一个以技术为核心的公司,在中国如果不依赖政府,肯定成长不起来,但过度依赖政府,将来的空间会少一点。我们一开始的确就是依赖政府补贴,否则一下子进入市场,是养活不了自己的,只有在跨过一定的技术门槛后,我们才能靠市场养活自己。我们现在已经在找更合适的商业模式,以减少对政府的依赖。我们现在看到很多人工智能公司,他们已经找到了赚钱的方法,但这对我们来说仍然是个挑战。
EW:其实现在很多人在怀疑你们的盈利能力。
HY:这种怀疑是对的,我们虽然说在很多测评上面取得了不错的成绩,但是并没有达到让大家信服的程度。事情还没成之前,你说你是英雄,谁信?武松打虎,得把老虎打死了,结果出来了,大家才把他看成英雄,现在我说我能打死老虎,谁信呢?我们现在就是在努力证明自己。


EW:相较北上广深,合肥的商业环境是不是差了一点?为什么一直留在合肥?
HY:坦白讲,合肥这个地方很适合做研究,但商业氛围和商业创新环境确实和北上广深杭相比是有巨大差距的。但我们还是一直留在合肥,如果我们不是在合肥,我们的人早已经被挖了七八遍了,在我们这边拿50万年薪的人,腾讯可以给150万。我们为什么能在核心技术上持续深入,并且取得领先世界的水平,就是因为在合肥能够真正静下心来做研究。在北京给他100万的薪水,马上就会有人拿200万来挖,工作一有变动,研究就会停滞下来。北上广太浮躁了,这些地方房价那么高,让人怎么安心做研究?我们现在在京津冀,上海广州深圳杭州都有分部,但我觉得做研究的人,还是来合肥好,一线城市安不下心来。
EW:如果你们工资比其他公司低的话,用什么来吸引人才?
HY:追求。世界上还是有一批有追求的人,就是在中国用人工智能改变世界。
EW:资本对于你们是一个什么作用?
HY:我觉得一个公司一定要借助资本的力量,资本是最重要的。我们不能只靠追求来生活,我们要给这些做出巨大成绩和贡献的人体面的生活。有了资本,我才能真正吸引到优秀的人,解决他们的后顾之忧,他们想要去旅游的时候就能够去世界上任何一个国家去旅游,我们要给他们与能力匹配的薪资。
EW:除了受到资本的青睐外,你们自己也有投资。你们在投资上的构想是怎样的?
HY:战略投资是围绕着我们的战略布局来投。我们现在有三大战略板块,教育、智慧城市,还有消费者业务。
EW:科大讯飞的生态能描述一下吗?
HY:我们现在首先要在教育这个方向做成一个核心技术支撑的开放平台,大家有什么内容都可以放上来,可以对接到学校;在智慧城市方面,我们希望能够通过大数据和人工智能,为交通、社会信息化管理、医疗等提供智能服务;最后在消费者业务上,我们要建立生态入口,让用户用语音的方式与机器进行交互,让机器越来越了解用户的需要。
EW:现在每年研发投入有多大?
HY:收入的25%。主要用于几个方面,核心技术、云计算和各个领域应用的开发。我们现在还有很多需要突破的,像核心技术现在其实还没有达到我们想要的水准,我们还要持续努力,因为技术爆炸是一个持续的过程,不是说一瞬间的,而是在一点点改进中获得的。
EW:作为科大讯飞重点攻坚的领域,目前人工智能在你看来处于什么阶段?
HY:现在业界谈人工智能分成三个阶段,计算智能、感知智能和认知智能。人工智能目前处于感知阶段。人在计算智能上比机器人差,感知智能上好一点,认知智能上会更好,所以说,我们现在的切入点叫语音和语言为入口的认知革命。人类最早成为世界的统治者是因为人类发生了认知革命而不是农业革命。机器人也需要认知革命,机器人认知革命的第一歩就是先理解语言,我们现在的使命是要让机器能听会说,能理解会思考。接下来我们把这个技术跟很多行业,如医疗、卫生、法律等结合起来。
EW:人工智能为什么这两年这么火?过几年它还会这么热吗?
HY:人工智能能火起来,主要是因为核心算法、数据量和应用模式三个方面成熟了,因此它在技术上可以大规模应用于产业。科大讯飞在核心技术方面还比较有优势,在数据的收集上,现在的“讯飞语音云”用户超过8亿,开放云平台的应用项目8万多个,我们正在尝试各个场景的应用。人工智能过几年是不是还能这么火还很难说,现在大数据已经不那么热了,就是大家接受了这个概念以后就没人天天喊了。
EW:现在你们的挑战主要来自哪些方面?
HY:一个就是核心技术还需要时间来突破;另一个就是我们要寻找到合适的商业模式;第三就是我们需要很多综合性人才,不仅仅是技术人员,还需要会市场的、懂产品的、懂宣传的、会做品牌传播的人。坦白讲,我们原来是一个To B的公司,在品牌宣传方面没什么经验,现在需要更多这样的人。
EW:在产品出口方面,有没有遇到一些问题?
HY:问题很大。我们的产品在国际上还没有产生什么效益。我们最大的问题是,语言是个双刃剑,我们可以挡住外国产品进入中国,但是我们进入别的国家也很难。我们现在英语做得不错,但在西班牙语、法语、德语等其他语言国家,我们就不行。
EW:科大讯飞的发展目标和愿景是什么?
HY:愿景就是三个阶段吧:第一个阶段,我们希望成为中国智能语音产业领导者和人工智能产业先行者,其实我们已经达到了,然后我们现在的目标是销售达到100个亿,市值达到1000亿人民币;第二个阶段,我们希望能够在10年内成为中国人工智能领导者,销售额达到1000个亿;第三个阶段,我们的远期目标是成为全球人工智能领导者和重要参与者。现在我们的盈利我是觉得不满意的,我们其实离一个优秀的公司还有差距。
收藏文章
分享到:

本期封面COVER

封面故事:118期
118期
出版日期:2016-10-10