腾讯计划投资月之暗面,杨植麟最新发言:今天人类对AI信任还不够
文章来源:钛媒体
作者|林志佳
编辑|胡润峰
图片来源:由无界AI生成5月21日消息,钛媒体AGI独家获悉,腾讯公司正考虑投资 AI 大模型初创公司月之暗面(Moonshot AI),腾讯主要希望建立微信与月之暗面产品Kimi智能助手之间更深层次合作。
钛媒体App就此事向腾讯、月之暗面两家公司寻求回应。但截至发稿前,腾讯、月之暗面均不予置评。
值得一提的是,在此之前,月之暗面已从阿里集团、蚂蚁等机构获10亿美元融资。而一旦上述新一轮融资完成,月之暗面将成为国内 AI 领域单轮融资额最高、又一家同时获得阿里与腾讯两家巨头投资的大模型公司。
图片来源:钛媒体App编辑拍摄目前,月之暗面新一轮投前估值已达到30亿美金。
据悉,月之暗面成立于2023年3月,是国内大模型领域的关键玩家。其核心团队曾参与到Google、盘古、智源悟道等多个大模型研发中。
月之暗面创始人、CEO杨植麟月之暗面创始人、CEO杨植麟本科毕业于清华大学,博士毕业于卡内基梅隆大学计算机专业,曾就职于Google Brain(谷歌大脑)和美国初创公司FAIR,师从苹果公司人工智能负责人Ruslan Salakhutdinov,有多年创业经验,曾与多名图灵奖得主合作发表论文,是盘古、悟道等国内最早大模型的技术贡献者。
同时,杨植麟还是中国35岁以下NLP(自然语言处理)领域引用最高的研究者,也是Transformer-XL和XLNet两篇重要论文的第一作者——两篇文章均为大语言模型领域的核心技术。而另两位联合创始人周昕宇和吴育昕都有超10000次Google Scholar引用。
人员方面,截至今年3月,月之暗面团队已超过80人。
产品层面,月之暗面已完成从通用大模型到上层应用的布局。其中,大模型基础层,月之暗面已训练千亿级别的自研通用大模型,并获得了国内大模型备案审批;应用层,2023年10月,月之暗面推出全球首个支持输入20万汉字的智能助手产品Kimi,支持20万汉字的长文本输入,主打无损记忆以及“长文本(Long Context)”,被网友称为ChatGPT中文平替,善于读长文、搜网页,可以用于会议纪要、辅助编程、文案写作等场景。
近期,月之暗面Kimi智能助手开始通过“打赏”方式,在小范围灰度测试付费功能。目前,Kimi打赏方案有6种,价格分别为5.2元、9.99元、28.8元、49.9元、99元和399元,打赏后分别可获得4天、8天、23天、40天、93天和365天的高峰期优先使用权,点击“去支付”后弹出微信支付页面。
日前举行的上海科学节活动上,杨植麟对外透露,多模态是公司持续投入的重点方向,公司希望在商业化和技术发展之间取得平衡。
“希望在‘爬楼梯’和‘看风景’之间取得平衡,大模型能力接下来有非常大提升空间,我们希望能把精力和优先级放在‘爬楼梯’上。” 杨植麟表示,作为“看风景”的商业化探索,公司也在尝试和发布一些新的商业化功能。
而在5月16日奇绩创空间闭门活动上,杨植麟表示,AI最重要的产品能力就是模型,特别是接下来的两三年,最重要的还是模型,模型决定了你的边界。同时,人和AI之间的信任特别重要,但是今天,人类对AI信任还不够,是因为AI的鲁棒性还不够。
“模型有两个核心能力,一是你能做多少事情、二是每件事情能做到多少分。套用传统产品的思考框架,它分成几块,有功能、交互、增长等方向。功能向基本上还是由模型能力决定, 模型能力指的不只是算法上的,还有产品上的。当然作为一个新产品,功能很重要,交互增长也得做好。”杨植麟称。
谈及商业化,杨植麟称,商业化会决定你产品能增长多少用户,产品有时候不一定是瓶颈,重点是要找一个scalable的增长方式。这里可能会出现一些很伟大的商业创新。
他举例,目前大模型有两种商业模式:订阅模型、抽成模式。
谈及业务决策,杨植麟指出,控制规模不能为了控制人数而控制,本质要砍业务。对于创业者来说,最重要的就是要聚焦,不能做太多的事情。如果OpenAl做的方向我们都做,团队可能很有安全感,但不是个好事。很多时候要做一些好的决策虽然他们去做了,但我们不一定要做一一这样才能发挥优势。
关于融资心态,杨植麟坦言,不要怕被拒绝,心态要强大,创业就是一个新的东西,能看懂的人肯定是少的,心态要摆好。第二个就是具体的策略,每一轮融资里安排好怎么见投资人的顺序也特别重要,聊的时候心态最重要。
值得一提的是,早前有消息称,杨植麟通过售出个人持股已套现数千万美元,此次杨植麟及相关人员套现金额在4000万美元。对于该传言,月之暗面称,“上述消息不实,月之暗面此前已公布员工激励计划。”但至于该激励计划与此次“套现”传言之间有何关系,月之暗面未给予进一步解释。
杨植麟在此次闭门会议上强调,他相信规律效应(Scaling law)带来的AGI发展路线。未来很长一段时间,随着模型能力越强,对话式(conversational)Al边界会被扩展,不只是语言的交互,还有多模态的交互,以及像图形的界面是可以随时生成出来的,所以有可能直接生成一个你想要的交互界面去解决这个问题。
“接下来最重要的事情还是go-to-person(去找人)的逻辑。很有可能先从生产力开始发展,然后慢慢延伸到生活。用户每次都会给一些新的context(上下文语境)。(产品)每次不需要太多的事情,就能给用户一个偏好,做一个真正的go-to-person的入口。”杨植麟称。