第三财经网 2024-11-16 15:00 0
自9月7日简单亮相后,鲜少公开露面的腾讯混元大模型,昨日公布了最新的研发新进度。
本次新进展,混元大模型主要在中文、数学、代码、文生图方面进行了升级,官方表示,中文能力上,混元大模型整体超过GPT3.5,代码处理效果胜出ChatGPT6.34%。
具体到应用方面,腾讯的工程师们已经可以利用混元来进行代码生成、代码补全、代码漏洞检测和修复、表格数据处理、数据库查询等工作。比如,在IDE编程场景中,腾讯工蜂Copilot接入混元大模型,可根据注释生成对应代码,或基于上下文智能补全代码。
混元大模型本次升级的最大亮点,是开放了文生图能力,该功能现在已经可以在混元助手微信小程序直接体验。
另有网友测试了生成“桂林山水”
文生图是AIGC领域的核心技术之一,也是体现通用大模型能力的试金石,对模型算法、训练平台、算力设施都有较高的要求。
在昨日的媒体沟通会上,据腾讯混元大模型文生图技术负责人芦清林介绍,腾讯文生图从去年8月份开始着手,正式大力度投入是今年,文生图能力最早在广告场景进行探索,今年被视为重点项目推进,现在正在探索生成3D和视频的形式。
从整个市场而言,目前市面上不乏大模型文生图应用应用,目前业界以Midjourney为标杆。
芦清林也坦言,对比国内外的竞品,“毫无疑问Midjourney确实非常好”,通用场景里混元跟其相比还是有一定的差距。就广告场景而言,腾讯混元将以Midjourney作为目标。
从使用来看,芦清林表示,腾讯内部对文生图的需求非常强烈,比例广告业务上可以商品合成广告配图,游戏场景中生成背景和画面元素,内容场景中给小说配图。
与多数应用类似,腾讯也将文生图的功能,首先瞄准广告领域。在接受《科创板日报》等媒体采访时,芦清林用“非常大”来形容广告的文生图商业化体量,不过,混元的文生图不会仅仅面向广告业务,之后还会面向其他业务。
商业化方面,芦清林告诉《科创板日报》等记者,混元也会考虑将文生图能力通过产品化的方式提供给不同行业的客户,比如在广告投放端单独做一个专门服务广告主的产品工具,提供一个接口接入到产品当中去。不过,芦清林也强调,混元的文生图,优先会跟其他业务场景结合,暂时还不会单独做一个产品出来。
根据研究机构前瞻产业研究院的报告,当前,我国的AIGC产业已涌入了互联网大厂、AI公司、生态场景链公司、研究机构等多类参与者。在产业链的三个层级上的主要企业分别是:基础设施层主要有百度、腾讯、华为、阿里巴巴等;模型层主要有百度、腾讯、科大讯飞、华为、阿里巴巴、澜舟科技、必优科技、联汇科技、智源研究院、达摩院等;而应用层主要有万兴科技、拓尔思、创新奇智、美图等。另外,还包括独角兽与新兴创业公司小冰、超参数、澜舟科技、必优科技、智谱华章、密度科技、西湖心辰、联汇科技、蜜度科技、影谱科技、出门问问、云舶科技、聚力维度、启元世界、诗云科技等。
根据《新一代人工智能发展规划》确立的“三步走”目标:到2020年人工智能总体技术和应用与世界先进水平同步;到2025年人工智能基础理论实现重大突破、技术与应用部分达到世界领先水平;到2030年人工智能理论、技术与应用总体达到世界领先水平,成为世界主要人工智能创新中心。我国AIGC行业代表性企业在AIGC产业链各层级以及未来应用场景的应用上均有自己的规划和布局。
热门文章