随着AI大模型研发应用热潮持续高涨,记者注意到,赛道内的玩家开始将重心从语言大模型转向视觉大模型。近期,Adobe、Meta、360、美图等多家国内外互联网头部企业纷纷发表大模型成果,为本就火热异常的AI市场再添了一把火。
“人工智能在视频领域的应用越来越受到重视。”中国通信工业协会两化融合委员会副会长吴高斌向《华夏时报》记者表示,这些大型AI模型的发布为企业间的竞争带来了新的动力。企业之间的竞争将促进技术创新和进步,同时也将带来更好的产品和服务。竞争还将促进企业间的合作和共享资源,从而更好地满足市场需求。
(资料图片仅供参考)
海内外视觉大模型“神仙打架”
在鳞次栉比的语言大模型、多模态大模型纷纷涌现之后,“视觉大模型”成为又一个兵家必争之地。日前,美图发布AI视觉大模型MiracleVision,一同发布的还有AI视觉创作工具WHEE、AI数字人生成工具DreamAvatar、美图AI助手RoboNeo等7款产品。
据介绍,MiracleVision具有强大的视觉表现力和创作力,能从绘画、设计、影视、摄影、游戏、3D、动漫等视觉创作场景反推技术演化。与市面上其他大模型不同,它尤其擅长亚洲人像摄影、国风国潮、商业设计等生成方向。
美图公司创始人、董事长兼首席执行官吴欣鸿在接受《华夏时报》记者采访时表示:“美图大模型的核心优势是‘懂美学’,C端用户基础足够大,大模型冷启动的获客成本低,美图目前有2.43亿的月活用户,全球VIP会员数为719万,能在短时间去验证产品成功与否。不同于其他厂商,美图大模型聚焦于美学(画面画质设计等),未来如果非要竞争,会在美学上面去‘卷’。”
无独有偶,360也日前正式发布“360智脑-视觉大模型”。 360创始人周鸿祎表示,大语言模型是构建视觉大模型的基础,多模态能力增强的核心是借助了大语言模型的认知、推理、决策能力。同时,视觉大模型也是“360智脑”的重要能力组成,能够看懂图片,未来还能看懂视频、听懂声音。
海外企业也已经开始在视觉大模型上布局。日前,社交媒体巨头Meta宣布,将向研究人员开放一个名为I-JEPA的“类人”人工智能模型的部分组件,该模型可以比现有模型更准确地分析和完成未完成的图像,而不是像其他生成式人工智能模型那样,只根据附近的像素进行推断。
Meta公司首席人工智能科学家杨立昆曾公开指出,当前的GPT自回归模型存在缺乏规划、推理的能力,未来GPT系统或将被抛弃,并给出了他认为的正确答案——世界模型。据称I-JEPA是第一个基于其愿景关键组成部分的AI模型,能比现有模型更准确地分析和完成未完成的图像。
除此之外,Meta还发布了语音生成AI模型“Voicebox”,支持从文本中生成语音,能够根据仅两秒长的样本匹配音频风格,并将文本样本转换为另一种语言,在给定单独的语音样本的情况下,并能够以说话者的原始语音朗读翻译后的文本内容,目前支持六种语言:英语、法语、德语、西班牙语、波兰语和葡萄牙语。
而早在今年4月,Adobe便将其Adobe Firefly功能(类ChatGPT产品)集成在Premiere Pro、After Effects、Audition、Remix等音视频产品矩阵中,为用户提供一键生成内容、剪辑、调色、更换音乐等功能。
从“语言大模型”到“视觉大模型”
《中国人工智能大模型地图研究报告》显示,从全球已发布的大模型数量及分布来看,中国和美国大幅领先,超过全球总数的80%。同时,欧洲、俄罗斯、以色列等越来越多的研发团队也在投入大模型研发。但值得注意的是,我国在计算机视觉等领域的大模型还较少。
究其原因,北京智源研究院访问首席科学家颜水成向《华夏时报》记者表示:“现在视觉模型发展稍微滞后的主要原因,是因为视觉大模型吃算力吃得比文本要大很多,所以我们也期待芯片更快速的发展,甚至有可能把非GPU其他的芯片融合在一起来做。现在大家见到的模型一般千卡级比较常见,但可能明年就有人会用万卡级来做。”
而在北京智源人工智能研究院院长黄铁军看来,视觉领域是大模型领域下一个浪潮的重点。他指出,视觉大模型和语言大模型背后的思想方法和基本路线是异曲同工的,只是输入的数据变成了图像和视频,训练出来的模型则具有一定的通用视觉语言能力,一种是之前提到的AIGC(人工智能自动生成内容),可以生成图像和艺术品,“还有一种更基本的能力,就是看到世界之后,得首先能把这个世界(万物)分清。”
对于视觉大模型的发展,不少机构也表达出看好的态度。中金研究发布的研报认为,计算机视觉未来有望实现更高程度的自动化、高精度和低功耗,进一步丰富元宇宙的内容生态,降低进入门槛。计算机视觉的进步引领了三维重建和动捕技术快速成熟,并逐渐在各自的领域积累技术进步。计算机视觉未来有望迎来更高程度的自动化、更高的精度,以及更低的功耗,逐渐在移动端实现更好的视觉效果,被应用在大量下游行业,逐渐迈向连接物理世界和数字世界的长期愿景。
中信证券研究也表示,在设计领域,大模型引领数字设计走向智能设计,相关工业设计软件结合GPT等技术,可应用在设计规划、布局优化、插件助手、草图绘制等场景,工业设计软件有望在AI升级的大趋势下迎来新一轮生产力革命。
(文章来源:华夏时报)
随着AI大模型研发应用热潮持续高涨,记者注意到,赛道内的玩家开始将重
端午临中夏,时清日复长,端午粽香飘满白鹿原之际,也是陕西关中地区农
oppo手机刷机步骤教程图解,oppo手机刷机教程图解这个很多人还不知道,
1、 2023年6月23日蚂蚁庄园小鸡课堂今日问题已经公布,跳水运动员需
6月22日,江苏省健身健美运动协会通报:2023年6月18日下午,江苏省健美
策划 统筹羊城晚报全媒体记者陈骁鹏文 羊城晚报全媒体记者李海婵通讯员
时至炎夏,贵州特色农产品蜂糖李迎来“出山季”,特别的口感使其快速“
1、乔迁致词今天是一个特殊的日子,在蓝天高远金秋收获的九月里,我们
1、意气的意思如下:意志和气概。2、2、志趣和性格。3、3、由于主观和
6月22日,继峰股份发布了2023年度向特定对象发行A股股票募集说明书(申
<p>,关于郑州焊工证报名的话题受到了广泛的关注。< p> <p>有很多人都
最近,上海±500千伏南桥换流站设备改造工程正式竣工投产。来自葛洲坝
6月21日,交通银行(601328)融资买入2355 04万元,融资偿还2678 41万
近日,国际计算生物学学会(ISCB)发布消息,计算生物学家、清华大学智
据甘肃省气象局网站消息,平凉市气象局党组21日通报称,6月21日,网上
6月21日,南方匠心优选股票A最新单位净值为0 7012元,累计净值为0 7012
6月21日,广发集丰债券A最新单位净值为1 136元,累计净值为1 38元,较
6月21日,鹏华中证国防ETF最新单位净值为0 781元,累计净值为1 562元,
6月21日,广发利鑫灵活配置混合A最新单位净值为2 367元,累计净值为2 7
6月21日,景顺长城竞争优势混合最新单位净值为0 8285元,累计净值为0 8
龙岩新罗区:数字引领产业升级福建日报记者张杰通讯员温连光部门日常业
日前,记者从公安部获悉,近来各地公安机关处理了一批涉及校园安全的谣
记者昨日获悉,为迎接端午假期,丰富市民的文化生活,弘扬中国传统文化
说起来,我国自从成为一个现代化的地方以来,各方面都发展迅速,也不像
6月22日,生意社丙烷基准价为3998 25元 吨,与本月初(4418 25元 吨)相
如何抓好今冬明春市场监管领域安全生
12月16日,达州市达川区市场监督管理局下发《市场监管领域今冬明春安全生产隐患大排查大整治行动工作方案》,要求下属各部门从2022年12月16日起至2023年3月15日,全面聚焦城镇燃气、特种设备、危险化学品、烟花爆
《2021年度中国对外直接投资统计公报
金港高速公路连接柬埔寨首都金边和该国最大深水海港西哈努克港,是中国路桥按建造—运营—移交模式投资的项目,采用中国设计及质量标准,横跨5个省份,全长187 05公里,双向四车道。金港高速公路通车后,从金边到
总体保持稳定恢复态势 工业经济展现
2022年1至10月,浙江省宁波市811家汽车制造业规上工业总产值2646 8亿元,同比增长14 2%。图为11月19日,工人在领克汽车宁波梅山工厂的总装车间作业。今年以来,受疫情多发散发、市场需求不振等因素影响,国内工业
14家券商获首批个人养老金代销展业资
11月18日晚间,证监会发布《个人养老金基金销售机构名录》,共37家机构入围,其中券商14家,银行16家,独立基金销售机构7家。14家券商包括华泰证券、中信证券、海通证券、国泰君安、申万宏源、中金财富和长江证券
北京再担保承保规模超6000亿 覆盖中
北京中小企业融资再担保有限公司(简称北京再担保)发布的最新数据显示,成立14年来已累计承保规模超过6000亿元,覆盖中小微企业(农户)超过16万户次,积极推动北京市中小微企业融资规模不断扩大。北京再担保2008年
Copyright @ 2001-2023 www.u74.cn All Rights Reserved 商业时报网 版权所有 关于我们
网站信息内容, 均为相关单位具有著作权,未经书面授权,转载注明出处
未经商业时报网书面授权,请勿建立镜像,转载请注明来源,违者依法必究