上海夜店网

正在阅读:

jitongyongdamoxingzhihou,zijietiaodongyouyaobaduomotaidamoxingdejiagedaxialai

saoyisaoxiazaijiemianxinwenapp

继通用大模型之后,字节跳动又要把多模态大模型的价格打下来

zuixinfabudedoubaoshijuelijiemoxingshoujiabixingyepingjunjiagebianyi85%。

摄影:曾宇

界面新闻记者 | 肖芳

界面新闻编辑 | 宋佳楠

掀起通用大模型价格战后,字节跳动又要把多模态大模型的价格打下来。

1218火山引擎Force大会上,字节跳动正式发布豆包视觉理解模型,同时公布售价tokens输入0.003比行业平均价格便宜85%相当于一元钱就可处理284张720P的图片

这意味着字节跳动多模态大模型领域再次复制通用大模型领域大幅降价打法今年5,该公司正式对外发布豆包大模型并把价格降低一个数量级引发了阿里、百度等多家厂商大模型降价潮

火山引擎总裁谭待此前表示,降低成本是推动大模型快进到“价值创造阶段”的一个关键因素。

半年过去豆包通用大模型市场上表现一定程度验证谭待判断字节跳动对外公布数据显示,截至12月中旬,豆包通用模型的日均tokens使用量已超过4万亿,较七个月前首次发布时增长了33倍。

大模型应用正在向各行各业加速渗透。据界面新闻了解,豆包大模型已经与八成主流汽车品牌合作,并接入到多家手机、PC等智能终端,覆盖终端设备约3亿台,来自智能终端的豆包大模型调用量在半年时间内增长100倍。最近3个月,豆包大模型在信息处理场景的调用量增长了39倍,客服与销售场景增长16倍,硬件终端场景增长13倍,AI工具场景增长9倍,学习教育等场景也有大幅增长。

此次发布会谭待再次强调豆包大模型市场份额的爆发,得益于火山引擎“更强模型、更低成本、更易落地”的发展理念

最新发布豆包视觉理解模型大幅降价基于同样逻辑,而字节跳动多模态大模型野心不止于此

争夺更多有AIGC需求的客户

字节跳动方面称,豆包视觉理解模型不仅能精准识别视觉内容,还具备出色的理解和推理能力,可根据图像信息进行复杂的逻辑计算,完成分析图表、处理代码、解答学科问题等任务。此外,该模型有着细腻的视觉描述和创作能力。

例如,其可以一眼识别动物的影子,并推断出这是什么动物,也可识别地标建筑、生活中不太熟悉的物品,并给出科普信息,同时还可识别出图片被全选位置的物体

豆包战略研究负责人周昊表示,豆包一直试图让用户的输入更快更方便,非常注重多模态的输入和打磨,包括语音、视觉等能力,这些模型都已通过火山引擎开放给企业客户。

根据谭待的判断,豆包视觉理解模型在判卷指导、作文批改、儿童陪伴等教育场景,目的地推荐、外文菜单识别、著名建筑识别及讲解等旅游场景,以及拍照找同款、商品搭配建议、广告种草文案等电商营销场景有较大的空间。目前,火山引擎已邀请数百家企业测试该模型。

豆包视觉理解模型一同发布还有豆包3D生成模型。该模型与火山引擎数字孪生平台veOmniverse结合使用,据称可高效完成智能训练、数据合成和数字资产制作,成为一套支持AIGC创作的物理世界仿真模拟器。

界面新闻记者现场体验了用豆包3D生成模型生成一张桌子输入相关参数模型就可以生成相应3D图像还可以根据需求变换桌子材质装修设计游戏元宇宙领域模型可以很好辅助设计人员进行创作

这也是字节跳动多模态大模型领域更大野心所在多模态模型技术能力更强价格便宜更多场景以及更多AIGC有需求企业使用

同时,火山引擎升级了火山方舟、扣子和HiAgent三款平台产品,帮助企业构建自身的AI能力中心,提升开发AI应用的效率。其中,火山方舟发布了大模型记忆方案,并推出prefix cache和session cache API,以降低延迟和成本。火山方舟还带来全域AI搜索,具备场景化搜索推荐一体化、企业私域信息整合等服务。

批量更新大模型

新模型发布同时豆包此前发布多款大模型迎来更新

其中豆包通用模型pro已全面对齐GPT-4o,使用价格仅为后者的1/8;音乐模型从生成60秒的简单结构,升级到生成3分钟的完整作品;文生图模型2.1版本,首次实现精准生成汉字和一句话P图的产品化能力。

明年春季字节跳动还将发布具备更长视频生成能力的豆包视频生成模型1.5版,豆包端到端实时语音模型也将很快上线,从而解锁多角色演绎、方言转换等新能力。

相比于市场同类产品豆包系列大模型发布时间并不算早一直保持较快速度更新豆包系列大模型最新能力通过即梦AI和豆包App开放普通用户使用

本月初豆包网页版豆包App上线图片理解功能。测试显示功能可识别图片中包含的元素和基本特征。同时,用户还可通过该功能询问某景点所处的位置或某个角色出自哪部影视作品。

基于字节自研的豆包文生图模型、豆包视频生成模型,即梦AI近期上线了3款视频生成模型,并接入了最新的豆包文生图模型测试显示用户输入一句话一键生成海报海报文字生成的准确率大幅提升图片创作编辑更加灵活。

即梦AI隶属于字节跳动旗下剪映业务,于2024年5月上线,定位是AI内容平台,支持通过自然语言及图片输入,生成高质量的图像及视频。

此前界面新闻独家报道字节跳动旗下创作工具剪映和CapCut,在2024年实现了超过三位数收入增长,总收入正接近百亿元人民币。同时,剪映和CapCut的全球月活用户,也已经超过8亿。

目前字节跳动计划提升即梦的产品优先级,尝试用新的路径打造AI时代的“抖音”。这也意味着字节跳动大模型在消费产品落地还有更高预期

未经正式授权严禁转载本文,侵权必究。

字节跳动

4.1k
  • 大模型使用价格步入“厘时代”,字节豆包商业化路径日渐清晰
  • 美国最高法院将就TikTok禁令再次进行讨论

评论

暂无评论哦,快来评价一下吧!

下载界面新闻

微信公众号

继通用大模型之后,字节跳动又要把多模态大模型的价格打下来

zuixinfabudedoubaoshijuelijiemoxingshoujiabixingyepingjunjiagebianyi85%。

摄影:曾宇

界面新闻记者 | 肖芳

界面新闻编辑 | 宋佳楠

掀起通用大模型价格战后,字节跳动又要把多模态大模型的价格打下来。

1218火山引擎Force大会上,字节跳动正式发布豆包视觉理解模型,同时公布售价tokens输入0.003比行业平均价格便宜85%相当于一元钱就可处理284张720P的图片

这意味着字节跳动多模态大模型领域再次复制通用大模型领域大幅降价打法今年5,该公司正式对外发布豆包大模型并把价格降低一个数量级引发了阿里、百度等多家厂商大模型降价潮

火山引擎总裁谭待此前表示,降低成本是推动大模型快进到“价值创造阶段”的一个关键因素。

半年过去豆包通用大模型市场上表现一定程度验证谭待判断字节跳动对外公布数据显示,截至12月中旬,豆包通用模型的日均tokens使用量已超过4万亿,较七个月前首次发布时增长了33倍。

大模型应用正在向各行各业加速渗透。据界面新闻了解,豆包大模型已经与八成主流汽车品牌合作,并接入到多家手机、PC等智能终端,覆盖终端设备约3亿台,来自智能终端的豆包大模型调用量在半年时间内增长100倍。最近3个月,豆包大模型在信息处理场景的调用量增长了39倍,客服与销售场景增长16倍,硬件终端场景增长13倍,AI工具场景增长9倍,学习教育等场景也有大幅增长。

此次发布会谭待再次强调豆包大模型市场份额的爆发,得益于火山引擎“更强模型、更低成本、更易落地”的发展理念

最新发布豆包视觉理解模型大幅降价基于同样逻辑,而字节跳动多模态大模型野心不止于此

争夺更多有AIGC需求的客户

字节跳动方面称,豆包视觉理解模型不仅能精准识别视觉内容,还具备出色的理解和推理能力,可根据图像信息进行复杂的逻辑计算,完成分析图表、处理代码、解答学科问题等任务。此外,该模型有着细腻的视觉描述和创作能力。

例如,其可以一眼识别动物的影子,并推断出这是什么动物,也可识别地标建筑、生活中不太熟悉的物品,并给出科普信息,同时还可识别出图片被全选位置的物体

豆包战略研究负责人周昊表示,豆包一直试图让用户的输入更快更方便,非常注重多模态的输入和打磨,包括语音、视觉等能力,这些模型都已通过火山引擎开放给企业客户。

根据谭待的判断,豆包视觉理解模型在判卷指导、作文批改、儿童陪伴等教育场景,目的地推荐、外文菜单识别、著名建筑识别及讲解等旅游场景,以及拍照找同款、商品搭配建议、广告种草文案等电商营销场景有较大的空间。目前,火山引擎已邀请数百家企业测试该模型。

豆包视觉理解模型一同发布还有豆包3D生成模型。该模型与火山引擎数字孪生平台veOmniverse结合使用,据称可高效完成智能训练、数据合成和数字资产制作,成为一套支持AIGC创作的物理世界仿真模拟器。

界面新闻记者现场体验了用豆包3D生成模型生成一张桌子输入相关参数模型就可以生成相应3D图像还可以根据需求变换桌子材质装修设计游戏元宇宙领域模型可以很好辅助设计人员进行创作

这也是字节跳动多模态大模型领域更大野心所在多模态模型技术能力更强价格便宜更多场景以及更多AIGC有需求企业使用

同时,火山引擎升级了火山方舟、扣子和HiAgent三款平台产品,帮助企业构建自身的AI能力中心,提升开发AI应用的效率。其中,火山方舟发布了大模型记忆方案,并推出prefix cache和session cache API,以降低延迟和成本。火山方舟还带来全域AI搜索,具备场景化搜索推荐一体化、企业私域信息整合等服务。

批量更新大模型

新模型发布同时豆包此前发布多款大模型迎来更新

其中豆包通用模型pro已全面对齐GPT-4o,使用价格仅为后者的1/8;音乐模型从生成60秒的简单结构,升级到生成3分钟的完整作品;文生图模型2.1版本,首次实现精准生成汉字和一句话P图的产品化能力。

明年春季字节跳动还将发布具备更长视频生成能力的豆包视频生成模型1.5版,豆包端到端实时语音模型也将很快上线,从而解锁多角色演绎、方言转换等新能力。

相比于市场同类产品豆包系列大模型发布时间并不算早一直保持较快速度更新豆包系列大模型最新能力通过即梦AI和豆包App开放普通用户使用

本月初豆包网页版豆包App上线图片理解功能。测试显示功能可识别图片中包含的元素和基本特征。同时,用户还可通过该功能询问某景点所处的位置或某个角色出自哪部影视作品。

基于字节自研的豆包文生图模型、豆包视频生成模型,即梦AI近期上线了3款视频生成模型,并接入了最新的豆包文生图模型测试显示用户输入一句话一键生成海报海报文字生成的准确率大幅提升图片创作编辑更加灵活。

即梦AI隶属于字节跳动旗下剪映业务,于2024年5月上线,定位是AI内容平台,支持通过自然语言及图片输入,生成高质量的图像及视频。

此前界面新闻独家报道字节跳动旗下创作工具剪映和CapCut,在2024年实现了超过三位数收入增长,总收入正接近百亿元人民币。同时,剪映和CapCut的全球月活用户,也已经超过8亿。

目前字节跳动计划提升即梦的产品优先级,尝试用新的路径打造AI时代的“抖音”。这也意味着字节跳动大模型在消费产品落地还有更高预期

未经正式授权严禁转载本文,侵权必究。