(相关资料图)
经济观察网 记者 钱玉娟
继海外开源大模型体系推出并实现商用化后,8月3日,阿里云宣布其自研的大模型通义千问正式开源,成为首个宣布大模型开源的大型中国互联网科技公司。具体来看,通义千问70亿参数的通用模型Qwen-7B和对话模型Qwen-7B-Chat,均上架在AI模型社区魔搭ModelScope,开源、免费、可商用。
据了解,魔搭社区是阿里云在2022年牵头发起的一个AI模型社区,借此服务AI开发者。官方数据显示,目前魔搭社区聚集了超20家顶尖人工智能机构贡献的1000多款开源模型,是中国大模型开源的第一门户。
不过,在此之前的6月,由王小川创立的人工智能创新科技公司百川智能,先后推出了70亿规模参数的Baichuan-7B开源模型,以及号称拥有130亿的参数规模的Baichuan-13B模型,率先成为国内推行完全开源、免费可商用的大模型创业公司。
在加入魔搭社区的开发者飞鲸看来,尽管通义千问开源的模型参数只有70亿,但经过微调后,模型的数学推理能力表现不错,“对于一些常见的加减乘除应用题,答得还可以。”
伴随通义千问开源消息发出,两个模型在社区上架后,应用开发者等用户既可从魔搭社区直接下载模型,也可通过阿里云灵积平台访问和调用Qwen-7B和Qwen-7B-Chat两个模型。当用户使用上述开源大模型体系的过程中,阿里云会提供包括模型训练、推理、部署、精调等在内的全套服务。
今年4月推出自研大模型通义千问后,今年7月,阿里云宣布将促进中国大模型生态的繁荣作为首要目标,向大模型创业公司提供智能算力、开发工具等服务。
谈及当前国内外开源的模型,飞鲸认为对包括他在内的开发者们帮助极大,“可以基于自己的业务领域需求,做finetune(微调)或者和本地知识库对接,实现快速地业务落地。”
飞鲸告诉记者,在一些垂直领域并不需要参数量很高、通用能力很强的模型,而是“希望一些小甜点”,他举例到,比如几十到百亿左右参数规模的模型,结合垂直领域数据,就可以发挥很好的价值。
阿里云方面认为,开源大模型可以帮助用户简化模型训练和部署的过程,用户不必从头训练模型,只需下载预训练好的模型并进行微调,就可快速构建高质量的模型。
(责任编辑:刘畅 )标签:
- 通义千问宣布开源
- 征信报告单上怎么看逾期多少次-征信报告单上怎么看逾期多少次记录
- 苹果手机充电越来越少怎么回事 苹果手机充电越充越少怎么回事
- 纸浆巨头Suzano与一些私募公司都在考虑竞购维达国际的股份
- 交通违章处理不合理如何投诉
- 不给劳动仲裁直接起诉可以吗
- 信创和非信创是什么意思(信创是什么意思)
- 一起学习建模哇
- 北京市体育竞赛管理和国际交流中心关于调整2023年北京市青少年举重锦标赛比赛时间的补充通知
- 期交所加快新品种供给 服务石化产业上中下游企业
- 股票行情快报:丰林集团(601996)8月4日主力资金净卖出480.57万元
- 救援官兵来了,瘫痪的老奶奶说:看到你们我就安心了!
- 暂缓前往!门头沟昌平多路段因抢险泄洪暂时封闭
- 河南队不敌北京国安,主帅萨尔科:球队创造了很多机会
- 吉林舒兰强降雨致1死4失联
- “大水过后需防大疫”,市疾控深入房山开展防疫工作
- 教育部:重点核查毕业生灵活就业等数据 “零容忍”态度查处就业违规行为
- 火印工程5吨生活垃圾焚烧炉的操作步骤
- 【夕萌】世萌|暗杀教室整理第三编(杀老师篇·2016年)
- 大主宰:血屠抢夺玉灵果,被高级灵兽击杀,牧尘得到神秘铜片
- 鸿蒙生态设备已超7亿台,近距离无线连接技术“星闪”亮相
- 贵州“村超”:乡村传统与现代融合的高分答卷
- 成都大运会代表团走出赛场沉浸式逛成都 想把中国文化装进手机带回家|在成都街头走一走
- fellow worker是什么意思啊_fellow worker
- 窝藏罪与包庇罪有什么不同
- 大运会“交友记”:有朋自四海来
- “光头”戴假发乔装“锅盖头”,多次进入烟酒商店窃白酒
- 7月全国自然灾害1601.8万人次受灾,因灾死亡失踪147人
- 永定河水位已回落!1998年建成的滞洪水库首次启用即建功
- 京津冀新视听公共服务志愿行动正式启动