当前位置: 首页 > 科技

开源助推AI技术落地

    ◎本报记者 操秀英

    近日,浪潮电子信息产业股份有限公司(以下简称浪潮信息)发布千亿级开源大模型“源2.0”。“源2.0”创新采用局部注意力过滤增强机制(LFA),可以有效捕捉局部信息和短依赖信息,使模型能够更精准地掌握上下文之间的强语义关联,学习人类语言习惯范式本质,大幅提升数理逻辑、数学计算、代码生成能力。

    浪潮信息于2021年9月在业界率先推出了中文人工智能(AI)巨量模型“源1.0”,参数规模高达2457亿。浪潮信息人工智能软件研发总监吴韶华介绍,比起“源1.0”,“源2.0”在算法、数据、计算等方面都实现了创新。在算法上,该模型基于LFA。有别于传统Transformer模型结构擅长捕捉全局信息和长依赖信息能力的特点,LFA具备有效捕捉局部信息和短依赖信息的能力,可确保模型更精准地学习人类语言范式本质。

    在数据处理方面,“源2.0”通过使用中英文书籍、论文等资料,结合高效的数据清洗流程,为大模型训练提供了高质量的学科专业数据集和逻辑推理数据集。除此之外,浪潮信息提出基于单元测试的数据清洗方法,可更高效地获取高质量数据集,提高训练效率。“有限的算力资源下,训练数据的质量直接决定了模型的性能。”吴韶华说,“‘源1.0’绝大部分的数据来源于网页,虽然我们花费了很大力气清洗,但数据质量确实需要进一步提高。‘源2.0’减少了网页数据,增加了书籍、期刊等的数据,并引入代码和数学数据,使模型数理逻辑能力进一步增强。”

    不仅如此,“源2.0”还将实行全面开源(模型全开源、免费可商用、无需申请授权)。对此,浪潮信息高级副总裁刘军表示,从计算机科学与人工智能的发展历程来看,开源始终对软件技术乃至IT技术的发展有巨大的推动作用。“Meta公司的LLaMA大模型开源之后,迅速吸引了大量开发者。”刘军说,在国内,开源开放是促进AI技术发展和商业落地的重要手段,大模型的开源开放可以使不同的模型之间共享底层数据、算法和代码,有利于打破大模型孤岛,促进模型之间的协作和更新迭代,推动AI开发更加灵活高效。

    刘军认为,开源开放有利于推进“技术+行业”的闭环,以更丰富的高质量行业数据反哺模型,打造更强的技术产品,并加速其商业化进程。

    刘军透露,未来,依托浪潮信息在AI算力平台等方面的长期技术积累,“源2.0”将持续为大模型创业者和开发者提供更加丰富、全面的助力和更加开放的技术创新空间。

浪潮信息AI人工智能 新浪众测 新浪众测 新浪科技公众号 新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

相关新闻
本文来源于网络,不代表广州热线立场,转载请注明出处
转发到:
拓展阅读
  • 5月1日,红星新闻记者从中国铁路成都局集团有限公司成都车站获悉,“五一”小长假首日,铁路成都车站迎来客流高峰,全站累计发送旅客56.3万人次,超过了今年清明小长假首日(4月4日)创下的50.1万人次的旅客发送量纪录,创历史新高。其中成都东站[全文]
    2024-05-02 03:17
  • ◎本报记者 张佳星    一张只有背影的肖像照矗立在第28届中国青年五四奖章颁奖暨百场宣讲启动仪式现场,这是获得今年中国青年五四奖章的黑龙江省国家安全厅干警晋鹏,他肩负着维护国家安全的重要职责和使命;一首稚气的童声合唱响彻会场,那是获得中国[全文]
    2024-05-01 03:38
  • 图片来源:视觉中国蓝鲸财经记者 徐晓春4月30日,天齐锂业两季度亏损近50亿后,“85后”二代蒋安琪在低谷完成接班。近十年间,蒋卫平安排女儿蒋安琪在天齐集团体系内任职历练,2022年4月蒋安琪经选举成为天齐锂业副董事长,二代接班的节奏逐渐明[全文]
    2024-05-01 03:25
  • 本报讯(记者韩扬眉)为进一步提高冷冻电镜分辨率和效率,清华大学研究团队提出了一款新算法CryoSieve,并受到国际冷冻电镜研发领域的高度关注。近日,由美国哈佛大学医学院管理、为全球结构生物学提供计算支持的SBGrid联盟收录了CryoSi[全文]
    2024-04-30 03:26
  • 从2024年开年起,围绕中端手机的话题就从未停止过。各家新品接连发布,卷性能、卷续航、卷屏幕、卷AI……剑拔弩张的口水仗更加重了内卷的气氛,为产品赚足了热度。中端市场向来被看做是手机行业的基本盘,也是非常重要的增长引擎。在被寄予厚望大盘回升[全文]
    2024-04-29 03:20
  • 新快报讯 记者许力夫 通讯员张东 王天巍报道 雨一直未停,4月份累积雨量相当惊人,截至4月25日10时,广东已有20个市县国家站雨量打破当地4月历史纪录,韶关市的累积雨量更是达到了常年同期4倍。接下来的几天还要继续下雨。 25日白天,[全文]
    2024-04-26 03:19
阿里云服务器
腾讯云秒杀
Copyright 2003-2024 by 广州热线 gd.newsfc.cn All Right Reserved.   版权所有