拓尔思林松涛:发挥高质量数据积淀优势 打通大模型落地关键路径 当前聚焦
21世纪经济报道记者雷晨 北京报道
6月6日,由21世纪经济报道、北京人工智能产业联盟元宇宙专业委员会、中国文化产业协会文化元宇宙专业委员会主办的“21世纪卓越董事会人工智能闭门会”召开,主题为“AI领域上市公司创新涌现、技术难题与发展路径”。
会上,拓尔思(300229.SZ)副总裁林松涛介绍了“拓天”大模型及行业应用。他表示,大模型技术场景落地中的挑战,主要是质量、可控、时效和成本。
【资料图】
质量方面,他认为,个人服务用ChatGPT,提示词不准可以换一个,如果图片生成不好也可以再换一个,可以说个人对AIGC的容忍度是很高的。但是企业不一样,给政府写顾问报告,数据来源必须是准确的。
可控层面,一是内容安全,数据是有价值观的,模型没有价值观。二是私域数据安全,中国大模型要数据化落地,如何在保证用户私有数据安全的同时将大数据较好地运用也是一个问题。
时效方面,在大数据训练上,灾难性的遗忘一直都是训练的问题,所以需要大模型解决这个问题。另外,怎样输入即时数据,类似Chat GPT,数据最新只到2021年9月,因此在To B服务的时候用不好。
成本方面,千亿模型私有化落地的时候需要训练好,在企业端落地还需要让企业用得起。拓尔思做To B服务,垂直场景落地成为“百模大战”的核心要点。
据林松涛介绍,大模型出来以后颠覆了拓尔思此前积累的NLP技术,公司发现,在大模型的基础上再去结合知识图谱、自然语言处理技术效果更好。与此同时,公司拥有长期数据采集和高质量数据资产积累优势,可将数据迅速投入到大模型当中。
“现在拓尔思拥有全网数据1500亿,有人工整理、专家整理的数据库达30多个,主题数据110亿个,这是拓尔思能够做大模型很重要的优势。”林松涛称。
据了解,拓尔思在大模型应用方面首先选择政府、媒体和金融三个优势赛道。
在林松涛看来,做垂直领域首先要选好大模型基座,国内头部厂商自己做基座,也有一些厂商选择开源,同时还需要有数据以及在专业领域的积累,最后在大模型落地时,不仅要有技术、数据、还需要让用户知道如何应用,包括真实场景的闭环、基于用户反馈的学习等等。
“我们现在要解决的三个问题,一是实现大模型与专业知识库的融合。二是如何提升AIGC的内容质量和数据安全,特别是在内容事实核查方面。三是如何降低百亿级大模型落地的成本。”林松涛表示。
上一篇:广期所再次组织工业硅期货模拟交割
下一篇:最后一页

广东建成81条特色自然教育径 免费向公众开放
记者从广东省林业局获悉,今年广东省已建成101条特色自然教育径,总长度达176 4公里,其中有81条自然教育径免费向公众开放。据了解,自然教
2022-07-18青藏高原最大中心城市发现多种珍稀野生动物影像
中新网西宁5月25日电 (记者 孙睿)中国科学院西北高原生物研究所专家连新明25日向中新网记者透露,通过近一年来的观测,在青藏高原最大中
2022-05-25湖北一男子在赣病逝 家属捐献器官挽救3人
中新网南昌5月25日电 (记者 吴鹏泉)江西省红十字会24日消息,湖北一男子在江西南昌因病逝世,家属在悲痛中捐献其器官,挽救了3名重症患者
2022-05-25湖北云梦全县域恢复实施常态化疫情防控措施
(抗击新冠肺炎)湖北云梦全县域恢复实施常态化疫情防控措施 中新网孝感5月25日电 据湖北孝感市云梦县新冠肺炎疫情防控指挥部通告,该县全
2022-05-25手语律师唐帅:让法治阳光照亮无声世界
奋进新征程 建功新时代·我们的新时代丨手语律师唐帅:让法治阳光照亮无声世界 新华社重庆5月24日电 题:手语律师唐帅:让法治阳光照亮
2022-05-25
中国援柬中医张大武:升华中柬医患友谊的“关键钥匙”
中新网金边5月25日电 (记者 欧阳开宇)“大医博学,厚德济民”——中国中医科学院西苑医院院训。在张大武看来,这句话也是一把升华中柬医
2022-05-25(中国这十年·吾乡)“邂逅雪豹”带热高原小镇
记者 李江宁 摄 " >
2022-05-25“但凡有可能,就去做好它”
西北工业大学网络空间安全学院党总支书记王震—— “但凡有可能,就去做好它”(奋斗者正青春) 在西北工业大学网络空间安全学院,党总支书记王
2022-05-25上海通报嘉定区1例本土无症状感染者排查情况 一地列为中风险地区
中新网5月25日电 据“上海发布”微信公众号消息,5月25日上午举行的上海市疫情防控工作新闻发布会上,上海市卫生健康委副主任赵丹丹介绍,
2022-05-25上海嘉定区公布1例无症状感染者所涉及区域和场所
中新网5月25日电 据“上海发布”微信公众号消息,5月25日上午举行的上海市疫情防控工作新闻发布会上,上海嘉定区副区长王浩介绍:5月24日
2022-05-25X 关闭





X 关闭