三、传统数据标注亟待升级
值得注意的是,在如今火爆的大模型训练浪潮中,传统的数据标注需求,很可能是下降的。
让ChatGPT更具有"人味"的关键——强人工反馈RLHF,带来的是另一种更高要求的数据标注需求。
相关分析显示,在RLHF环节,模型首先在大数据集上进行预训练,再与专业的人工智能训练师进行交互,专业的标注人员会对ChatGPT生成的回答进行标注、评估和反馈,给出一个针对回答的分数或者标签。
这些标注数据可以作为强化学习过程中的"奖励函数"来指导ChatGPT的参数调整,最终帮助模型进行强化学习和不断优化。
也就是说,让ChatGPT"更具人味儿"的精妙之处很可能就在于——它可以利用人工标注的反馈结果不断优化自身模型,实现更合乎人类思维逻辑的表达。
但传统数据标注模式很难满足RLHF的需求。
在过去,数据标注公司的主流商业模式以销售工具系统和标注服务为主。一方面,缺少自有数据很少有出售精准数据集的服务。另一方面,人才升级作为一个系统工程,对数据标注公司的考验更高。
在完成这一步后,RLHF训练还涉及到不少事实判断和价值判断。其中,价值判断涉及到公认的"公序良俗",理论上是更容易拉齐AI认知的部分,事实判断则涉及各行业Know-How。
这往往需要行业专业人.........
当前,大模型正处在产业落地前期,高质量的数据,是大模型实现产业化的关键要素。 最近,一项来自Epoch AI Research团队的研究抛出了一个残酷的事实:模型还要…
原文转载:https://www.kjdsnews.com/a/1601907.html
中国疫情:https://www.ikjzd.com/search?keyword=中国疫情
中国银联:https://www.ikjzd.com/search?keyword=中国银联
中国银行金融市场外汇牌价:https://www.ikjzd.com/search?keyword=中国银行金融市场外汇牌价
中国银行卡开户:https://www.ikjzd.com/search?keyword=中国银行卡开户
中国邮政国内小包:https://www.ikjzd.com/search?keyword=中国邮政国内小包
中国邮政海外仓:https://www.ikjzd.com/search?keyword=中国邮政海外仓
被爆财务丑闻,德国支付巨头Wirecard申请破产,P卡无影响! -跨境知道:https://tools.ikjzd.com/articles/124461.html
亚马逊公告:卖家退货退款工作流程的更新-跨境知道:https://tools.ikjzd.com/articles/130007.html
卡塔尔世界杯:https://tools.ikjzd.com/t/1594588656350093312.html
小红书关停自营电商业务 :https://www.kjdsnews.com/a/1601906.html
AI大模型数据争夺战 :https://www.kjdsnews.com/a/1601907.html
没有评论:
发表评论