原文链接:https://mp.weixin.qq.com/s/8PKA8EeWCGWlGLDNeb3ESg
当前人工智能技术在某些领域已经取得了不错的精度,然而几乎在所有任务上,人工智能还相当脆弱。例如,人脸识别虽然在测试集上可达到99.9%以上的精度,但在现实场景中经常会发生误识别;语音识别,在安静环境下识别率可达到97%以上,但在嘈杂环境中识别率会显著下降。
我们不得不接受人工智能系统会犯错误的事实,这个事实短时间内不会改变。一种可行的办法是由人和机器协同工作,大部分工作由机器来完成,出错的时候由人来纠正。这种人机器协同工作的模式不仅可以让机器发挥其效率上的优势,也可以发挥人在处理错误事件上的灵活性和能动性。例如,当自动口语翻译还不成熟时,让人类口译员来帮忙纠错,是一种合理的处理模式。
图1:人机协同工作[1]
人机协同还可以用于模型学习,解决系统的冷启动的问题。什么是冷启动呢?对于特定任务,我们最初是没有实际数据的,因此就没有一个合理工作的模型,也就无法启动任务处理。这时不妨由人承担绝大部分处理工作,产生第一批实际数据,用这些数据训练初始模型并开始介入工作。此时,人的角色可以从任务处理切换为监督和检查,必要时进行纠错。基于这一过程,即可实现从无到有的数据积累,人的压力逐渐减轻,甚至完全交给机器完成。
在上述协同学习过程中,机器还可以更加“主动”一些,它可以通过分析理解哪些数据对自己训练模型最有价值,并把这些数据送给人来进行标注。这一学习方法称为“主动学习(Active Learning)”。因为只有价值最大的数据才会被标注,极大减少了人工标注成本。近日,自然-机器智能杂志发表了一篇论文,用主动学习方法帮助研究者做文献综述,并开源了相关软件[2]。利用该软件,研究者只需输入主题和少量参数,机器就会帮忙在海量文献中筛选合适的文献,交给研究者判断是否合理,并基于研究者给出的反馈修正筛选算法。实验表明,这一主动学习方法可极大提高文献筛选的效率,节约了研究者的宝贵时间。
有学者认为,人机协同也许不只是权宜之计,即便未来人工智能技术有了更高的精度,人机协同也是必要的工作模式。一味追求完美的人工智能不仅不现实,也不是一个价值最优的目标 --人和机器和谐相处,互相取长补短,本身就是件非常有意义的事。
参考文献:
[1]https://hrc2.io/projects/Collaborative-Design
[2]an de Schoot, R., de Bruin, J., Schram, R. et al. An open source machine learning framework for efficient and transparent systematic reviews. Nat Mach Intell 3, 125–133 (2021).