学习型AI智能体之所以脱颖而出,是因为它们能够根据自己的经验进行调整和改进。与仅基于预编程规则或模型运行的静态 AI智能体不同,学习型智能体可以改进其行为和策略。由于这种学习元素,它们最常用于不断变化的环境中。
金融行业的欺诈检测系统通过不断收集数据然后进行调整以更有效地识别欺诈模式来运行。由于诈骗者总是在改变他们的策略,欺诈检测的AI智能体也需要不断适应。这类AI智能体便是学习型智能体的典型。它们可以依据经验和不断变化的数据来做出预判,不断学习。
网易云音乐或爱奇艺等平台会使用配备学习型AI智能体的系统来改进他们对音乐、电影、节目和产品的推荐。
即使您的个人资料显示您应该喜欢恐怖片和惊悚片,但如果您突然转向浪漫喜剧,那么系统也会给您做出相关的推荐。这样的智能体就像我们一样,它也一直在学习。
语音识别软件是学习型AI智能体的典范。类似讯飞、Siri等应用程序利用学习型AI智能体来更好地理解与他们交谈的对象,有时甚至是含糊不清的表达,它们也会多次求证逐渐学习语义,进行明确地语音识别。
正是由于学习型AI智能体的存在,这些系统才能更好地理解口音和俚语——因此我们可以问 Siri 这样的问题:“噢,Siri,你能帮我找最近的炸鱼薯条店吃晚饭吗?我饿坏了!”
即使是智能恒温器也能从用户行为中学习,例如用户何时在家或外出,以及他们喜欢的温度。这些信息可能一直在变化,因此恒温器必须能够随着时间的推移进行调整——这使它们成为学习型AI智能体的另一个例子。
学习型AI智能体有时也以竞争者的姿态出现,比如与围棋大师对弈的AlphaGo。它早期基于大量人类专业器具进行监督学习,以掌握为其的基本策略和技巧,后期通过与自己进行对弈来不断优化决策能力来增强学。最终基于深度神经网络进行“价值网络”和“策略网络”的训练,来评估棋局局面和下一步落子的位置。这都是学习型AI智能体在当今如此受欢迎并表现优异的重要原因。
相关新闻推荐