下面属于强化学习的是()

A.用户经常阅读军事类和经济类的文章,算法就把和用户读过的文章相类似的文章推荐给你。

B.算法先少量给用户推荐各类文章,用户会选择其感兴趣的文章阅读,这就是对这类文章的一种奖励,算法会根据奖励情况构建用户可能会喜欢的文章的“知识图”。

C.用户每读一篇文章,就给这篇新闻贴上分类标签,例如这篇新闻是军事新闻,下一篇新闻是经济新闻等;算法通过这些分类标签进行学习,获得分类模型;再有新的文章过来的时候,算法通过分类模型就可以给新的文章自动贴上标签了。

D.两个变量之间的关系,一个变量的数量变化由另一个变量的数量变化所惟一确定,则这两个变量之间的关系称为强化学习。

正确答案:B