物流及供应链多元技术研发中心 > 网志
网志
存档
2023
《学过、无学过、不用学、学一半》- 第三章
2023年05月02日

有一个出名的理论,它影响了多个不同的领域,包括社会科学、经济学、生物学、及计算机科学等,它能够推断出在没有完整信息的情况下,人类的理性选择,这个理论的名字是博弈论。在它的模型内,所有人都是自私的,即都会试图使其所获得的回报达到最大化。就如在博弈论的经典故事 - 囚徒困境中,两个囚徒都会选择招认,因为通过这个选择,每一位囚徒都可以获得个别最大的回报。有趣的是,如果他们能够互相合作,并都拥有完整信息,他们便有可能改为选择一个使他们的共同利益得到最大化的选项,即都保持沉默。

在现实世界中,德州扑克是一个经典的不完整信息游戏,玩家各有2张底牌,底牌信息是隐藏的,即玩家不知道对手的底牌是好牌或坏牌。玩家可以采取各种策略来胜出比赛,例如虚张声势,即手上其实没有强牌,但却作出巨额下注,装出志在必得的行为。有人试过用深度学习来建构有关的人工智能模型。但因为可能性太多的关系,效果只是一般。

后来,有一个名为Libratus的人工智能软件出现了,它在一场比赛中连赢4位人类德州扑克顶尖高手,并取得20万美元的奖金。根据赛后的统计,在整个比赛中,人类选手甚至从未领先过。与其他人工智能相比,Libratus并没有使用任何机器学习。它主要是根据博弈论,计算出概率分布,通过与对手进行各场大战,使自己的回报最大化,最终获得胜利。

在一般情况下,我们人类所得到的信息都是不完整的,就如扑克一样,我们都不知道对手的底牌是好还是差,因此在使用机器学习来帮助决策时,往往会遇到一定的困难。尽管如此,在处理一些实际问题时,却也不一定可以单纯用建基于博弈论来生成的人工智能来把事情办好,如果可以同时加上机器学习,在两款人工智能互补不足的建构下,效果可能会更好。

LSCM – David Chung