9月27日举行的2017全国首届兵棋推演大赛上,由自动化所研制的人工智能程序“CASIA-先知V1.0”在“赛诸葛”兵棋推演人机大战中与全国决赛阶段军队个人赛4强和地方个人赛4强的8名选手激烈交锋,以7:1的战绩大胜人类选手,展示了人工智能技术在博弈对抗领域的强大实力。
此次兵棋推演大赛是经由中国科协批准、中国指挥与控制学会组织主办的“全国兵棋推演大赛系列活动”之一,旨在推动信息化时代新型指挥与控制系统及技术的普及,促进人工智能技术在军事指挥控制系统的应用,提升全国兵棋推演的规范化、普及化、科学化水平,助力我国国防教育活动的蓬勃开展。全国分十一个分赛区共计5000名选手参加,每个赛区分军队组和地方组,每一组又分为编队赛和个人赛,经过分赛区预选赛、淘汰赛、晋级赛、决赛和全国大赛阶段的多轮淘汰赛,比赛场次15000余场,产生了军队和个人赛4强选手。
此次“赛诸葛”兵棋推演人机大战采用连级规模城镇居民地遭遇战的对抗想定,人工智能程序和人类选手在完全相同的场景和对等条件下进行指挥对抗。人工智能程序“CASIA-先知V1.0”同时分别对战军队和地方个人赛4强选手,结果以7:1击败了人类顶级选手。相比人类选手,人工智能程序能更加快速准确地进行态势判断和策略决策,很少犯低级错误,因而能够战胜经验丰富的人类高手。
近几年,以深度学习、强化学习为代表的数据驱动型人工智能理论和技术已经在大数据驱动下的非军事博弈对抗领域获得成功,如2016-2017年谷歌公司的AlphaGo程序击败世界围棋顶级选手,2017年加拿大阿尔伯特大学开发的DeepStack和美国卡内基梅隆大学开发的人工智能系统Libratus在德州扑克中击败人类顶级玩家,2017年OpenAI公司的人工智能程序在Dota2游戏中击败人类顶级玩家。但这些技术在军事博弈对抗中需要解决的一个主要问题是小样本学习训练的问题。中国科学院自动化研究所研制的人工智能程序“CASIA-先知V1.0”采用知识和数据混合驱动的体系架构,构建了人工智能指挥员模型。目前在态势感知和作战决策的主要模块上采用知识规则+不确定推理的方式,第一步实现了知识驱动的人机对抗和机机对抗系统。通过机机对抗系统可以实现对抗数据收集整理,为下一步知识和数据混合驱动的博弈推理学习训练奠定了实验基础。
博弈对抗问题广泛存在于军事、商业、安防、灾害应急等领域,是大到影响国家战略,小到决定有限资源下的个人竞争。博弈对抗技术已经成为许多领域的标准分析工具之一,在金融学、证券学、生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。但这些理论在兵棋对抗中需要解决的一个主要问题是不完全信息态势感知的问题。自动化所研制的人工智能程序“CASIA-先知V1.0”聚焦不完全信息态势感知和群体博弈策略优化的关键技术问题,提出新型自动敌情分析和时空综合态势分析的有效方法;构造了方案构想、方案推演、方案评估、方案确定的群体博弈策略优化模型,发展了基于不完全信息态势估计的不确定决策推理技术。这种技术将大大提高博弈对抗的收益和效能,在具有不完全信息的重要博弈对抗应用领域具有重大应用前景。
人工智能程序“CASIA-先知V1.0”获得了科技创新特区创新项目的支持,以军民融合的国家战略为背景,将自动化所的前沿基础理论成果与国家未来指挥控制的重大需求相结合,积极推动智能技术在博弈对抗领域的应用,使我国在博弈对抗领域保持与世界先进水平同步。“CASIA-先知V1.0”在“赛诸葛”兵棋推演人机大战中大胜人类选手,显示了自动化所在人工智能领域的深厚底蕴和在博弈对抗智能理论与技术研发上的初步成效。未来将面向更加复杂多变的对抗场景研究态势理解、策略决策和学习能力更强的人工智能技术。