楼主:
LCamel (LCamel)
2017-08-10 09:46:56DeepMind and Blizzard open StarCraft II as an AI research environment
Wednesday, 9 August 2017 (缩 https://goo.gl/KSfFFa )
DeepMind (世界最强围棋 AI 那家) 和 Blizzard 共同发表新的 AI 开发环境,
"SC2LE" , 其中包括了:
* A Machine Learning API developed by Blizzard that gives researchers
and developers hooks into the game. This includes the release of tools
for Linux for the first time.
Blizzard 公开一套给机器学习用的接口
https://github.com/Blizzard/s2client-proto
The StarCraft II API is an interface that provides full external control
of StarCraft II.
可以让外部程控 SC2.
This API exposes functionality for developing software for:
这套接口可以用来开发:
* Scripted bots. 写死规则的传统 bot
* Machine-learning based bots. 机器学习的 bot
* Replay analysis. 分析 replay 录影 (才知道高手怎么玩)
* Tool assisted human play. 人玩, 同时工具在旁协助 (这没问题吗?)
The API is available in the retail Windows and Mac clients.
There are also Linux clients available at the download links below.
零售版的 Windows / Mac 星海可用. Linux 也有.
* A dataset of anonymised game replays, which will increase from 65k
to more than half a million in the coming weeks.
将陆续公开超过 50 万场 replay 来让大家有得学.
* An open source version of DeepMind’s toolset, PySC2,
to allow researchers to easily use Blizzard’s feature-layer API
with their agents.
https://github.com/deepmind/pysc2
"... It exposes Blizzard Entertainment's StarCraft II
Machine Learning API as a Python RL Environment."
把上述接口包成 python 语言可以用的强化学习环境.
* A series of simple RL mini-games to allow researchers to test
the performance of agents on specific tasks.
一些让研究者可测试的小任务.
采矿采矿 生兵生兵
https://www.youtube.com/watch?v=6L448yg0Sm0
* A joint paper that outlines the environment, and reports initial
baseline results on the mini-games, supervised learning from replays,
and the full 1v1 ladder game against the built-in AI.
https://deepmind.com/documents/110/sc2le.pdf
一篇两家公司共同发表的目前成果, 作为大家开始的起点.
影片中右边的训练成果看起来还有模有样的呢:
https://www.youtube.com/watch?v=WEOzide5XFc
LCamel
作者:
kira925 (1 2 3 4 疾风炭)
2017-08-10 09:48:00为什么要在矿区盖BS...XD
AI常常会下出与自身常识不符合的动作万一这样采矿效率比较高呢XDDD
作者:
EGsux (天龙人)
2017-08-10 09:56:00那个只是在训练里的动作 不是在对战
作者:
kira925 (1 2 3 4 疾风炭)
2017-08-10 10:12:00是可以理解对T来说可以偷一咪咪的来回时间拉但是卡到的时间成本大概没被计入...
作者:
kira925 (1 2 3 4 疾风炭)
2017-08-10 10:26:00有趣的是 为什么现在都只看到人族?
作者:
lather (煞气ㄟ溺水)
2017-08-10 10:58:00因为t可以多线投到你崩溃
作者:
teren (blank)
2017-08-10 11:17:00因为AI认证的TIMBA
作者:
APM99 (血统纯正台北人)
2017-08-10 11:22:00影片中的AI是学了50万场青铜组的录像吗 ...
作者:
win4104 (BB)
2017-08-10 11:25:00因为这个AI不像我们有十几年的游戏经验他没有一般玩家的游戏直觉吧
可能是DeepMind没买序号,只能玩免费的XDDD
作者: luckhunter (大番薯) 2017-08-10 11:41:00
因为人类的操作空间在AI下可以无限大
作者:
kira925 (1 2 3 4 疾风炭)
2017-08-10 11:47:00那个AI只有采矿一个任务
Tool assisted human play应该意思是用工具辅助达成 人类理论上可以办到的完美play就像是Tool assisted speedrun (TAS) 也都是人玩的但实际上根本玩不出来 XD
作者:
gmoz ( This can't do that. )
2017-08-10 11:59:00API也出了XD
作者:
eggli (eggli)
2017-08-10 12:00:00作者:
gmoz ( This can't do that. )
2017-08-10 12:02:00借转八卦?
作者:
eggli (eggli)
2017-08-10 12:03:00贴个[天网]tag (误
作者:
positMIT (MarineQueen)
2017-08-10 12:50:00push!
作者:
positMIT (MarineQueen)
2017-08-10 13:17:00untrained AI----->trained AI----->>innovation
这些工具可以让一般人做出什么呢? 类似可以在自订开游戏然后让AI自己操控电脑打吗?
作者:
kira925 (1 2 3 4 疾风炭)
2017-08-10 13:38:00给想要玩AI开发的人可以玩
作者:
win4104 (BB)
2017-08-10 14:37:00我讲的直觉是GameSence 也是透过游戏经验的累积透过参考过往的经验来分析 这点应该跟AI的学习是一致的
作者:
kira925 (1 2 3 4 疾风炭)
2017-08-10 14:57:00确实是一致的 训练AI的时候会有个模拟奖赏的机制鼓励AI的类神经网络权值矩阵 只是RTS因为战争迷雾让他变复杂
Bug report:Shu Dong Huang
作者:
tasin (Ringo)
2017-08-10 15:29:00快赢得时候砸AI矿螺 它会学起来吗
作者: gouran (群争) 2017-08-10 16:23:00
太阳拳!!!
作者:
JokerRF (RF)
2017-08-10 18:05:00AI:干死黄旭东
作者:
Pony5566 (Luna Akbar)
2017-08-10 19:08:00AI不知道会不会受到四川神祕力量影响
作者:
kane111 (kane)
2017-08-10 20:13:00星海操作的影响程度太大,不知道最后怎么样评断训练的结果
作者:
Timba (踢音霸)
2017-08-10 22:34:00狂!!!!! 他会不会模仿对手阿???输了时候 都被丢矿螺 赢的时候会不会也学起来??
作者: vul3kuo (Glory) 2017-08-10 22:45:00
期待看到像围棋那样 出现颠覆常理的玩法
作者:
shentis (夜寅)
2017-08-10 23:24:00说不定后面知道自己快赢了,一堆工兵跑到对手家喷漆XD
可能会来比个 执政官 阿法狗:可以投降了 玩家:我不要阿法狗默默的放推
作者: h311013 2017-08-11 01:29:00
大卫精一调整 AI武功尽失 XD
作者:
jyunwei (jyunwei)
2017-08-11 11:40:00操作除了分钟操作数以外会不会点错也是影响
作者:
gmoz ( This can't do that. )
2017-08-11 12:54:00理论上不会点错
作者:
banmi (数学小天兵)
2017-08-11 15:31:00照这样发展下去,不知道有没有一天会出现天网??
作者:
kira925 (1 2 3 4 疾风炭)
2017-08-11 16:48:00AI是不会点错的阿....
作者:
oldTim (TIME WILL TELL)
2017-08-11 21:00:00这篇可以让围棋界那些瞧不起星海的人闭嘴了论文上Deepmind试了各种不同的深度学习架构,结果根本没用只有在某些mini-game里面才能训练出职业等级的操作要打full game还打不过暴雪内建AI,看来Deepmind没办法了所以开源来请大家集思广益。