腾讯研发全新框架:用AI打,让DeepSeek学会战略性思考
来源:24直播网
发布时间:2025-10-05 15:06:28

电竞资讯10月05日称 据 decoder 今天报道,腾讯研究人员最近用《王者荣耀》游戏作为训练平台,探索如何让 AI 在游戏中学会“战略性思考”,研究全新 TiG(Think in Games)框架,相关成果已发表于 Hugging Face 网站和 arXiv 平台。

研究团队指出,目前的 AI 模型存在明显的功能鸿沟,以游戏为取向的 AI 能正常游玩但无法理解自己所做的决策,而语言模型虽然可以推理策略,但很难真正执行操作,为此他们研发了全新 TiG 框架,让模型在游戏中同步思考、行动。
团队选择以《王者荣耀》游戏作为训练范本,先使用匿名且标准化的赛事数据定义推上路、击杀暴君、守家等 40 种宏观行动,胜负回数均衡,AI 模型们必须要在每个定义好的场景下选择最佳策略,并解释其战略缘由。
具体来说,训练分为两个阶段,首先是在监督中学习,弄清楚这些策略的基本机制;随后通过奖励机制进行强化学习,如果行动正确能得 1 分,错误行动则得 0 分。
随后团队测试了多种语言模型,涵盖 Qwen2.5(7B、14B、32B)、Qwen3-14B 模型,并使用 DeepSeek-R1 大模型作为对照组;先从 DeepSeek-R1 提炼高质量训练数据,然后使用群体相对策略优化(GRPO)技术,比较不同策略之间的优劣。
最终经过 TiG 框架训练的模型不仅能制定行动计划,还能解释原因,例如 AI 会指出某个防御塔防守薄弱,是理想的进攻目标,但需要注意埋伏的敌人。模型训练后仍保持原有的文本理解、数学推理与问答能力。
相关阅读
最新录像
01月13日U23亚洲杯小组赛A组约旦U23vs吉尔吉斯斯坦U23全场录像
01-13
01月12日西甲第19轮莱万特vs西班牙人全场录像
01-11
01月11日西甲第19轮瓦伦西亚vs埃尔切全场录像
01-11
01月11日意甲第20轮亚特兰大vs都灵全场录像
01-11
01月11日U23亚洲杯小组赛B组叙利亚U23vs卡塔尔U23全场录像
01-11
01月11日德甲第16轮柏林联合vs美因茨全场录像
01-10
01月11日德甲第16轮弗赖堡vs汉堡全场录像
01-10
01月10日WCBA常规赛福建女篮厦门女篮全场录像
01-10
01月10日德甲第16轮法兰克福vs多特蒙德全场录像
01-10
01月10日U23亚洲杯小组赛A组约旦U23vs沙特U23全场录像
01-10
最新集锦
足总杯利物浦41巴恩斯利进32强索博世界波+失误送礼维尔茨传射
01-13
意甲科隆博破门弗伦德鲁普建功热那亚30完胜卡利亚里
01-13
老鹰轻取勇士迎3连胜约翰逊23+11+6CJ首秀12分库里31+5
01-12
猛龙加时险胜76人巴恩斯31+6+7&罚球绝杀马克西38+4+5
01-12
魔术逆转鹈鹕班凯罗23+7+8锡安22分普尔21分
01-12
青岛击败吉林段昂君17分赵嘉义15分曾繁日5中0
01-11
广东30分终结辽宁3连胜奎因&萨姆纳合轰57分辽宁三分24中3
01-11
黄蜂最多领先57分但最终胜爵士55分科迪威60创纪录
01-11
快船19分逆转残阵活塞!小卡26+8哈登19分&20中4科林斯25+7
01-11
西甲迪安加纳破门佩佩鲁点射绝平瓦伦西亚11埃尔切
01-11
热词推荐
热门TAG
-
中日德兰
FC大阪
神话
完毕
削弱
基多大学体育
诋毁
天宫
DSV萊奧本
华盛顿联
伊姆斯特
幻想
停止
迪欧斯捷尔
家乡
国歌
带动
请愿
南非
扣除
沮丧
月中
无意
逻辑
德青聯H
亚冠联赛视频直播
76人VS猛龙直播
98直播
普雷斯顿莱恩VS南墨尔本直播
CETV-1
直播吧录像
中央4台在线直播观看高清
河北卫视在线直播
阿奎拉尼
卫视直播在线观看
黄蜂VS国王直播
阿拉维斯VS西班牙人直播
巴黎对摩纳哥直播
178直播高清免费足球直播
亚冠精英赛视频直播
中国女排联赛直播在线观看
nba98八度免费观看
cba辽篮今晚比赛直播
勇士直播在线直播观看
nba直播免费观看直播在线泡泡
尤文图斯对曼城直播
布莱克本对利兹联直播
2025张伟丽今天比赛直播
欧罗巴杯直播足球在线观看
蜘蛛直播nba免费