用于生成赛中见解的方法及系统与流程
未命名
10-09
阅读:89
评论:0

技术领域:
:3.本公开总体上涉及用于基于例如赛事数据来生成、评分和向用户呈现赛中见解的系统和方法。
背景技术:
::4.人类分析师基于他们的经验和在赛事之前进行的研究的组合来针对主要体育赛事生成赛中评论和分析。考虑到这项工作的时间敏感性和高度手工性质,容易错过重要或有趣的见解。技术实现要素:5.在一些实施例中,本文公开了一种方法。计算系统接收赛事数据。赛事数据包括赛事的现场报道信息。计算系统访问包括与赛事相关的知识图谱的数据库。知识图谱包括多个节点和多条边。多个节点中的每个节点表示参与赛事的运动员或团队。多条边连接多个节点中的节点。多个边中的每条边表示在赛事中执行的动作。计算系统基于现场报道信息更新知识图谱。计算系统经由第一机器学习模型基于更新的知识图谱生成一个或更多个见解。计算系统经由第二机器学习模型对一个或更多个见解中的每个见解评出分数。计算系统向一个或更多个终端用户呈现一个或更多个见解中的排序最高见解。6.在一些实施例中,本文公开了一种系统。该系统包括处理器和存储器。存储器包括存储在其上的编程指令,编程指令在由处理器执行时使系统执行操作。操作包括接收赛事数据。赛事数据包括赛事的现场报道信息。操作还包括访问包括与赛事相关的知识图谱的数据库。知识图谱包括多个节点和多条边。多个节点中的每个节点表示参与赛事的运动员或团队。多条边连接多个节点中的节点,其中,多条边中的每条边表示在赛事中执行的动作。操作还包括基于现场报道信息更新知识图谱。操作还包括经由第一机器学习模型基于更新的知识图谱生成一个或更多个见解。操作还包括经由第二机器学习模型对一个或更多个见解中的每个见解评出分数。操作还包括向一个或更多个终端用户呈现一个或更多个见解中的排序最高见解。7.在一些实施例中,本文公开了一种非暂时性计算机可读介质。非暂时性计算机可读介质包括一个或更多个指令序列,一个或更多个指令序列在由一个或更多个处理器执行时使计算系统执行操作。操作包括由计算系统接收赛事数据。赛事数据包括赛事的现场报道信息。操作还包括由计算系统访问包括与赛事相关的知识图谱的数据库。知识图谱包括多个节点和多条边。多个节点中的每个节点表示参与赛事的运动员或团队。多条边连接多个节点中的节点,其中,多条边中的每条边表示在赛事中执行的动作。操作还包括由计算系统基于现场报道信息更新知识图谱。操作还包括由计算系统经由第一机器学习模型基于更新的知识图谱生成一个或更多个见解。操作还包括由计算系统经由第二机器学习模型对一个或更多个见解中的每个见解评出分数。操作还包括由计算系统向一个或更多个终端用户呈现一个或更多个见解中的排序最高见解。附图说明8.为了可以详细理解本公开的上述特征的方式,可以参考实施例对本公开(如上文简要总结的)进行更具体描述,本公开的一些实施例在附图中示出。然而,应注意,附图仅说明本公开的典型实施例,因此不应视为限制其范围,因为本公开可允许其他等效实施例。9.图1是示出根据示例实施例的计算环境的框图。10.图2是示出根据示例实施例的示例性知识图谱(knowledgegraph)的框图。11.图3是示出根据示例实施例的生成完全训练的见解生成和评分模型的方法的流程图。12.图4是示出根据示例实施例的生成、评分和向终端用户呈现见解的方法的流程图。13.图5a是示出根据示例实施例的计算设备的框图。14.图5b是示出根据示例实施例的计算设备的框图。15.为了便于理解,在可能的情况下,使用相同的附图标记来表示附图中共有的相同元件。可以预期,在一个实施例中公开的元件可以有利地用于其他实施例而无需具体叙述。具体实施方式16.本文公开的一种或更多种技术总体上涉及一种用于基于现场报道的(play-by-play)赛事数据生成赛中见解(insight)的系统和方法。例如,本文公开的一种或更多种技术涉及一种将来自团队体育赛事的实况比赛统计表和现场报道数据转换成描述性的书面见解并基于这些见解的相关性对这些见解进行排序的方法。本文公开了一种用于在体育赛事期间生成基于文本的见解的概念验证系统。17.如以上所提供的,目前产生赛中见解的方法依赖于通过赛事数据进行的人类分析解析并识别可能相关和/或有趣的那些见解。这种手工过程可能不仅非常耗时,而且可能导致人类分析师错过关键见解。进一步地,人类分析师也可能在现场赛事期间花费其有限的时间和注意力,从而产生公式化的、重复的见解和更深、更有意义的见解的组合,这可能分散人类分析师对实际赛事的注意力。18.基于静态规则生成的见解可以缓解这些问题中的一些问题。生成赛中见解的相同分析师可能会识别出将确定性地触发给定见解的具体实例。例如,当在全国橄榄球联盟(nationalfootballleague,nfl)比赛中跑卫冲刺获得100码、或者在美国职业篮球联赛(nationalbasketballassociation,nba)比赛中运动员得了30分时。用于触发这些见解的逻辑然后可以由数据库管理员或软件工程团队来实现。该过程可以消除分析师在现场赛事期间的一些公式化见解生成工作,并且具有低误报率的优点;然而,它未能解决识别分析师尚未识别的关键见解的问题。19.本系统通过使更多的公式化见解自动化来消除人类分析师的这种负担,并且改进常规的静态的基于规则的方法,从而允许人类分析师完全集中于产生更深入的见解,因此提高了呈现给球迷的分析的整体质量。20.本系统可以在没有人类干预的情况下实现,以产生在没有人类分析师支持的比赛期间直接呈现给球迷的见解。这些见解可能不如人类在主要赛事期间产生的那些见解那样深入,但是尽管如此,与没有任何实况见解相比,这些见解将提供显著价值。21.图1是示出根据示例实施例的计算环境100的框图。计算环境100可以包括:经由网络105通信的跟踪系统102、组织计算系统104以及一个或更多个客户端设备108。22.网络105可以是任何合适的类型,网络105包括经由互联网(诸如,蜂窝或wi-fi网络)的单独连接。在一些实施例中,网络105可以使用直接连接(诸如,射频识别(radiofrequencyidentification,rfid)、近场通信(near-fieldcommunication,nfc)、蓝牙tm、低能量蓝牙tm(low-energybluetooth,ble)、wi-fitm、zigbeetm、环境后向散射通信(ambientbackscattercommunication,abc)协议、通用串行总线(usb)、广域网(wan)或局域网(lan))来连接终端、服务和移动设备。由于所传输的信息可以是私密的或机密的,出于安全考虑可以规定对这些类型的连接中的一个或更多个进行加密或以其他方式进行保护。然而,在一些实施例中,所传输的信息可能不太私密,因此,可以出于便利性而非安全性来选择网络连接。23.网络105可以包括用于交换数据或信息的任何类型的计算机网络布置。例如,网络105可以是互联网、专用数据网络、使用公共网络的虚拟专用网络和/或使得计算环境100中的组件能够在环境100的组件之间发送和接收信息的其他合适的连接。24.跟踪系统102可以被定位在场地106中。例如,场地106可以被配置为举办包括一个或更多个代理112的体育赛事。跟踪系统102可以被配置为记录比赛场地表面上的所有代理(即,运动员)以及一个或更多个其他相关对象(例如,球、裁判员等)的运动。在一些实施例中,跟踪系统102可以是使用例如多个固定相机的基于光学的系统。例如,可以使用具有六个静止的、校准的相机的系统,该系统将运动员和球的三维位置投影到球场的二维俯视图上。在一些实施例中,跟踪系统102可以是使用例如由运动员佩戴或嵌入在待跟踪的对象中的射频识别(radiofrequencyidentification,rfid)标签的基于无线电的系统。一般来说,跟踪系统102可以被配置为以高帧速率(例如,25hz)采样和记录。跟踪系统102可以被配置为针对比赛文件110中的每帧至少存储比赛场地表面上的所有代理和对象的运动员身份和位置信息(例如,(x,y)位置)。例如,跟踪系统102可以被配置为将给定赛事的现场报道数据存储在比赛文件110中。25.比赛文件110可以增加与赛事数据相对应的其他赛事信息,诸如,但不限于:比赛赛事信息(传球、投中、失误(turnover)等)和情境信息(当前分数、剩余时间等)。26.跟踪系统102可以被配置为经由网络105与组织计算系统104通信。组织计算系统104可以被配置为管理和分析由跟踪系统102捕获的数据。组织计算系统104可以至少包括网络(web)客户端应用服务器114、预处理代理116、数据存储118和见解生成引擎120。预处理代理116和见解生成引擎120中的每一个可以包括一个或更多个软件模块。一个或更多个软件模块可以是存储在介质(例如,组织计算系统104的存储器)上的代码或指令的集合,该代码或指令表示实现一个或更多个算法步骤的一系列机器指令(例如,程序代码)。这样的机器指令可以是组织计算系统104的处理器解释以实现指令的实际计算机代码,或者可替代地,可以是被解释以获得实际计算机代码的指令的更高级别的编码。一个或更多个软件模块还可以包括一个或更多个硬件组件。示例算法的一个或更多个方面可由硬件组件(例如,电路)本身执行,而不是作为指令的结果。27.数据存储118可以被配置为用于存储一个或更多个比赛文件124。每个比赛文件124可以包括空间赛事数据和非空间赛事数据。例如,空间赛事数据可以对应于由跟踪系统102从特定比赛或赛事捕获的原始数据。非空间赛事数据可以对应于一个或更多个变量,一个或更多个变量描述在没有相关联的空间信息的情况下的特定匹配中发生的赛事。例如,非空间赛事数据可以表示给定赛事的现场报道数据。在一些实施例中,非空间赛事数据可以从空间赛事数据导出。例如,预处理代理116可以被配置为解析空间赛事数据以导出射门尝试信息。在一些实施例中,非空间赛事数据可以独立于空间赛事数据导出。例如,与组织计算系统相关联的管理员或实体可以分析每个匹配以生成这样的非空间赛事数据。照此,出于该应用的目的,赛事数据可以对应于空间赛事数据和非空间赛事数据。28.在一些实施例中,每个比赛文件124可以进一步包括:在竞赛期间每个时间t的当前分数、进行竞赛的场地、每个团队的名册、每个团队比赛的分钟数、以及与每个团队和每个运动员相关联的统计。29.预处理代理116可以被配置为处理从数据存储118中检索的数据。例如,预处理代理116可以被配置为生成可以用于训练与见解生成引擎120相关联的机器学习算法的一个或更多个信息集。预处理代理116可以扫描存储在数据存储118中的一个或更多个比赛文件中的每个以识别对应于每个指定数据集的一个或更多个统计数据,并相应地生成每个数据集。例如,预处理代理116可以扫描数据存储118中的一个或更多个比赛文件中的每个以识别包含在其中的现场报道数据,并且提取与每个比赛相关联的各种信息。30.见解生成引擎120可以被配置为基于现场报道数据生成实况(或近实况)见解。见解生成引擎120可以包括知识图谱引擎126和机器学习模块128。31.知识图谱引擎126可以被配置为生成由见解生成引擎120所使用的知识结构。例如,知识图谱引擎126可以被配置为构造知识图谱,该知识图谱使用来自现场赛事的现场报道数据流,并维护运动员、团队、教练、场地和组织单位(例如,联盟、分区、赛区等)的最新比赛、赛季和职业统计数据。由知识图谱引擎126生成的知识图谱可以用作由见解生成引擎120生成的见解的“真实源”。在一些实施例中,一个或更多个知识图谱125可以被存储在数据存储118中。32.在一些实施例中,知识图谱引擎126可以基于来自不同比赛文件124的历史现场报道数据生成一个或更多个知识图谱。例如,给定历史比赛文件中的现场报道数据,知识图谱引擎126可以生成知识图谱。这样的知识图谱可以在赛季、职业、十年、团队的一生等过程中被更新。33.通常,对于知识图谱,节点(或实体)可以对应于给定比赛中的名词。例如,节点可以对应于“锡安(zion)”、“杜克大学(duke)”、“杜克大学对战北卡罗来纳大学(大西洋海岸联盟(atlanticcoastconference,acc)总决赛)”、“卢克·梅耶(lukemaye)”、“北卡罗来纳大学(unc)”等。边(或关系)可以对应于给定比赛中的动词。例如,锡安节点和杜克大学节点之间的边可以读取“效力于”。换言之,锡安效力于杜克大学。节点和边可以被配置为存储任意属性或事实。通常,终端用户希望返回的任何事实可以作为属性存储在边或节点上。34.知识图谱引擎126可以基于现场报道或跟踪信息实时地(或近实时地)不断地更新给定的知识图谱。例如,当从现场赛事接收到新比赛时,知识图谱引擎126可以更新与该比赛相关联的所有实体的统计数据并发布受影响的节点和边的列表。35.在一些实施例中,当知识图谱已经被更新时,知识图谱引擎126可以与机器学习模块128对接或通信。例如,知识图谱引擎126可以触发机器学习模块128来执行机器学习过程,该机器学习过程基于对给定知识图谱的最近改变来生成新见解或更新现有见解。在一些实施例中,机器学习模块128可以被配置为实施模板以生成见解。模板可以包括输出文本的确定性定义。在一些实施例中,模板还可以包括对填充见解所需的统计数据的引用。36.在一些实施例中,机器学习模块128可以被配置为识别包括描述性统计的见解。例如,机器学习模块128可以被配置为学习运动员和团队级统计,比赛或团队相对于职业/赛季/联赛是否表现过度/表现不足,等等。使用特定示例,见解可以是rj·巴雷特到目前为止获得了20分,这让他有望创下赛季新高。在另一具体示例中,见解可以是:杜克大学上半场仅有6个篮板球,而他们上半场的平均得分为12。37.在一些实施例中,机器学习模块128可以被配置为识别对应于连胜(例如,连续的x次成功)的见解。例如,机器学习模块128可被配置为识别团队级连胜(例如,得分、失误、篮板球、盖帽、第一次进攻、命中、双(doubles)、进球、助攻等)和运动员级连胜(例如,得分、失误、断球、助攻、篮板球(进攻/防守)、接住球、扑抱(sacks)、命中等)。在一些实施例中,机器学习模块128可被配置为识别对应于进球荒(droughts)(例如,最后t秒内团队得分小于平均值)的见解。在一些实施例中,机器学习模块128可被配置为识别对应于失分(runs)(例如,最后t秒内团队得分小于平均值且其他团队处于进球荒中)的见解。38.在一些实施例中,机器学习模块128可以被配置为识别何时团队是活跃的/冷漠的。例如,机器学习模块128可被配置为识别对应于进攻/防守统计数据的组合在历史上是异常的见解。在另一示例中,机器学习模块128可以被配置为识别对应于对高/低获胜概率有贡献的进攻/防守统计数据的组合的见解。39.一旦生成了见解,机器学习模块128可以被进一步配置为基于见解对球迷的相关或有趣程度来对见解进行排序。在一些实施例中,机器学习模块128可以利用多臂赌博方法(multi-armedbanditapproach)来对见解进行排序。机器学习模块128可被配置为学习哪些见解对球迷来说或多或少有趣,并相应地对这些见解进行排序。在一些实施例中,可以训练机器学习模块128以按照以下两种方式对见解进行排序。然而,本领域技术人员可以认识到,其他训练机制也是可能的。40.第一,机器学习模块128可以被配置为基于发生的可能性来学习如何对见解进行排序。例如,在广播期间提供的见解通常集中在识别低概率赛事。作为极端示例,新记录可以表示在特定情境之前从未发生的赛事,因此根据定义新记录是低概率的。机器学习模块128可被配置为通过将运动员和团队在整个比赛中的表现与历史数据进行比较来学习如何识别这些见解。然后,机器学习模块128可以估计特定赛事发生的概率,并且与那些更常见的赛事相比,将那些“更罕见”的赛事排序的更高。例如,对于每个比赛,机器学习模块128可被配置为生成与统计数据或者一个更极端的概率对应的“p值”。使用该p值,机器学习模块128可以生成最近邻模型,并计算局部离群因子。41.第二,机器学习模块128可以被配置为基于对赛事(或比赛)的影响来学习如何对见解进行排序。例如,体育球迷们感兴趣的另一关键点是知道目前哪些比赛或统计对比赛或赛季的影响最大。通过建立赛中获胜概率和赛季输赢记录的预测模型,机器学习模块128可以能够估计不同统计数据已经对团队的整体表现具有多少影响,并且将更有影响的统计排序的更高。例如,机器学习模块128可通过建立线性获胜概率模块(例如score=coeff*(actualstat-expectedstat))来对团队级见解进行评分。在另一示例中,机器学习模块128可被配置为对运动员级见解进行评分。42.例如,在操作中,机器学习模块128可以使用贝叶斯模型来估计对运动员在比赛中的表现的预期。机器学习模块128可被配置为在整个比赛中连续地更新估计。在一些实施例中,机器学习模块128可以使用先验和后验之间的kullback-leibler距离来生成该见解的分数。在另一示例中,机器学习模块128可以使用随机森林回归器来在比赛中的每个点生成获胜概率,并且寻找获胜概率的大波动(swing),因为这些赛事可能更有趣。在一些实施例中,局部可解释模型-无关解释(localinterpretablemodel-agnosticexplanations,lime)还可以用于将波动归于特定统计数据。在另一示例中,机器学习模块128可应用一个或更多个试探法来确定将寻找非常高或低百分比的统计、某些赛事/统计的长连胜、或超过某一阈值的统计数据的兴趣度。43.客户端设备108可以经由网络105与组织计算系统104通信。客户端设备108可由用户操作。例如,客户端设备108可以是移动设备、平板电脑、台式计算机、或具有本文中描述的能力的任何计算系统。用户可以包括但不限于:诸如与组织计算系统104相关联的实体的订阅者、客户、预期客户或顾客的个人,诸如已经从与组织计算系统104相关联的实体获得产品、服务或咨询的个人,将从与组织计算系统104相关联的实体获得产品、服务或咨询的个人或可以从与组织计算系统104相关联的实体获得产品、服务或咨询的个人。44.客户端设备108可以至少包括应用132。应用132可以表示独立应用或允许访问网站的web浏览器。客户端设备108可访问应用132以访问组织计算系统104的一个或更多个功能。客户端设备108可通过网络105通信,以例如从组织计算系统104的web客户端应用服务器114请求网页。例如,客户端设备108可以被配置为执行应用132以访问由web客户端应用服务器114管理的内容。显示给客户端设备108的内容可从web客户端应用服务器114传输到客户端设备108,并且随后由应用132处理以便通过客户端设备108的图形用户界面(gui)显示。例如,客户端设备108可以访问应用132以查看由见解生成引擎120生成的一个或更多个见解。45.图2是示出根据示例实施例的示例性知识图谱200的框图。如图所示,知识图谱200可包括一个或更多个节点202、204、206、208和210以及一条或更多条边212、214、216、218、220和222。如以上所讨论的,每个节点可以表示给定的名词或实体。例如,节点202可以指锡安;节点204可以指杜克大学;节点206可以指北卡罗来纳大学;节点208可以指杜克大学;节点210可以指杜克大学对战北卡罗来纳大学(acc总决赛)。边212可以从节点202延伸到节点204。例如,边212可以包括存储在其上的信息,该信息对应于锡安效力于杜克大学的事实。边214可以从节点208和节点206延伸。例如,边214可以包括存储在其上的信息,该信息对应于卢克·梅耶效力于北卡罗来纳大学的事实。边216可以从节点202延伸到节点210。例如,边216可以包括存储在其上的信息,该信息对应于锡安参加了杜克大学对战北卡罗来纳大学(acc总决赛)比赛的事实。边218可以从节点204延伸至节点210。例如,边218可包括存储在其上的信息,该信息对应于杜克大学是参加了杜克大学对战北卡罗来纳大学(acc总决赛)比赛的团队的事实。边220可以从节点206延伸至210。例如,边220可以包括存储在其上的信息,该信息对应于北卡罗来纳大学是参加了杜克大学对战北卡罗来纳大学(acc总决赛)比赛的团队的事实。边222可以在节点208与节点210之间延伸。例如,边222可以包括存储在其上的信息,该信息对应于卢克·梅耶参加了在杜克大学对战北卡罗来纳大学(acc总决赛)的事实。46.如本领域技术人员认识到的,在杜克大学对战北卡罗来纳大学acc总决赛之前已经生成了知识图谱200的一些方面。例如,节点202、节点204、节点206和节点208可能在杜克大学对战北卡罗来纳大学acc总决赛之前就已经存在。换言之,在所讨论的比赛之前,知识图谱引擎126可能已经先前地创建了指向锡安的节点202、指向杜克大学的节点204、指向北卡罗来纳大学的节点206和指向卢克·梅耶的节点208。因此,知识图谱引擎126可能已经先前地绘制了节点202与204之间的边212以及节点208与节点206之间的边214。47.当杜克大学和北卡罗来纳大学在acc总决赛宣布为参赛者时,知识图谱引擎126可能已经更新了知识图谱200以包括边216、218、220和222。在比赛过程期间,见解生成引擎120可以接收实时(或近实时)现场报道信息。例如,假定锡安在给定比赛期间打进了两分球,知识图谱引擎126可以更新边216以包括所述信息。换言之,边216可以在整个赛事(例如,实时、近实时、周期性地等)被更新以反映锡安的比赛统计表(即,比赛统计数据)。48.图3是示出根据示例实施例的生成完全训练的见解生成和评分模型的方法300的流程图。方法300可开始于步骤302。49.在步骤302处,见解生成引擎120可以检索多个赛事的赛事数据。例如,见解生成引擎120可以检索跨多个赛季的多个团队的多个比赛的现场报道赛事。现场报道数据可以包括信息,诸如但不限于:关于每次比赛的赛场上的运动员、每次比赛的开始时间(例如,第一节、9分钟;第一节、3分钟、第三次进攻和五码)、每次比赛的结束时间(例如,下半场、12分钟)、每次比赛的持续时间、哪个团队控球、与比赛相关联的比赛统计表统计数据(例如,谁投球、是否投球尝试成功、如果成功(如果有的话)谁助攻、谁翻转球权(turntheballover)、谁导致的失误等)等等。50.在步骤304处,知识图谱引擎126可以基于针对多个赛事检索的赛事数据生成多个知识图谱。例如,知识图谱引擎126可以构建反映赛季子集的赛事的历史知识图谱的储存库。使用具体示例,知识图谱引擎126可以接收来自过去的25年的每个全国大学体育协会(nationalcollegiateathleticassociation,ncaa)一级联赛(division1)男篮比赛的现场报道信息。给定该现场报道数据,知识图谱引擎126可以根据上述方法生成多个知识图谱。51.在步骤306处,机器学习模块128可以被配置为基于知识图谱学习如何生成见解。例如,机器学习模块128可以执行机器学习过程以生成见解模型,该见解模型基于对给定知识图谱的最近改变来学习如何生成新见解或更新现有见解,并相应地对这些见解进行评分。在训练过程期间,机器学习模块128可利用历史知识图谱中的信息子集。例如,预处理代理116可以生成将由机器学习模块128在训练期间实施的多个训练集。52.在一些实施例中,机器学习模块128可以被配置为在学习中如何实施模板以生成见解。模板可以包括输出文本的确定性定义。在一些实施例中,模板还可以包括对填充见解所需的统计数据的引用。53.在一些实施例中,机器学习模块128可以被配置为学习如何识别包括描述性统计的见解。例如,机器学习模块128可以被配置为学习运动员和团队级统计,运动员或团队相对于职业/赛季/联赛是否表现过度/表现不足,等等。在一些实施例中,机器学习模块128可以被配置为学习以识别对应于连胜(例如,连续的x次成功)的见解。例如,机器学习模块128可以被配置为学习以识别团队级连胜(例如,得分、失误、篮板球、盖帽、第一次进攻、命中、双、进球、助攻等)和运动员级连胜(例如,得分、失误、断球、助攻、篮板球(进攻/防守)、接住球、扑抱、命中等)。在一些实施例中,机器学习模块128可被配置为学习以识别对应于进球荒(例如,最后t秒内团队得分小于平均值)的见解。在一些实施例中,机器学习模块128可以被配置为学习以识别对应于投手失分(例如,最后t秒内的团队得分小于平均值且其他团队处于进球荒中)的见解。54.在一些实施例中,机器学习模块128可以被配置为学习以识别何时团队是活跃的/冷漠的。例如,机器学习模块128可被配置为学习以识别对应于进攻/防守统计数据的组合在历史上是异常的见解。在另一示例中,机器学习模块128可以被配置为学习以识别对应于对高/低获胜概率有贡献的进攻/防守统计数据的组合的见解。55.在步骤308处,机器学习模块128可以输出被配置为从知识图谱中识别见解的完全训练的见解模型。56.在步骤310处,机器学习模块128可以被配置为基于知识图谱学习如何对所生成的见解进行评分。一旦生成了见解,机器学习模块128可以被进一步配置为生成评分模型,该评分模型基于见解对球迷的相关或有趣程度来对见解进行排序。例如,机器学习模块128可以被配置为学习哪些见解对球迷来说或多或少有趣,并相应地对这些见解进行排序。在一些实施例中,可以训练机器学习模块128以按照以下两种方式对见解进行排序。然而,本领域技术人员可以认识到,其他训练机制也是可能的。57.第一,机器学习模块128可以被配置为基于发生的可能性来学习如何对见解进行排序。例如,在广播期间提供的见解通常集中在识别低概率赛事。作为极端示例,新记录可以表示在特定情境之前从未发生的赛事,因此根据定义新纪录是低概率的。机器学习模块128可被配置为通过将运动员和团队在整个比赛中的表现与历史数据进行比较来学习如何识别这些见解。然后,机器学习模块128可以学习以估计特定赛事发生的概率,并且与那些更常见的赛事相比,将那些“更罕见”的赛事排序的更高。例如,对于每个比赛,机器学习模块128可被配置为生成与统计阿虎局或者一个或更多个极端的概率对应的“p值”。使用该p值,机器学习模块128可生成最近邻模型,并计算局部离群因子。58.第二,机器学习模块128可以被配置为基于对赛事(或比赛)的影响来学习如何对见解进行排序。例如,体育球迷们感兴趣的另一关键点是知道目前哪些比赛或统计对比赛或赛季的影响最大。通过建立赛中获胜概率和赛季输赢记录的预测模型,机器学习模块128可以能够估计不同统计数据已经对团队的整体表现具有多少影响,并且将更有影响的统计排序的更高。例如,机器学习模块128可通过建立线性获胜概率模块(例如score=coeff*(actualstat-expectedstat))来对团队级见解进行评分。在另一示例中,机器学习模块128可被配置为对运动员级见解进行评分。在步骤312处,机器学习模块128可以输出被配置为对所识别的见解进行评分的完全训练的评分模型。59.图4是示出根据示例实施例的生成、评分和向终端用户呈现见解的方法400的流程图。方法400可以开始于步骤402。60.在步骤402处,见解生成引擎120可以接收给定赛事的赛事数据。赛事数据可以包括现场报道数据。这样的现场报道数据可以包括信息,诸如但不限于:关于每次比赛的赛场上的运动员、每次比赛的开始时间(例如,第一节、9分钟;第一节、3分钟、第三次进攻和五码)、每次比赛的结束时间(例如,下半场、12分钟)、每次比赛的持续时间、哪个团队控球、与比赛相关联的比赛统计表统计数据(例如,谁投球、是否投球尝试成功、如果成功(如果有的话)谁助攻、谁翻转球权、谁导致的失误等)等等。在一些实施例中,可以实时地(或近实时地)接收现场报道数据。在一些实施例中,可以周期性地分批接收现场报道数据。61.在步骤404处,见解生成引擎120可以基于所接收的现场报道数据来更新一个或更多个知识图谱。例如,知识图谱引擎126可以解析现场报道数据,以确定是否将新的边或节点添加到知识图谱。例如,如果新的边或节点要被添加到知识图谱(例如,新的运动员第一次进入比赛),则知识图谱引擎126可以相应地更新对应于该赛事的知识图谱。在另一示例中,知识图谱引擎126可以解析现场报道数据,以确定是否要更新边或节点。继续以上讨论的示例,当锡安记录篮板球时,知识图谱引擎126可以更新在锡安与赛事之间延伸的边以包括这样的篮板球。62.在步骤406处,见解生成引擎120可以基于更新的知识图谱生成一个或更多个见解。例如,使用见解模型,见解生成引擎120基于更新的知识图谱生成一个或更多个见解。在一些实施例中,见解模型可以利用模板来生成见解。模板可以包括输出文本的确定性定义。在一些实施例中,模板还可以包括对填充见解所需的统计数据的引用。63.在一些实施例中,见解可以包括描述性统计。例如,描述性步骤可以包括:运动员和团队级统计、比赛或团队相对于职业/赛季/联赛是否表现过度/表现不足等。在一些实施例中,见解可以包括基于连胜的统计数据,诸如团队级连胜(例如,得分、失误、篮板球、盖帽、第一次进攻、命中、双、进球、助攻等)和运动员级连胜(例如,得分、失误、断球、助攻、篮板球(进攻/防守)、接住球、扑抱、命中等)。在一些实施例中,见解可以包括进球荒信息(例如,最后t内团队得分小于平均值)。在一些实施例中,见解可以包括投手失分信息(例如,最后t秒内团队得分小于平均值并且其他团队处于进球荒中)。在一些实施例中,见解可以包括进攻/防守统计数据的组合在历史上是异常的。在一些实施例中,见解可以包括有助于高/低获胜概率的进攻/防守统计的组合。64.在步骤408处,见解生成引擎120可以对一个或更多个见解进行评分。例如,使用评分模型,见解生成引擎120可以基于例如对球迷来说或多或少有趣的见解来对见解进行评分,并相应地对这些见解进行排序。在一些实施例中,评分模型可以基于发生的可能性对见解进行评分。评分模型可以通过将运动员和团队在整个比赛中的表现与历史数据进行比较来识别这些见解。评分模型可以估计特定赛事发生的概率,并且与那些更常见的赛事相比,将那些“更罕见”的赛事排序的更高。在一些实施例中,评分模型可以基于对赛事(或比赛)的影响来对见解进行排序。65.在步骤410处,见解生成引擎120可以识别排序最高见解。例如,基于先前生成的见解分数,见解生成引擎120可以识别排序最高见解以呈现给用户。66.在步骤412处,见解生成引擎120可以向用户呈现排序最高见解。在一些实施例中,呈现排序最高见解包括经由显示器向广播者提供见解。在一些实施例中,呈现排序最高见解包括提示计算设备显示见解。67.图5a示出了根据示例实施例的计算系统500的系统总线架构。计算系统500可以表示组织计算系统104的至少一部分。计算系统500的一个或更多个组件可以使用总线505彼此电通信。计算系统500可以包括处理单元(cpu或处理器)510和系统总线505,该系统总线505将包括系统存储器515(诸如只读存储器(readonlymemory,rom)520和随机存取存储器(randomaccessmemory,ram)525)的不同系统组件耦接到处理器510。计算系统500可以包括与处理器510直接连接、紧密接近处理器510或者集成为处理器510的一部分的高速存储器的高速缓存。计算系统500可以将数据从存储器515和/或存储设备530复制到高速缓存512,以供处理器510快速访问。以此方式,高速缓存512可提供避免处理器510在等待数据时延迟的性能提升。这些和其他模块可以控制或被配置为控制处理器510以执行不同动作。其他系统存储器515也可用于使用。存储器515可以包括具有不同性能特性的多个不同类型的存储器。处理器510可包括任何通用处理器和硬件模块或软件模块,诸如存储在存储设备530中的服务1532、服务2534和服务3536,硬件模块或软件模块被配置为控制处理器510以及专用处理器,其中软件指令被并入到实际处理器设计中。处理器510本质上可以是完全独立的计算系统,包含多个核或处理器、总线、存储器控制器、高速缓存等。多核处理器可以是对称的或非对称的。68.为了实现与计算系统500的用户交互,输入设备545可以表示任何数量的输入机构,诸如用于语音的麦克风、用于手势或图形输入的触敏屏、键盘、鼠标、运动输入、语音等等。输出设备535(例如,显示器)还可以是本领域技术人员已知的多个输出机构中的一个或更多个。在一些实例中,多模式系统可以使得用户能够提供多种类型的输入来与计算系统500通信。通信接口540通常可以控制和管理用户输入和系统输出。在任何特定硬件布置上操作没有限制,因此当改进的硬件或固件布置被开发时此处的基本特征可以容易地被它们替代。69.存储设备530可以是非暂时性存储器并且可以是硬盘或可以存储可由计算机访问的数据的其他类型的计算机可读介质,诸如磁带盒、闪存卡、固态存储器设备、数字通用盘、盒式磁带、随机存取存储器(ram)525、只读存储器(rom)520、以及其混合。70.存储设备530可以包括用于控制处理器510的服务532、534和536。构想了其他硬件或软件模块。存储设备530可以连接到系统总线505。在一个方面,执行特定功能的硬件模块可以包括与必要硬件组件(诸如处理器510、总线505、输出设备535等)结合的存储在计算机可读介质中以实施功能的软件组件。71.图5b示出了具有芯片组架构的计算机系统550,该芯片组架构可以表示组织计算系统104的至少一部分。计算机系统550可以是可用于实现所公开的技术的计算机硬件、软件和固件的示例。系统550可包括处理器555,其表示能够执行被配置为执行所识别的计算的软件、固件和硬件的任何数量的物理和/或逻辑上不同的资源。处理器555可以与芯片组560通信,芯片组560可以控制到处理器555的输入和来自处理器555的输出。在此示例中,芯片组560将信息输出到输出565(例如显示器等),且可将信息读取和写入到存储设备570,存储设备570可以包含例如磁性介质和固态介质。芯片组560还可以从ram575读取数据和向ram575写入数据。可以提供用于与各种用户接口组件585接合的桥接器580以用于与芯片组560接合。这样的用户接口组件585可以包括键盘、麦克风、触摸检测和处理电路、诸如鼠标之类的定点设备等。一般而言,给系统550的输入可以来自机器生成和/或人类生成的各种源中的任何一种源。72.芯片组560还可以与具有不同物理接口的一个或更多个通信接口590接合。这样的通信接口可以包括用于有线和无线局域网、用于宽带无线网络以及个人局域网的接口。本文公开的用于生成、显示和使用gui的方法的一些应用可包括:通过物理接口接收经排序的数据集,或者由机器本身通过处理器555分析存储在存储设备570或ram575中的数据来生成。进一步地,机器可以通过用户接口组件585从用户接收输入,并通过使用处理器555解释这些输入来执行适当的功能,诸如浏览功能。73.可以认理解,示例系统500和550可以具有多于一个处理器510或是联网在一起以提供更大处理能力的计算设备组或群集的一部分。74.虽然前述内容是针对本文描述的实施例,但是在不背离其基本范围的情况下,可以设计其他和进一步的实施例。例如,本公开的各方面可用硬件或软件或硬件和软件的组合来实现。本文描述的实施例可以实现为与计算机系统一起使用的程序产品。程序产品的程序定义实施例(包括本文描述的方法)的功能,并且可以被包含在各种计算机可读存储介质上。说明性计算机可读存储介质包括但不限于:(i)其上永久地存储信息的非可写存储介质(例如,计算机内的只读存储器(rom)设备,诸如可由cd-rom驱动器读取的cd-rom盘、闪存、rom芯片或任何类型的固态非暂时性存储器);以及(ii)其上存储有可变信息的可写存储介质(例如,硬盘驱动器或磁盘驱动器内的软盘或任何类型的固态随机存取存储器)。当携带指导所公开的实施例的功能的计算机可读指令时,这样的计算机可读存储介质是本公开的实施例。75.本领域技术人员将理解的是,前述示例是示例性的而非限制性的。在阅读说明书和研究附图之后,所有置换、增强、等同物、及其改进对于本领域技术人员而言都是显而易见的,都被包括在本公开的真实精神和范围内。因此,所附权利要求旨在包含落入这些教导的真实精神和范围内的所有这些修改、置换和等同物。当前第1页12当前第1页12
技术特征:
1.一种方法,包括:由计算系统接收包括赛事的现场报道信息的赛事数据;由所述计算系统访问包括与所述赛事相关的知识图谱的数据库,其中,所述知识图谱包括:多个节点,其中,所述多个节点中的每个节点表示参与所述赛事的运动员或团队,以及连接所述多个节点中的节点的多条边,其中,所述多条边中的每条边表示在所述赛事中执行的动作;由所述计算系统基于所述现场报道信息更新所述知识图谱;由所述计算系统经由第一机器学习模型基于所更新的知识图谱生成一个或更多个见解;由所述计算系统经由第二机器学习模型对所述一个或更多个见解中的每个见解评出分数;以及由所述计算系统向一个或更多个终端用户呈现所述一个或更多个见解中的排序最高见解。2.根据权利要求1所述的方法,还包括:由所述计算系统通过以下方式生成所述第一机器学习模型:基于多个历史知识图谱生成多个训练数据集;以及由所述第一机器学习模型经由包括描述性文本的确定性输出的模板基于所述多个历史知识图谱来学习所述一个或更多个见解。3.根据权利要求2所述的方法,其中,由所述第一机器学习模型经由包括所述描述性文本的确定性输出的所述模板基于所述多个历史知识图谱来学习所述一个或更多个见解包括:学习以识别与团队级或比赛级连胜相对应的见解。4.根据权利要求2所述的方法,还包括:由所述计算系统通过以下来生成所述第二机器学习模型:由所述第二机器学习模型通过识别每个见解与其他见解相比的相关性来学习所述一个或更多个见解中的每个见解的分数。5.根据权利要求4所述的方法,其中,由所述第二机器学习模型通过识别每个见解与其他见解相比的相关性来学习所述一个或更多个见解中的每个见解的分数包括:学习以基于特定统计数据发生的可能性来对见解进行评分。6.根据权利要求4所述的方法,其中,由所述第二机器学习模型通过识别每个见解与其他见解相比的相关性来学习所述一个或更多个见解中的每个见解的分数包括:学习以基于特定统计数据对对应赛事的影响来对见解进行评分。7.根据权利要求1所述的方法,其中,由所述计算系统向所述一个或更多个终端用户呈现所述一个或更多个见解的排序最高见解包括:与客户端设备对接,并且提示所述客户端设备在与所述客户端设备相关联的显示器上显示所述排序最高见解。8.一种系统,包括:处理器;以及
存储器,所述存储器上存储有编程指令,所述编程指令在由所述处理器执行时使所述系统执行操作,所述操作包括:接收包括赛事的现场报道信息的赛事数据;访问包括与所述赛事相关的知识图谱的数据库,其中,所述知识图谱包括:多个节点,其中,所述多个节点中的每个节点表示参与所述赛事的运动员或团队,以及连接所述多个节点中的节点的多条边,其中,所述多条边中的每条边表示在所述赛事中执行的动作;基于所述现场报道信息更新所述知识图谱;经由第一机器学习模型基于所更新的知识图谱生成一个或更多个见解;经由第二机器学习模型对所述一个或更多个见解中的每个见解评出分数;以及向一个或更多个终端用户呈现所述一个或更多个见解中的排序最高见解。9.根据权利要求8所述的系统,其中,所述操作还包括:通过以下方式生成所述第一机器学习模型:基于多个历史知识图谱生成多个训练数据集;以及由所述第一机器学习模型经由包括描述性文本的确定性输出的模板基于所述多个历史知识图谱来学习所述一个或更多个见解。10.根据权利要求9所述的系统,其中,由所述第一机器学习模型经由包括所述描述性文本的确定性输出的所述模板基于所述多个历史知识图谱来学习所述一个或更多个见解包括:学习以识别与团队级或比赛级连胜相对应的见解。11.根据权利要求9所述的系统,还包括:通过以下来生成所述第二机器学习模型:由所述第二机器学习模型通过识别每个见解与其他见解相比的相关性来学习所述一个或更多个见解中的每个见解的分数。12.根据权利要求11所述的系统,其中,由所述第二机器学习模型通过识别每个见解与其他见解相比的相关性来学习所述一个或更多个见解中的每个见解的分数包括:学习以基于特定统计数据发生的可能性来对见解进行评分。13.根据权利要求11所述的系统,其中,由所述第二机器学习模型通过识别每个见解与其他见解相比的相关性来学习所述一个或更多个见解中的每个见解的分数包括:学习以基于特定统计数据对对应赛事的影响来对见解进行评分。14.根据权利要求9所述的系统,其中,向所述一个或更多个终端用户呈现所述一个或更多个见解的排序最高见解包括:与客户端设备对接,并且提示所述客户端设备在与所述客户端设备相关联的显示器上显示所述排序最高见解。15.一种非暂时性计算机可读介质,所述非暂时性计算机可读介质包括一个或更多个指令序列,所述一个或更多个指令序列在由一个或更多个处理器执行时使计算系统执行操作,所述操作包括:由所述计算系统接收包括赛事的现场报道信息的赛事数据;由所述计算系统访问包括与所述赛事相关的知识图谱的数据库,其中,所述知识图谱包括:
多个节点,其中,所述多个节点中的每个节点表示参与所述赛事的运动员或团队,以及连接所述多个节点中的节点的多条边,其中,所述多条边中的每条边表示在所述赛事中执行的动作;由所述计算系统基于所述现场报道信息更新所述知识图谱;由所述计算系统经由第一机器学习模型基于所更新的知识图谱生成一个或更多个见解;由所述计算系统经由第二机器学习模型对所述一个或更多个见解中的每个见解评出分数;以及由所述计算系统向一个或更多个终端用户呈现所述一个或更多个见解中的排序最高见解。16.根据权利要求15所述的非暂时性计算机可读介质,还包括:由所述计算系统通过以下方式生成所述第一机器学习模型:基于多个历史知识图谱生成多个训练数据集;以及由所述第一机器学习模型经由包括描述性文本的确定性输出的模板基于所述多个历史知识图谱来学习一个或更多个见解。17.根据权利要求16所述的非暂时性计算机可读介质,其中,由所述第一机器学习模型经由包括所述描述性文本的确定性输出的所述模板基于所述多个历史知识图谱来学习所述一个或更多个见解包括:学习以识别与团队级或比赛级连胜相对应的见解。18.根据权利要求16所述的非暂时性计算机可读介质,还包括:由所述计算系统通过以下来生成所述第二机器学习模型:由所述第二机器学习模型通过识别每个见解与其他见解相比的相关性来学习所述一个或更多个见解中的每个见解的分数。19.根据权利要求18所述的非暂时性计算机可读介质,其中,由所述第二机器学习模型通过识别每个见解与其他见解相比的相关性来学习所述一个或更多个见解中的每个见解的分数包括:学习以基于特定统计数据发生的可能性来对见解进行评分。20.根据权利要求18所述的非暂时性计算机可读介质,其中,由所述第二机器学习模型通过识别每个见解与其他见解相比的相关性来学习所述一个或更多个见解中的每个见解的分数包括:学习以基于特定统计数据对对应赛事的影响来对见解打进行评分。
技术总结
计算系统接收包括赛事的现场报道信息的赛事数据。计算系统访问包括与赛事相关的知识图谱的数据库。知识图谱包括多个节点和多条边。多个节点中的每个节点表示参与赛事的运动员或团队。多条边连接多个节点中的节点。计算系统基于现场报道信息更新知识图谱。计算系统经由第一机器学习模型基于更新的知识图谱生成一个或更多个见解。计算系统经由第二机器学习模型对一个或更多个见解中的每个见解评出分数。计算系统向一个或更多个终端用户呈现一个或更多个见解中的排序最高见解。个或更多个见解中的排序最高见解。个或更多个见解中的排序最高见解。
技术研发人员:尼古拉斯
受保护的技术使用者:斯塔特斯公司
技术研发日:2022.03.03
技术公布日:2023/10/7
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/