Les données ont changé la donne

9 décembre 2014 Non Par SoTennis

©IBM

Au tennis les statistiques sont présentes partout. Pour les collecter, les analyser et les partager, ce sport peut compter sur un acteur incontournable, IBM, qui est le principal partenaire technologique des tournois du Grand Chelem depuis près de 30 ans, et qui met son savoir-faire, au service de ces Majeurs. Claire Herrenschmidt, responsable des partenariats sportifs chez IBM France, évoque pour So Tennis la présence du Big Data, sur le circuit professionnel, ainsi que les innovations technologiques qui ont changé la donne, sur et en dehors du court.

Le Big Data  occupe une place de plus en plus importante dans le sport et en particulier dans le tennis, mais comment le définiriez-vous?
Le terme de « Big data » peut être défini comme la possibilité de traiter un important volume de données structurées, et non structurées, émanant par exemple d’objets connectés. L’analyse de ces données est d’autant plus intéressante lorsqu’elle est effectuée en temps réel, ce qui est très souvent le cas en sport, et en particulier dans le tennis et à Roland-Garros dans le cadre du partenariat entre le tournoi du Grand Chelem et IBM. Le « Big Data » ne peut être dissocié de l’analytique, car avoir des données dont la valeur ne peut être traitée, cela manque d’intérêt.

Depuis près de 30 ans IBM est le principal partenaire technologique du tennis. Aujourd’hui comment les données émanant d’un match sont-elles collectées, analysées et partagées en temps réel ?
Sur la partie collecte des données, la vitesse de service est enregistrée à l’aide d’un radar placé au bord du court. Certaines données sont collectées manuellement avec l’aide des marqueurs qui sont placés en tribunes, afin d’enregistrer toutes les informations émanant des matches, comme les points joués, les coups réalisés… Ce qui a énormément évolué ces derniers temps, c’est l’analyse de ces données, notamment grâce aux outils d’analyse prédictive et à l’accumulation des données sur plusieurs années, permettant de venir enrichir la description des performances d’un joueur, en utilisant toutes les statistiques des matches antérieurs. Tout cela peut être réalisable grâce à l’infrastructure mise en place par IBM qui permet un traitement et une diffusion en temps réel de ces statistiques mais également des scores et résultats, que ce soit sur les sites Internet des tournois du Grand Chelem, de leurs applications mobiles ou à la télévision .

«Tout se fait en temps réel, et dans le domaine du sport en particulier, c’est une clé essentielle de la réussite, et de la pertinence»

Depuis 2012 les solutions d’analyses prédictives d’IBM, proposent les clés du match, véritable tableau de bord de la victoire. Sur quelles données vous appuyez-vous pour proposer un tel résultat ?
Ces outils d’analyse prédictive sont capables de comparer tous les matches joués entre deux joueurs, pour déterminer les fameuses clés du match, qui sont les trois critères clés qu’un joueur doit atteindre pour optimiser ses chances de gagner, face à son adversaire du jour. Ces critères sont choisis par le système, car ils s’appuient sur l’antériorité des matches du joueur qui l’ont mené à la victoire. Tout se fait en temps réel, et dans le domaine du sport en particulier, c’est une clé essentielle de la réussite, et de la pertinence. Tout ceci peut être réalisable via la puissance du réseau mis en place par IBM, et grâce à la puissance du cloud, afin de diffuser tous les résultats, en particulier sur les sites Internet des tournois du Grand Chelem, qui sont hébergés sur un cloud privé, compsé de trois datacenters basés aux États-Unis. Ces machines sont dimensionnées afin de gérer le nombre d’accès et le nombre de connexions, pour consulter ces sites Internet et leurs contenus dans des conditions optimales.

Ces données servent-elles également au moment d’un match à enjeux à anticiper les pics de connexions sur les sites Internet de ces tournois et leurs applications mobiles?
Dans le domaine du sport il y a des pics de demande, avec des fluctuations de trafic selon l’actualité sportive, en particulier lorsque les cadors du circuit WTA et ATP jouent. Cette anticipation peut être réalisée en analysant la programmation des matches, mais aussi la réputation sur les réseaux sociaux des joueurs jouant le jour J. Par exemple, lorsque des joueurs sont particulièrement populaires comme le sont les principales têtes de série d’un tournoi, lorsqu’ils jouent, c’est un fait, une augmentation significative du trafic sur le site Internet du tournoi est observée. Tout ceci est déduit désormais par le système. Cet usage du Big Data et de l’analytique est très intéressant, puisqu’il permet de provisionner le cloud et les ressources nécessaires, afin que le site officiel puisse transmettre les résultats, les contenus… et les diffuser et les afficher en temps réel. En période de tournoi à Roland-Garros par exemple, nous pouvons observer des pics de connexions jusqu’à 1500 pages consultées par seconde. De ce fait, il est primordial d’avoir l’infrastructure pour tenir ces charges. Pour anticiper l’infrastructure nécessaire, l’utilisation de l’analytique est requise, d’où le lien très fort entre ce dernier et le cloud, pour devancer ce trafic dans les datacenters et garantir une performance optimale du site.

L’un des ambassadeurs d’IBM France n’est autre que Sébastien Grosjean qui est co-entraîneur de Richard Gasquet. Vous demande-t-il des données spécifiques dans le cadre de ses fonctions d’entraîneur?
Sébastien Grosjean analyse de près tout ce qui est fourni par le site Internet officiel d’un tournoi du Grand Chelem, et en particulier celui de Roland-Garros, mais il n’a jusqu’à présent pas émis de demande particulière. Ce qui est certain, c’est que ces statistiques lui servent avant et après un match, autant pour ses fonctions d’entraîneur, que pour celles de consultant (ndlr : pour beIN SPORTS).

«Le Social Leaderboard présent sur les sites Internet officiels des tournois du Grand Chelem, permet aux internautes d’avoir accès à des informations quantitatives et qualitatives»

Analyse des médias sociaux Roland-Garros 2014 ©SoTennis

Lors de la dernière édition de l’US Open, une infographie mettant en exergue différentes statistiques des matches en Grand Chelem cette année de Serena Williams a été publiée. Comptez-vous en publier régulièrement lors de ces tournois ?
Effectivement l’équipe d’IBM (ndlr : USA) en charge de ce tournoi, est particulièrement active sur ce point là. Il est possible de retrouver toutes ces infographies sur le blog www.ibm.com/sports. Durant la dernière édition de Roland-Garros, nous avons également publié ce genre d’infographie. Quelques jours après la fin du tournoi, une infographie sous forme de « synthèse » avait été proposée, reprenant les principales informations concernant ce tournoi notamment sur les réseaux sociaux, et les statistiques du site Internet officiel. Ce principe devrait être accentué lors de l’édition 2015 de Roland-Garros.

Les réseaux sociaux ont une place exponentielle, notamment lors des tournois du Grand Chelem. Les commentaires des fans sur ces réseaux sociaux sont-ils également analysés?
Durant l’édition 2014 de Roland-Garros, deux types d’analyses ont été menées. Pour la première fois nous avons proposé le Social Leaderboard, qui était présent sur le site Internet officiel du tournoi, et dont l’utilisation permettait aux internautes d’avoir accès à des informations quantitatives et qualitatives. Comme le nombre de tweets mentionnant Rafael Nadal sur 24 heures, ou depuis le début de la quinzaine. Un classement était d’ailleurs proposé, afin de comparer les joueurs les plus populaires sur twitter. L’outil d’analyse des médias sociaux permet de déterminer le sentiment exprimé dans un tweet et de proposer le pourcentage de tweets positifs concernant un joueur. Une analyse plus poussée a également permis de mettre en exergue la perception et les commentaires concernant le tournoi, et émanant des réseaux sociaux et blogs.

En 2015, IBM fêtera ses 30 ans de partenariat technologique avec le tournoi de Roland-Garros, le Big Data tiendra-t-il une place particulière lors de cette édition ?
Le Big Data en fera partie tout comme l’analytique, le cloud, la sécurité, et les réseaux sociaux. Ces sujets stratégiques pour IBM sont illustrés régulièrement au moment de Roland-Garros, et le Big Data est un thème important, et il le sera de nouveau en 2015. Nous travaillons actuellement sur cet événement, et il est encore un peu tôt pour évoquer tout ce qui sera mis en place au moment du tournoi.

Propos recueillis par E-A
Pour en savoir plus sur les solutions d’IBM rendez-vous sur ibm.com/rolandgarros