•  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  

Voici Shimon, le premier robot rappeur

Un robot doté d'un visage humanoïde sur un bras mécanique regarde un rappeur chanter dans un micro.

Dans son premier duel de rap public, Shimon s'est mesuré au rappeur et trompettiste Dash Smith.

Photo : Site web de Richard Savery / Georgia Tech Center for Music Technology

Radio-Canada

Les adeptes de rap ont maintenant un nouvel adversaire : un robot du nom de Shimon qui, grâce à l’apprentissage profond, peut composer et livrer des paroles en temps réel, comme le rapporte le magazine Scientific American.

Shimon est un robot musical conçu au Centre de technologie musicale de l’Université Georgia Tech par une équipe dirigée par Gil Weinberg, un expert en technologie musicale. Par le passé, on a pu le voir chanter, jouer du marimba et composer de la musique (le robot a même son propre album sur Spotify, Shimon Sings).

Après lui avoir apporté quelques modifications, son créateur affirme que Shimon est maintenant le premier robot à pouvoir improviser des paroles de chanson qui riment en empruntant le style hip-hop, un défi de programmation selon M. Weinberg, qui a publié avec son équipe de recherche un papier résumant les avancées technologiques derrière cet exploit.

Lorsque Shimon participe à une bataille de rap, un logiciel convertit les mots de son adversaire – un être humain – en texte. Le robot y repère ensuite les mots clés pour générer de nouvelles paroles en se basant sur divers ensembles de données déjà intégrées à son système.

Ces données peuvent provenir de différentes sources, que ce soit des paroles d’artistes rap de renom comme Lil Wayne et Jay-Z, des paroles empruntées d’un autre style musical, ou encore des œuvres littéraires non musicales comme des textes de Shakespeare ou de Jane Austen.

L’importance des phonèmes

Les nouvelles capacités de Shimon reposent en grande partie sur sa capacité à segmenter les mots de sa base de données en phonèmes, de petites unités distinctives pouvant être isolées par segmentation dans la chaîne parlée (par exemple, la langue française compte 36 phonèmes, soit 16 voyelles et 20 consonnes).

Afin de permettre à Shimon de répondre rapidement à ses adversaires, les spécialistes de Georgia Tech ont dû faire de nombreux choix de programmation. La réponse du robot est limitée à un ensemble de 3000 mots et le temps pendant lequel il écoute son adversaire est restreint.

À l’heure actuelle, Shimon peut offrir une réplique à son adversaire en sept secondes tout en improvisant des mouvements, comme en hochant la tête ou en haussant les sourcils.

Au-delà du caractère inédit de son expérience, M. Weinberg souhaite que Shimon permette aux mélomanes comme aux compositeurs et compositrices d’explorer de nouvelles formes de musique. Ce n’est pas intéressant pour moi si [Shimon] fait ses choses sans les êtres humains, dit-il.

Avec les informations de Scientific American

Vos commentaires

Veuillez noter que Radio-Canada ne cautionne pas les opinions exprimées. Vos commentaires seront modérés, et publiés s’ils respectent la nétiquette. Bonne discussion !