Le débat sur l’accès à la « freeware » pour l’entraînement des IA : Une perspective de l’IA de Microsoft

Parlant en tant que passionné du monde de l’intelligence artificielle (IA), je suis fasciné par l’énorme potentiel que cette technologie détient. Cependant, une préoccupation majeure demeure : celle de l’utilisation des contenus web comme « freeware » pour entraîner les modèles d’IA. J’ai suivi avec intérêt les récentes déclarations de Mustafa Suleyman, le PDG de Microsoft AI à ce sujet.

Contenu web ou « freeware » pour l’IA ?

Selon Suleyman, une grande partie du contenu web fonctionne comme du « freeware », une sorte de logiciel qui peut être librement téléchargé et utilisé par les utilisateurs finaux. En gros, il considère que tout contenu web qui n’opte pas explicitement contre cette notion peut être utilisé pour former des modèles d’IA.

Il est fascinant de constater que tout en reconnaissant l’existence d’une « zone grise » légale autour de cette question, Suleyman a déclaré lors du Aspen Ideas Festival :

« …avec le contenu qui est déjà sur le web ouvert, le contrat social de ce contenu depuis les années 90 a été qu’il est d’utilisation équitable. N’importe qui peut le copier, le recréer avec, le reproduire avec. Cela a été le freeware… ».

Freeware » ou vol ? Discerner les limites

La notion de « fair use » est sans doute pertinente ici. Le « fair use » permet en effet une utilisation limitée de matériel protégé par des droits d’auteur pour des raisons spécifiques comme l’enseignement ou la recherche. Cependant, l’utilisation des contenus web par l’IA dépasse généralement ce cadre, générant des profits pour les entreprises qui détiennent ces modèles.

Il est important de clarifier ici qu’il n’existe pas de « contrat social » rendant tout contenu en ligne disponible pour l’enseignement de l’IA. Comme observateur attentif de ce domaine, je suis préoccupé par le fait que des géants du monde numérique comme Microsoft et Google souscrivent à cette idée. Il est clair que cela avantage ces multinationales, mais qu’en est-il des créateurs de contenu originel ?

La question se posant à plus grande échelle

Cette déclaration controversée vient à un moment où des multinationales comme Microsoft, OpenAI et Google font face à plusieurs défis juridiques pour violation de droits d’auteur, ce qui explique également pourquoi OpenAI signe autant d’accords de licence de contenu.

Je vous invite à écouter personnellement ce débat dans cette vidéo, où le PDG de Microsoft AI parle de l’avenir de l’intelligence artificielle au Aspen Ideas Festival.

C’est une question épineuse, mais une chose est certaine : alors que nous naviguons dans l’ère de l’intelligence artificielle, ce débat sur l’utilisation du contenu Web comme « freeware » pour la formation des modèles d’IA doit être abordé avec soin et attention.

Jérémy Lagache
Suivez-moi