Avec l'explosion de l'IA générative , l'une des questions (et des problèmes juridiques) est de savoir d'où les modèles tirent leurs informations pour s'entraîner. La réponse est simple : Google et OpenAI ont puisé dans la source disponible, Internet. Et si cela a conduit à une série de problèmes, comme nous le verrons plus tard, maintenant le Big G, qui considère évidemment Bard et Translator comme des objectifs importants de son entreprise, veut s'assurer que vous êtes d'accord pour alimenter l'IA avec vos données. Pour cette raison, à partir du 1er juillet, il a mis à jour ses règles de confidentialité, qui permettaient déjà par le passé à l'entreprise de collecter des données de ses utilisateurs et de les utiliser à des « fins commerciales », y compris « recherche et développement », un terme utilisé pour l'amélioration de Google Traduction . Mais maintenant, la maison de Mountain View a changé le terme associé à la formation, en le transformant de modèles de langage en modèles d'IA, et en incluant également ses modèles d'intelligence artificielle, appelés "produits et fonctionnalités" tels que Bard et Cloud AI (au - delà de Translator ). Voici le point pertinent :
Il s'agit d'une clause plutôt inhabituelle pour une politique de confidentialité, car ces politiques décrivent généralement la manière dont une entreprise utilise les informations que vous publiez sur les services de l'entreprise. Ici cependant, Google se réserve le droit de collecter et d'exploiter les données publiées sur n'importe quelle partie du Web disponible, en assumant le droit d'utiliser l'ensemble d'Internet comme base de son modèle. Pas que ça change quoi que ce soit. Comme nous l'avions prévu au départ, les grandes entreprises qui développent ces produits ont déjà utilisé (et utilisent) Internet pour les former, que ce soit légal ou non. Cela déclenche des poursuites dans le monde entier (qui ne feront qu'augmenter, et c'est pourquoi OpenAI s'oppose aux nouvelles règles de transparence de l'UE sur l'IA) et a indirectement amené Twitter et Reddit à bloquer les clients tiers et, pour le premier, sur la limite d'accès aux tweets.
Par exemple, nous pouvons collecter des informations accessibles au public en ligne ou auprès d'autres sources publiques pour aider à former les modèles d'IA de Google et à créer des produits et des fonctionnalités telles que Google Translate, Bard et les fonctionnalités AI Cloud. Ou, si les informations sur votre entreprise apparaissent sur un site Web, nous pouvons les indexer et les afficher sur les services Google.
Il s'agit d'une clause plutôt inhabituelle pour une politique de confidentialité, car ces politiques décrivent généralement la manière dont une entreprise utilise les informations que vous publiez sur les services de l'entreprise. Ici cependant, Google se réserve le droit de collecter et d'exploiter les données publiées sur n'importe quelle partie du Web disponible, en assumant le droit d'utiliser l'ensemble d'Internet comme base de son modèle. Pas que ça change quoi que ce soit. Comme nous l'avions prévu au départ, les grandes entreprises qui développent ces produits ont déjà utilisé (et utilisent) Internet pour les former, que ce soit légal ou non. Cela déclenche des poursuites dans le monde entier (qui ne feront qu'augmenter, et c'est pourquoi OpenAI s'oppose aux nouvelles règles de transparence de l'UE sur l'IA) et a indirectement amené Twitter et Reddit à bloquer les clients tiers et, pour le premier, sur la limite d'accès aux tweets.
Plus d'actualités dans cette catégorie