Publié le: 15/04/2024 @ 14:50:57: Par Nic007 Dans "Programmation"
![Programmation Programmation](images/news/categories/coding.png)
Le problème ne concerne pas seulement le reste du monde par rapport aux États-Unis, mais aussi les États-Unis eux-mêmes. 44 % des Californiens parlent une langue autre que l'anglais, et le Congrès américain a demandé à Sam Altman d' OpenAI ce que faisait son entreprise pour combler le fossé linguistique. Altman a déclaré qu'il espère travailler avec les gouvernements et d'autres organisations pour acquérir des ensembles de données qui renforceraient les capacités linguistiques de ChatGPT et étendraient ses avantages à « un groupe aussi large que possible ». OpenAI n'a pas caché le fait que ses systèmes sont biaisés. La raison est simple. La plupart des données de formation sont dérivées et, comme l'a déclaré OpenAI lui-même, les efforts de l'entreprise pour régler et étudier les performances du modèle se sont concentrés principalement sur l'anglais " avec une perspective centrée sur les États-Unis ". En effet, comme l'a écrit un membre du support technique dans une demande sur un forum d'entreprise , « Tout bon résultat en espagnol est un bonus ».
Les solutions ne sont pas très convaincantes. Les dirigeants de Microsoft, OpenAI et Google travaillant sur les chatbots ont déclaré que les utilisateurs peuvent obtenir des réponses correctes en ajoutant des instructions plus détaillées à leurs questions. Certains ont simplement découvert qu’il valait mieux utiliser l’anglais directement. Et cela vaut également pour le chinois, l’une des langues les plus parlées au monde. Comme nous l’avions anticipé, le problème ne concerne pas uniquement ChatGPT. Google a annoncé que son modèle PaLM 2, sorti ce mois-ci, contient des données de formation non anglaises pour plus de 100 langues. Le modèle reconnaît les expressions idiomatiques en allemand et en swahili , les blagues en japonais et corrige la grammaire en indonésien, dit Google, et reconnaît mieux les variations régionales que les modèles précédents. Mais pour les utilisateurs de Gemini, ce n'est pas aussi polyvalent. Le modèle basé sur PaLM 2 ne fonctionne qu'en anglais américain , japonais et coréen. L'assistant d'écriture pour Gmail prend uniquement en charge l'anglais.
![](images/base_document.png)
![English English](images/en_flag.png)
![](images/base_document.png)