L'Ukraine développe son propre modèle linguistique à grande échelle (LLM) grâce à la technologie de Google. Ce modèle sera entraîné à comprendre correctement le contexte ukrainien, ses dialectes et ses langues minoritaires.
La formation se déroulera d'abord sur l'infrastructure de Google avant de migrer vers des serveurs locaux. Les autorités anticipent des cyberattaques dès le lancement et mettent en place des mesures de défense contre des menaces telles que l'injection de paquets.
L'Ukraine a lancé un projet national d'IA
L'Ukraine développe un modèle de langage de grande envergure à l'aide du framework open source Gemma de Google. Le pays ambitionne de créer un système d'intelligence artificielle totalementdent , destiné à des usages militaires et civils.
Le ministère ukrainien du Numérique et l'opérateur mobile Kyivstar ont annoncé ce projet lundi. Il utilisera l'infrastructure informatique de Google pour l'entraînement initial avant de basculer entièrement vers une infrastructure locale, garantissant ainsi à l'Ukraine le contrôle total des systèmes d'IA accessibles quotidiennement à ses 23 millions de citoyens.
Après une évaluation approfondie, Google a été sélectionné pour ce projet. Selon des sources proches du dossier, citées par Reuters,
Les modèles de langage chinois, notamment DeepSeek et Qwen, ont également été rejetés pour ce projet.
L'armée ukrainienne utilise déjà des outils d'IA pour la reconnaissance aérienne et satellitaire, les opérations de drones et l'analyse du champ de bataille.
Oleksandr Bornyakov, vice-ministre ukrainien de la transformation numérique, a expliqué que le choix d'éviter de dépendre de systèmes comme ChatGPT d'OpenAI était intentionnel, car les forces armées ukrainiennes prévoient d'intégrer l'IA dans les systèmes de gestion du champ de bataille pour la coordination des troupes et la surveillance de l'ennemi.
Combler le fossé linguistique
Ce projet découle en partie des lacunes de communication qui affectent les systèmes d'IA actuels. Bornyakov a constaté que ces systèmes peinent à traiter le dialecte parlé par les habitants de sa ville natale de Bolhrad, dans l'oblast d'Odessa, où l'on parle un mélange d'ukrainien, de russe et de bulgare.
Misha Nestor, directeur des produits chez Kyivstar, qui supervise le projet, a souligné des problèmes tels que des erreurs de traduction dans les documents juridiques et des erreurs générées par l'IA. Quatre comités consultatifs seront chargés des aspects techniques, juridiques, culturels, historiques et linguistiques du nouveau modèle, afin de garantir la prise en charge de l'ukrainien et des langues minoritaires comme le tatar de Crimée, ainsi que du russe.
Des données sont collectées auprès de plus de 90 institutions gouvernementales, notamment des greffes de tribunaux, des éditeurs scolaires, des archives régionales et des documents relatifs aux actions russes pendant le conflit en cours. Cet ensemble de données exhaustif permettra à l'IA de comprendre le contexte et la terminologie ukrainiens bien mieux que les modèles globaux généralistes.
Les experts du ministère de la Transformation numérique affirment que Gemma est l'un des modèles ouverts les plus performants, tant par sa taille que par sa qualité, offrant un équilibre optimal entre performance et utilisation des ressources. Ce modèle prend déjà en charge l'ukrainien et son tokenizer étendu gère jusqu'à 128 000 tokens, avec un traitement multimodal du texte et des images.
L'entraînement se déroulera sur des unités de traitement graphique sécurisées, fournies par Google , situées hors d'Ukraine, avant le déploiement des modèles finaux sur des centres de données locaux. Il s'agit de la solution apportée par le pays face à la menace persistante de frappes russes contre les infrastructures ukrainiennes.
Bornyakov a déclaré que les autorités s'attendent à ce que le système soit attaqué immédiatement après sa mise en service. L'équipe développe des protections contre diverses cybermenaces, notamment les attaques par injection rapide où des instructions malveillantes sont intégrées aux tâches confiées à l'IA.
Kyivstar a installé plus de 3 500 générateurs de secours afin de stabiliser ses opérations, alors que la Russie poursuit ses frappes contre les infrastructures énergétiques ukrainiennes. L'entreprise de télécommunications comptait plus de 22,5 millions d'abonnés mobiles et plus de 1,2 million d'abonnés à l'internet fixe en septembre.
Affinez votre stratégie grâce au mentorat et aux idées quotidiennes - Accès gratuit de 30 jours à notre programme de trading

