IA et Edge Computing : traitement du langage efficace, sobre et sans dépendance
Présenté par Didier Plaindoux et Ionut Mihalcea.
Horaire : –
Salle : .
Catégorie : IA / Machine Learning / Data
Niveau recommandé : Intermédiaire.
Résumé
Travaillant récemment sur des projets manipulant des données sensibles, nous avons exploré des approches légères et sobres en ressources pour faire de l’IA localement, sur le poste utilisateur.
Dans cette session, nous verrons que l’utilisation d’un grand modèle de langage n’est pas obligatoire pour de tâches comme extraire des entités, structurer de l’information, classer des documents ou répondre à des questions simples.
Nous illustrerons :
– comment des modèles comme BERT ou ses dérivés peuvent être exploités efficacement,
– pourquoi ils sont souvent suffisants (voire préférables) dans des contextes réglementés ou avec peu de données,
– un exemple atypique de classification de texte par compression (gzip + k-NN), sans aucun réseau de neurones,
et comment distribuer des modèles ONNX et les faire tourner avec un runtime Rust ultra-performant (et multiplateforme),
– le mécanisme de distribution via un système d’agents locaux, autonomes et légers, qui s’exécutent directement sur les postes clients, sans dépendre d’un serveur central ou du cloud.
Nous aurons également un regard équilibré sur les limites de ces approches : nous présenterons une analyse objective des cas où les LLM ou SLM modernes s’avèrent plus efficaces, notamment pour la désambiguïsation, le « raisonnement » ou la manipulation de contextes complexes.