Respect de la confidentialité des données

Lorsque l’on questionne la confidentialité du traitement des données et le respect de la vie privée, plusieurs éléments sont à prendre en compte en plus des traitements propres à OMIST. OMIST s’appuyant sur d’autres outils, le degré de protection va également dépendre de ces outils et de la configuration d’OMIST en matière de traduction. Ceci est présenté plus en détail par la suite. De toute cette étude, il ressort que pour bénéficier d’un respect total de confidentialité, il faut utiliser les outils OMIST avec le navigateur Safari sour Mac OS X et en utilisant la solution de traduction offerte par DeepL PRO.

Transcription

Pour la transcription, OMIST s’appuie sur les fonctionnalités de transcription intégrées aux navigateurs web. Cela implique qu’il y a des navigateurs compatibles (Google Chrome, Microsoft Edge, Apple Safari) et d’autres qui ne le sont pas (Firefox, Chromium, Brave,…). 

Les conclusions des éléments en annexe sont :
Google Chrome et Microsoft Edge ont recours à un service cloud sur lequel sont envoyés les fichier audios et quelques métadonnées (non personnelles). Aucun des prestataires ne stocke les données audio et seules quelques informations secondaires (date, taille du fichier, langue) non personnelles sont conservées.
Attention. Les utilisateurs doivent avoir conscience que ces fichiers audio transitent par des services tiers et il est bien entendu conseillé de ne pas décrire à l’oral des situations qui pourraient contenir des données personnelles sensibles. Notamment, pour les services de santé, il est conseillé de ne pas donner l’identité des personnes ou d’autres informations identifiantes à l’oral.
Dans le cas du navigateur Safari, les choses sont très différentes puisque le système de transcription est local. Les fichiers audios ne quittent pas l’ordinateur „client“, ce qui assure un maximum de confidentialité.


Traduction

Pour rappel, le service de traduction utilisé par défaut dans la version „normale“ des outils OMIST (application enseignante, étudiante, création de capsule avec traduction préalable, traduction de sous-titres (version désactivée) est DeepL PRO API, à l’exception du service de traduction des sous-titres qui utilise la version publique de Google Translate. Pour tous ces outils, il est possible de basculer vers d’autres API depuis l’interface d’administration, comme DeepL Free, Google Cloud Translate ou LibreTranslate qui offrent des degrés variables en terme de confidentialité.

La version „ouverte“ de l’application enseignante ainsi que la nouvelle version des Capsules (Traduction à la demande) utilise la version publique de Google Translate.

DeepL PRO est un service hébergé en UE qui respecte tous les critères en matière de respect de la vie privée (RGPD). Il peut-être utilisé pour traduire des données personnelles sensibles sans risque. 

DeepL Free est un service hébergé en UE mais qui n’apporte aucune garantie sur la non ré-utilisation des données transmises. Il ne peut pas être utilisé dans un cadre où des données sensibles sont susceptibles d’être transmises pour traduction. A noter que les utilisations de DeepL via son interface web suivent cette même politique, y compris lorsque l’on est connecté.

Google Translate Cloud API est un service américain, dont les serveurs peuvent être situés en UE mais sans aucune garantie. Les données transmises ne sont ni stockées, ni réutilisées pour entrainer les modèles. Ce service peut-être utilisé pour des traductions de données non sensibles sans risque, mais en ayant pleine conscience que les données peuvent transiter hors de l’UE. A noter qu’une configuration fine du service permet d’obtenir des garanties proches du service offert par DeepL Pro (notamment respect du RGPD)

Instance publique de google translate est un service américain, dont les serveurs peuvent être situés en UE mais sans aucune garantie. Les données transmises peuvent être stockées et réutilisées pour entraîner les modèles (aucune mention du contraire). Ce service ne peut pas être utilisé pour des traductions de données sensibles. Les utilisateurs doivent être informés de cette politique. A noter que les utilisations de Google Translate via son interface web ou son application Smartphone suivent cette même politique, y compris lorsque l’on est connecté.

LibreTranslate est un service de traduction open source. Des instances de ce service sont disponibles avec des politiques diverses et qui leur appartient. Cependant, l’intérêt de LibreTranslate est qu’il peut être auto-héberger, ce qui permet de définir sa propre politique de respect de données sensibles. Cependant, il faut prendre en compte que l’installation d’une instance, suffisamment performante pour répondre aux besoins de traduction d’OMIST, nécessite des infrastructures particulières (serveurs avec GPU par exemple) et la qualité des traductions produites reste très inférieure au offres commerciales précédentes. 

Interne à OMIST

Pour les besoins de fonctionnement basique des outils, certaines données sont stockées sur le serveur OMIST (contenu partiel du cours diffusé, présentation diffusée). Ces données ne sont pas réutilisées et sont effacées régulièrement du serveur (effacement des données liées aux cours 1 semaine après leur dernière utilisation).

Pour les besoins de monitoring et statistique, des données d’usage sont enregistrées. Ces données identifient l’utilisateur (login), son adresse IP, l’outil utilisé et l’heure d’utilisation. Les données recueillies permettre de mettre en oeuvre une politique de re-facturation. Ces données sont effacées tous les ans. Ce monitoring peut-être désactivé si besoin.

Pour la transcription d’enregistrements, OMIST propose une version totalement client de l’outil ouvert Whisper d’OpenAI. La particularité de cette version est que les fichiers, leurs transcriptions et éventuelles traductions ne quittent jamais la machine de l’utilisateur. Le système de transcription et les modèles nécessaires sont téléchargés sur la machine de l’utilisateur et les calculs sont réalisés sur sa machine. Il y a donc un respect total de la confidentialité des données.

Última modificación: jueves, 2 de abril de 2026, 08:27