↓
Introduction
Le Modèle d'évaluation des capacités de gestion des données (DCAM®) définit l'étendue des capacités requises pour établir, activer et maintenir une discipline mature de gestion des données (DM). Elle aborde les stratégies, les structures organisationnelles, la technologie et les meilleures pratiques opérationnelles nécessaires pour mener à bien la gestion des données. Elle aborde les principes de la gestion des données sur la base d'une compréhension de la valeur commerciale combinée à la réalité de la mise en œuvre opérationnelle.
Vue d'ensemble
Le concept de données en tant qu'aspect fondamental des opérations commerciales a fait son chemin. Il est désormais largement compris comme l'un des principaux facteurs d'entrée dans l'ensemble des processus commerciaux et organisationnels. Une organisation qui utilise efficacement les données est une organisation qui met en œuvre et gère un environnement de contrôle des données. L'environnement de contrôle des données offre à l'organisation un large éventail d'avantages, notamment la réduction des coûts opérationnels, l'automatisation des processus manuels, la consolidation des systèmes redondants, la minimisation de la réconciliation et l'amélioration des opportunités commerciales. Une organisation met en place un environnement de contrôle des données pour garantir la confiance dans les données sur lesquelles elle s'appuie pour le traitement et la prise de décision. Il n'est donc plus nécessaire de procéder à des rapprochements manuels ou de s'appuyer sur des systèmes de gestion des données. transformation des données processus.
Le concept d'environnement de contrôle des données permet de s'assurer que les données sont définies avec précision, décrites à l'aide de métadonnées, Les objectifs de l'UE, alignés sur le sens et gérés dans l'ensemble de l'organisation, sont les suivants cycle de vie des données. La clé de la mise en place d'un environnement de contrôle des données réside toutefois dans l'obtention d'une signification partagée sans ambiguïté au sein de l'organisation, ainsi que dans la gouvernance nécessaire pour garantir des définitions précises. Les données doivent être définies de manière cohérente par la chose réelle qu'elles représentent, comme les produits ou les clients, clients, Il s'agit d'un ensemble de processus de gestion de l'information, d'entités juridiques, de transactions, d'événements et de bien d'autres choses encore. Tous les autres processus sont construits sur cette base.
Dans un environnement de données fragmentées, qui est à l'opposé d'un environnement de contrôle des données, le développement d'applications peut aboutir à des modèles de données ad hoc qui exacerbent le problème des termes communs qui ont des significations différentes, des significations communes qui utilisent des termes différents et des définitions vagues qui ne saisissent pas les nuances essentielles. Pour de nombreuses organisations, ce défi peut être débilitant parce qu'il y a des milliers d'éléments de données, fournis par des centaines de sources internes et externes, tous stockés dans des dizaines de bases de données non connectées. Cette fragmentation entraîne un défi permanent en matière de cartographie, de références croisées et de rapprochement manuel. Pour mettre en place un environnement de contrôle des données, chaque attribut des données doit être comprise, à son niveau atomique, comme un fait aligné sur une signification métier spécifique et durable, sans duplication ni ambiguïté. La gestion des données en tant que signification est la clé de l'alignement des référentiels de données, de l'harmonisation des glossaires commerciaux et de la comparabilité des dictionnaires de données d'application.
Harmoniser le sens de l'activité, y compris l'approche de l'entreprise. processus de la façon dont les termes sont créés et maintenus, peut être une tâche décourageante. Il n'est pas rare de rencontrer une certaine résistance de la part des utilisateurs internes de l'entreprise et de la technologie, en particulier lorsqu'il existe de nombreux systèmes existants liés à des applications commerciales essentielles. La meilleure stratégie de réconciliation dans un environnement fragmenté consiste à harmoniser sur la base des significations légales, contractuelles ou commerciales plutôt que d'essayer de faire en sorte que chaque système adopte la même convention de dénomination. La nomenclature représente la structure des données et démêler les structures et les modèles de données est coûteux et inutile. Il est préférable de se concentrer sur la définition précise des concepts d'entreprise, la documentation des processus de transformation et la saisie des relations entre les données du monde réel. Une fois établis, les systèmes existants, les glossaires, les dictionnaires, les référentiels, etc. peuvent être référencés par rapport à la signification commune.
Les données en tant que signification doivent être gérées en même temps que leur définition. métadonnées pour garantir cohérence et la comparabilité dans l'ensemble de l'organisation. Signification des données et gestion des métadonnées doit être considéré comme le cœur de votre infrastructure de contenu et comme la base de référence pour la mise en œuvre de la processus l'automatisation, l'intégration des applications et l'alignement des processus liés. Certains types courants de métadonnées comprennent les aspects commerciaux, opérationnels, techniques, descriptifs, structurels et administratifs.
La mise en œuvre et la gestion d'un environnement de contrôle des données sont régies par des politiques, des normes, des processus et des procédures en matière de données. Ce sont les mécanismes essentiels pour mettre en place une initiative de gestion des données durable et pour garantir le respect d'un environnement de contrôle des données face à la complexité de l'organisation. La gestion du sens est la clé d'une gestion des données efficace. La signification est obtenue par l'adoption de normes sémantiques. Les normes sont régies par politique. Les politique est établi par la direction générale, soutenu par les propriétaires des données et appliqué par l'audit interne.
Défis liés à la création d'un environnement de contrôle des données

Diagramme 0.1 : Défis liés à l'environnement de contrôle des données
Pour mettre en place un environnement de contrôle des données, l'organisation doit relever les défis suivants.
- Comprendre les environnements de données existants, y compris l'inventaire des données, les liens point à point, les définitions incohérentes, etc.
- Simplifier, organiser et classer l'environnement disparate en domaines de données définis, avec des éléments de données clairement identifiés et des flux de données documentés.
- Aligner les éléments de données sur une signification commune non ambiguë dans l'ensemble de l'organisation grâce à la mise en œuvre de contrôles, politique, et la gouvernance.
- Mesurer et suivre les données afin de garantir la qualité et l'exactitude des données. cohérence avec une réconciliation minimale.
- Aligner la technologie pour s'assurer que les principes et les meilleures pratiques qui ont été établis sont appliqués dans toute l'infrastructure technologique de l'organisation.
C'est ce parcours qu'il faut entreprendre pour parvenir à un environnement de contrôle des données nécessaire pour garantir la meilleure qualité de données possible aux processus critiques de l'ensemble de l'organisation.
De nombreuses organisations ont commis l'erreur d'essayer de résoudre le problème de la gestion du changement en commençant par la technologie. Les DCAM, En tant que meilleure pratique, il préconise que le point de départ soit l'entreprise. processus qui définit les besoins en matière de données. Ensuite, l'entreprise processus et les données peuvent être automatisées par la technologie.
Niveaux opérationnels de la gestion des données
Le DCAM Le cadre définit les composants et les capacités nécessaires pour mettre en place un environnement de contrôle des données au sein de l'organisation. Toutefois, le cadre n'est pas prescriptif quant à la manière dont les capacités sont mises en œuvre aux différents niveaux opérationnels de l'organisation. Une organisation devra adapter son modèle de fonctionnement pour tenir compte de la taille, de la complexité, de la géographie et de la culture de l'organisation.

Diagramme 0.2 : Niveaux opérationnels de la gestion des données
Lors de l'utilisation du DCAM Pour évaluer les capacités de l'organisation, il est préférable d'évaluer chaque niveau tel qu'il est défini dans le DM. modèle opérationnel cible de l'organisation.
Parties prenantes de la gestion des données
Le DM Partie prenante La matrice de responsabilité illustrée ci-dessous est une construire pour identifier les partie prenante Les parties prenantes sont les principaux acteurs de l'écosystème des données, ainsi que les rôles de haut niveau et les relations entre les parties prenantes. Comprendre les partie prenante est une base importante pour l'application de la DCAM Cadre dans un DM modèle opérationnel cible pour l'organisation. Il définit également le public visé par l'utilisation de la DCAM comme outil d'évaluation des capacités de l'organisation. Au sein de la matrice, architecture des données est le pivot de la relation entre les parties prenantes de l'entreprise et de la technologie.

Diagramme 0.3 : Gestion des données Partie prenante Matrice de responsabilité
Questions émergentes
La pratique de la gestion des données continue d'évoluer. Les nouvelles technologies et les problèmes introduits dans les organisations qui ont un impact sur les données ou la gestion des données créent des exigences supplémentaires pour l'initiative de gestion des données. Alors que le CDO peuvent ne pas être directement responsables de la mise en œuvre de ces technologies ou de la résolution des problèmes, ils doivent participer activement à l'orientation de l'organisation.
Notre mission est de continuer à évoluer DCAM de rester à jour et d'aider les professionnels de la gestion des données à réussir dans leur rôle au sein de leur organisation. D'après les commentaires de nos membres, deux sujets - l'essor du Machine Learning (ML) et de l'Intelligence Artificielle (IA) dans l'analytique et la question de l'éthique des données - sont apparus comme des considérations importantes pour la prise de décision en matière de gestion des données. Le travail des membres groupe supportant la nouvelle version de DCAM comprenait des experts en la matière. Grâce à leur contribution, nous avons intégré des considérations relatives à ces sujets dans les sous-capacités existantes dans les domaines suivants DCAM et a introduit de nouvelles capacités et sous-capacités le cas échéant.
Analyse et apprentissage automatique
De nombreuses organisations en sont à différents stades de développement et de mise en œuvre d'applications d'analyse et d'apprentissage automatique plus avancées au sein de leurs opérations. Bien que ces applications ne modifient pas fondamentalement les structures requises pour une bonne gestion des données, elles nécessitent une série de changements dans un certain nombre de ses éléments. Ces changements sont décrits dans les composantes et les capacités correspondantes. Toutefois, il est utile de présenter les fonctions d'analyse et d'apprentissage automatique au sein d'une organisation afin de replacer les exigences dans leur contexte.
D'une manière générale, deux grands types d'activités d'analyse des données se déroulent au sein d'une organisation :
- Statistiques descriptives / inférentielles (D/IS) - Il s'agit du résumé des principales mesures d'une organisation. Les indicateurs clés comprennent les revenus, le débit, les ventes et les dépenses. Les statistiques descriptives/inférentielles peuvent également être des estimations de ce que ces paramètres sont susceptibles d'être, s'ils ne sont pas directement observables. Ces résumés peuvent être présentés sous forme numérique ou graphique, par exemple sous forme de tableaux de bord, et peuvent également être générés périodiquement ou en temps réel. Ce type d'analyse fait généralement partie de l'intelligence économique (BI) ou de l'intelligence de gestion (MI). fonction d'une organisation.
-
Apprentissage automatique / Intelligence artificielle - Contrairement aux statistiques descriptives et inférentielles, qui visent à présenter les principales caractéristiques d'un ensemble de données par le biais d'un résumé direct des données, ce type d'analyse utilise des algorithmes pour discerner des modèles utiles et précieux à partir des données avec peu, ou pas, d'intervention humaine au-delà de la mise en place de l'algorithme d'apprentissage. Ces modèles peuvent être dérivés de données structurées et non structurées. Les modèles découverts sont souvent plus précieux que ceux discernés par les humains, et ce pour plusieurs raisons :
- Ces types d'algorithmes peuvent prendre en compte beaucoup plus de dimensions de données et leurs interactions que les humains. Ils peuvent également prendre en compte beaucoup plus d'exemples d'un phénomène simultanément qu'un humain ; et
- Les machines ne souffrent pas d'un grand nombre de biais cognitifs qui entraînent des résultats médiocres en matière de reconnaissance des formes chez l'homme.
Une conséquence de la complexité des modèles reconnus par ces types d'algorithmes est que, malgré l'existence d'un système d'évaluation des risques, il n'est pas possible d'obtenir des résultats satisfaisants. précision des modèles reconnus, le modèle sous-jacent est souvent trop complexe pour être compris par l'homme et fonctionne effectivement comme une boîte noire. Cela n'est pas toujours acceptable, en fonction de l'application de l'algorithme.
Le D/IS et le ML/AI peuvent tous deux servir de base à d'autres types d'activités d'analyse et de prévision.
En ce qui concerne la flux de données qui a lieu pour les activités analytiques, les deux catégories d'activités analytiques passent approximativement par les mêmes étapes :
- Les données d'entrée brutes proviennent de bases de données de référence et sont introduites dans un espace de travail unique ;
- Les données brutes sont manipulées et transformées en une forme nécessaire aux activités analytiques ;
-
Les activités analytiques ont lieu :
- Dans le cas du D/IS, il s'agirait de la génération de métriques de synthèse ;
- Dans le cas de la ML/AI, il s'agirait de la formation d'algorithmes pour reconnaître les modèles requis ;
-
Le résultat de l'étape d'analyse est mis à la disposition des utilisateurs autorisés dans le format de sortie souhaité :
- Dans le cas du D/IS, il s'agirait d'un résumé des mesures sous la forme d'un rapport ou d'un tableau de bord numérique ou graphique ;
- Dans le cas de la ML/AI, il s'agirait de la publication d'algorithmes formés et testés pour les utilisateurs autorisés à les utiliser ou de la publication des résultats des algorithmes formés lorsqu'ils sont appliqués à des données courantes.
Les nouvelles technologies telles que la ML/AI introduisent des considérations uniques pour le DM. Cela dit, la mise en œuvre réussie de toutes les capacités de gestion des données est la meilleure façon de répondre à ces nouvelles exigences. DCAM La V2 intègre désormais ces considérations dans l'ensemble des capacités et sous-capacités afin de guider l'autonomisation de l'analyse avancée.
Éthique des données
La ML/AI et d'autres innovations technologiques ont augmenté le volume de données à la disposition des organisations et créé une plus grande distance entre le jugement humain et la prise de décision automatisée. L'éthique des données est l'une des questions de gestion des données soulevées par les innovations technologiques. Dans nos discussions avec des experts en gestion des données du monde entier, le sujet de l'éthique des données est apparu comme une préoccupation majeure, en particulier à la lumière des amendes record imposées aux organisations qui font le commerce des données personnelles. données personnelles et ne protègent pas la vie privée des utilisateurs, ainsi que la rapidité avec laquelle les entreprises développent des produits et des services qui tirent parti de l'internet des objets, notamment des systèmes de sécurité à reconnaissance faciale et des voitures autopilotées. DCAM V2 aborde cette question de manière proactive en aidant les professionnels du DM à instaurer une culture organisationnelle alignée sur un code de déontologie qui articule les valeurs et les priorités de leur organisation et fournit des lignes directrices pour l'opérationnalisation.
La prise de décision automatisée - l'utilisation d'algorithmes pour classer les données et prendre des décisions sur la base de ces classifications - a le potentiel de révolutionner les processus de gestion des données qui étaient auparavant fastidieux, coûteux et/ou impossibles à réaliser par les humains. Par exemple, les réseaux neuronaux convolutifs - la technique d'apprentissage automatique la plus couramment utilisée en imagerie médicale - sont employés pour la détection des tumeurs en radiologie diagnostique. Cependant, la fiabilité et l'efficacité des réseaux neuronaux convolutifs ne sont pas toujours au rendez-vous. précision de ces algorithmes dépend de nombreux facteurs, notamment de la qualité des données d'entraînement, du volume et de la qualité du corpus de données qui représente ce qu'il est censé représenter. Les meilleurs algorithmes fonctionnent parce qu'ils sont formés sur des données précises, mais généralisables, de sorte que les nouvelles informations ne sont pas forcées d'entrer dans des classifications inappropriées.
Pour l'éthique des données, cela signifie que la complexité des algorithmes employés par une organisation doit être étayée par des données d'entraînement fortement annotées et un corpus de données très vaste et largement représentatif. En outre, les responsables de l'éthique des données au sein de l'organisation doivent comprendre comment les algorithmes classent les données et comment cette classification peut avoir des conséquences inattendues. Dans certaines organisations, les CDO se voient confier la responsabilité de l'éthique des données, tandis que d'autres nomment un responsable de l'éthique. Quelle que soit l'approche retenue, il existe des responsabilités et des exigences en matière de données et de gestion des données inhérentes au fonctionnement des organisations qui accordent la priorité à l'éthique des données.
La capacité des algorithmes à faire face à des données qui diffèrent de leurs données d'apprentissage est déterminée par les hypothèses que les programmeurs font lorsqu'ils envisagent le domaine des résultats possibles. Bien que les progrès de l'apprentissage automatique aient mis en lumière l'éthique des données, cette question ne se limite pas au domaine de l'intelligence artificielle. Les efforts déployés pour respecter les engagements en matière de protection de la vie privée des personnes représentées par les données sont souvent sapés par une simple erreur humaine ou par des protocoles de systèmes obsolètes. Si le respect des exigences légales en matière de gestion des données est utile, il ne représente qu'un faible niveau de protection de la vie privée. Même les professionnels les mieux intentionnés travaillant avec les ensembles de données les plus propres peuvent causer des dommages par inadvertance, en particulier s'ils ne sont pas conscients de la manière dont les algorithmes reproduisent les inégalités sociétales. En d'autres termes, “de bonnes données peuvent produire de mauvais résultats”.”
De même, les responsables de l'éthique des données au sein d'une organisation doivent être prêts à examiner la manière dont la prise de décision automatisée et humaine peut affecter les parties prenantes de l'organisation, qu'il s'agisse d'entités connues ou de populations inconnues susceptibles d'être affectées involontairement par les activités de l'organisation. Par exemple, Amazon a fait l'objet d'un examen minutieux lorsqu'elle a déployé son service de livraison Prime le jour même dans des zones métropolitaines à travers les États-Unis. À première vue, la décision, fondée sur des données, d'offrir en priorité un service de livraison le jour même aux habitants des zones métropolitaines de l'ensemble des États-Unis a été accueillie favorablement. clients vivre dans les codes postaux où il y a une forte concentration de membres Prime et étendre le service à d'autres codes postaux au fil du temps, semble logique en termes de coût et d'efficacité. Toutefois, étant donné que le clients qui paient pour devenir membres Prime sont regroupés dans des quartiers majoritairement blancs, les zones de service de livraison le jour même d'Amazon ont fini par renforcer une inégalité chronique et systématique dans l'accès aux services de vente au détail. Depuis que l'on a appris l'existence de disparités raciales dans les zones de livraison Prime le jour même, l'entreprise a changé d'approche. Toutefois, il faudra plus de temps pour atténuer les atteintes à la réputation.
Intégrer l'éthique des données dans le DCAM est conçu pour aider les organisations à mettre en place des politiques et des procédures qui augmentent la probabilité d'identifier et de modifier en conséquence les décisions fondées sur des données susceptibles de produire de tels résultats involontaires. Bien entendu, il est difficile d'anticiper la manière dont les classification des données et l'utilisation des données affecteront les personnes dans des contextes dynamiques. Une culture organisationnelle qui adopte l'éthique des données peut contribuer grandement à minimiser la vulnérabilité aux violations de données et à compenser les préjugés inhérents aux hypothèses de programmation. Chaque membre de l'organisation qui interagit avec les données et/ou les systèmes de données peut contribuer à une culture de l'éthique des données.
DCAM : Un cadre pour la gestion durable des données
La mise en place d'un environnement de contrôle nécessite un ensemble complexe de capacités de gestion du changement. Les capacités de Modèle d'évaluation des capacités de gestion des données est un cadre pour la mise en œuvre d'un système de gestion du changement solide et durable. fonction. Il s'agit également d'un outil essentiel pour l'évaluation et l'étalonnage continus des capacités de gestion du changement d'une organisation.

Diagramme 0.4 : DCAM Le cadre
Le DCAM Le cadre comprend sept éléments. La première composante, Stratégie de gestion des données et analyse de rentabilité, et la deuxième composante, Programme de gestion des données et financement. Modèle, sont fondamental aux cinq autres composantes.
Les quatre composantes suivantes de la DCAM cadre, Business & Architecture des données, Données & Architecture technologique, Qualité des données et la gouvernance des données sont les exécution des composants.
Le dernier composant est le collaboration L'activité "Environnement de contrôle des données". C'est là que les composantes d'exécution sont mises en œuvre par l'équipe d'exécution. producteur de données afin de contrôler un ensemble défini de données et de les mettre à la disposition des consommateurs de données à un moment donné, soit en temps réel, soit à la fin d'une période.
Les sept composantes comprennent 31 capacités et un total de 106 sous-capacités. La définition et le champ d'application de chaque composante sont présentés ci-dessous.
DCAM : Le champ d'application des sept composantes
1.0 Stratégie de gestion des données et analyse de rentabilité
La stratégie de gestion des données (SGD) et l'analyse de rentabilité constituent un ensemble de capacités permettant de définir, de hiérarchiser, d'organiser, de financer et de régir la gestion des données et la manière dont elle est intégrée dans les activités de l'organisation, conformément aux objectifs et aux priorités de l'administration centrale et de l'administration centrale. entreprise et les unités opérationnelles. L'analyse de rentabilité est la justification de la création et du financement d'une initiative de gestion des données. L'analyse de rentabilisation présente les principaux problèmes liés aux données et aux données auxquels est confrontée une organisation ou une unité opérationnelle et décrit les résultats et les avantages attendus de la mise en œuvre d'une initiative de gestion des données réussie.
- Mise en place d'un DMS fonction au sein de l'Office de gestion des données (ODM).
- Travailler avec DM Bureau de gestion des programmes (PMO) pour concevoir et mettre en œuvre des processus et des outils durables pour le SGD. fonction.
- Aligner le SGD sur la stratégie, les objectifs et les priorités de l'entreprise, y compris la hiérarchisation des données en fonction de leur criticité pour l'entreprise.
- Définir la raison d'être et l'analyse de rentabilité de la gestion des données en tant qu'actif dans le cadre de l'initiative de gestion des données à l'échelle de l'organisation.
- Veiller à ce que le SGD soit aligné sur le plan d'action de l'organisation. Entreprise Principes de gestion des données.
- Formulez l'objectif et l'état actuel du DM. Ensuite, à l'aide de DCAM en tant qu'outil d'évaluation pour l'analyse des lacunes et leur comblement par ordre de priorité, créer un plan d'exécution cohérent.
- Définir la feuille de route d'exécution de haut niveau.
- Définir les risques liés à l'exécution de la stratégie et les mesures d'atténuation.
- Définir les indicateurs de performance du DM.
- Documenter le SGD à l'aide d'une présentation convaincante de la valeur d'une initiative de gestion du changement à l'échelle de l'organisation.
- Veiller à ce que la gouvernance du SGD soit intégrée dans la structure de gouvernance des données (DG).
2.0 Programme de gestion des données et modèle de financement
Le Programme de gestion des données (PGD) et financement Modèle est un ensemble de capacités permettant de gérer l'Office de gestion des données (ODM). Ces structures organisationnelles comprennent les exigences en matière de ressources et l'éventail complet des capacités de gestion de l'Office de gestion des données (ODM). Bureau de gestion des programmes (PMO), comme l'exécution de la gestion du programme, partie prenante gestion, gestion du financement, communication, formation, mesure des performances. Le financement du SM modèle Le DMP est conçu pour fournir le mécanisme permettant d'assurer l'allocation des capitaux nécessaires à la mise en œuvre du programme. Il définit et décrit également les méthodes utilisées pour mesurer les coûts et les avantages de l'initiative de gestion du changement pour l'ensemble de l'organisation.
- Établir un PGD fonction pour mettre en œuvre la Bureau de gestion des programmes (PMO) au sein de l'ODM.
- Faciliter la conception et la mise en œuvre de processus et d'outils de gestion du changement durables dans l'ensemble des composantes et de leurs capacités.
- Établir les rôles et les responsabilités liés aux capacités du SM en fonction d'une structure organisationnelle et les mettre en œuvre dans le cadre d'un GDO.
- Définir le financement Modèle, Il s'agit d'assurer et de contrôler le financement, et d'instituer un suivi des coûts et des avantages en fonction de l'analyse de rentabilisation.
- Établir la feuille de route de l'exécution de la gestion des données avec des plans de projet à l'appui pour s'appuyer sur la feuille de route de haut niveau de la stratégie de gestion des données (DMS).
- Engager chaque partie prenante dans l'ensemble de l'écosystème des données, en fonction de leur rôle dans l'alignement des ressources, le financement, la communication, la formation et le développement des compétences.
- Gérer l'initiative DM en contrôlant et en diffusant les indicateurs de performance DM.
- Veiller à ce que la gouvernance du DMP soit intégrée dans la gouvernance des données (DG).
3.0 Architecture d'entreprise et de données
Le Entreprises et Architecture des données (DA) est un ensemble de capacités permettant d'assurer l'intégration entre le système d'information de l'entreprise et le système d'information de la société. processus et l'exécution de la DA fonction. L'entreprise processus est défini par le architecture d'entreprise fonction. L'AD définit des modèles de données tels que des taxonomies et des ontologies, ainsi que des domaines de données, métadonnées, Le DA est un système de contrôle des données qui permet de contrôler les données de l'entreprise et les données critiques pour l'entreprise afin d'exécuter les processus dans l'environnement de contrôle des données. Le DA fonction garantit le contrôle du contenu des données, que la signification des données est précise et non ambiguë et que l'utilisation des données est cohérente et transparente.
- Établir une DA fonction au sein de l'Office de gestion des données (ODM).
- Travailler avec le bureau de gestion de projet du SM (PMO) pour concevoir et mettre en œuvre des processus et des outils durables pour l'AD, y compris l'intégration nécessaire avec les processus et les outils de l architecture d'entreprise.
- Identifier et établir des domaines de données, des sources faisant autorité et des points d'approvisionnement.
- Identifier et inventorier les données nécessaires pour répondre aux besoins de l'entreprise, y compris toutes les données nécessaires à la mise en œuvre de la stratégie de l'entreprise. métadonnées y compris glossaire, dictionnaire, classification, lignée, etc.
- Définir et attribuer des définitions d'entreprise, liées à l'inventaire des données.
- Veiller à ce que la gouvernance de l'AD soit intégrée dans la gouvernance des données (DG) et alignée sur les activités de gouvernance commerciale et technologique.
4.0 Architecture des données et des technologies
Le Données & Architecture technologique (TA) est un ensemble de capacités permettant d'aligner les exigences architecturales de l'entreprise, les données et la technologie dans l'ensemble de l'organisation afin de soutenir l'activité souhaitée. processus les résultats. Ces résultats comprennent les processus de gestion du changement et l'infrastructure technologique requise.
- Travailler avec le bureau de gestion de projet du SM (PMO) pour concevoir et mettre en œuvre des processus et des outils durables pour l'intégration de l'entreprise et de la société civile. architecture technologique avec architecture des données.
- Garantir le DM fonction l'alignement sur les activités, les données et les architecture technologique et la stratégie.
- Veiller à ce que la gouvernance de la gestion des documents soit alignée sur les activités de gouvernance commerciale et technologique.
5.0 Gestion de la qualité des données
Le Qualité des données Gestion de la qualité (DQM) est un ensemble de capacités permettant de définir profilage des données, Ces capacités permettent à l'organisation d'exécuter des processus dans l'ensemble de l'environnement de contrôle des données, en veillant à ce que les données soient adaptées à l'usage auquel elles sont destinées. Ces capacités permettent à l'organisation d'exécuter des processus dans l'ensemble de l'environnement de contrôle des données, en veillant à ce que les données soient adaptées à l'usage auquel elles sont destinées.
- Mise en place d'un DQM fonction au sein de l'Office de gestion des données (ODM).
- Travailler avec la gestion des données (DM) Bureau de gestion des programmes (PMO) pour concevoir et mettre en œuvre des processus et des outils durables pour la gestion de la qualité des produits.
- Exécuter des processus DQM sur des données critiques pour l'entreprise. Les processus DQM comprennent profilage & classement, mesure, gestion des défauts, résolution des causes profondes, remédiation.
- Établir des mesures de QD et des routines d'établissement de rapports.
- Veiller à ce que la gouvernance du DQM soit intégrée dans la gouvernance des données (DG).
6.0 Gouvernance des données
Le Gouvernance des données (DG) est un ensemble de capacités permettant de codifier la structure, les lignes d'autorité, les rôles et responsabilités, le protocole d'escalade, politique & les normes, la conformité et les routines pour exécuter les processus dans l'environnement de contrôle des données. Cela garantit une prise de décision faisant autorité à tous les niveaux de l'organisation.
- Établir un fonction de gouvernance des données au sein de l'Office de gestion des données (ODM).
- Travailler avec DM Bureau de gestion des programmes (PMO) pour concevoir et mettre en œuvre des processus et des outils durables pour la gouvernance des données.
- Définir clairement les rôles, les responsabilités et l'obligation de rendre compte des ressources du SM, y compris celles mandatées par le SM. politique.
- Définir et faire fonctionner la structure de gouvernance des données avec des lignes d'autorité claires, la responsabilité de la prise de décision, l'engagement des parties prenantes, une supervision adéquate, des voies d'escalade des problèmes et le suivi de l'activité de remédiation.
- Élaborer des politiques, des normes et des procédures complètes et réalisables en matière de gestion des documents et veiller à ce qu'elles soient respectées, notamment en dirigeant la réponse aux audits.
- Garantir fonction de gouvernance des données est aligné sur les autres contrôles pertinents fonction les politiques, les procédures, les normes et les exigences de gouvernance en matière de sécurité de l'information, de respect de la vie privée, architecture technologique etc.
7.0 Champ d'application de l'environnement de contrôle des données
Le Environnement de contrôle des données (ECD) est un ensemble de capacités qui, ensemble, forment l'environnement de contrôle des données pleinement opérationnel. Opérations sur les données, gestion de la chaîne d'approvisionnement, contrôle croisé fonction l'alignement et la collaboration architecture technologique doit fonctionner de manière cohérente afin de garantir que les objectifs de l'initiative de gestion du changement sont atteints dans l'ensemble de l'organisation.
- Travailler avec DM Bureau de gestion des programmes (PMO) pour concevoir et mettre en œuvre des processus et des routines durables et habituels afin de créer un environnement de contrôle des données performant.
- Rassembler les composants de la gestion des données pour en faire un écosystème de données cohérent de bout en bout.
- Suivre les meilleures pratiques actuelles en matière de gestion du changement en examinant et en vérifiant régulièrement les capacités et leurs processus.
- Assurer toutes les facettes de la gestion des données critiques pour l'entreprise, telles que cycle de vie des données, de bout en bout lignée de données et les agrégations de données sont pleinement opérationnelles.
- Veiller à ce que le DM soit aligné sur les autres contrôles fonction les politiques, les procédures, les normes et la gouvernance.
Cas d'utilisation du DCAM
DCAM a de multiples usages au sein d'une organisation.
- En tant que cadre de contrôle bien défini
- En tant qu'outil d'évaluation
- En tant que référence pour l'industrie
Le DCAM en tant que cadre
Lorsqu'une organisation adopte le standard DCAM Ils introduisent une manière cohérente de comprendre et de décrire le DM. DCAM est un cadre des capacités requises pour une initiative globale de gestion du changement, présenté comme un paradigme de meilleures pratiques. DCAM contribue à accélérer le développement de l'initiative DM et à la rendre opérationnelle. L'initiative DCAM Le cadre :
- Fournit un cadre commun et mesurable pour la gestion du changement
- Établir un langage commun pour le DM
- Traduire l'expertise sectorielle en normes opérationnelles
- Documente les exigences en matière de capacités du DM
- Proposer des artefacts fondés sur des données probantes
Le DCAM en tant qu'outil d'évaluation
Pour utiliser efficacement DCAM en tant qu'outil d'évaluation nécessite la définition des objectifs et de la stratégie d'évaluation, la planification de la gestion de l'évaluation et une formation adéquate des participants afin d'établir une compréhension de base de l'outil d'évaluation. DCAM Le cadre.
Les résultats de l'évaluation transforment la pratique du DM en une science quantifiable. Les avantages que l'organisation peut tirer des résultats de l'évaluation sont les suivants :
- Mesure de référence des capacités de gestion du changement de l'organisation par rapport à un secteur d'activité. standard
- Mesure quantifiable des progrès réalisés par l'organisation pour rendre opérationnelles les capacités requises en matière de gestion du changement.
- Identification des lacunes dans les capacités de gestion des données afin d'établir une feuille de route prioritaire pour le développement futur, alignée sur les besoins de l'organisation en matière de données et de gestion des données.
- Une attention particulière aux besoins de financement de l'initiative DM
Guide de notation du DCAM
Le guide de notation utilisé tout au long de l'année DCAM est le suivant. Il est conçu pour évaluer la phase de réalisation des capacités. Il ne s'agit pas d'une évaluation de la maturité ou de l'étendue de l'application des capacités d'une organisation. De par sa conception, la notation est un nombre pair afin d'obliger l'évaluateur à prendre une décision consciente et d'éviter la tendance à choisir le point médian de l'échelle de notation.
SCORE
CATÉGORIE
DESCRIPTION
CARACTÉRISTIQUES
1
Non initié
Non effectué
Activités ad hoc réalisées par les héros
2
Conceptuel
Étapes de la planification initiale
Questions débattues ; séances de tableau blanc
3
Développement
Engagement en cours
Identification des principales parties prenantes fonctionnelles ; définition des axes de travail ; réunions en cours ; participation croissante ; politiques, rôles et procédures opérationnelles en cours d'élaboration ; financement du projet/annuel.
4
Défini
Défini et vérifié
Les utilisateurs professionnels sont actifs ; la direction du secteur d'activité ayant une responsabilité en matière de pertes et profits est impliquée ; les exigences sont vérifiées ; les responsabilités sont définies et attribuées ; politique et des normes existent ; des routines sont en place ; la lignée est en cours ; les éléments de données critiques (EDC) sont identifiés ; l'adhésion est suivie ; le financement est pluriannuel/durable.
5
Atteint
Adoptés et appliqués
Sanction de la direction générale ; engagement proactif des entreprises ; coordination des responsabilités ; politique et normes mises en œuvre ; vérification de la lignée ; harmonisation des données entre les référentiels ; vérification de l'adhésion ; financement stratégique/de l'investissement
6
Améliorée
Intégré
Pleinement intégré à la culture opérationnelle de l'organisation dans un souci d'amélioration continue
Tableau 0.5 : DCAM Guide de notation
DCAM, une référence dans l'industrie
Le Conseil EDM a réalisé une étude comparative de l'industrie du DM en 2015, 2017 et 2020. L'étude comparative est basée sur les capacités définies dans le document DCAM et peut donc être utilisé dans le cadre d'une analyse comparative pour les organisations qui mènent une étude de marché. DCAM l'évaluation.
La référence sectorielle n'est pas limitée aux organisations qui utilisent le DCAM. L'apport d'un plus grand nombre de praticiens de l'industrie du DM permet d'avoir une meilleure perspective sur l'état de l'industrie du DM.
Résumé des notes de mise à jour du DCAM v2.1
Cette version de DCAM est considéré comme un majeur en ce sens qu'elle comporte des changements structurels. L'objectif est qu'il n'y ait pas de changement structurel pour les DCAM plus souvent que 24 mois, ce qui correspondra au cycle de deux ans pour l'actualisation des données de référence de l'industrie. Entre les versions majeures, il est possible de publier une version mineure tous les six mois au maximum. Une version mineure pourrait inclure des changements tels que la langue, la clarification, l'alignement du glossaire et des améliorations de l'introduction des composants et des références aux documents relatifs aux meilleures pratiques de l'EDMC. Les fautes de grammaire ou d'orthographe les plus élémentaires seront corrigées lorsqu'elles seront découvertes.
Le Conseil EDM soutiendra toujours une version antérieure à la version majeure actuelle (v2.x). En d'autres termes, la version 1.3 sera soutenue jusqu'à la sortie de la version 3.1.
L'objectif de la DCAM La mise à jour v2.1 comprend les éléments suivants :
- Modifications des composants du cadre pour mieux présenter le flux logique des capacités
- Introduction de nouveaux concepts qui ont des exigences en matière de données et de DM
- Amélioration du contenu pour favoriser la clarté, la facilité d'utilisation et l'efficacité de l'information. cohérence dans la langue, le format et le style de présentation
DCAM v1.3 Mapping to v2.11 - a modèle est disponible et présente l'alignement de la composante, des capacités et des sous-capacités dans le cadre de l DCAM de la version 1.3 à la version 2.1.
Changements apportés aux composants du cadre
1.0 Stratégie de gestion des données et analyse de rentabilité
- Modification de la capacité stratégique qui regroupe les concepts des six autres composantes en une stratégie sommaire.
- Introduit le concept selon lequel une stratégie de gestion des données se compose d'une stratégie de contenu des données, d'une stratégie d'utilisation des données et d'une stratégie de déploiement de la gestion des données.
- Analyse de rentabilité intégrée à la stratégie de gestion des données - auparavant, il s'agissait d'un élément autonome avec financement. Modèle
2.0 Programme de gestion des données et modèle de financement
- Programme de gestion intégrée des données avec financement Modèle - précédemment dans un composant autonome avec Business Case
3.0 Architecture d'entreprise et de données
- Clarification du fait que la gestion des données commence avec l'entreprise processus exigences en matière de données ; maintien de l'intégralité des données Architecture des données champ d'application
4.0 Architecture des données et des technologies
- Clarification de la responsabilité de la technologie pour répondre aux besoins de l'entreprise. processus et les exigences en matière de données
5.0 Gestion de la qualité des données
- Clarification d'un seul la qualité des données processus qui prend en charge tous les types de données
6.0 Gouvernance des données
- Agrégation de l'ensemble de la gouvernance exploitée par les autres composantes en une vue unique de la gouvernance.
7.0 Environnement de contrôle des données
- Précisé que l'environnement de contrôle des données est l'exécution opérationnelle qui rassemble les composants de la gestion des données en un écosystème de données cohérent et de bout en bout.
- Formalisation du risque lié aux données en tant que sous-capacité
Introduction de nouveaux concepts
Apprentissage automatique et intelligence artificielle - l'introduction de défis et d'opportunités à l'aide d'outils et de méthodologies d'analyse innovants tels que l'apprentissage automatique (ML) et l'intelligence artificielle (IA).
Éthique des données - l'analyse avancée expose une organisation à un risque accru dû à une mauvaise utilisation des données ; l'utilisation et le résultat des données ne sont pas simplement une question juridique, mais aussi une question éthique
Concepts d'éthique des données/ML/AI mis en correspondance avec DCAM v2.12 - a modèle est disponible et aligne les concepts de ML/AI et d'éthique des données, ainsi que leurs exigences en matière de données et de gestion des données, sur les sous-capacités correspondantes de la norme DCAM.
Entreprises Processus Conception - mettre l'accent sur le rôle de l'entreprise processus en définissant les exigences en matière de données et de gestion des données et en recherchant les causes premières ; introduire l'exigence d'un système de gestion des données et de gestion de l'information. standard de bout en bout DCAM Processus de DM
Améliorations du contenu
Standard Langue - améliorer l'utilisation cohérente de la langue et la lisibilité
DM Glossaire commercial - a appliqué la discipline consistant à s'aligner sur l'utilisation de la terminologie définie dans la gestion des données de l'EDMC. Glossaire commercial
Guide de notation Standard Langue - a établi un langage cohérent pour décrire les six notes d'évaluation d'une sous-capacité afin de simplifier la notation du répondant processus
L'orientation de la notation standard est destiné à être utilisé comme base pour comprendre comment noter chaque sous-capacité. Toutefois, chaque sous-capacité dispose de ses propres orientations en matière de notation, qui sont spécifiques au contexte de la sous-capacité et qui devraient être un mélange des éléments suivants standard langue et informations spécifiques pour vous aider à évaluer la sous-capacité.
Comment utiliser ce document - Anatomie du DCAM
Le DCAM est organisé en sept composantes essentielles. Chaque élément est précédé d'une définition de ce qu'il est, de son importance et de son lien avec la gestion globale des données. processus. Ces définitions sont rédigées à l'intention des cadres commerciaux et opérationnels afin de démystifier la gestion des données. processus. Les composantes sont organisées en 31 capacités et 106 sous-capacités. Ces capacités et sous-capacités constituent l'essence même de la DCAM Cadre. Elles définissent les objectifs de la gestion des données à un niveau pratique et établissent les exigences opérationnelles nécessaires à une gestion durable des données. Enfin, chaque sous-capacité est associée à un ensemble de critères de mesure. Les mesures sont utilisées pour évaluer votre parcours de gestion des données.
-
Composant - a groupe de capacités qui, ensemble, fournissent un principe fondamental de gestion des données ; utilisé comme outil de référence par les praticiens des données qui sont responsables de la mise en œuvre du principe.
- Introduction - contexte de haut niveau pour le composant ; utilisé comme toile de fond pour développer une compréhension du composant par les praticiens des données
- Définition - description formelle du composant ; utilisée pour soutenir la compréhension et le langage communs en matière de gestion des données
- Champ d'application - un ensemble d'énoncés établissant les garde-fous de ce qui est inclus dans le composant ; utilisé pour comprendre et communiquer des limites raisonnables
- Proposition de valeur - un ensemble d'énoncés permettant d'identifier la valeur commerciale de la mise en œuvre de la composante de gestion des données ; utilisé pour informer les divers dossiers commerciaux pour le développement de l'initiative de gestion des données.
- Vue d'ensemble - un contexte et une comptabilité plus détaillés à un niveau pratique pour établir une compréhension de l'exécution opérationnelle requise pour une gestion durable des données ; utilisés comme guide par les praticiens des données respectifs
- Processus, Outils et constructions - éléments nécessaires à l'exécution du volet ; utilisés à titre de référence et pour établir un lien avec les documents relatifs aux bonnes pratiques lorsqu'ils sont disponibles
- Questions fondamentales - demandes de haut niveau mais approfondies ; utilisées pour diriger l'exploration du composant de gestion des données
-
Capacité - a groupe de sous-capacités qui, ensemble, exécutent des tâches et atteignent les objectifs fixés ; utilisé comme outil de référence par les praticiens des données qui sont responsables de l'exécution.
- Description - brève explication globale de ce que est incluse dans les sous-capacités requises pour atteindre la capacité ; utilisée dans l'évaluation processus informer le répondant de l'étendue de ce qu'il évalue
-
Sous-capacité - activités plus granulaires requises pour atteindre la capacité ; utilisées comme outil de référence par les praticiens des données qui sont responsables de l'exécution.
- Description - brève explication de ce que est incluse dans la sous-capacité ; utilisée dans l'évaluation processus informer le répondant de l'étendue de ce qu'il évalue
- Objectif - objectifs identifiés ou résultats souhaités de l'exécution de la sous-capacité ; ils servent de base à la définition des exigences en matière de gestion des données. processus conception
- Conseil - un aperçu plus détaillé mais décontracté des meilleures pratiques comment pour exécuter la sous-capacité dans une perspective de revue d'audit ; utilisée par le praticien des données
- Questions - demandes de renseignements pour orienter l'interrogation sur l'état actuel de la capacité/sous-capacité ; utilisées par le praticien des données pour donner une perspective à la notation de l'évaluation
- Artéfacts - Éléments requis ou preuves d'adhésion ; utilisés à des fins d'évaluation et de référence d'audit et pour établir un lien avec les documents de référence sur les bonnes pratiques, le cas échéant.
- Guide de notation - aperçu de la définition d'un score d'évaluation ; utilisé lors de la réalisation d'une enquête d'évaluation
Gestion des données Glossaire commercial
Le Conseil EDM a mis au point un système de DM Glossaire commercial qui contient ~130 données de gestion terme noms et définitions. DCAM v2.1 a appliqué ces termes de manière cohérente dans l'ensemble du document. Lorsque des termes sont définis dans le glossaire, le mot ou la phrase est mis en italique et souligné dans le texte.