合作机构:阿里云 / 腾讯云 / 亚马逊云 / DreamHost / NameSilo / INWX / GODADDY / 百度统计
使用数据、高级分析或AI的公司需要数据治理计划。顾问兼作家Robert Seiner表示,最好的方法是非侵入性数据治理。
Seiner花了20年的时间研究数据治理。作为Kik Consulting的总裁和负责人,他与公司合作解决他们的治理问题,并实施他的非侵入性数据治理框架。
2014年,Seiner出版了他的第一本书《非侵入性数据治理:最小阻力和最大成功之路》,并为公司介绍了一种考虑构建数据治理结构的新方法。非侵入性数据治理侧重于将现有角色可能已经具有的责任正式化,而不是重组职责并潜在地增加员工工作负荷的责任。
自从出版了他的第一本书并帮助世界各地的公司实施他的框架以来,他在公司面临的数据治理问题上学到了新的教训和观点,他于2023年出版了第二本书——非侵入性数据治理再次出击:获得经验和观点——分享了这些见解和非侵入性数据治理成功所需的框架。
Seiner接受了记者的采访,谈到了非侵入性数据治理与其他数据治理方法的区别,为什么他的框架是数据和分析操作成功的关键,以及GenAI对数据治理的影响。
Robert Seiner:公司可以采用三种方法进行数据治理。有一种命令和控制,自上而下的方法,每个人都被分配了新的角色,对公司来说感觉是全新的。有一种传统的方法遵循电影《梦想之地》的理念——“如果你建立它,他们就会来”——公司构建了一种数据治理方法,并希望人们会被它所吸引,然后还有第三种方法,我的非侵入性方法,这种方法假设公司中已经有了责任级别,并且它专注于将责任正式化,而不是将其作为对他们来说是全新的东西交给他们,它的威胁要小得多,这种方法不是给人们分配新的东西,而是根据他们与数据的关系来识别他们,并帮助他们更有效地管理,而不是故意增加他们已经在做的事情。
非侵入性数据治理是公司现在使用的主要方法,还是他们正在更多地使用其他方法?
Seiner:我想说的是,大多数公司仍然遵循传统的方法,他们建立了一个程序,并希望人们会被吸引过来。有很多公司告诉我,唯一对他们有效的方法是保持非侵入性。人们通常在100%以上的时间里已经很忙,如果他们觉得你增加了他们的工作努力,他们就会推后。有很多公司来找我说,我们需要有一个数据治理计划,非侵入性是我们需要遵循的方法。随着人们对它的不断了解,人们对它的兴趣似乎越来越大。
Seiner:最大的挑战是向它应用必要的资源。我已经和几个公司谈过,他们认为通过创建一个数据治理程序,它将自动运行。需要有与实施数据治理和元数据管理相关的资源。如果没有元数据文档,很难管理你的数据。
比其他公司做得更好的公司是那些将资源应用于其努力的公司,仍然有很多公司很难找到资源来应用于数据治理,这是令人惊讶的,因为公司应该预料到该程序不会自动运行。最大的障碍,因此也是最大的挑战,是在公司的最高层,他们往往仍然不认识到他们为什么需要这样做。
我总是用‘数据不会自我支配’这句话,治理需要了解数据的人来治理它,元数据将不会自行管理,该程序不会自动运行,数据治理是对数据和数据管理资产的授权的执行和强制执行,你采用什么方法进行数据治理并不重要。归根结底,你需要执行和加强权威,否则人们不会遵循标准、政策和规则,问题是你想用什么方法。
Seiner:有了我在书中分享的框架,你不应该试图一次实现所有的框架。我建议公司找到框架中[他们]需要关注的部分,该框架旨在使核心组成部分与本公司的观点相匹配,例如,有必要描述行政人员的角色、战术人员和操作人员的角色,而且,有必要记录能够安抚公司的战略和支持级别的指标。公司需要在某个时候了解框架中收集的所有信息。如果你采用结构化的方法来使用该框架,那么实现该框架并不困难。如果你试图一下子接受这一切,特别是如果你没有一个好的计划来做到这一点,那就会变得更加困难。
Seiner:是的,AI将强调治理的重要性,就像它之前出现的任何其他东西一样,可以应用于数据仓库和分析平台的相同级别的治理必须应用于AI和大型语言模型。因此,你必须对数据进行控制,这是与之相关的挑战。你不能让任何人问高管的工资是多少,然后得到答案,例如,需要对人们可以看到和使用的内容进行限制。
还需要理解我们如何有效地使用AI。GenAI于2022年11月成为主流,它仍然是一门不断发展的学科和科学,而且它只会成为一个越来越有价值的工具,我们需要在数据周围放置控件,明白必须治理其数据的公司将比那些现在才开始的公司更有优势。
Seiner:这绝对不意味着你对数据治理的需求减少。大多数公司正处于开始考虑大型语言模型和部署产生式AI的阶段,但大多数大型公司还没有开始走这条路。任何公司如果想要确保他们的数据受到保护、共享,并遵循监管方面的担忧,确保数据不会重复,有高质量的数据,就需要数据治理。AI只是另一个应用程序。它可能感觉更多,但它实际上是对数据进行保护和控制的另一种应用。随着人们对AI的依赖程度越来越高,AI背后的数据将决定他们对AI的使用。
如果它提高了人们对数据治理的认识,那就是一件好事。如果它提高了人们对非侵入性数据治理的认识,那就更好了。
Seiner:第二本书的名字是《非侵入性数据治理再次出击》,这不是第一本书的第二版,它包含50篇文章,重点是我在世界各地的公司中使用这种方法所学到的教训和获得的观点。这本书很容易读,你可能不想把它直接读完,你可能会发现一个你感兴趣的话题,然后直接去做。这是在非侵入性数据治理方面学到的真正经验教训。这本书的标题暗示了这样一个事实,即非侵入性数据治理已经开始——以第一本书的形式出现。非侵入性和突破性的东西处于光谱的两端。
TOP