在本书中指出AI-Readiness包含以下要素:
数据质量
完整性
一致性
无偏性
时效性
来源和可靠性
访问
数据格式
交付选项
使用权(清晰、机器可读的许可证)
安全 ...
/隐私(保护受限数据)
文档
机器可读的元数据(关于数据的信息)
数据字典(关于每个参数的信息)
标识符(唯一标识数据集的编号/代码)
以上要素可作为数据发布者对自身数据AI-Readiness ...
作为数据发布者,唯有元数据、文档和数据质量是可以直接控制和改善的。因此,过去的大多数关于数据的AI-Readiness的研究都聚焦在这一方面。
METADATA AND DOCUMENTATION(元数据和文档):这仍然是评价数据AI-Ready与否的核心特征,包括元数据的完善程度、数据检索和访问的难易程度以及数据质量等因素。
NOAA发布的《企业数据管理手册》和“AI-Ready Open Data”资源,为数据的AI-Readiness在数据质量、访问和元数据文档等方面提供了一系列评价指标。