-
Notifications
You must be signed in to change notification settings - Fork 174
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
数据质量Metric新增完整性校验 #466
Comments
你说的数据日志指的是什么? |
|
这个校验文件的数据能不能写到一张表里面呢?比如把文件里面表名、记录数。数据时间插到一张表里,然后期望值增加一种自定义脚本的类型,写SQL读取对应的记录数进行比较 |
实际上我们目前的系统里已经有这么一张表,我们成为“日志表”,希望能够根据“日志表”里的数据时间、数据表名称作为输入参数来查询本地数据库里的记录数,然后和“日志表”里的数据记录数来比较,以此来确定数据是否是完整的。 |
那你可以使用数据对比检查中的两表值比对规则,通过写自定义SQL进行比较 |
Search before asking
Description
后续能否新增基于数据日志的完整性检查,目前比较接近的检查方式包括“表行数检查”,“平均值检查”,但缺少完整性检查的metric,也即数据日志中记录了主数据的记录数,可以通过比较日志中的信息和计算出来的主数据记录数来比较数据是否完整。
感谢datavines开源团队。
Usage Scenario
No response
Related issues
No response
Are you willing to submit a PR?
The text was updated successfully, but these errors were encountered: