|
|
||
|---|---|---|
| .. | ||
| __pycache__ | ||
| README.md | ||
| __init__.py | ||
| data_insight.py | ||
| normalizer.py | ||
| outlier.py | ||
README.md
解析配置文件,在数据进入下一步前进行一定的预处理(如补充空值、采样等)
目前完成了Pre-process Lib的部分预处理功能,如下:
- data_insight
- DuplicateInsight - 重复数据的检测
- NullInsight - 空值数据的检测
- ValidationInsight - 数据有效性检测
- data_process
- FilteringProcessor - 数据过滤
另外:
- TypeInsight - 其中对date日期的检验方法还未完成
还未完成