数据抽取非关系数据库ETL处理的数据源除了关系数据库外,还可能是文件,例如txt文件、excel文件、xml文件等
对文件数据的抽取一般是进行全量抽取,一次抽取前可保存文件的时间戳或计算文件的MD5校验码,下次抽取时进行比对,如果相同则可忽略本次抽取
以上内容由大学时代综合整理自互联网,实际情况请以官方资料为准。