该产品是一款对各采集到数据源文件进行整编,通过该软件可生产解析模板,按解析模板对同类型的数据文件进行自动解析,并转成结构化数据。企业大量Excel、word、专用协议等半结构化数据需要结构化入库。该产品有效解决因数据维度高,参数多,很难解析入库的数据类型。避免因每个文件或接口都需要程序员定制开发一次,耗时耗力不灵活等场景。
支持各类半结构化数据, 如Excel(.xls、.xlsx、.sylk)、Word(.docx)、CSV UTF-8(.csv)、DIF数据交换格式(.dif)、开放文档电子表格(.ods)、网页表格(.html、.htm)、制表符分割文本文件(.txt);
按解析模板对同类型的数据文件进行解析,并转成结构化数据;
数据解析时可根据业务需要提取必要的特征数据。特征数据主要包括常见的统计数据,如最大最小值、均值、方差、极差等。另外还会提取一些特定的特征数据,例如根据技术要求计算的一些高阶参数指标等;
支持为数据增加相应的标记,如分类、注释等,让数据成为可以被计算机识别分析的数据;
提供文件整编规则,有操作人员完成数据整编模板编辑并上传;
解析引擎自动批量解析数据,半结构化数据批量结构化;
可以生成图数据文件。图数据文件可以被扁平化输出、对外导出和结构化存储;
支持解析高维数据,并支持将高维数据输出成二维数据。支持以图Graph的形式存储高维数据。
非IT开发人员可以使用可视化界面设计如何解析数据文件;
可视化建模,一次建模永久使用;
支持各类半结构化数据;
解析引擎自动批量解析数据,批量解析性能极大提升至秒级;
支持解析高维数据,并支持将高维数据输出成二维数据;
支持以图Graph的形式存储高维数据。