GeoScene GeoAnalytics Server——空间大数据高级分析软件
GeoScene GeoAnalytics Server是GeoScene Enterprise的矢量大数据分析服务器产品,具有高性能、高稳定性、高可扩展性三大优势。它提供了一个分布式计算框架,来处理带有时间、空间、属性的大规模矢量数据或者表格数据。通过GeoAnalytics Server,可以大大提升千万级、亿级数据的分析计算效率。与此同时,还提供了基于业务需求的场景化模型构建能力,如常用的时空数据处理、洞察分析挖掘、趋势价值预测等能力。
多源数据融合治理
1. 数据汇聚:把离散的、分散的、不同来源的时空数据和表格数据,进行统一汇聚,汇聚到大数据分析资源池中,通常大数据分析资源池以分布式存储形式提供;
2. 数据清洗:对数据进行多个维度的清洗和检查,包括空间数据结构检查和处理、空间数据自相交检查和处理、异常点检查和处理、空间数据投影检查等内容;
3. 数据融合:实现不同维度的数据融合处理,如针对二调数据的线、与面进行转换和融合处理;
4. 数据质检:空间数据的几何错误检查、拓扑关系检查、数据的质量和精度保障;
5. 数据存储:针对时空数据进行基于业务流程的汇聚和管理、清洗和质检以后,对数据进行入池存储。
分布式计算和洞察挖掘
GeoScene GeoAnalytics Server提供了多种大数据分析工具和能力,这些工具覆盖了数据治理、空间统计、模式分析与洞察预测等众多方面,能够针对全域时空数据进行分析计算和洞察挖掘。
分布式计算和洞察挖掘
GeoScene GeoAnalytics Server提供了多种大数据分析工具和能力,这些工具覆盖了数据治理、空间统计、模式分析与洞察预测等众多方面,能够针对全域时空数据进行分析计算和洞察挖掘。
image.png
基于业务需求的模型构建
GeoScene GeoAnalytics Server产品能力是以用户业务逻辑为导向的,旨在解决传统业务难题、洞察数据背后的信息和价值、预测事务时空发展态势,因此,基于业务需求的模型构建方式方法,是平台的一大核心能力。
灵活的自定义工具扩展
GeoScene Geoanalytics Server提供了原生的大数据分析工具和可自定义扩展分析工具的接口,通过Pyspark,结合空间分析算法和Spark算子,实现大数据分析能力扩展。GeoAnalytics Server具备多种开发接口和扩展能力,包括Rest API、JS API、Python API等开发方式,同时可以基于RunPythonscript,基于需求进行自定义工具扩展。
多重计算框架支撑
GeoScene GeoAnalytics Server支撑多种计算框架,包括产品内置框架、第三方分布式计算框架,通过产品配置,可以实现多重分析能力使用,便于资源整合,也提升了大数据平台建设中,统一资源调度能力,通过灵活的任务调度机制,和智能化调度策略,实现多种计算框架支撑能力。
产品优势
基于分布式计算提升分析性能
GeoScene GeoAnalytics Server通过分布式计算框架,把一个复杂计算任务通过分解,由集群中多个节点统一执行,通过合理的资源调度,实现多次迭代和快速运算,从而大大提升复杂业务流程的计算效率。
在国家级、省级土地利用现状分析过程中,数据规模在千万级、亿级以上,通过对业务模型进行改造、优化业务流程,对比传统分析方式,使用GeoAnalytics Server的性能提升90%以上。