距离览会开幕还有 0

优秀产品

全国农产品价格监测预测系统

日期:2014-11-05 11:10   来源:专题展筹备办   作者:

  优秀产品:产品提供商名称:南京绿色科技研究院有限公司

  一、应用领域

  系统不仅可以为农业生产者经营者提供快速直接的农产品价格信息服务,同时还可以为农产品交易主体及政府主管部门提供高效的辅助决策支持。

  二、主要性能与重点解决的问题

  系统智能化程度高,实现信息自动采集、提取、预处理、分类、聚类、文本挖掘和自然语言处理、其采集性能可以实现自动采集全国农产品批发市场蔬菜、果品、粮油、畜禽、水产品等近300个品种的价格信息和分析信息,云采集效率约为10万条/小时,数据挖掘分析效率达到100条/秒,云服务查询响应时间达到毫秒级,每日更新的有效数据记录约为20万条,并对信息进行深度挖掘分析和相关性分析。

  系统基于“云采集”+“智能终端上传”模式进行价格数据收集,“云采集”模式利用云计算技术从互联网涉农网站、搜索引擎及批发市场网站对全国各地的价格数据进行分布式采集,然后对数据进行统一的转换、清洗、去重、汇总和保存。“智能终端上传”模式则是利用智能手机客户端软件对本地的市场价格数据进行人工上报汇总。因此,系统可以实现本县市、本省和全国价格的统计比较分析,同时对价格的短期预测和长期趋势预测也更为精确。

  三、产品的架构图和主要功能模块

  

  图1 “行情通”农产品价格智能监测平台架构

  四、主要技术特点及创新点说明

  自动采集(Auto-Crawling),利用计算机自动采集技术(网络爬虫技术)构建网络采集机器人,每天从互联网上自动收集全国农贸批发市场的价格信息及专家分析信息。

  信息抽取(Information Extraction),针对所采集网页的布局特点和网页标签进行解析和定位,从网页信息中自动提取有用的信息元素。在信息提取的过程中,系统会自动探测网页字符编码,并进行统一转换。

  自动分类(Auto-Classification),系统利用数据挖掘中的自动分类技术,构建自动分类模型,对所采集的涉农信息进行自动归类。

  自动聚类(Auto-Clustering),自动聚类技术是对未进行类别指定的样本进行自学习,根据样本之间的相似度自动归类。与分类技术不同的是,聚类无需训练样本,可以进行自适应学习。

  文本挖掘和自然语言处理(Text Mining and Natural Language Processing),系统借助自然语言处理中的词法分析、句法分析、语义分析等语法分析手段,结合文本挖掘中的建模技术对采集的文章进行分析,从中抽取出描述专家观点的句子和段落,并从专家观点中挖掘出农产品价格的长期趋势预测信息以及农产品价格涨跌的影响因素,为用户在农产品价格信息方面给予建议和指导。

  时间序列挖掘(Time Series Mining),系统利用自主开发的改进的ARIMA(Auto-regressive Integrated Moving Average Model)时间序列挖掘技术对农产品价格进行建模,然后对未来短期内的农产品价格进行预测。

  多维统计分析(Multidimensional Statistical Analysis),系统的多维统计分析功能模块通过计算各种统计变量(最大值、最小值、均值、方差、标准差、涨跌幅等),对价格数据从多个角度和维度进行对比分析。

  五、获奖情况

  2014年江苏省高新技术产品证书,国家发明专利2项,江苏省经信委和南京市经信委新兴产业重点推广应用产品。

 
下载文件: