亿橙文献挖掘管理平台

是一款用于科技文献信息管理与分享的软件平台,它涵盖数据流处理、数据库发布、数据管理、文献分发、文献挖掘等领域,为客户提供文献使用全生命周期管理服务。

产品介绍

产品案例

动态全文检索数据库

单服务器可管理亿级数据,动态增删改查数据可实时参与检索,傻瓜式无障碍操作界面

内容管理WEB发布系统

类百度的超简洁检索入口,支持多库多表统一检索,可选复杂检索语法,一键完成数据库的发布

跨域共享检索系统

无需复杂配置,可在云端共享外部数据库,无差别化的集成到内部发布系统

专题文献分选系统

通过主题词序列,可自动将多个文献库中相关文文献自动整理形成专题库

文献知识树构建与发布系统

可建立知识树结构,将海量文献,分别归纳到各个树节点,实现数据精准浏览

文件管家平台

数字方志检索平台

中医临床文献管理平台

中医实验室文献管理平台

数字图书馆资源管理平台

数字采集分析管理平台

情报跨域共享检索平台

年鉴资料归档检索平台

案例2:数字方志检索平台

客户对象:方正集团

方正集团在推进全国的数字方志检索项目时,市场上所有的全文检索软件(当时包括百度和TRS等知名公司)仅支持两字节汉字,而大量的唐代、宋代、元代的古籍文字归属在UCS-4的范畴,无法检索这批汉字,首先会给客户使用带来缺失,其次会使文献的研究利用工作无法展开。

接到合作伙伴的技术需求后,我公司仅用1个月时间就完成了技术核心研发,在全国范围内独家支持四字节编码的汉字。直至今日,方正依然采用我们的全文检索内核为数字方志项目提供技术支撑。

案例1:文件管家平台

客户对象: 西宁市人民政府

为解决西宁市人民政府对电子化文档的安全管理和精准快速查找需求,我们为其策划实施了内部网络版“文件管家”软件。 在文件管理上,我们兼容Windows的多层文件夹管理方式,同时并存标签管理方式,用户可选对文件进行多标签标注,标注的文件,可通过标签形式进行分类浏览,帮助用户迅速定位文件。

在文件检索上,依托我公司优势,可对Office全系列文件、WPS全系列文件、PDF文件、HTML、文档扫描图片、视频(内嵌文本)、压缩包等数种格式进行全文检索,检索结果可智能预览,可精准告知用户命中结果在文件第几页,并标亮命中关键词。100T以上、共计数百万的文件,全文检索响应速度可控制在1秒以内。

案例3:中医临床文献管理平台

客户对象:国家中医临床(糖尿病)研究基地

国家中医临床研究(糖尿病)基地是三所国家级糖尿病基地其中之一,基地以研究为基础,搜集和购买了各类中外文文献、论文、期刊,全文总量超过150T,通过关键词返回的数据结果数以百万计,即使利用权重技术优化排序,也无法快速定位关键文献。

我公司为其研发了文献挖掘工具,利用深度嵌套检索语法,在医学专家和技术专家的共同努力下,将疾病按病症进行知识树分类,最终将千万级数据归纳到各个子节点,每节点平均仅数百条数据。最终为科研工作者带来了智能的访问体验,获得了客户的一致好评。

案例4:中医实验室文献管理平台

客户对象:国家中医药管理局重点实验室

基于之前在糖尿病基地完成的150T数据自动归类经验,利用自然语言处理和深度学习模型,我们为妇科重点实验室、眼科重点实验室、内分泌科完成了文献数据库系统,为病理学家和临床医生提供了专业疾病分型体系,极大了方便了专家的研究学习工作。

该系统采用无主题词模式,基于TensorFlow深度学习框架和我们自研发的亿橙大数据检索平台,结合NLP技术的分词、文本分类、词性标注等基础能力,在前期准备的少量标引数据完成后,分类过程完全由我们提供的学习平台完成,对增量数据可完成自动归类。 经实验室专业学者检验,针对电子版论文和期刊,2019年全年自动分类平均准确率在93.7%以上。目前,通过模型的优化,准确率还在进一步提升中。

案例5:数字图书馆资源管理平台

客户对象:总参某研究所 、中国船舶 、中国航发四川燃气涡轮研究所 、江南电子研究所

针对众多科研院所对文献综合利用的需求,我们以全文检索为中心,围绕文献领域设计了针对数据流处理、发布、管理、分发、挖掘等操作的管理平台。

该系统分别在总参某研究所、中国船舶、中国燃气涡轮研究院、江南电子研究所等多个军队及军工单位研究所进行了部署。针对这类单位数据库分散、数据类型多、专业知识强、自产文件多等特点提供了多库整合、异构检索、专题库建立、自建库整合等解决方案,很好的解决了此类单位数据整合、数据检索、数据应用等现实需求。特别是为某所提供了几十个数据库、上百TB数据的毫秒级整合检索,大大提高了文献的应用效率和检索速度。

案例6: 数字采集分析管理平台

客户对象:中科院光电所

利用全文检索核心优势,我们为光电所开发了互联网数据采集工具,该工具自动根据目标网站数据排列特点,以模拟人工的方式将最新资料及时采集到本地,结合特征对比、正文提取、关键词提取等技术对海量数据进行定向化筛选,完成数据分类和聚类工作,最终根据每位研究员设定的主题词,推送到最终用户桌面,为用户查新工作带来全自动化智能体验。

案例7:情报跨域共享检索平台

客户对象:成都科学技术情报研究所

成都市科学技术情报研究所主要围绕全市科技进步、经济建设和社会发展需要,为政府和企事业单位,提供科技信息咨询服务和公共技术服务。目前各城市情报所建设状况不一,储备的数据各有不同,涵盖专利、文献、图书等领域,缺乏有效的数据协同渠道。

我们利用现在文献管理产品,为情报所设计了“跨域共享检索系统”,该系统是一个分布式检索解决方案,可实现在不同的地域之间、不同的服务器之间的统一全文检索需求,实现单位与单位之间,部门与部门之间的数据互联互通。 通过该系统,实现了城市间同级情报所数据的共享利用,综合提高了各地文献利用率。

案例8:年鉴资料归档检索平台

客户对象:四川年鉴社、成都年鉴社

2003年起,我们持续为成都市统计局、四川年鉴社和成都年鉴社提供年鉴资料归档检索系统,每年将传统的纸质年鉴按目录制作成可目录浏览的分类,形成WEB站点,为全社会服务。同时利用全文检索挖掘核心,为检索提供智能化数据结果反馈。

例如搜索“2003年到2018 CPI指数”,系统会自动在全库中搜索逐年CPI数据,将数据按摘要或图表的方式,有条理的展现给最终用户,并将所有依据和来源列出。