专利文献的检索现状
摘要
关键词
专利文献 语义检索
正文
0 前言
专利文献始于专利法的产生而存在。在计算机尚未普及、特别是尚未商业应用的年代,专利文献以纸质文件形式保存,因而文献检索靠人工翻阅大量的纸质文件完成。计算机及数据库应用给予了文献检索工作极大的便利性。
1 政府数据库应用
现有政府主导的专利数据库类型有摘要数据库、全文数据库,而在世界各专利局中应用范围较广的专利数据库主要包括世界知识产权组织的WOTXT、欧洲专利局的维恩库(VEN)和德文特数据库(DWPI)、日本特许厅的JPABS、美国专利商标局的USTXT以及中国的SIPOABS和CNABS以及CNTXT。这些数据库各有各的特点,收录的专利文献数据也有所不同,但是在数据字段结构上具有较大的相同点,因而在检索时检索方法和手段可以有很好的通用性。当然,即使具有这些数据库,检索员也都是需要在检索系统中通过键入大量字段信息获取相关的专利文献。
2 非政府主导的专利检索手段
2006年12月14日,Google发布了一项新的搜索服务Patent Search[1],通过该服务,用户可以搜索到所有美国的专利申请信息,包括专利申请号/公开号、发明人/申请人、摘要、图片信息以及发布日期。继Patent Search推出之后,百度公司与国家知识产权局中国专利信息中心达成合作协议,构建了针对中国专利数据信息查询的专利搜索服务[2],提供全面、丰富、权威的专利检索信息。这两大搜索引擎可以通过关键词检索的方式进行检索,主要是关键词的完全匹配,虽然语义检索是这两家公司最为骄傲的搜索手段,但是在专利检索中这种语义检索手段并没有得到较好的应用。杨宏章等[3]提出了利用专利文本结构化特征进行专利文献检索的思考。程晓静等[4]通过结构语言分析的方法讨论了药物专利的检索问题。索意互动(北京)信息技术有限公司开发出的Patentics[5]采用全球先进的新一代文本自动理解/概念搜索技术,也即语义扩展技术,并且能够和传统的布尔运算相结合,自动在专利数据库中搜索专利文献,在专利文献的语义检索之路上踏出了重要的一步,并使专利文献服务商业化,但是,该检索引擎将待检索的专利文献全文看作一个整体概念进行检索,并没有对文献的重点进行划分,也就是说并没有关注到专利的发明要点上,从而导致不能突出专利的要解决的技术问题和技术效果,这样的“全面性检索”靶向不清,会出现很多的噪音文献,增加用户的筛选文献时间。还有其它智能检索系统,比如Total patent检索系统[6],运用了语义检索模块,用户在使用时可以输入部分词句进行扩展查询,但是这些系统较多地需要人工对关键词进行标引,具有人工干预需求大、系统复杂性高的特点。
3 总结
目前虽然专利检索及语义检索分别在各自领域有了较大的发展,但是两者的结合应用程度并不高,基于语义关键词的专利文献智能检索功能性差,因而将专利检索与语义检索有效结合,构建智能检索系统将为专利文献的快速检索提供便利。
参考文献
[1] 胡莹. 浅议Google Patent Search专利搜索[J]. 企业导报,2012:260-261
[2] 百度专利搜索. https://wapbaike.baidu.com/item/百度专利搜索/10011266?fr=aladdin,2012-12-28
[3] 杨宏章,付静. 利用专利文本结构化特征构建专利信息智能语义检索系统的方法[J]. 情报理论与实践,2015,38(4):136-138
[4] 程晓静,程文堂,王艳. 自然语言处理技术在药物专利检索中的应用研究[J]. 情报学报,19(5):577-580
[5] 贺秀莲,韩雪莲. 专利情报检索与分析工具——PATENTICS[J]. 情报探索,2014(1):79-81,86
[6] TotalPatent全球专利数据库介绍及使用,http://wk.baidu.com/view/1e055e7201f69e3143329403?pcf=2#1,2010-10-5
...