首页>中国>搜索>正文

AMiner - AI赋能科技情报挖掘-学术搜索-论文检索-论文专利-文献追踪-学者画像

AMiner - AI赋能科技情报挖掘-学术搜索-论文检索-论文专利-文献追踪-学者画像

AMiner由清华大学计算机科学与技术系建立,包含了超过3.2亿学术论文/专利和1.33 亿学者的科技图谱,提供学术检索、论文检索,推荐订阅、论文专利、学者画像、文献追踪、趋势分析等科技情报服务,是拥有我国完全自主知识产权的学术科技情报大数据挖掘与服务系统平台。

AMiner(aminer.org)旨在为研究者社交网络提供全面的搜索和挖掘服务。在这个系统中,我们的重点是:(1)通过从分布式网络中提取信息,为每个研究者创建一个基于语义的档案;(2)整合来自多个来源的学术数据(例如,书目数据和研究者简介);(3)准确搜索异构网络;(4)从已建立的研究者社会网络中分析和发现有趣的模式。AMiner中的主要搜索和分析功能包括:

概况搜索:输入研究员姓名(例如,唐杰),系统将返回使用信息提取技术为研究员创建的基于语义的概况。在个人资料页面,提取整合的信息包括:联系方式、照片、引用统计、学术成果评价、(时态)研究兴趣、教育历史、个人社交图、研究经费(目前只有US和CN)、发表记录(包括引用信息,论文自动分配到几个不同的域)。

专家发现:输入一个查询(如数据挖掘),系统将返回该主题的专家。此外,该系统将建议关于该主题的顶级会议和排名靠前的论文。有两种排名算法,VSM和ACT。前者类似于传统的语言模型,后者基于我们的作者-会议-主题(ACT)模型。用户还可以对搜索结果提供反馈。

会议分析:输入一个会议名称(例如,KDD),系统返回谁是这个会议上最活跃的研究人员,以及排名靠前的论文。

课程搜索:输入一个查询(如数据挖掘),系统会告诉你谁在教与查询相关的课程。

子图搜索:输入一个查询(例如,数据挖掘),系统首先告诉你哪些主题与该查询相关(例如,五个主题“数据挖掘”、“XML数据”、“数据挖掘/查询处理”、“Web数据/数据库设计”、“Web挖掘”是相关的),然后显示在每个相关主题上发现的最重要的子图,并增加子图的摘要。

主题浏览器:基于我们的作者-会议-主题(ACT)模型,我们从出版物中自动发现200个热门话题。对于每个主题,我们会自动分配一个标签来表示其含义。再者,浏览器呈现最活跃的研究者,最相关的会议/论文,发现话题的演变趋势。

学术排名:我们定义了8个衡量标准来评估研究人员的成就。衡量标准包括“h指数”、“引用”、“上升趋势”、“活跃程度”、“寿命”、“多样性”、“社交能力”、“新星”。对于每个度量,我们输出不同领域的排名列表。例如,可以搜索谁在“数据挖掘”领域的引用次数最多。

用户管理:可以注册为用户以:(1)修改提取的简档信息;(2)提供对搜索结果的反馈;(3)在Miner中跟踪研究人员;(4)创建一个AMiner页面(可用于宣传confs/workshop,或招生)。

AMiner.org已经在互联网上运行了三年多。目前,该学术网络包括6,000多个会议、3,200,000个出版物和700,000个研究人员简介。该系统吸引了来自200多个国家的用户,每天接收超过200 000个访问日志。用户来自的前五个国家是美国、中国、德国、印度和英国。