人工智能领域的全局认识
Table of Contents generated with DocToc
0. 摘要
从 Google Scholar 获取大牛名称,从大牛的主页获取五位领域大牛的所有论文;从知网获取中文硕博论文;从 Google Scholar 和 Journal Rankings 获取顶级期刊名称,从其中的开方期刊获取它的订阅。
1. 背景
ch1 基础任务:运用至少两种实践策略,形成对「心理学」或自己感兴趣领域的全局认识,记录探索过程,完成一份信息分析报告。
注意:使用的实践策略中须包含「获取该领域中文所有硕博论文」。
2. 分析过程
2.1 思路
学前思考:
如何做到全局认识具有较好的保真性?
之前写毕业论文的时候,做了财务预警领域的全局认识,当时的方法是
- 用三个关键词的或表达式在 WOF 检索论文,导出所有论文的记录
- 用罗绍峰老师推荐的 HistCite ,添加遗漏的文献;统计不同作者的文献频次,找到领域大牛;建立文献引用网络图,找出最重要的综述文献
- 从综述文献和大牛发表论文的变化,了解了领域已有的研究和前沿
由于之前做的领域极小,WOF 核心期刊中仅有2000篇论文与领域相关,所有能用几个关键词去获取领域的全部文献,但此法用在这里可能就不适用了
没有想到清晰的实践步骤
思路:
- 占有全局信息:获取前42大牛的论文、获取中文硕博论文、获取顶级期刊论文
- 获取最小知识:源头论文、发展脉络、反驳观点
2.2 具体步骤
(耗时2.5h)获取领域大牛排名:Profiles,挑选第一页5位听过的学者,批量下载他们的论文,以Geoffrey Hinton为例:
维基百科一下学者的名字:杰弗里·辛顿 - Wikiwand,是机器学习领域的加拿大首席学者,确定是大牛没错
点击 wiki 页面最下方的外部链接,到达他的个人主页:Home Page of Geoffrey Hinton
找到 Publication 页Geoffrey E. Hinton's Publications: in reverse chronological order,用 chrono 批量下载
下载后拖入 Zotero 对应的目录
(耗时0.5h)下载硕博论文
在知网首页打开硕博论文的检索页,选择人工智能这一学科,直接点击检索。勾选需要的结果
导出文献
将下载下来的 txt 格式的文件导入 EndNote,注意从 Option 选择导入的文件格式
从 Endnote 导出所有条目,格式为 XML,在从 Zotero 导入 XML 文件(不能拖入),得到
挑选感兴趣的标题,读一下摘要,获取信息点
(耗时2h)查找顶级期刊:
获取期刊排名:期刊的排名从两处获取:Google 的期刊排名(即模板的Top20-ArtificialIntelligence)和Journal Rankings on Artificial Intelligence
挑选感兴趣的主题,例如 arXiv Artificial Intelligence (cs.AI),恰好是开源库,搜索到期刊的主页Artificial Intelligence authors/titles recent submissions
在arXiv.org e-Print archive的最下方,点击 Feeds
获取订阅的 URL:http://export.arxiv.org/rss/cs.AI
在 Zotero 里订阅,点击方框-->新建订阅-->来自 URL,输入 URL,保存
获取最小知识,待补充
3. 结论
占有了所有中文重要硕博论文,以及5位领域内大牛的所有论文,顺带关注了几个实验室和领域相关的经典论文www.mlsurveys.com。还未找出最小知识。
4. 讨论
4.1 对结论的讨论
中文硕博论文的元数据可在知网一处获取,较为容易,对于感兴趣的论文,也可借助学校的 VPN 获取资源。
大牛大多都不认识,未找到几个靠谱的排行榜进行交叉验证(只找到Artificial Intelligence: Top 100 Influencers, Brands and Publications 2017和AI Influencers 2017: Top 30 people in AI you should follow on Twitter - Watson,混杂了企业家和科幻小说家),等对领域更加熟悉后再继续进行。
顶级期刊,论文数量远大于前两者,arxiv 等开发资源可借助网友提供的工具批量获取,例如Arxiv Sanity Preserver。但这么多的论文不知道怎么去管理,可能需要借助 Citespace 等知识图谱工具。人工智能领域与之前接触的财务管理领域不同,该领域顶级会议的论文似乎是最重要的,比期刊更加重要,因此要关注会议。从 dblp: computer science bibliography获取的统计也证实了这一点。
4.2 可优化的环节
获取大牛的论文太耗时了,等对领域更熟悉之后,可整理出一个排名,然后 Google:XXX + Publications,快速找到大牛的论文
4.3 收获:开放获取期刊初体验
做作业的没忍住,了解了一下arXiv.org e-Print archive,arxiv 收录了数学/物理/计算机/统计等领域的论文,其他领域也有相似的开放期刊获取,参见List of open access journals - Wikiwand。在开源数据库检索论文,会比 Google Scholar 的论文质量更高,更相关,时效性也更好。
4.4 收获:寻找优质资源遇见更多优质资源
用英文检索大牛和顶级期刊时,很多网页点进去,发现很多没见过,但被 Zotero Translators 收录的网页。大牛的主页也有很多优质资源,例如实验室、研究项目、课程、书籍、论文等等。
5. 参考文献
- Profiles
- 中国知网
- Journal Rankings on Artificial Intelligence
- www.mlsurveys.com
- arXiv.org e-Print archive
- List of open access journals - Wikiwand
- 如何学习科学:开放科学工具箱 - 阳志平的网志
- 免费知识哪里来——Arxiv使用指南 – ThoughtWorks洞见
ChangeLog
2018-05-10 初稿