一条Twitter引发的学术争论NLP是
雷锋网AI科技评论按:一般认为计算语言学(CL)是语言学的一个分支,自然语言处理(NLP)是计算机科学的一个子学科。但是现在由于CL和NLP之间的界限越来越模糊,甚至两个领域的人常常去参加同样的会议,交流起工作来也完全没有障碍,于是一个问题出现了:NLP是跨语言学和计算机科学的交叉学科吗?
雷锋网注意到,近日在NLP学术圈里,因为Twitter上的一个推文引发了对这个问题的一场小争论。
一、TheBeginning
事情的过程大概是这样的:
华盛顿大学著名的语言学教授EmilyM.Bender在审核一篇跨语言应用的论文时,为作者数据集的混乱不堪发愁,于是就发了个twitter:
直接的评论到没有,转推也就两个。但两个转推却引来两场争论。一场主要关于怎么用数据集的,因为和本文无关,这里我们就按下不表了。
另一场争论起点是这样的:
推文转了四天,到了纽约大学计算科学与数据科学的助理教授KyunghyunCho这里,他抱怨说:“为什么我不用更多的语言?因为投稿ACL反馈回来的评审意见是:‘奇怪,作者竟然选择用土耳其语-英语数据集’。”
这条推文本身也是对数据集问题的响应。EmilyBender教授是这么回复的:会不会是因为(由于ACL是跨学科的)人手不够,不能相互审查?
我们知道,推文就像聊天,不一定看到的人联想到什么呢,所以推着推着话题就变了。接着“interdisciplinarity”这个词,约翰霍普金斯大学JasonEisner教授(nlp几个神牛之一)的博士生RyanCotterell加入了讨论:
RyanCotterell:整体上来看,我不认为ACL是跨学科的。它将机器学习应用到语言数据上,很大程度上和语言学理论是不相干的。
EmilyBender:再次声明,NLP绝不只是机器学习的一个应用领域——即使机器学习在NLP上越来越有效。
……
一个是著名的语言学教授,一个只是一个博士生,在国内可能Ryan早早缴械投降,说“我one-million-percentendorseEmily教授的观点”了。但Ryan毕竟也是大牛的学生,并不怯于和教授辩论。
二、ACL是跨学科的吗?
随后的内容就变得越来越复杂,也有越来越多的人加入争论。
加上twitter个字符的限制,道理更是说不清。于是RyanCotterell决定做两件事情:
1)在medium.
转载请注明:http://www.abuoumao.com/hytd/3647.html