2020 www 投稿复盘:
这篇文章经历非常坎坷,从2019年春节时开始准备,先是投了ijcai, 5月份出结果被拒,8月份修改了大实验,增加了验证性实验,投稿Ubicomp,以内容和普适计算领域无关被desk reject,最后修改一轮在10月份投了www。
在这个漫长的战线中,其实真正修改文章、补充实验的时间不到50%,大量的时间被耗费在等待导师意见的过程中。为了提高投稿的效率,可以有两种选择 1. 先斩后奏,看到合适的期刊先投着再说,至少能返回一些review意见。 2. 在等待过程开启新的课题,流水线作业,以量取胜。除此之外的经验教训是,导师不一定了解你做的工作,对你要投的track是否合适心里不一定有底,这次ubicomp desk reject 的理由就是与track无关, 有些主意一定得自己拿。
今年www首次设立rebuttal环节, 于12.12日收到review意见,相比于稿件数量爆炸性增长的某些顶会,www的reviewer 明显阅读稿件时更加认真,给出的意见也更加中肯,我也从review意见中收获良多,下面主要展示一些不足之处。
Review1 (strong reject):
- 与DeepCrime 过于相似。 这是非常无奈的一点,学术文章也是手快有,手慢无。idea出来发现已经被人发表了,心情就和吃屎一样,只能在他的基础上增加补充实验。 所以,写文章尽量立意新,方法新,这样在效果上就有一定的转圜余地。
- 文章和track相关性不高。
- 实验结果的重要性阐述。 MAE 提升的0.1个百分点对现实有何意义? 这个问题确实难回答,regression的预测指标不像分类问题那么直观。
Review2 (reject):
分段给出了评价。
- 拼写、语法、用词的错误,writing skill 还需再提升一下。
- 针对问题定义章节, 数据清洗方法未阐明,word2vec embedding 在少量天气条件下是否合理,输入输出不明确,对三类模型是否单独训练,每一层的数学表述没有必要,缺少模型参数的说明。 这里有的问题我在文章中是确实写明了,如输入输出,也给出了数学定义,对维度也做出了说明。如果review没有理解的话,推测依然还是写作的问题。
- 针对 evaluation部分, training / testing split 分割 需要对季节性差异做出解释(因为我只用了一年的时间,分为前3/4 和 后1/4);错误率的提高是否适用于真实场景;赞扬对于网络不同结构的效用研究,补充了建议,增加对模型参数数量的考量,比如,引入attention可能并非是attention本身的作用,也有可能仅仅是参数的增加带来的效用?
- 结论部分。建议增加一些讨论, 现实应用对预测的要求如何?未来的工作?evaluation的局限性?纽约可以代表其他城市么?如果犯罪分子提前知道了预测结果,而改变他们的行为,这种情况该如何处理?
Review3(reject):
- 缺少技术创新性,仅仅是结合了几种现存的方法。
- 技术细节缺少,如,demographic 特征的选择缺少理由;没有利用到poi上的check-in数据,poi上的语义信息;使用word2vec embed 天气情况的理由;SOTA方法用的不够多;baseline 里有用到 dynamic spatial pattern,但是paper里只用了static, 缺乏解释;
- 对中小型城市的效果如何? community的具体定义,是Public Use Microdata Areas (PUMAs)么? community对于实际应用来说依然太大?
自我检讨部分:这篇文章其实先天上就不足,属于赶鸭子上架的作品,作为毕业设计的延伸,我当时在完成毕设后完全没有发文章的念头,划水了大半学期,随后在导师和师姐的鼓励下,于2019年春节前后匆忙投出一稿,果然白给。在写作过程中,因为看到了很多比较水的文章,导致自己心态有点膨胀,对顶会甚至生出一股轻视之意,从而忽略了对遣词造句的精益求精。更糟糕的是,我在整个研究目标设计上没有明确的框架规划,前期调查中也没有阅读足够的相关文章,没有明确问题的输出以及评价指标,没有考虑训练的细节,没有提前预判合理的特征分析,导致在后面的特征提取、实验设计、baseline选取时不得不根据实验结果临时修修补补,导致整篇文章逻辑相对混乱,脉络不甚清晰。总而言之,这篇文章虽然带给我极大的挫败感,甚至归宿也未知(我甚至都不想理它),但也让我实践了一个科研的完整流程,对接下来的研究工作应该也具备奠基意义吧。