投稿经验总结

2020 www 投稿复盘：

这篇文章经历非常坎坷，从2019年春节时开始准备，先是投了ijcai， 5月份出结果被拒，8月份修改了大实验，增加了验证性实验，投稿Ubicomp，以内容和普适计算领域无关被desk reject，最后修改一轮在10月份投了www。

在这个漫长的战线中，其实真正修改文章、补充实验的时间不到50%，大量的时间被耗费在等待导师意见的过程中。为了提高投稿的效率，可以有两种选择 1. 先斩后奏，看到合适的期刊先投着再说，至少能返回一些review意见。 2. 在等待过程开启新的课题，流水线作业，以量取胜。除此之外的经验教训是，导师不一定了解你做的工作，对你要投的track是否合适心里不一定有底，这次ubicomp desk reject 的理由就是与track无关，有些主意一定得自己拿。

今年www首次设立rebuttal环节，于12.12日收到review意见，相比于稿件数量爆炸性增长的某些顶会，www的reviewer 明显阅读稿件时更加认真，给出的意见也更加中肯，我也从review意见中收获良多，下面主要展示一些不足之处。

Review1 （strong reject）：

与DeepCrime 过于相似。这是非常无奈的一点，学术文章也是手快有，手慢无。idea出来发现已经被人发表了，心情就和吃屎一样，只能在他的基础上增加补充实验。所以，写文章尽量立意新，方法新，这样在效果上就有一定的转圜余地。
文章和track相关性不高。
实验结果的重要性阐述。 MAE 提升的0.1个百分点对现实有何意义？这个问题确实难回答，regression的预测指标不像分类问题那么直观。

Review2 (reject):

分段给出了评价。

拼写、语法、用词的错误，writing skill 还需再提升一下。
针对问题定义章节，数据清洗方法未阐明，word2vec embedding 在少量天气条件下是否合理，输入输出不明确，对三类模型是否单独训练，每一层的数学表述没有必要，缺少模型参数的说明。这里有的问题我在文章中是确实写明了，如输入输出，也给出了数学定义，对维度也做出了说明。如果review没有理解的话，推测依然还是写作的问题。
针对 evaluation部分， training / testing split 分割需要对季节性差异做出解释（因为我只用了一年的时间，分为前3/4 和后1/4）；错误率的提高是否适用于真实场景；赞扬对于网络不同结构的效用研究，补充了建议，增加对模型参数数量的考量，比如，引入attention可能并非是attention本身的作用，也有可能仅仅是参数的增加带来的效用？
结论部分。建议增加一些讨论，现实应用对预测的要求如何？未来的工作？evaluation的局限性？纽约可以代表其他城市么？如果犯罪分子提前知道了预测结果，而改变他们的行为，这种情况该如何处理？

Review3(reject):

缺少技术创新性，仅仅是结合了几种现存的方法。
技术细节缺少，如，demographic 特征的选择缺少理由；没有利用到poi上的check-in数据，poi上的语义信息；使用word2vec embed 天气情况的理由；SOTA方法用的不够多；baseline 里有用到 dynamic spatial pattern，但是paper里只用了static，缺乏解释；
对中小型城市的效果如何？ community的具体定义，是Public Use Microdata Areas (PUMAs)么？ community对于实际应用来说依然太大？

自我检讨部分：这篇文章其实先天上就不足，属于赶鸭子上架的作品，作为毕业设计的延伸，我当时在完成毕设后完全没有发文章的念头，划水了大半学期，随后在导师和师姐的鼓励下，于2019年春节前后匆忙投出一稿，果然白给。在写作过程中，因为看到了很多比较水的文章，导致自己心态有点膨胀，对顶会甚至生出一股轻视之意，从而忽略了对遣词造句的精益求精。更糟糕的是，我在整个研究目标设计上没有明确的框架规划，前期调查中也没有阅读足够的相关文章，没有明确问题的输出以及评价指标，没有考虑训练的细节，没有提前预判合理的特征分析，导致在后面的特征提取、实验设计、baseline选取时不得不根据实验结果临时修修补补，导致整篇文章逻辑相对混乱，脉络不甚清晰。总而言之，这篇文章虽然带给我极大的挫败感，甚至归宿也未知（我甚至都不想理它），但也让我实践了一个科研的完整流程，对接下来的研究工作应该也具备奠基意义吧。