论文指南
本检查表是一份主观性较强但实用的指南,用于检查计算机科学论文(特别是会议和期刊投稿)中的写作质量、结构合理性和内容呈现。尽管部分条目具有主观色彩,但其目标是提供具体提醒并指出常见问题。本项目为持续更新版,欢迎社区反馈与修订。
1. 🎯 标题与摘要
- 1.1 标题应不超过 15 个词。避免使用通用短语(如“A Novel Framework...” 这种信息量低的表达)以及过于狭窄的主题(会减少潜在读者),目标是简洁且信息充足。
- 1.2 标题应明确体现问题和解决方案,并包含至少一个技术关键词(如 jailbreak、OOD detection、graph learning)。
- 1.3 避免使用冷僻或歧义缩写。LLM、AI、ML 这类缩写在 CS 领域是可以接受的,但 AD(可能是广告或异常检测)这类就应避免。
- 1.4 摘要应包含四个核心要素:(1)问题或任务定义,(2)提出的方法或思想,(3)主要结果,(4)广泛意义或影响(部分内容可合并)。
- 1.5 摘要避免未定义的缩写,以及模糊的形容词(例如 “important”、 “novel”、 “state-of-the-art” 等不加说明的表述)。
- 1.6 附加项:摘要中应至少包含一个具体的、可量化的结果或发现以增强吸引力。例如:“我们的方法在 jailbreak detection 上实现了 11.2 倍推理加速。”
2. 📚 引言部分
- 2.1 在前两个段落中清楚地定义研究问题或任务。
- 2.2 引言应包含真实应用背景或相关工作引用(最好两者都有)。
- 2.3 引言结尾简要介绍方法名称及其基本思想。
- 2.4 明确列出贡献(如:“(1) 首个框架..., (2) 新数据集..., (3) 大规模实验...”)。
- 2.5 每项贡献都应明确、可验证,避免使用“提供见解”、“提升理解”等模糊表述。
- 2.6 彩蛋:第一页中包含吸引人的图,如与现有工作的比较、性能亮点或核心思想示意图。
3. 🔍 相关工作
- 3.1 所有引用的工作都应与本文方法、基线或任务直接相关。
- 3.2 至少提及近年被引用次数最多的 3 篇相关论文中的一个作为 baseline。
- 3.3 相关工作部分不超过 1.5 页(除非是综述类论文)。
- 3.4 可使用 LLM 辅助检索,但所有引用必须手动验证,切勿盲信 LLM。
- 3.5 彩蛋:使用相关工作部分引出 baseline 算法,结合表格展示新方法的优势。
4. 🧪 方法部分
- 4.1 所有符号在首次出现时均已定义。
- 4.2 所有公式均有正文引用与解释(如 “Eq. (3) 表示...”,若未引用可考虑内联以节省空间)。
- 4.3 方法的每个模块或组件都有图示或文字描述。
- 4.4 每个小节最好与总览图中的组成部分对应,并在展开前写一个总览段。
- 4.5 总览图和伪代码无需都放正文,伪代码建议放附录。
- 4.6 本节内容应让审稿人无需查看附录或代码即可理解方法。
- 4.7 彩蛋:删除不会影响理解的内容,长数学公式 ≠ 好论文。
5. 📊 实验部分
- 5.1 使用不少于 3 个数据集(除非文章为新数据集介绍)。
- 5.2 比较不少于 3 个 baseline 方法,并说明为什么选这些方法,它们是否是 SOTA。
- 5.3 包含至少一个消融实验。
- 5.4 在合适情况下报告标准差或置信区间。
- 5.5 描述硬件环境、使用的软件库和超参数。
- 5.6 不忽略负面结果,失败案例有参考价值。
- 5.7 评估指标需定义清晰,并说明合理性。
- 5.8 图表在正文中都有引用。
- 5.9 除了“数值优于 baseline”,是否有深入分析,如为何方法有效或失败在哪。
- 5.10 彩蛋:考虑他人复现难度;若有“trick”应去除。
6. 🧾 写作质量与风格
- 6.1 所有缩写首次出现时有定义(如 ML、LLM),不重复定义。
- 6.2 无长句(>25词)不加逗号或句号。
- 6.3 无段落超过 10 行。
- 6.4 被动语态比例应低于 30%。
- 6.5 彩蛋:检查是否充斥 LLM 风格的华丽词汇(如 encompass, intricate 等)。
7. 🖼️ 图表部分
- 7.1 所有图表标题 ≥ 2 行,并包含解释内容;避免无说明地插图。
- 7.2 图中文字大小 ≥ 8pt,标签清晰不被裁剪。
- 7.3 所有配色在灰阶打印下依旧可辨别(部分审稿人会打印论文)。
- 7.4 所有方法都在图例或表格中标明。
- 7.5 图表优先放页面顶部(非硬性要求,但更清晰)。
- 7.6 无冗余图表,每张图都提供新信息。
- 彩蛋:图表为无损格式(如 PDF),严禁使用低分辨率图片。
8. 🧱 结构与排版
- 8.1 无 LaTeX 警告或 bad boxes。
- 8.2 小节标题符合论文结构(如 Introduction, Method, Experiments 等)。
- 8.3 正文中需明确引用附录具体章节(如 “见 Appendix B.2”)。
- 8.4 全文不得出现孤立行(orphan line),即段首或段尾仅一行。
- 8.5 不连续堆叠多个图表,中间必须有解释文字。
9. 📎 参考文献
- 9.1 引用格式符合目标会议或期刊要求。
- 9.2 所使用的数据集、工具包、模型等均已引用。
- 9.3 至少引用一篇目标会议/期刊的文章。
- 9.4 自引比例 ≤ 20%。
- 9.5 BibTeX 已去重并检查拼写错误。
10. 🛑 引用真实性检查(避免 LLM 幻觉)
- 10.1 所有引用已手动验证其真实存在,标题、作者、会议与年份均匹配。
- 10.2 不包含由 LLM 虚构的引用。
- 10.3 若由 ChatGPT、Copilot 等生成引用,需在 Google Scholar 或 Semantic Scholar 等站点交叉验证。
11. 🧠 提交前的最终检查
- 11.1 PDF 可在 Overleaf/本地无警告编译。
- 11.2 文件命名符合投稿要求(匿名时不可包含作者信息)。
- 11.3 无任何泄露作者身份的信息(如元数据、文件名、代码注释)。
- 11.4 论文总长度(包括参考文献与附录)不超过页数限制。
- 11.5 论文已由非作者完整阅读一遍,且无需中途停顿查阅。
- 11.6 所有合作者已列出,避免遗漏作者(真实案例屡见不鲜)。
- 11.7 彩蛋:提交后,换设备换系统(如 Windows/Mac)登录检查论文显示是否正常。
本项目属于 cs-paper-checklist。欢迎通过 PR 提出修改建议。