科研技能辅助当前方向前进

Wings Lv1

碎碎念

之前没有系统性地针对科研这一块进行梳理,是因为一方面之前读研的时候看了太多的论文需要去缓一缓,重新思考一下科研对自己的意义;另一方面,也是需要去换一个方向,因为之前主要是做的“推荐系统”,但是这个方向并不是我特别想要做的方向,所以只是堪堪毕了个业就结束了。

而在新的方向上,同时也是当前学术科研中还算是稍微热门的方向——模型部署和推理方向。针对这个方向的前进,在一开始可以阅读很多相关经典的材料来快速入门,但是真正到这个方向比较关键的问题上,相关的资料一定是稀少的,其实这个问题在科研中是经常出现的,因为一般来说在学术中阐述的方向都是比较新的,也就是一般只能拿到一些文字描述,但具体如何在这个方向上推进则需要大量自己的思考和实验才能够解决。

所以,在这里,重新对之前的科研方法做一定的梳理,尝试在当前的方向上去推进一些比较深入的研究。

学术和科研

目前主流认知来看,科研一般都是和学术,特别是学术圈(比如某某高校老师,某某研究院)紧密联系在一起,而在外界中,或者在个人中则很少和科研相关。当然在绝大学科中,特别是工科需要实际的仪器,比如医学药学、机械工程、生物化学等相关的方向,其科研过程就是通过对应的仪器在所在的领域中探索新的可能性或更好的效率。

所以这一类学科的研究很大程度依赖对应的探测仪器,也很自然需要有专门的研究室和场地布置相关的仪器,甚至可以想象到,仪器的使用本身也需要成本也需要持续的支付对应的成本,所以很难以个人的方式开展相关的研究。

在这里还可以额外说一点是,之前在知乎上回答一个关于仿真实验科研相关的问题,在这里还可以意识到一点是,相关领域底层的机制已经能够被数学模型比较精准地进行建模的时候,在仿真环境下处理是一种成本更低的方式。因为如果数学模型比较精准地刻画了领域相关的现象,在该仿真平台上进行操作得到的结果和现实对应的组件操作后得到的结果类似,那为什么不在仿真上去做相关的实验。至于文科相关的科研,由于本人主要是理工科相关的,所以没有多少经验,就不乱说话了。

所以,这里就又引出一个问题,数学和物理在科研中的作用是什么。在这里可以简单地进行二分,数学建模(描述)和数学理论(关系),前者是用数学形式化的符号对对应的内容进行描述,而后者是在这个基础上探索符号之间的关系。所以更进一步地,纯粹数学就是探索数学符号的数学,后续有相关的材料再进行深入的阐述。

那么基于具体领域科研的基本形式的理解,再来理解学术圈其实就很简单,学术圈从某种角度来看就是组织一群人在这个领域上去探索新的内容,针对具体的内容在这里不再去说,总之,在这里应该理解,学术圈和科研在某种程度上是可以分离开来,而不需要特别深入学术圈也能够做科研。

那么接下来,简单阐述一下尽可能摒弃掉学术的科研应该是一个什么样的形式。

科研的基本形式

从过程来看,学术圈中理工科的科研的基本形式是,看论文,做实验(工科)或者做题目(理科),在已看论文的基础上发现新的内容并确定下来,此时就可以开始写论文进行论文上的投稿。

而至于对应的工具,不管是大模型时代之前的文献管理工作,翻译软件,还是如今的大模型时代下直接全文翻译与阅读,其核心仍然没变,大体可以分为三个过程:

  1. 知识输入
  2. 领域探索
  3. 知识输出

1. 知识输入

知识输入,最浅薄的理解就是,我去看领域相关的材料就是知识输入。不过,据我个人体会,我认为单纯看应该是不够的,而是要自己也去动手去做,才是一种真正的知识输入。

就以深度学习领域的研究为例,当看完一篇比较好的论文的时候,并不是单纯看完就行了,甚至有可能是需要动手去重新把这一块重新走一遍才算是真正的知识输入。具体来说,可以按照以下步骤来执行”材料搜集”,”材料阅读和验证”,”材料化简和整理”。

材料搜集

在学术上则相对比较直接,就是从论文中来,这也是当前学术圈的主要目标,那就是——发论文,所以学术圈肯定是从论文中来,到论文中去。但以个人经验来看,一个领域中的材料是非常多,可能有课程,可能有书籍(专著),可能有博客,代码,当然也有论文。所以针对一个领域的材料的搜集,一开始确实可以从论文中出发,但最后形成比较体系的内容的时候肯定不止论文。在这里只是简单地阐述这样的过程,材料的形式是很多的。

材料阅读和验证

这一阶段的目标是,针对相关的材料进行阅读,大概有这么几个阶段:

  1. 初步阅读:材料过滤,很多材料可能就是标题相关,但内容是讲其他的内容,所以这一类材料是需要过滤掉。以及对该领域的材料有一个大致的认识。
  2. 深入阅读:在已有阅读的基础上,对材料的重要性和难度进行一定程度的区分,这能够加快后续阅读的效率。
  3. 进阶阅读:有一些内容,特别是理工科的内容不能只停留在阅读上,还需要与对应的器材,代码交互操作才能够真正在这个上面有理解。

经过这样的流程,就是知识输入,而这样的流程并不是一个线性过程,是需要反反复复做的过程。

材料化简和整理

输出并不只有写论文的阶段,事实上,在阅读和了解的阶段就可以进行输出。只是在学术圈中,阅读和了解的阶段可以以“资料整理”的形式表述出来,比如综述,或者是一小块的知识阅读报告。在这一块,主要就是对之前的内容的一个回顾和梳理,很多论文可能重复的内容,在这里就可以做一点筛选。当然,形式并不只是综述,对相关内容做一点归纳总结也可以。

2. 领域探索

上一阶段从领域的视角来看,可以被视作“领域熟悉”,知道这个领域在当前圈中是一个什么样的状态,有什么进展,有什么成果,并且在上述的过程中,自己也熟悉过。

那么在这个基础上,此时论文以及一些前沿的博客内容就会相对较好,因为他们是针对当前比较新的问题进行讨论和尝试,这实际上就是一个方向,甚至是一些可行的方向,因为能够被发表出来被大多数人看到,可以理解为这个方向当前是一个被视作有潜力的领域,大家都愿意在这上面花时间去努力,所以也可以在这个方向上去尝试,当然最后的判断仍然是个人。所以对于个人来说,要么跟着当前前沿主流大家讨论的方向去做,要么就是根据自己的判断去做。有时候这两者是统一的,自己的判断和主流方向是一样的也是可以的。

所以,从不同的视角来看,会有不同的探索方向:

  1. 学术的方向是从论文中出发的,其方向也一定学术论文的方向。
  2. 但也可以从领域视角出发,领域可能还有一些新的问题更困难的问题,短期内无法出论文但是相对重要的内容,由个人判断也可以自主推进。
  3. 甚至更远离学术的视角来看,从实际生产生活中出发,发现了一些问题,针对这些问题进行探索等。

当确定方向以后,还需要确定其目的,比如深度学习领域的很多论文,其目的就是在该任务下做得更好;比如一些数学理论的论文,其目的就是继续找到相关领域上新的定理和结论;比如一些数值计算方向的论文,可能方向就是更高效且数值稳定地计算方程相关的任务。

在确定方向和目的以后,就能够从两方面入手来讨论:

  1. 当前已有的方法做到了什么程度,还有那些没有解决的问题?
  2. 从领域来看,已有的方法告诉了我们什么消息,是否还有什么其他的信息可以利用?

领域探索最困难的点主要是两点:

  1. 如何判断出一个有价值的问题。
  2. 如何针对该问题提出有效的解决方案。

对于前者来说,我们对一个领域了解以后会有很多问题,但大多数的问题可能只是较为简单或者只需几步,甚至别人已经解决了的问题只是暂时没搜集到;而对于后者,一般有价值的问题往往也是难题,是一般方法没有解决的问题。

目前针对这一块就是领域相关的问题,换句话说,到了这里,科研的游戏才算是正式开始,所以对这些内容,也在以后的进展中逐渐道出答案。

3. 知识输出

最后,在上述探索中探明了一些有价值的内容以后,就可以进行知识输出。实际上,上述知识整理的时候就已经可以有知识输出。所以在这里也可以简单做一个分类:

  1. 知识整理的知识输出——对已有材料的个人化重复。
  2. 领域探索的知识输出——对探索结论甚至是过程的描述。

前者是对已有内容的重复,所以这要求写作的时候需要大量地引用相关的内容;而后者是对探索成果甚至过程的描述,所以相对较少,但是也要描述清楚,为什么,是什么,结果如何。

未来博客内容的规划

所以根据上述的从学术圈剥离出来的科研方法与当前个人方向的结合,未来就是在这边进行相关的内容的输出,输出的内容有:

  1. 已有材料的个人重复性输出。
  2. 个人探索过程的描述。

已有材料的个人重复性输出

具体来看,又可以分成两类:

  1. 如果比较已有材料可能包括课程,书籍,论文、博客和代码等等,总之可能相关的内容就会在前面标定一个标号。
  2. 如果是一个系列内容的总体概述,也就是类似综述,则就是以一个类别来进行标题。

个人探索过程的描述

这一块就更接近当前的论文,或一些探索性,创新性的博客的撰写。

  • 标题: 科研技能辅助当前方向前进
  • 作者: Wings
  • 创建于 : 2025-09-08 09:00:00
  • 更新于 : 2025-09-08 11:39:04
  • 链接: https://www.wingslab.top/其他/科研技能辅助当前方向前进/
  • 版权声明: 本文章采用 CC BY-NC-SA 4.0 进行许可。